Цифровой портрет регионального развития: анализ грантовых проектов методами LDA и BERTopic
- Митрофанова Татьяна Валерьевна, Чувашский государственный университет им. И.Н. Ульянова (Чебоксары, Россия)
- Христофорова Анастасия Владимировна, Чувашский государственный университет им. И.Н. Ульянова (Чебоксары, Россия)
В статье представлен подход к построению цифрового портрета социально-экономического развития региона на основе автоматизированного анализа текстовых данных. В качестве ключевого индикатора рассматриваются описания грантовых проектов, поддержанных в Республике Марий Эл за 2023–2025 годы. С помощью комбинации методов тематического моделирования – классического LDA и современного нейросетевого BERTopic – выявлены и визуализированы латентные тематические паттерны, формирующие актуальную повестку развития территории. Полученный «портрет» позволяет объективно оценить структуру гражданских инициатив, выявить доминирующие направления (социальная поддержка, развитие человеческого капитала, спорт, образование) и определить их соответствие стратегическим целям региона.
В результате исследования установлено, что смыслообразующим ядром грантовой повестки выступает целевая группа «дети», вокруг которой концентрируются кластеры образовательных, реабилитационных и инклюзивных проектов. LDA-моделирование выделило пять устойчивых тематических направлений, в том числе поддержку семей с детьми и адаптацию лиц с ограниченными возможностями здоровья. BERTopic, в свою очередь, позволил детализировать узкие нишевые практики, например, инклюзивный спорт, реабилитацию людей с нарушениями зрения и культурно-досуговые программы для детей с ОВЗ (ограниченными возможностями здоровья), что подтверждает высокую семантическую чувствительность нейросетевого подхода. Сопоставление полученных тематических кластеров с проектом Стратегии социально-экономического развития Республики Марий Эл выявило как зоны полного совпадения приоритетов (поддержка детства, инклюзия), так и стратегические дисбалансы: слабую представленность проектов в сферах креативных индустрий, туризма и работы с молодёжью. Предложенная методика демонстрирует, что методы машинного обучения открывают новые возможности для мониторинга и диагностики состояния региональных и муниципальных систем, обеспечивая управленческие команды Data-Driven-инструментом для принятия решений и коррекции грантовой политики. Таким образом, тематическое моделирование позволяет перевести массив неструктурированных текстовых данных в плоскость объективного анализа, превращая описание гражданских инициатив в надежный инструмент выявления реальных социальных приоритетов и основу для стратегического планирования.
цифровой портрет региона, тематическое моделирование, LDA, BERTopic, управление на основе данных, анализ грантов, региональное развитие, машинное обучение, обработка естественного языка (NLP), Республика Марий Эл
2026-03-05