ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ ДЛЯ СЕМАНТИЧЕСКОГО АНАЛИЗА БОЛЬШИХ ДАННЫХ О НАУЧНЫХ И ТЕХНОЛОГИЧЕСКИХ РЕШЕНИЯХ В ОБЛАСТИ ЭНЕРГЕТИКИ

Копайгородский Алексей Николаевич, Хайруллина Елена Павловна

Институт систем энергетики им. Л.А. Мелентьева СО РАН

В статье рассмотрены подходы к проектированию и реализации отдельных компонентов инструментальных средств для семантического анализа извлекаемой из открытых источников информации о научных и технологических решениях в области энергетики. Рассмотрена структура билингвистической онтологии, позволяющая решать задачу классификации информации с учётом ее представления в различных языках и синонимии. Рассмотрен подход к поиску и обработке информации из открытых источников, основанный на применении разработанных авторами средств семантического анализа, реализация которых выполнялась на Python с использованием библиотеки Natural Language Toolkit.

научно-технологическое прогнозирование, семантический анализ, классификация текстовых документов, билингвистическая онтология

Вернуться назад