Control Systems and Computers, N5, 2020, Статья 2

https://doi.org/10.15407/csc.2020.05.017

Палагін О.В., Петренко М.Г. Знання-орієнтований інструментальний комплекс обробки баз даних наукових публікацій. Control Systems and Computers. 2020. № 5. С. 17-33.

УДК 004.318

ПалагинА.В., академик НАНУ, профессор, зам. директора, Институт кибернетики имени В.М. Глушкова НАН Украины, просп. Академика Глушкова, 40, Киев 03187, Украина, E–mail: palagin_a@ukr.net,

ПетренкоН.Г., докт.техн.наук, ст.научн.сотрудник, вед.научн.сотрудник, Институт кибернетики имени В.М. Глушкова НАН Украины, просп. Академика Глушкова, 40, Киев 03187, Украина, E–mail:petrng@ukr.net

Знание-ориентированныйинструментальный комплекс
обработки баз данных научных публикаций

Ведение. На сегодня известны многочисленные приложения и инструментарий, реализующие технологии поиска информации в различных текстовых источниках в соответствии с заданными параметрами. Причем результаты поиска предоставляются пользователю по каждому параметру поиска в отдельности и не связанные между собой. А применение технологий Semantic Web с целью многопараметрического и связанного поиска информации в различных источниках в Украине находится на начальной стадии развития. Отдельной проблемой является мультимедийное представление результатов поиска и их сравнение с понятийной структурой представляющей интерес предметной области (Knowledge Domain) с цель извлечения новых знаний. С этой точки зрения для научных исследований обработка научных публикаций одного автора, авторов научного подразделения и академического института в целом является актуальной с применением технологий SemanticWeb, мультимедийным представлением информации и эффективной поддержкой процесса извлечения новых знаний.

Цель статьи. Проектирование архитектуры и алгоритмов функционирования инструментального комплекса обработки баз данных научных публикаций, а также разработка примеров использования формального описания научной статьи с выполнением ряда запросов.

Методы. Методы и модели, используемые в работе, основаны на информационных технологиях Semantic Web, ориентированных на разработку и использование онтологий предметных областей. Онтологии являются базовыми компонентами указанных технологий, как для проведения научных исследований, так и создания крупных баз данных, в том числе научных публикаций авторов.

Результат. Разработана архитектура инструментального комплекса обработки баз данных научных публикацийи алгоритмы его функционирования на подготовительном и основном этапах. Приведены примеры запросов к базе данных научных публикаций, демонстрирующие работоспособность инструментального комплекса.

Выводы. В статье рассмотрены архитектура инструментального комплекса обработки баз данных научных публикацийи алгоритмы его функционирования на подготовительном и основном этапах. Подробно рассмотрены шаги подготовительного этапа, которые реализуются инженером по знаниям. При этом выделено создание двух моделей онтологии научной статьи с представлением соответствующих онтографов: CRF-модель описывает понятия, содержащиеся в статье, и OWL-модель описывает структурные компоненты статьи. В заключение приведены примеры запросов к БД НП, демонстрирующие работоспособность ИК.

Далее следует расширить использование в разработке ИК технологий, таких как когнитивные семантика и графика, мультимедийное представление информации, ориентированные на эффективную поддержку процессов извлечения и/или генерации новых знаний.

 Загрузить полный текст! (на украинском)

Ключевые слова: онтология, технологии SemanticWeb, база данных научных публикаций.

Поступила 24.06.2020