Control Systems and Computers, N3, 2020, Статья 6

Ходякова Г.В. Використання інформаційних технологій в розв’язанні задач комп’ютерної лінгвістики. Control Systems and Computers. 2020. № 3. С. 60-68.

УДК 004.9

Г.В. ХОДЯКОВА, канд. пед. наук, доцент кафедры компьютерных наук и прикладной математики, Николаевский национальный ун-т имени В.А. Сухомлинского, Николаев, ул. Шнеерсона, 11, кв. 7, khodiakovagalina@gmail.com

Информационные технологии в решении задач компьютерной лингвистики

Вступление.  В настоящее время опубликовано большое количество научных работ, посвященных компьютерной лингвистике. Описанные в них проблемы обсуждаются на уровне общенаучной методологии. Рассмотрены возможности использования современных компьютерных средств для анализа текстовой информации в задачах компьютерной лингвистики и процесс решения некоторых прикладных лингвистических задач на технологическом уровне.

Цель написания данной статьи — описать новую технологию решения некоторых лингвистических задач путем использования популярных онлайн ресурсов и на основе сравнительного метода.

Результаты. В статье дается обзор популярных онлайн сервисов по обработке и анализу текста. Описана технология решения следующих лингвистических задач:  семантического анализа текста; вычисления частотных характеристик текста; нахождения типологических индексов Гринберга для данного языка, разбор слова по составу, грамматического анализа текста, построение синтаксических графов.

Вывод. Результаты решения рассмотренных задач могут использоваться для других исследований в области лингвистики. В частности, при определении автора текста предварительно проводится частотный анализ слов, словосочетаний и оборотов речи. Семантический анализ текста используется SEO-специалистами, работа которых заключается в оптимизации сайтов под поисковые запросы. Результаты вычисления типологических индексов нужны специалистам по теоретической лингвистике. Грамматический анализ текстов и построение семантических графов нужны при создании программ-переводчиков, а также программ по распознавания речи и автоматическому вводу текста. Статья предназначена для лингвистов и специалистов в области SEO-анализа, решающих задачи по анализу и обработке текстов.

Загрузить полный текст в PDF (на украинском).

Ключевые слова: компьютерная лингвистика, компьютерная обработка текста, анализ текста, задачи лингвистического анализа текста.

Поступила 05.01.2020