Управляющие системы и машины, №5, 2016, стаття 8

DOI: https://doi.org/10.15407/usim.2016.05.062
Урсатьев А. Некоторые программные среды аналитики больших данных и машинного обучения. Управляющие системы и машины. 2016. № 5. С. 62-75.

Abstract on English.

УДК 004.65:004.7:004.75:004.738.5

О.А. Урсатьєв, к. техн. н., Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України, просп. Глушкова, 40, Київ 03187, Україна,
E-mail: aleksei@irtc.org.ua

Деякі програмні середовища аналітики великих даних та машинного навчання

Розглянуто машинне навчання і розподілена обробка даних з Apache Mahout. Зіставлені дві його реалізації – з використанням парадигми MapReduce та програмної конструкції Spark з математичним середовищем Mahout Samsara, яке створює семантично дружні умови для лінійної алгебри, побудоване за образом базового пакета в R, містить алгебраїчний DSL Scala та оптимізатор виразів. Бібліотека ML Mllib підтримує універсальну масштабовану лінійну алгебру і включає в себе чимало сучасних
алгоритмів.

Завантажити повний текст в PDF (російською).

Ключові слова: обробка великих даних, аналітика, машинне навчання, Apache Mahout, MapReduce, Mahout Samsara, Spark.

Надійшла 13.07.2016