Управляющие системы и машины, №2, 2018, стаття 6

DOI: https://doi.org/10.15407/usim.2018.02.051
Урсатьев А.А. Большие Данные. Аналитические базы данных и хранилища: Teradata.  Управляющие системы и машины. 2018. № 2. C. 51-67.

Abstract on English.

УДК 004.65:004.7:004.75:004.738.5

О.А. Урсатьєв, канд. техн. наук, Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, просп. Глушкова, 40, Київ 03187, Україна, aleksei@irtc.org.ua

ВЕЛИКІ ДАНІ. АНАЛІТИЧНІ БАЗИ ДАНИХ І СХОВИЩА: TERADATA

Вступ. Стаття є продовженням досліджень Великих Даних та інструментарію, що трансформується в нове покоління технологій і архітектури платформ БД та сховищ для інтелектуального виводу. У даній частині огляду подано DB Teradata. Основну увагу приділено питанням зміни інфраструктури, інструментального середовища і платформи для виявлення необхідної інформації та нових знань з Великих Даних, а початкові відомості про продукт наведено в загальній характеристиці виробу.

Мета. Розглянути та оцінити ефективність застосування інфраструктурних рішень нових розробок в дослідженнях Великих Даних для виявлення нових знань, неявних зв’язків і поглибленого розуміння, проникнення в сутність явищ і процесів.

Методи. Інформаційно-аналітичні методи і технології обробки даних, методи оцінки та прогнозування даних, з урахуванням розвитку найважливіших галузей інформатики та інформаційних технологій.

Результати. Teradata — це реляційна система паралельної обробки з використанням архітектури без загального доступу. В її основі технологія, що складається з обладнання, програмного забезпечення (ПЗ), бази даних та консалтингу. Система переміщує дані в сховище, де їх можна викликати та проаналізувати. Створюючи своє рішення — Database Appliance — між спеціалізованими апаратними засобами і ПЗ, Teradata успішна в ніші Data Warehouse протягом тривалого часу, досягнувши продуктивності в дуже великих базах даних в задачах аналітики при прийнятті стратегічних рішень. Але Teradata Database Appliance — це прилад з наслідками: немає можливості налаштування обладнання на проблемний простір. Немає жодних варіантів використання оптимізації хмарного або еластичного стилю. Так само відзначається, що Teredata має дуже незрілий рівень абстракції даних. Незначні зміни в програмуванні можливі в порівнянні з іншими мовами РСУБД.

Teredata своєчасно відреагувала на нагальну необхідність аналізу BigDate і в першу чергу даних нових форматів медіаджерел. Першим рішенням був Hadoop for the Enterprise — гнучкий набір апаратних засобів, програмного забезпечення і сервісів для інтеграції Hadoop в середу Teradata. Потім — платформа для виявлення даних Teradata Aster Discovery. Розроблено та використано аналітичні функції SQL, SQLMapReduce®, Graph, функції часових рядів, статистичних методів, аналітики тексту, забезпечено доступ до мультиструктурованих даних в Apache™ Hadoop™, Teradata Data Warehouse та інших реляційних СУБД.

Високопродуктивний доступ до даних, обробку і віртуальну доставку до систем в гетерогенних аналітичних середовищах забезпечує екосистема Teradata QueryGrid™ — своєрідна матриця, яка використовує паралельне переміщення між системам обміну. Ідея екосистемного підходу, який застосовує Hadoop поряд з реляційними і іншими середовищами для охоплення різного типу даних, зводиться до задачі зв’язування вузлових інформаційних точок, що зберігаються у середовищах. Прийнята уніфікована архітектура даних Teradata™ (UDA) не суперечить єдиному поданню даних, без їх переміщення, — концепту LDW.

Висновки. На думку аналітиків Gartner, за 2014 р. Teradata отримала три оцінки: лідерство в галузі аналітики, визнання архітектури Teradata® Unified Data Architecture™, та лідерство у використанні Hadoop для великих обсягів даних. З 2015 р. сховища даних розширилися внаслідок звернення до декількох типів даних, механізмам обробки та репозиторіям. У цьому зв’язку у звіті Gartner 2017 р. відзначається, що Teradata побудувала платформу управління даними, що враховує всі варіанти застосування сховищ даних: традиційну, операційну, логічну та контекстно-незалежну. Це відображає підхід до сховища з уніфікованою архітектурою даних Teradata® UDA™.

Пропозиції Teradata також містять рішення хмарних сховищ даних як на приватній керованій хмарі, так і на інфраструктурі громадського хмарного провайдера. Це сприяє об’єднанню хмарних і локальних мереж в гібридних конфігураціях. Teradata IntelliCloud™ — це нове покоління захищених хмарних рішень, що надає дані і аналітичне програмне забезпечення як послугу за моделлю SaaS.

Завантажити повний текст в PDF (російською).

Ключовi слова: архiтектура MPP, логiчнi сховища даних LDW, платформа Warehouse Appliance, SN (Shared Nothing)-архiтектура, Teradata Aster Discovery — платформа виявлення, Teradata IntelliCloud™ — данi та аналiтика за моделлю SaaS, Teradata QueryGrid™, унiфiкована архiтектура даних Teradata™ (UDA).

Отримана 16.01.2018