Компания Teradata, игрок в сегменте аналитики больших данных и маркетинговых приложений, анонсировала многолетнюю программу развития open source-разработки Presto и объявила об обеспечении ее коммерческой поддержки. Как сообщили CNews в Teradata, основываясь на принятом трехступенчатом плане реализации проекта, компания вложится в open source-проект под лицензией Apache, который обеспечит оптимизированные характеристики современной базы кодов Presto, улучшит масштабируемость, итерационные запросы, а также возможность направлять запросы одновременно в несколько репозиториев данных.

В целом Presto, разрабатываемый и используемый Facebook, представляет собой open source-«движок» SQL-запросов следующего поколения, поддерживающий аналитику больших данных. По задумке компании, вклад Teradata в развитие Presto облегчит компаниям процесс извлечения ценных аналитических выводов из «озер данных» и поможет распространить их полезный эффект на всю аналитическую экосистему.

«Мы с воодушевлением смотрим на сотрудничество с Facebook и open source-сообществом и рассчитываем на долгосрочные результаты этого проекта по переносу аналитического Hadoop-движка из Кремниевой долины в инфраструктуру предприятий масс-рынка, — заявил Джастин Боргман, вице-президент и генеральный менеджер Центра Hadoop в Teradata. — Для ускорения развертывания Presto наши консалтинговые команды Think Big помогут заказчикам включать ценностный вклад Presto в свои предприятия на тех участках, где он оптимизирует аналитические экосистемы, построенные на имеющейся линейке технологий Teradata».

По словам представителей компании, Presto дополняет собой программное решение Teradata QueryGrid и вписывается в идеологию Teradata Unified Data Architecture. Presto обеспечивает пользователям возможность инициировать запросы напрямую из Hadoop, в то время как Teradata QueryGrid позволяет инициировать запросы из Teradata Database и Teradata Aster Database посредством обычного SQL-протокола.

Presto работает на нескольких Hadoop-дистрибутивах. Кроме того, Presto может непосредственно из Hadoop-платформы отправлять запросы в Cassandra, реляционные базы данных или частные хранилища данных. Эта кросс-платформенная аналитическая характеристика позволяет пользователям Presto извлекать бизнес-ценность из «озер данных» любого размера, исчисляемых гига- или петабайтами, утверждают в Teradata.

В целом, как ожидается, трехэтапный проект Teradata по инвестициям в open source-решение расширит корпоративный функционал Presto. Так, этап 1 посвящен оптимизации базовых функций, упрощающих ввод Presto, включая инсталляцию, изучение сопроводительной документации, а также базовый мониторинг. Характеристики данного этапа доступны для скачивания уже сегодня на teradata.com/presto или Github.

Этап 2 подразумевает интеграцию Presto с другими ключевыми компонентами экосистемы больших данных, такими как стандартный Hadoop-дистрибутив инструментов управления, операционная совместимость с Yarn, а также коннекторы, расширяющие охват функционала Presto за пределы файловой системы Hadoop distributed file system (HDFS). Эти возможности будут доступны в конце 2015 г.

В свою очередь, этап 3 предполагает: запуск архитектуры ODBC (Open Database Connectivity, открытых средств связи с базами данных) и интерфейса JDBC (Java Database Connectivity API, взаимодействие Java и баз данных по API) для расширения возможностей адаптации Presto организациями и усиления интеграции с инструментами бизнес-аналитики; а также обеспечение повышенной защищенности за счет доступа по модели распределенных служебных ролей. Эти расширения будут доступны в 2016 г.

В дополнение к развитию open source-продукта, коммерческая поддержка Teradata сегодня доступна при обращении в консалтинговый департамент Think Big. По информации компании, Think Big предложит экспертизу по трем направлениям: Presto Jumpstart — в «облаке» или на объекте, Think Big поможет в первичном освоении нового функционала; Presto Development — в «облаке» или на объекте, консультанты Think Big помогут заказчику разработать, создать и развернуть решение на основе Presto; Think Big Academy — двухдневные семинары помогут заказчикам понять лучшие сценарии и критерии применения технологии для архитектурных решений.