Windows Azure запустил поддержку кластеров Hadoop

ПО Свободное ПО Открытое ПО Маркет
, Текст: Любовь Касьянова
Корпорация Microsoft официально интегрировала в облачную платформу Windows Azure собственную сборку Apache Hadoop, носящую название Windows Azure HDInsight. Теперь на Azure можно будет развертывать кластеры «больших данных», которые обладают стопроцентной совместимостью с Hadoop, и при этом интероперабельны с продуктами Microsoft, утверждает компания.

Эрон Келли (Eron Kelly), ведущий менеджер Microsoft по продукту SQL Server, в понедельник, 18 марта, опубликовал в официальном блоге компании сообщение о запуске демонстрационной версии HDInsight — «облачной» сборки Hadoop от Microsoft — в качестве одного из сервисов платформы Windows Azure.

HDInsight, «редмондская сборка» Apache Hadoop, была впервые представлена в октябре 2012 года. Спустя шесть месяцев разработки, продукт окончательно созрел для коммерческого использования в «облаке» и был включен в состав Azure в рамках новой услуги HDInsight Service.

Как пишет в личном блоге Скотт Гатри (Scott Guthrie), корпоративный вице-президент Microsoft по направлению Azure, подписка на HDInsight Service дает пользователю Azure поднять и настроить собственный кластер «больших данных» за 10-15 минут, «большая часть которых уйдет на создание виртуальных машин, составляющих кластер». После этого клиент сможет использовать все возможности анализа больших данных, предоставляемый открытым программным каркасом от Apache.

«HDInsight Service предоставляет полную совместимость с Apache Hadoop, что гарантирует клиентам, выбирающим HDInsight, уверенность в том, что они смогут взаимодействовать с Hadoop как сейчас, так и в будущем», - заявил Эрон Келли.

Запуск сервиса может стать хорошей новостью для организаций, нуждающихся в «больших данных», и при этом использующих проприетарные инструменты для офиса и бизнес-аналитики, такие как Excel, PowerPivot and Power View, добавил менеджер. HDInsight обеспечивает с продуктами Microsoft через при помощи открытого плагина Hive от Apache.

На протяжении демонстрационного периода корпорация предоставляет 50%-ную скидку на использование услуги.

Apache Hadoop, фреймворк для разработки и выполнения распределенных программ на кластерах данных, получивший меткое название «швейцарский нож 21 века», в настоящее время является де-факто стандартом в индустрии. Продукт с открытым кодом под лицензией Apache используют в своих дата-центрах такие гиганты, как Amazon Web Services, Apple, eBay, Facebook, Netflix, Rackspace и Twitter.

Проект также дал начало ряду стартапов, среди которых наиболее известен Hortonworks, компания, занимающаяся промышленными имплементациями Hadoop. На одной из таких имплементаций, Hortonworks Data Platform 1.1, и базируется решение Microsoft HDInsight.

Следует отметить, что среди крупных игроков индустрии намечается тенденция к созданию версий Hadoop на основе собственного опыта. Вслед за «редмондской сборкой», выпущенной в конце прошлого года, 26 февраля 2013 г. свет увидела версия Hadoop от Intel — Intel Distribution for Apache Hadoop, оптимизированная под возможности новых серверных процессоров Xeon и твердотельных накопителей (SSD).