Портал открытых данных США серьезно обновится

ПО Свободное ПО Открытое ПО Маркет
, Текст: Любовь Касьянова
Правительство США продолжает развивать официальный портал государственных данных Data.gov, которому вскоре предстоит масштабное обновление. Новая версия сайта, в настоящий момент тестирующаяся на поддомене Next.Data.gov, использует еще больше открытых компонентов, среди которых открытый движок поиска Solr, система управления контентом WordPress и платформа управления данными CKAN.

Национальный ресурс открытых данных США вскоре получит обновленную версию, соответствующую требованиям, установленным приказом Белого Дома от мая текущего года. Согласно данному приказу, все госведомства обязаны по умолчанию предоставлять порталу только машиночитаемые данные.

Бета-версия сайта, в настоящий момент доступная для открытого тестирования по адресу next.data.gov, включает в себя дополнительные возможности визуализации данных, расширенный список тематических сообществ, а также новый раздел, демонстрирующий примеры использования правительственных данных третьими сторонами.

Портал Datа.gov был запущен в 2009 г. по инициативе администрации Барака Обамы для сбора и публикации данных различных госведомств с целью дальнейшего использования в проектах физических и юридических лиц. Тогда президент Обама заявил, что открытие правительственных данных способно подстегнуть развитие новых стартапов.

С тех пор популярность Data.gov и открытых данных в целом стабильно растет. В мае 2013 г. сайт получил более 213 тыс. уникальных посещений, что почти вдвое больше, чем года назад, в мае 2012 г.

В настоящий момент Data.gov предлагает более 70 тыс. наборов данных, предоставляемых 174 государственными ведомствами и учреждениями. Для удобства выгрузки и использования данных портал оснащен почти тремя сотнями различных API, в том числе реализующими некоторые виды госуслуг.

Разработка обновленного сайта ведется Администрацией общих служб США (General Services Administration) под контролем Административно-бюджетного управления (Office of Management and Budget) и Офиса по науке и технологиям (Office of Science and Technology Policy).

Как сообщают в блоге Белого Дома Ник Синай (Nick Sinai), заместитель технического директора Белого дома, и его ведущий консультант, Райан Панчадсарам (Ryan Panchadsaram), команда Data.gov изучила схемы использования сайта и обнаружила, что пользователи «остро нуждаются в примерах использования данных».

Благодаря этому новая версия будет включать в себя динамически обновляемую ленту, отображающую записи в блогах, твиты, цитаты и иные источники, демонстрирующие, как третьи стороны используют данные, предоставляемые правительством.

Помимо этого, ряд наборов данных будет отображаться в прокручивающемся блоке на главной странице сайта, что будет обеспечено средствами D3.js, библиотеки JavaScript. Превью функции, доступное на сайте, демонстрирует данные о землетрясениях, собранные геологическими исследованиями на территории США.

Однако главные изменения произойдут на серверной стороне: команда Data.gov внедряет сразу несколько новых открытых компонентов. Так, новая версия сайта будет включать в себя движок поискового сервера Solr, разработанный Apache Foundation.

Внедрение Solr преследует цель улучшения индексации данных на сайте в связи с переводом их в машиночитаемый формат. Государственные агентства США теперь обязаны публиковать на портале мета-описания своих данных в едином формате JSON с использованием схемы Common Core Metadata Schema, позволяющей Data.gov индексировать их для поиска.

Помимо этого, каталог данных в новой версии сайта будет построен на открытой платформе публикации данных CKAN (Comprehensive Knowledge Archive Network), а управление контентом и социальные возможности сайта будут реализованы на движке WordPress.

На новом сайте открытыми будут даже шрифты — обновленный Data.gov будет использовать гарнитуры Abel и Lato из коллекции Google Fonts.

Использование открытого ПО в новой версии сайта демонстрирует, что Data.gov следует федеральной программе Белого дома, ставящей целью максимизировать использование открытого ПО в госсекторе, причем не только в рамках США. Напомним, что в прошлом году США и Индия совместно запустили открытую имплементацию Data.gov — платформу Open Government Platform (OGPL).

Платформа OGPL, доступная по лицензионному контракту с правительством США, позволяет другим странам развертывать сайты открытых данных, аналогичные порталу Data.gov. В настоящий момент на платформе строится госпортал Индии Data.gov.in. Кроме того, о планах использования открытых наработок Data.gov в этом году заявили Канада и Гана, сообщает проект в официальном микроблоге.