Перейти к основному содержимому

HubOfData — каталог датасетов по госфинансам

ПризнакЗначение
Краткое имяHubOfData
ОператорНП «Информационная культура»
Официальный URLhttps://hubofdata.ru/
Режим доступаОткрытый: веб-каталог и CKAN API без регистрации для типовых сценариев чтения

Назначение и границы

HubOfData — гражданский каталог датасетов на базе CKAN: метаданные и ссылки на файлы открытых данных, в том числе зеркала и агрегированные подборки наборов Минфина, Федерального казначейства, ФНС, Росстата и других операторов. Сервис даёт единый поиск, списки организаций и тем, а также Action API (package_search, package_show, выгрузка ресурсов) для скриптов и интеграций.

Проект не является официальным федеральным порталом открытых данных и не подменяет первичные реестры ведомств: актуальность ссылок, состав полей, лицензии и юридический статус публикации определяются у источника на его портале. Для нормативно значимой сверки паспортов наборов и версий файлов всегда ориентируйтесь на официальный каталог оператора.

Пользователи и типовые задачи

  • Аналитик открытых данных — найти набор по ведомству или теме (бюджет, налоги, закупки) и перейти к скачиванию или к API каталога.
  • Разработчик — вызывать CKAN Action API для перечисления пакетов, фильтрации по организации и автоматической проверки появления новых ресурсов.
  • Журналист или исследователь — быстро получить обзор того, какие выгрузки уже собраны в одном интерфейсе, до углубления в первоисточник.

Подсистемы и разделы

  • Каталог пакетов (datasets) — карточки наборов с тегами, организациями-владельцами и списком ресурсов (файлы, ссылки).
  • Организации и темы — группировка по операторам данных и предметным меткам (в т.ч. бюджетная и налоговая тематика).
  • CKAN API — машиночитаемый доступ к метаданным каталога и перечню наборов; сами бинарные файлы обычно отдаются по URL ресурса (часто с домена оператора или зеркала).

Точки доступа

Тип доступаURLФормат
Веб-интерфейсhttps://hubofdata.ru/HTML
CKAN Action API (v3)https://hubofdata.ru/api/3/action/JSON (например package_search, package_show)

Данные: объекты и связь с источниками

В терминах CKAN основные объекты — пакеты (логические датасеты), ресурсы (файлы или внешние URL), организации и теги. Содержательно это прежде всего справочники и табличные выгрузки ведомств: бюджетная классификация, макропоказатели, открытые реестры и статистические формы — в том объёме, в каком соответствующие операторы выложили их в открытый доступ и как они отражены в HubOfData.

Связь с разделом источников данных в wiki (первичные описания наборов и полей — на стороне оператора):

  • Открытые данные Минфина России — КБК, долг, ФНБ, бюджетная роспись и др.; типичные наборы Минфина, которые часто индексируются в HubOfData и с которыми имеет смысл сверять паспорт на minfin.gov.ru.
  • Витрины данных Казначейства (datamarts) — аналитические и открытые срезы по исполнению бюджета и смежным темам; часть материалов Федерального казначейства discoverable через агрегаторы вроде HubOfData, но форматы и срезы нужно проверять на витрине казначейства.
  • Налоговая статистика ФНС — готовые формы отчётности (1-НМ, 1-НДС и др.); HubOfData помогает найти связанные открытые наборы ФНС, но разрезы и актуальность таблиц задаёт официальный контур ФНС.

Для классификационных полей в выгрузках полезно согласовать коды с глоссарием, например КБК и ГРБС.

Связанные информационные системы

  • DataCatalogs.ru — метакаталог порталов и каталогов ОД того же оператора; дополняет HubOfData, который ориентирован на конкретные датасеты и CKAN API.
  • ГИИС «Электронный бюджет» — официальный портал бюджетной системы и публикации открытых данных исполнения; первичный контур для сверки с гражданским каталогом.
  • Сайт Минфина России — ведомственная витрина и реестр открытых данных Минфина; канонический вход при расхождении метаданных с агрегатором.

Ограничения и актуальность

Состав пакетов и URL ресурсов зависят от политики операторов и работы зеркал: записи в CKAN могут отставать или указывать на устаревшие ссылки. Лицензия и условия использования набора задаются в первую очередь паспортом на стороне источника, а не только строкой в карточке каталога. При массовых запросах к API соблюдайте разумные лимиты нагрузки и кэшируйте результаты package_search.

Частые вопросы

В: Можно ли считать HubOfData официальным реестром открытых данных государства?

О: Нет. Это независимый гражданский каталог на CKAN. Юридически значимые паспорта и обновления наборов публикуют операторы (ведомства, портал data.gov.ru и т.д.); HubOfData облегчает поиск и API-обход каталога.

В: Чем HubOfData отличается от DataCatalogs.ru?

О: HubOfData — это каталог отдельных датасетов с CKAN API. DataCatalogs.ru — обзор самих порталов-каталогов; их удобно сочетать: сначала выбрать портал, затем искать наборы на HubOfData или наоборот.

В: Где смотреть поля и методологию конкретной таблицы?

О: В паспорте набора у оператора и на страницах источников в wiki, например /data-sources/federal/minfin-opendata, /data-sources/federal/roskazna-datamarts и /data-sources/federal/nalog-statistics; карточка в HubOfData даёт в основном навигацию и ссылку на файл.