HubOfData — каталог датасетов по госфинансам
| Признак | Значение |
|---|---|
| Краткое имя | HubOfData |
| Оператор | НП «Информационная культура» |
| Официальный URL | https://hubofdata.ru/ |
| Режим доступа | Открытый: веб-каталог и CKAN API без регистрации для типовых сценариев чтения |
Назначение и границы
HubOfData — гражданский каталог датасетов на базе CKAN: метаданные и ссылки на файлы открытых данных, в том числе зеркала и агрегированные подборки наборов Минфина, Федерального казначейства, ФНС, Росстата и других операторов. Сервис даёт единый поиск, списки организаций и тем, а также Action API (package_search, package_show, выгрузка ресурсов) для скриптов и интеграций.
Проект не является официальным федеральным порталом открытых данных и не подменяет первичные реестры ведомств: актуальность ссылок, состав полей, лицензии и юридический статус публикации определяются у источника на его портале. Для нормативно значимой сверки паспортов наборов и версий файлов всегда ориентируйтесь на официальный каталог оператора.
Пользователи и типовые задачи
- Аналитик открытых данных — найти набор по ведомству или теме (бюджет, налоги, закупки) и перейти к скачиванию или к API каталога.
- Разработчик — вызывать CKAN Action API для перечисления пакетов, фильтрации по организации и автоматической проверки появления новых ресурсов.
- Журналист или исследователь — быстро получить обзор того, какие выгрузки уже собраны в одном интерфейсе, до углубления в первоисточник.
Подсистемы и разделы
- Каталог пакетов (datasets) — карточки наборов с тегами, организациями-владельцами и списком ресурсов (файлы, ссылки).
- Организации и темы — группировка по операторам данных и предметным меткам (в т.ч. бюджетная и налоговая тематика).
- CKAN API — машиночитаемый доступ к метаданным каталога и перечню наборов; сами бинарные файлы обычно отдаются по URL ресурса (часто с домена оператора или зеркала).
Точки доступа
| Тип доступа | URL | Формат |
|---|---|---|
| Веб-интерфейс | https://hubofdata.ru/ | HTML |
| CKAN Action API (v3) | https://hubofdata.ru/api/3/action/ | JSON (например package_search, package_show) |
Данные: объекты и связь с источниками
В терминах CKAN основные объекты — пакеты (логические датасеты), ресурсы (файлы или внешние URL), организации и теги. Содержательно это прежде всего справочники и табличные выгрузки ведомств: бюджетная классификация, макропоказатели, открытые реестры и статистические формы — в том объёме, в каком соответствующие операторы выложили их в открытый доступ и как они отражены в HubOfData.
Связь с разделом источников данных в wiki (первичные описания наборов и полей — на стороне оператора):
- Открытые данные Минфина России — КБК, долг, ФНБ, бюджетная роспись и др.; типичные наборы Минфина, которые часто индексируются в HubOfData и с которыми имеет смысл сверять паспорт на
minfin.gov.ru. - Витрины данных Казначейства (datamarts) — аналитические и открытые срезы по исполнению бюджета и смежным темам; часть материалов Федерального казначейства discoverable через агрегаторы вроде HubOfData, но форматы и срезы нужно проверять на витрине казначейства.
- Налоговая статистика ФНС — готовые формы отчётности (1-НМ, 1-НДС и др.); HubOfData помогает найти связанные открытые наборы ФНС, но разрезы и актуальность таблиц задаёт официальный контур ФНС.
Для классификационных полей в выгрузках полезно согласовать коды с глоссарием, например КБК и ГРБС.
Связанные информационные системы
- DataCatalogs.ru — метакаталог порталов и каталогов ОД того же оператора; дополняет HubOfData, который ориентирован на конкретные датасеты и CKAN API.
- ГИИС «Электронный бюджет» — официальный портал бюджетной системы и публикации открытых данных исполнения; первичный контур для сверки с гражданским каталогом.
- Сайт Минфина России — ведомственная витрина и реестр открытых данных Минфина; канонический вход при расхождении метаданных с агрегатором.
Ограничения и актуальность
Состав пакетов и URL ресурсов зависят от политики операторов и работы зеркал: записи в CKAN могут отставать или указывать на устаревшие ссылки. Лицензия и условия использования набора задаются в первую очередь паспортом на стороне источника, а не только строкой в карточке каталога. При массовых запросах к API соблюдайте разумные лимиты нагрузки и кэшируйте результаты package_search.
Частые вопросы
В: Можно ли считать HubOfData официальным реестром открытых данных государства?
О: Нет. Это независимый гражданский каталог на CKAN. Юридически значимые паспорта и обновления наборов публикуют операторы (ведомства, портал data.gov.ru и т.д.); HubOfData облегчает поиск и API-обход каталога.
В: Чем HubOfData отличается от DataCatalogs.ru?
О: HubOfData — это каталог отдельных датасетов с CKAN API. DataCatalogs.ru — обзор самих порталов-каталогов; их удобно сочетать: сначала выбрать портал, затем искать наборы на HubOfData или наоборот.
В: Где смотреть поля и методологию конкретной таблицы?
О: В паспорте набора у оператора и на страницах источников в wiki, например /data-sources/federal/minfin-opendata, /data-sources/federal/roskazna-datamarts и /data-sources/federal/nalog-statistics; карточка в HubOfData даёт в основном навигацию и ссылку на файл.