Перейти к основному содержимому

Hub of Data — гражданский каталог датасетов (CKAN)

ПризнакЗначение
Уровень и охватГражданский агрегатор; индексируются и зеркалируются наборы федеральных и иных операторов открытых данных (Минфин, Казначейство, ФНС, Росстат и др.)
Тип доступаСмешанный: веб-каталог и CKAN Action API для метаданных и перечня пакетов; файлы наборов обычно по URL ресурса (часто на домене оператора)
Основные форматыJSON (API каталога), CSV, XLSX, ZIP, HTML (витрина и типичные ресурсы пакетов)
ОператорНП «Информационная культура»
Режим доступаПубличный веб и чтение API без регистрации для типовых сценариев

Коротко: единая точка поиска и машинный обход каталога (package_search, package_show, списки ресурсов) по открытым финансовым и смежным наборам, когда удобнее работать через CKAN, чем собирать ссылки с разных ведомственных порталов.

Описание

Hub of Data — публичный каталог на CKAN: карточки пакетов (датасетов), организации, теги и ресурсы (файлы или внешние URL). Сервис полезен для обнаружения выгрузок, зеркал и подборок, но не задаёт юридический статус первичной публикации и не заменяет паспорта наборов у операторов.

Сюда не входят внутренние сервисы оператора и каналы, не описанные на hubofdata.ru.

Оператор

НП «Информационная культура» — каноническая витрина: https://hubofdata.ru/

  • Карточка ИС: HubOfData — назначение, границы относительно официальных каталогов и типовые сценарии API.

URL и точки доступа

Тип доступаURLФормат
Веб-интерфейсhttps://hubofdata.ru/HTML
CKAN Action API (v3)https://hubofdata.ru/api/3/action/JSON (package_search, package_show, …)

Объекты данных и показатели

  • Пакет (dataset) — логический набор с метаданными, тегами и привязкой к организации-владельцу в терминах CKAN.
  • Ресурс — конкретный файл (CSV, XLSX, ZIP и т.д.) или ссылка на внешнюю выгрузку; формат и актуальность нужно сверять с первоисточником.
  • Содержательно — прежде всего справочники, табличные открытые данные и статистические формы ведомств в том объёме, в каком они попали в каталог (включая архивные и зеркальные копии).

Типичные ключи связи с другими наборами: коды КБК, ОКТМО, ИНН/ОГРН в таблицах (если есть в выгрузке); идентификаторы пакета в CKAN (name, id) удобны для скриптов, но не являются межведомственными реестровыми ключами.

Периодичность обновления

У каталога нет единого SLA по всем пакетам: даты обновления записей в CKAN и сами файлы зависят от операторов и зеркал. Ориентиры и риски отставания — в разделе «Ограничения и актуальность» карточки HubOfData (ИС); для даты и методологии таблицы опирайтесь на официальный источник набора.

Ограничения и особенности

  • Не официальный реестр государственных открытых данных: значимые паспорта и обновления — у оператора набора и на data.gov.ru там, где набор проходит государственную паспортизацию.
  • Метаданные и URL в карточке CKAN могут отставать или указывать на устаревшие зеркала; лицензия и условия переработки в первую очередь в паспорте у источника.
  • При массовых запросах к API соблюдайте разумные паузы и кэшируйте результаты package_search.

Примеры доступа

Поиск пакетов по строке запроса (GET к Action API):

import requests

url = "https://hubofdata.ru/api/3/action/package_search"
r = requests.get(url, params={"q": "minfin", "rows": 5}, timeout=30)
r.raise_for_status()
payload = r.json()
if not payload.get("success"):
raise RuntimeError(payload)
for row in payload["result"]["results"]:
print(row["name"], "-", row.get("title"))

Связанные страницы wiki

Не путать с

  • Портал открытых данных РФ (data.gov.ru)официальный государственный каталог; Hub of Data — независимый CKAN-агрегатор без статуса первичной публикации.
  • DataCatalogs.ru — каталог самих порталов-каталогов, а не строк табличных наборов с CKAN API по каждому датасету.