Hub of Data — гражданский каталог датасетов (CKAN)
| Признак | Значение |
|---|---|
| Уровень и охват | Гражданский агрегатор; индексируются и зеркалируются наборы федеральных и иных операторов открытых данных (Минфин, Казначейство, ФНС, Росстат и др.) |
| Тип доступа | Смешанный: веб-каталог и CKAN Action API для метаданных и перечня пакетов; файлы наборов обычно по URL ресурса (часто на домене оператора) |
| Основные форматы | JSON (API каталога), CSV, XLSX, ZIP, HTML (витрина и типичные ресурсы пакетов) |
| Оператор | НП «Информационная культура» |
| Режим доступа | Публичный веб и чтение API без регистрации для типовых сценариев |
Коротко: единая точка поиска и машинный обход каталога (package_search, package_show, списки ресурсов) по открытым финансовым и смежным наборам, когда удобнее работать через CKAN, чем собирать ссылки с разных ведомственных порталов.
Описание
Hub of Data — публичный каталог на CKAN: карточки пакетов (датасетов), организации, теги и ресурсы (файлы или внешние URL). Сервис полезен для обнаружения выгрузок, зеркал и подборок, но не задаёт юридический статус первичной публикации и не заменяет паспорта наборов у операторов.
Сюда не входят внутренние сервисы оператора и каналы, не описанные на hubofdata.ru.
Оператор
НП «Информационная культура» — каноническая витрина: https://hubofdata.ru/
- Карточка ИС: HubOfData — назначение, границы относительно официальных каталогов и типовые сценарии API.
URL и точки доступа
| Тип доступа | URL | Формат |
|---|---|---|
| Веб-интерфейс | https://hubofdata.ru/ | HTML |
| CKAN Action API (v3) | https://hubofdata.ru/api/3/action/ | JSON (package_search, package_show, …) |
Объекты данных и показатели
- Пакет (dataset) — логический набор с метаданными, тегами и привязкой к организации-владельцу в терминах CKAN.
- Ресурс — конкретный файл (CSV, XLSX, ZIP и т.д.) или ссылка на внешнюю выгрузку; формат и актуальность нужно сверять с первоисточником.
- Содержательно — прежде всего справочники, табличные открытые данные и статистические формы ведомств в том объёме, в каком они попали в каталог (включая архивные и зеркальные копии).
Типичные ключи связи с другими наборами: коды КБК, ОКТМО, ИНН/ОГРН в таблицах (если есть в выгрузке); идентификаторы пакета в CKAN (name, id) удобны для скриптов, но не являются межведомственными реестровыми ключами.
Периодичность обновления
У каталога нет единого SLA по всем пакетам: даты обновления записей в CKAN и сами файлы зависят от операторов и зеркал. Ориентиры и риски отставания — в разделе «Ограничения и актуальность» карточки HubOfData (ИС); для даты и методологии таблицы опирайтесь на официальный источник набора.
Ограничения и особенности
- Не официальный реестр государственных открытых данных: значимые паспорта и обновления — у оператора набора и на data.gov.ru там, где набор проходит государственную паспортизацию.
- Метаданные и URL в карточке CKAN могут отставать или указывать на устаревшие зеркала; лицензия и условия переработки в первую очередь в паспорте у источника.
- При массовых запросах к API соблюдайте разумные паузы и кэшируйте результаты
package_search.
Примеры доступа
Поиск пакетов по строке запроса (GET к Action API):
import requests
url = "https://hubofdata.ru/api/3/action/package_search"
r = requests.get(url, params={"q": "minfin", "rows": 5}, timeout=30)
r.raise_for_status()
payload = r.json()
if not payload.get("success"):
raise RuntimeError(payload)
for row in payload["result"]["results"]:
print(row["name"], "-", row.get("title"))
Связанные страницы wiki
- HubOfData (ИС) — подсистемы, границы с официальными контурами и FAQ.
- Открытые данные Минфина России — типичные первичные наборы Минфина; сверяйте паспорт на
minfin.gov.ru, если метаданные в CKAN расходятся с витриной. - Витрины данных Казначейства (datamarts) — официальные срезы по исполнению бюджета; часть тем пересекается с индексом Hub of Data.
- Налоговая статистика ФНС — готовые формы; Hub of Data помогает найти связанные открытые файлы ФНС, но разрезы задаёт ФНС.
- Портал открытых данных РФ (data.gov.ru) — официальный каталог с паспортизацией; контраст по статусу публикации относительно гражданского CKAN.
- DataCatalogs.ru (ИС) — метакаталог порталов того же оператора; дополняет Hub of Data при выборе витрины до уровня отдельных датасетов.
Не путать с
- Портал открытых данных РФ (data.gov.ru) — официальный государственный каталог; Hub of Data — независимый CKAN-агрегатор без статуса первичной публикации.
- DataCatalogs.ru — каталог самих порталов-каталогов, а не строк табличных наборов с CKAN API по каждому датасету.