Работа с региональными порталами открытых данных
Назначение и аудитория
Инструкция для аналитиков и исследователей, которым нужны официальные публикации субъекта РФ (план, исполнение, пояснения), а не только федеральные своды. Региональные витрины «Открытый бюджет» (и аналоги) различаются по структуре и глубине; единого API «все регионы» нет — часто остаются HTML, XLS/XLSX и PDF, а машиночитаемые наборы есть не везде.
Входные данные
- Субъект РФ и бюджетный год (или несколько лет), с которыми вы работаете.
- Тип задачи: закон о бюджете, исполнение, долг, госпрограммы, субсидии — от этого зависит раздел на сайте региона.
- Точка отсчёта для воспроизводимости: дата скачивания файла, URL страницы выгрузки и (если есть) имя файла из паспорта набора.
- При межрегиональном сравнении — заранее зафиксируйте сопоставимость кодов (КБК, КОСГУ, ОКТМО); ориентир по полям — индекс кодов классификаций.
Инструменты
- Браузер для навигации по официальному сайту субъекта и разделам «Бюджет» / «Открытые данные».
- Для таблиц: Excel/LibreOffice, Python (
pandas,openpyxl/calamineдля XLSX), при необходимости OCR только если исходник — скан в PDF и других вариантов нет. - Журналирование запросов: при парсинге HTML — умеренные паузы и кеш, чтобы не нагружать региональные сайты.
Шаги
- Откройте на едином портале бюджетной системы раздел навигации к субъектам (см. карточку региональные порталы) и перейдите на официальный сайт выбранного субъекта, если нужен полный комплект материалов, которого нет на федеральной витрине.
- На сайте органа власти субъекта (как правило блок финансов / «Открытый бюджет») найдите нужный год и тип документа: закон о бюджете, отчёт об исполнении, открытые данные.
- Скачайте XLS/XLSX, CSV или JSON, если регион их публикует; иначе заберите офисное вложение или экспортируйте таблицу вручную и зафиксируйте источник.
- На своей стороне приведите столбцы к единой схеме (имена полей, даты, разделители дробной части, кодировка UTF-8 vs Windows-1251).
- Для контекста и перекрёстной проверки используйте федеральные открытые наборы портала (см. наборы данных ГИИС «Электронный бюджет»), не подменяя ими первичный региональный источник там, где нужна детализация субъекта.
Воспроизводимый пример
Минимальная проверка доступности единого портала (стабильная точка входа без привязки к домену конкретного субъекта):
import requests
url = "https://budget.gov.ru/"
resp = requests.get(url, timeout=30)
resp.raise_for_status()
print(resp.status_code, resp.headers.get("content-type", ""))
После скачивания регионального файла (пример для CSV с известной кодировкой):
from pathlib import Path
import pandas as pd
path = Path("~/Downloads/regional_budget_execution_2024.csv").expanduser()
df = pd.read_csv(path, sep=";", encoding="utf-8-sig")
print(df.shape)
print(df.columns[:10].tolist())
Замените путь и параметры read_csv (sep, encoding, decimal) на те, что указаны в файле или видны по превью.
Проверка результата
- Сверьте итоговые суммы с PDF или HTML-отчётом на том же сайте за тот же год и раздел.
- Сопоставьте ключевые показатели с федеральным агрегатом (например краткая информация об исполнении консолидированных бюджетов субъектов), понимая, что методика и уровень детализации могут отличаться.
- Убедитесь, что не смешаны план и факт, разные фонды и ведомства, если в источнике несколько таблиц.
Ограничения и типовые ошибки
- Разные кодировки и форматы дат между регионами и даже между файлами одного сайта — всегда открывайте «сырой» фрагмент файла перед объединением выборок.
- Нет публичного API у большинства витрин: парсинг HTML ломается при смене вёрстки; предпочитайте официальные файлы и паспорта наборов.
- Лаги публикации и смена URL (редизайн портала) — закрепляйте ссылку и дату скачивания; устаревшие короткие пути на
budget.gov.ruмогут отдавать 404 (см. карточку региональные порталы). - Путать федеральные открытые данные портала
budget.gov.ruс полным комплектом документов на сайте субъекта — для юридически значимых выводов опирайтесь на публикацию органа субъекта.
Связанные страницы
- Региональные порталы «Открытый бюджет» — канонические URL входа и типовые объекты данных.
- Как искать региональные бюджетные данные — пошаговый маршрут поиска официального источника.
- Консолидированные бюджеты субъектов — федеральный слой для ориентира и сопоставления.
- ГИИС «Электронный бюджет» — связь витрин с оператором единого портала.
- Анализ региональных бюджетов — практический разбор после загрузки данных.