Перейти к основному содержимому

Анализ государственных закупок

Назначение и аудитория

Инструкция для аналитиков и разработчиков, которые строят сводки по контрактам и процедурам (заказчик, поставщик, ОКПД2, территория, суммы) и хотят согласовать цифры с официальной витриной ЕИС и с бюджетным контуром (отчётность, касса) без подмены источников.

Входные данные

  • Правовой режим — отдельные потоки по 44-ФЗ и 223-ФЗ; до агрегации зафиксируйте отбор (колонка, папка выгрузки, фильтр в запросе).
  • Канонический след — выбранный тип документов из сведений о закупках (ЕИС) (извещения, протоколы, контракты, планы-графики) и при массовой обработке — комплект XML-выгрузок на дату снимка.
  • Ключи связи — реестровые номера, ИНН/ОГРН, ОКПД2; при стыковке с бюджетом — КБК и коды территории если они есть в выбранной схеме (см. идентификаторы ЕИС).
  • Период — календарные границы процедуры или даты публикации контракта (явно запишите, какое поле используете).
  • Региональный слой (опционально) — если заказчик субъектный или муниципальный, проверьте навигатор региональных витрин на дублирование или уточнение к порталу ЕИС.

Инструменты

  • Портал ЕИС и документация СОИ — через карточку ЕИС и сведения о закупках.
  • Парсинг XMLlxml, потоковый iterparse или аналог; см. также Python: парсинг XML из ЕИС и карточку XML-выгрузок.
  • Табличные срезы — Excel, pandas, DuckDB: нормализация справочников и группировки по ОКПД2, заказчику, региону.
  • Гражданское зеркалоClearspending только с пониманием расхождения с официальной редакцией документа на zakupki.gov.ru.

Шаги

  1. Зафиксируйте гипотезу и границы — что считаете «закупкой» в отчёте (процедура, контракт, исполнение) и какой режим 44/223 включён.
  2. Получите официальный слой — выгрузка или выборка с портала; для машинной обработки следуйте XML-выгрузкам и регламенту СОИ в карточке ЕИС.
  3. Нормализуйте идентификаторы — разведите извещение, процедуру и контракт по how-to по идентификаторам; не смешивайте версии и дубликаты одного контракта.
  4. Агрегируйте аналитически — группировки по ОКПД2 (при необходимости ориентиры — ОКПД2 в закупках), по заказчику (ИНН), по территории (поля схемы или справочник сопоставления).
  5. При необходимости добавьте регион — если сценарий «закупки субъекта РФ», сверьте навигатор и не дублируйте те же контракты из ЕИС и региональной витрины без явного правила приоритета.
  6. Свяжите с бюджетом осторожно — цепочка «контракт → КБК → касса» не всегда восстанавливается из одного XML; используйте отчётность по контрактам и смежные регламенты (44-ФЗ, 223-ФЗ) как ориентир полей, а не как замену выгрузки.

Воспроизводимый пример

Минимальная проверка доступности публичной витрины (без авторизации СОИ); ожидается код ответа 200 или 301/302 на конечный документ:

curl -fsSIL "https://zakupki.gov.ru/epz/main/public/home.html" | head -n 20

Для машиночитаемых объёмов используйте каналы из XML-выгрузок ЕИС и не полагайте на незадокументированные URL со страницы поиска.

Проверка результата

  • Согласованность 44/223 — доли и суммы по отдельным режимам не должны неожиданно смешиваться в одной строке отчёта.
  • Контроль ключей — нет дублей одного реестрового номера контракта с разными суммами без объяснения (версия, исправление).
  • Внешняя опора — выборочная сверка с статистикой на главной ЕИС или с отчётностью по контрактам по смыслу показателя, не подменяя построчную детализацию.

Ограничения и типовые ошибки

  • Объёмы и rate limit — массовые запросы к порталу без регламента СОИ приводят к блокировкам; тяжёлую аналитику ведите по XML или согласованным сервисам.
  • Смешение уровней — контракт ЕИС не равен строке казначейского отчёта без явной методики связки.
  • Кодировки и даты — в XML и CSV различаются часовые пояса и форматы; фиксируйте дату выгрузки в метаданных проекта.
  • Гражданские агрегаторы — удобны для поиска, но для юридически значимой цифры сверяйте первоисточник на ЕИС.

Связанные страницы