Цифровизация статистики РЖД выходит на новый уровень
РЖД и Росстат меняют подходы в области управления данными
22:42, 15 августа 2024
Укрепление сотрудничества РЖД и Росстата не просто совместная работа двух организаций. Это новый уровень реализации задач в рамках национального проекта «Экономика данных». О взаимодействии РЖД и Росстата и системе управления данными в холдинге подробно рассказал начальник управления анализа и статистики Департамента информатизации ОАО «РЖД» Дмитрий Быстрицкий.
Как меняются подходы РЖД и Росстата в области управления данными?
В РЖД действует около 260 статистических внутренних форм, которые создаются в разных режимах: автоматизированном, полуавтоматизированном или ручном. При этом в соответствии с федеральным законодательством мы предоставляем в Росстат еще около 80 статистических форм, утвержденных на государственном уровне. Многие из них нужно готовить ежемесячно. Для сдачи отчетов подразделениям нашей компании в Росстате зарегистрировано 9000 кодов ОКПО. Это фактически 9000 отчетов, таких как П-4. Если на каждый тратить даже по полчаса, это уже 4500 часов. При норме рабочего времени 160 часов в месяц для подготовки этих отчетов нужно почти 30 человек. С одной стороны, при численности более 700 тыс. человек цифра небольшая, но эти 30 человек могут реализовать новый проект или за счет высвобождения времени более эффективно решать производственные задачи. При дальнейшей работе в части автоматизации данных мы будем учитывать этот фактор снижения временных непроизводительных затрат.
Укрепление сотрудничества РЖД и Росстата – это новый уровень реализации задач в рамках национального проекта «Экономика Данных».
Цифровизация статистики – цель всего холдинга. РЖД и Росстат переходят от простой статистики к управлению данными. Анализ данных – это не просто сбор сведений, главная ценность – выводы на основе этих сведений. РЖД не только передает свои показатели, мы также заинтересованы в получении официальных данных от Росстата для использования в своей работе. Сейчас нами сформирован перечень из
343 показателей, которые мы бы хотели получать от Росстата, которые важны в том числе и для разработки макроэкономических прогнозов.
Взаимодействие с Росстатом в части формирования единого цифрового окна началось еще в 2022 году, а в 2023-м пришли к необходимости заключить отдельное соглашение. Документ регламентирует порядок сдачи отчетности, упорядочивает количество подразделений компании в каталоге назначений отчетности Росстата. Уже есть конкретный результат нашей работы: настроен прямой защищенный канал для обмена данными между РЖД и Росстатом с возможностью подписания отчетных форм электронной цифровой подписью.
Как работает канал передачи данных?
Канал позволяет перейти от формального электронного предоставления статистики к управлению данными и к потоковой передаче по показателям. Например, при изменении какого-то отдельного параметра мы меняем только этот конкретный параметр, а не всю форму. Это одновременно снижает трудозатраты и повышает качество и оперативность. Через новый канал мы уже сдали отчет по инвестициям за 2023 год от Центрального аппарата. Всего 64 отчета, как и положено в детализации по субъектам РФ. Такой подход позволяет РЖД существенно
снизить трудозатраты на их подготовку и количество занятых в этом процессе специалистов. А еще мы снимаем риски: за нарушение при сдаче отчетности предусмотрены штрафные санкции – от 20 до 200 тыс. за один факт непредоставления отчета или за некорректные данные.
Кроме того, в рамках нового соглашения и настроенного канала связи у компании появляются возможности предиктивно заниматься назначением отчетности для наших подразделений по уведомительному принципу. Например, Росстат формирует годовую потребность по отчетам. Мы это согласовываем, обсуждаем порядок и структуру передачи сведений, то есть мы на начальном этапе снимаем возможные риски, а не в момент сдачи отчета.
Какие сложности возникают при передаче данных по защищенному каналу?
Каждый отчет имеет свою специфику, при автоматизации могут возникать нюансы, как методологические, так и технические. Например, при
сдаче первого отчета в Росстат были сложности с подписанием (ЭЦП). В онлайн-режиме мы решали этот вопрос, практически постоянно были на связи с партнерами, в конечном итоге уложились в сроки.На этапе внедрения любой механизм требует корректировок. Но уже на начальном этапе видно, как мы упрощаем свою работу. Наш Главный вычислительный центр создал отдельную систему подготовки и передачи статистических данных. Например, в некоторых отчетах есть сравнение с прошлыми периодами. Система их хранит и не требует повторного ввода.
В РЖД действует около 260 статистических внутренних форм, которые создаются в разных режимах.
Когда планируется автоматизировать всю систему отчетности?
Это одна из приоритетных задач холдинга, но всегда необходимо оценивать целесообразность. Некоторые данные мы сдаем один раз в 4–5 лет. Важно корректно соотносить стоимость извлечения данных и их преобразования с текущими затратами. Например, если мы автоматизируем процесс, а используем эту автоматизацию через 5 лет, то срок ее окупаемости может не наступить. Несмотря на эпоху цифровизации, остаются операции, когда проще открыть систему и взять нужную цифру, сформировать отчет и передать.
Как можно применять искусственный интеллект для управления данными?
Во-первых, возможно применение чат-ботов. Например, когда коллеги из Росстата задают вопрос, почему здесь указана та или иная цифра, чат-бот формирует ответ. Объясняет методику расчета, ссылается на соответствующие законы.
Во-вторых, нельзя исключать использование искусственного интеллекта в математическом моделировании. Статистика – это всегда результат расчетов, и как раз расчетная модель может быть построена на основе искусственного интеллекта.
Для внутренней статистики в РЖД запустили в тестовую эксплуатацию систему искусственного интеллекта при анализе графика исполненного движения. Пока мы используем модель для внутренних целей, но в перспективе и с коллегами из Росстата придем к этому.
Как в РЖД развивается направление прогнозной аналитики?
Работа в области прогнозной аналитики идет в нескольких направлениях. Группа аналитиков проходила обучение в Корпоративном университете. Повторюсь, что анализ – это в первую очередь умение работать с информацией, делать выводы. Для этого специалист должен применить свой естесственный интеллект. Обучение было нацелено как раз на развитие таких навыков.
Кроме того, в компании уже введены соответствующие должности. Мы с коллегами готовим подходы и нормативные документы, чтобы системно выстроить эту аналитическую работу. Следующий этап – перевод наших корпоративных хранилищ на импортозамещенную платформу с возможностью быстрого создания аналитических доменов. Основная проблема связана с извлечением данных. До 80% времени сотрудники тратят на сбор информации, а 20% – на обработку. Наша задача – перевернуть это соотношение, и важно учитывать информационную безопасность вплоть до создания отдельных аналитических комнат без возможности утечек.
Как происходит унификация данных внутри РЖД?
В Корпоративном хранилище данных одни и те же данные могут находиться в разных источниках, их постоянно приходится сопоставлять. Есть риск, что два человека используют разные источники. Для этого мы внедряем глоссарий бизнес-терминов и репозиторий форм, где прописаны все показатели и системы, ответственные за конкретный показатель. Статистическая отчетность как раз дает возможность унифицировать эти данные, у нее будет один источник. Это не значит, что сведения из других систем не нужны. Их можно использовать для более глубокой аналитики. Главное – понятийно правильно описать любые данные и понимать, как их применять.
До 80% времени сотрудники тратят на сбор информации, а 20% – на обработку.
Какие еще остаются задачи в области управления данными?
Необходимы системы с инструментарием бизнес-аналитики. Основное требование – возможность интеграции с нашим Корпоративным хранилищем данных. Это позволит эффективно работать с результатами: интерпретировать их на различных дашбордах, информационных панелях, в видеоотчетах.
Большинство инструментов бизнес-аналитики требуют очень серьезной переработки, готового решения под наши потребности сейчас нет. Пока оцениваем пилотные версии продуктов, которые есть на рынке. Особенно для нас важна система моделирования бизнес-процессов. Сейчас используем ARIS, но нужно импортозамещаться. У нас в Корпоративной системе управления данными предусмотрена связка с системой бизнес-процессов, потому что ни один показатель не появится без них. И выбор такой системы – важный шаг. В компании 200 тыс. процессов и около 48 млн единичных показателей. Без системного управления и увязки всех этих сущностей невозможно строить анализ и принимать решения.
Еще одна задача – визуализация жизненного цикла данных. Мы должны видеть, где и как зарождается информация, сколько времени она живет. Основной принцип любой эффективной системы управления данными – однократный ввод и много- кратное использование. Это один из элементов повышения эффективности работы с данными, к чему мы и стремимся.
Как развивается информационное взаимодействие РЖД и Росстата читайте здесь.