«Необходимо грамотно встраивать решения, выработанные ИИ-системами, в нашу производственную деятельность»
Как работает уникальный импортонезависимый комплекс РЖД из корпоративного хранилища и системы управления данными
18:35, 21 ноября 2023
Российские железные дороги начали решать задачу по управлению данными с 2000 года. До этого был опыт использования проприетарного западного решения, сейчас – уникальный импортонезависимый комплекс из корпоративного хранилища и системы управления данными. Как в РЖД развивается управление данными, рассказывает Дмитрий Быстрицкий, начальник управления анализа и статистики Департамента информатизации компании.
Какой объем данных аккумулирует РЖД в корпоративном хранилище данных (КХД)?
По оценке главного вычислительного центра компании, сейчас в корпоративном хранилище данных хранится 39 петабайт (ПБ) информации. Если опираться на текущее состояние ИТ-ландшафта РЖД, то за год мы собираем примерно 5 ПБ данных. Однако мы развиваемся, и внедрение некоторых систем может привести к кратному росту объема.
Сегодня в корпоративном хранилище данных хранятся данные, накопленные с 2000 года, в том числе за счет оцифровки бумажных документов.
Я могу назвать количество показателей, которые включены в глоссарий бизнес-терминов корпоративной системы управления данными (КСУД). Это более правильно, потому что мы оперируем информацией, которая необходима для аналитики и отчетов. По нашим оценкам, это более 48 млн единичных показателей статистической отчетности, из них до 80% в зависимости от направления деятельности хранится в КХД.
Сбор статистических показателей основан на трех базовых вещах: распорядительном документе, методике и порядке сбора. Порядок сбора, в том числе, определяет, с какой периодичностью и на какой территории собираются данные, с какой полнотой, то есть это компания, территория железной дороги или конкретное подразделение. Приведу пример.
Отчет о технической оснащенности Центральной дирекцией управления движением охватывает все технические устройства, которые используются всеми подразделениями данного филиала компании. В итоге получается, с одной стороны, это вся страна в рамках присутствия РЖД, с другой – функционал в рамках Центральной дирекции управления движением. Или отчет о технических устройствах хозяйства пути, который еще называется паспортом пути, включает эксплуатационную длину пути и все его параметры. Аналогичные отчеты есть по другим хозяйствам. Собираются эти отчеты один раз в год.
Отчеты содержат не только количественные, но и качественные показатели о работе локомотивов, движении поездов.
В РЖД различные горизонты планирования: на год, квартал, месяц, неделю, декаду, сутки. Есть даже сменно-суточное планирование, когда планируется работа на 12 часов. Для оперативного управления применяется трехчасовое планирование.
Каждые три часа оперативная обстановка меняется, хотя и не всегда кардинально. Но при этом данные за последние три часа являются ключевой точкой влияния на управленческие решения, например, о переназначении локомотивной бригады, о передислокации локомотива с одной станции на другую или на ремонт в депо. Ведь случаются технические отказы, происходят иные события, в том числе изменяются условия работы не по ответственности РЖД.
До 1500 показателей включают в себя ежедневные отчеты начальников железных дорог
Можно, конечно, и каждый час планировать, но зачастую в этом нет необходимости. При этом одним и тем же отчетом с одинаковым срезом данных пользуются и дежурный по локомотивному депо, и поездной диспетчер и руководство компании. Это очень важно для такой крупной компании, как РЖД.
Отчеты содержат не только количественные, но и качественные показатели о работе локомотивов, движении поездов. Качественный показатель говорит о том, насколько эффективно перевезены грузы или пассажиры. Это соотнесение доходов и расходов, которое должно быть оптимальным, а лучше – максимальным.
Когда мы подавали статистические отчеты в бумажном виде, то заполняли утвержденные формы. Автоматизация позволяет идти не от формы, а от показателя. Сейчас мы формируем новую методологию – будем отслеживать, как и где используется конкретный показатель. Но методология его формирования при этом, безусловно, будет соблюдаться.
Прогнозная аналитика базируется на статистической информации. Наиболее распространенный прогноз на основе трендов должен учитывать сезонность, а это можно сделать, только используя исторические статистические данные. При этом необходимо учитывать и так называемые выплески, или выбивающиеся из общей логики события, и давать им отдельную оценку. К примеру, сегодня, составляя аналитические отчеты и строя тренды, по некоторым показателям мы стараемся не учитывать статистику за 2020 год – период локдауна, потому что эти данные по грузовым и пассажирским перевозкам не коррелируются с общей тенденцией изменения данных показателей.
РЖД рассчитывает увеличить провозную способность с 173 млн т в 2023 году до 180 млн т в 2024 году
В качестве примера планирования на основании статистики и анализа могу привести работу на Восточном полигоне. РЖД рассчитывает увеличить провозную способность с 173 млн т в 2023 году до 180 млн т в 2024 году. Показатель учитывает планы по строительству, содержанию инфраструктуры.
При этом надо понимать, что провозная способность и реально перевезенные тонны – это разные вещи. Объем перевозок определяется заказом, а заказ – это вопрос многостороннего взаимодействия клиента, оператора подвижного состава, ОАО «РЖД». Влияние государства в лице регулирующих органов, которые определяют правила недискриминационного доступа и временные правила, также необходимо учитывать
При планировании перевозок Центр фирменного транспортного обслуживания РЖД взаимодействует с Минпромторгом, Минэкономом, Минсельхозом, Минтрансом и другими ведомствами. Спланировать такой объем перевозок без определенных оценок, на основе статистики невозможно. В результате рождается сбалансированный подход к перевозке и появляются новые сервисы. Например, в этом году мы начали вывозить контейнеры в полувагонах, потому что необходимо было вывести большое количество порожних контейнеров из портов Дальнего Востока. При этом на Восток необходимо перевезти более 150 млн т продукции.
Корпоративное хранилище данных (КХД) в основном содержит информацию по направлениям:
◆ грузовые перевозки;
◆ пассажирские перевозки (пригородные и дальние);
◆ локомотивные парки.
Также в КХД формируется корпоративное хранилище по трудовым ресурсам. В нем собирается информация:
◆ о сотрудниках;
◆ об учете рабочего времени; данные для расчета среднесписочной численности;
◆ для расчета средней заработной платы, необходимые для расчета
производительности труда в компании.
Всего у нас 260 статистических форм, которые готовятся с разной периодичностью. В ежедневном режиме формируются 46 отчетов, например, отчет о переходе поездов и вагонов по междорожным или межгосударственным стыкам, отчет о наличии парка магистральных грузовых локомотивов.
На основе таких данных формируются и аналитические отчеты, которые включают динамические ряды статистических данных и позволяют пользователю строить прогнозы. Как пример, отчеты начальников железных дорог готовятся ежедневно и включают в себя до 1500 показателей.
Ответ может показаться парадоксальным: один. У любой компании есть два самых важных показателя: доход и расходы. Соответственно, есть себестоимость продукции и норма прибыли. Расчетный прогноз этих показателей сегодня вполне возможно написать на одном листе.
При этом скрытой от глаз останется вся формируемая для этой цели пирамида данных, на основе которых рассчитываются эти показатели, и это очень тонкая и скрупулезно выстроенная система. В РЖД для планирования работы на год вперед на всех уровнях управления используется около 48 млн единичных показателей. Важно еще и не учитывать при расчете прогнозов нерепрезентативные данные. Например, на станции раз в месяц может быть отгружен один вагон, и есть месяцы, когда на этой станции грузов вообще нет. Это что: тенденция или случай? Чтобы учитывать такие данные в прогнозах, необходима CRM-аналитика, которая будет более тонко учитывать клиентскую информацию.
Да. В каждой дирекции есть подразделения, которые занимаются такой аналитикой. Только вчера в нашем Корпоративном университете начались курсы по бизнес-аналитике. Две группы специалистов будут учиться методам, способам прогнозной аналитики и моделирования. Мы рассчитываем, что они помогут раскрыть все возможности нашего Корпоративного хранилища данных, создадут новый аналитический инструментарий.
Мы хотим сделать следующий шаг – чтобы аналитика включала выводы и предлагала варианты решений, а в идеале единственно правильное решение для его последующей реализации.
У нас есть статистический отчет о классификации линий. До автоматизации он формировался раз в год, сейчас – раз в месяц. На основе этого отчета строятся взаимоотношения с субъектами Федерации, в том числе рассчитывается компенсация за пригородные пассажирские перевозки. Сегодня мы видим, как меняется ситуация, и можем корректировать параметры компенсации с меньшей дискретностью, а значит, более точно и чутко реагировать на любые изменения.
Ведь в данном чувствительном для многих жителей страны вопросе необходимо учитывать много факторов. Нельзя выходить за рамки регулируемого тарифа и при этом необходимо обслуживать линии, поддерживать возможность мобильности, ведь между некоторыми населенными пунктами нет другого сообщения, кроме железной дороги.
В корпоративном хранилище данных РЖД хранится 39 ПБ информации. За год аккумулируется около 5 ПБ данных. При этом внедрение некоторых систем может привести к кратному росту объема
Расскажу на примере отчета о локомотивах и их работе. Сначала на основе первичных данных формируется электронный маршрут машиниста – от момента его явки на работу до ее окончания.
Когда машинист приходит на работу, он для формирования отметки о явке вставляет индивидуальную чипованную карту в терминал самообслуживания в депо. На карте хранятся все данные сотрудника, включая паспортные. В результате в отчете появляется время явки машиниста.
Далее машинист по процессу идет к медицинскому работнику, чтобы пройти предрейсовый медицинский осмотр. Он вставляет карту в компьютер медработника, и медработник надевает ему манжету, дает алкотестер. Все медоборудование также подключено к компьютеру. Показания приборов автоматически попадают в отчет. Вывод о годности машиниста к работе формируется автоматически. Дополнительно машинист и медработник визируют данные медосмотра своими электронными подписями.
Потом машинист с помощью терминала самообслуживания проходит предрейсовый инструктаж. На терминале высвечивается перечень вопросов для поездки и перечень изменений, с которыми он должен ознакомиться. Машинист опять электронно расписывается, что ознакомился с информацией.
После этого машинист идет к дежурному по депо, где подтверждается маршрут его предстоящей поездки и номер локомотива, который он должен принять для работы. Дежурный также проверяет, все ли «параметры» машиниста в норме, и вручает пакет документов о рейсе.
Машинист принимает локомотив и подъезжает под состав. Проверяется тормозная магистраль, машинист получает от системы справку о состоянии тормозов и передает информацию дежурному по станции о готовности. Если все в порядке, тот подтверждает, что состав может ехать, передав в автоматизированную систему сообщение о готовности поезда. Только после этого считается, что поезд готов к отправлению. Далее информация об отправлении вводится в систему дежурным по станции.
Можно ли полностью исключить участие человека при сборе данных?
Мы планируем перейти на полный автоматический сбор данных о ходе следования поезда. Сегодня все локомотивы оборудованы датчиками ГЛОНАСС, координаты передаются в систему о движении поезда и формируется электронный маршрут машиниста.
Заканчивая поездку, машинист выполняет действия в обратном порядке: сдает локомотив, идет в депо, подходит к терминалу, подтверждает все параметры поездки и заканчивает работу, подтверждая все это своей электронной подписью. Явка, медосмотр, номер локомотива, номер бригады локомотива, табельные номера сотрудников – все фиксируется автоматически. На некоторых участках в систему автоматически добавляются данные о топливе или электроэнергии. Где нет такой возможности, машинист сам вводит в систему параметры счетчиков.
Корпоративную систему управления данными РЖД составляют примерно 10–15 ИТ-модулей. Она оперирует данными из всех автоматизированных систем РЖД
Если машинист с чем-то не согласен, то он корректирует данные и корректировка фиксируется его электронной подписью. Информация с маршрута машиниста также поступает в Центр по расшифровке данных с приборов безопасности, и далее подписанный маршрут попадает в Центр оперативно-технического учета тягового подвижного состава локомотивного депо, где операторы и руководители группы учета еще раз проверяют все данные. После этого маршрут поступает в обработку в автоматизированную систему и происходит расчет всех показателей работы.
Сегодня 35–40% маршрутов РЖД закрываются автоматически, потому что соблюдены все параметры рейса. Остальные поступают к операторам, чтобы они проконтролировали данные. Пока не везде можно обойтись без человека. Когда данные выверены, оператор нажимает кнопку, данные отчетов фиксируются в системе и используются для дальнейших расчетов.
Такие цепочки данных формируют несколько ключевых показателей бюджета РЖД. Они используются в системе управления трудовыми ресурсами для расчета трудозатрат и заработной платы. В системе управления финансовыми ресурсами учитывается расход топлива, электроэнергии и т.д.
Чтобы подготовить отчет о работе локомотива, используется около 20 интегрированных ИТ-модулей, каждый из которых автоматизирует одну бизнес-функцию:
◆ локомотивная модель;
◆ бригадная модель;
◆ поездная модель;
◆ перевозочная модель;
◆ система централизованной обработки маршрута машинистов;
◆ система предрейсового медицинского осмотра;
◆ система по предрейсовым инструктажам;
◆ система автоматической идентификации подвижного состава;
◆ система диспетчерского контроля;
◆ система спутниковой навигации;
◆ система управления локомотивным комплексом;
◆ автоматизированная система контроля за топливом;
◆ система по выдаче предупреждений;
◆система по расшифровке кассет регистрации с приборов безопасности.
данными РЖД?
Если очень укрупненно, то примерно из 10–15. При этом система оперирует данными из всех автоматизированных систем РЖД.
К концу года мы хотим внедрить систему, которая будет строить диаграммы жизненного цикла данных. Мы будем видеть, где и как зарождаются данные, из каких источников, в каких системах используются. Это поможет нам оптимизировать сам подход к хранению данных. Сейчас одни и те же данные могут храниться в нескольких сегментах хранилища, что не совсем рационально. Ключевая задача – однократный ввод данных и многократное их использование.
Планируем внедрить систему бизнес-аналитики с современными инструментами анализа, чтобы строить более точные прогнозы. Пока мы на стадии выбора решения, но уже понятно, что от вендора потребуется доработка. Ведь наши требования соответствуют объемам нашей работы и нашей ответственности.
Отдельное поле деятельности – внедрение систем искусственного интеллекта. Предстоит серьезная проработка требований. Нам необходимо грамотно встраивать решения, выработанные ИИ-системами, в нашу производственную деятельность.