Технологии

Большие данные

Большие данные (big data) – совокупность непрерывно увеличивающихся объемов информации одного контекста, но разных форматов представления, а также методов и средств для эффективной и быстрой обработки. Иначе говоря, это наборы данных, часто из нестандартных источников, размер которых настолько велик, что традиционные программы для обработки не могут с ними эффективно справиться.

Теория

Большие данные (big data) – совокупность непрерывно увеличивающихся объемов информации одного контекста, но разных форматов представления, а также методов и средств для эффективной и быстрой обработки.

Иначе говоря, это наборы данных, часто из нестандартных источников, размер которых настолько велик, что традиционные программы для обработки не могут с ними эффективно справиться.

Сегодня big data применяется фактически во всех решениях по цифровизации бизнес-процессов.

Большие данные дают возможность оперативно добавлять разнообразные данные из множества различных источников для анализа прогнозов и выводов. Обработка информации позволяет улучшить эффективность бизнес-процессов, маркетинг и продажи, снизить затраты.

К методам сбора и обработки больших данных относятся:

  • Data Mining – обучение ассоциативным правилам, кластерный и регрессионный анализ;
  • смешение и интеграция разнородных данных, таких как цифровая обработка сигналов и обработка естественного языка;
  • машинное обучение;
  • искусственные нейронные сети, сетевой анализ, методы оптимизации и генетические алгоритмы;
  • распознавание образов;
  • предиктивная аналитика;
  • имитационное моделирование;
  • пространственный и статистический анализ.

Практика

ОАО «РЖД» использует большие данные как для оптимизации работы инфраструктуры, так и для повышения лояльности потребителей и партнеров.

В частности, компания анализирует большие данные для информирования пассажиров через мобильное приложение и push-уведомления, чтобы повысить адресность предложений для клиентов.

Проекты

Центр анализа и обработки данных

Создан совместно ОАО «РЖД» и компанией «Сименс» в феврале 2017 года. Сотрудники центра используют аналитические модели, которые на базе полученных технических параметров позволяют реализовать концепцию предиктивного техобслуживания, прогнозировать отказы критически важных узлов подвижного состава. Данные передает большинство систем, вовлеченных в инфраструктуру РЖД. Это информация о движении поездов, открытии/закрытии дверей, эффективности работы тягового привода, износу оборудования и прочее.

Современные модели, построенные на основе анализа больших данных, позволяют прогнозировать отказы тяговых двигателей за 5–7 дней.

Доверительная среда локомотивного комплекса

Разработка ведется с 2018 года. Цифровая платформа для сбора, хранения информации и взаимодействия участников проекта, обеспечивающих работу тягового подвижного состава.

Проект по переводу систем управленческого учета компании «РЖД» на платформу SAP HANA.

Технологии больших данных позволили сократить сроки подготовки отчетности в 43,5 раза, повысить скорость и точность распределения затрат в 40 раз.

Поделиться
Вы подписаны!
email
Подписка на новости
Нажимая на кнопку “Подписаться”, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности