Большие данные в металлургии: онлайн-хакатон от «Северстали» и McKinsey
Высокие технологии проникают во все отрасли бизнеса и промышленности, не исключая, конечно же, металлургию. Благодаря разным технологиям металлургические предприятия более эффективно используют ресурсы, мониторят качество продукции, улучшают показатели непрерывности процесса производства. Но нет предела совершенству! И поэтому мы в ПАО «Северсталь» совместно с McKinsey и при поддержке Russian Hackers решили провести онлайн-хакатон для аналитиков и разработчиков в сфере поиска и анализа данных. Может быть, это как раз вы или ваши друзья?
Кто может участвовать
Для участия в нашем хакатоне есть всего три условия:
Во-первых, анализ данных или разработка – это ваша профессия или хобби.
Во-вторых, участвовать можно как одному человеку, так и команде до 5 человек.
В-третьих, для получения приза в команде должен быть хотя бы один гражданин РФ старше 18 лет.
Если у вас ещё нет тиммейтов, но вы хотели бы с кем-то объединиться, можно поискать их в чате хакатона в Telegram или в разделе «Поиск команды» на платформе регистрации. Кроме того, помочь могут и организаторы. Важный момент – для работы не нужен мощный ноутбук или ПК. Вполне достаточно рабочего ПК и выхода в интернет.Участвовать можно из любой точки мира.
Задачи для участников
Мы подготовили четыре задачи для участников хакатона.
Задача 1. Управление ликвидностью
Суть задачи:
Провести исследование данных по затратам на энергоресурсы за несколько лет, проанализировать возможности обогащения внешними данными, определить значимые факторы влияния, построить прогнозную модель с пошаговым разъяснением принципов построения.
На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA).
Ключевые вопросы участникам:
Какие закономерности движения денежных потоков в разрезе балансовых единиц удалось выделить в результате EDA? Какие связи были найдены при исследовании?
Можно ли предположить, в какие дни будут происходить транзакции в будущем? Проверьте свои результаты на имеющихся данных, какой МАРЕ у вас получился?
Попробуйте составить график движения денежных средств на основе выявленных закономерностей на 1-2 квартал 2021 года (будет предложен пример).
Какие данные могли бы, на ваш взгляд, помочь построить более точный прогноз? Предложите схему сбора новых данных: частота, гранулярность и другие необходимые параметры. Отразите в презентации, как вы предполагаете использовать эти данные для решения задачи.
Почему это важно:
«Северсталь» непрерывно улучшает качество планирования, что дает возможности более эффективно распределять финансовые ресурсы и экономить на финансовых затратах.
Наша задача на этом хакатоне – найти инсайты для увеличения точности прогноза доходов и расходов по статьям ликвидности.
Задача 2. Мониторинг цен
Суть задачи:
Разработать инструмент, помогающий специалисту планировать цену на закупку запасных частей к спец. технике.
Подойти к задаче творчески: создать инструмент прогнозирования в будущем либо "сервис-шпаргалку" пользователю с анализом конкретных товаров и вариантов определения цен (should cost model).
В задаче предстоит разработать принципы алгоритмического мэппинга имён и характеристик товаров, исследовать зависимости между данными.
На выходе – воспроизводимый код и презентация сервиса.
Ключевые вопросы участникам:
Вы разработали инструмент, который позволит специалисту на основе внутренних и внешних факторов планировать цену на закупку. Расскажите, какие внешние данные вам удалось собрать? Как на ваш взгляд эти данные могут повлиять на планирование и мониторинг цен на товары?
Как будет выглядеть процесс использования инструмента для специалиста по планированию? Опишите бизнес-процесс с иллюстрациями.
Разработанный инструмент должен позволять как визуализировать данные по товарам, так и выгружать данные в Excel для «быстрого» построения отчета. Продемонстрируйте варианты информативной визуализации и подготовьте код для формирования отчета, а также пример отчета.
Каких внутренних данных не хватает для улучшения качества планирования?
Почему это важно:
«Северсталь» массово обрабатывает десятки товарных групп при планировании бюджетов на закупку. Для увеличения скорости и точности обработки рассматривается альтернативный сценарий планирования цен на закупку по наиболее популярным категориям товаров с использованием алгоритмов, основанных на поиске данных.
Задача 3. Автоматический поиск поставщиков
Суть задачи:
Задача состоит из нескольких блоков:
разработка алгоритма для парсинга товаров
исследование возможных данных во внешних источниках
разработка программы подготовки информации в требуемом разрезе (товар vs поставщик vs рейтинг поставщика)
На выходе – воспроизводимый код и презентация сервиса.
Ключевые вопросы участникам:
Опишите ваше решение в таком разрезе: список найденных факторов, алгоритм поиска этих факторов во внешней среде, критерии ранжирования по ним контрагентов в связке с каждым товаром (возможно, не все факторы релевантны всем товарам). Опишите бизнес-процесс с иллюстрациями.
В рамках вашего решения должна быть дополнена информация о контрагенте, принадлежащем к номенклатуре. В частности, это могут быть ИНН/КПП, юр. адрес, статус, фин. показатели, отзывы о компании и др.
Какие инсайты по поиску информации о поставщиках и подходы для проведения ранжирования вы нашли?
Разработанный инструмент должен позволять визуализировать данные по поставщикам с привязкой (с учетом ранжирования) к товарам.
Почему это важно:
Автоматизация процесса поиска, первичной проверки и базового ранжирования поставщиков в разрезе каждой товарной группы – задел в сторону дополнительной прозрачности в принятии решений по закупкам и упрощения бизнес-процесса.
Задача 4. Анализ контрагентов
Суть задачи:
Провести исследование имеющихся данных и попробовать спрогнозировать просрочку по контрагенту, предложить, как обогатить модель иными данными.
На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA) и воспроизводимым кодом решения, предобработки, моделирования, а также выводами.
С нас — данные по контрагентам за 2 года, список показателей для анализа, выборка для обучения модели.
Ключевые вопросы участникам:
Вам представлены данные за разные годы с различным набором информации. Проведите EDA, постарайтесь определить и визуализировать взаимосвязи и выделите самые значимые факторы, опишите свои выводы.
Возможно ли на данных за предыдущие годы спрогнозировать по контрагенту на следующий год: a) факт просрочки; б) просрочку более 30 дней; с) просрочку в диапазоне от 60 до 90 дней?
Какие дополнительные данные можно было бы добавить для повышения точности прогноза?
Почему это важно:
Повышение точности прогнозирования просрочек позволяет более точно планировать доходность и возможные риски.
Когда можно приступать?
Подать заявку можно по этой ссылкедо 8 марта. Нужно заполнить анкету, создать команду и пригласить единомышленников или же участвовать самостоятельно. С 22 февраля по 8 марта пройдёт отборочный этап, нужно будет отправить решение одной из четырёх предложенных задач. 14 марта мы объявим итоги отбора. Финальный этап хакатона пройдёт 18-20 марта. Финалисты смогут доработать свои решения бок о бок с бизнесом. В течение этого этапа команды участвуют в онлайн чек-поинтах с экспертами и загружают итоговое решение на платформу регистрации. 20 марта все финалисты приглашаются на питчи своих решений в офис. Можно будет выступить онлайн. После оглашения результатов планируется награждение, афтерпати и нетворкинг в офисе при участии экспертов «Северстали» и McKinsey.
Что получают участники?
Призовой фонд включает как денежные призы, так и мерч:
700 000 рублей – общий призовой фонд хакатона.
4 приза по 100 тыс. рублей за лучшее решение каждого трека
200 тыс. рублей получит лучшее решение всего хакатона, а 100 тыс. рублей – лучшее решение по версии участников.
160 наборов мерча получат участники по итогам отборочного этапа.
Хочешь узнавать о новых хакатонах первым? Подписывайся на нашу группу в ВК: https://vk.com/hackathoncom Также, наш Telegram-бот, где мы присылаем хакатоны по параметрам, которые интересны вам: https://t.me/hackathons4ubot