Вам предоставлены данные из приложения МТС Kion по взаимодействиям пользователей с контентом за период 6 месяцев. В отдельных файлах есть:
факты просмотра контента пользователями
описание контента
описание пользователей
Что нужно сделать? Наиболее качественно порекомендовать список из 10 объектов для каждого пользователя из тестовой выборки. Код базовых моделей для этих данных уже есть.
Как сделать предсказание (сабмит)? Примеры базовых моделей и создания сабмита вы сможете найти в ноутбуке RecSys notebook Baseline.ipynb . Пример сабмита вы найдете в файле под названием sample_submission.csv. Это id пользователей, для которых сделаны предсказания контента, максимально совпадающие с реальными фильмами/сериалами, с которыми пользователи взаимодействовали за 7 дней теста. Формат файла sample_submission.csv: Id - список ID пользователей, по которым нужно сделать прогноз Predicted - список ID контента, отсортированного по релевантности, которые нужно предсказать. Это строка, где разделитель для ID - это запятая. Формат сабмита Ваш submission.csv - должен содержать 2 столбца: Id and Predicted. Ограничения:
В сабмите должны присутствовать все пользователи тестовой выборки
Количество item_id должно быть 10
Они должны быть отсортированы по убыванию релевантности для пользователя.
Для каждого пользователя должно быть предсказано 10 различных объектов. Не должно быть пропущенных пользователей.
Хочешь узнавать о новых хакатонах первым? Подписывайся на нашу группу в ВК: https://vk.com/hackathonsrus Также, наш Telegram-бот, где мы присылаем хакатоны, соревнования по параметрам, которые интересны тебе: https://t.me/hackathons4ubot