«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых? в МТС Digital решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Для этого в МТС Digital сгенерировали полусинтетические данные.
Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?
Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (<18, 18-24, 25-34, 35-44, 45-54, 55-64, 65+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.
Задача соревнования Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе ситнетических данных.
Проверка решений:
Решения проверяются автоматически. Запуск происходит на полностью закрытых тестовых данных, которые не передаются участникам.
На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
Кол-во сабмитов в день: 3
Метрика соревнования — ROC-AUC – для определения пола, f1 weighted – для определения возраста. Все решения рассчитываются по формуле - 2 * f1_weighted(по 6 возрастным бакетам) + gini по полу.