mikaprok (mikaprok) wrote,
mikaprok
mikaprok

Play Off



Околоматематика.

Сетон-Томпсон как-то заметил: терять свое время за наблюдением чужих упражнений (бесплатно) может только человек, чье время ничего не стоит.

Собственно, вся неизбывная любовь к спорту у англичан держится исключительно на ставках. Отсюда трепетное отношение к болению и навязывание социальным низам определенных подкрепляющих привычек для коллективного финансирования собственных удовольствий.

Может быть это покажется удивительным, но в 2018 году мы имеем тот же способ заработать (потерять) деньги, что и в 1980х, 90х и 2000х: каждый букмейкер выставляет свои коэффициенты, как бог на душу положит. Разумеется, говорят о немыслимой работе нанятых математиков, сборе статистике, которому позавидует любое государство первого мира и инсайде (не без того).

Не знаю, не знаю. Так ли всё перечисленное недоступно простым смертным?:-)

Вот усредненные вероятности на победу трех команд от 10 топовых букмейкеров, сделанные до начала турнира:
- 16,6% у Бразилии;
- 12,8% у Германии;
- 12,5% у Испании.

Сейчас коэффициент скорректировался, с небольшим отрывом лидирует Испания (несмотря на ничью).

Но, извините, почему бы действительно не использовать высокоточную технику, заодно проверив ее на «детекторе лжи».






Четверо исследователей из Университета Дортмунда взяли всю доступную публичную статистику о футбольных первенствах, ранжирование команд и случаи потенциальных сюрпризов на Чемпионатах Мира и Европы последних 50 лет, ну и до кучи имеющиеся коэффициенты букмейкеров.

Кроме того, они попытались перечислить некоторое количество факторов «далекого» влияния. Например, ВВП страны-участницы турнира.

Основываясь на внушительном массиве данных они решили до момента предсказания немножко поучить машинку и отранжировать все обстоятельства по степени их влияния на исход поединков, а дальше уже применить к предсказанию 18-го года.

Кому интересны технические детали, см. специальные приложения метода «random forest».

Интересно, что из всего многообразия факторов, самыми значимыми оказались как раз имеющиеся коэффициенты букмейкеров и ранг команд FIFA (!), посчитанные как бы на ходу.

Менее значимым стали общее количество футболистов команды, успешно выступавших в трех предыдущих сезонах в Лиге Чемпионов и их возраст.

Относительно неважной, основываясь на имеющихся данных, является, например, национальность и время работы в должности тренера.

Случайность? :-)





Дальше начались симуляции начинающегося чемпионата.

Ее прогнали 100000 раз.

Первые несколько раз Испания выглядела безоговорочным лидером. Однако, на большом количестве попыток лучшие шансы появились у Германии.

Проблема в тяжелой турнирной сетке у Германии.

В целом, предсказание выглядит так: если ей удастся прорвется через четвертьфиналы, она станет лидером. Если нет, то из оставшихся выбираем Испанию.
О Бразилии речь не идет :-) Впрочем и предсказывали сотрудники немецкого ВУЗа.





В таком раскладе, на мой взгляд, совершенно не учтены сюрпризы, происходящие на уровне 1/8 на каждом крупном турнире. Иначе всё было бы слишком просто.

«Вот такая, понимаешь, загогулина»


https://telegram.me/mikaprok


Tags: #machine learning, #россия, #спорт, #статистика, #чм-2018, football, machine learning, math, russia, sport, statistics
Subscribe
promo mikaprok july 7, 2017 00:17 87
Buy for 20 tokens
Редкий для меня служебно-личный пост. За последние полгода накопилось просто какое-то невероятное количество тем, о которых стоит поговорить, но за повседневной текучкой не доходят руки. Причем большей частью тем вполне жежешных форматов, которые не нужно упрощать-адаптировать и…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 60 comments