среда, 19 сентября 2012 г.

Прогнозирование будущих результатов(Часть 1)

Для разработки модели прогнозирования и оценки, я решил немного углубиться в дебри прогнозирования и выявить какой показатель по итогу чемпионата большего всего коррелирует с очками набранными командой по итогу. Начать решил с сезона 2007, чтобы потом не углубляясь в каждый конкретный сезон показать вам только окончательные результаты.

И так базовыми показателями по окончании сезона являются Место, Очки, Забитые мячи, Пропущенные мячи, Удары по воротам, Точные удары по воротам и Удары по воротам соперника.

На их основе уже получаем следующие показатели которые и будем оценивать:
- Место
- Очки
- +/- (Разница забитых и пропущенных)
- Sh% (Отношение забитых мячей к общему количеству ударов)
- Sv% (Отношение незабитых ударов по воротам к общему количеству ударов)
- PDO ((Sh%+Sv%)*1000)
- TSR (Отношение уаров и точных ударов по воротам)

И так по итогам 2007 года мы имееи следующие цифры:



На основе этих данных найдем аналитическую зависимость показателей от очков набранных командами по итогу турнира. То есть сравним показатели искусственно нами созданные и единственный объективный показатель влияющий на расстановку команд в итоговой таблице.
В следующей таблице я приведу коэффициент корреляции между показателям и очками команды.

По итогам расчетов мы получаем следующие данные:



По этим показателям мы видим что наибольшей корреляцией по отношению к очкам набранным командами являются показатель разницы забитых и пропущенных и PDO.

По разнице забитых и пропущенных график выглядел следующим образом:



Этот показатель наиболее близок к итоговому набору очков, но насколько прогнозируем этот параметр по ходу турнира нам еще предстоит выяснить.


По PDO имеем следующую картину:


Этот показатель как показывают исследования других блогеров(хоккейных и футбольных) имеет тенденцию держаться на одном уровне на протяжении долго времени, и по прошествии 1 круга чемпионата почти всегда остается неизменным.

В следующих постах посмотрим на картину по остальным сезонам, следующим за 2007 и попытаемся выяснить насколько эти показатели предсказуемы по прошествии определенного количества матчей. Проведенная работа позволит нам получить параметры для построения уравнения регрессии типичного именно для РФПЛ. И позволят делать прогнозы на финальную таблицу чемпионата после 1 круга.

Данные взяты с сайта Чемпионат.сом

Комментариев нет:

Отправить комментарий