МУБК - "Что? Где? Когда?" в МГУ - Рейтинг МАК - Страница 5

Рейтинг МАК

Дата: Понедельник, 30.11.2009, 20:41 | Сообщение # 61

Группа: Модераторы

Сообщений: 496

Статус: Offline

Luke, кстати, на НЗ 4 города уже есть (и в листе ожидания - пятый). Так что в рейтинг пойдёт. Другое дело, что столь завышенных баллов уже не будет.

Эр

Дата: Понедельник, 30.11.2009, 21:09 | Сообщение # 62

Группа: Администраторы

Сообщений: 558

Статус: Offline

Quote (Roman)

он тоже не работает, как надо

Он работает именно так, как надо.

Roman

Дата: Вторник, 01.12.2009, 01:12 | Сообщение # 63

Группа: Модераторы

Сообщений: 884

Статус: Offline

Quote (Эр)

Он работает именно так, как надо.

Он не отражает реальной силы команд. По крайней мере пока. Следовательно, не работает как надо.

Эр

Дата: Вторник, 01.12.2009, 10:25 | Сообщение # 64

Группа: Администраторы

Сообщений: 558

Статус: Offline

Quote (Roman)

Он не отражает реальной силы команд. По крайней мере пока.

Он отражает реальную силу команд, продемонстрированную ими на закончившихся к моменту публикации рейтинга турниров. Колебания рейтинга у давно играющих команд, обусловленные обычными колебаниями формы - пунктов 50-60, и было бы странно, если бы их не было, а то вместо команд могли бы рейтинги играть. А если не нравится, что с трудом обыгранная команда не первая в рейтинге, а только-только выбралась из нижней половины, стоит немного освежить память, посмотрев, какие места эта команда ранее занимала в турнирах, в которых участвовала, и кому проигрывала. Результат, как говорят футболисты, на табло.

Эр

Дата: Вторник, 01.12.2009, 11:59 | Сообщение # 65

Группа: Администраторы

Сообщений: 558

Статус: Offline

Quote (Энди)

По-моему, и так понятно. Имеет смысл играть турниры, где много команд, сопоставимых по силе с твоей командой и имеющих рейтинги, отвечающие их силе или даже завышенные. Тогда, обыгрывая их (или хотя бы какую-то часть из них), получаешь неплохие баллы.

С командами, сила которых равна твоей, а рейтинг отвечает силе, играть мало смысла, поскольку теоретический максимум того, что можно при этом выиграть - 15%. Думаю, даже потерю трети прошлогодних бонусов скомпенсировать при этом не так просто будет. Не входя в топ, гораздо больше набираешь, именно что обыгрывая команды с завышенными рейтингами. А косяком во всём этом является то, что результат зависит только от тех, кого ты обыграл, и при этом абсолютно неважно, кто оказался впереди. Если команда "Ниф-ниф" обыграла "Транссферу" но проиграла всем командам второй лиги РЧ МУБК, это не команда "Ниф-ниф" так хорошо сыграла - она сыграла плохо, а "Транссфера" - очень плохо, но никакой заслуги "Ниф-нифа" в этом нет. А если команда "Наф-наф" проиграла "Транссфере", "Социал-демократам", командам Кузьмина и Губанова, но при этом оставила за спиной все абсолютно команды с рейтингом менее 2000, скорее всего, это означает, что команда "Наф-наф" посильнее будет. По существующей же формуле "Наф-наф", скорее всего, меньший бонус получит.

Roman

Дата: Вторник, 01.12.2009, 14:26 | Сообщение # 66

Группа: Модераторы

Сообщений: 884

Статус: Offline

Quote (Эр)

какие места эта команда ранее занимала в турнирах,

о! ты сам это сказал!

рейтинг отображает результаты команды, которые играны сейчас, и которые были играны ранее. Грубо говоря усредняет по времени результаты. Это значит, что о силе команда В ДАННЫЙ МОМЕНТ рейтинг не говорит ничего.
Если ещё вспомнить о том, что нанаших турнирах не везде составы собирают и переемственность не считается, что можно вообще о силе говорить.
Как можно сравнивать например "МР" образца конца прошлой весны (например периода туры команды Вода), где Энди играл один и нынешний убойный "МР"? Это разные команды, играбщие с разной силой. Которые при прочих равных должны разные места в турнире занимать.
РотоР, Змрзлинки, Вода... да много комнад существенно обоновились.
Некоторые команды бешенно прогрессируют в своём классе. Это никак не учитывается.

Плюс, по нынешнему рейтгу МУБК если ты не уверен, что сыграешь хорошо, лучше вообще не участвовать в турнире. Это разумнее рейтинга МАК, но всё же не совсем логично.
Если сборная Аргентины футболу, которая предположим пятое место в мировом рейтинге занимает, вдруг не захочет ехать на чемпионат мира, она прилично рейтинга потеряет. И не просто потому, что другие сыграют лучше.

Я не ругаю рейтинг МУБК. Он экспериментальный, он ещё выходит на свои мощности (когда у большиснтва команд больше 20 турниров будет, он будет точнее). Он лучше маковского, на мой взгляд.
Но у него есть минусы, как и у всего. Нет ничего иделаьного.
В моём понимании иделаьный рейтинг - тот, который соответствует силе команды в данный момент.

Энди

Дата: Вторник, 01.12.2009, 18:00 | Сообщение # 67

Группа: Модераторы

Сообщений: 496

Статус: Offline

Quote (Roman)

В моём понимании иделаьный рейтинг - тот, который соответствует силе команды в данный момент.

Тогда он должен учитывать то, сколько спали и сколько пили игроки команды перед игрой smile

Quote (Roman)

Как можно сравнивать например "МР" образца конца прошлой весны (например периода туры команды Вода), где Энди играл один и нынешний убойный "МР"?

Ну давайте введём учёт преемственности, если больше заняться нечем smile

В ГП прошлого года я ни разу не играл один, а на туре "Воды" состав как раз был сильнейший за все туры ГП (Валя тогда как раз играл в первый раз за МР). Это просто тур был такой smile

Эр

Дата: Среда, 02.12.2009, 01:25 | Сообщение # 68

Группа: Администраторы

Сообщений: 558

Статус: Offline

Quote (Roman)

рейтинг отображает результаты команды, которые играны сейчас, и которые были играны ранее. Грубо говоря усредняет по времени результаты.

Только усредняет их так, чтобы результаты команд, никогда не игравших в одном турнире, можно было сравнивать.

Quote (Roman)

Это значит, что о силе команда В ДАННЫЙ МОМЕНТ рейтинг не говорит ничего.

Ни один рейтинг в мире не сможет тебе наверняка предсказать, кто из двух команд окажется сильнее в следующем поединке. Повторюсь - если бы это было не так, играли бы рейтинги, а не люди. Однако верно ли при этом, что рейтинг не говорит ничего о силе команд? Примерно в той же степени, в какой любой турнир не говорит ничего о силе участвовавших в нём команд, только и всего. То, что в последнем релизе рейтинга "Механизм реакции" опережает "Ротор" на 98 пунктов, вполне себе говорит как о том, что первая команда ощутимо сильнее, так и о том, что "Ротор" неплохо выступал в последнее время - потому что разница 98 пунктов, а не больше. А верно ли, что на ближайшем турнире "Механизм" обыграет "Ротор" именно с вероятностью 62.9%, проверить нельзя никак. Или обыграет, или нет.

Quote (Roman)

Если ещё вспомнить о том, что нанаших турнирах не везде составы собирают и переемственность не считается

Quote (Энди)

Ну давайте введём учёт преемственности, если больше заняться нечем

Я как раз не вижу смысла её считать, даже если бы действительно было больше нечем заняться. Если команда регулярно играет в совсем разных составах, рейтинг даст некоторое усредненное значение её силы, чуть сдвинутое в сторону последних результатов, вклад которых всегда больше. Это в любом случае даст значительно меньшие ошибки в ожидаемом результате по сравнению с тем, что было бы, если бы каждый раз эта команда считалась командой новичков.

Quote (Roman)

Некоторые команды бешенно прогрессируют в своём классе. Это никак не учитывается.

Почему? Учитывается. И вполне адекватно, если к этому спокойно подходить. Во-первых, ты начал кричать об этой "проблеме" еще до того, как завершился хотя бы один сколь-нибудь успешный турнир с участием упоминавшейся тобой команды. Рейтинг не угадывает будущие результаты команд по звездам или даже по сообщениям на сайте. Во-вторых, чтобы получить существенную прибавку к рейтингу, её нужно заработать, показывая результаты выше предсказанных. Нужно доказать свою силу. Играя только в факультетском чемпионате и во второй лиге РЧ, где соперников мало и хорошо выступают они нечасто, много рейтинга не заработаешь. То есть из зоны "менее 2000", конечно, выйти можно очень легко, если ранее неудачно в неё попасть. Чтобы набрать хотя бы 2100 и больше, надо играть с этими соперниками много и очень стабильно всех их обыгрывать. Только вообще-то есть путь гораздо проще - сыграть в одном турнире с более сильными соперниками. Все "недооцененные команды" при этом могут исправить своё положение очень легко. Вот, например, динамика рейтингов некоторых команд после турнира на ДФ (32 участника, кажется):
Felidae +79 за 3е место
Прыжок аффикса +77 за 4е место (а если бы ты не устроил перестрелку, они бы получили больше, чем мы, т.к. до начала турнира их рейтинг был чуть-чуть ниже)
Кубинские революционеры +76 за делёж 5го места
Пепелац +82 за делёж 5го места (это самый большой плюс на турнире - блестящее выступление, которое, увы, команде потом подтвердить не удалось - и сейчас её рейтинг снова 2000, а 60 очков от полученных тогда 2060 как-то распределились между её соперниками).
Всё это, замечу, существенно больше, чем прибавка за 1-2 места.

Quote (Roman)

Плюс, по нынешнему рейтгу МУБК если ты не уверен, что сыграешь хорошо, лучше вообще не участвовать в турнире.

Не совсем верно. Да, ты рискуешь потерять очки; тем легче будет их набрать потом обратно. Неудачно выступил на одном турнире - перед следующим твой ожидаемый результат оказался ниже - в итоге получил больше. Да, наверняка не настолько больше, чтобы полностью компенсировать потерю за один раз (иначе было бы выгодно время от времени проваливаться), но вполне достаточно, чтобы сильно по этому поводу не беспокоиться.

Quote (Roman)

Если сборная Аргентины футболу, которая предположим пятое место в мировом рейтинге занимает, вдруг не захочет ехать на чемпионат мира, она прилично рейтинга потеряет. И не просто потому, что другие сыграют лучше.

А по нашей системе эта самая Аргентина так и останется со своим рейтингом, только уже не на пятом месте, а где-нибудь пониже, потому что вся верхняя половина таблицы - "команды, вышедшие из группы" - получат существенные прибавки за свои победы над сильными соперниками. Впрочем, напрямую к футболу на уровне сборных такую систему было бы сложно адаптировать. Там за два года сборная команда страны наигрывает меньше результатов, чем у нас в чемпионате биологического факультета. Рейтинг бы, по крайней мере, с такими коэффициентами сходимости, "сходился" бы настолько медленно, что потерял бы всякий смысл.

Энди

Дата: Среда, 02.12.2009, 02:02 | Сообщение # 69

Группа: Модераторы

Сообщений: 496

Статус: Offline

Тем не менее футбольный Эло-рейтинг существует. http://en.wikipedia.org/wiki/World_Football_Elo_Ratings
Даёт вполне осмысленные значения. Для России место на данный момент в точности совпадает с официальным рейтингом ФИФА smile

Эр, а, может, попробовать экстраполировать систему на базу турниров МАК? Могу сам попытаться этим заняться, если ты не против. У тебя эта программа (или что используется для расчёта) в каком виде? Какой формат входных данных?
Ну или хотя бы хочется попробовать её рассмотреть получше, может, какие коэффициенты удастся подкрутить для лучшей сходимости smile

Эр

Дата: Среда, 02.12.2009, 12:26 | Сообщение # 70

Группа: Администраторы

Сообщений: 558

Статус: Offline

Quote (Энди)

Тем не менее футбольный Эло-рейтинг существует. http://en.wikipedia.org/wiki/World_Football_Elo_Ratings

Ой, здорово! А я не знал.

Quote (Энди)

Можно.
Сейчас - tab separated values, в каждой строке - <место><TAB><название команды>, в первой строке - слова Турнир: <название турнира>. Результаты разных турниров в отдельных файлах, они должны обрабатываться в хронологической последовательности. После обработки очередного турнира генерируется файл с промежуточными результатами, который читается при обработке следующего турнира. Вообще к любому текстовому входному формату её легко адаптировать, она на ReXXе написана.

Коэффициентов в системе, к счастью, немного.
База системы - "нулевой рейтинг" (у нас сейчас 2000) и количество очков, превосходство на которое означает 75% результат превосходящей команды против уступающей. Сейчас у нас - 200, как у шахматистов. Для совместимости по масштабу с рейтингом МАК должно было бы быть что-то около 3000-3500, мне кажется.
Эти коэффициенты влияют только на масштаб.
Скорость сходимости и колебания рейтинга регулируются весовым коэффициентом, смысл которого - максимальное количество очков, которое можно получить за одиночную победу над одним соперником. У нас сейчас 10, тоже как у шахматистов.
Еще я ввел параметр, которого у шахматистов не было, поскольку в течение одного турнира шахматист никогда не играет достаточно много партий, регулирующий максимально достижимое количество очков за турнир. У нас сейчас 200, и работать этот параметр начинает, когда в турнире играет более 20 команд.

Quote (Roman)

он ещё выходит на свои мощности (когда у большиснтва команд больше 20 турниров будет, он будет точнее).

Еще уточню. Дело не в 20 турнирах. Проблем, если это можно назвать проблемами, сейчас две.
1. В начале существования рейтинга многие команды, по факту - не новички, не имевшие рейтинга МАК, получили рейтинг 2000, как начинающие команды. В итоге за турниры, проводившиеся в первые несколько месяцев, набирать очки было гораздо тяжелее, чем потом. Тем не менее сейчас истинный рейтинг среднестатистической команды новичков, по-видимому, пока еще ниже заложенных в системе 2000.
2. Рейтинг лидеров пока еще не стабилизировался - уже медленно, но всё еще верно они продолжают двигаться вверх, и, соответственно, тянут за собой остальных.
Оба этих фактора приводят к тому, что в данный момент рейтинг почти всех команд несколько занижен. Причем рейтинг тех команд, которые не играли несколько месяцев, тем более - в последний раз играли в прошлом семестре - занижен сильнее, чем рейтинг сыгравших недавно. Как только эти команды сыграют снова, пары турниров хватит на то, чтобы примерно восстановить "статус кво".

Энди

Дата: Четверг, 03.12.2009, 02:02 | Сообщение # 71

Группа: Модераторы

Сообщений: 496

Статус: Offline

А тем временем новый релиз рейтинга посчитан-таки по старой формуле.
Наши люди:

140 Прочерк 5382
143 От двух до пяти 5355
270 Концептуальный респект 3499
343 Credo 2728
426 Toulouse Lautrec 2127
545 Felidae 1540
638 Провал 1204
666 Вода 1112
670 Мюнхенский сговор 1100
719 Ротор 961
842 Delirium tremens 700
885 In Medias Res 653
783 Борис Савинков 817
965 Механизм реакции 553
1018 Змрзлинки 500
1440 994 214
1468 Команда с ежом 204

Эр

Дата: Суббота, 05.12.2009, 12:25 | Сообщение # 72

Группа: Администраторы

Сообщений: 558

Статус: Offline

О вот этом посте - поскольку ЖЖ-юзера хранят свои сообщества от посягательств, отвечу здесь.
К сожалению, много ответов от людей, которые берутся судить о том, чего вообще не понимают и не хотят понять. Кажется, наша игра поощряет такую привычку. Это печально.
Кноп, конечно, ответил по-свински, раз математик, мог бы указать на конкретные ошибки, а не понтоваться - если сам разбирается в математической статистике, конечно. Некорректности у тебя есть, попробую указать на них я.
Во-первых, я устарел, возможно, но "среднеквадратичное отклонение", о котором ты говоришь, и дисперсия - одно и то же или нет? Т.е. ты делил сумму квадратов нормированных ошибок на n или на n-1 (n здесь число команд)? Надо делить на n-1, хотя ошибка, возникающая от этого при типичном числе участников очного турнира, оказывается незначительной.
Во-вторых, и это более серьёзно. Сравнивать дисперсии по абсолютным значениям напрямую нельзя, и, в общем, из этого следует замечание о неправомочности сделанных выводов. Результат предсказания - величина с погрешностью, а расчитываемые из них дисперсии - тем более величины с погрешностью. Сравнивают их с помощью F-критерия для заданной доверительной вероятности. Чтобы это сделать, ты должен задаться доверительной вероятностью P, найти таблицу F-критерия для этого P, найти в ней величину F-критерия для заданного числа степеней свободы (они будут равны числу команд минус один, и если ты сравниваешь две системы на одном турнире, это будут одинаковые числа), и посмотреть, превосходит ли отношение сравниваемых дисперсий найденный критерий. Если да, ты можешь сказать, что результаты данного турнира система такая-то предсказывает лучше с вероятностью более P. Лучше взять хотя бы 75% (таблицы F-критерия ты точно сможешь найти еще для P=90%, обычно принятого у физиков; химики используют P=95%), но, боюсь, при P под 90% окажется, что все системы статистически одинаковы. ;-)
Усреднение дисперсий, вычисленных на разных турнирах, конечно, операция некорректная с точки зрения статистики. Если я ничего не путаю, тем более некорректная, что разброс дисперсий между турнирами гораздо больше, чем их же разброс между разными системами в пределах одного турнира. Смысл есть считать, сколько раз какая система опередила другую по F-критерию - если будет явное преимущество, наверное, конечные выводы оправданы.

Энди

Дата: Вторник, 22.12.2009, 17:10 | Сообщение # 73

Группа: Модераторы

Сообщений: 496

Статус: Offline

Окончательный релиз от 1 декабря.
146 Прочерк 5382
149 От двух до пяти 5355
283 Концептуальный респект 3507
361 Credo 2728
442 Toulouse Lautrec 2127
564 Felidae 1540
661 Провал 1204
689 Вода 1112
694 Мюнхенский сговор 1100
744 Ротор 961
810 Борис Савинков 817
872 Delirium tremens 700
911 In Medias Res 653
990 Механизм реакции 553
1043 Змрзлинки 500
1484 994 214
1493 Команда с ежом 209

Забавно, что всего в 2 рейтинговых баллах от команды "994" находится команда "911" из Иркутска smile

Эр

Дата: Четверг, 04.02.2010, 23:51 | Сообщение # 74

Группа: Администраторы

Сообщений: 558

Статус: Offline

Примерно вот так выглядел бы рейтинг МАК, если бы он считался по системе Эло в варианте МУБК.

Энди

Дата: Пятница, 05.02.2010, 19:22 | Сообщение # 75

Группа: Модераторы

Сообщений: 496

Статус: Offline

Супер!!!
А можно подробности? В какой степени ты учитывал реальный рейтинг - или всё вообще с нуля посчитано?
И за счёт чего "Афина" обошла Губанова?
Насколько сильно рейтинг меняется с каждым турниром?

ЗЫ. Поправь глюки при конвертировании: у тебя там на 227-м, 341-м, 401-м, 477-м, 1114-м, 1915-м, 2127-м, 2131-м местах какие-то html-коды вместо команд. Ещё имеется бНОПНЯ в изрядном количестве.