Читатель Артем Платонов размышляет над преимуществами и недостатками различных рейтинговых систем для оценки настольных игр на примере рейтингов портала о настольных играх Board Game Geek и оценки комментариев на «Тесере».
Википедия утверждает, что стереотипы как клише для типографской печати появились в XVIII веке, хотя стереотипы в человеческом мышлении появились, пожалуй, еще у пещерных людей. Ничего не скажешь, полезное изобретение – подобная картина мира позволяет здорово сэкономить время и сберечь ресурсы мозга, то есть оценивать, не подключая его!
Со временем для занятых людей были разработаны рейтинги, представляющие собой числовые или порядковые показатели, отображающие важность того или иного объекта или явления. С их изобретением практически отпала необходимость самому узнавать новое и анализировать данные – всё это уже сделали специально обученные люди (эксперты или проголосовавшие пользователи), и благодарному юзеру оставалось лишь пожинать сочненькие плоды чужих усилий.
Если взять мир настольных игр, в котором десятки тысяч наименований выходят каждый год (при этом старые никуда не деваются), то без «помощи зала» юзеру не обойтись – особенно, если он в мир миплов и картона пришел недавно. Зеленые новички обращаются за консультациями к продавцам в магазинах или друзьям, но прошаренные настольщики уже давно тусуются на сайтах, оборудованных рейтинговыми системами. В самом деле, удобно: глянул на рейтинг и готово!
Взяв за основу сайты Тесеры и BGG, мы обнаружим, что и там, и там используется десятибалльная шкала оценок, причем юзеру выдается средний итоговый балл нескольких критериев. Для BoardGameGeek, как родоначальника подобного рода рейтинга, в 2000 году подобное средство вполне годилось, тем более что тогда в ходу в основном и были пятибалльные и десятибалльные системы. Однако сегодня этот приём уже не отвечает современным требованиям и, по сути, не работает – и то, что его хотят воплотить в Тесере 2.0, не может не вызывать тревогу.
Первым недостатком десятибалльной системы оценки является субъективный характер отданных голосов: так, хейтеры «Мира хобби» будут сознательно занижать оценки играм этого издательства, а небезызвестный варгеймер молодецким набегом и вовсе поставит единицы всем, кто попадется под руку. Опять же, отечественные гики традиционно низко оценивают игровые достоинства того же «Манчкина», что не соответствует реальности. В связи с этим даже родилась шутка – эксперты с Тесеры не считают «Манчкина» за настолку. Людям, правда, нравится, но они же не эксперты.
Вторым недостатком десятибалльной системы является несопоставимость отметок от разных людей. Так, один юзер может быть очень придирчив и «семерка» для него наивысшая оценка почти идеальной игры, а для другого юзера «семерка» – нижний порог для «ничо так игрушки». Сложив оценки от таких юзеров, мы получим классическую среднюю температуру по больнице, где у всех вышло 36,7 – но только такой рейтинг нам ничего не даст в плане знания, интересна ли на самом деле данная игра.
Третий недостаток десятибалльной системы – то что оценки от игровой механики и оформления валятся в один средний балл. В связи с этим вспоминается одна московская мусорка по раздельному сбору отходов, где есть три крышки (для приёма стекла, бумаги и металла) и единый бак для всего этого. И если механику еще как-то можно сравнить с эталоном в жанре, то восприятие оформления и дизайна – сугубо субъективно, и эти два показателя нельзя смешивать. Они должны рассматриваться только отдельно.
Наконец, принцип балльной системы построен по принципу вычитания: мы сравниваем игру с неким эталоном (который сильно зависит от вкуса, опыта и знаний – и никто не знает, исходя из какого сравнения вы поставили свою оценку), после чего принимаемся отнимать баллы, если рассматриваемая настолка до эталона не дотягивает. Это устаревший путь, потому что начислять баллы, а не отнимать, продуктивней.
Таким образом, расплывчатость критериев и сильная субъективность оценок делает десятибалльную систему рейтинга малополезной. Но есть ли какая-нибудь концепция, которая работает лучше? Оказалось, все уже украдено до нас. Это – старая добрая двухбалльная система, в просторечье – «лайк» и «дизлайк». Или, если угодно, «плюс» и «минус».
Кстати, она когда-то применялась в оценке комментариев на Тесере, но в итоге от нее отказались в пользу однорейтинговой системы (только «лайк»). Это, конечно, является регрессом, потому что теперь пользователь не может выразить свое несогласие с комментатором без комментария. С другой стороны, этот full back понятен: подобная концепция чувствительна к набиганию мамкиных траллей-минусомётчиков, после чего срабатывает эффект толпы: люди принимаются лепить минусы каменту, даже если они до этого и не собирались этого делать. Впрочем, то же самое происходит и с каментом, набравшим много плюсов: ведь приятно ощутить сопричастность, хоть в глубине души ты и понимаешь, что нема нічого гіршого, ніж бути, як всі.
Опять же, суммирование положительных и отрицательных оценок, если сумма стремится к нулю, не показывает реальной картины остроты и полемичности: у камента, набравшего тысячу «лайков» и «дизлайков», будет такой же рейтинг, как и у камента, набравшего один «плюс» и один «минус». Как говорится, кваканье лягушек заглушает тихий шепот признания в любви и стоны умирающего, и на каждый реально полезный и важный камент придется по десять каментов лягушек – но читателю, чтобы продраться сквозь кваканье до действительно интересных вещей, в такой системе рейтинга придется потрудиться.
Впрочем, эти проблемы решает наиболее оптимальная система рейтинга – двухбалльная с двумя переменными. В ее рамках пользователь может поставить и «лайк», и «дизлайк» – как конкретному пункту оценки игры (механика, оформление и т.д.), так и комментарию, записи в дневнике или статье. Оценки складываются, но не между собой, а по отдельности, и юзер видит число как «плюсов», так и «минусов» – и по их количеству может судить о ценности рассматриваемого объекта. Эффект толпы при этом значительно ослабляется, потому что человек наглядно видит два лагеря и может спокойно примкнуть к одному из них, не ощущая себя д’Артаньяном в толпе гвардейцев кардинала.
Единственный недостаток двухбалльной системы оценок с двумя переменными заключается в том, что для ее анализа требуется некоторое усилие маленьких серых клеточек, тогда как значительное число юзеров хотят жить по принципу «я девочка, я не хочу ничего решать, я хочу платье увидеть готовое число». И винить их в этом мы не можем – в конце концов, жизнь коротка, и сэкономить время на анализе интересности настолок не такая уж плохая идея. Однако, как мне кажется, для аудитории Тесеры, которая позиционирует себя как интеллектуалов, это не должно стать проблемой.
Или станет?
Нужна хотя бы еще одна оценка «Так себе», иначе опять возникнет сильная зависимость от пользователя. Кто-то вместо «Так себе» ткнет дизлайк, а кто-то лайк.
Хорошая система, но, соглашусь, дефолтное значение «ноль» было бы очень кстати и позволило бы кое-что улучшить.
Пример рейтинга по одному критерию.
У пользователя есть коллекция «сыгранного», которая делится на 3 категории:
1. Значение по умолчанию. Я в это играл.
2. Сыграл и больше не собираюсь прям ни за что. Фу-фу. Так ужасно, что не поленился зайти и проставить дизлайк.
3. Сыграл, офигенно! Игра входит в мой топ5-топ20-просто топ любимых.
Самыми крутыми будут игры, для которых соотношение «входит в топ» к «есть в сыгранных» ближе к единице (т.е. почти все, кто играл, считает их великолепными). Ну а самые отстойные — соотношение «фу-фу» к «есть в сыгранных» ближе к единице.
Обращаю внимание, что это решает обозначенную Артёмом проблему нулевой суммы лайков и дизлайков, потому что они нигде не суммируются. Одна и та же игра спокойно может оказаться как среди лучших, так и среди худших (Манчкин, Arkham Horror — многие игры заслуживают такой судьбы). Это позволяет дифференцировать людей с разными вкусами, а не усреднять полярные вкусы до нуля. В перспективе это позволило бы ещё и систему рекомендаций сделать более гибкой и мощной.
Для порядка взвешиваем игры по количеству владельцев, а вклад каждого пользователя — согласно его «любвеобильности» (чем больше у конктрегого юзера соотношение игр в «сыгранных» и «крайних», тем больше вес «крайних». Если юзер обожает абсолютно все игры, то нам обожание ничего не говорит, если спокойно относится к 100 и любит лишь одну — то тут вес будет больше).
Какую систему оценок ни выбрать, она всё равно будет СУБЪЕКТИВНОЙ и зависеть от состава пользователей. Сейчас, если судить по ежемесячным рейтингам тесеры, в ней значителен процент воинствующих фанатов, и всякие войнушки занимают верхние строчки рейтинга. Такое же было двадцать лет назад на БГГ. Потом портал стал популярным, в него пришли обычные игроки, предпочитающие обычные игры, и именно они сейчас задают тон. Конечно, некоторые сложные игры всё равно заметны в рейтингах, но только самые массовые, а войнушки оказались на таких задворках, что их и там не каждый и найдёт (ну а любители войнушек, соответственно, обиделись и ушли на другие, специализированные сайты). Это же ждёт и тесеру — если она станет настолько популярной, что в ней появятся тысячи обычных пользователей, её рейтинги тут же перестанут нравиться тем, кто считает себя главным спецом по играм.
Естественно, любой получившийся рейтинг будет не устраивать большинство пользователей — всем будет казаться, что именно его любимые игры «затирают» всякие идиоты, не разбирающиеся в хороших играх, и ставящие хорошие рейтинги совсем другим, дурацким, играм. Поэтому я давно использую для анализа ОБЪЕКТИВНЫЙ показатель — количество игроков, играющих в те или иные игры. А если мне нужно подробнее узнать про какую-то игру, смотрю её GeekBuddy Analysis (нужно просто правильно выбрать друзей, мнению которых доверяешь) — порой одно-единственное критическое мнение даёт больше информации об игре, чем десятки хвалебных статей от знаменитых «обозревателей».
>>Первым недостатком десятибалльной системы оценки является субъективный характер отданных голосов
А при двухбалльной системе воцариться объективность и справедливость отданных голосов — те же нравится/не нравится только уже без градации?
>>Третий недостаток десятибалльной системы – то что оценки от игровой механики и оформления валятся в один средний балл.
На Тесере оценки разделены и эта система вообще не работает.
>>Опять же, отечественные гики традиционно низко оценивают игровые достоинства того же «Манчкина», что не соответствует реальности. В связи с этим даже родилась шутка – эксперты с Тесеры не считают «Манчкина» за настолку.
Оценка Манчкина на Тесере — 6,29, на БГГ — 6.0
Идеальной системы не бывает. И при любой системе нужно включать мозг.
Лично мне нравятся нарративная система оценок когда вместо цифр используются слова и оценочные суждения, как в Steam. Но и она не идеальна. Мне нравится 5-балльная шкала — она интуитивно понятная всем тем кто учился в школе и не такая ультимативная как лайки/дизлайки.
На БГГ можно и гистограмму по оценкам вывести и сортировки по рейтингам есть и тематические и издательские и авторские и т.п. И коммент к своей оценке можно оставить. Так что сопоставимостью отметок от разных людей а БГГ все нормально. Если включить мозг.
@aasever
>Идеальной системы не бывает. И при любой системе нужно включать мозг.
Система тем ближе к идеальной, чем менее она требует включения мозга 😀
Этот критерий тоже не идеален. Человек может любить игру, но не иметь возможности играть в неё часто (трудно найти партнёра, не хватает времени и т. п.). И наоборот, играть в то, что не особенно нравится, «на безрыбье».
@Денис II
Если игрок не играет в игру хотя бы раз в год (это требуется, чтобы я засчитал его), то он не имеет права называть её любимой игрой.
Я уже видел на БГГ призывы удалять старые рейтинги. Игрок сыграл в игру 10 лет назад, поставил ей тогда 10 баллов, но вот уже лет 5 в неё вообще не играет — есть игры поинтереснее. А обновить рейтинг той игре ему конечно же лень.
@Pard
Разумно! Надо ещё и во времени оценки взвешивать, вот это жесть :[
Критерий «минимум раз в год для любимой игры» — интересный.
@Random_Phobosis
Я даю рейтинги популярности двух видов — общегодовые (чтобы посмотреть, какие игры были вообще популярны, например, в последние 10 лет) и ежемесячные (чтобы видеть горячие новинки).
Все ссылки на поп-рейтинги собраны в одном месте: https://www.boardgamegeek.com/blogpost/56434/
@Pard
Это большой и полезный труд, однако он позволяет оценить именно популярность, а не качество, причём игры меньшей сложности сразу же получают преимущество за счёт того, что аудитория у них больше. Думаю, такая система тоже субъективна, просто взвешена на середину настольной аудитории (отсекает казуалов, потому что они не логают партии, и отсекает хардкорщиков, потому что их гораздо меньше).
В частности, в твоём стратегическом топе из первых 10 игр я не просто прохладен, а активно хейтерю 8 (и дальше картина немногим лучше, просто я не во всё играл). Топ БГГ, несмотря на субъективность (а может, и благодаря ей) выглядит для меня как для гика чуть поинтересней.
Так что по-моему вопрос в том, как построить рейтинговую систему, которая будет приносить не объективный (что бы это ни значило), а удобный для использования результат (чтобы больше юзеров смогли им воспользоваться).
@Random_Phobosis
Знание о том, что у феррари да ламборгини самые высокие рейтинги, нужно лишь миллионерам. Обычному человеку, который решил купить себе авто, гораздо полезнее знание того факта, что половина машин в стране — хёнде да форды, наиболее приемлемые для народа по параметру «цена/качество».
То же самое и с играми. Если человек в одну игру играет 200 раз в год, а другую раскладывает раз в 3 года, то мне совершенно наплевать, как он их оценивает: я вижу, что в первую игру ему нравится ИГРАТЬ гораздо больше. Игры надо покупать не для понтов (вот, мол, сколько у меня коробок из Топ-100 БГГ), а чтобы получать от них удовольствие. То есть использовать их по назначению, а не выбрасывать свои деньги на абстрактные «рейтинги».
@Pard
Ну вот это некорректное сравнение, т.к. настолки в большинстве своём стоят одинаково, и вопрос выбора в пределах одной ценовой категории для рядового потребителя остаётся открытым.
Если же продолжать количественную логику, то в идеальном мире, где все партии будут логать все игроки, лучшими станут Диксит и Манчкин. Шакал, может быть, или, к примеру Данетки — у них продажи больше, чем у Агриколы. А то и дурак подкидной с домино на пару (что даст нам ещё меньше юзабельной информации, кроме того, что популярные игры популярны).
Мы смотрим не на весь мир (в котором в бридж да в покер всё равно играют гораздо больше других игр), а на данные от продвинутых пользователей игрового портала. Это такие же игроки, как ты да я. Ты же не считаешь себя дураком, мнением которого можно пренебрегать? Так что получаемой от них статистикой вполне можно (и нужно!) пользоваться.
У игроков сейчас на полках лежит больше всего коробок со следующими играми (Munchkin на 14-м месте):
Catan
Carcassonne
Pandemic
Dominion
7 Wonders
Однако это не означает, что в них активно играют! Их места по числу игроков в этом году — только 30-е, 9, 6, 13 и 4 (у Munchkin — 198-е место).
@Pard
Моим мнением совершенно точно стоит пренебречь тем, у кого вкусы не совпадают с моими — и тут уже неважно, дурак или нет, если просто игры разные нравятся) В идеале система рейтинга должна помогать делать именно это — в нужных ситуациях пренебрегать. Насчет Манчкина хороший аргумент и ценное сведение.
Вижу ситуацию так: мы смотрим всё-таки на весь мир, но от которого произвольным образом отрезали 99% людей, и границу эту провели на «не лень логать игры на специализированном сайте настольщиков». Граница взята с потолка — сделай интерфейс посложнее или сайт более тормозной, будут логать меньше, сделай мобильное приложение с автораспознаванием коробки или поля по фото — будут логать всё подряд чисто по приколу.
И вот при ровно таком отсечении оставшийся процент тех, кому логать не лень, по стечению обстоятельств для нас с тобой как для настольщиков получился относительно близок по духу. Что-то типа «клуб проживающих на острове с градообразующим предприятием КамАЗ: ребята, а кто какие грузовики предпочитает?»
Проведи мы эту границу выше или ниже по параметру «не влом логать» — что будет? Фиг знает. А в идеале хотелось бы, конечно, получить систему, которая будет давать полезные результаты на любом наборе входных данных, неважно, участвует в ней только пять пацанов с игротеки или весь мир, который силами какого-нибудь суперудобного сервиса получил право голоса. Утопично, но хочется размышлять именно в этом направлении.
Могу предположить, что рекомендовательные сервисы типа last.fm невосприимчивы к подобным колебаниям аудитории. Если оттуда вдруг в один день пропадут все металлюги или, наоборот, набегут толпами — для не-металлюг вряд ли что-то коренным образом поменяется. И это круто.
@Денис II
Точно. У меня например в топе по сыгранным партиям «Бэнг на кубиках» который я не люблю но у друзей в кампании детей постоянно партейку раскладываем. И другие филлеры, типа Тайного послания. А вот в любимые мной кооперативы играем редко.
@Random_Phobosis
>>> Я уже видел на БГГ призывы удалять старые рейтинги. Игрок сыграл в игру 10 лет назад, поставил ей тогда 10 баллов, но вот уже лет 5 в неё вообще не играет — есть игры поинтереснее. А обновить рейтинг той игре ему конечно же лень.
А как быть в этом случае с плохими оценками. Я сыграл года два назад в игру Эксодус. Она мне жутко не понравилась и я влепил ей низкую оценку. И возвращаться к ней я не собираюсь.
По этой логике через 5 лет моя оценка не будет значит ничего. Ведь чтобы подтверждать свою плохую оценку я должен фиксировать в нее партии. А я не люблю эту игру, настолько что не собираюсь даже второго шанса ей давать.
Я же исхожу из той логики, что даже если моя плохая оценка, основанная всего на одной партии несправедлива, то другие оценщики выправят своими положительными оценками. Тут количество оценок важно. Но их количество важно при любой системе оценок.
Другая ситуация поиграл где-то (например на конвенте каком) в допустим Элизиум партии 2. Игра мне умеренно понравилась. Я выставил ей оценку. Но вот я уехал с конвента и все — игра мне больше не доступна. Она не понравилась мне настолько чтобы ее себе купить, а вот при случае сыграл. И этот случай может никак не наступить. И что же. Через 5 лет оценка сгорит.
Конечно можно придумать какую-нибудь хитрую формулу чтобы у оценки был вес. И у игрока отыгравшего много партий вес оценки больше, от времени последней оценки вес был больше. Но зачем? Расчеты усложнит, прозрачность системы тоже (меня вполне устраивает на БГГ что я могу посмотреть распределение оценок и комменты), а объективности если и добавит то едва. И все равно будут недовольные оценки.
@ciaemon, «так себе» — это мы берем «нравится» и принимаемся понижать эту оценку =) Или, если угодно, «так себе» — это отсутствие оценки. Ее можно симулировать, просто… не проставляя «нравится» или «не нравится» =)
Мы пошли на второй круг. Повторюсь: ни одна система, основанная на СУБЪЕКТИВНЫХ оценках, не будет удовлетворять всех — большинство всё равно останется недовольным (поскольку личные вкусы никогда не будут совпадать с полученным общим результатом).
А с ОБЪЕКТИВНЫМИ данными просто нет смысла спорить — они реально отражают то, что есть. И каждый может почерпнуть (и использовать, скажем, при выборе игр) из них ту часть, которая ему нужна и интересна. Например. Любишь сложные стратегии? Смотри список самых популярных стратегических игр, пропуская слишком простые (низкое значение Weight). Терпеть ненавидишь войнушки, особенно с кубиками? Пропускаешь в списке и их. И т. д.
@Random_Phobosis, в твоем примере на результат влияют «сыграл, но с оценкой еще не определился» и «сыграл, но забыл проголосовать». Кроме того, рейтинги для популярных патигеймов/гейтвеев будут отличаться от рейтингов для суровых гиковских игр, потому что в первом случае «забывчивых» будет больше. Мне кажется, у оценки «нейтрально/ноль/играл» больше минусов, чем плюсов, хотя они есть =)
@Pard, «Какую систему оценок ни выбрать, она всё равно будет СУБЪЕКТИВНОЙ» — да. Но речь идет о том, чтобы применять систему оценок, где субъективность сведена к минимуму. «ОБЪЕКТИВНЫЙ показатель — количество игроков, играющих в те или иные игры» — этот показатель не учитывает ни время партии, ни рекомендуемое число игроков, ни стоимость игры (в дешевые быстрые игры, где можно нормально играть даже вдвоем, будут играть больше), а потому он малоприменим.
@aasever, «А при двухбалльной системе воцариться объективность и справедливость отданных голосов» — влияние субъективности будет меньше. «На Тесере оценки разделены и эта система вообще не работает» — ну даже на скриншоте в статье есть средний балл же. «Лично мне нравятся нарративная система оценок когда вместо цифр используются слова и оценочные суждения, как в Steam» — там как раз используется система «лайк/дислайк» 😉 Просто с оценкой ты должен объяснить, почему так проголосовал. Впрочем, некоторые пишут пару бессвязных слов. «Так что сопоставимостью отметок от разных людей а БГГ все нормально» — к сожалению, вы невнимательно читали первую часть статьи =(
@Pard, «Если человек в одну игру играет 200 раз в год, а другую раскладывает раз в 3 года, то мне совершенно наплевать, как он их оценивает: я вижу, что в первую игру ему нравится ИГРАТЬ гораздо больше» — гм, если человек ходит на работу 400 раз в год, а в отпуск — 2 раза в год, значит, работа ему нравится больше? Оценка по формальным показателям приведет к формальному рейтингу, который ничего не объясняет.
«А с ОБЪЕКТИВНЫМИ данными просто нет смысла спорить — они реально отражают то, что есть» — угу, и отображают только то, что есть, потому что информацию о том, насколько людям эта игра нравится, извлечь нельзя.
@Pard
А еще есть понятие время партии.
Если мы например codenames за час сыграем раза 3, а в тех же колонизаторов в лучшем случае один раз, то это не значит, что codenames я люблю в три раза больше.
Для серьезных настолок это нужно учитывать. Иначе на первом месте по количеству партий всегда будут филлеры.
Я считаю НЕ количество партий, а число игроков. Ты сыграл 100 партий в игру, я — только 1 раз. Мы оба считаемся как ровно 1 игрок, сыгравший в эту игру. Этого с лихвой хватает для статистики (рейтинги телепередач, например, учитывают мнение на пару порядков меньшего количества людей, а ведь на их основе осуществляются огромные по суммам оплаты рекламы) и исключает накрутки, которые всегда возникают при учёте всех других видов рейтинга.
«Если б я был Оранж…» 🙂
Вставлю свои пять копеек:
1. Рейтинги без назначения весов категориям бессмысленны. В момент назначения весов возникает чистый субъективизм, отражающий личность назначающего веса. В этот момент любые ОБЪЕКТИВНЫЕ критерии становятся субъективным рейтингом.
2.Рейтинг из одной полоскикатегории в 10 звезд аля «Play Маркет» тоже собственно ни о чем не говорят.
3. Лайк/Дизлайк еще менее показательный рейтинг.
Самый реальный рейтинг это аля Facemash Цукерберга: две игры и ты выбираешь какая круче, а потом математика расчитывает рейтинг. Чем более массовое голосование, чем больше пар было, тем точнее рейтинг. Такую штуку запилили на сайте moeobrazovanie.ru небольшая плашка ге надо было выбрать лучшую из двух специальностей, а потом расчсчитывался рейтинг.
Если б я был Тимофей сделал бы такую штуку и пользователь при каждой перезагрузке страницы мог бы проголосовать за одну из двух СВОИХ игр (из своей личной коллекции). Тогда автоматом будет выстраиватся рейтинг игрв моей личной коллекции и в целом по Тесере.
Но самой главной фишкой являются не рейтинги, а теги/бирки к играм. Тег говорит об игре больше чем рейтинги. Я бы дал возможность юзерам создавать свои, индивидуальные наборы тегов к карточке игры. Другим юзерам дал бы возможность видеть и прикручивать/использовать эти «чужие» наборы тегов. Тогда игра начинает обрастать кучей тегов одинаковых и не очень и глядя на эти теги и их популярность становится сразу понятней что это за игра. Если 100 человек присвоили игре тег «Евро-аутизм» про игру становится все понятно без звезд и цифирей.
Юзер получает индивидульный каталог с индивидуальными тегами, ресур получает хорошее облако тегов к карточки игры. Фсе счастлифы.
С точки зрения кода ну на неделю работы одному прогеру.
Ерунда. Тот же субъективизм, только вид сбоку. Одни говорят: игра «А» круче, ведь её делал гениальный пан Игнаций, а другие: «Да он давно ничего нового не создаёт, его марсиане только что с треском провалились, а вот игра «Б» — будущая классика!»
@icenine
Это крутой вариант, но есть минусы.
1. Возможен когнитивно-исказительный Уроборос, когда в игру А хочется поиграть больше, чем в Б, в Б сыграть хочется больше, чем в В, но в В хочется поиграть больше, чем в А. Сам себя на этом ловил на маттрейде 😀
2. Ну просто нереальное количество работы, которую не сделают ни казуалы (влом и так часто не заходят), ни харкдорщики (скромная коллекция хотя бы из стошки знаешь сколько комбинаций займёт?)
@Pard, «Я считаю НЕ количество партий, а число игроков» — то есть в лидеры стремительно вырывается City of Horror на 18 игроков и «Требуются сценаристы» (еще не издана) с неограниченным количеством игроков (там в игре могут участвовать зрители, которые смогут пометить «играл»)?
«и исключает накрутки» — тут в лидеры выбивается быстрый филлер на 5 минут, коих я наиграю за время партии в Твилайт империум штук 50.
@Pard
Один предпочел А вместо Б, а другой выбрал Б вместо А или С. Система с выбором из двух на больших выборках работает идеально. Большую выборку сделать проще пареной репы: маленький виджет с коробками от двух игр, который принимает твой клик и аяксом перегружается, дает новую пару.
Эта гадалка из двух реально завораживает. Я порой сидел и тыкал в неё по 5-10 минут не обращая внимания на сайт. Если это будут игры из твоей личной коллекции, то ты будешь оценивать не сферического коня в вакууме, а игры которые знаешь, трогал, играл.
Если ещё чуть чуть напряч мозг программиста, то можно выдавать пары с учетом общих тегов. Тогда евроигры будт биться с евроиграми, варгеймы с варгеймами. Что лучше Рококо или 100000 лет до нашей эры?…и выборка на 100500 голосований — сразу станет понятно какая игра действительно лучше.
Прикладная математика и никакого мошенства.
@icenine, «чем больше пар было, тем точнее рейтинг» — по каким критериям будем сравнивать? Игра — это набор механик плюс бэк и оформление. По хорошему, нужно сравнивать не по играм, а по играм плюс по критериям этих игр. Это работает для фоточек, но не работает для комплексных объектов.
«Если 100 человек присвоили игре тег «Евро-аутизм» про игру становится все понятно без звезд и цифирей» — кхм, очень скоро станет понятно, какие игры подвергались набегу траллей и эффекту толпы. Кроме того, большинство юзеров будут лепить теги от балды, не зная, что они означают.
Вообще, есть ощущение, что это выбор из серии «что лучше, картошка или котлеты».
Не согласен в принципе. Мне кажется, что на бгг неплохая система и именно из-за короткого комментария после оценки. Скажем 10 — Отличная игра, буду в нее играть долго и не думаю что мое мнение поменяется. Если я увижу много десяток это многое скажет об игре. Если же я увижу много плюсов… вот, скажем, есть отличная игра N но она «тяжёлая». В вашем варианте там будет пара плюсов ибо всего несколько человек играли в эту игру. Пусть даже она великолепна… И эти пару плюсов вообще не дают мне никакой информации.
По поводу вычисления рейтинга — есть масса алгоритмов, которые как раз созданы для вычисления той самой итоговой оценки. Когда 100 оценок в плюс и одна в минус. Или 10 в плюс и одна в минус будут сильно отчличаться. Не надо тупо суммировать оценку с бгг. Можно вычислять оценку вовсе не суммой оценок проголосовавших. Я об этом писал на форуме Тесеры2.
Т.е. оценивать хорошо бы по десятибальной с четкой позицией каждого балла. Не на уровне «дизайн», а на уровне «игра принесла удовольствие»
А вот это: «Единственный недостаток двухбалльной системы оценок с двумя переменными заключается в том, что для ее анализа требуется некоторое усилие маленьких серых клеточек, тогда как значительное число юзеров хотят жить по принципу «я девочка, я не хочу ничего решать» вообще детский сад. Попытка манипуляции читателями. «Если вы думаете как я — то вы умны, а если нет, то вы тупой…»
Рейтинг 10бальный с разумным выведением результата несет массу информации. К нему можно добавить информацию по разбивке сколько голосов каждому баллу, как сдлелали в microsoft store. Это вполне современный вариант. И главное несущий информацию. В вашем стиле можно было бы написать: «Считается модным среди хомячков ставить лайки и дизлайки. 10 баллов это слишком сложно. Но аудитория тесеры имеет достаточно мозгов, чтобы справиться с градацией очень понравилось буду играть и мнение не поменяется. Надо всего лишь применить немного мозгов»
@futb_all
«по каким критериям будем сравнивать? »
Ни по каким. Исключительно по личным предпочтениям и ощущениям.
Это работает для любых объектов. И очень хорошо работает.
«Кроме того, большинство юзеров будут лепить теги от балды, не зная, что они означают.»
Зачем так плохо думать о людях? Я как имманентно забаненный на куче ресурсов вынужден хранить обзоры, архивы PnP и базу данных игр на своих ресурсарах берусь утерждать, что свобода тегов к карточке игры это величайшее благо. Я веду картотеку игр в андроидовской проге Memento Database. Вы не представляете насколько это круче чем унылая коллекция пользователя на тесере. У меня там теги: тип игры, используемые механики, краткий диагноз, линк на статью, цена, время игры, место хранения игры. Из этих данных потом такой суп варить можно, что мама не горюй. А по структуре тупейшая БД с джоинами.
«Вообще, есть ощущение, что это выбор из серии «что лучше, картошка или котлеты».»
Ровно для поиска ответа на такие вопросы и составляются рейтинги.
И в одной аудитории победит котлета, а у вегетарианцев победит картофан и это выявит Истину и на сайте мясоедов, и на форуме вегетарианцев. 🙂
Мне уже надоело опровергать всякие глупости. Пора с этим заканчивать.
Если я в рамках обычной системы рейтингов поставлю любому филлеру 10, а империи — всего 1, это для накрутки рейтингов в интересную мне сторону это сработает ОЧЕНЬ эффективно (что, собственно, довольно часто наблюдается — см. Топ-100 БГГ, не говоря уж о рейтингах тесеры — я уже писал статью об этом, с конкретными примерами) — не зря все мгновенно закипают, когда кто-то ставит игре рейтинг 0.
А если (по объективной системе учёта числа игроков) я отмечу, что в каждую из этих игр за весь год я ИГРАЛ (не важно, сколько раз), то все они получат ровно по 1 моему голосу. Какая здесь накрутка рейтинга? Никакой! Всё будет зависеть уже не от меня и от моего мизерного одного голоса, а от общего числа игроков, которые открывали коробки с этими играми хотя бы раз в год.
@Pard
Ну ок, а почему, собственно, раз в год? Почему не раз в месяц или раз в 5 лет? Почему именно год показателен? Плюс как уже неоднократно писали, «открыл коробку» — не значит, что она мне нравится.
@Pard
Смотрите где проблема:
вы берете ОБЪЕКТИВНЫЙ критерий — количество партий, и вы при определении своих рейтингов присваиваете ему очень большой вес. Вам кажется, что это важный критерий. НО… важность назначили вы и в этот момент появилась субъективность рейтинга. Это стал именно рейтинг Parda. Другие вправе с ним соглашатся или нет, но это все равно уже на уровне вкусовщины и ЛОМов (лидеров общественного мнения. Количество спорный критерий, т.к я к примеру играю каждое утро в электричке в Сан Хуан и количество партий сумасшедшее, но это не значит, что RtfG хуже. Просту у Гонки нет электронной версии и поэтому она пролетает как фанера над Парижем.
Назначение весов критериям автоматичски делает рейтинг авторским/субъективным.
Это я вам как чел мутивший стартап об образовании и рейтинговавший все вузы России говорю. Любой объективный критерий после придания ему веса становится субъективным.
@icenine
Приватные теги — это одно. Они интернализируются и применяются инстинктивно.
Публичные теги — совсем другое. Я не в курсе, что такое «евро-аутизм», и могу придумать штук пять противоречащих друг другу определений. И с радостью побегу использовать случайный из них (а может и все!). Twilight Struggle — варгейм или нет? Вот тебе и банальнейший тег, который на деле неюзабелен. Как пользователям узнать, какой тег что значит? Не, так дело не пойдёт.
@icenine
Опять вы своим словоблудием суть вопроса подменяете. Какой может быть более качественный показатель интересности любой игры, чем ответ на этот простой вопрос: «играют в неё или нет»? Это ОБЪЕКТИВНЫЙ и понятный показатель, а тов. Pard к нему никакого отношения не имеет. Он просто на него отвечает.
А вот если вам интересно другое, идите в том направлении. Если вам интересны продажи игры, см. количество имеющихся коробок у игроков. Если интересны СУБЪЕКТИВНЫЕ размышления игроков о том, какую игру считать лучшей (каждый ведь понимает под этим разное — кто оформление, кто число путей к победе, кто сложность или продолжительность, кто отсутствие случайностей и т. д.), то продолжайте таращиться (поскольку использовать их бессмысленно) на рейтинги БГГ/Тесеры, которые показывают что угодно, но только не интересность игры для игроков (поскольку мы видим, что сами игроки играют вовсе не в то, что они выше всего оценили).
@Majo
Читай выше: я делаю и месячные рейтинги.
@icenine, «Ни по каким. Исключительно по личным предпочтениям и ощущениям. Это работает для любых объектов» — миллионы мух не могут ошибаться и какашки таки вкусные? Окай.
«Зачем так плохо думать о людях?» — я работаю продавцом настолок и вижу уровень геймерской культуры в массах. Счастье, что 99% этих людей не ставят оценки в инете.
«Ровно для поиска ответа на такие вопросы и составляются рейтинги» — ну ладно, уж меня-то траллить не надо =) Рейтинги ориентированы на массового пользователя, а массовый пользователь любит и то, и то.
@Pard, «Мне уже надоело опровергать всякие глупости. Пора с этим заканчивать» — Пард, упырьте мел, ей-богу. Давайте все же не скатываться в траллинг.
«А если (по объективной системе учёта числа игроков) я отмечу, что в каждую из этих игр за весь год я ИГРАЛ (не важно, сколько раз), то все они получат ровно по 1 моему голосу. Какая здесь накрутка рейтинга?» — то есть паленая водка по качеству круче обычной, раз ее больше потребляют? Ну окай, уговорили.
@Pard, «Если вам интересны продажи игры, см. количество имеющихся коробок у игроков» — значит, «Шакал», на продажу которых и создана «Мосигра», игра всех времен и народов? Ну окай.
А ведь Пард в конце правильно написал — бгг позволяет ранжировать как кому надо. Считаешь, что важнее наличие игр? Упорядочи по количеству владельцев. Интересны оценки? Упорядочивай по оценкам. Хочешь смотреть только сводную оценку избранных гигов? Легко. Хочешь выделить только игры с определенной механикой — вперед. Вот поэтому тесера 2, 3, 10 и т.д. всегда будет более убогой, человек из СНГ всегда хочет навязать одну единственно правильную точку зрения, а не дать возможность каждому получить свой критерий…
Хорош рейтинг с единомышленниками (это я его так обозвал, как называется «по-научному», не знаю). Как, например, на фантлабе. Это когда система вычисляет для тебя индивидуальный рейтинг. Работает это так. Система сравнивает твои оценки с оценками других пользователей. Те, чьи оценки близки к твоим, объявляются твоими единомышленниками, и при вычислении рейтинга для тебя их оценки будут иметь больший вес, чем оценки других пользователей.
Увы, это работает, только когда пользователей много, и когда ты сам поставил достаточно много оценок.
@Денис II, любопытная система, но она не защищена от траллей =(
@futb_all
1) Отмечают свои сыгранные игры ТЕ ЖЕ люди, которые ставили рейтинги, а не мухи из туалета.
2) «Шакал» по числу игроков БГГ ни в какие списки популярности по определению попасть не может — в этом ГОДУ в него играли ровно 16 человек. А на тесере рейтинг у игры выше среднего — по мнению 300 (!) игроков. Или мух…
Так, что тут у нас? Пард гнет свою любимую линию про ОБЪЕКТИВНОСТЬ своей оценки и СУБЪЕКТИВНОСТЬ всех других, а когда ему приводят контрпримеры — называет их «словоблудием», «глупостями» и прочим.
По-моему разговор идет на разных языках. Давайте определимся с терминологией. Для начала — что такое «интересность» игры?
@hickname
Интересность — когда сначала говоришь ‘давайте сыграем партейку, до последнего автобуса ещё успеем.’, и позже этим же вечером ‘давайте сыграем партейку, до первого автобуса ещё успеем’. Если вы понимаете о чём я 🙂
Методика Цукерберга из facemash основана на рейтинге ЭЛО по которому ФИДЕ расчитывает рейтинг шахматистов.
https://ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%B9%D1%82%D0%B8%D0%BD%D0%B3_%D0%AD%D0%BB%D0%BE
Ровно столкновение двух Игр/Шахматистов дает настощий рейтинг игры, без субъективизма весов, критериев и прочей фигни.
Тупой вопрос:»Кого любишь больше: маму или папу? Каркасон или Маленький мир?» даст вам объективный рейтинг.
А главное голосовать за пары ОЧЕНЬ прикольно.
Я бы на месте тесеры написал бы эту часть с готовыми виджетами для блогов вордпресса и просто готовым JS для вставки в сайт. Пусть бы люди играли в эту голосовалку и на других сайтах, блогах, а статистика собиралась бы на тесере.
Этот рейтинг будет реально более точным. Даже лучше чем на bgg.
Киллер-фича практически.
Лайк не является рейтингом. Это механизм формирования контента пользователя через действия/лайки его френдов.
«после чего срабатывает эффект толпы: люди принимаются лепить минусы каменту, даже если они до этого и не собирались этого делать. Впрочем, то же самое происходит и с каментом, набравшим много плюсов: ведь приятно ощутить сопричастность»
Фигню сказал.
Может где-то и есть такие стадные товарищи, но с последними 20-ю годами культивирования «неповторимости и уникальности каждого» я таких не знаю.
Вон даже православные священники пишут длинные посты про «мы разучились быть рабами и это очень печально»
Согласен с тем что пишет человек — плюс ему. Видишь фигню порет — минус. А если количество плюсов и минусов отдельно показывать, то можно как раз объективную относительно картину увидеть.
Отсутствие дизлайков как раз и приводит к пустым холиварам: да нет ты не прав, да нет ты — с размазыванием реальной оценки по куче лайков каждого из комментов.
@icenine
Внезапно для себя, нахожу подход Айса интересным. Не скажу чтоб идеальным, но он хотя бы не выплескивает на помойку ребенка вместе с водой, убирая относительность оценок одного пользователя между собой. Так допустим мне нравятся и Тайное Послание и СтарКрафт, но очевидно же не одинаково.
И как это коррелирует с количеством игроков? Я лично не вижу никакой связи…
Психологи говорят, это самый неправильный и вредный вопрос, который можно задать ребёнку. Это к слову, вне связи с дискуссией.
@Pard, забавно получается — сыграли в игру, всем не понравилось, отметили, что играли (но про себя решили, что больше не будут), и Пард тут такой — опа! В игру играет! Это хит! =))))
@icenine, «Лайк не является рейтингом» — угу, а ответ в анкете («Нравится ли вам игра?») не является ответом.
@ThunderWolf, «Может где-то и есть такие стадные товарищи» — тут проблема в том, что каждый себя считает нестадным, а потом идет и голосует за ЕР, как все.
Всё это очень хорошо, но лично мне нужна условная 10 бальная система (на самом деле больше, учитывая дроби), чтобы ранжировать игру в своём личном топе игр.
В этом случае двухбальная система абсолютно бесполезна.
ИМХО, основная проблема не в количестве баллов, а в ориентированности оценивающих.
То есть, еврогеймеры будут ставить низкий балл америтрешу, и наоборот.
В результате оценка игры будет зависеть не только от её качества/интересности, а в значительной мере от преобладания любителей/хейтеров жанра среди голосовавших.
И как этого избежать, мне например, непонятно 🙁 .