Найди себя на картинке

EVE Online: Найди себя на картинке
Вы могли пропустить интересную инфографику, которую показала компания CCP на последнем фанфесте. При помощи датамайнинга разработчики проанализировали разные типы игровой активности в EVE Online и внимание к ним со стороны игроков. После этого вся аудитория космической вселенной была разделена на пять групп: Профессионалы, Предприниматели, Агрессоры, Тусовщики и Традиционщики. Отдельное спасибо oleg_krapilsky за прекрасный перевод и оформление инфографики на русском.

Из приведенной картинки можно сделать множество интересных выводов, но пока давайте пройдем по тому, что подразумевается под каждой из групп.

EVE Online: Найди себя на картинке
«Профессионалы» — это те, кто использует все доступные в игре механики, грубо говоря, подстраиваясь под требования игры. Из неожиданных открытий – они больше всех выступают в роли «лекаря» (здесь это называется «ремонт кораблей»), хотя я ожидал увидеть в чемпионах этого пункта «Тусовщиков». Из ожидаемого – у них самые длительные игровые сессии. И они самые социально интегрированные – количество связей с другими игроками, активность в чате и полеты в составе флотов зашкаливают.

А вот то, что группа «Предприниматели» почти не отстает от «Профессионалов» по времени, проведенному в игре, приятное открытие. Оно подтверждает статистикой, в принципе, известный факт – в EVE Online достаточно много мирной деятельности. Параметр «Количество уничтоженных кораблей» у этой категории игроков – яркое тому свидетельство. Количество связей с другими игроками – на предпоследнем месте.

«Агрессоры» — название этой категории говорит само за себя. Но вот игровые сессии у этих ребят короче, чем у предыдущих двух групп, количество мирной деятельности стремиться к нулю. Зато связей с другими игроками больше, чем у «предпринимателей», при одинаковой активности в чате.

«Тусовщики», несмотря на название, проводят в игре довольно мало времени, отсюда отставание по всем видам игровой активности. Даже по социальным связям они на третьем месте после «Профессионалов» и «Агрессоров». В саму категорию «туссовщиков» они попали благодаря пропорции при распределении всех видов игровой активности: параметр «активность в чате» у них способен затмить все остальные вместе взятые.

Наконец, «Традиционщики» — их поведение соответствует стандартному набору шаблонов в традиционной MMO – выполнение миссий, много путешествий по секторам с высоким уровнем безопасности, много торговли. Все остальное – значительно меньше, чем у других категорий. Думаю, что и игру такие люди покидают куда чаще.

К слову, вот и статистика по текущему соотношению этих групп в игре:

EVE Online: Найди себя на картинке
Как видим – шок, сенсация – меньше всего в EVE Online «агрессоров». Циник внутри меня подсказывает, что, может, это потому, что «профессионалы» по модели поведения не слишком далеко ушли от «агрессоров», но романтик замечает, что в сумме остальные три категории все равно представляют больше половины всей аудитории EVE Online. Мне кажется, что эту статистику мы будем использовать в наших дискуссиях еще не раз.

EVE Online: Найди себя на картинке
Отдельного упоминания заслуживает статистика закономерности использования альтов при сравнении с возрастом альянса. NC, пандемики и разоры отличились зашкаливающим количеством альтов, уделав даже такие рентерские образования, как NA. А вот CVA в очередной раз порадовали уверенным расположением в верхней части картинки (возраст), но при этом в первой ее трети (количество альтов).

Еще раз хочу сказать огромное спасибо Олегу, как за предоставленные материалы, так и за трансляции непосредственно с места событй.

Ах, да, у меня вопрос: если вы играли в EVE, вы к какой группе сами себя относите? Я вот отчетливо «Предприниматель».
Читайте также

54 комментария

Неожиданно, скорее предприниматель. Спасибо за разъяснения. Никак не мог сесть и разобраться в этих инфографиках, а тут все сразу понятно стало.
  • KaDoy
  • 0
  • v
Почему неожиданно? При таком количестве возможностей для мирной деятельности-то. Если вы любите заниматься добычей/производством — можно зависнуть просто от количества возможностей. Это я вам как раз как большой ценитель этого дела говорю.
Ну, я не торгую. Не люблю. Поэтому неожиданно.:)
Торговля это очень мааааленькая часть :) Количество сертификатов в разделе «наука» кажется наибольшее из всех разделов. Что как-бы намекает :)
oleg_krapilsky уже линковал в своей трансляции эти ссылки. Но я повторюсь.
http://spreadsheetsin.space/year-in-review/
http://youreveyear.appspot.com/
http://pozniak.pl/yearly-stats/
По этим ссылкам можно в визуальном виде посмотреть статистику по своему персонажу в EvE Online.
Определенно больше всего возможностей, а также потребностей в нулях. Так что большинство профессионалов это наверняка агрессоры, которые умеют зарабатывать кредиты. Поэтому у них больше активности по агентам, научным исследованиям, торговле и даже добыче руды.

Ева силшком сурова, чтобы лекарями в ней были тусовщики. К тому же в большинсте PVE активносей не нужны лекари. А тусовщики это именно те, кто много общается в чате, на форуме или в голосовике. При этом они совсем не обязательно летают во флотах. Опять же большинство PVE активностей не требуют группы (флота).
Нет.

В нулях есть уникальные возможности (очень немного, на самом деле), но вот насчет потребностей — вы заблуждаетесь, и насчёт зарабатывания кредитов — тоже не всё так однозначно. В вормхолах и на 5-ых агентах зарабатывают не меньше. И то и другое — не нули.
Ах, да, у меня вопрос: если вы играли в EVE, вы к какой группе сами себя относите?
Традиционщик из палаты мер и весов)))
Профессионал с ПвЕ активностью как у Агрессора, ну или Агрессор с показателем ремонта как у Профессионала(как сел года 2,5 назад на логи так и сижу на нём).
Традиционшик, хотя я не играю сейчас
  • MriN
  • 0
  • v
После этого вся аудитория космической вселенной была разделена на пять групп: Профессионалы, Предприниматели, Агрессоры, Тусовщики и Традиционщики.
Из заметки так и не понял, что именно является критериями занесения игрока в определенную группу.
Анализ реальных типов активности в рамках действий конкретного персонажа и соотношение времени, потраченного на них.
Анализ реальных типов активности
То есть некоторая хитрая формула. И потом из этих же групп выделяли склонности к тем же активностям, по которым и делили?
Насколько я понимаю, нашли закономерности и разделили на группы.
нашли закономерности и разделили на группы
В которых потом и нашли закономерности, по которым разделяли? Да, утрирую, но явно чего-то не понимаю.
Во во. :)
Вот алгоритм:

Make a long list of potential variables by brainstorming, e.g. how active are they in shooting other player's internet spaceships, how much they mine or produce, how much do they socialize(chat, eve-mail), how much they travel, the number of jumps they make, how often they log in and for how long their game sessions last
Individually analyze, and transform each of those variables, i.e. look at their distribution, some can be e.g. log transformed or factorized into ranges, e.g. [0,1], [0,0.333,0.666,1], etc. In the end, all variables are normalized into [0..1]
example: if the number of days a player did any mining in January is 5, then the mining variable becomes 5 / 31 = 0.1613
Select the most important variables in an iterative process of PCA, segmentation and discussion with in-house experts.
Use PCA to perform dimensional reduction, and find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
Finally, run a clustering algorithm(e.g. K-Means) on the principal components, pick the optimal number of clusters to settle with, look at the underlying variables aggregated by the cluster IDs, and come up with fancy names for them.

Какой из этапов в нем смущает? :)
Select the most important variables in an… process of… discussion with in-house experts.
Этот.
find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
И этот.

Ну и конечно сложно доверять таким выводам без сопутствующего подтверждения другими методиками. Хотя, если на безрыбье никаких других исследований нет, то приходится довольствоваться и этим.
Комментарий отредактирован 2015-03-31 11:14:06 пользователем hitzu
Select the most important variables in an… process of… discussion with in-house experts.

Какие важные игровые активности не вошли в статистику? Ведь она вся представлена в таблице.

find the optimal number of components to use in the clustering. We ended with using the first 5 significant components

А в этом случае что упущено, на твой взгляд?
А разве ты не видишь, что методология построена на субъективном отборе?

«Мы выбрали 5 важных компонент»
А что считать важными? И почему пять, а не шесть или три? И чем руководствовались эксперты, когда отбирали главные переменные в «итеративном процессе PCA»? То есть что послужило отправной точкой для выбора степени аппроксимации?
Слушай, ну, у нас же есть результат. Он перед глазами. Ты можешь сказать «ха, ну, вот видите, они не включили в статистику такую-то активность». А так получается какая-то абстракция. В логах намного больше данных, чем приведено. Например, из какого оружия стреляли, на какой дистанции, какую руду копали и так далее. Так что отделять важное от неважного пришлось бы однозначно. Что и было сделано. У меня претензий к вычленению важных активностей нет, но если у кого-то есть, если есть замечание — вот конкретно такая активность не попала, а она важна — тогда давайте говорить.
У нас есть такой результат: Есть группа людей, которая любит стрелять, мы назвали их Агрессорами. И наше исследование подтвердило, что Аргессоры любят стрелять. Круто, да?
Ну, я вижу статистику совершенно иначе. Если посмотреть на картинку, то Агрессоры и Профессионалы «любят стрелять» абсолютно одинаково.
Комментарий отредактирован 2015-03-31 11:59:53 пользователем Atron
У нас есть такой результат: Есть группа людей, которая любит стрелять, мы назвали их Агрессорами. И наше исследование подтвердило, что Аргессоры любят стрелять.

Нет, Дмитрий, в описании процесса написано совсем другое:

Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров, смотрим на то, какие именно из исходных переменных оказались собраны в каждом из кластеров, и придумываем для кластеров громкие названия.

Разделение на группы и придумывание названий для этих групп происходит на самом последнем этапе — никто, как вы можете видеть, и не думает вести анализ данных, исходя из заранее сложившихся представлений о классификации игроков.
Для этого алгоритма надо знать (или придумать) заранее число кластеров. С тем же успехом они могли поделить множество на более многочисленные мелкие кластеры, но тогда, видимо, громких названий придумать бы не получилось.
С тем же успехом они могли поделить множество на более многочисленные мелкие кластеры

Вы ведь в курсе, что значение k берётся не с потолка, да?
Ага. Какой вариант лучше сочетается с ожидаемым результатом, тот и выбираем. Знаем, проходили.
С вас — цитата, убедительно доказывающая факт существования «ожидаемого результата» где-либо, кроме вашей собственной головы; ни в одной из опубликованных презентаций, статей и видеозаписей выступлений не упоминается о том, что к этому исследованию аналитики CCP подходили, уже имея на руках готовую классификацию игроков по стилям игры.

Или я снова не дождусь от вас ничего, кроме вашего традиционного «ничего я вам доказывать не собираюсь»?
А зачем мне доказывать ваши выдумки?
Т. е. от своих слов вы отказываетесь?
Это была другая ветка — раз. Это было до того, как была озвучена методология — два. Ещё наезды будут?
А вот комментарий из этой ветки, оставленный уже после того, как здесь был описан метод проведения исследования:



Судя по всему (и по комментарию, и по плюсику) мысль о предвзятости исследователей по-прежнему встречает у вас живейшее одобрение.

Ещё наезды будут?

Когда вам указывают на, э-э-э, несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»?
Судя по всему
Судя по всему это лишь ваши догадки за уши подтянутые под ваши обвинения, милейший.

Когда вам указывают на, э-э-э, несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»?
Когда я высказываю свои предположения, то это действительно не более, чем предположения. Но вам же надо педантично втоптать в грязь собеседника, на меньшее вы не согласны. На нормальный человеческий диалог ради которого я когда-то зарегистрировался на ММОзге я с вами уже давно больше не рассчитываю, зря только ввязываюсь.
Судя по всему это лишь ваши догадки за уши подтянутые под ваши обвинения, милейший.

Да-да-да. А то, что здесь, здесь и здесь вы продолжаете настаивать на предвзятости исследователей — это, разумеется, иллюзия.

Когда я высказываю свои предположения, то это действительно не более, чем предположения.

Вот чего в этой теме ещё не было — так это ваших предположений по поводу того, что и почему в данный раз «скрывают власти». Сможете объяснить, зачем CCP нужно заниматься искажением результатов?

Но вам же надо педантично втоптать в грязь собеседника, на меньшее вы не согласны.

Я повторю свой вопрос: когда вам указывают на несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»? «Втаптывание в грязь»?

На нормальный человеческий диалог ради которого я когда-то зарегистрировался на ММОзге я с вами уже давно больше не рассчитываю, зря только ввязываюсь.

«Нормальный человеческий диалог» редко когда начинается с туманных обвинений, ёрничества и нежелания признавать собственные ошибки.
Whatever, вы победили. Можете взять с полки пряник.
Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров,
Это уже кое-что объясняет.

Вы ведь в курсе, что значение k берётся не с потолка, да?
Тем не менее, из текстов я понял, что однозначного метода выбора наилучшего k нет:
You can maximize the … Another approach is to start with … Finally, you can …
As always in data analysis, there is no one true approach that works better than all others in all cases. In the end, you have to use your own best judgement.
И вообще, en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set
Тем не менее, из текстов я понял, что однозначного метода выбора наилучшего k нет

Однозначного метода нет, однако я бы не сказал, что расхождения между результатами чудовищно велики.
я бы не сказал, что расхождения между результатами чудовищно велики
А я не могу быть уверен, что в данном случае статистики EVE все годные методы дали бы именно 5 категорий. А ведь 4 или 6 могли бы нарисовать… не знаю как сказать… иначе воспринимаемую картину. Хоть и не чудовищно.
Исправил перевод:

Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров, смотрим на то, как именно исходные переменные меняются от кластера к кластеру, и придумываем для кластеров громкие названия.
А разве ты не видишь, что методология построена на субъективном отборе? «Мы выбрали 5 важных компонент». А что считать важными?
Дмитрий, мне в очередной раз придётся поинтересоваться у вас, понимаете ли вы, о чём тут вообще идёт речь; «significant» вы переводите как «важный», что наводит на определённые мысли о степени вашего знакомства со основами статистического анализа.
Комментарий отредактирован 2015-03-31 13:14:23 пользователем oleg_krapilsky
Для начала, смущает, что я не настолько хорошо знаю английский, чтобы понять точное значение технических терминов, тем более, что в конкретной сфере они могут иметь специфические нюансы.

Что такое PCA? На суть мало влияет, но интересно.

...and find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
Что за 5 компонентов, по которым группировали?

Finally, run a clustering algorithm(e.g. K-Means) on the principal components, pick the optimal number of clusters to settle with, look at the underlying variables aggregated by the cluster IDs, and come up with fancy names for them.
Это вообще плохо понял. Что за главные компоненты, кластеры (группы?), переменные? И ответ на сам вопрос, по каким именно признакам формировали группы и какие признаки показали в итоге на диаграмме, остался за границами текста…
Комментарий отредактирован 2015-03-31 23:48:29 пользователем Agrikk
Что такое PCA? На суть мало влияет, но интересно.

Principal component analysis, он же метод главных компонент (МГК).

Что за 5 компонентов, по которым группировали?

Значимые главные компоненты, выделенные в результате применения МГК к множеству переменных, описывающих поведение игроков.

Что за главные компоненты, кластеры (группы?), переменные?

Про главные компоненты — см. выше, про кластеры — см. описание алгоритма k-средних; хорошей иллюстрацией того, что может включать в себя набор переменных, служат страницы с персональной статистикой пилотов.

И ответ на сам вопрос, по каким именно признакам формировали группы и какие признаки показали в итоге на диаграмме, остался за границами текста...

Так задайте этот вопрос непосредственно автору презентации — думаю, он вам на него охотно ответит.
Так задайте этот вопрос непосредственно автору презентации — думаю, он вам на него охотно ответит.
Для чего мне будет нужно завести аккаунт на Твиттере и вспомнить навыки еще и письма по-английски…
Спасибо, я лучше остановлюсь на нечетком мнении, которое удалось сформировать.
Жалко нельзя посмотреть суммарные показатели всех своих альтов, так была бы более полноценная картина.
Знаете в чём подвох? Они взяли пул непрерывных данных, разделили на части по условным критериям, наклеив на каждую лейбл, а потом начали разбирать свойства каждой из групп, по которым эти же группы и разделяли. Есть в американской политологии такой интересный термин — джерримендеринг. Вижу сходные черты.
  • hitzu
  • 0
  • v
Тебе известна методология их дата майнинга?
Метод получения данных здесь не при чём. Важна методология их обработки.
Отсюда (навигация — стрелочками на клавиатуре):

Комментарий отредактирован 2015-03-25 21:35:35 пользователем oleg_krapilsky
А в чем подвох? Их же разделили на эти группы не для голосования.:) Обычная статистика. Такая тренерами баскетбольными иногда используется для разбивки совсем молодых игроков по позициям, где их будут окончательно нарабатывать. Думаю, в футболе и в хоккее тоже есть такая практика. Только тут добавили несколько несущественных пунктов, как мне кажется, чисто для интересу. А почему нет?:)
если вы играли в EVE, вы к какой группе сами себя относите?
Ну выходит, что «агрессор». Хоть я и испробовал большинство других видов деятельности и механик, а некоторыми из них и продолжаю заниматься, но pvp все равно всегда преобладало.
ну тогда уж профи
Да уж нет, я просто хорошо знаю несколько «профессионалов» и вижу разницу. Там где я лишь чуть пробую геймплей они изучают механику досконально, оптимизируют, разрабатывают алгоритм и выдаивают ее досуха.
Когда я хочу попробовать производство, я, условно, строю из найденного бпц цинобал, когда он хочет заняться производством — он запускает 25 посов с алхимической цепочкой и производством джампфрейтеров. Когда я хочу посмотреть на вх — я беру ковроклочный т3, когда он хочет посмотреть на вх, он находит c5, спиливает посик местных, ставит свой, завозит туда капиталы, придумывает оптимальный формат для хоумдефа и завозит его… ну и через пару недель съезжает, «насмотревшись». И так во всем.
… а сегодня всё тот же CCP Quant, отвечающий в CCP за сбор и анализ данных о поведении игроков, опубликовал в сабреддите r/eve две интереснейшие диаграммы:




Да-да, 65% подписчиков играет всего за одного персонажа.
Спасибо!
Жаль нету распределения хайсек-лоусек-нули
Надо было в отдельную заметку вынести.

Оставить комментарий