Найди себя на картинке

EVE Online: Найди себя на картинке
Вы могли пропустить интересную инфографику, которую показала компания CCP на последнем фанфесте. При помощи датамайнинга разработчики проанализировали разные типы игровой активности в EVE Online и внимание к ним со стороны игроков. После этого вся аудитория космической вселенной была разделена на пять групп: Профессионалы, Предприниматели, Агрессоры, Тусовщики и Традиционщики. Отдельное спасибо oleg_krapilsky за прекрасный перевод и оформление инфографики на русском.

Из приведенной картинки можно сделать множество интересных выводов, но пока давайте пройдем по тому, что подразумевается под каждой из групп.

EVE Online: Найди себя на картинке
«Профессионалы» — это те, кто использует все доступные в игре механики, грубо говоря, подстраиваясь под требования игры. Из неожиданных открытий – они больше всех выступают в роли «лекаря» (здесь это называется «ремонт кораблей»), хотя я ожидал увидеть в чемпионах этого пункта «Тусовщиков». Из ожидаемого – у них самые длительные игровые сессии. И они самые социально интегрированные – количество связей с другими игроками, активность в чате и полеты в составе флотов зашкаливают.

А вот то, что группа «Предприниматели» почти не отстает от «Профессионалов» по времени, проведенному в игре, приятное открытие. Оно подтверждает статистикой, в принципе, известный факт – в EVE Online достаточно много мирной деятельности. Параметр «Количество уничтоженных кораблей» у этой категории игроков – яркое тому свидетельство. Количество связей с другими игроками – на предпоследнем месте.

«Агрессоры» — название этой категории говорит само за себя. Но вот игровые сессии у этих ребят короче, чем у предыдущих двух групп, количество мирной деятельности стремиться к нулю. Зато связей с другими игроками больше, чем у «предпринимателей», при одинаковой активности в чате.

«Тусовщики», несмотря на название, проводят в игре довольно мало времени, отсюда отставание по всем видам игровой активности. Даже по социальным связям они на третьем месте после «Профессионалов» и «Агрессоров». В саму категорию «туссовщиков» они попали благодаря пропорции при распределении всех видов игровой активности: параметр «активность в чате» у них способен затмить все остальные вместе взятые.

Наконец, «Традиционщики» — их поведение соответствует стандартному набору шаблонов в традиционной MMO – выполнение миссий, много путешествий по секторам с высоким уровнем безопасности, много торговли. Все остальное – значительно меньше, чем у других категорий. Думаю, что и игру такие люди покидают куда чаще.

К слову, вот и статистика по текущему соотношению этих групп в игре:

EVE Online: Найди себя на картинке
Как видим – шок, сенсация – меньше всего в EVE Online «агрессоров». Циник внутри меня подсказывает, что, может, это потому, что «профессионалы» по модели поведения не слишком далеко ушли от «агрессоров», но романтик замечает, что в сумме остальные три категории все равно представляют больше половины всей аудитории EVE Online. Мне кажется, что эту статистику мы будем использовать в наших дискуссиях еще не раз.

EVE Online: Найди себя на картинке
Отдельного упоминания заслуживает статистика закономерности использования альтов при сравнении с возрастом альянса. NC, пандемики и разоры отличились зашкаливающим количеством альтов, уделав даже такие рентерские образования, как NA. А вот CVA в очередной раз порадовали уверенным расположением в верхней части картинки (возраст), но при этом в первой ее трети (количество альтов).

Еще раз хочу сказать огромное спасибо Олегу, как за предоставленные материалы, так и за трансляции непосредственно с места событй.

Ах, да, у меня вопрос: если вы играли в EVE, вы к какой группе сами себя относите? Я вот отчетливо «Предприниматель».
Читайте также

54 комментария

avatar
Неожиданно, скорее предприниматель. Спасибо за разъяснения. Никак не мог сесть и разобраться в этих инфографиках, а тут все сразу понятно стало.
  • KaDoy
  • 0
  • v
avatar
Почему неожиданно? При таком количестве возможностей для мирной деятельности-то. Если вы любите заниматься добычей/производством — можно зависнуть просто от количества возможностей. Это я вам как раз как большой ценитель этого дела говорю.
avatar
Ну, я не торгую. Не люблю. Поэтому неожиданно.:)
avatar
Торговля это очень мааааленькая часть :) Количество сертификатов в разделе «наука» кажется наибольшее из всех разделов. Что как-бы намекает :)
avatar
oleg_krapilsky уже линковал в своей трансляции эти ссылки. Но я повторюсь.
http://spreadsheetsin.space/year-in-review/
http://youreveyear.appspot.com/
http://pozniak.pl/yearly-stats/
По этим ссылкам можно в визуальном виде посмотреть статистику по своему персонажу в EvE Online.
avatar
Определенно больше всего возможностей, а также потребностей в нулях. Так что большинство профессионалов это наверняка агрессоры, которые умеют зарабатывать кредиты. Поэтому у них больше активности по агентам, научным исследованиям, торговле и даже добыче руды.

Ева силшком сурова, чтобы лекарями в ней были тусовщики. К тому же в большинсте PVE активносей не нужны лекари. А тусовщики это именно те, кто много общается в чате, на форуме или в голосовике. При этом они совсем не обязательно летают во флотах. Опять же большинство PVE активностей не требуют группы (флота).
avatar
Нет.

В нулях есть уникальные возможности (очень немного, на самом деле), но вот насчет потребностей — вы заблуждаетесь, и насчёт зарабатывания кредитов — тоже не всё так однозначно. В вормхолах и на 5-ых агентах зарабатывают не меньше. И то и другое — не нули.
avatar
Ах, да, у меня вопрос: если вы играли в EVE, вы к какой группе сами себя относите?
Традиционщик из палаты мер и весов)))
avatar
Профессионал с ПвЕ активностью как у Агрессора, ну или Агрессор с показателем ремонта как у Профессионала(как сел года 2,5 назад на логи так и сижу на нём).
avatar
Традиционшик, хотя я не играю сейчас
  • MriN
  • 0
  • v
avatar
После этого вся аудитория космической вселенной была разделена на пять групп: Профессионалы, Предприниматели, Агрессоры, Тусовщики и Традиционщики.
Из заметки так и не понял, что именно является критериями занесения игрока в определенную группу.
avatar
Анализ реальных типов активности в рамках действий конкретного персонажа и соотношение времени, потраченного на них.
avatar
Анализ реальных типов активности
То есть некоторая хитрая формула. И потом из этих же групп выделяли склонности к тем же активностям, по которым и делили?
avatar
Насколько я понимаю, нашли закономерности и разделили на группы.
avatar
нашли закономерности и разделили на группы
В которых потом и нашли закономерности, по которым разделяли? Да, утрирую, но явно чего-то не понимаю.
avatar
Во во. :)
avatar
Вот алгоритм:

Make a long list of potential variables by brainstorming, e.g. how active are they in shooting other player's internet spaceships, how much they mine or produce, how much do they socialize(chat, eve-mail), how much they travel, the number of jumps they make, how often they log in and for how long their game sessions last
Individually analyze, and transform each of those variables, i.e. look at their distribution, some can be e.g. log transformed or factorized into ranges, e.g. [0,1], [0,0.333,0.666,1], etc. In the end, all variables are normalized into [0..1]
example: if the number of days a player did any mining in January is 5, then the mining variable becomes 5 / 31 = 0.1613
Select the most important variables in an iterative process of PCA, segmentation and discussion with in-house experts.
Use PCA to perform dimensional reduction, and find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
Finally, run a clustering algorithm(e.g. K-Means) on the principal components, pick the optimal number of clusters to settle with, look at the underlying variables aggregated by the cluster IDs, and come up with fancy names for them.

Какой из этапов в нем смущает? :)
avatar
Select the most important variables in an… process of… discussion with in-house experts.
Этот.
find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
И этот.

Ну и конечно сложно доверять таким выводам без сопутствующего подтверждения другими методиками. Хотя, если на безрыбье никаких других исследований нет, то приходится довольствоваться и этим.
Комментарий отредактирован 2015-03-31 11:14:06 пользователем hitzu
avatar
Select the most important variables in an… process of… discussion with in-house experts.

Какие важные игровые активности не вошли в статистику? Ведь она вся представлена в таблице.

find the optimal number of components to use in the clustering. We ended with using the first 5 significant components

А в этом случае что упущено, на твой взгляд?
avatar
А разве ты не видишь, что методология построена на субъективном отборе?

«Мы выбрали 5 важных компонент»
А что считать важными? И почему пять, а не шесть или три? И чем руководствовались эксперты, когда отбирали главные переменные в «итеративном процессе PCA»? То есть что послужило отправной точкой для выбора степени аппроксимации?
avatar
Слушай, ну, у нас же есть результат. Он перед глазами. Ты можешь сказать «ха, ну, вот видите, они не включили в статистику такую-то активность». А так получается какая-то абстракция. В логах намного больше данных, чем приведено. Например, из какого оружия стреляли, на какой дистанции, какую руду копали и так далее. Так что отделять важное от неважного пришлось бы однозначно. Что и было сделано. У меня претензий к вычленению важных активностей нет, но если у кого-то есть, если есть замечание — вот конкретно такая активность не попала, а она важна — тогда давайте говорить.
avatar
У нас есть такой результат: Есть группа людей, которая любит стрелять, мы назвали их Агрессорами. И наше исследование подтвердило, что Аргессоры любят стрелять. Круто, да?
avatar
Ну, я вижу статистику совершенно иначе. Если посмотреть на картинку, то Агрессоры и Профессионалы «любят стрелять» абсолютно одинаково.
Комментарий отредактирован 2015-03-31 11:59:53 пользователем Atron
avatar
У нас есть такой результат: Есть группа людей, которая любит стрелять, мы назвали их Агрессорами. И наше исследование подтвердило, что Аргессоры любят стрелять.

Нет, Дмитрий, в описании процесса написано совсем другое:

Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров, смотрим на то, какие именно из исходных переменных оказались собраны в каждом из кластеров, и придумываем для кластеров громкие названия.

Разделение на группы и придумывание названий для этих групп происходит на самом последнем этапе — никто, как вы можете видеть, и не думает вести анализ данных, исходя из заранее сложившихся представлений о классификации игроков.
avatar
Для этого алгоритма надо знать (или придумать) заранее число кластеров. С тем же успехом они могли поделить множество на более многочисленные мелкие кластеры, но тогда, видимо, громких названий придумать бы не получилось.
avatar
С тем же успехом они могли поделить множество на более многочисленные мелкие кластеры

Вы ведь в курсе, что значение k берётся не с потолка, да?
avatar
Ага. Какой вариант лучше сочетается с ожидаемым результатом, тот и выбираем. Знаем, проходили.
avatar
С вас — цитата, убедительно доказывающая факт существования «ожидаемого результата» где-либо, кроме вашей собственной головы; ни в одной из опубликованных презентаций, статей и видеозаписей выступлений не упоминается о том, что к этому исследованию аналитики CCP подходили, уже имея на руках готовую классификацию игроков по стилям игры.

Или я снова не дождусь от вас ничего, кроме вашего традиционного «ничего я вам доказывать не собираюсь»?
avatar
А зачем мне доказывать ваши выдумки?
avatar
Т. е. от своих слов вы отказываетесь?
avatar
Это была другая ветка — раз. Это было до того, как была озвучена методология — два. Ещё наезды будут?
avatar
А вот комментарий из этой ветки, оставленный уже после того, как здесь был описан метод проведения исследования:



Судя по всему (и по комментарию, и по плюсику) мысль о предвзятости исследователей по-прежнему встречает у вас живейшее одобрение.

Ещё наезды будут?

Когда вам указывают на, э-э-э, несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»?
avatar
Судя по всему
Судя по всему это лишь ваши догадки за уши подтянутые под ваши обвинения, милейший.

Когда вам указывают на, э-э-э, несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»?
Когда я высказываю свои предположения, то это действительно не более, чем предположения. Но вам же надо педантично втоптать в грязь собеседника, на меньшее вы не согласны. На нормальный человеческий диалог ради которого я когда-то зарегистрировался на ММОзге я с вами уже давно больше не рассчитываю, зря только ввязываюсь.
avatar
Судя по всему это лишь ваши догадки за уши подтянутые под ваши обвинения, милейший.

Да-да-да. А то, что здесь, здесь и здесь вы продолжаете настаивать на предвзятости исследователей — это, разумеется, иллюзия.

Когда я высказываю свои предположения, то это действительно не более, чем предположения.

Вот чего в этой теме ещё не было — так это ваших предположений по поводу того, что и почему в данный раз «скрывают власти». Сможете объяснить, зачем CCP нужно заниматься искажением результатов?

Но вам же надо педантично втоптать в грязь собеседника, на меньшее вы не согласны.

Я повторю свой вопрос: когда вам указывают на несостоятельность и надуманность ваших утверждений — это, по-вашему, «наезд»? «Втаптывание в грязь»?

На нормальный человеческий диалог ради которого я когда-то зарегистрировался на ММОзге я с вами уже давно больше не рассчитываю, зря только ввязываюсь.

«Нормальный человеческий диалог» редко когда начинается с туманных обвинений, ёрничества и нежелания признавать собственные ошибки.
avatar
Whatever, вы победили. Можете взять с полки пряник.
avatar
Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров,
Это уже кое-что объясняет.

Вы ведь в курсе, что значение k берётся не с потолка, да?
Тем не менее, из текстов я понял, что однозначного метода выбора наилучшего k нет:
You can maximize the … Another approach is to start with … Finally, you can …
As always in data analysis, there is no one true approach that works better than all others in all cases. In the end, you have to use your own best judgement.
И вообще, en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set
avatar
Тем не менее, из текстов я понял, что однозначного метода выбора наилучшего k нет

Однозначного метода нет, однако я бы не сказал, что расхождения между результатами чудовищно велики.
avatar
я бы не сказал, что расхождения между результатами чудовищно велики
А я не могу быть уверен, что в данном случае статистики EVE все годные методы дали бы именно 5 категорий. А ведь 4 или 6 могли бы нарисовать… не знаю как сказать… иначе воспринимаемую картину. Хоть и не чудовищно.
avatar
Исправил перевод:

Наконец, применяем к главным компонентам алгоритм кластеризации (например, алгоритм k-средних), вычисляем оптимальное число выявляемых кластеров, смотрим на то, как именно исходные переменные меняются от кластера к кластеру, и придумываем для кластеров громкие названия.
avatar
А разве ты не видишь, что методология построена на субъективном отборе? «Мы выбрали 5 важных компонент». А что считать важными?
Дмитрий, мне в очередной раз придётся поинтересоваться у вас, понимаете ли вы, о чём тут вообще идёт речь; «significant» вы переводите как «важный», что наводит на определённые мысли о степени вашего знакомства со основами статистического анализа.
Комментарий отредактирован 2015-03-31 13:14:23 пользователем oleg_krapilsky
avatar
Для начала, смущает, что я не настолько хорошо знаю английский, чтобы понять точное значение технических терминов, тем более, что в конкретной сфере они могут иметь специфические нюансы.

Что такое PCA? На суть мало влияет, но интересно.

...and find the optimal number of components to use in the clustering. We ended with using the first 5 significant components
Что за 5 компонентов, по которым группировали?

Finally, run a clustering algorithm(e.g. K-Means) on the principal components, pick the optimal number of clusters to settle with, look at the underlying variables aggregated by the cluster IDs, and come up with fancy names for them.
Это вообще плохо понял. Что за главные компоненты, кластеры (группы?), переменные? И ответ на сам вопрос, по каким именно признакам формировали группы и какие признаки показали в итоге на диаграмме, остался за границами текста…
Комментарий отредактирован 2015-03-31 23:48:29 пользователем Agrikk
avatar
Что такое PCA? На суть мало влияет, но интересно.

Principal component analysis, он же метод главных компонент (МГК).

Что за 5 компонентов, по которым группировали?

Значимые главные компоненты, выделенные в результате применения МГК к множеству переменных, описывающих поведение игроков.

Что за главные компоненты, кластеры (группы?), переменные?

Про главные компоненты — см. выше, про кластеры — см. описание алгоритма k-средних; хорошей иллюстрацией того, что может включать в себя набор переменных, служат страницы с персональной статистикой пилотов.

И ответ на сам вопрос, по каким именно признакам формировали группы и какие признаки показали в итоге на диаграмме, остался за границами текста...

Так задайте этот вопрос непосредственно автору презентации — думаю, он вам на него охотно ответит.
avatar
Так задайте этот вопрос непосредственно автору презентации — думаю, он вам на него охотно ответит.
Для чего мне будет нужно завести аккаунт на Твиттере и вспомнить навыки еще и письма по-английски…
Спасибо, я лучше остановлюсь на нечетком мнении, которое удалось сформировать.
avatar
Жалко нельзя посмотреть суммарные показатели всех своих альтов, так была бы более полноценная картина.
avatar
Знаете в чём подвох? Они взяли пул непрерывных данных, разделили на части по условным критериям, наклеив на каждую лейбл, а потом начали разбирать свойства каждой из групп, по которым эти же группы и разделяли. Есть в американской политологии такой интересный термин — джерримендеринг. Вижу сходные черты.
  • hitzu
  • 0
  • v
avatar
Тебе известна методология их дата майнинга?
avatar
Метод получения данных здесь не при чём. Важна методология их обработки.
avatar
Отсюда (навигация — стрелочками на клавиатуре):

Комментарий отредактирован 2015-03-25 21:35:35 пользователем oleg_krapilsky
avatar
А в чем подвох? Их же разделили на эти группы не для голосования.:) Обычная статистика. Такая тренерами баскетбольными иногда используется для разбивки совсем молодых игроков по позициям, где их будут окончательно нарабатывать. Думаю, в футболе и в хоккее тоже есть такая практика. Только тут добавили несколько несущественных пунктов, как мне кажется, чисто для интересу. А почему нет?:)
avatar
если вы играли в EVE, вы к какой группе сами себя относите?
Ну выходит, что «агрессор». Хоть я и испробовал большинство других видов деятельности и механик, а некоторыми из них и продолжаю заниматься, но pvp все равно всегда преобладало.
avatar
ну тогда уж профи
avatar
Да уж нет, я просто хорошо знаю несколько «профессионалов» и вижу разницу. Там где я лишь чуть пробую геймплей они изучают механику досконально, оптимизируют, разрабатывают алгоритм и выдаивают ее досуха.
Когда я хочу попробовать производство, я, условно, строю из найденного бпц цинобал, когда он хочет заняться производством — он запускает 25 посов с алхимической цепочкой и производством джампфрейтеров. Когда я хочу посмотреть на вх — я беру ковроклочный т3, когда он хочет посмотреть на вх, он находит c5, спиливает посик местных, ставит свой, завозит туда капиталы, придумывает оптимальный формат для хоумдефа и завозит его… ну и через пару недель съезжает, «насмотревшись». И так во всем.
avatar
… а сегодня всё тот же CCP Quant, отвечающий в CCP за сбор и анализ данных о поведении игроков, опубликовал в сабреддите r/eve две интереснейшие диаграммы:




Да-да, 65% подписчиков играет всего за одного персонажа.
avatar
Спасибо!
Жаль нету распределения хайсек-лоусек-нули
Надо было в отдельную заметку вынести.

Оставить комментарий