Средний возраст пользователей вконтакте – Узнать возраст пользователя VK или о чём ещё может рассказать социальный граф / Habr

Содержание

Узнать возраст пользователя VK или о чём ещё может рассказать социальный граф / Habr

«Скажи мне кто твой друг и я скажу, кто ты.»
Еврипид 480—406 до н. э.

Долгое время я смотрел на API VK как кот на стиральную машину — меня гипнотизировала возможность провести какое-нибудь исследование в одной из крупнейших социальных сетей, которая проникла во многие сферы нашей жизни. И вот однажды родился вопрос, а можно ли по кругу общения пользователя социальной сети определить его возраст?


Для желающих узнать скрытый возраст и раньше был небольшой хак. Надо лишь воспользоваться поиском по людям, указать узкие параметры, чтобы искомый профиль попадал в выдачу, а затем бинарным поиском определить возрастной диапазон. Или окажется, что в контактной информации вдруг указан год окончания школы. И никаких скриптов писать не надо. Но скрытый возраст и косвенная информация могут быть искажены, а главное статья всё-таки не о том, как добыть побольше персональной информации. В статье предлагается проанализировать один из аспектов социального графа.

Одно из первых, что приходит на ум при рассмотрении связей профиля: давайте посмотрим возраст одноклассников и одногруппников, в подавляющем большинстве у данного пользователя будет возраст +- 1 год. За это спасибо всеобщему среднему образованию. Есть только один нюанс: выявить одноклассников. Чем больше проходит времени с выпускного, тем в более разношёрстных по возрасту кругах мы начинаем вращаться. Школьные друзья словно оказываются в прошлой жизни, и вот их уже почти незаметно среди большого количества новых знакомых. Можно ли для профилей людей зрелого возраста как-то понять в какой поток они учились и, следовательно, примерный возраст?

Итак, давайте рассмотрим задачу определения возраста пользователя как определение подмножества одноклассников и одногруппников. То есть мы взяли за допущение, что у него в друзьях есть некоторое количество одноклассников, возраст которых примерно соответствует возрасту профиля. Конечно же бывают исключения, но они редки. Человек ходит в школу от звонка до звонка 10 лет, за такой срок успевают установиться множество перекрёстных социальных связей. Короче говоря, все друг друга знают, при этом разброс возраста в этом социальном клубке минимален. В дальнейшем, когда человек вливается в другие коллективы, как правило, разброс возраста в них значителен, будь это работа, спортивная активность или клуб по интересам. Попробуем, опираясь на такое различие, выявить нужные социальные группы.

Давайте для наглядности рассмотрим один из профилей ВК с большим количеством друзей. Получим список друзей пользователя с помощью запроса friends.get. Рассмотрим профили только с указанным возрастом и расположим их на временной шкале в виде гистограммы по годам. Есть небольшой нюанс с тем как разбивать множество друзей на годовые интервалы. Мы ведь хотим добиться, чтобы одноклассники вошли в один интервал, а не размазались по двум соседним. Опытным путём было установлено, что разбивать год лучше всего осенью, причём чтобы пользователи с датами рождения в жёлтое время года вошли сразу в два смежных интервала. То есть получаются 15 месячные интервалы с сентября по ноябрь с шагом 12 месяцев.


oX — возраст пользователей, оY — количество пользователей, попавших в заданный интервал.

Мы наблюдаем пятилетнее плато с максимальным годовым количеством друзей. Совсем не очевидно найти группу одногодок среди этого 5 летнего отрезка. По правде говоря, такая картина нетипична. Чаще год рождения одноклассников/одногруппников значительно выделяется среди других по большему количеству друзей. Но давайте в сложном случае для каждого пользователя найдём отношение дружеских связей внутри годовой группы к количеству связей с другими друзьями изначального пользователя, для кого мы определяем возраст; далее усредним этот показатель по каждому году. Назовём это нормированный коэффициент связности.

oX — возраст пользователей, оY — нормированный коэффициент связности для заданного интервала.

Картина изменилась, и в лидерах имеется единственный год. В нём большую долю имеет коллектив с однородным возрастом, следовательно имеем право ожидать, что раз пользователь является его частью, то имеет схожий возраст. А что, если человек в этом коллективе играет какую-то особенную роль, например, не одноклассник, а учитель? И вправду, для случая учителей/тренеров, могут существовать подгруппы с большой плотностью связей в узком возрастном промежутке. Частично такой случай удается обработать, если при выбирать группу не с самой высокой связностью, а с самым большим возрастом среди групп с достаточно большой связностью. Иными словами использовать логику, что человек на своем жизненном пути сначала должен побывать рядовым учеником, а уж потом играть выделенную роль в “коллективах с однородным возрастом”.

Более подробное описание и немного формулВыразим численно обнаруженное на графике явление. Обозначим за F0 — множество друзей пользователя, для которого вычисляется возраст.
Fi
— множество друзей произвольного профиля. Fi,y — множество друзей профиля, имеющих указанную дату рождения в годовом интервале y. Тогда Сi,y — связность профиля i в интервале у:


Сy — ненормированный коэффициент связности в интервале у по всем профилям:


И наконец искомый год рождения:

Ещё была идея рассматривать к какому типу относится та или иная связь. Если тип связи школьные или университетские друзья, то учитывать их с повышенным весом. А если тип коллеги, родственники и всё остальное, то не учитывать такие связи вообще. Однако, если использовать запросы, загружающие такую информацию, то время ожидания увеличивается раз в 5. К тому же, указывать тип связи — не популярная практика, поэтому было принято решение запрашивать такую информацию только для профилей с малым количеством друзей.


Из вышеобозначенного алгоритма вытекают естественные границы применимости подхода к определению возраста. Если пользователь не страдает ностальгией по школьным годам, и у него в друзьях отсутствуют его одноклассники/одногруппники, то надо использовать другой метод.

Как насчёт попробовать это безобразие в деле? Был реализован шуточный сервис в ВК группе «Гадалка возраста». Там дружелюбный бот погадает на возраст, если скинуть ему ссылку на незакрытый профиль ВК, используя вышеупомянутый алгоритм.

Как устроен сервис

Первым звеном в работе гадалки является механизм сообщений группы ВК. В настройках группы подключается callback API на собственный сервер. В качестве отправляемых типов событий надо выбрать “Входящее сообщение”. Таким способом сообщение группы превращается в запрос на нашем сервере. Если вы также как и я не дружите с фронтендом, то это супер вариант. Далее с сервера происходит обращение к VK API с запросами users.get для рассматриваемого профиля и friends.get для друзей профиля с известной датой рождения. Для их осуществления требуется access token приложения ВК. Я не использовал запросов, требующих подтверждения прав от пользователя, чтобы не грузить людей запросами на разрешение доступа. После того как произведён расчёт предполагаемого возраста, формируется ответ на запрос из группы, и пользователь гадалки видит ответ в диалогах. Дёшево и сердито.


Что касается улучшения самого алгоритма, ничего не мешает пойти ещё дальше, собрать обучающий датасет из профилей с указанным возрастом и натренировать регрессионную модель на основе, скажем, матрицы смежности возрастного графа среди друзей профиля. Уверен, при достаточно большой выборке результаты окажутся точнее эвристик. Как уже упомянул выше, мне было любопытно проверить принципиальную идею, поэтому развивать это направление не планирую.

В заключении хочется затронуть аспект этичности. На мой взгляд “Гадалка возраста” находится на границе частной жизни, но всё-таки не переступает её, потому что использует для анализа открытые данные. Собственно поэтому для пользователей со скрытым профилем сервис работать не будет.

Есть ощущение, что всякие «гадалки возраста», поисковики лайков, SearchFace – это лишь первые ласточки социально-прозрачного мира. В некоторой степени это можно назвать возвращением к истокам. Человек долгое время существовал в небольших социумах, где все друг у друга были на виду. Открытая репутация являлась неотъемлемой частью механизма социального регулирования. Да, новые инструменты постепенно позволят вновь сделать социальные взаимодействия человека как на ладони, только теперь уже на глобальном уровне. Да, как и любой инструмент, это можно использовать во вред. Нужно ли делать их доступными для каждого? Не знаю. Но я уверен, что если такие инструменты будут доступны лишь ограниченному кругу лиц, то баланс в сторону конструктивного использования точно не сместится.

«ВКонтакте» рассказала о росте активности аудитории за 2019 год

Фото: Беликов Валентин

За 2019 год среднее время, проводимое пользователями «ВКонтакте» в соцсети, выросло на 16%, говорится в сообщении компании, в котором подводятся итоги года.

«ВКонтакте» объявила даты шестого VK Fest Общество

«ВКонтакте» объявила даты шестого VK Fest

«Согласно данным Mediascope, за год среднее время, проводимое пользователями в VK, выросло на 16%. Число активных сообществ за год выросло на 26%. В частности, на 37% — игровых, на 32% — развлекательных, на 31% — музыкальных, на 24% — спортивных, на 21% — образовательных, на 19% — бизнес-сообществ», — говорится в сообщении.

На 11% выросло среднесуточное количество просмотров ленты новостей, на 45% стало больше опубликованных историй в месяц. Также на 47% стало больше прямых трансляций в сутки, на 44% — просмотров видео в сутки, на 34% — загруженных видео.

На 10% увеличилось количество лайков под записями пользователей и сообществ.

«ВКонтакте» продолжает быть самой популярной коммуникационной платформой в России. На 15% выросло количество сообщений за сутки, на 27% — месячное число аудио- и видеозвонков», — отмечается в сообщении.

Также в соцсети сообщили, что за 2019 год «ВКонтакте» представила более 200 крупных обновлений.

«Уже сейчас мы связываем людей и бизнес внутри крупнейшей экосистемы страны. Мы не хотим останавливаться — и ставим цель на следующий год быть главным приложением для интернет-пользователей в России и СНГ, закрывая все потребности в общении, развлечениях, самореализации и решении повседневных задач», — отметил генеральный директор «ВКонтакте» Андрей Рогозов.

Выделите фрагмент с текстом ошибки и нажмите Ctrl+Enter

Маркетинговое исследование аудитории Вконтакте 2015

Как показало маркетинговое исследование пользователей рунета в возрасте от 12 до 64 лет, наиболее популярной социальной сетью у россиян является ВКонтакте. Аккаунты имеют почти 80% пользователей. Популярность VK обеспечивает широкое разнообразие контента, интерфейс, интуитивно понятный как подросткам так и более взрослой аудитории, большой выбор игр и других приложений, а также удобная мобильная версия. Благодаря возможности создания групп и сообществ, фильтрации ЦА по множеству параметров эта площадка очень эффективна для продвижения и PR.

Второй по популярности у россиян ресурс – видеохостинг YouTube. Благодаря широкому распространению мобильных устройств каждый теперь может зафиксировать любое событие на видео и быстро поделиться интересной информацией. Популярность YouTube связана также с тем, что видео вызывает гораздо больше доверия и легче воспринимается, чем текст. К тому же ролики из соцсети легко встраиваются в другие сайты, демонстрируются на любых устройствах. Информация в звуковом и видеоформатах всегда получает более мощный эмоциональный отклик массовой аудитории, чем самый шедевральный текст. Поэтому более половины пользователей после просмотра рекламного ролика на YouTube продолжают коммуникацию с брендом. С точки зрения рекламы и продвижения, качество трафика в YouTube значительно выше, чем в ВКонтакте. Инструменты YouTube Analytics предоставляют максимально подробную информацию о ЦА, позволяя достичь полного охвата потенциальных потребителей.

Живой Журнал занимает последнюю строку рейтинга, но ценен он не количеством, а качеством аудитории. Большинство пользователей – зрелые люди с определенными интересами, способные воспринимать и анализировать информацию. Здесь давно сформировались лидеры мнений, тренд-сеттеры с тысячами подписчиков, которые им всецело доверяют.

исследованиеисследование

Пользователям соцсетей не свойственна пассивность. Наиболее частое действие – поделиться контентом. В каждой возрастной категории более половины участников исследования создают оригинальный контент, комментируют и пишут рецензии, реагируя на чужой контент.

Таким образом, главный акцент при продвижении в социальных сетях должен быть сделан на контенте. На смену прямой рекламе и директ-маркетингу приходит сторителлинг – короткие, но интригующие истории, где бренд является главным героем или источником сюжета.

Уровень вовлеченности в социальные сети уменьшается с возрастом пользователей. Более половины опрошенных старше 45 лет проводят в соцсетях до одного часа. Они наиболее устойчивы к искушению провести день, обмениваясь сообщениями, лайкая и меняя статусы. Естественным образом, сказывается и занятость этих пользователей.

Значительно выше вовлеченность в соцсети у россиян в возрасте от 35 до 45 лет. Многие используют эти площадки для работы, для продвижения и поиска клиентов, для неформальной коммуникации с потребителями и коллегами. Как и молодежь 25-34 лет, они склонны проводить в сети не более 4 часов и преимущественно в рабочие часы.

исследованиеисследование

«Чемпионы» по продолжительности сеанса – самые молодые пользователи, каждый седьмой респондент 16-54 лет проводит в сети более 6 часов. Однако прямая связь между временем, проведенным в сети, и готовностью потреблять рекламный продукт, отсутствует. Оптимальным контентом при продвижении среди этой аудитории будут короткие видеоролики и игры.

исследованиеисследование

Исследование основных мотивов использования социальных сетей показало, что доминируют потребности в коммуникации. Более половины опрошенных заходят в свой аккаунт, чтобы следить за жизнью друзей и поддерживать существующие контакты. Поэтому при продвижении в соцсетях очень эффективен вирусный контент, которым пользователи активно делятся в своем кругу общения. Тематика контента всецело может зависеть от интересов конкретной группы. Вконтакте популярен своими группами и пабликами, которые можно использовать при таргетинге.

Примерно четверть обитателей соцсетей используют их для работы, и значительный эффект в узконаправленной стратегии продвижения дают публикации на профессиональные темы, аналитические материалы, инфографика и т.п. оригинальный контент от бренда.

исследованиеисследование

Контент очень важен для пользователей Вконтакте, которые избалованы вниманием пабликов, которые проводят частые бомбардировки (до 15-20 раз в сутки) все более интересным контентом, отлично оформленным, но часто повторяющимся. В перечне интересов самая значительная доля принадлежит материалам визуального характера. Больше впечатляющих картинок, оригинальных демотиваторов, цепляющих видеороликов – вот что жаждет получить потребитель в соцсетях. Для развития двусторонней коммуникации, для качественного фидбека стоит также больше внимания уделять пользовательскому контенту. Ведь 42% пользователей делятся своими фото и видео в надежде получить лайки и комменты.

ВКонтакте – безусловный лидер среди социальных сетей как по количеству, так и по качеству пользователей. В особенности молодых, но не стоит забывать и про засилие ботов. Так или иначе, примерно 40% аудитории ВК являются «авторами», т.е. как минимум раз в месяц создают уникальный контент – пишут оригинальные тексты, комментируют чужие тексты, оставляют рецензии на различный контент, представленный в сети. Поэтому стратегия продвижения должна обязательно быть интерактивной, вовлекающей пользователей в диалог.

исследованиеисследование

Данные посещаемости в разное время суток позволяют рассчитать оптимальное время для публикации контента. Наиболее активна аудитория ВКонтакте днем, в рабочие часы. Если утро, до полудня, большинство людей все-таки посвящает работе, то справившись с основной нагрузкой большинство «награждает» себя общением в ВКонтакте. Также многие используют сеть с рабочими целями, для продвижения продукта или бренда, для общения с партнерами и коллегами, для оперативного решения проблем клиента и других задач клиентского сервиса.

В вечернее время аудитория также достаточно активна. Это время оптимально для развлекательного трафика. Публикации же в ночные часы могут остаться незамеченными большинством целевой аудитории.

 

Успешное продвижение в социальных медиа требует четко представлять портрет своей целевой аудитории, чтобы приходить в ее любимые места обитания будучи вооруженным любимым контентом. Стоит больше внимания уделять аудиовизуальному контенту, инфографике. Наиболее значимые публикации должны выходить в период с 11 до 22 ч, это позволит получить максимум просмотров. Особо важны праздничные и выходные дни, когда люди посвящают сетям больше времени.

Роль социальных сетей в бизнесе.

Привет ВСЕМ!

Сегодня я хочу поговорить с вами о социальных сетях.

Дело в том, что они могут принести вам и вашему сайту просто ОГРОМНУЮ пользу!

Если грамотно использовать их ресурсы, вы сможете:

  • Увеличивать посещаемость своего сайта.
  • Увеличивать количество подписчиков.
  • Соответственно, ваш доход будет расти!

Главное – знать, как их использовать.

Самые крупные социальные сети на этот момент:

  1. Facebook.
  2. Вконтакте.
  3. Одноклассники.
  4. Twitter.
  5. Google +

В интернете бытует один миф, что в социальных сетях в основном общаются только школьники. И даже я когда то так думал.

Каково было мое удивление, когда мне на глаза попалась статистика по возрастам. Основной возраст аудитории оказался — в радиусе от 18 до 54 лет.

Т.е. это самая, что ни на есть платежная аудитория!

И почему я раньше об этом не знал?

Но вместо разговоров, давайте лучше посмотрим на статистику возрастов на примере первых двух социальных сетей. Сразу хочу оговориться, что я беру статистику только по России.

Статистика возрастов пользователей Вконтакте.

Я привел в пример статистику пользователей за июнь 2012 года:

[image(center)=http://master-css.com/uploads/2012/mini/statvk.png Статистика Вконтакте по возрастам (июнь 2012)]http://master-css.com/uploads/2012/statvk.png[/image]

(нажмите для увеличения)

Оказывается, что подростков там очень мало. Менее 11 %.

А остальные – взрослые люди (от 18 до 54 лет), которые в состоянии позволить себе тратить деньги.

Основную долю из них занимает аудитория от 25 до 34 лет — это почти 9 миллионов человек. Или 32 процента.

ПОТРЯСАЮЩЕ! Не правда ли.

Статистика возрастов пользователей в Facebook.

Самое интересное, что здесь наблюдается практически то же самое. Вот статистика за последний месяц.

[image(center)=http://master-css.com/uploads/2012/mini/statfb.png Статистика Facebook по возрастам (июль 2012)]http://master-css.com/uploads/2012/statfb.png[/image]

(нажмите для увеличения)

Та же статистика, только в процентном соотношении:

Как видите, пользователи в возрасте от 13 до 17 лет составляют всего 8%. Еще меньше чем Вконтакте.

А все остальные – платежеспособная аудитория. И опять таки, самая большая доля приходится на возраст от 25 до 34 лет – 36%.

Конечно, аудитория Facebook в России сильно уступает Вконтакте. Но не стоит терять из виду тот факт, что эта аудитория постоянно растет.

Так то.

После просмотра статистики, вывод напрашивается сам собой:

Социальные сети можно и нужно использовать для развития своего бизнеса! Ведь там общается много людей, каждый из которых потенциально – может стать вашим клиентом и принести вам деньги!

Любые из этих сетей вы можете использовать для раскрутки сайта и повышения дохода.

И естественно, что самое большое внимание стоит уделить первым двум. А лучше использовать сразу все 4!

Благо все эти социальные сети сами предлагают ряд инструментов по продвижению. Которые в народе называют — социальными виджетами.

Плохо только то, что не каждый знает – что это за инструменты такие.

Поэтому, специально для вас я попросил одного моего знакомого, в интернете его зовут Юджин, предоставить специальный отчет:

«Как установить социальные виджеты на ваш сайт самостоятельно?«

В этом отчете вы узнаете про сами виджеты, и как их поставить к себе на сайт.

Кстати, Юджин — автор и разработчик того самого социального замка, который вы можете наблюдать ниже.

Загрузка замка…


Как работают виджеты социальных сетей?

Самый интересный момент здесь заключается в том, что на вас будет работать сарафанное радио , или вирусный маркетинг. Это когда люди передают информацию, нужную нам информацию, из рук в руки так сказать.

Все что надо сделать, это попросить человека порекомендовать вашу страничку своему кругу друзей в социальных сетях. А для этого обычно достаточно нажать лишь одну кнопку.

Его друзья видят эту рекомендацию и переходят на вашу страницу и вновь рекомендуют эту страничку, но уже своему кругу друзей.

И так можно продолжать до бесконечности.

Основной упор здесь делается на рекомендацию друга или знакомого.

Согласитесь, что люди доверяют своим друзьям и знакомым и намного чаще следуют их рекомендациям и переходят ссылкам.

А это – очень качественный трафик для вас.

Поэтому совет здесь один:

Обязательно используйте социальные сети для заработка и продвижения своих сайтов!

Аудитория сайта «Одноклассники»

Если Вы хотите успешно продвигать товары и услуги в социальных сетях, то в первую очередь необходимо познакомиться поближе с посетителями интересующей Вас платформы. В этой статье мы выясним, кто составляет целевую аудиторию «Одноклассников», которые уже несколько лет входят в топ-10 популярнейших сайтов России и едва ли нуждаются в представлении.

«Возрастная» социальная сеть — миф или реальность?

Стереотип о «возрастных» «Одноклассниках» можно сравнить с надоедливой песней, которая прицепляется против желания. Как следствие, даже далекие от социальных сетей люди считают, что аудитория сайта «Одноклассники» — это пользователи «постарше». Размытость формулировки «постарше» дает волю интерпретациям: «люди среднего возраста», «те, кому за 40» и даже «пенсионеры». Попробуем разобраться в истинном положении дел.

Наверное, любой стереотип имеет под собой правдивые основания. Справедливо это и по отношению к OK.ru. Если задуматься, кое-какая информация содержится уже в самом названии: найди тех, с кем ты когда-то учился в школе (подразумевается, что школу ты давно закончил, и связи того времени не поддерживаются). На заре существования «Одноклассников» их «возрастной» статус был не мифом, а реальностью, однако это полностью соответствовало изначальной концепции сайта. По данным за 2008 год, большинство пользователей «OK» в тот период составляли люди в возрасте от 25 до 34 лет.

Но нельзя упускать из виду переменчивость, которая свойственна всему Интернету и, в частности, социальным сетям. «Одноклассники» — это не статичное и окаменелое образование, они не стоят на месте, преобразуются, эволюционируют. С момента их запуска прошло почти десятилетие, и статистика 2008 года сегодня кажется, мягко говоря, неактуальной. Специалисты отмечают, что современные «Одноклассники» стремятся расширить свою аудиторию за счет молодежи, не теряя при этом проверенный «зрелый» сегмент.

Эта задумка имеет все шансы обрести успешное воплощение, ведь OK.ru — это развлекательная платформа, где для каждого найдется интересный контент, а также игры, фильмы или музыка по вкусу. Но только время покажет, приведут ли эти усилия к желаемому результату, а пока аудитория «Одноклассников» распределяется следующим образом: большая часть пользователей (35 %) — это люди 25–35 лет, причем женщин и мужчин в этой категории поровну. А вот в других возрастных группах соотношение женщин и мужчин колеблется:

Возраст, лет Соотношение ж / м, %
12–17 10 / 12,6
18–24 14,3 / 18,5
25–35 35 / 35
36–45 19,4 / 18,1
45–55 11,9 / 9,7

По другим данным, «Одноклассники» — это ярко выраженный «женский» сайт (почти 70 % женщин против 30 % мужчин). В связи с этим «женский» и «семейный» контент пользуется здесь постоянной популярностью.

Важно учитывать не только половозрастные характеристики пользователей, но и их географический разброс, интересы и многое-многое другое. К примеру, аудитория сайта «Одноклассники» более «региональна» по сравнению со столичной аудиторией Facebook или «ВКонтакте».

Типичный пользователь «Одноклассников» — какой у него нрав?

Несмотря на множество переменных, вполне можно нарисовать некий усредненный «портрет» посетителя «Одноклассников».

Аудитория «Одноклассников» сконцентрирована преимущественно на внутреннем общении, то есть просмотре профилей и обмене сообщениями. Новостная лента интересует людей значительно меньше. Пользователи не очень придирчивы к качеству фотоконтента и иллюстраций, но вместе с тем любят графику и видео больше, чем тексты. Эту отличительную черту восприятия довольно легко учитывать при адаптации контента под платформу, поэтому ее игнорирование станет грубой ошибкой.

С точки зрения маркетинга, аудитория сайта «Одноклассники» идеальна для продвижения массового сегмента. Вот несколько характерных особенностей: высокая покупательская и пользовательская активность, низкий средний чек, активное участие пользователей в конкурсах и большое количество отметок к публикациям.

Однако аналитики не советуют маркетологам «порхать по верхам» и довольствоваться усредненным образом пользователя. Нюансов здесь существует безграничное множество, поэтому топорные методы работы вряд ли окажутся эффективными.

Жизненная позиция пользователей ВКонтакте в зависимости от пола и возраста / Habr

В анализе Фейсбука, который провел Стивен Вольфрам, мне особенно понравились графики изменения интересов людей в зависимости от пола и возраста. Поэтому я решил посчитать нечто похожее для отечественной соцсети ВКонтакте. В анкете ВКонтакте есть любопытная группа полей — «Жизненная позиция», по значениям которых можно искать фактически в реляционном стиле. Поэтому от меня не требовалось разворачивать мощную data mining инфраструктуру, а лишь обработать результаты нескольких сотен GET-запросов.

Для начала — общее кол-во людей по возрастам:

Так как мужчины и женщины неодинаково активны в социальных сетях, а так же учитывая наличие фейков и ботов, я бы не стал делать из этого графика далеко идущие демографические выводы.

Доля людей, заполняющих отдельные поля в разделе «Жизненная позиция» (почти не зависит от конкретного поля):

Тут все понятно, подростки (особенно девушки) больше увлечены описанием своей личности в интернете.

Прошу извинить за вырвиглазные цвета на диаграммах. Я не нашел, как в LibreOffice автоматически задавать цвета областей. Вручную менять цвета полей по одному на всех графиках было выше всяких сил.

Главное в жизни



Как видно, жизненные приоритеты фиксируются к 25 годам. Интерес к развлечениям и отдыху у подростков (и красоте и искусству у девушек) сменяется фокусом на карьере, деньгах и саморазвитии у молодежи в возрасте 20-25 лет.
Главное в людях



Красоту и здоровье считают главным в людях максимум до 20 лет. Я пока не вижу объяснения тому, что люди среднего возраста (как мужчины, так и женщины) больше ценят в окружающих смелость и упорство.
Отношение к курению


Отношение к алкоголю



Во-первых, не подтверждается расхожее мнение, что подростки считают крутым курить и пить. Молодые люди до 18 лет — самая негативно настроенная по отношению к вредным привычкам группа граждан. Во-вторых, ожидаемо, среди мужчин в 2-3 раза больше любителей сигарет и спиртного, чем среди женщин.
Как считалось

Наколеночный скрипт на Питоне, а также JSON с сырыми данными для мужчин и женщин можно посмотреть тут: gist.github.com/leventov/999d547a3da06d16b91a

UPD. Бонус-трек. Корреляции.

Жизненная позиция пользователей ВКонтакте в зависимости от пола и возраста / Habr

В анализе Фейсбука, который провел Стивен Вольфрам, мне особенно понравились графики изменения интересов людей в зависимости от пола и возраста. Поэтому я решил посчитать нечто похожее для отечественной соцсети ВКонтакте. В анкете ВКонтакте есть любопытная группа полей — «Жизненная позиция», по значениям которых можно искать фактически в реляционном стиле. Поэтому от меня не требовалось разворачивать мощную data mining инфраструктуру, а лишь обработать результаты нескольких сотен GET-запросов.

Для начала — общее кол-во людей по возрастам:

Так как мужчины и женщины неодинаково активны в социальных сетях, а так же учитывая наличие фейков и ботов, я бы не стал делать из этого графика далеко идущие демографические выводы.

Доля людей, заполняющих отдельные поля в разделе «Жизненная позиция» (почти не зависит от конкретного поля):

Тут все понятно, подростки (особенно девушки) больше увлечены описанием своей личности в интернете.

Прошу извинить за вырвиглазные цвета на диаграммах. Я не нашел, как в LibreOffice автоматически задавать цвета областей. Вручную менять цвета полей по одному на всех графиках было выше всяких сил.

Главное в жизни



Как видно, жизненные приоритеты фиксируются к 25 годам. Интерес к развлечениям и отдыху у подростков (и красоте и искусству у девушек) сменяется фокусом на карьере, деньгах и саморазвитии у молодежи в возрасте 20-25 лет.
Главное в людях



Красоту и здоровье считают главным в людях максимум до 20 лет. Я пока не вижу объяснения тому, что люди среднего возраста (как мужчины, так и женщины) больше ценят в окружающих смелость и упорство.
Отношение к курению


Отношение к алкоголю



Во-первых, не подтверждается расхожее мнение, что подростки считают крутым курить и пить. Молодые люди до 18 лет — самая негативно настроенная по отношению к вредным привычкам группа граждан. Во-вторых, ожидаемо, среди мужчин в 2-3 раза больше любителей сигарет и спиртного, чем среди женщин.
Как считалось

Наколеночный скрипт на Питоне, а также JSON с сырыми данными для мужчин и женщин можно посмотреть тут: gist.github.com/leventov/999d547a3da06d16b91a

UPD. Бонус-трек. Корреляции.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *