Twitter — это наши digital-мемуары. Исследование

18:3207.11.2013 (обновлено: 12:47 19.12.2013) / 89Технологии
Ранее мы вам уже рассказывали: соцсети и то, что мы им «доверяем», многое могут поведать о нас, а порой и за нас. А догадываются ли, к примеру, пользователи Twitter, что день за днём они фактически ещё и пишут свою биографию, а особые программы могут по твиттам составить целую хронологию их жизни?
Главная

При помощи специального приложения записи в социальной сети Twitter, где пользователи делятся деталями своей жизни и мыслями, превратятся в точную биографию: специалисты в области программирования из Университета Карнеги–Меллон в Питтсбурге и Корнелльского университета в Итаке, США, разработали алгоритм, который сам сортирует твитты и только на их основании, не прибегая к дополнительным источникам информации, создает хронологию жизни пользователя.

Ключевой принцип, который лежит в основе алгоритма – это классификация записей по четырем категориям. К первой, самой важной, относятся наиболее значительные события, имеющие привязку к определенной дате – например, сообщение о начале работы на новом месте. Ко второй категории относятся твитты, которые рассказывают о действиях пользователя, являющихся стандартной частью его режима, например, о пробежках или тренировках.

В отличие от первых двух категорий, аккумулирующих события из личной жизни пользователя, к двум другим, которые также отличаются друг от друга по критерию протяженности или привязки к определенной дате, относятся твитты, не касающиеся того, что происходит непосредственно с автором: например, когда он пишет про выборы в США или о том, что на улице светит солнце.

Главной проблемой для Jiwei Li (Хувей Ли) и Claire Cardie (Клэр Карди), авторов алгоритма, стало конструирование его таким образом, чтобы он мог максимально успешно отделять «зерна от плевел», то есть выделять твитты первой категории из всей массы записей. Решить эту проблему им помогло открытие, что твитты каждой категории имеют свои паттерны написания, распространения и ответов на них. Например, реакция на пост о том, что пользователь заступает на новую должность, отличается от реакции на твитт о погоде или выборах президента США, поэтому разгадка лежит в правильной идентификации этих опознавательных признаков.

Для того, чтобы проверить эффективность своих разработок, Ли и Карди в течение 21 месяца следили за Twitter–аккаунтами 20 обычных пользователей и 20 знаменитостей, а затем попросили пользователей из первой группы написать автобиографию, ориентируясь на события, которые они освещали в сервисе микроблогов. Биографию знаменитостей ученые сверяли по различным источникам, например, используя Википедию. По итогам этой работы они сравнили эти «золотые стандарты» жизнеописаний с теми, которые составил их алгоритм – и он показал неплохие результаты, собрав практически все ключевые события из жизни респондентов.

Конечно, по признанию авторов, алгоритм пока не совершенен. Например, он работает только с аккаунтами тех пользователей, которые пишут более–менее регулярно и получают достаточный отклик на свои записи – тогда алгоритм может уловить характерные паттерны. Пока авторы не собираются продавать кому–либо свое детище, прекрасно понимая, какие перспективы оно открывает для множества сторон: например, в подобной разработке как минимум могут быть заинтересованы правительственные структуры и бизнес–структуры, потенциальные работодатели, медиа и органы внутренней безопасности.

 

Смотрите также

на эту тему

Исследование на английском языке

Источник
http://www.webscience.ru

Обсуждение