不论“大数据”概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据。
他们都是怎样八仙过海、各显神通让你感受到大数据的?比如,去年年终的时候,你肯定看到众多好友在微信朋友圈儿分享了一张“订制”的图片,在微信产品成长历程的时间轴中标注你加入的时点;你可能在登录豆瓣电台后,才发现通过一个特别的回忆通道,豆瓣已经帮你记录了一年来的音乐足迹,从哪天注册哪天听第一首歌哪天听的很悲伤……无一遗漏;如果你是知乎用户,你肯定搭乘了一架“时光机”,直到这时一组组数据才让你猛然发现,你曾经写下的回答已经被上万的人分享……
这些贴心而极具煽情功效的产品背后,就是基于数据挖掘的最基本形态。这些体贴的数据化产品,常常为你一边绞尽脑汁写年度总结一边担心年底红包缩水的灰暗生活提供些许慰藉(支付宝的账单除外,这差不多是提醒了“过去一年造了太多孽”的恐吓信吧……)社交网站Facebook也在大数据挖掘上有一套自己的风格。
你知道SNS霸主Facebook是怎么玩转大数据的吗?Facebook知道你什么时候跟别人约会,什么时候分手——对,就这么简单。《大西洋月刊》一篇最新的文章发布了一张有趣的关系图(如下),显示了Facebook部分用户发帖数随时间变化图,这是什么意思呢?
就在今年情人节后第三天, Facebook通过其开发博客公布了其数据研究部门科学家团队的一项发现,即利用Facebook网站的统计数据,可以判断发帖的用户是否、何时擦出了爱的火花,用下面这张图说明了他们的研究成果。
联想到一首古诗“不识庐山真面目,只缘身在此山中”,换句话说,Facebook可能还比某些情侣早一步察觉他们之间萌生了爱意。
和传统线下结为恋人的过程类似,社交网络的用户确立恋爱关系也会经历所谓的“求爱”阶段。Facebook的科学家卡洛斯·迪乌克(Carlos Diuk)透露,沿着时间轴观察,在一段网恋的求爱期,两位Facebook用户的发帖都会增多。而一旦真正认准了对方就是意中人,两人在对方Facebook留言板上发的帖子都会减少。原因可能是共浴爱河的恋人花了更多的时间线下相处。
迪乌克这样用数字来解释上面的一切:
我们通过大量数据发现,在成为恋人之前的100天里,日后坠入情网的两人相互发帖缓慢地逐步增加。假设恋情正式开始的那天是“第零天”,这类帖子的数量是从“第零天”起越来越少。我们发现,“第零天”以前发帖最高峰的12天里,平均每天发1.67贴;而“第零天”以后发帖最少的85天里,平均每天每天发布1.53贴。
再加上点儿常识和心理学分析,解释这个现象就更简单:恋人之间求爱结束以后,双方共处的时间增加,线上互动就给线下现实世界的互动让位了。
迪乌克说,数据还显示了另一个有趣的趋势,即在告别单身之后,情侣之间普遍爱意大涨,互动的内容会越来越甜蜜,传递正能量。正如Facebook的下图趋势线所示,在第零天和第零天之后的第一天,恋人之间发帖数量剧增(比对上图)。
活跃用户规模已经达到2.7亿的Facebook掌握了数以亿计的这类用户信息。而Facebook这项分析的数据收集对象是2010年4月到2013年10月之间宣布恋爱满周年的情侣用户,并未包括这期间恋爱关系有变的用户。在分析恋人们彼此多相爱的时候,主要针对英语用户。
迪乌克的同事、Facebook数据研究团队的另一位科学家格登·史塔特(Bogdan State)还透露了两项好玩儿的发现:
第一、如果通过Facebook发展的一段恋爱关系能维持三个月以上时间,很可能会持续四年甚至更久;
第二、恋人分手可能性最大的月份是5月、6月和7月。这显然是快要取代心理学专家和搞社会调研的那群人的饭碗的节奏了。
不过你可能会说,这种研究差不多也算情人节营销吧?不瞒你说Facebook还真的是喜欢利用情人节档期来玩转数据分析。
早在2012年始,Facebook的数据研究团队就开始利用用户主动公开感情的数据做出一些有趣的尝试。2011年底,Facebook开始让用户在社交网络上分享自己(数据来自Spotify插件)的收听习惯,Facebook的数据工作团队也同一时间开始工作。
这些带着一颗八卦心的数据工程师们,将情感关系和音乐这两个概念融合在一起,能够挖掘出哪些歌曲是用户开始一段新感情时喜欢播放的,而哪些歌曲是在他们分手后常提到的。具体的分析工具我们不得而知,然而看看这份发布于2012年情人节当天的排行榜吧,是不是比一味的情人节推广广告更讨巧、更有趣味?
新的感情开始时人们最喜欢的歌曲:Don’t Wanna Go Home(音乐人Jason Derulo的《不想回家》);而陷入爱河者最喜欢曲目TOP 10包括:
- “Don’t Wanna Go Home” by Jason Derulo
- “Love on Top” by Beyoncé
- “How to Love” by Lil Wayne
- “Just the Way You Are” by Bruno Mars
- “Good Feeling” by Flo Rida
- “It Girl” by Jason Derulo
- “Stereo Hearts” by Gym Class Heroes featuring Adam Levine
- “Criminal” by Britney Spears
- “No Sleep” by Wiz Khalifa
“Free Fallin’” by John Mayer相应的,当人们分手时排在榜首的歌曲是的The Cave(Daniel Ek fave Mumford & Sons乐队的《洞穴》);而最受欢迎的失恋歌曲TOP 10包括:
-
“The Cave” by Mumford and Sons
-
“Crew Love” by Drake
-
“All of the Lights” by Kanye West
-
“Rolling in the Deep” by Adele
-
“Take Care” by Drake
-
“It Will Rain” by Bruno Mars
-
“We Found Love” by Rihanna & Calvin Harris
-
“Call It What You Want” by Foster the People
-
“Love You Like a Love Song” by Selena Gomez and the Scene
-
“Without You” by David Guetta featuring Usher
除了博你一笑,Facebook还让这些分析结果用在基于数据的推荐引擎上。产品工程师们基于各种推测结果推出了新的社交服务——向用户提供最契合心境的曲目。
Facebook的数据挖掘团队就像一群已经掌握了爱情“读心术”的魔法师,而从谈(ren)情(zhi)说(chang)爱(qing)做起使用大数据,这个路数看起来更接地气。这让人想到国内大大小小的婚恋平台和社区,是不是还没意识到自己还停留在1.0时代呢?未来,真正的红娘和“知心姐姐”也许就是社交网站!
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
数据丰富的企业将重点转向道德数据挖掘
随着数据泄露事件席卷Facebook、Equifax等公司,越来越多的公司开始谈论道德数据挖掘。虽然大部分讨论 […]
-
数据挖掘规则正在改变 人工智能技术更需信任
随着特朗普政府和国会与互联网服务供应商合作的展开,逐渐放宽了对用户搜索历史的管制,数据领域可能会进一步扩大。
-
看Facebook如何使用深度学习模式提升用户参与度
Facebook通过运用贴近用户的商业模式,为他们量身打造内容和广告。随着社交网络公司的发展,其强大的网络优势很大程度上依赖于深度学习模式。
-
对于预测建模来说,数据集才是决定成败的关键
数据科学核心任务之一是利用数据挖掘和机器学习算法来开发预测模型。但是,如果在前期没有选择正确的数据挖掘数据集合,即使是最佳设计的模型也可能会误入歧途。