今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会道德讨论中。
数字实验可谓是新兴技术,引人注目。但Facebook曝光了的数字实验有点玩大了。
很多人认为网络是一个巨大的实验室,的确如此。但数字实验并不是不受限制的。社会道德问题是新技术需要面对的,它将影响数据管理和分析工作。
Facebook的数据科学家在2012年1月篡改用户发布的动态信息用来做情绪实验,并发现人类的情绪在社交网络上具有传染性。在实验过程中,研究者挑选近70万名Facebook用户分成两组,将其中一组用户的带消极情绪的帖子剔除,并将另一组用户带积极情绪的帖子剔除,发现用户的情绪果然会受到社交网络上帖子情绪的影响。
测量情绪传播
这和医疗实验不同,参与者并不知道自己被研究了。在康奈尔大学在今年6月17日在《美国国家科学研究院诉讼》上发表了题为《社交媒体上的大规模情绪传染》的论文之前,很多卷入了实验的人对此毫不知情。传染本用来形容疾病,但在这里形容情绪,很容易让大家记住。此后各大媒体也都沿用了这一用词。
这项研究很快带来了争议。很多人认为Facebook把用户当做了小白鼠。而对这一风险的警告隐藏在注册Facebook时弹出的用户协议中。
Facebook实验还有一点引人关注,那就是它混淆了公司想要微调产品的实验和科学家想要验证假设的实验。这种混淆更让Facebook实验陷入争议。此前在麻省理工学院举行的数字实验会议也讨论了这一话题。
聚光灯下的数据实验
在大会上,发言者讨论了一些先进的数据科学,比如有效指数实验、群体自组织、移动广告效率、线上实验设计和现在大数据分析专家喜欢说的因果关系和相关关系。
其实,数字实验是很多大型互联网公司都在进行的,目的是提高在线服务质量。
在数字实验会议中一场关于实验和社会道德实践的分论坛上,马里兰大学法学教授Leslie Meltzer Henry做了发言,他和他的同事联名向马里兰州相关部门提交了公开信,反对Facebook的实验行为。
Henry很了解数字实验的益处,但她也认为,像Facebook这样的在线实验需要在符合政府监管要求的前提下进行。
她表示:“我认为大规模的数字实验还不能强推。实验也许能带来一定的价值,但是我们还要尊重当事人。”她认为Facebook的主要问题就是没有获得参与人群的认同就私自进行数字实验。
不过,也有一些与会者表示,并不能用临床医学研究的标准衡量Facebook的实验。他们认为Facebook的行为是有操纵性的广告,为用户选择故事,编写标题,目的是挖掘用户的情感反应。有人认为应该对大网站挖掘用户行为数据的行为进行限制。
资深技术媒体人Esther Dyson表示:“Facebook的研究确实有点过分了。” Esther Dyson还是风险投资者,注资公司包括HICCup,是一家想要利用美国小镇作为提升健康水平的实验室的公司。
Dyson认为,科学研究和网站市场行为的界限要分清。但他认为用户也有一定的责任。她告诉与会嘉宾,人们需要知道自己什么时候被利用了,如何被利用了。这件事对人们了解互联网上的侵犯隐私和数据利用来说,到未尝不是一件好事。
数据困境
还有很多数据研究的问题都把矛头指向了数据社会道德。因为大数据的产生,企业可以更容易地抓取更多的数据。这也有好的一面,比如很多医生通过患者历史医疗记录的分析,可以更好地掌握患者情况,找到更好的治疗方法。不过,一切都要在法律允许的范畴内进行。
人们之所以屡屡采用新方法做研究,也从一个方面说明旧的研究方法不能再适应时代的发展。而且旧的方法可能成本还很高。它们有时候依赖分散的数据,有时数据不足以推导出正确的结论。
总之,科学实验和数字研究可能得出对人类发展有益的结论,但是目的到底是不是促进人类发展就不得而知了。因此就有了数据困境。在这一方面,相关的保护和指导会最终确立起来的。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
看Facebook如何使用深度学习模式提升用户参与度
Facebook通过运用贴近用户的商业模式,为他们量身打造内容和广告。随着社交网络公司的发展,其强大的网络优势很大程度上依赖于深度学习模式。
-
Facebook 300PB的数据仓库是如何炼成的?
Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增600TB的速度增长。
-
利与弊:社交媒体分析双面性解读
仅仅拥有社交媒体数据并不一定意味着企业可以从中获得商业洞见。用户需要知道如何进行情感评分,如何编码算法,以便理解讽刺和玩笑之间的细微差别。
-
Facebook等大型企业的Hadoop部署案例
虽然搭建Hadoop集群,不能完美解决所有问题,但是Hadoop集群最大的优点就是它非常适合处理分布广泛且非结构化的大数据。