社交媒体分析是大数据最严峻的挑战之一。诚然,可用数据就大小来说十分庞大。非结构化文本需要专门自然语言处理技术和工具来进行数据分析,并且这一需求永无止境。这些因素加在一起使得社交媒体数据应用成为企业的一项艰巨任务。
但是仍然值得一试。明确客户和公众对于公司及其产品的普遍了解有助于企业高管调整商务策略,在问题失去控制之前作出反应。社交媒体分析学为客户调查提供了一个更广阔更实时的平台。社交网络用户可以自由发表观点。企业要做的仅仅只是深入分析并利用好这一数据流。
这也是问题开始的地方。仅仅拥有社交媒体数据并不一定意味着企业可以从中获得商业洞见。用户需要知道如何进行情感评分,如何编码算法,以便理解讽刺和玩笑之间的细微差别。让数据自己说话,这一理念在社交媒体分析中尤其难以实现。
Capital Market Exchange公司总裁Sarah Biller表示,“人们错误的认为,现在所有的数据都在我们手中,大数据时代里这些数据都变得可用。”Capital Market Exchange是一家美国公司,通过分析社交网络和传统媒体资源数据来帮助投资管理者对企业债券价值和债券组合进行评估。Biller还表示,企业还需要内部人才对数据进行标准化和结构化,让数据通过分析引擎来运行。
社交媒体分析技术紧缺
然而,找到社交媒体技术人才又是另外一个问题。没有哪一个领域数据科学家的紧缺程度比得上社交媒体分析领域。这一领域相对较新,很少有分析方法专家具备管理复杂的社交媒体新闻数据挖掘所必需的经验和专业能力。
Jiri Medlen是eBay的子公司PayPal的高级文本分析专家,他表示,社交媒体分析的整体理念非常之新,即使是经验丰富的数据分析师也经常不知如何着手。更糟糕的是,对于如何量化文本中表达的情感并没有普遍公认的实践。
Medlen建议,企业在采用社交媒体分析之前要有明确的目标。不过即使是这样,从社交媒体情感分析中得到的投资回报率(ROI)也是值得怀疑的。比如,即使Medlin能够知道社交媒体上关于Paypal的负面言论——该言论者还可能注销其Paypal账号,想要改变该言论者的心态可能已经为时已晚。了解客户的情感并不一定等同于采取了有意义的措施。
Medlen表示,“最大的问题在于,如何让处理这种类型的数据。”这些数据是否会触碰公司的底线?“这样的难题我们难以回避。”
社交媒体数据的技术难关
尽管社交媒体数据能够深入分析模型和数据发现,它同样也能增加企业面临的技术挑战。在美国举办的2014年 RapidMiner全球用户大会上, Barclays PLC首席数据官,前雅虎首席数据官Usama Fayyad表示,社交媒体数据的快速流动性和无结构特性,使得数据与分析系统的整合十分困难。
Fayyad 表示,过去他在雅虎的团队常常会思考互联网公司从每个大数据用户所获取的数据信息的25个标准特征。其中包括年龄特征、人口统计特征以及搜索历史,这些数据主要用来建立雅虎用户的个人信息进行定向市场营销。后来,分析师开始探索如何利用Facebook,Twitter和LinkedIn的用户数据,他们也因此开始真正面临着与大数据打交道的挑战。
他还补充道,社交媒体分析应用刚开始前景很好,但是非结构数据的错综复杂给数据处理带来了很大的困难。“我们确实不知道如何处理数据的多样性问题,你可以利用这些数据来强化数据组,并且可以达到一定效果,但是实际操作起来非常棘手。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
采矿设备制造商利用BI on Hadoop来挖掘数据
如果大数据要取得巨大成功,则需要提供给更多的最终用户群组。但广泛使用的商业智能工具尚不能轻松分析最大的大数据, […]
-
新Qlik Sense功能可用于云计算、AI和大数据
一年前,Qlik公司公布其长期计划,即将高级云计算、AI和大数据功能添加到其自助式BI和数据可视化软件中。现在 […]
-
Cambridge Analytica秘密收集Facebook数据表明对道德数据挖掘的需求
当有关Cambridge Analytica公司秘密收集Facebook数据的消息传出时,这暴露了一个薄弱环节 […]