想必数据管理专家都很熟悉大数据的三个V——volume(规模大)、velocity(速度快) 和variety(种类多)。但是随着各种类型的数据库处理大规模数据流的技术愈加成熟,数据的种类逐渐成为大数据最棘手的问题。
Scotts Miracle-Gro公司商务智能项目的高级总监David Judson出席了SAS高级商业领袖系列会议,在他2011年接受大数据项目的时候,他并不担心数据库需要处理的数据的规模和速度,因为现存基础设施足以胜任。
他关心的是数据种类。Judson发现,每当他想要建立客户档案的时候,他得到的关于潜在客户的数据都是一些天气预报、聊天记录和其他形式的线上内容。这种问题现在也困扰着他。这种数据中得出来的信息结果无法以合适的格式进行存储或分析。
Judson表示,公司以前有一个企业数据仓库(EDW),但目前正在考虑如何使用Hadoop存储和分析混合媒体数据。
这不禁让我们重新审视“大数据”这个概念。因为“大数据”主要强调数据集规模的庞大。但事实上,处理大规模数据集时,面临的主要问题是如何处理不同类型的数据。
美国波特兰数据分析国际研究所的联合创始人、调查总监Tom Davenport表示大多数大型企业关心的都是数据种类。他最近完成了一份名为《大企业的大数据》的调查报告。通用电气、UPS和花旗银行等大企业都参与了调查。Davenport表示,这些公司主要关心的都不是数据量和处理速度。
Davenport认为,这说明人们通常理解的“大数据”并没有触及问题的关键。它没有充分的揭示出公司在部署大数据技术时应该考虑的因素。Davenport觉得会有一个表意更明确的词最终取代“大数据”这个词,只是现在还不知道它是什么。
Davenport表示:“种类是要考虑的首要因素。”
Jill Dyche是SAS研究院最佳实践的副总裁,同时也与Davenport合作开展了上述调研。她认为,当人们刚接触大规模数据集的时候,人们使用三个V来阐释大数据,想要广泛地定义这个新技术。但现在这个词已经失去其意义。不过要想用一个更能揭示大规模数据集本质困难的词替换它,恐怕还需要一段时间。
Dyche同时也表示,在另一方面,“大数据”这个词或许还值得沿用一段时间,因为它可以激起管理层的兴趣。或许他们并不知道“大数据”到底是什么,但他们会经常在杂志或其他地方看到它,从而最终选择它。
Dyche表示:“我觉得管理者关心数据只是一件很偶然的事,他们可能一下子就转变观念,决定采用‘大数据’技术。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
采矿设备制造商利用BI on Hadoop来挖掘数据
如果大数据要取得巨大成功,则需要提供给更多的最终用户群组。但广泛使用的商业智能工具尚不能轻松分析最大的大数据, […]
-
新Qlik Sense功能可用于云计算、AI和大数据
一年前,Qlik公司公布其长期计划,即将高级云计算、AI和大数据功能添加到其自助式BI和数据可视化软件中。现在 […]
-
Cambridge Analytica秘密收集Facebook数据表明对道德数据挖掘的需求
当有关Cambridge Analytica公司秘密收集Facebook数据的消息传出时,这暴露了一个薄弱环节 […]