高中时,我在一家快餐店打工,一直深信不疑的工作原则是“力求速度、勿求完美。”随着时间的推移,我的想法有所改变。 如今,数据管理和分析团队不仅需要提升速度,而且必须力求完美,完成企业实时数据分析任务。这给了他们很大的压力,因为构建一个实时架构,并在该框架上运行流数据分析应用是一项非常复杂的工作。
首先,流分析系统并不是一个黑盒系统。配置这个系统是一个纯手动的过程,需要准用户拼凑各种数据处理技术和分析工具,以满足特定的应用需求。此外,可供选择的技术种类在过去的几年中显著增加,这主要得益于多个大数据平台以不同的方式提供了流处理能力。 各式流分析平台 Spark 流分析,Flink,,Storm,Sa……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
高中时,我在一家快餐店打工,一直深信不疑的工作原则是“力求速度、勿求完美。”随着时间的推移,我的想法有所改变。
如今,数据管理和分析团队不仅需要提升速度,而且必须力求完美,完成企业实时数据分析任务。这给了他们很大的压力,因为构建一个实时架构,并在该框架上运行流数据分析应用是一项非常复杂的工作。
首先,流分析系统并不是一个黑盒系统。配置这个系统是一个纯手动的过程,需要准用户拼凑各种数据处理技术和分析工具,以满足特定的应用需求。此外,可供选择的技术种类在过去的几年中显著增加,这主要得益于多个大数据平台以不同的方式提供了流处理能力。
各式流分析平台
Spark 流分析,Flink,,Storm,Samza,Pulsar,Druid,Kylin——所有的开源处理引擎都期望在数据流和实时分析领域占据一席之地。就连Kafka,这个用于从一个系统向另一个系统传输数据的系统,现在也试图作为一个流处理平台而存在。除了开源工具,从20世纪90年代开始,各个IT供应商都开始提供更为传统且复杂的事件处理系统。例如专用数据库,内存处理数据库,这些技术出现的驱动力之一,就是流数据分析。
在分析软件层面,机器学习算法的广泛使用,让预测模型的构建工作变得更为容易,这些预测模型可以处理大量的流数据,例如金融交易数据、设备性能监控数据和网络点击流等。可供人们选择的技术有很多:来自主流分析供应商的工具,机器学习厂商,云端服务,开源平台等。
和构建大数据架构类似,支撑实时分析架构的软件种类繁多,这对于用户来说有利有弊。找到合适的技术,并把这些技术整合成一个有效的分析框架将是一个十分冒险的过程,一着不慎,满盘皆输。
流数据处理项目依然受到企业的追捧
这些困难并没有让企业停止实施流数据分析架构的脚步,尤其是那些拥有大量数据和充足的IT资源的大型企业。来自TechTarget公司进行的调查显示:7000名受访的IT从业人员中,28.1%的人表示他们的企业正在寻找在接下来的一年中,在实时分析技术上进行投资。此外,13.4%的人表示他们计划购买流处理软件。
为什么要使用流数据分析呢?因为实时从数据流中提取有用信息的能力可以企业运营做出实时调整。运行在Web流数据上的预测分析应用程序,为网站个性化定制提供了有利的依据,能够让在线广告投放和营销活动变得更为精准和有效。欺诈检测,预测性维护和卫星成像等,也属于能从流数据分析中获益的应用场景范畴。
在很多情况下,实时意味着机不可失,失不再来。Forrester的分析师Mike Gualtieri和同事Rowan Curran在2016 Forrester Wave报告中提到,数据流分析工具能够抓住时机,让企业在流数据上得到立即的见解,以便做出快速反应。简单地把数据扔到Hadoop集群中,是无法得到类似的见解的, Dell EMC首席数据平台架构师Darryl Smith,在Strata + Hadoop World 2016的一次演讲中说道。
速度的确可以带来很好的体验。但在追求速度之前,要确保你的团队具有深思熟虑的计划。否则,你很有可能让企业高管们失望。
翻译
TechTarget特邀编辑。北京邮电大学计算机科学与技术专业硕士。熟悉软件开发流程,对系统管理,网络配置,数据库应用等方面有深入的理解和实践经验。现就职于IBM(中国)投资有限公司,从事IBM服务器相关软件的开发工作。业余时间喜欢游泳登山,爱健身,喜欢结交朋友。
相关推荐
-
Qlik收购Attunity为用户扩展数据管理功能
近日BI和数据可视化供应商Qlik公司收购以色列数据集成和数据管理供应商Attunity公司,此举将进一步推动 […]
-
如何减少部署自助BI工具的痛苦
为什么部署自助BI如此困难?从理论上来讲,自助BI应该是你所有问题的答案。但很多企业最终都还是失望,数据让他们 […]
-
Qlik收购Podium旨在提高BI数据管理
Qlik正在收购初创公司Podium Data。这次收购将为这家自助式BI和数据可视化软件供应商带来新的数据管 […]
-
学习迪士尼的分析之道
华特迪士尼公司正在继续增加对数据分析的投资,以改善其关键业务部门的客户体验。 该公司的业务包括公园和度假村、媒 […]