话题: Hadoop
-
IBM,Microsoft大力推广的Spark2.0:真实力还是纯套路?
2016-06-20 | 作者:Jack Vaughan | 翻译:杨宏玉在Databricks的Spark峰会上,支持结构化处理和SQL 2003的Spark2.0 呈现在众人面前,此外,R-to-Spark接口也在该峰会上崭露头角。
-
Forrester报告:Teradata大数据 Hadoop 优化系统获高度评价
2016-06-06Forrester 在最新报告中给与Teradata天睿公司大数据 Hadoop 优化系统高度评价,并表示Teradata 是通过数据管理一体机获得显著成功的少数厂商之一。
-
应对Hadoop选择困难症 四大产品特征值得关注
2016-06-02 | 作者:David Loshin | 翻译:张亮亮虽然厂商Hadoop发行版的企业版本都提供了Hadoop生态系统堆栈的核心组件,但是这些厂商提供的超越公开可访问功能的部分才是其关键优势。
-
Hadoop真的适合你吗?
2016-05-30 | 作者:David Loshin | 翻译:冯昀晖Hadoop的部分优势在于,它有许多种开源组件和相关工具,可以完成数据捕获、处理、管理和分析工作。
-
NoSQL人气高涨 Spark功不可没
2016-05-25 | 作者:Jack Vaughan | 翻译:张亮亮近年来,由于NoSQL数据库出现并用于处理大规模数据扩展,在线事务处理技术不断变化。同时,随着Hadoop和Spark的出现,经典分析模式被逐渐打破。
-
【大数据小故事】飓风来临! 沃尔玛“奇葩备货”
2016-05-18飓风来袭,除了常见的应急用品,草莓酱吐司饼干和啤酒竟然成为沃尔玛超市的热卖商品?这个故事虽然有点老,不过的确是沃尔玛的经典大数据故事。
-
开源技术群雄逐鹿 数据分析大势所趋
2016-05-12开源市场从来不缺席创新者,目前的开源大数据技术用群雄逐鹿来形容丝毫不为过。开源的战略就是要帮助客户能够取得成功,就是用数据分析建立相应的生态系统。
-
MapReduce地位难保?Spark开源上位
2016-04-26 | 作者:Jack Vaughan | 翻译:冯昀晖开源Apache Spark架构已经提供了快速的内存处理和高性能的机器学习库,还集成了数据流处理能力。它还在继续吸引更多来自Web新贵和传统企业环境的追随者。
-
新型数据准备工具来袭 你还在使用传统数据仓库架构吗?
2016-04-25 | 作者:David Loshin | 翻译:杨宏玉越来越多的业务分析师正在提升自身编写临时查询和分析算法的能力。这些临时查询和分析算法用来寻找企业数据存储中的有用信息,为企业业务决策提供更多数据。
-
创建企业级品质数据湖 Spark没那么简单
2016-04-20许多企业正在尝试部署Apache Spark,通常会结合数据湖使用,希望能发挥其在流数据、查询和分析上的优势。但用户很快意识到,Spark并不容易使用。