SharePoint大数据分析成为现实?

日期: 2013-11-27 作者:Scott Robinson翻译:曾少宁 来源:TechTarget中国 英文

虽然我们总是听到大数据——就像流行歌曲一样,但是实际上SharePoint更多是用于处理小规模数据。 大数据提供了发现和处理公司数据的机会,它现在已经成为必备的业务策略。但是,一直以来,SharePoint都不是处理复杂分析的工具。   众所周知,大数据是指大规模且复杂的数据集。

大多数组织都有多年积累的历史数据,它们具有非常宝贵的战略意义。问题是,只有极少数组织掌握分析大数据的工具和专业知识。 SharePoint与小型数据 随着SharePoint平台的发展,它与微软的业务应用套件更好地整合在一起了,包括SQL Server和Office。这种整合已经完全体现在SharePoint……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

虽然我们总是听到大数据——就像流行歌曲一样,但是实际上SharePoint更多是用于处理小规模数据。

大数据提供了发现和处理公司数据的机会,它现在已经成为必备的业务策略。但是,一直以来,SharePoint都不是处理复杂分析的工具。

 

众所周知,大数据是指大规模且复杂的数据集。大多数组织都有多年积累的历史数据,它们具有非常宝贵的战略意义。问题是,只有极少数组织掌握分析大数据的工具和专业知识。

SharePoint与小型数据

随着SharePoint平台的发展,它与微软的业务应用套件更好地整合在一起了,包括SQL Server和Office。这种整合已经完全体现在SharePoint 2013上。

SharePoint基于SQL Server,SQL Server的工具集可以存储和分析大规模数据集。此外,微软在SQL Server 2005中开创了开箱即用且用户友好的商业智能工具,引入了一组能够创建数据仓库和数据集市,方便地分段提取、转换和加载数据的工具集,以及从Transact-SQL演化而来的,能够查询那些处理n维数据结构的有力工具。这样,你不需要在内部聘请商业智能专家,就可以完成一个成功的商业智能项目。你只需要安装SQL Server 2005及以上版本,然后交由一般IT人员去完成。

SharePoint 2010包括PerformancePoint,这是微软的仪表板/关键性能指标(KPI)技术,它已经绑定到SQL Server Reporting Services和Excel上,可以更方便地执行业务分析。

那么,问题出在哪里呢?为什么SharePoint仍然只是一个小规模数据管理环境,为什么我们不能将它看作是大数据工具?

人决定了处理能力

一直以来,在SharePoint中执行的分析都使用Excel Services。

但是,这里有一个严重的问题:因为SharePoint主要帮助业务端人员处理数据,而非IT人员,所以它所能处理的文件对象有一个硬性的2GB大小限制。在大数据领域,2GB根本不算什么。

现在,SharePoint改进了2个主要特性,目的是克服大数据障碍,同时又减少对于IT的依赖:第一,它引入了开放数据协议(OData),它使用REST应用编程接口,读取SharePoint中Excel工作薄的信息。业务用户现在可以将一个分析工作薄同时链接到多个数据源:将要分析的数据不一定要存储在SQL或数据仓库中。

第二,更重要的是,虽然SharePoint的对象仍然有2GB大小限制,但是在执行分析处理时,内存内操作的数据量已经没有硬性限制。所以,用户可以创建一个分析工作薄,然后在其中存储不超过服务器物理限制的数量,然后再处理数据。但是,最终存储在SharePoint的结果不能超过2GB。

其他方面

SharePoint 2013的处理能力只是其中一个方面。除了执行工作表数据分析和在过程中处理大数据集的能力,它还有许多新的处理工具:改进的PowerPivot;新数据显示功能;数据建模与可视化引擎Power View;PerformancePoint仪表板的iPad接口。

最关键的是,SharePoint 2013最终会将SharePoint的大数据处理变为现实。

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐