搜索引擎老兵谈数据驱动的业务决策

日期: 2014-01-15 作者:Lauren Horwitz翻译:陈洪钰 来源:TechTarget中国 英文

随着大数据时代的到来,分析和处理海量数据,逐渐成为企业发展的利器。这也创造出一代新星。企业咨询公司Attivio的CTO Sid Probstein就凭借大数据技术脱颖而出。

Attivio是一家帮助企业提升搜索能力,增强数据驱动决策的公司。Attivio的主动智能引擎可以搜索结构化数据和非结构化数据,即不仅能分析数据库、电子表格中的数据,也能分析SharePoint、电子邮件、博客、社交媒体和其他数据源的信息。Attivio搜索引擎的用户界面很简单,却能在数据库中处理复杂的关系。它可以快速处理数据,解决复杂问题,比如针对社交媒体上对公司比较活跃的用户群,如何制定营销策略。

还可以在引擎上加载应用,运行复杂的查询和数据分析。企业要想实现数据驱动决策,需要能够快速准确处理数据的软件应用。在该领域,Probstein具有二十年的从业经验,了解企业搜索技术的得失。

Probstein是Attivio的创始人之一,在此之前他担任了搜索技术公司Fast Search & Transfer的技术副总裁。该公司现已被微软收购。而在2002年加入Fast Search & Transfer以前,他是搜索引擎公司Northern Light Technology的工程副总裁,该公司以卓越的发现相关关系的能力著称。

TechTarget记者采访了Probstein,讨论了传统企业搜素和Attivio技术创新的问题。

Sid Probstein

Sid Probstein: Northern Light当时是一家著名的独一无二的搜索公司。它的规模很大。但它的痛点在于内容业务模型。那时候搜索引擎还很少,所以在那里工作是一个很难得的学习机会。我也把这些工作经验带到了Fast Search & Transfer。

Fast Search & Transfer一开始是一个硬件解决方案,核心技术是高可伸缩通用搜索引擎。只是那时重大决策的焦点在企业而不在客户。在短短五年的时间里,该产品从不盈利发展到盈利1.5亿美元。它有一个高质量客户集。每个人都在应用这项技术。

企业搜索面临的主要问题是什么?

Probstein:企业都想有一个搜索界面。它们不喜欢SQL界面,也不喜欢BI。企业想要应用搜索模型,可搜索模型只有在拥有所有数据的情况下才能使用。谷歌的网页版工具会被防火墙隔离。所以无论是搜索引擎还是企业自己的数据库都无法满足企业的业务分析的需求。

所有的商务智能问题都是由结构化数据催生的,而非非结构化数据。不过现在随着交易的出现,我们发现把相关关系和因果关系区分开来,会产生严重的问题。而因果关系来自于非结构化数据。比如如果一项合同没有签成,或者一笔款没有支付,你需要知道是为什么。真正把分析做的好的公司都会引入因果关系。

Attivio与传统企业搜索引擎有哪些区别?

Probstein:真正的搜索引擎需要结构化数据和非结构化数据的结合。也许企业现在应用的是传统搜索,但当你需要处理业务逻辑、业务细节、数字和交易的时候,传统的搜索引擎就难以胜任了。你需要统一的信息,这样你才能进行分析,才能启用应用程序。

Attivio关注的就是统一信息。大数据的最终目的就是增加洞察力。而分析的前提就是获取数据。现实中,这两者经常是分开的。如果你要处理结构化数据,你需要传统数据库;如果是非结构化数据,你需要搜索;如果是半结构化数据,则需要SQL数据库。问题是没有技术能够在不使用建模的情况下把信息整合起来。而有些奇怪的格式,比如XML数据库,你很难分析它。不找到结构就无法利用数据。

Attivio的基础架构是怎样的?

Probstein:我们可以容纳很多数据源。可以使用云端的Office 365的数据,使用本地SharePoint的数据。没有ETL(提取、转换和加载)的过程。数据可以快速地进入我们的引擎。

在从多个数据源获取数据后,我们把数据集成。结构化数据会保留它的结构,如果有关系数据库模型,我们也会保留。在客户记录中没有扁平化数据,这是你在搜索层需要做的。我们也像数据库一样创造了表格,建立关联,而本质上,我们还是一个搜索引擎。你可以在任意一个表格或所有表格中进行全文搜索,你可以像在关系型数据库一样使用表格之间的关系进行搜索。这是一般的搜索引擎和数据库做不到的。

在搜索引擎中,页面之间是不能连接的。因此,我们加了一个图形引擎,是一个包含很多节点和关联的数字图形。我们通过图形将搜索A的结果和搜索B的可能结果关联在一起。搜索结构非常快。

技术是用户友好型的还是需要分析专家来操作呢?

Probstein:是用户友好型的。它是一个门户,可以多个用户登录。安全是首要考虑因素,所以不同用户看到的内容是不一样的,尤其是内部数据。

搜索中还有一点很赞的是,你不需要烦人的选择列表,尤其是在报表领域。搜索引擎的搜索功能是很成熟的,还包括了提前键入、自动完成和即时搜索等功能。如果技术太复杂,用户很可能难以收获价值。

我们来看一个例子。我们有一个客户是银行,管理现金付款。他们有严格的服务等级协议,要求服务中断最长不能超过15分钟。之前,50%的服务中断都要花费大约27分钟的时间去维修,这对银行来说是是很长一段时间。

通常,系统管理员要想解决这个问题,需要多达9筒仓的数据。而我们花费了两周的时间,搭建了搜索应用,把9筒仓的数据集成起来。极大地节省了时间。现在搜索只需要花费几分钟的时间。80%的问题都可以一键解决。这不是简单的搜索问题,而是工具和技术的成熟。而用户不需要考虑这些复杂的技术问题。

以前,他们会聘请专业的系统管理员,这是昂贵的人力成本。现在,他们只需要招聘大学毕业生。输入标签后,机器就会自动识别相关内容。现在系统管理员也轻松了,公司也节省了成本,提高了效率。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Lauren Horwitz
Lauren Horwitz

TechTarget执行主编,重点关注业务应用和架构,曾多次获美国商业期刊编辑协会 (ASBPE)的网络编辑大奖。

相关推荐