自然语言查询可使未经数据科学培训的普通业务用户分析数据,但该技术在发展成为真正的变革工具前仍有很长的路要走。
自然语言查询(NLQ)是指简单地通过普通语言(口头或者输入)而不是代码提问题来查询数据的能力。理想情况下,自然语言查询将使业务用户无需编码即可进行深度分析。
但是,这种理想还没有照进现实。
目前的情况是,自然语言查询允许在福特经销店工作的人问:“2019年售出了多少蓝色野马?”以及,“2019年售出了多少红色野马?”然后比较两者。
服装店的人员可以问:“11月冬季大衣的销量预测如何?”
但是,自然语言查询还无法汇总数据仓库中的非结构化数据,并且还不够先进,无法进行复杂的查询和分析。
IT分析和研究公司Enterprise Strategy Group(ESG)的高级分析师Mike Leone说:“多年来,我们已经有语音搜索,但功能有限。我们刚刚开始可以有效地使用自然语言处理来查询数据,但我们还无法利用自然语言查询进行复杂查询,这些查询通常需要大量后端工作和数据科学团队参与。”
数据库和分析咨询公司DBInsight的创始人兼首席执行官Tony Baer表示,自然语言查询还没有发展到–允许没有数据科学家参与的情况下进行深度分析。
他说:“你不能进入给定的工具或数据库,提出任何随机问题。它仍然必须链接某种结构。我们还没有发展到,像与人类交谈那样,大脑可以自行进行处理。我们目前所处的位置是,为数据和语法提供了某种结构,这是一种以特定方式构造查询的替代方法。”
NLQ优势
在最基本的水平上,商业智能可以改善决策过程。而且,企业中可进行数据驱动型分析的人越多,决策过程就越有高效,不仅针对企业的高层,而且面向整个员工队伍。
同时,自然语言查询不需要大量的专业知识。它不会强迫用户编写大量的代码来为相对简单的分析问题提供答案,它使业务用户无需请求数据科学团队的帮助-至少对于基本查询而言。它使企业内更多用户可以进行分析。
Constellation Research首席分析师Doug Henschen说:“好的NLQ可以帮助BI高级用户和未经培训的业务用户更快地获得见解,但最需要帮助和最大收益的是业务用户。这些用户不知道如何编码SQL,很多用户甚至都不熟悉查询结构,例如“显示X”和“按Y时间段”,以及何时需要使用饼图、条形图或折线图。
IT咨询公司Impact Analytix的创始人兼首席顾问Jen Underwood表示:“想想那些想要运行报告但无法这样做的人,自然语言查询很简单,让这些人可以自行进行搜索,而带来价值。”
从本质上讲,自然语言查询和其他低代码/无代码工具有助于提高数据素养,而提高数据素养对很多企业而言是重大推动。
但目前而言,该技术有其局限性。
Leone说:“在企业中扩展这种功能,可使员工以他们感到舒适的方式与数据进行交互。但是不要指望仅仅因为有人可以使用Alexa来查看有多少人在星期二买了袜子而带来数据革命。”
局限性
全面自然语言查询的最大障碍也许就是语言本身的性质。
全球共有超过5,000种语言,估计200至400个字母表,单个语言就很复杂。有些单词的拼写相同但含义不同,其他单词的拼写不同但听起来相同,还有些彼此之间没有视觉或听觉关系的单词竟是同义词。
在商业世界中,经常有一些术语可能对不同企业有着不同的含义。
自然语言查询工具实际上无法理解口头或书面单词。他们了解特定的代码,并被编程为将口头或书面查询转换为SQL,然后将来自SQL的响应转换回口头或书面词语。
Underwood说:“自然语言查询在同义词和特定领域术语等方面存在缺陷-缺少背景信息。你仍然需要人工来处理同义词和术语,因为不同的公司对不同的单词具有不同的含义。”
另外,当进行自然语言查询时,口音也可能会带来问题。而且,无论是口语还是书面,该工具的最轻微的误解都可能导致无用的响应,甚至更糟糕的是,某些不正确的响应。
ESG的Leone说:“在查询方面,准确性至关重要。只要对语音请求的轻微误解,都会导致产生错误的结果。”
他说,在接下来的几年中,人们将依靠自然语言查询来快速在其设备上提出基本问题,但仅此而已。
Leone说:“不要指望NLQ取代数据科学团队。只不过,NLQ将成为快速返回结果的方式,然后可以将其用作进行更复杂的查询和专家分析的起点。”
虽然现在由于语言的限制而受阻,但该技术并不会举步不前。这些工具将变得更加先进,并在机器学习的帮助下,逐渐了解用户的模式以更好地理解他们的要求。
DBInsight的Baer说:“阻碍我们前进的主要是缺乏经验。它还处于早期阶段。现在的自然语言查询比两年前有了很大的进步,但是仍然有很多改进要做。我认为改进将是渐进的;机器学习将有所帮助。”
顶级NLQ工具
尽管功能有限,但是在询问结构化数据的基本问题时,自然语言查询工具确实可为企业用户节省大量时间。而且某些供应商的自然语言查询工具要比其他供应商更好。
在2007年收购Hyperion之后,顶级的BI供应商之一甲骨文一度失去动力,因为数据可视化改变了分析方式。而现在,增强智能和机器学习已成为BI的核心原则,甲骨文再次提高BI平台的技术功能。Oracle Analytics Cloud和Day by Day支持基于语音的查询,其自然语言查询支持28种语言,Henschen表示这是目前可用的最广泛的语言支持。
Henschen说:“甲骨文在几年前发布了Day by Day应用程序时,就提高了自然语言查询的门槛,该应用程序使用设备本地语音-文本,并引入了明确的点赞/差评训练。”
Henschen指出的另一家供应商是Qlik,它通过2019年1月对Crunch Data的收购提高了其平台的自然语言功能。
Henschen说:“关键资产是CrunchBot,自收购后更名为Qlik Insight Bot。”
他补充说,Qlik Insight Bot是一种机器人构建功能,可与现有Qlik应用程序一起使用,并且该机器人随后可以嵌入到第三方应用程序中,包括Salesforce、Slack、Skype和Microsoft Teams。
Henschen说:“它使NLQ超越Qlik Sense的范围,并与BI系统进行交互。”
Tableau是另一家尝试使用自然语言处理工具简化分析过程的供应商。他们于2019年2月推出了Ask Data,Tableau在2019年9月更新中添加了将Ask Data嵌入其他应用程序的功能。
Underwood说:“当我考虑设计一个系统,并将其更进一步时,Tableau就已经在做一些事情。它记得是否有人进行过类似的查询,并提供指导。它具有信息并且知道人们在问什么,并且可以提出建议。”
Baer同样提到Tableau的Ask Data,而Leone表示,自然语言查询的最终流行将由Amazon Web Services、谷歌和微软推动。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
企业商业智能的10大好处
商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]
-
生成式AI会取代数据分析师吗
生成式AI不会取代数据分析师的工作。在很多领域,人工智能都无法取代人类,特别是那些需要人类同理心和洞察力的领域 […]
-
改进数据可视化的7项技能
数据可视化可以实现可操作的洞察力和卓越的业务成果。但构建有效的数据可视化可能很困难。如果你想创建数据可视化,你 […]
-
了解BI生命周期以构建有效的架构
成功的数据驱动运营遵循商业智能(BI)生命周期,定义BI能力,并部署良好理解的治理架构。 该过程的前提是,你必 […]