在关于AI的炒作中,包括自主代理可在几秒钟内做出业务决策以及执行耗时任务等,也许AI的最大好处可能是它能够解锁非结构化数据。
这是科技企业家Andrew Ng的观点,他是DeepLearning.AI公司创始人兼LandingAI的执行主席。这是他在11月4日在Snowflake Build的小组讨论中的发言。Snowflake Build是由数据管理供应商Snowflake主办的开发人员虚拟会议。其他小组成员包括Snowflake首席执行官Sridhar Ramswamy和AWS代理AI副总裁Swami 。Sivasubramanian。
多年来,非结构化数据一直是分析的圣杯。
企业历来使用财务记录和销售统计数据等结构化数据来为决策提供信息。但结构化数据只占企业整体数据的一小部分。大多数(可能高达90%)是非结构化数据,例如PDF和电子邮件中的文本、来自客户服务互动的音频文件和图像。
一直以来,仅使用结构化数据,企业只能部分理解其运营,而不是整体理解,并基于此得出见解和制定关键战略举措。非结构化数据与结构化数据相结合,可提供完整视图,企业可以通过AI轻松访问非结构化数据。
Ng说:“我们在过去20年里一直在构建结构化数据。我认为很大的解锁将是非结构化数据,AI最终可以理解它。”
解锁非结构化数据
很多数据管理和分析平台历来只关注结构化数据。有些仍然主要只支持结构化数据。然而,其他平台还在使用生成式AI和代理AI,使其易于操作和分析非结构化数据。
例如,Microsoft Power BI、Tableau和Qlik等分析平台现在允许用户查询和分析非结构化数据。同样,科技巨头AWS、谷歌云和微软的数据管理平台都支持非结构化数据,Databricks、Snowflake和Informatica等更专业的供应商也支持非结构化数据。
为了使非结构化数据可以通过数据库、数据湖和数据湖屋访问,它必须赋予某种形式的结构,例如向量(数据的数值表示)使其可被发现。
虽然开发将向量分配给非结构化数据的算法很复杂,但构建包括向量数据库、代理和其他AI应用程序在内的数据和AI管道是劳动密集型的,显著简化了非结构化数据的访问和操作。
他们可以处理数据准备,使非结构化数据可访问。此外,通过自然语言接口和文本到代码的翻译功能,AI可以让开发人员轻松构建数据的应用程序,以包含非结构化,并让分析师查询其组织的整个数据资产。
Ng表示,虽然客户服务互动音频可以分析客户情绪,扫描邮件内容可以获得有价值见解,但以前锁定在PDF中的信息(现在可以访问)对企业来说可能是最有价值的。
Ng说:“我认为我们所有业务中最有价值的非结构化数据形式是PDF文件。我对正在完成的工作感到非常兴奋……关于代理文档提取,例如从金融和医疗保健中大量PDF文件提取价值。这方面用例数量正在飙升。”
据主持小组讨论的Ramswamy称,在代理AI之前,在大型PDF文件中查找相关数据基本上是手动的。
复杂的配置可以提取有价值的信息。但通常,它留给搜索数据的个人自己去寻找它。
Ramaswamy说:“我问人们,’你知道我一生中最强大的PDF搜索引擎是什么吗?Command F。’”他指的是搜索的键盘快捷键,在文档、网页和应用程序中查找单词或短语。
发展战略
虽然AI工具可以轻松从非结构化数据中获取价值,但开发AI代理仍然很复杂,以使非结构化数据可访问或执行任何任务。
根据Sivasubramanian的说法,这需要从数据开始。他指出,随着开发人员工具和基础模型的改进,企业开发尖端应用程序的速度呈指数级增长。但是,如果没有强大的数据基础,代理、聊天机器人和其他AI工具不会使业务受益。
Sivasubramanian说:“提供新功能实际上不仅要构建概念证明,还要优先考虑对业务重要的事情,然后专注于正确构建数据架构,并构建所有这些AI解决方案。只有这样做才说明,你们在为未来做好准备。”
与此同时,Sivasubramanian继续说,开发代理和其他AI工具的能力取决于企业所在行业和商业模式。例如,一个开发人员框架或大型语言模型可能更适合制造业企业而不是零售业,反之亦然。
Sivasubramanian说:“对我来说,最好的模式是你的商业模式,了解什么能为你的客户和你的业务提供价值,并朝着这个方向努力。”
Ng说,关于AI开发的成本,这对有些企业来说可能是高昂的,开源模型正在改进,并且是越来越有吸引力的选择,可以减少“创新的窒息点”。此外,他补充说,开源功能可以帮助企业避免被锁定在供应商的技术中,这些技术可能会无意中隔离数据。
Sivasubramanian指出,即使是代理本身,当被委托召唤模型履行职责时,现在也可以在后台选择最佳模型,这样就不会花费过高。
最终,根据Ng的说法,开发满足客户和员工需求的AI工具的关键应该从了解想要什么开始。只有这样,开发人员才应该开始寻找合适的功能。
他称:“最大的挑战是识别和构建客户喜爱的产品,而不是成本。只要努力打造好产品。有时成本开始上升,看起来很可怕,但那时,你可以找到降低成本的工程方法。…成本通常下降得足够快,所以这是很好的问题。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
15种常见数据科学技术
那些没有充分投资于数据科学技术的企业将很快被竞争对手抛在后面。 数据科学家到底在做什么,以提供变革性的商业利益 […]
-
掌握这些技能以谋求合适的数据科学家职位
如果你具备数据科学所需的技术和软技能,在就业市场,你会是有吸引力的求职者。对于希望提高技能以谋求数据科学家职位 […]
-
在业务中使用模拟模型的最佳做法
模拟模型指导数百万美元的库存决策、影响患者护理的人员配置模式和管理养老基金的投资策略。然而,很多企业仍然将它们 […]
-
实时边缘分析用例
在业务场景中,几秒钟的时间都很重要。 在实时分析中,机器故障或买家犹豫等信息会带来宝贵的商业见解。大多数企业仍 […]