在过去的12个月里,影响数据管理和分析的顶级趋势是生成式AI代理的兴起。
另一个趋势是数据平台(包括数据库、数据仓库、数据湖和数据湖屋)继续转型作为AI开发环境。还有一些趋势是越来越强调数据质量和AI治理日益重要。
数据目录供应商Alation产品管理副总裁Diby Malakar说:“每次与客户交谈时,他们都说他们正在用GenAI做更多事情,或者至少在考虑它。他们谈论的前几件事是如何管理这些资产——AI模型中的资产、功能存储以及任何可以输入AI的内容或机器学习生命周期。”
但这些只是影响2024年数据管理和分析的部分趋势。主要还是受到2022年底开始的对AI发展兴趣激增的影响,当时OpenAI推出ChatGPT标志着生成式AI技术的显著改善。
当与企业的专有数据相结合时,生成式AI模型可以使员工更有知识和效率。因此,企业自然而然地在AI开发方面投入大量资金。数据管理和分析供应商已经做出回应,认识到市场对简化数据使用来训练模型和应用程序的工具的需求。
这些需求形成趋势。以下是过去一年出现的6项最重要的事情:
代理AI的出现
在2024年开始时,供应商们最终交付了他们在2023年推出的生成式AI助理,但随着一年的发展,这些助手正在变得过时。
这些AI助手支持自然语言互动。但是它们是被动的。它们要求用户通过提问来参与自然语言界面。有些助手足够成熟,可以提出后续问题,导致更深入的分析,而另一些助手至少允许用户提出后续问题,而不会丢失线程。
在整个2024年下半年,代理AI迅速崛起。
代理AI工具是主动的,而不是被动的。与之前的助手不同,它们可以自主行动。
ISG Ventana Research的分析师David Menninger在9月表示:“市场正在转向代理AI和代理分析。构建代理而不是依赖仪表板,这代表企业如何利用数据的范式转变。代理可以根据数据启动操作,而不是数据出现在仪表板中,数据解释留给人员查看。”
同样,谷歌云数据、分析和AI战略主管Yasmeen Ahmad表示,开发AI代理是企业AI演变的下一阶段。
谷歌云是目前开发AI代理并为客户提供工具的公司之一。Looker是这家科技巨头的主要分析平台,正在对生成AI采取代理方法。
Databricks、Qlik、Salesforce、Snowflake和ThoughtSpot等供应商也是如此。
例如,ThoughtSpot在11月推出了Spotter,这是一个生成式AI代理,可以理解上下文并不断学习,以更好地了解企业的运营。Salesforce的子公司Tableau于9月推出了Tableau Einstein,这是其以代理AI为核心的BI平台的全新版本。Databricks在6月推出了Mosaic AI代理框架,以实现代理AI的开发。
Ahmad在8月表示:“对于数据代理,不是人类拿来数据并要求提供见解或提高数据质量,而是代理在监控数据,寻找异常,提出见解,建议语义建模指标进行监控。我们正在从一个被动的世界转向一个生成式AI积极主动地支持数据分析生命周期的世界。”
不断发展的数据平台
不久前,数据管理和分析的主要目的是使客户能够准备和分析数据。
Databricks和Snowflake等数据管理供应商提供了基于云的平台来存储数据,使客户能够轻松访问其数据进行分析。然后,MicroStrategy和Qlik等供应商提供了创建和查看报告和仪表板的平台,从而得出见解和决策。
现在,它们都正在成为AI平台。
自OpenAI推出ChatGPT以来,很多数据管理和分析供应商的主要重点一直是开发环境,使客户能够构建生成的AI驱动模型和应用程序。
Menninger在11月表示,所有数据平台供应商都在提供AI/ML功能方面进行大量投资。
例如,Databricks在2023年以13亿美元收购MosaicML,为AI开发奠定基础。在过去的两年里,他们还开发与Mistral AI和Anthropic等大型语言模型(LLM)开发人员的集成,构建了自己的LLM,并公布了模型质量和AI治理能力。
同样,宿敌Snowflake开发了与LLM提供商的集成,构建了自己的LLM,并使用Cortex AI为客户创建环境以创建AI工具。Cortex AI包括AI可观察性和容器化存储等功能,以安全地管理AI模型。
此外,科技巨头AWS、谷歌云和微软,以及从Accenture到Zoho的专家也将AI开发作为其产品开发的焦点。
然而,SnowflakeAI主管Baris Gultekin表示,随着对AI开发的兴趣激增,过去两年只是数据管理和分析新时代的开始。
他在3月份说:“说到AI,我想说每个人都处于旅程的开始,而我们进展得非常快。总的来说,发展速度,发展步伐,都令人难以置信。”
AI照进现实
在ChatGPT首次发布约三个月后,数据管理和分析供应商的第一个生成式AI开始推出。
Pyramid Analytics、ThoughtSpot和Sisense等供应商公布了与LLM供应商的整合。通过集成,他们计划开发AI驱动的助手,使客户能够使用自然语言来处理他们的数据,而不是代码。
很多其他供应商也开始效仿。他们承诺各种工具,这些工具将使几乎任何员工都能获得决策智能能力,并承担繁重的编码和文档任务,以提高专家的效率。
然而,大多数在首次推出时甚至还没有预览版。在整个2023年,我们看到很多承诺,但这些承诺很少实际兑现。
IDC分析师Stewart Bond在4月表示:“在过去的一年里,我们看到数据智能软件中出现了很多生成式AI的应用,但主要是在研发实验室和演示中,这些应用可能或可能没有涉及假象。”
2023年底,当MicroStrategy等供应商开始全面提供生成式AI驱动功能时,这种变化开始发生变化。在整个2024年,很多其他供应商也效仿,生成式AI的承诺开始实现。
Informatica和Dremio等数据管理专家推出了AI助手,Tableau和Qlik等分析专家也推出AI助手。
此外,数据平台供应商(Databricks和Snowflake)以及科技巨头都全面提供生成式AI驱动的功能,以及旨在帮助客户开发自己的生成式AI应用程序的功能。
一家企业成功利用2024年推出的AI开发功能,这就是PowerSchool。该教育技术供应商的平台被美国和国外的17,000个学区使用。
该公司使用Snowflake和微软的技术,开发了PowerBuddy,这是一个AI驱动的生成助手,允许用户使用自然语言与数据进行交互。
PowerSchool首席产品和创新官Shivani Stumpf在11月表示:“任何用户都可以提出自然语言问题。这里概念是,教育领域的每个人,无论你是家长、学生、管理员、辅导员、校长,都可以快速获取与他们相关的信息。”
对数据质量的需求
随着AI发展的激增,对于AI助理、代理和对企业有价值的其他应用程序,用于培训和丰富应用程序的数据需要高质量。
因此,数据质量变得越来越重要。
AI模型和应用程序由数据训练。这就是赋予它们智慧的原因。因此,模型和应用程序只与提供它们的数据一样好。
如果数据不准确、不一致、不完整或过时,模型和应用程序提供的输出将反映这一点,并且不值得信任。后果可能包括,由于输出不可信AI应用程序被弃用,到财务损失、违反监管和重大失误。
然而,如果数据质量高,如果数据完整、一致、准确和及时,模型和应用程序输出将更有可能正确和值得信赖。这里的好处包括广泛使用数据来为决策提供信息,这已被证明可以刺激增长,以及提高效率,这也有助于提高企业利润。
MicroStrategy首席产品官Saurabh Abhyankar在9月表示:“数据质量真的非常重要,我们正在从手工创建仪表板和报告的世界转到希望利用AI进行大规模分析的世界。要做到这一点,必须确保数据质量。”
然而,长期以来,确保数据质量一直是企业面临的挑战。企业现在收集的数据量呈指数级增长,加上数据日益复杂,使其更具挑战性。
TreeHive Strategy公司创始人兼负责人Donald Farmer表示,为了尽可能确保仅使用高质量的数据来训练AI工具,需要有人类监督自动化流程(例如矢量搜索、检索–增强生成和数据可观察性),他们在必要时可以进行干预。
他在9月表示:“数据质量强调可自动化的流程,识别需要比以前更少专业知识的数据清理流程。这就是正在改变的地方。我们正试图在更大的规模上做事,而在这种规模人类无法实现。这个过程是否可以被审计非常重要。”
AI治理的出现
尽管对数据质量的高度重视有助于确保AI模型和应用程序提供正确的输出,但企业仍然需要确保他们正确地使用AI工具。
就像不良数据会导致企业受影响,AI模型和应用程序的不当使用也是如此。
几十年来,数据被保存在本地数据库中,并由企业的IT部门监督,分析师必须提交申请来开发报告和仪表板。由于对数据的访问有限,不需要数据治理。
然后是自助服务分析的时代,Tableau和Qlik等供应商提供平台,使非专家能够访问和分析数据。当访问数据不再仅限于训练有素的专家,企业就需要数据治理框架,使业务用户能够自信地处理数据,并限制他们使用数据,以保护企业免受意外伤害。
现在,AI正在发生同样的演变。
长期以来,机器学习、预测分析和其他形式的传统AI一直是数据科学团队的领域。生成式AI改变了这一点,使AI能够更广泛地用于决策。现在几乎任何员工都可以对企业的数据提出问题。
BARC U.S.的分析师Kevin Petrie表示,如果不遵守适当的做法和政策,不当使用AI工具可能会产生与训练不力的模型和应用程序相同的后果,包括准确性差、有偏见的输出、不遵守法规和财务损失。
他在9月表示:“如果这些风险没有得到适当的控制和减轻,你最终可能会受到监管处罚或成本损失–与合规、愤怒或疏远客户相关,你最终可能会遇到瓶颈的运营流程,因为AI的预期效率效益将无法实现。”
Petrie继续说,随着人们对AI开发的兴趣激增,很多企业尚未开发AI治理框架。然而,很多数据管理供应商(例如Alation和Collibra)现在正在添加AI治理工具,使客户能够更好地确保AI的正确使用。
Constellation Research公司分析师Doug Henschen在10月表示,作为一项数据驱动的活动,AI的发展必须像我们管理数据一样严格地管理,因此它是数据治理计划的自然延伸。“企业需要帮助来应对这些挑战,所以很高兴看到……供应商添加功能来解决AI特定风险和新出现的监管要求。”
资金回流
投资者曾经喜欢数据管理和分析供应商。
在整个2010年代,随着分析成为一种更受欢迎的决策手段,金融家们看到了机会。2020年,当新冠肺炎疫情爆发时,实时分析变得至关重要,这一情况有所增加,数据为企业提供了决策的情报,使他们能够在不断的变化中生存下去。
2020年9月,Snowflake成为美国软件公司历史上规模最大的首次公开募股。随后,仅在2021年,10家数据管理或分析供应商就执行了1亿美元或以上的融资,包括Databricks,当年2月筹集了10亿美元,Confluent筹集了8.28亿美元。
此类供应商在2022年初继续吸引资本,Sigma Computing和Pyramid Analytics的融资回合超过1亿美元。
但随后,一系列事件的发生,包括俄罗斯入侵乌克兰、反复的供应链问题、利率上升和对经济衰退的担忧加剧,导致了经济的不确定性。
随着整个股市的下跌,科技股大幅下跌。裁员增加。风险资本资金枯竭。
只有Databricks和其他少数数据管理和分析供应商能够在2022年下半年和2023年全年筹集资金。
2024年,虽然资金不像几年前那样涌入数据领域,但我们仍然看到Cribl、Aerospike和Sigma各筹集了1亿美元以上,Ocient和Coalesce等其他公司吸引了约5000万美元。
ISG Ventana Research公司分析师Matt Aslett在4月表示,鉴于整体经济环境,近年来筹集风险资本有些困难。“但资金仍然可用……用于具有有吸引力、差异化价值主张的分析和数据软件提供商。”
在某种程度上,这里的价值主张是AI。
AI供应商本身正在筹集大量资金。例如,OpenAI在2024年筹集了超过100亿美元,而开发生成式AI模型的Claude系列的Anthropic今年筹集了约70亿美元。
Informa TechTarget企业战略小组分析师Stephen Catanzano表示,吸引投资者的是,提供可用于开发AI模型和应用程序的工具的数据管理和分析供应商。
他在4月表示:“那些吸引资金的供应商都在增加AI支持能力,以追逐AI工作负载市场。我认为供应商看到大规模的AI市场预测,他们很容易表明他们可以分得一杯羹,但他们需要更多的钱,并且吸引注意力。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
培养数据素养技能以提升职业发展
数据知情决策的成功取决于决策者能否有效查找、评估和解释数据:换句话说,取决于他们的数据素养。 有些决策是数据驱 […]
-
企业商业智能用例的9个示例
商业智能应用程序可以为企业内各个部门提供价值,使BI成为最广泛使用的技术驱动流程之一。 BI可用于分析数据,并 […]
-
如何通过7个步骤部署商业智能项目
商业智能是数据驱动企业的重要组成部分。在竞争激烈的商业环境中,企业成功部署BI项目的能力可能决定着在市场上的输 […]
-
企业商业智能的10大好处
商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]