微软公司周三推出Fabric,这是一个新的人工智能分析和数据管理平台,于5月首次推出预览版。
Fabric现已正式发布,这是一个SaaS平台,其中汇集了微软长期商业智能套件Power BI的功能;Data Factory;和 Azure Synapse Analytics。
在首次推出Fabric时,微软董事长兼首席执行官Satya Nadella称该产品组合是自1989年SQL Server以来该科技巨头最重要的新数据产品。
Ventana Research分析师David Menninger对此表示赞同。
他表示:“如果最大的是通过产品的广度和深度来衡量的,那么你必须同意这是自SQL Server以来微软最大的数据产品。”
在西雅图举行的用户大会 Ignite 上,微软宣布正式推出Fabric,该供应商在该大会上推出了数十种新的主要是 AI 支持的更新、功能和产品。
在广泛引入传统和基于生成式 AI 技术的功能之际,生成式 AI 技术在企业软件的所有领域都呈爆炸式增长。在过去的一年里,科技巨头和独立供应商迅速采取行动,开发基于人工智能的生成式系统,并将其推向市场。
除了向所有客户提供Fabric之外,微软还推出了Copilot in Fabric的预览版。自然语言处理(NLP)工具使用户能够使用对话语言查询其数据并生成代码。
除Fabric之外,微软还引入一系列其他新的和改进的分析和数据管理功能,包括新的数据库功能,例如Azure Cosmos DB MongoDB vCore中的矢量搜索。
新的Fabric
Microsoft Fabric 是一个用于数据集成、数据管理和分析的新环境,其中汇集了一组功能,使客户能够以多种方式对数据进行建模和分析。
该套件包括 Power BI,这是微软长期以来的传统 BI 平台,用户可以在其上开发和使用报表、仪表板以及 AI 和机器学习模型等数据产品。此外,Fabric 还包括 Azure Synapse Analytics,这是一种基于云的服务,用于数据集成、数据仓库和大数据分析。最后,Fabric 包括 Azure Data Factory,这是一种提取、转换和加载服务,使客户能够大规模集成和转换数据。
除了三个以前独立的平台外,Fabric 还包括一个名为 OneLake 的多云数据湖,该湖可自动连接到 Fabric 中的每个数据工作负载。OneLake 附带了 Azure Data Lake Storage Gen2 和 Amazon S3 等数据源的快捷方式。
据微软称,将以前不同的平台组合在一个环境中,旨在简化数据管理和分析。
同时,随着企业以越来越复杂的形式收集越来越多的数据,简单性尤为重要,所有这些数据都需要结合起来,为企业想要构建的生成式 AI 语言模型提供信息和训练,以改善决策。
微软公司通信副总裁Frank Shaw表示,因此,随着人工智能变得越来越普遍,BI超越数据可视化,转向模型训练和分析, Fabric的开发是为了满足组织的需求。
他在 11 月 10 日的虚拟新闻发布会上表示:“微软Fabric 通过将所有人聚集在一个专为 AI 时代构建的 AI 驱动的平台上,重塑了团队处理数据的方式。它创造了一种集成、简化的体验,将你的数据状态统一到企业级数据基础上。”
Fabric中包含的数据集成、管理和分析功能经常被很多企业拼凑在一起。他们可能会使用来自一个供应商的数据摄取和集成平台、来自另一个供应商的存储和管理工具,以及顶部的各种 BI 平台来进行实际分析和决策。
这种方法可帮助企业避免供应商锁定,使他们摆脱对所有数据管理和分析工具依赖一家供应商的束缚。
但是,供应商中立的方法既有财务成本(将不同供应商的工具放在一起通常比只从一家供应商那里购买更昂贵),而且复杂性也随之而来。企业本身必须将最初未开发为相互集成的工具连接起来,而不是购买旨在相互集成的工具。
因此,根据微软的说法,成本是Fabric的主要优势之一。
Fabric 的定价基于使用情况,两个单位的价格从每小时 36 美分或每月 262.80 美元起,价格从每小时 368.64 美元或每月 269,107.20 美元(2,048 个单位)不等。
与此同时,Menninger认为,简单性可能是Fabric的最大优势。
他表示:“大多数功能都不是新的,但它们都汇集到一个统一的平台中。用户应该发现在Fabric中将所有这些功能结合起来更容易,而不必将东西拼接在一起来创建自己的架构。”
Menninger 继续说道,除了成本和简单性之外,Fabric 中最重要的功能可能是 OneLake 和 S3 等数据源的快捷方式。
他表示:“通过实现跨应用程序的数据共享,这些功能将有助于减少冗余数据以及随之而来的所有麻烦,包括额外的数据管道、数据同步问题和数据治理挑战。”
Fabric和人工智能
虽然Fabric旨在为微软客户提供开发和管理现代数据产品(包括AI和机器学习模型)所需的工具,但该平台也受益于AI。
像很多微软功能一样,Fabric将获得专用的Copilot。
Copilots 由微软于 2021 年首次推出,它是 NLP 工具,可协助用户完成工作。这家科技巨头的第一个Copilot是为微软和软件开发平台GitHub的联合用户而开发。从那时起,微软发布了Office 365,Teams和很多其他工具的Copilots。
Fabric 中的 Copilot 现已推出公共预览版,使客户能够使用自然语言而不是代码广泛处理其数据。
近年来,很多数据管理和分析平台都具有 NLP 功能。但这些 NLP 功能是有限的。它们的训练是基于有限的词汇量,这意味着使用这些工具仍然需要数据素养培训,而且它们不能用于建模和深入分析。
自从人工智能供应商OpenAI发布ChatGPT以来,这种情况发生了变化,OpenAI是微软的合作伙伴,这家科技巨头已经投资了130亿美元。大型语言模型标志着生成式人工智能和法学硕士技术的重大改进。ChatGPT和其他LLM(包括Google Bard和微软的Azure OpenAI)拥有广泛的词汇表,可以实现自由形式的自然语言交互。
通过将这些 LLM 功能与他们自己的工具集成,数据管理和分析供应商现在能够开发 NLP 功能,让客户可以像在 Google 中进行搜索和提问一样提出数据问题。此外,他们无需编写代码即可开发流程和管道。
Copilots是微软支持自然语言交互的工具版本。
就Fabric而言,Copilot将使用户能够使用对话语言来生成代码,开发数据管道,并创建AI和机器学习模型以及其他数据产品。
与此同时,Menninger指出,在以前需要代码知识和数据素养培训的任务中使用自然语言,应该能使组织内更多的员工能够处理数据。
二十多年来,组织内的BI使用一直停滞在大约四分之一到三分之一的员工身上。会话语言可以改变这一点。
Menninger 称:“Copilot是微软将生成式AI封装到其产品中,生成式人工智能的真正直接价值是NLP。NLP简化数据和分析的很多方面,这也同时会使数据和分析在组织内更容易访问。”
Shaw表示,Copilot还将帮助数据专家提高效率。
生成式 AI 驱动的自然语言使组织内的更多人能够使用数据和分析,同时也可避免数据工程师和数据科学家花费大量时间去编写开发管道和创建模型所需的大量代码。
Shaw称:“借助 Microsoft Fabric 中的 Copilot,数据专业人员可以使用对话语言快速发现新的见解,并在这个 AI 新时代更好地快速竞争。”
自 ChatGPT 发布以来的一年里,除微软之外,很多数据管理和分析供应商都发布了 AI 助手和文本到代码的翻译功能。
例如,微软的竞争对手AWS和Google都在其数据管理和分析产品组合中添加了生成式AI功能,Informatica和Tableau等很多集中式数据管理和分析供应商也是如此。
更多新功能
虽然Fabric的全面发布可能是微软最重要的新数据产品,但这家科技巨头周三还透露了很多其他新功能和更新功能。
其中包括 Azure Cosmos DB MongoDB vCore 中的矢量搜索。
Azure Cosmos DB MongoDB vCore 是 微软与数据库专家 MongoDB 之间的集成,使共同客户能够开发数据应用程序。
与此同时,随着生成式人工智能的快速发展,矢量搜索是一项越来越重要的功能。向量是数据的标识符,它提供了数据结构,因此可以在其他数据的泥潭中搜索和找到数据,并随后用于为决策提供信息。
有些数据从一开始就是结构化的,例如财务记录和销售点交易。但文本、照片和视频文件等数据是非结构化的。
同时,生成式 AI 模型比其他模型类型需要更多的数据来确保高水平的准确性。这意味着组织通常需要将结构化数据与非结构化数据相结合,以便为这些生成式 AI 模型提供足够的数据。
因此,非结构化数据通常被分配一个向量(一种数字表示)以赋予其结构,然后使其能够被发现并用于为模型提供信息。
此外,构建矢量数据库是为了进行相似性搜索,以便其他方式无法发现的数据也可用于训练模型。
除了 Azure Cosmos DB MongoDB vCore 中的矢量搜索之外,新的和更新的数据管理和分析功能还包括:
- Amazon S3 快捷方式,使企业能够将其在 Amazon S3 中的数据与 Microsoft OneLake 中的数据统一起来,而无需复制数据。
- 使数据工程师能够将数据从外部 Azure Data Lake Storage Gen2 数据湖连接到 OneLake 的快捷方式。
- Azure SQL 更新可降低成本并提高可靠性和安全性。
- Microsoft 365和OneLake之间的集成。
- Azure Cosmos DB 中的新功能可降低成本,并提高开发人员的工作效率。
- 提高SQL Server的安全性。
- Azure Database中的性能增强功能。
- 针对Azure Database for PostgreSQL 的新 AI 功能和性能改进。
Menninger指出,很多新的和改进的功能,例如对亚马逊的S3快捷方式,表明微软承认客户使用来自多个供应商的工具。
展望未来,微软明智的做法是做更多的事情,通过将微软工具(尤其是Fabric)连接到其他供应商的工具,使用户能够开发数据生态系统。
Menninger 称:“虽然Fabric的大部分功能都是关于统一微软产品和服务,但微软可以通过进一步扩展Fabric来为客户提供更多帮助。让我们看看他们在拥抱第三方数据源方面会走多远。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
企业商业智能的10大好处
商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]
-
生成式AI会取代数据分析师吗
生成式AI不会取代数据分析师的工作。在很多领域,人工智能都无法取代人类,特别是那些需要人类同理心和洞察力的领域 […]
-
改进数据可视化的7项技能
数据可视化可以实现可操作的洞察力和卓越的业务成果。但构建有效的数据可视化可能很困难。如果你想创建数据可视化,你 […]
-
了解BI生命周期以构建有效的架构
成功的数据驱动运营遵循商业智能(BI)生命周期,定义BI能力,并部署良好理解的治理架构。 该过程的前提是,你必 […]