数据即产品:提供分析使用率的方法

日期: 2024-02-18 作者:Eric Avidon翻译:邹铮 来源:TechTarget中国 英文

企业正在寻求新方法以让更多员工开始使用分析工具,其中数据即产品的方法开始快速兴起。

研究表明,企业内使用数据的员工比例已经停滞了大约二十年,徘徊在潜在用户的四分之一左右。

分析工具很复杂,通常需要代码来查询和分析数据,并且至少需要大量的数据素养培训。为此,近年来,供应商开发了自然语言处理 (NLP) 功能和低代码/无代码功能,以降低编码要求。

尽管如此,鉴于这些 NLP 和低代码/无代码工具的局限性,分析的部署率仍然没有改变。

与此同时,大多数企业都希望提高分析的采用率。2月1日,数据集成供应商Denodo的产品营销总监Kevin Bohan在TDWI的虚拟峰会上表示,企业希望成为数据驱动。该峰会由该数据和人工智能教育和研究公司主办。

然而,Bohan指出,NewVantage Partners对100多家财富500强公司的高管进行的一项调查显示,只有24%的人认为自己是数据驱动。甚至更少(21%)的人自我报告说在他们的组织内建立了一种数据文化。

Bohan说:“企业要成为数据驱动型,需要投入大量的精力和努力,但大多数企业都认为迄今为止他们还没有取得成功。”

随着过去一年生成式人工智能大型语言模型(LLM)的兴起,技术最终可能会发展到一个地步,它可以使分析的使用更简单,从而帮助企业扩大对数据的使用,为决策提供信息。

LLM 的词汇量比分析供应商开发的 NLP 工具要广泛得多。此外,LLM 经过培训以理解意图。两者结合在一起,使真正的对话交互成为可能,大大减少了编写代码来处理数据的需要。

此外,嵌入式分析以可消费的形式向员工提供数据,而不是强迫他们学习如何使用 BI 平台,作为使分析更易使用的一种手段,嵌入式分析继续受到欢迎。

但是,要最大限度地利用分析,需要的不仅仅是技术。

观念转变也是必要的。数据以及仪表板、报表和模型等数据资产需要区别对待。数据应该很容易找到,并且需要向数据的潜在消费者展示为什么数据有用。

数据需要被视为一种产品,而不仅仅是信息。反过来,技术需要培养这种观念。

数据即产品

数据资产(例如模型、报表、仪表板和其他数据应用程序)通常称为数据产品。但是,将它们称为数据产品并不等同于将数据视为产品。

与数据本身一样,数据资产通常在组织内部是隔离的。不同的部门通常使用不同的工具进行数据操作,从数据摄取到管理和分析。这些数据系统彼此脱节。

例如,财务部门收集的数据与营销部门收集的数据是隔离的。同样,为财务部门开发以告知其决策的模型、报告、仪表板和其他数据资产与为营销部门开发的数据资产(用于为其决策提供信息)是隔离的。

即使没有隔离,数据资产也经常由集中式数据团队严格控制,或者被转储到一些访问受限或搜索参数效率低下的存储库中,这使得它们难以被发现。

因此,数据复制是多人委托或创建类似数据资产的必然结果。同样,这里还缺乏数据沿袭,数据沿袭使潜在用户能够了解数据的来源以及自摄取以来数据如何被使用。

这两者都可能导致数据质量问题。

Bohan说:“提供给数据消费者的内容与这些数据消费者需要的东西之间存在脱节。用户被期望处理数据中的复杂程度,而这些数据不足以满足他们正在做的事情。最终,这会给整个企业带来问题。”

数据即产品是一种思维方式,它通过寻求使数据资产易于数据使用者发现和操作来解决这种脱节问题。它像零售商对待销售产品一样对待资产,使它们对潜在客户有吸引力,并且易于找到。

Bohan说:“我们可以让用户更容易使用。如果我们能够降低有效利用数据所需的技能水平,那就是通往胜利的最快途径。我们没有以消费者可以轻松利用的方式提供数据。”

他继续说,单独显示数据资产的内容并不等同于将其视为产品。

这就是杂货店对其产品采取的做法,将橙子堆叠在一起,没有关于每个橙子的信息(它在哪里种植,何时采摘,运输多长时间以及使用什么化学物质来保持新鲜),只有价格。

相反,将数据视为一种产品,更类似于药物包装和展示在药房货架上的方式,使消费者能够就购买哪种药物做出明智的决定。除品牌名称和价格外,包装上还包含药物的预期用途、成分、潜在副作用和有效期等信息。

Bohan认为,企业应该将同样的产品管理思维应用于数据。

企业需要考虑如何使用数据资产,以及如何打包和存储资产,以便任何想要使用它们的人都能发现它们。

Bohan说:“企业越是考虑重用,他们就越能从他们创建的每个数据产品中获得更好的价值。你不想创建只能用于一个用例的数据产品,仅此而已。那只是创建一个特定的报告。其价值来自重用,并使其适用于企业内越来越多的用户。”

技术

Bohan认为,虽然将数据视为产品涉及观念转变,但技术需要帮助实现这种转变。

但是,企业需要战略性地选择和部署他们使用的技术。技术应帮助用户了解数据资产的可用性、用于通知资产的数据的结构以及用户如何使用资产。

Bohan 称:“我们需要做的是提供一种创造信任的体验。”

提供这种体验的部分涉及借鉴电子商务供应商在过去二十年中制定的策略,例如使用有助于提供个性化推荐的工具。此外,这些工具应该能够为用户提供查找其组织最受欢迎的数据资产的快捷方式,促进分析和决策过程中的协作,包括反馈环以确保数据质量和提高数据信任度,并在具有相关性时实时交付数据资产。

数据目录是一种工具,可以使数据资产易于查找、鼓励协作、增强信心,并对其进行编程以提供建议。数据目录是创建组织数据和数据产品清单的应用程序,使原始数据、报告、仪表板、模型和其他资产易于查找和操作。

此外,目录使管理员能够使用访问层来管理数据和数据资产。这些层安全地限制某些员工访问敏感信息,以确保数据的正确使用。它们还为监督者提供工具以建立推荐系统,这样数据使用者就不必主动搜索可能与其工作相关的信息。

Bohan 称:“仅仅以数据库中的格式提供数据,并使用数据库中的命名是不够的。它应该以对业务友好的方式提供,以便用户能够以他们习惯使用的语言访问他们能够理解的数据。”

他补充说,除了使搜索和发现数据变得容易之外,数据目录还可降低与数据重复相关的风险,因为它们使任何拥有适当访问凭据的人都可以访问数据。

在数据管理供应商中,Alation 和 Collibra 是数据目录专家,而 AWS 和谷歌等大型数据平台供应商则提供数据目录以及很多其他产品。

除了数据目录之外,数据管理的联合方法是将数据视为产品的原则。

从历史上看,数据由集中式数据团队监督,这些团队限制访问,并根据要求解析数据。然而,随着数据量和复杂性的增长,集中式数据管理方法被证明是无效的。瓶颈已经形成,提交报告或仪表板请求与开发和交付报告或仪表板之间的滞后时间使实时决策变得不可能。

对此,供应商已经开发了分散的数据管理方法,包括数据网格和数据结构。这种方法分配数据所有权,将其从集中式团队中移除,并将其联合到领域和部门,其中,领域专业知识和在决策中具有实际利害关系有助于改变用户查看数据的方式。

同时,为了避免数据隔离,坚持这种方法的组织使用数据目录等工具来连接组织的域并将其数据整合。

Bohan称:“创建数据产品通常是一项与信息联合相关的工作。让不同的所有者拥有数据,他们比集中式团队更了解数据,这一点很重要。”

专门从事数据网格的供应商包括 Starburst和Informatica,而Denodo和Cloudera则专注于Data Fabric。

结果

虽然将数据视为产品可能代表一种观念转变,但这种方法已经取得了切实的成果。

据McKinsey & Company公司称,数据即产品方法可以将数据运营成本(包括技术、开发和维护)降低 30%,同时将新业务用例的速度提高多达 90%。

此外,考虑到这种方法所需的工具,数据治理负担和滥用风险都会下降。

然而,根据Bohan的说法,无形的结果可能更为重要。

简化数据访问和更广泛地使用数据并不容易量化。但是,这可带来企业内广泛的自助式商业智能,在充满挑战的经济环境中,这可提供企业采取行动和做出反应所需的敏捷决策。

从2020年COVID-19疫情开始的全球事件,包括乌克兰战争、反复的供应链中断、通胀上升和对经济衰退的担忧,共同造成了商业世界的持续不确定性。

企业需要实时决策来应对这种动荡。只有当企业将数据作为核心资产时,企业才能做出明智的实时决策。

Bohan称:“在我看来,真正的价值是让用户更容易了解数据的用途,并将其用于他们的工作。当他们能够做到这一点时,那就是你开始建立数据文化的时候。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

邹铮
邹铮

相关推荐