担忧非结构化数据存储问题?并非只有你如此

日期: 2019-09-29 作者:Erin Sullivan翻译:邹铮 来源:TechTarget中国

存储非结构化数据是存储面临的主要挑战之一。当你知道很多现代化技术进步在创建海量数据,而你必须管理、存储和分析这些数据时,你很难去欣赏这些技术。

然而,并非没有办法处理非结构化数据,并且,供应商正逐渐开始满足企业需求,以处理大量笨重的数据。存储技术也在不断发展,通过部署正确的存储系统和做法,你完全可以有效地处理非结构化数据。

下面我们将解答有关存储非结构化数据的五个常见问题。从应对非结构化数据带来的挑战到最适合存储这些数据的系统,我们希望可缓解你对非结构化数据的恐惧,并帮助你的组织充分利用非结构化数据。

什么是非结构化数据?

顾名思义,非结构化数据不遵循传统结构,例如在金融系统和业务应用程序中的数据。结构化数据则有固定格式,但非结构化数据则更为自由。非结构化数据的示例包括图像、文本文件、传感器数据和电子邮件。

这些文件的非结构化性质具有其优势,例如分析团队可以直接使用数据,而不必先对其进行标准化,以实现更全面的分析。机器学习和人工智能的进步使得对非结构化数据的标记和分类变得更加容易,从而使信息更易于访问和分类。

存储非结构化数据面临的最大问题是什么?

“令人畏惧”可以用来描述当前的非结构化数据量。在现在生成的数据中,大部分都是非结构化数据,并且数量非常多。非结构化数据存储的三个最大障碍是数量、类型和价值。

由于非结构化数据是由音频、视频、图片甚至社交媒体数据之类的文件组成,因此很容易理解为什么数量是一个挑战。幸运的是,在存储非结构化数据方面,现在有很多供应商可以提供帮助,包括Dell EMC、Pure Storage、Scality、Igneous Systems和Red Hat。另外,面对大量的数据类型,如果处理不当,也可能导致重大的安全问题。由于存储如此多的数据,企业可能不会考虑数据类型-包括个人识别信息、信用卡号和社会保险号。

同时,在处理大量数据时,数据的价值可能会丢失。在非结构化数据中,其价值需要被发现,但是利用这些信息困难。Cohesity和NetApp等供应商提供的产品可以帮助你有效地对数据进行分类,并关注其中的内容。

什么系统最适合存储非结构化数据?

对于非结构化数据存储,NAS和对象存储都有其优势。NAS是一种传统且可靠的存储系统,并且,其分层和规范格式可对文件进行分类并易于搜索。NAS很快速、用户友好且得到广泛支持。但是,NAS缺乏可扩展性,至少在与对象存储相比时是这样。

对象存储系统不是采用固定格式,而是使用元数据来描述数据并按属性(例如名称、创建日期和位置)对其进行排序。对象存储具有高度可扩展性,从而使增加容量变得容易。不过,性能是对象存储系统的潜在问题。尽管对象存储似乎具有优势,但这两种存储系统都有优缺点。

闪存呢?

如果你想增强存储系统,投资于闪存可能很有价值,可帮助你处理非结构化数据。现在闪存成本持续下降,这使得企业开始迅速替换硬盘,转而使用闪存来存储更多工作​​负载。由于对象存储在性能方面举步维艰,因此使用混合或全闪存可显著加快处理速度。

随着性能的提高,基于闪存的SSD消耗的能源更少,占用的空间也更少。但是,尽管价格下降,闪存仍然是一种昂贵的选项。在考虑通过闪存存储非结构化数据前,请评估你的企业并确保这是明智的投资。

存储分层是否有用?

存储分层并不是什么新鲜事物,不过,随着非结构化数据的兴起,企业对正确分层的需求越来越多。通过自动存储分层,你可以为非结构化数据分配类别,对其进行整理,以便经常访问的数据随时可用,而次要的(但仍必要)数据则暂放一边。由于非结构化数据种类繁多,以这种方式进行优先级排序可以提高性能并降低管理存储成本。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Erin Sullivan
Erin Sullivan

Erin于2014年8月加入存储网站,担任网站助理编辑。她以前是TechTarget的编辑活动团队的成员,花了一年时间与专家、演讲者一起工作,并协助研讨会、晚宴和会议活动的运营。 Erin毕业于Assumption College学院,获得了文学和大众传播学士学位。

翻译

邹铮
邹铮

相关推荐

  • 企业商业智能的10大好处

    商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]

  • 生成式AI会取代数据分析师吗

    生成式AI不会取代数据分析师的工作。在很多领域,人工智能都无法取代人类,特别是那些需要人类同理心和洞察力的领域 […]

  • 改进数据可视化的7项技能

    数据可视化可以实现可操作的洞察力和卓越的业务成果。但构建有效的数据可视化可能很困难。如果你想创建数据可视化,你 […]

  • 了解BI生命周期以构建有效的架构

    成功的数据驱动运营遵循商业智能(BI)生命周期,定义BI能力,并部署良好理解的治理架构。 该过程的前提是,你必 […]