随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。 举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。
曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。
举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。
曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位于华盛顿的机构,成为了一名独立IT咨询顾问。
在接受采访时她还在APA,Jamison说,过去这几年,JSON帮助专业协会为大约八万会员在网络上更快速地传递信息。
Jamison负责管理学术出版系统的改进,该系统目前管理16万期刊文章和三百万摘要信息,包括一些参考文献可以追溯到100多年前。她说:“我们学术文章的外部引用信息往往用JSON格式表示。”
不同数据格式引发的碰撞
JSON格式支持开发者保持相当程度的设计独立,对数据的描述非常简单,前期结构约束限定做到了最小化。JSON走向了前沿,成为XML的替代品。尽管如此,一些学术文档还是从XML的标记功能中受益,因为XML更加结构化,文档元素数据定义更严格。正因为如此,XML很自然地成为APA需要的交互机制。
此外,在APA环境中这两种数据格式并不是相互排斥的。某些情况下,JSON用于传输嵌套的XML载荷。用Jamison的话说,就是:“对另一端的要求不是那么苛刻,假定他们仍然在使用XML文档。”
Jamison和她的团队开发的API支持出版系统以JSON或者XML两种格式发起请求,根据特殊需要使用即可。
她说:“我们最喜欢内容系统中的XML和JavaScript,简直是两全其美。内容只作为结构存在一次,但它可以表现为XML或者Java。”
软件供应商MarkLogic公司设计的同名数据库(MarkLogic数据库)充当APA出版系统的开发和运行平台。2008年开始就在用了,那时候协会正把早期的数据
MarkLogic公司的软件最早是在十多年前开发的,定位是管理XML文档的数据库。但是,为了满足新数据架构的需求,MarkLogic已添加的功能超出了XML支持,现在归类为NoSQL数据库。在2014年该公司发布的MarkLogic 8支持原生JSON功能。
Joe Pasqua是MarkLogic公司产品战略副总裁,他说JSON和XML这两种格式在程序员中应用都很广,只是用于不同的场合。JSON经常用于Web API,擅长表示编程对象;在他看来,JSON并不像XML那样可以更好地展示标记文档。
用于语义的数据三元组
2015年八月,MarkLogic公司在发布的第8版产品中增强了对语义数据的处理。这样一来,现在该数据库可以与Apache Jena和Eclipse Sesame语义API协作了。Jena和Sesame都是为帮助开发人员使用资源描述框架(RDF)而设计的,这种框架是图形风格的数据结构,采用三元组的存储格式,更好地表达不同数据元素之间的关系。
三元组描述数据关系使用主语、谓词和宾语的结构。有很多独立的RDF数据库,图形数据库技术的变体专为存储三元组开发出来。但是MarkLogic公司在数据库产品中提供了对三元组存储的原生支持。该技术加上SPARQL语义查询语言技术,都很好地支持了APA团队使用MarkLogic的软件环境创建和管理数据图。
Jamison说:“APA的元数据研究其实就是对关系的研究。三元组存储大体是捕
展望未来,APA可能会继续利用各种各样的数据格式,包括JSON格式、XML、RDF以及其它格式。Jamison说,对于整个APA来说,“最重要的事是建立高度模块化的数据流管道。”
翻译
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
采矿设备制造商利用BI on Hadoop来挖掘数据
如果大数据要取得巨大成功,则需要提供给更多的最终用户群组。但广泛使用的商业智能工具尚不能轻松分析最大的大数据, […]
-
新Qlik Sense功能可用于云计算、AI和大数据
一年前,Qlik公司公布其长期计划,即将高级云计算、AI和大数据功能添加到其自助式BI和数据可视化软件中。现在 […]
-
Cambridge Analytica秘密收集Facebook数据表明对道德数据挖掘的需求
当有关Cambridge Analytica公司秘密收集Facebook数据的消息传出时,这暴露了一个薄弱环节 […]