企业级基础云服务商青云QingCloud日前宣布,Spark服务作为QingCloud大数据基础平台的重要组件现已正式上线。通过QingCloud Spark服务,用户能够在2-3分钟内创建一个Spark集群,并支持横向和纵向的在线伸缩,提供丰富的监控告警服务,极大地简化了大数据集群的运维和管理,让用户从繁重的运维工作中解脱出来,投入到业务创新中。
青云QingCloud Spark服务正式上线
数据是新一代的自然资源,是判别企业竞争力的试金石。然而,随着数据量的爆炸式增长、数据来源和结构的多样化,传统IT基础架构已无法满足企业对数据处理的需求,Hadoop、Spark等支持PB级别数据的分布式存储和分布式计算框架应运而生。
青云QingCloud系统工程师&大数据基础平台负责人周小四(Ray Zhou)表示,基础架构是大数据应用的基石,如果没有底层数据架构的支持,大数据就是纸上谈兵。此次推出的Spark服务就是基于QingCloud稳定高效、资源秒级响应、弹性可伸缩的IaaS之上,能够最大限度地发挥Spark轻巧、灵活和快速的优势。
Spark是继Hadoop之后新一代的大数据分布式处理平台。它是一个基于内存的、容错型的分布式计算引擎。与Hadoop MapReduce相比,Spark的计算速度要快100倍。即便同样采用硬盘计算,Spark也比MapReduce快10倍。Spark卓越的用户体验以及统一的技术堆栈基本上解决了大数据领域所有核心问题,使得Spark迅速成为当前最为热门的大数据基础平台。
Spark 提供了多语言支持,如Scala、Python、Java、R等,支持交互式操作。它在RDD(Resilient Distributed Datasets,一个容错的、并行的数据结构)基础之上提供了Spark Streaming流式计算,结构化数据处理组件SparkSQL,机器学习库MLlib以及图计算GraphX等功能。
具体而言,青云QingCloud提供的Spark服务有如下特征:
- 一键部署:QingCloud用户只需简单的配置,就能够在2-3分钟内搭建出一个Spark集群,并且通过丰富的工具和服务,实现高效简便的Spark运维管理。QingCloud提供多样化、组件化的服务模式,用户可以根据自己的业务需求,组建个性化的解决方案。
- 在线伸缩:Spark服务支持横向和纵向在线伸缩,以满足用户对计算能力和容量的需求,横向伸缩对用户业务的连续性不会产生任何影响。后续还会配合AutoScaling,达到Spark集群自动伸缩的效果。
- 迁移成本低:QingCloud Spark服务采用原生开源解决方案,并且采用最新的版本(目前为1.4.1版本,未来还会持续更新,并保留三个最新版本),具有良好的向下兼容特性,便于用户将自有Spark集群迁移至云端,也不限制用户从Spark服务迁移至自有集群。使用QingCloud的Spark服务,用户完全不必担心产生Vendor lock-in的束缚。
- 监控告警:QingCloud提供了对每个节点资源的监控告警服务,包括CPU使用率、内存使用率、硬盘使用率、硬盘IOPS、硬盘吞吐量等,以帮助用户更好的管理和维护Spark集群。
- 安全性:Spark集群运行于私有网络内,结合QingCloud提供的高性能存储和超高性能存储,在保障高性能的同时兼顾用户的数据安全。
青云QingCloud CEO黄允松(Richard Huang)表示,Spark服务的发布标志着QingCloud完整的大数据基础平台已初步建立,接下来QingCloud还会陆续发布一系列大数据相关服务,如Hadoop、Cassandra、Hive、HBase和Storm等。未来,大数据、数据库、缓存和对象存储将同IaaS组件一起构成QingCloud完整的数据产品生态圈,提供一站式的计算、存储和数据处理服务,更好地帮助用户实现数据的价值。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
Databricks通过自动配置选项来简化Spark计算
Databricks为其管理的Spark平台带来了新功能,以及开源Spark,希望能够使计算引擎更广泛地使用。
-
Spark在基因组数据分析应用中大有可为
科学研究人员需要强大的大数据架构来应对挖掘和分析基因组数据的挑战,有人说Apache Spark引擎非常适合这项工作。
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
Dr. Elephant:Hadoop和Spark的优化“神器”
美国加州软件公司Pepperdata的应用程序分析软件建立在Dr. Elephant开源项目上。主要目的是让更多的Hadoop和Spark应用程序投入生产。