避开数据分析的那些坑 可视化数据分析必不可少

日期: 2017-11-16 作者:Ed Burns翻译:乔俊婧 来源:TechTarget中国 英文

可视化数据分析是任何高级分析项目中的重要的一步,而分析师和数据科学家们常常忽略了这一点。 分析师跳过可视化数据探索这一步可能会错过有价值的见解并深入了解他们正在使用的数据。 音乐流媒体公司Spotify的收入团队分析经理Tatiana Gabor说:“如果你的数据看上去有些不对劲,那可能是错误的。” 可视化数据发现工具一直备受分析采购商的青睐。

然而,该软件通常是作为一个终端来部署的,许多企业购买它作为业务用户的自我服务分析工具。然而,在有经验的数据科学家的手中,它可以带来更深入的见解。 在任何分析中,数据探索都是重要的第一步,但分析师往往只关注数字,如平均数,中位数和点差等汇总统计数据。他们并……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

可视化数据分析是任何高级分析项目中的重要的一步,而分析师和数据科学家们常常忽略了这一点。 分析师跳过可视化数据探索这一步可能会错过有价值的见解并深入了解他们正在使用的数据。 音乐流媒体公司Spotify的收入团队分析经理Tatiana Gabor说:“如果你的数据看上去有些不对劲,那可能是错误的。” 可视化数据发现工具一直备受分析采购商的青睐。然而,该软件通常是作为一个终端来部署的,许多企业购买它作为业务用户的自我服务分析工具。然而,在有经验的数据科学家的手中,它可以带来更深入的见解。 在任何分析中,数据探索都是重要的第一步,但分析师往往只关注数字,如平均数,中位数和点差等汇总统计数据。他们并不总是参与可视化数据的探索。 一些分析师还会对数据进行假设,然后通过回归或聚类模型运行数据来测试这些数据。但是,先跳过这些技术会让分析师忽略数据的重要特征。

三思而后行

Gabor在2017年拉斯维加斯Tableau Conference上的演讲中表示,她的分析团队通过视觉探索Spotify用户收集的可用活动数据来启动每个项目。该团队分析用户行为中的模式,了解人们如何应对Spotify平台中的变化,并开发新的方式来保持用户的参与。 在Spotify美国纽约总部工作的Gabor表示,可视化数据探索最重要的好处是可以评估数据的质量。她指出,根据分析师的专业知识,您可以立即看到可能不现实的异常值或数据点集群。分析师可以对这些问题进行跟踪,如果有必要的话,他们可以在开始正式分析之前对其进行纠正。 可视化方式还强调了数据集的重要方面。例如,它显示了数据是正态分布还是其他分布形式。它也可以阐明两个变量之间的相关性。当然,相关性并不等同于因果关系,但根据Gabor和其他会议发言人的说法,通过可视化探索数据来识别潜在趋势可能会帮助分析人员检查变量之间的关系,否则他们可能就不会考虑这种关系。

谨防错过洞察力

Spotify收入团队产品洞察总监Peter Gilks在演讲中表示,任何数据分析都必须来自假设或公司想要回答的一系列问题。分析师可能会先用R或Python编写查询,但是这种方法可能会导致错误的见解。Gilks警告说,可视化数据的探索使分析师能够从一开始就通过突出数据中的模式或趋势来更好地塑造他们的假设。 Gilks表示,Spotify尤其如此,因为数据科学家和分析师可以获得大量数据。该公司从其应用程序收集各种用户数据,包括点击流记录。公司拥有6000万付费用户和1.4亿活跃用户,这就产生了巨大的数据量。 但Gilks补充说,不仅仅像Spotify这样的公司可以从数据的前期可视化探索中受益。他说:“每个使用数据的人都可以并应该使用这些技术。 如果你不这样做,你可能得不到你想要的。”

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

乔俊婧
乔俊婧

关注商务智能及虚拟化领域技术发展,专注网站内容策划、组稿和编辑, 负责《数据价值》电子杂志的策划和撰稿。喜欢桌游,热爱音乐,吃货一枚。

相关推荐