关于深度学习必须了解的3件事情

日期: 2017-09-18 作者:David Mueller 来源:TechTarget中国 英文

大堡礁位于澳大利亚东北海岸,是世界著名的水下风景区,是潜水专业人士和潜水爱好者的乐园。在50公里外的昆士兰北部海岸,我这个数据科学家正在度过为期两周的暑假,站在所租船只湿漉漉的尾部,穿着过于紧身的潜水衣,准备跨入深水区第一步。 潜水眼镜,没问题,氧气也没问题。配重腰带收紧,背心充气,没有鲨鱼在视线里,出发! 探索深海 事实证明,潜水对于爱好数据的专业人士来说是一项完美的运动,因为数据收集是潜水程序的重要组成部分。

慢慢地沉入海洋深处,你可以想象自己第一次沉入一个未经勘探的数据湖。在成千上万的生物中寻找最大的鱼或最鲜艳的珊瑚,这就像在大规模的数据集中寻找隐藏的洞察。 但深度不仅仅与深海潜水有关。作……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

大堡礁位于澳大利亚东北海岸,是世界著名的水下风景区,是潜水专业人士和潜水爱好者的乐园。在50公里外的昆士兰北部海岸,我这个数据科学家正在度过为期两周的暑假,站在所租船只湿漉漉的尾部,穿着过于紧身的潜水衣,准备跨入深水区第一步。 潜水眼镜,没问题,氧气也没问题。配重腰带收紧,背心充气,没有鲨鱼在视线里,出发!

探索深海

事实证明,潜水对于爱好数据的专业人士来说是一项完美的运动,因为数据收集是潜水程序的重要组成部分。慢慢地沉入海洋深处,你可以想象自己第一次沉入一个未经勘探的数据湖。在成千上万的生物中寻找最大的鱼或最鲜艳的珊瑚,这就像在大规模的数据集中寻找隐藏的洞察。 但深度不仅仅与深海潜水有关。作为一个概念,它对于数据分析和机器智能越来越重要的。人工神经网络,相互连接的处理元件的计算模型——人工神经元——松散地受到人脑的启发,并且已经存在了几十年。这些网络,历史上由一个或两个隐藏的神经元层组成,从浅层结构发展到深层结构——又叫做深度学习。这种转变是由大规模建造大型和并行模型成本的下降,以及需要训练深度模型的大数据和多维数据集的可用性的增加来支持的。
  1. 深度学习机器学习的分支
深度学习是机器学习的一个分支。但是,标准的机器学习通常需要耗时从数据(或特征工程)中提取模型输入,深度学习模型擅长自动捕捉隐藏在大量数据集中的复杂结构模式。这种能力使得在图像、视频、音频和文本数据方面的一系列分析任务获得最新进展——但这些数据的手动提取很快达到了极限。
  1. 深度学习不是仅限技术部门
到目前为止,仅限于大量的学术机构和技术部门,关于深入学习相关成果的媒体报道最近的增加(通常是由真正实际的研究成果,比如游戏专用电脑、人工创意机器等)大大有助于提高深度学习的名声。现在其他公司匆忙穿上潜水衣进行深层探索。数据科学家将深度学习方法应用到更广泛的分析领域,如客户流失预测、财务欺诈侦测和产品推荐,证明了传统企业日益增长的利益。
  1. 深度学习一种权衡
企业需要理解,深度分析涉及到一种权衡。虽然深度网络结构的准确性可以媲美现有方法或者更胜一筹,甚至在结构良好的数据集之上,但由此产生的模型却是需要微调的不透明的“黑盒”。深度学习通常需要前期的架构投资来处理模型的复杂性。众所周知,大型神经网络需要几个小时甚至几天的训练时间,这种情况如果没有预见或计划到,可能会妨碍数据科学团队。 为分析性挑战选择合适的模型不仅仅是最大限度提高模型精准度的问题,这种模型精准度还要受到输入数据集的限制。对于传统的分析来说,模型的兼容性和简单性往往比低粒度的精确度更重要。处理大型数据集时,需要考虑到建模方法的性能和可扩展性。协助获得洞察的非操作模型的要求将不同于完全操作的建模架构。

作者

David Mueller
David Mueller

Teradata天睿公司国际数据科学卓越中心高级数据科学家

相关推荐