《纽约时报》使用预测分析算法的经验

日期: 2015-11-04 作者:Ed Burns翻译:杨宏玉 来源:TechTarget中国 英文

过去十年,互联网作为新闻的主要来源,逐渐取代了印刷出版物,这种变革使得大多数新闻机构的收入直线下滑。广告商不再愿意支付高额的印刷版面费,他们逐渐倾向于网络广告。这几乎让新闻机构抓狂。

许多人仍然没有适应新闻行业的新兴业务内容。但《纽约时报》早已开始将预测分析作为其商业模式的主要部分,以快速地适应现实。从试图让更多的人订阅到推广社交媒体上的文章,纽约时报使用预测模型指导了其大部分的业务决策,并希望通过这种方式在21世纪获得一如既往的成功。

在波士顿举行的Predictive Analytics World大会上,《纽约时报》首席数据科学家Chris Wiggins提及了他和他的团队如何使用预测分析算法来做事,如使用漏斗分析来探究人们如何成为用户,以及如何影响更多的人成为用户等。他们也使用自然语言处理来理解内容主题使读者达到最高的参与度,以便营销团队知道推广哪些类型的文章。

新闻行业的门外汉

让Wiggins来引领报纸行业的数据改革似乎是一个很奇怪的选择。他早年被授予理论物理博士学位,其职业生涯的大部分时间都是在学术界做生物研究。但他的大多数研究工作利用到了机器学习和其他先进的统计方法。他说将这些类型的预测分析模型应用于报纸等传统业务与在生物学上使用区别不大,况且这也向来不是依靠数据驱动的一个特殊科学领域。

在《纽约时报》,针对那些受过高等教育且工作多年的人,Wiggins往往让他们使用非学术性工作方法。他说,他让团队尽力避免只拥有理论业务价值的项目,将关注点放在更有实际价值的事情上。

“公司里的每个人都应该清楚我们正在做的事为什么对于公司来说是有价值的,”Wiggins说道,“你应该只做那些具有可行性的工作。”

为了做到这一点,Wiggins建立了一个团队,更倾向于使用通用的计算机科学技术,而不是统计数据。他说,这种策略有助于建立一个从开发到生产的模型。团队成员熟悉编程技术意味着他们开发应用程序或Web门户相对于数据科学家来说更为容易。他们在大多数项目中使用Python,而不是像R stats-centric那样的预测分析工具,因为前者更倾向于编程密集型。

Python 吸引了更多从事计算机科学的人,它同时保证了我们所完成的一些工作不再是冷冰冰的幻灯片。

数据不会涉及到编辑相关的决策

尽管纽约时报使用预测分析算法取得了一些成绩,但有一个领域,Wiggins表示他的团队不会涉及:编辑部。他承认还有很多其他的新闻机构使用分析来驱动编辑的决定,但是他说重要的是要知道什么时候该做出让步。现在,报纸的编辑质量仍是区别于其他竞争对手所参照的最主要因素。但使用数据驱动提高编辑质量却不那么容易做到。

在大多数其他领域,分析帮助纽约时报成为适应21世纪的新闻机构。Wiggins说,关键是思维方式的变化,让人们首先想到使用数据来解决问题。

他总结:“数据越来越受到认可,并成为《纽约时报》第一等要素。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

杨宏玉
杨宏玉

TechTarget特邀编辑。北京邮电大学计算机科学与技术专业硕士。熟悉软件开发流程,对系统管理,网络配置,数据库应用等方面有深入的理解和实践经验。现就职于IBM(中国)投资有限公司,从事IBM服务器相关软件的开发工作。业余时间喜欢游泳登山,爱健身,喜欢结交朋友。

相关推荐