听张一鸣谈互联网技术怎么改变媒体行业
以下据张一鸣演讲整理
记得从中学到刚工作的那段日子,每周四下午都会有点高兴,因为下班或者放学后能买到南方周末。一直以来,我始终保持着信息获取重度用户的习惯,并长期关注如何解决信息不对称的问题。11年底,移动互联网的快速发展,导致信息的创作、分发、讨论,发生很大的变化。12年初,我从上一个创业公司离开,重新启动,做了今日头条。
我简单介绍一下今日头条。首先,它是一个超大用户量的平台,今年年初日活用户超过2000万。第二,它是一个信息分发的平台,并不是生产内容的媒体,当然我们跟很多网站媒体有合作。目前,有超过20000个内容的创作者入驻今日头条头条号。其中,政府加各类机构超过5000家,签约的传统媒体有超过1000家,自媒体超过15000个,而且是以每月20%~30%的环比速度上升。 第三,从技术角度说,今日头条是一款基于机器学习的个性化推荐引擎。它根据用户的兴趣、喜好、手机,位置,包括其他的环境信息为用户推荐可阅读的内容。
在我创业的时候,就有人问我张一鸣你做过媒体吗?因为一看到今日头条的名字,大家可能想会觉得:这是不是一个媒体机构。我说不是,我既没有在传统媒体工作过,也没有在门户网站工作过。还有人会问,你为什么招这么多工程师呢?我们确实需要这么多工程师,我们主要靠技术驱动来达到信息分发的目标。
一、互联网技术怎么改变媒体行业的?
1.机器学习
从2011年开始移动互联网快速发展,让信息传播,包括知识积累发生了很大变化。人类最早结绳记事,后来有了文字,人们将知识总结成符号记录下来。但现在积累知识已经不是靠人了,是靠系统的观察。系统通过观察每个用户的行为,不仅得到对这个用户的了解,还得到不同用户之间的差距。它可以知道同样使用iPhone6手机的北京的男性用户,有什么共同的特点。在使用3G和wifi网络的时候,小米手机的用户喜欢看的内容有什么区别。这些行为被系统记录,被系统理解,沉淀下智慧。
在垂直领域,搜索、阅读、导航、交易、保险、金融、天气等都会出现这样垂直的“上帝”,它们在这个领域不断积累。系统就像一个不断翻译的大脑,刚刚做出来的时候可能是没有多少智慧的,也就相当于几岁的小孩,但它有一个优势,不会死亡,能够日夜不停的工作。而且用的人越多越久,它知道的东西就越多。我认为机器学习对信息的整理归纳理解的能力,将会大规模改变信息的传播,也会抹平信息的鸿沟,减轻人脑的负担。
2.介质的变化
我基本按时间排列了各种媒体形态——传播信息的介质。纸是很重要的传播介质,相比墙贴公告,(有了邮递之后)它的传播范围很广。特别是有了无线电技术之后,它可以分散多地印刷,让大规模的传播信息成为可能。广播更是如此,第一次实现了非常快速的长距离的信息传播。《伟大的博弈》那本书说,在电磁波出现之前,美国的东海岸和西海岸的市场交易价格是不一样的,通过驿站和马车,早上东海岸的价格下午才能传到西海岸。电视,使多媒体信息传播成为可能。无线电台只能传递声音信息,电视可以传播视频的信息。
互联网,第一次实现了双向实时的互动,内容创造者可以发布内容,读者可以反馈,可以写评论,可以互动。移动互联网跟互联网,就传播信息的能力而言,没有太大变化的。但移动互联网可以随身携带,所以它能记录个人很多很多的特征,这一点意义重点重大。在PC上的时候,一个人用几台电脑,几个人共用一台电脑等等情况非常多,并且它不能捕捉个人的完整场景。
07年08年的时候,我在电脑上看各种内容,但也买报纸,为什么?在上下班的路上不会拿着电脑看。所以平媒受到移动互联网的影响更大。10年之前,北京地铁站入口有卖报纸的,出口有收报纸的,但11年之后就没有了。因为移动互联网便携性非常好,传递信息也非常实时,并且能够标识个人。这种介质的变化,不仅带来信息分发效率的变化,还带来创作的变化。第一手信息常常不再是记者的报道,而是用户拍摄的照片发到了微博再被传播,记者可能在微博上看到了,再去二次加工,联络当事人。视频也是,以前视频网站都是长视频播放,但现在开始有更多的短视频了,为什么?因为手机不仅有阅读功能,还能创作。手机一般都有两个以上摄像头,能非常方便地捕捉场景,所以大量的内容被创作出来。
互动也发生了很大的改变。在功能手机时代,手机报可能一天发两条,每一条大概摘要五条新闻,但是没法评论,是单向接收。现在用户不仅能评论,还可以看评论人过去的所有评论,看评论人收藏分享的文章,比如头条上的社交功能一样。所以媒体在阅读之外还带了社交属性。这就是我理解介质带来的变化。
3.个性化推荐需求
08年底,我有个强烈的感觉,信息越来越多,我关心的事情总是不能第一时间到达我。这个场景其实很多。比方大家都经历高考,你们会到网上去查成绩,每天可能都去看一下发布了没有。但比较方便的,应该是一有信息就推送给你。09年的时候,有很多公司在做这方面的尝试。其实,社交网站不论是微博还是朋友圈也能起到一定的功能,但它存在一个问题:朋友关心的不一定是我关心的。有什么产品能够更满足我信息获取的需求呢,当时我看了在世界排名1000名的网站,寻找有没有这样的产品。发现 95年之后有很多人做了尝试,都不太成功。09年有个比较大的网站——这个网站的创始人就是后来uber的创始人——也不是特别好。我就在想,应该存在一个更理想的形式,但一直没出现。
我带着这个问题工作,一直到11年智能手机出现,我觉得可以实现这个理想了。手机是你随身携带的,携带时间比钥匙更长,比手表更长,所以它能够了解你的很多信息。并且手机是唯一对应到个人的设备。此外,手机屏幕很小,信息却那么多,这两者之间的矛盾就越加大了,信噪比(有效面积内的信息和噪音的比例)就显得越加重要,个性化推荐的需求上更强烈了。当然,到了那个时候,相关的技术也越来越成熟了。
我还有一个观点是这个世界越来越透明了,人在互联网留下的痕迹越来越多了。在2009年之前,有一个说法,谁也不知道你在互联网上是一个人还是一条狗,现在的说法是,互联网上别人很容易知道你是谁。大家越来越多地使用真实职业,表达真实兴趣,表达真实的态度观点。因此,我觉得在移动互联网上有可能做出基于推荐的产品,于是有了今日头条。
二、大数据+好算法=今日头条
有人跟我说,今日头条长得跟新闻客户端差不多,看不出是技术驱动。包括我跟猎头说,我要招高水平的工程师,他们也不理解。其实如果看了这个图,他们就能理解了。从左上角的部分,相当于一个搜索引擎的前半部分,它也要对信息进行收集、整理、分析,它要自动计算出这篇文章是哪一个主题的,是哪一个大类和小类,提到了什么人物、公司、地点。
之后,它要给用户排序。就此时此刻,大家可以拿出手机刷一下今日头条,跟周围的人对比一下,你刷出来的前5条和他刷出来的5条是否一样,肯定是不一样的。为什么呢?因为它根据每个文章的特点,根据每个用户的特点做了一个排序。用户的特点是怎么知道的,我们可以看到右边,用户使用今日头条,根据推荐结果产生行为,比如是否点击、评论等,这些行为又迅速回到最下方——用户信息的收集器——被分析,分析之后设定用户的兴趣,用户的兴趣又返回影响到排序。如果你刚刚点了一篇文章,是你从来没有关注过的某个主题,过几分钟之后你再刷新,这个主题的文章就会增多。所以我们会对每条信息,每个商品(因为我们也推荐商品信息)进行各种分析。
我刚才是非常简单的列举,实际上分析纬度会非常多,让这个循环不断地迭代。人工智能系统,它不仅像一个助理,还像一个上帝,这个迭代的过程中,越来越多的知识沉淀下来。最左边的一侧显示要做这样一个系统的基础工具。我们现在大概有3000台高性能的服务器,到今年12月份会到6000台,据我们所知,是未上市公司中最多的,当然也比很多上市公司多很多。这些服务器每天处理的日志大概有100多亿条,100T,每天要消耗200块500G的硬盘。讲到这儿,大家也能理解了为什么今日头条要招很多很多优秀的工程师。
这个图表是我们过去一年中我们平均每个用户每天点击数的变化,大概是涨了90%。这个提高一方面有数据积累的因素,我们积累的数据越来越多了,另一方面就是算法的提高,计算公式越来越准了,在过去一年中,已经有几次,一改进算法,第二天点击率就明显提高。
三、为内容生产者提供整套服务体系
1.智能推荐,内容生产者可以专心创作
我相信传统媒体都挺关心我们内容合作情况的。我们的内容创作平台——头条号为什么能吸引很多的创作者呢?因为它具备个性化分发的能力。在平媒时代有两个东西限制内容的分发,一个是刊号,第二个是发行。小众内容在平媒时代是不被创造,因为它没法被发行。比如说古筝,全国可能有20万个读者,但是太分散了,每个省就10000个,通过零售渠道很难发行。有了推荐引擎之后,发布第一天我们就向对古筝最感兴趣的6万人推荐了这个内容,这样,长尾创作就发展起来了。
我们跟微信公众号相比有一个特点,因为微信公众号要人工订阅的,如果你不搞一些病毒营销、抽奖之类的东西,你是很难获取有用户的。很多微信公众号运营了半年,也就几千个粉丝,那每篇的阅读量在一两百。但是头条不一样,很可能你创作的第一篇或者第二篇内容就有几千、几万个阅读了,因为它会自动把你的内容推荐给可能感兴趣的用户。每篇文章下面还可以看到真实大量读者的互动,很多人在评论顶踩。
2.内容变现
分发内容之后,如何变现呢?头条现在已经做的一些事情。第一,头条有广告系统,用户可以自己选择匹配头条的广告系统,我们给用户返还广告收入。第二,用户可以自己经营广告位,可以放App下载,商品链接,或承接的广告。一些头条号,像电动汽车时代网、山茶花、石榴婆报告,都经营得很好,公司规模不大,也获得了挺好的收入。
3.保护原创
在座的很多都是内容创作者,也很关心版权问题,我们今日头条去年也有一些风波,是关于版权方面的。我想说的是,我们是业界最重视版权的。我们用业界领先的消重算法来保证作品在我们站内是唯一的。
我跟很多自媒体的作者聊过,如果你发现一篇文章被别的自媒体抄袭了,你在头条上和微信上投诉得到处理的情况分别是怎么样的?我经常听到作者抱怨在微信很长时间没有被受理,但在头条上绝对是24小时内一定被处理完成的,因为我们要求所有的投诉反馈都要日清,这是我们的态度。 仅今年4月,今日头条就处理了超过450例作者举报,其中涉及侵害版权的有132例。
四、和最优秀的人做有趣和有挑战的工作
最后,我想跟大家介绍下我们的公司文化,我相信大家对技术驱动的公司有什么特点感兴趣。找工作有很多标准,最庸俗的叫做“钱多事少离家近,睡觉睡到自然醒”,但我们的标准不是这个,而是“和最优秀的人做有趣和有挑战的工作”,招到最好的人,给尽量好的待遇,给尽量有挑战的工作,让他做感兴趣且能做好的事情,给他最充分的发挥。
我们600个员工差不多有近300个是产品技术,我自己有40%的精力在跟招聘相关的事情上,其实我觉得应该还要再多一点,所以我们对人才是非常重视的。当然我们尤其重视技术人才,所以我们的HR负责人也是会写代码的。
顶级的技术人才值多少钱?我最近在朋友圈转了这篇招聘启示,很多人问我你们是不是营销的噱头,不是的,我们希望可以付100万美金年薪招聘一个优秀的机器学习专家,但并不是说资深业界教授,我们优先喜欢35岁以下的,85后就更好了。我们经常说人力成本,其实我认为人力不是成本,我觉得人力是资源,人力是投资,所以我们愿意为优秀的机器学习人才付这么多的价钱。公司内部有很多相关规则,像推荐优秀的机器学习人才,我们奖2万美金,推荐公司内部任何一个岗位,都奖5000人民币,高级工程师奖1万人民币。我们是想员工能够自循环起来,招到好的人,好的人再推荐好的人 。
责任编辑:大云网
-
碳中和战略|赵英民副部长致辞全文
2020-10-19碳中和,碳排放,赵英民 -
两部门:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
国家发改委、国家能源局:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业
-
碳中和战略|赵英民副部长致辞全文
2020-10-19碳中和,碳排放,赵英民 -
深度报告 | 基于分类监管与当量协同的碳市场框架设计方案
2020-07-21碳市场,碳排放,碳交易 -
碳市场让重庆能源转型与经济发展并进
2020-07-21碳市场,碳排放,重庆
-
两部门:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
国家发改委、国家能源局:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
2020年二季度福建省统调燃煤电厂节能减排信息披露
2020-07-21火电环保,燃煤电厂,超低排放
-
四川“专线供电”身陷违法困境
2019-12-16专线供电 -
我国能源替代规范法律问题研究(上)
2019-10-31能源替代规范法律 -
区域链结构对于数据中心有什么影响?这个影响是好是坏呢!