李彦宏反思大数据:难点不在制造新硬件 而是找到什么数据有价值
近来,大数据一直是业界热议的话题,加上可穿戴设备就更热闹了。但是,可穿戴产生的数据,如何能够有效地利用起来,也一直是待解的谜题。 这样的疑问,同样在百度CEO李彦宏身上发生。他在今日召开的百度联盟大会上表示,大数据的难点在于什么数据对你有价值,这不是随随便便生产一个硬件就能解决得了的。 有数据显示,过去两年,我们生产的数据,占到全部人类所有数据总和的90%。也就是,我们古人生产的数据还不到10%。 尽管数据很多,各行各业都在说自己生产了很多很有价值的数据,但在李彦宏看来,好多都是没有价值的数据,不是我们真正想要的数据。 像智能手环收集到很多数据,有走了多少步路,消耗了多少卡路里,但是没法分析,不能帮助用户解决问题,大多也都没用;还有眼镜每天看到的信息有很多,但收集起来有什么用呢? “最近智能软件,智能眼镜等智能硬件产生的数据没法收集。这个数据拿过来我们用不了。手环能帮助治病吗?我问过医生,其实是不能的。”李彦宏说。 未来真正的大数据积累应该是可以提前预测人的疾病情况,就像中医中说的未病:因为疾病不是一天出现的,而是天长日久累计出来的,各种数据一定发生变化。 他在现有言必称大数据的情况下,提出了新数据,基于大数据产生的新型的持续的有效的数据。“这种慢数据的收集方法,不是平时不戴什么东西,你让我戴个东西;而是我平时就在做什么事情就能测出来。比如癌症,提前五年就能检测出来。”李彦宏说。 今年4月1号的时候,我们讲了一个概念性的产品,就是百度筷搜。很多人问你们什么时候出这个产品,我们想买。实际上,这个东西我们还没做出来。但是,这东西确实是代表方向的。当我们说,你有一双筷子,在你吃饭的时候就能知道这盘菜有没有用地沟油、或者这个蔬菜是不是重金属超标了……那么大家就会觉得这个东西太有用了,我想要这个东西。 筷子跟手环不一样。筷子是我们必须要用到的,不像手环这类强加给你。所以,他觉得越是这种日常用到的、自然而然不是强加给用户的东西会是大数据用武之地。 再比如我们平时用到的牙刷,可不可以通过牙刷测试我们的唾液,来查看我们的身体有什么样的症状,这可不可以做出来呢?这样的数据,都是自然而然的收集。 所以,他觉得难点不是说生产一个硬件出来,而是识别出什么数据对你有价值。 同时,他还认为企业级软件也是一个方向,这个方向还都是BAT都不愿意做大。 李彦宏介绍说,在美国企业级软件市场已经诞生了很大知名大公司,比如IBM、甲骨文、微软,但中国还没有出现大的企业级软件企业。 这主要由两方面原因造成,其一是过去中国劳动力成本很低,使用企业级软件的效应并没有起来,其二是很多企业老板并不用电脑,不会用PC提升效率。 李彦宏认为,目前制约中国企业级软件发展的这两个因素正在发生改变,中国劳动力成本上升非常快,每个老板都拿着智能手机,可以随时随地的上网,自然会想到用企业级软件提升公司效率。 “大家都知道百度收购91无线,我在和91打交道过程中很吃惊,91高管的每个高管的邮件地址并不一致。”李彦宏说,后来才知道,91无线开发了自己的IM,这种IM不仅可以交流,还可以进行任务分发、考核。 李彦宏认为,企业级软件仅仅接管过去的工作还不够,新的企业级软件应该能解决更多问题,不仅是企业内部流程的问题,而且是由内部到外部的问题,这些都是过去企业级软件无法解决的问题。 在他看来,这些企业级软件,在餐饮、KTV、发廊等这些服务产业有很大市场空间。这将充分提升这些服务业的效率。(曹天鹏/钛媒编辑 本文来自钛媒体 微信号:taimeiti) 以下为李彦宏演讲实录大家好,欢迎大家来到黄山。 每年的联盟峰会都会选择一个山清水秀的地方,这样是因为,一方面心情可以比较放松;另外一方面,思路也容易打开。去年的联盟峰会在香格里拉举 行,当时我讲的话题是“互联网加速颠覆传统产业”。其实这个话题也是在峰会前一天晚上才把思路整理出来的,不是说平时不在想,而是平时想的时候思路比较 乱、不成系统;到前一天晚上,去一个比较安静的地方,在一个美丽的环境当中,就很容易能够把思路理出来。当然,当时讲的时候主要还是觉得,我在讲的是未来 三到五年才会发生的事情,没有想到仅仅过了不到一年,这个理念就被很多人所接受了。当时讲这个话主要还是希望让我们的传统产业能更早地意识到互联网给他们 带来的冲击,同时及早地去拥抱互联网,及早地用互联网思维来做事情。 那次讲话之后,银行来找我,证券公司来找我,保险公司来找我,医院来找我,学校来找我,都希望能和百度合作。其实跟一家公司合作这种解决方案是 没法拓展的,我觉得,每一个企业应该更多从自身的特点想办法,用互联网的思维做事情,或者把原本的事情做得更好,效率才能提得更高。 这里我给大家举个例子,就是企鹅的例子。大家没有必要那么敏感,我是讲的真的企鹅。百度百科里有一个企鹅的词条,大家如果现在去试一下、或者最 近有所注意的话,就会发现这个企鹅词条里面有一个live web cam(实时网络摄像头)。你在看到这个词条的时候,不仅有文字性的介绍和图片,还有一个实时的对准北京动物园企鹅馆的录像。你要想看企鹅是什么样子、它 现在在那儿干什么,就能够看得到。这就是一个比较典型的传统行业拥抱互联网的例子。我了解,当初在做这个合作的时候,北京动物园内部也有两派意见:一个觉 得这是在拥抱互联网,是一个进步;另外一个觉得这样会影响动物园原有的业务,因为大家都能在网上轻易地看到动物园里面所有的动物长得什么样,那谁还会来动 物园现场看动物呢? 他们经过一番debate(讨论)之后,还是拥抱了互联网思维。其实,我们作为互联网从业者,来做这个决定是非常轻而易举的:如果把这些东西都 放到网上的话,就一定能够帮助我们获得更多的客户,帮助让更多的人产生对动物的兴趣、进而真正来动物园看一下。在网上看直播和到现场看的感受,其实还是非 常不一样的。我们每个人都应该会同意这一点。但是,对于一个传统产业来说,想要真正地把这种思维方式转变过来,还是需要一定时间的。但是,至少我自己,很 高兴看到在过去的这一年,这一方面的意识,无论在哪个产业都变得相当强了。 我也在想,每年在联盟峰会就是希望能够跟大家分享一下我对未来产业发展的判断。当然,不是说对未来一年的判断,更多的是对未来五年、或者更长时 间的判断。很多事情需要经过一定阶段、一定时间的酝酿才会越来越明显。而像去年那样讲了以后立竿见影、不到一年就所有人接受,是比较出乎意料的。 其实对我来说,讲未来的趋势也有一定的难度,因为百度本来就在互联网这个领域之中,我们想做的事我肯定天天都在想。但我要想做的不一定愿意告诉 大家,等我做出来以后才会告诉你们;我愿意告诉你们的,又是我不想做的,又能够代表未来趋势的,这个确实还是有难度的。我不想做的,“A”和“T”想不想 做呢?我估计他们也不想做。所以这个话题就变成:未来五年会有非常大的发展,但是BAT又都不会做的,是什么东西?我想了想,确实还有,有两个东西。 第一个是企业级软件。这倒不是一个新东西,但是在未来会变得很新。去年我们讲传统产业正在被加速颠覆,在这个颠覆的过程中,企业要拥抱互联网, 用互联网的思维来做事情。其实企业级软件,在发达国家,像美国等都有非常大的市场,孕育了很多市值非常大的公司,IBM(183.08, -1.70, -0.92%)、Oracle、 Microsoft等。像Microsoft原来有很大程度的收入来自consumer(用户端),但现在有70%的收入是来自enterprise(企 业端)。我估计未来这个比例会更高。一个企业级软件市场可以养这么多的大公司,但是在中国没有特别大的企业级软件公司。 为什么呢?我觉得有两个原因,第一,中国过去劳动力成本很低,而企业级软件在过去解决的问题是什么呢?是提高企业内部的运营效率,运营效率提高 了,可以少雇人。软件比人便宜,那么人们就买软件,这个事情过去在中国不是很明显,所以这个结论就不是特别成立。第二,我们发现其实在中国,当老板的人基 本不用PC,如果他自己不用的话,就很难带着整个公司去用。或者说,他很难去特别推崇用PC提升工作效率。 但是这两个条件,或者说这两个现象,都是正在改变的。一方面,中国的劳动力成本上升非常非常快,这是整个中国经济发展面临的非常大的问题。另一 方面,我们也看到,现在每一个老板都拿着一个智能手机,不仅拿着,而且他真的会用。如果是这样的话,他通过智能手机,随时随地带着,一天二十四小时都用, 这个手机又可以上网,那么自然而然地,他会想到去用这个企业级的软件来提升工作效率。 但是,我讲的这个企业级软件可以说是一种新的企业级软件,和我们过去讲的企业级软件是不一样的。它不一定是基于PC的,它的整个工作理念可能也 是不一样的。去年我们收购了91无线,很多人都很关注,但可能有一点你们没有注意到。我们在和91打交道的过程中有一点让我们觉得很吃惊,就是每个91高 管的名片,上面写的电子邮件的域名地址都是不一样的,不是91.com,而是163、qq、gmail或者其他域名的。我们很纳闷,觉得91 虽然不是大公司,但也是有几千人的公司,为什么高管拿出来的名片email都是乱七八糟的?他们说,我们工作不用邮件,我们用IM(即时通讯软件),他们 自己开发的。这个IM可以做什么呢?除了能够即时通讯,它还什么都干,ERP的审批、报销、员工绩效考核、任务的分发……任何事情都可以通过这个内部开发 的一个IM实现。我觉得这个东西其实挺有意思的,它很可能代表一种方向。整个企业可以用一种新型的软件来运营。一个IM就把我们过去在企业里面需要买的各 种各样的企业级软件都代替了。 其实整个产业界,不管是中国,还是美国,都在朝着这个方向发展。比如微软最近发布的Office365,基本就是把Office搬到了云端。这 是因为他们认为这代表了一个方向,所以才会这样做。但是仅仅接管过去企业内部流程运转方面的工作的话,我觉得还不能完全代表新的企业级软件。 在我心目当中,新的企业级软件是什么呢?它应该能够解决更多的问题。它不仅仅可以解决企业内部流程的问题,而且能够解决企业从内部到外部的连接问题,就是说,企业如何与客户打交道的问题。过去的企业级软件是没有办法解决这些问题的,而未来是可以解决的。 再给大家举个例子,不知道大家最近有没有注意到,青岛航空把整个售票体系全部包给了去哪儿。我卖了多少张票、每一张票多少钱、什么时候卖出、上 座率多少,这些东西都靠去哪儿软件来做决策。其实在Airline Industry(航空产业)中,航空公司对于上座率的问题已经研究很长时间了,因为如果空一个座位的话,它的成本就完全浪费了,就没有价值了。所以对航 空公司来说,把飞机坐满,同时让每一个人付的价钱又最高,这对于航空公司来讲是收益最大的。所以Airline Industry中一直在研究,提前一个月买票是多少钱、提前两周买票是多少钱、提前一天买票是多少钱、而我站在那儿等着马上就上飞机又是多少钱。但是, 他们过去的研究主要是根据historical data,比如说现在是5月29号,那么一年前5月29号的乘客数目是多少?demand(需求)是多少?未来,有很多其他的信息,如果用互联网的思维来 重新看一遍的话,有很多其他的信息是可以加进去,可以把票卖得更好。 去哪儿开发一了套软件,他们不仅知道过去卖票的情况,而且可以更好地预测到未来,根据人的特点、现在环境发生的变化、竞争情况等等,就可以卖出 去平均来说更高的价格。当我认为demand不够的时候,就把价格降得更低一些,或者提早降价;当然如果航空公司认为会有足够多的人在最后一分钟买票的 话,价格就一直不降,这里会有很多的技术。其实大家想想,不光是Airline Industry,在我们平时接触的很多行业中都有这个现象、也都有这个问题。 比较典型的是餐馆。我们都知道,好餐馆是经常需要排队的,有的餐馆价位定的比较高,客人就没有那么多,就会坐的不是很满。好餐馆每天一顿饭翻一 次台和翻两次台、翻三次台挣得钱是不一样的,因为餐馆的固定成本基本差不多。餐馆里坐了10%的人、和90%的人也是很不一样的。所以,怎样动态地定价, 让足够多的人、按照足够高的价钱到餐馆来,这其实和航空业的机票定价是一模一样的,酒店的房间也是同样的:什么时间、面向什么人、卖出什么价格……这套东 西如果作为一种企业级软件开发出来,那么未来不光是对企业内部的效益,而且对整个社会的效益都会有非常大的提升。所以,机票、酒店、餐馆、歌厅、发廊…… 很多这种服务型的企业,也是我们国家未来想大力发展的出口、投资、消费当中的消费的部分,这类型的企业,目前的运营效率是非常低的。用这类软件去提升效 率,我认为是未来五年左右一个具有巨大发展潜力的方向。 第二个方向跟大数据有关,但不完全是大家一般意义上讲的大数据。每每讲到大数据,我的美国同行,就是Google Chairman(谷歌(561.68, -4.27, -0.75%)董事长) Eric Schmidt(施密特)经常说的一句话是:在过去两年,我们生产的数据,是占全部人类文明史上所有数据总和的90%。也就是说,过去一万年产生的数据也 只占整个数据的10%。言外之意是,现在数据已经爆炸了,我们要解决的是信息爆炸、数据太多的问题。其实我觉得,这有点误导的嫌疑,我们现在看到,每天产 生的很多数据基本都是没价值的数据,很多产业,尤其是传统产业,他自己抱着那些数据说:我这些数据特别值钱,大数据时代来了,我这些数据可以开始显现威力 了。像百度这样的公司,在技术上有相当多年的积累,在我们看来,技术已经almost ready(基本就位),技术是可以去做一些事情的;但是我们真正想要的数据现在没有,或是还没有搜集上来,已经被搜集上来的数据基本没有价值。 比如说最近比较火的智能硬件。戴个手环、弄个眼镜,搜集了很多数据,但把这些数据拿回来之后总觉得用不上,觉得没法分析。比如戴眼镜,人平时眼睛能看到的,一天24小时除了闭着眼睡觉之外,把剩下能看到的全部搜集过来,但这些有什么用?我们想来想去,其实是没有用的。 国家有关部门的卫星,照了大量的卫星图片,数据量也非常非常大。百度做地图,其实我们对这些东西也研究了很长时间。琢磨来琢磨去,觉得这个数据拿过来我们用不了。那它们就不是大家真正需要的东西。弄个手环,算一下我每天走了多少步、消耗了多少卡路里、心跳多少,能帮助治病吗?我也问过很多医生, 他们也说这东西不能帮助治病。 我觉得下一个方向其实是新数据。就是要思考,什么数据能够真正的帮助人们解决问题。今年4月1号的时候,我们讲了一个概念性的产品,就是百度筷搜。很多人问你们什么时候出这个产品,我们想买。实际上,这个东西我们还没做出来。但是,这东西确实是代表方向的。当我们说,你有一双筷子,在你吃饭的时 候就能知道这盘菜有没有用地沟油、或者这个蔬菜是不是重金属超标了……那么大家就会觉得这个东西太有用了,我想要这个东西。 目前来说,这个数据还没有,我们还没有能力收集这些数据。但是这个的确是代表了一个方向,因为你本来天天就在吃饭、本来每天都在用筷子,不像你 本来不带手环你却戴上了、你本来不戴眼镜,却戴了这个很重的东西,这是完全不一样的。我本来就干的事,同时帮我收集数据,这些数据可以立刻告诉我一些有价 值的信息;或者这些数据也许不会立刻告诉我有哪些信息,立刻告诉我的也不一定有价值,但是,我如果坚持这样做下去,也许就会有价值。 就像中医的理念是“治未病”,就是还没生病的时候就告诉你身体以后会怎么样。很多的病有一个漫长的积累过程,在这个积累的过程当中,你的身体各 项指标一定是在发生变化的。可是目前的医学实践,都是说等你有病了,或者说你觉得你有病了,到医院进行检查,希望几个小时之内、最长几天之内诊断出来到底 有什么问题。而真正能够治疗人们的这种“未病”的、或者说更先进的治疗方法,是对很多症状的多年积累,在积累的过程中、由于你持续地monitor(监 测)你的身体特征长达三个月、六个月的时间,就可以知道我今天和六个月之前的身体数据有哪些不一样,可能是身体上出了什么问题,需要及早去医院看。 这样的不是“快数据”,而是“慢数据”。“慢数据”会对消费者有很大的价值。而这种“慢数据”的收集方法,又不是来自于那些原本不需要戴的东西,一定是平时就在 干的事,顺便就把这些数据收集上来了。比如说我天天都要刷牙,我在刷牙的过程中,唾液的情况都是可以接触到、可以分析的。也许有一种癌症,就可能会在被现 代医学检查出来前的五年,通过检测唾液,持续检测半年之后就可以知道癌症可能会发生,这样的数据如果收集上来,就会非常有价值。 所以我觉得,新一代的数据收集,不管是收集工具也好,或者说数据本身也好,都会有很大的发展。但是这里面,难点并不在于你制造出来一个新型的硬件,而在于能够找到那个点,找到什么数据对人们是有价值的。 其实在健康方面的大数据也讲了很长时间了。比如说,人类的基因测序,过去很多国家花了纳税人很多的钱,搞了这个人类的基因图谱。现在成本急剧下 降,可能花一千美元,用几天的时间,就能够把整个人的基因测出来了。理论来讲,这个数据也是可以告诉你,你这个人的身体会发生什么变化、有什么特点、未来 会有什么风险。但是在本质上,这些数据还是没有用的。因为它本质上就是ATCG,基因的序列就是利用ATCG排下来的。你看到的就是一串ATCG,可能重 复了很长很长的距离而已。现在所说的大数据有很多都是这样的数据。但是这样的数据是没有用的。我们拿着很好的技术,但是对这种数据下不了手。要想找到有价 值的数据,其实不光要有技术。技术是有价值的,但在这里并不是最关键的。最关键的是什么呢?最关键的是domain knowledge(领域知识)、你的experience(经验)、以及跨领域的思考能力。假如说你真的是一个懂互联网的中医,你就有可能研究能够出来 一个指标,在连续follow(跟踪)半年之后,就可以知道哪些病会不会发生,而这是纯互联网公司干不了的,需要有这个领域的专业知识、甚至是经验。还有 跨领域的思考,并不是一个简单的医生就可以想到这些东西,你一定要有互联网的思维。你可以不知道这个技术是怎么实现的,但是你要知道技术上可以实现这些东 西。那才有可能找到合适的数据。 所以,这种类型的数据,我认为是未来真正有价值的数据,过去不管产生了多少数据,其实都浪费掉了。所以从这个意义来讲,现在传统产业在数据上仍 然没有优势,互联网公司目前在数据上也没有优势。我们讲很多大数据,百度每天有几十亿人次的搜索什么的,这些数据,现在做的事情大多数是宏观上的预测:比 如我们预测一下端午节哪个景点人比较多、高速上哪里要堵车了,这些都相当于是统计型的结果,现在的数据可以做到这些。但是真正 individualized(个性化)的数据,比如说,我们怎么能够知道一个人在走进一个餐馆的时候会点什么菜?现在的数据积累其实还不够;某一个人, 五年以后会得什么病?我们现在也搞不明白。 所以,这样的东西,是需要每一个行业,以及拥有行业知识、行业经验的人,来积极拥抱互联网,来跟互联网进行结合,才能够做出来。 我之所以讲这些东西,还是希望有更多产业的人,不光是互联网产业界的人,其他产业界的人,能够多跟我们这些人碰撞。我也希望在座的联盟合作伙 伴,多和各个行业的人进行碰撞,因为很多东西是在不同的行业进行交叉的时候,才能够撞出火花,才能真正把一些过去被别人忽略掉的东西找出来。而这种领域, 恰恰是机会最多的。你是这个领域,他是另外一个领域,而大家没有把注意力都没有集中到中间的状态中;而且就算你把注意力集中到中间状态,但如果仅仅从自己 的角度来看这个问题,你就会发现其实也没什么价值。 百度这么多年积累了很多很多技术。比如现在我们有以图识图,用手机去拍,就立刻可以知道这个花叫什么。但是,这个东西到底有什么用,我们不知 道。有一天,如果有一个人告诉我说,这个东西你如果拍一下就能知道它是什么,那就有价值了,那就厉害了。我们现在缺这样的东西。我现在有这种 technology(技术),但我不知道计算机能够识别出什么,它就会变得就有价值。所以,希望不同领域的人能够进行交叉、进行相互的激励,最后产生创 新。而这方面,我觉得中国其实是处在一个非常有优势的地位,我们的传统产业时间更短,基础并不是那么牢固,我们的传统产业中的企业家,尤其是民营企业家, 他们更加开放——因为过去几十年中国的市场就一直是一个迅速变化的市场,他们本身做生意的方式就在变化,再变化一次对他们来说也没有那么难。这和美国那些 做了上百年的传统企业的思维方式,或者说转变思维方式的成本相比,还是很不一样的。所以,如果我们能够更好的把互联网公司的思维方式、技术、经验和每一个 领域进行更好结合,我觉得产生出来的未来价值,对整个社会的运营效率的提升,都是非常有帮助的。 所以当我们有了新的企业级软件,当我们有了新的数据,再结合上比如最近几年飞速发展的深度学习、人工智能这些技术,我相信未来若干年都会有一个非常美好的前景。 |
责任编辑:沧海一笑