数据运营最终将变成运营数据,就像金融业运营美元一样
《IT经理世界》杂志2015年10月05日出版近几年,中国的大企业吸引了来自全球各地的专家,快速推进人工智能技术的发展。今年,谷歌展示了一套全新人工智能系统,它能观察、自学游戏的玩法,并在29款游戏上战胜了人
《IT经理世界》杂志2015年10月05日出版
近几年,中国的大企业吸引了来自全球各地的专家,快速推进人工智能技术的发展。
今年,谷歌展示了一套全新人工智能系统,它能观察、自学游戏的玩法,并在29款游戏上战胜了人类玩家,甚至在《弹珠台》等游戏中,得分比专业玩家高出20倍。谷歌称,经过调整,这套人工智能系统有朝一日可以驾驶汽车。
谷歌、Facebook和微软是人工智能领域的一批重要驱动者。不过,最近几年,中国的大企业如阿里巴巴也吸引了来自全球各地的人工智能专家,快速推进人工智能技术的发展。
“为什么选择阿里?因为这里有非常复杂的数据场景,有吸引我们的‘juicy data’,这些数据就像鲜嫩多汁的烤肉一样,让我们能够实现数据智能梦想。”阿里人工智能平台DT PAI负责人韦啸说。
如今,这批人工智能专家正利用“juicy data”以及大规模分布式计算环境,积累人工智能底层技术,研发更高级的深度学习算法,增强图形识别和语音识别能力。在这个过程中,人工智能技术也正被应用到金融、零售、物流、智能家居、社交网络、企业服务等不同应用场景。
未来,随着这些企业逐步对外开放人工智能平台,人工智能将成为普适的科技,协助人们在各个领域开展学习和决策。
不一样的智能手机
2009年加入阿里巴巴的初敏博士,曾在微软亚洲研究院工作近10年,目前在阿里云负责语音识别、人机交互服务等智能技术的研发。
初敏与孩子看了很多遍《钢铁侠》,片中钢铁侠的人工智能管家贾维斯,能独立思考,会帮助主人处理各种事务,计算各种信息,还协助主人开发机甲,是初敏最关注的一个形象。如今,在学术界,人工智能还没有一个确定的范畴。很多人工智能专家希望,人工智能就像《钢铁侠》中的贾维斯一样,成为人类的得力助手。初敏从专业角度分析,要实现这样的人工智能,背后的技术是非常复杂的——机器人要能通过语音搞清意图,能做推理,能查找资料和汇总信息,最后还能用语言表达。
“科幻比现实提早了二、三十年,今天的人工智能技术要实现这一切还有一段距离。”她说,“但一些局部场景很有希望在近期看到。”
初敏的团队虽然去年底才组建,但这支以80后博士为主的生力军,已在两件事上取得快速进展。
首先是“机器人助手”。初敏他们一直在讨论一个场景:分布在各地的阿里人都要去杭州出差。他们出差前要订机票、酒店,还要叫车,这些事情很繁琐。“我就希望哪天对手机说,我明天去杭州出差,然后everything done。”她说,“今天从表面看,技术一块块都有,但把一切统统搞定,还没有人实现。”
初敏看到,她所从事的语音识别,在这样的场景中已不再是一种单纯的技术,而要成为一个“串联器”,把各种数据、应用很好地结合在人的身边。
目前,初敏团队与阿里YunOS团队合作,从操作系统层面实现智能助手功能。第一版会先把几个常用场景如出行、相机相册等做透。例如在出行场景,除了帮用户选择航班、酒店,还会与阿里旅行·去啊打通,完成订票、订酒店的全过程。这个产品将在今年内公布。
在初敏他们的畅想中,未来手机的操作方式将被改变。人们使用某种服务的入口不再是App,而是手机上的某个形象,比如你的私人助理。你需要它时叫它一声,它就能在不需要你关注的情况下,把需要的各种应用和服务串起来,帮你实现你的意图,手机再也不需要那么多屏的App了。
另一件事是关于企业客服。今天,淘宝、蚂蚁金服的业务非常广泛,当客服坐席达到一定规模后,就不能再靠增加坐席来解决服务规模问题。“客服这个地方需要技术来革命。”初敏说。
他们首先把大量常规、重复性的服务自动化,这样有限的人力资源就能投入到更复杂问题的处理上;还把呼叫中心的录音转化成文本。有了文本,企业就能更容易地监控服务质量,发掘用户声音,实现安全过滤等等。今年6月,这个由人工智能支撑的客服,陆续在淘宝和蚂蚁金服上线,反响很好。
初敏所研发的是一套自然语言基础技术平台,阿里各个业务部门可以调用它来开发不同应用。这个技术能力激发了业务部门的想象力,甚至在钉钉上用它来识别电话没有拨通的原因。
对于初敏来说,今天的工作还仅仅是一小步。以机器人助手为例,要实现像贾维斯那样强大的助手,是个复杂的系统工程,要把小块技术很好地集成在一起。“除此之外,今天秀个机器人助手的DEMO很容易,但当你面对5亿用户,每个人都有个性化需求,要单独建模,得出5亿个结果,计算规模是非常庞大的。”
“不过,我们很兴奋地来做这件事。阿里有丰富的数据,云计算基础架构,还有靠谱的团队,接下来就是如何有效地协同起来。”初敏说,在经历阿里内部各种应用场景的打磨后,语音和自然语言交互的技术平台对外开放将为期不远。
“最后一步”
不过,在阿里已有人工智能团队正在将平台开放。今年8月,阿里云发布国内首个人工智能平台DT PAI。它的目标是帮助客户“用数据驱动运营”。这套机器学习算法已在阿里零售、广告、物流、金融等关键数据场景发挥作用,像快的打车对司机的派单、阿里百川计划的精准营销等,每天不知要调用DT PAI多少次。
DT PAI的目标是实现人脑的两个功能——学习和决策。
“无论是天津爆炸案,还是道路碰瓷,从逻辑上讲,完全可以通过机器学习实现预警或判断。”DT PAI负责人韦啸说,“这是我们做这件事的原动力。实际上,今天各种数据已经放在那了,我们还有最后一步就爬上去了,为此,我们正在开放有价值的服务平台。”
8月底,国内外一批重要公司、科研机构和大学开始试用DT PAI。9月底,DT PAI支持新浪微博与阿里巴巴的天池大赛。新浪微博将开放300万用户脱敏数据,参赛者根据用户一周内发布的内容和对应的转发、评论、点赞数,建立分析模型,预测用户后续博文发表一周后的互动情况。参赛所调用的算法由DT PAI平台提供。经历一系列试商用后,韦啸希望DT PAI近期会对所有用户发布。
“所有数据应用,包括人工智能,都是数据+数据的操作。”韦啸非常技术化,他给记者演示在DT PAI中创建一个实验,也就是一个数据应用的过程。在一个类似软件IDE的开发环境中,韦啸通过鼠标拖拽的方式,选择了要输入的数据,然后选择不同的算法组件,像逻辑回归、数据森林等,通过对数据和算法组件连线的方式进行操作,没有编写一行代码。在8分钟内,实验训练了一批数据,建立了分析模型,并给出了预测。从演示看,DT PAI把计算放在大规模分布式计算阿里云上,在计算效率和规模上得到保障;DT PAI还覆盖机器学习和人工智能的整条链路,不必像以往那样在不同软件和环境中切换,没有损耗,也比较易用。
韦啸现在工作的重心是围绕DT PAI建立生态。“技术能力对外输出,不仅是产品化,关键是平台化。技术一旦平台化,才会有更多人到平台上来贡献工具,这会让人工智能、机器学习更加普适,给广大用户带去价值。”他说,“进化本身就是信息交换,大家彼此分享,一起优化,进化的脚步才会更快。”
今天DT PAI提供的组件,都是阿里巴巴内部场景沉淀下来的算法。近期,它们将开放编程框架,这样,第三方也可以提供算法组件。未来,当一个用户进入DT PAI平台后,他可以看到阿里巴巴的组件、用户自己开发的组件和通过授权获得的第三方组件。
韦啸坦言,目前还在摸索DT PAI服务的商业模式。因为人工智能或机器学习服务才刚刚开始,为了让它为更多人所用,DT PAI收费模式将与阿里云其他计算服务的收费模式一脉相承。“同时,我们也认为,高质量算法应该得到它应有的价值,因此,会为平台上的开发者考虑一个更好的商业模式——他们有自己的定价权,我们也会杜绝盗窃。”他说。
韦啸希望他们能像App Store一样,建立一个良性市场机制,来驱动生态的发展。
运营数据
从总体上看,阿里的人工智能布局与它提出的“DT(Data Technology)时代”战略非常吻合。马云在今年的数次演讲中提到,人类正从IT时代走向DT时代,这里的“D”不是Digital,而是Data。未来支撑机器的不是石油电力,而是数据,而阿里巴巴多年以来就是大数据的红利获得者。
而利用人工智能技术,数据将流动起来,从“死数据”变成“活数据”,实现价值。现在,人工智能在阿里就像是一场数据、计算和人之间开展的“联合作战”。由大规模分布式云计算、GPU集群实现的巨大的数据吞吐力,吞噬着每时每刻产生的业务数据。在这里,几千小时的数据实验在一天甚至更短时间内就能吐出计算结果,加入到反馈环中。对用户而言,今天淘宝对你的推荐,背后的数据决策与昨天已经不同。数据正在帮助企业实现运营。“最终,数据运营将变成运营数据,就像今天金融业运营美元一样。”韦啸说。
对于广大企业,人工智能技术正扑面而来。它们要做好哪些准备?初敏建议,企业首先要尽可能把数据存下来,然后,再考虑如何与业务挂钩。有了开放的人工智能平台,企业要考虑的是如何把一个业务问题变成一个数据模型,但它不必考虑底层的人工智能算法、数据计算和存储,也不必担心数据规模问题。
接下来,阿里将陆续对外开放深度学习能力,深度学习在文本、图像、视频、语音处理上都产生了令人振奋的效果,它让人类实现运营数据的愿景更进一步。
责任编辑:大云网
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网
-
新基建助推 数据中心建设将迎爆发期
2020-06-16数据中心,能源互联网,电力新基建 -
泛在电力物联网建设下看电网企业数据变现之路
2019-11-12泛在电力物联网 -
泛在电力物联网建设典型实践案例
2019-10-15泛在电力物联网案例
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
能源革命和电改政策红利将长期助力储能行业发展
-
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网 -
5G新基建助力智能电网发展
2020-06-125G,智能电网,配电网 -
从智能电网到智能城市