邬伦:瞄准智慧城市挖掘地理大数据,社会感知大有可为
北大遥感楼建于上世纪八十年代初,是我国第一栋以遥感冠名的的科研楼,在春光的映衬下,灰白的外墙爬着春藤,显得历史感十足。它静默地矗立于未名湖畔,博雅塔前,见证数十年间学者们在3S领域探索与奋斗的点点滴滴。
没有电梯,邬伦教授领着大家从一楼逐级上到四楼,穿过楼道打开一间贴着“邬伦”姓名标识的办公室,阳光豁然间就跳了进来。
东西两面墙分别挂着一幅世界地图与中国地图,隔着一个大办公桌和一个小茶几两两相望。北边靠墙是一大排被填得满满当当的书柜。事实上,书柜之外的其他地方,包括办公桌面甚至地板上,都堆着形形色色的书籍、资料和各式遥感卫星模型,陪伴着一位教授的日常。
一进门,邬伦教授就开始致歉,第一是因为他的忙碌,让采访时间一再延迟,第二还是因为他的忙碌,主人久未回归的办公室落了不少灰尘,并不算是一个好的待客场所。
然而,你只消看一下接下来的一长串头衔,就会明白邬伦教授为何如此忙碌了:北京大学教授、博士生导师,数字中国研究院副院长,遥感与地理信息系统研究所副所长,兼任国家测绘地理信息局科技委委员、联合国开发计划署(UNDP)项目专家、联合国国际粮农组织(FAO)GIS顾问、国土资源部信息化专家委员会顾问、住建部数字城市专家组成员……身兼多职,邬伦教授还带领成立北京大学Geosoft实验室,承担多项国家攻关、863、自然科学基金等重要科研项目,以及来自于不同领域的横向研究课题。而这也是国内高校最早从事地理信息系统教学、科研和实践的实验室之一。
作为第一代开展国产GIS软件研发并推进应用的专家,邬伦教授见证了我国GIS软件从无到有和GIS产业蓬勃发展的整个历程。
对于当初为何选择“地理信息系统”作为自己的研究方向,邬伦教授如是说:“这个学科在国内起步相对国际较晚一些,上个世纪80年代初,由陈述彭、承继成等几位老先生倡导开始研究发展。我1984年就读地貌专业研究生的时候,国内还没有这个学科。当时,地理学研究更偏于定性而非定量,描述性研究居多。计量地理革命虽然已于六、七十年代提出,但由于缺乏数字化工具手段,前行缓慢,举步维艰,甚至出现了地理学危机的说法。新兴的遥感与地理信息技术为地学发展提供了前所未有的定量化良机。”正是认识到这一点,进入硕士生后期和博士阶段时,在地理学家王乃樑先生、遥感信息学家承继成先生和地貌学家韩慕康先生指导鼓励下,邬伦逐渐转向了地理信息系统,并将其用于定量地貌分析。1990年取得博士学位后,邬伦又在北大数学系应用数学与信息科学专业,跟随数学泰斗程民德院士进行博士后研究,进一步夯实交叉学科基础。1992年邬伦回到城市与环境学系(原地理系)筹建GIS研究室,并于1997年在北大主持创办了国内高校第一批GIS本科专业。期间,邬伦作为主要人员推进了我国最早的自主GIS软件Spaceman(1988,DOS版)和CityStar(1992,Windows版)研究开发,促进了环境、水利、气象、地矿等众多行业的GIS推广应用。三十余年弹指一挥间,如今中国的地理信息产业发生了翻天覆地的变化,中国的GIS软件技术和应用也开始在世界范围内崭露头角,并与IT新技术结合得越来越紧密。邬伦教授的研究领域也从3S逐渐延伸到大数据等前沿技术。
邬伦教授认为,如何从大数据中挖掘动态时空地理信息是地理信息科学的前沿方向,在地理国情普查、智慧城市建设等国家与地方重大任务中有不可或缺的作用。同时由于人们的日常生活与地理位置高度关联,以地理位置为聚合框架,将地理大数据叠加其他数据,可以为城市运行和智慧生活提供更好的保障与服务。例如,在节假日黄金周,利用手机基站定位信号能掌握绝大部分人的活动情况,新型地理大数据挖掘将有效分析预测景点游客时空分布态势与演变规律,提前做好引导与防范工作。
在采访中,邬伦教授就基于地理大数据的社会感知研究和应用方向与《超图通讯》编辑部进行了交流。
对话邬伦
01、您这么忙,最近在关注什么课题?
近期我主要关注基于地理大数据的社会感知研究与应用。以前我曾说过,3S结合是两只“眼睛”(RS、GPS)加一个“大脑”(GIS)的模式,遥感看到什么,大脑才能接收到什么。但是,传统的遥感和测绘方式获取的是偏自然和物理的信息,如房屋、土地、树木等。随着互联网、移动通信等发展,产生了大量新型地理大数据,如手机定位、签到、公交刷卡等,能实时反映出人员的移动变化、出行时空规律等。我们可以利用这些新型的地理数据来感知社会和人文经济层面的动态信息,我们称之为社会感知。可以这样认为:人是社会感知最小单元,手机等终端是新型传感器,通过采集各类多通道的(精确到个体和汇集成群体)的数据,将构成人类时空行为识别与区域社会特征分析的新型遥感基础。目前,在我们实验室已经形成了一个包括几位教授、副教授和二十多位研究生的团队,由刘瑜教授具体牵头开展理论方法研究,并已有了一定的国际影响。
02、为何要做这样的研究?
我国城市化的进程很快,由于信息感知不够及时全面,信息系统孤岛林立,没有动态大数据集,城市规划与管理决策很难做到科学精准,造成各种各样的城市病,如交通堵塞、雾霾严重等,甚至一场暴雨就演化出灭顶之灾,突发事件常得不到及时响应,鲜有预见性,更谈不上前端治理和防患未然。
要解决这些问题,一定要反思过去数字城市建设的不足之处,厘清未来智慧城市建设的关键所在。数字城市虽初见成效,但不能动态更新的死库不少,信息管理对“物”而不对“人”,缺乏定量的人地关系,信息把握不全,只能头痛医头脚痛医脚,无法综合地理科学决策。因此,建立全面的动态感知体系,尤其是加强地理大数据分析和社会感知研究,解决人地关系定量化的短板,是智慧城市建设的一个关键环节。
03、如何诠释大数据和地理大数据?
关于大数据特点,人云皆云有4个V(Volume、Velocity、Variety、Value),好像把数据堆在一起形成大数据集就可以了,但是我并不认为这些就是大数据的实质内涵。
我理解的大数据本质特点,可以借三个通俗词汇来概括:一是“跨界”,即把一个领域的数据和处理方法拿来用到另外一个看起来不搭界的领域,得到新的发现。比如利用谷歌搜索引擎数据来进行禽流感的预测。二是“混搭”,将多领域(本领域、他领域)、多途径(传统获取方式、物联网方式、互联网+方式等)数据汇聚,以满足综合应用需求,如多规融合等。三是“算命”,从所有经典案例来看,大数据的提出很“功利”,目的性很强,都是要预测的,如预测未来机票价格走势、预测禽流感时空分布等,因此,只提建大数据集不提预测应用等于“耍流氓”。然而这种预测并不是基于因果关系,而是建立在关联关系的基础上,不能做到绝对准确,只是有一定置信水平的“算命”,所以不可盲目迷信大数据,胡乱挖掘解释大数据有可能是挖了埋自己的坑。需要客观了解数据、不断积累数据和不断挖掘学习,提高置信度才有实用价值。
大数据的作用意义亦可用两个俗语来概括:一是“变废为宝”,本来在一个领域用完价值的数据,由于“跨界”到另一个领域成了不可多得的“香饽饽”。信息获取从来都是信息化最花钱的环节,却往往在一个部门“一次性消费”,浪费巨大。大数据跨界应用将在信息化领域实现“循环经济”,效益无限。二是“众人拾柴”,大数据纲要的国家政策导向和大数据“混搭”展现的示范效果日渐人心,“众人拾柴”的大数据理念共识将用高涨的火焰烧破最后的信息壁垒,在更高的层面上实现信息化领域多年的信息共享梦想,合纵连横最终实现1+1远大于2的信息化价值目标。
地理大数据可分狭义和广义两类,前者是手机定位、签到、酒店入住等“跨界”而来的新型空间数据集。后者是多种新型的、传统的(遥感测绘等)多专题地理数据“混搭”形成的数据集,如城市大数据、国土大数据等。
需要防范装扮成大数据的“伪娘”,曾见过有篇探讨遥感大数据的文章,细观之数据源还是传统的航空或卫星影像,处理方法也还是教科书上的那些几何校正、图像增强、监督分类等等,除去套在头上的4V帽子,并无本质不同,也就是数据“大”罢了,或曰“假”大数据。
04、目前研究取得了哪些成果?
我们提出了社会感知概念:以人作为最小粒度的感知单元,以各类手机定位、社交媒体、出租车轨迹、公交刷卡等地理空间大数据为数据源,基于并扩展GIS空间模型和分析方法,通过数据融合、机器学习等手段,提取人的时空行为模式、空间交互模式、区域演化模式,反演人文及社会经济要素的地理空间特征(如组团特征等),定量刻画和揭示人地关系,从而为地理学科发展提供新的技术支撑,为智慧城市规划决策等应用提供依据。目前已初步形成一套理论框架体系,包括感知传输层、数据管理层、行为模式层、地理空间特征层、专题应用层等。
05、研究这一课题的未来应用方向在哪里?
智慧城市在全国已广泛开展建设,这是未来重点应用方向。如果一个城市要像人一样有智慧,首先必须全面感知信息,不能是一个“瞎子”或者“色盲”,社会感知平台在智慧城市动态感知体系中不可或缺。其次,能够综合判断运筹,要有“中枢大脑”,把一个城市各种各样大数据汇总关联起来,包括自然的、人文的、经济的方方面面,大约有20多大类、400多小类,形成一套完整的城市动态体征大数据集,可以实时诊断城市运行态势,再通过机器学习和关联分析等,形成知识库和模型库进行各种预测,才能真正实现城市的智慧决策,并可为企业商务智能、公众智慧生活等提供服务。
责任编辑:沧海一笑