谈数据挖掘在企业信息化中的认识误区
3.只要有了数据挖掘工具,就能自动挖掘出所需要的信息
这是人们常有的一个认识误区。数据挖掘利用了统计和人工智能技术的应用程序,它把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。虽然如此,人们仍然需要知道所选用的数据挖掘工具是如何工作的。换句话说,数据挖掘永远不会替代有经验的商业分析师或管理人员所起的作用,它只是提供一个强大的工具。数据挖掘决不会在缺乏指导的情况下自动地发现模型。数据挖掘工具要做的就是使这些模型得到的更容易、更方便,而且有根据。比如客户关系管理,不是只设一个客服专线,更不仅仅是把一堆客户基本数据输入计算机。一个完整的客户关系管理运作机制在相关的硬软件系统功能健全的支持之前,要有大量的数据准备工作与分析过程推动。
迈克尔·J·A·贝里和戈登·S·利诺夫指出,通过4种有效途径可以实现数据挖掘技术在企业中的专业化应用,即:从企业外的制造商处购买与企业商业问题配套的评分机制,购买实施整体解决方案的数据挖掘软件,针对特定问题聘请外部专家完成预测模型的建立,以及在组织内部掌握数据挖掘技能。他们认为,从公司长远发展考虑,最后一种方法应作为企业首选。因为这将促使企业把数据挖掘视为企业的法宝,并通过它将客户关系管理推向企业战略的核心。鉴于此,一个企业想要在未来的市场中具有竞争力。必须有一些数据挖掘方面的专家,专门从事数据分析和数据挖掘工作,再同其他部门协调,把挖掘出来的信息提供给决策者参考,但国内的企业还很少有决策人员认识到这一点。如果管理者没有这方面的意识,数据挖掘就很难发挥其应有的作用,且很容易走向两个极端:一是认为数据挖掘没有用处,二是认为数据挖掘是万能的,而得到的结果往往与初始期望相去甚远。
4.企业开发、运用数据挖掘的结果是可以预期的
这也是企业界对数据挖掘认识上的一个惯常误区。实际上,企业界运用数据挖掘要受许多因素的影响,例如,不充足的教育训练、不适当的支持工具、数据的无效性、过于丰富的模型、多变与具有时间性的数据、空间导向数据、数据的衡量性等。面对易变的环境,没有立刻能用的现成的模型,数据挖掘的本质是发现非预期的模式,同样,非预期的模式要以非预期的方法来发现,更不能期望按照程序即能成功。因此,要分析一些潜在的因素,如数据取舍、实体关系性、数量多寡、复杂性、数据质量、可取得性、专家意见等因素,才能做好挖掘工作。此外,所有通过数据挖掘发现的知识都是相对的.是有特定前提和约束条件且面向特定领域的。对于数据挖掘而言,需求牵引、市场驱动是永恒的,而对于企业应用数据挖掘而言,面向客户、讲求实际才是最主要的。
5.数据挖掘是企业商业智能的核心
简而言之,商业智能是能够帮助用户对自身业务经营作出正确明智决定的工具。不可否认,数据挖掘可以增加企业智慧,提升企业竞争优势,是企业走向智能化的重要组成部分。但是一个完整的知识挖掘过程牵涉大量的规划与准备,包括理解数据、融合与核查资料、去除错误或不一致的数据、发展模式与假设、实际数据挖掘工作、测试与审核所挖掘的数据、解释与使用数据等,从这个角度看,数据挖掘只是知识发掘过程中的一个步骤而已,而达到这个步骤前还有许许多多的工作要完成。
从技术层面来看,商业智能的技术体系包括数据仓库、在线分析处理(OLAP)以及数据挖掘3部分。所谓数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合.它提供在线分析处理或数据挖掘所需要的、整齐一致的数据,用以支持经营管理中的决策制定过程。OLAP则是帮助分析人员、管理人员多种角度地把从原始数据中转化出来、能够真正为用户所理解的、并真实反映数据特性的信息,进行快速、一致、交互的访问,从而获得对数据更深入了解的一类软件技术。而数据挖掘是一种决策支持过程,通过高度自动化地分析企业原有的数据,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,作出正确的决策圈。这三者的关系如图2所示。
图2 数据挖掘、OLAP、数据仓库之间的关系示意图
由图2可以看出,数据仓库是商业智能的基础,它是一个环境,主要提供用于决策支持的当前和历史的数据;OLAP属于数据仓库应用,它以数据仓库为基础,其分析结果可以为数据挖掘提供分析信息,作为挖掘的依据;数据挖掘则可以拓展OLAP的深度,可以发现OLAP所不能发现的更为复杂细致的信息。可见,只有将数据挖掘与OLAP、数据仓库结合起来,才能使企业的许多业务流程实现智能化运作。离开了数据仓库和OLAP,商业智能无从实现,因此,数据挖掘、OLAP与数据仓库均是企业商业智能的核心技术。
责任编辑:叶雨田
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网
-
新基建助推 数据中心建设将迎爆发期
2020-06-16数据中心,能源互联网,电力新基建 -
泛在电力物联网建设下看电网企业数据变现之路
2019-11-12泛在电力物联网 -
泛在电力物联网建设典型实践案例
2019-10-15泛在电力物联网案例
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
能源革命和电改政策红利将长期助力储能行业发展
-
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网 -
5G新基建助力智能电网发展
2020-06-125G,智能电网,配电网 -
从智能电网到智能城市