大数据驱动时代 云计算 规模化 高性能计算

2013-10-25 13:33:42 ZDnet   点击量: 评论 (0)
不久前的一次互联网大会上,与会人员已经明确将重点放在扩大网络带宽和通过网络的增强提高合作方面,这将带来更好的视频会议和其他大数据应用。  这些活动使企业都意识到他们将为大数据创造更大的网络管
,以确保每个人都遵循相同的大数据政策和程序,以便让企业所需要的大数据类型被存储、收集,并符合其最终的经营宗旨。
  所有上述这一切都是艰难的,劳动力密集的工作,可能并不总是出现在项目的时间表里,但却是必不可少的。
  IT部门如何确保其管治满足大数据发展的步伐?
  协调监管和审计,提前确保你的企业所管治的大数据是最新的。同时也必须意识到,未来相关管理法规的变化,可能会影响数据治理。
  大数据项目是跨学科的,因为大数据的有效管理是每个人的责任。
  由于这些工具的灵活性,这些工具现在也正在为企业提供一个直接与大数据整合的平台,如Hadoop和Cassandra(一个混合型的非关系的数据库)。然而,现在我们看到,老的供应商也开始在以新产品打入市场的堆栈来解决这一差距,并希望在未来一两年内再次洗牌,重新巩固市场。
  在大数据领域,高性能是一项特别的挑战。大数据量的特质和查询速度使得数据将通过仓库工具Hive进行整合,这意味着直接针对数据的查询将抑制工具的动态性能。
  这些工具的关键用例是快速的发现而非创造标准的报告。这意味着所需的数据在本质上是暂时性的——需要支持一种假设,然后丢弃。这导致了实现高性能的领先方案是创建特定的数据集,例如,通过引导图减少工作量,以及捕捉可视化工具中的内存。
  可视化工具的一个关键性的好处是,他们改变了项目交付的方法。因为他们允许通过原型快速实现价值可视化,他们能够在被纳入一个工业化的平台之前,在低成本点证明价值。作为这一进程的一部分,可视化工具提供了一个共同的语言,通过它,企业的IT部门和业务部门可以进行沟通。这就创造了一个对于需求的清晰的认识,有助于设置什么能够被交付的期望。
  虽然能够实现数据的快速可视化有很多好处,我们也看到创建Excel电子表格或者Access数据库进行数据库访问所存在的一些老的内在危险问题。鉴于此,支持大数据可视化必须采用一个强大的数据管理方法已经是一个不争的事实。
  这将创建一个混合环境的需要。在实践中,这意味着数据首先是在大数据环境下进行探索;然后,如果这些探索揭示了某些数据报道所需要的价值,此时数据才被推广到传统的关系型数据库,无论是MPP或内存中的。
  不容忽视的最后一个方面是,这些工具对于业务部门和IT部门之间的关系所产生的影响。可视化工具将授权业务,从而帮助企业业务部门实现快速的见解,并驱动更高价值的数据资产。因此,IT部门将需要以一套更加灵活的方式来提供数据。
  这将创建一个二分法。一方面,必须迅速提供信息,在更传统的过程以外驱动价值。另一方面,一旦解决方案需要工业化,还需要通过更传统的项目进行刚性的治理。未能达到适当的平衡,会导致挫折和价值的明显减少。
  两个部门都有其自己的责任:业务部门需要建立适当的洞察见解,并确保以企业正常的运作方式驱动变革,而IT部门需要提供一套适当治理水平的数据服务。
大云网官方微信售电那点事儿

责任编辑:廖生珏

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞