腾讯科技讯 11月27日消息,由商业价值价值和ITValue联合主办的2012中国大数据创新峰会暨第二届中国技术商业论坛、2012年度技术商业评选颁奖典礼、2012年度最具价值CIO评选颁奖典礼于11月24日在北京召开。下午举行分论坛大数据与商业创新,Informatica孙大山介绍最大化大数据投资回报。
孙大山:大家好,我是Informatica中国区资深技术顾问大山,很高兴能够参加今天的论坛。
Informatica是一家专注于数据集成、数据管理领域的软件提供商,我们的宗旨也是帮助企业能够为我们企业当中的业务应用提供及时、快速、可靠、准确地数据。因此我的话题肯定离不开数据。
首先看看我们公司提倡的价值主张,也就是说我们提倡最大化的实现数据的回报率,通过什么样的方式呢?一、提升数据的价值,二降低数据的成本。
我们知道在一个企业当中,无论是大到战略规划还是小到一个业务需求的实现,都脱离不开对数据的要求、数据的基础,特别是在现在这样一个瞬息万变的时代,数据已经变得比以往更加重要。而作为我们在座的可能更多的是IT方的人员,IT部门一个重要的任务就是为业务提供规定的数据,这个任务可能听起来比较简单,我需要什么数据你给我什么数据就OK了,但其实往往在工作当中并不是那么容易实现的,因为我们的数据总是以各式各样的形式、各式各样的状态被保存、锁定在一个个的数据孤岛当中,比如说企业当中的一些系统,或者一些商业应用系统,还有我们现在的云,有些数据可能在云端,另外现在正蓬勃发展的交互性数据,在这样的情况下如何进行有效的数据集成,这就给我们IT带来了很大的难题。
刚好Informatica恰恰在这方面为我们提供了完整的平台、完整的解决方案,帮助我们无论从企业外部的社交网络、社交媒体还是合作伙伴的系统当中,在所有的数据源当中可以轻松地获取到我们需要的数据,来进行数据的集成和数据的管理。
Informatica的数据集成、数据管理平台也从包括及时、可靠、可信、权威等等几方面来保证我们实现数据价值的最大化,通过这种流程的自动化降低我们在硬件、软件、存储以及人力方面的成本投入。
Informatica进入中国已经7年的时间,这之中我们积累了非常多的优质客户,我们也帮助很多客户成功地实现了数据回报率的提升。比如说上海电信,借助Informatica的解决方案,通过对自身数据系统的清洗和整合,大大提高了数据处理和数据响应的效率,整体的提高了业务运营的效率。像广大证券,我们帮他们实施了整个平台的建设,能够使他们对企业内部的关键数据做到及时的访问,降低了整个业务的风险。还有其它的很多一些案例我在这也就不一一介绍了。
接下来看看我们正在面临的或者正在经历的怎样的技术变革,这里主要有三个技术方向,包括云计算、社交计算、移动计算。
对于我们IT行业来讲,我们可以说这是第一次经历这样一个全面的重新定义这三个内容的时代,包括地点、事件、方式,这种变化对于我们来讲是一个全新的也是巨大的变化。首先是地点,在以往我们的数据基本上可以说都是存储在我们企业内部的应用系统当中,而现在越来越多的应用程序、越来越的交易数据在向云端迁移。过去我们处理的数据更多的是企业内部的交互数据、交易数据,而现在逐渐拓展到了社交媒体数据当中。另外,对于这种数据处理的方式,原来是PC,个人电脑一统天下的局面,而现在更加的多元化,推广到各种的智能终端,可以说这种变革让我们重新认识了我们的数据和我们的数据计算。
对于云来讲,其实云计算的价值主张可以说是比较吸引人的,通过规模化的经济为我们提供了一个低成本但是更加高效、更加好的结果,因为这些云提供商相对来说都比较专业,而我们自己不需要搭建整个的平台,我只需要买一个帐号就可以登陆进去直接使用比较专业的服务,得到比较好的结果。而且形形色色的云提供服务商,各式各样的云平台的提供商也让我们有着多样化的选择,这也难怪我们有很多的商业应用以及我们很多的交易数据在不停地迁移到云端。
云的进一步发展其实也从一个层面更加推动了我们交易数据本身就已经持续增长的交易数据进一步的增长,因为原来这些数据存在企业的本地、内部,我还有一个很大的顾虑就是成本,但是现在这个成本的影响对于我来说已经很小了,那么我企业当中交易数据的增长就会呈现一种新的势态。在这方面,面对云计算、面对云,我们所面临的挑战是什么呢?除了安全方面的因素以外,另一方面就是我们如何对我们的数据进行控制,特别是对我们在云中的数据进行控制。
云不可能说是完全替代传统的所有应用程序、应用平台,就像大机替代不了小机一样,但是一个新的云计算平台的出现导致新的应用数据会更多的出现在新的平台之上,而我们以往的传统平台又不可能丢弃掉,可能服务器会淘汰,但是当中的数据是不可能直接扔掉的,这就是说我们如何进行云数据和企业内部应用数据进行整合、结合。在这方面,Informatica平台最新推出了整个换新的云数据访问架构,通过这个我们可以轻松扩展访问任何云当中的数据,以此来实现灵活的实现把企业内部的数据与云中的数据进行整合、结合。
接下来就是社交计算,原来我们注重的是对我们企业内部的交易数据进行分析,更加注重的是一个企业的运营效率的管理,通过对我的业务分析、操作自动化来提升整体的运营效率,进行整体的业务管理。但是当社交网络出现之后,为我们企业的数据分析带来了一片新的天地,我们不仅仅再局限于我们本身的交易数据、事务数据,而可以更多的把目光投向社交互动的数据。从社交网络当中发现企业管理新的模式以及全新的数据分析角度,包括我们通过社交网络当中的社交数据的分析、通过对这种数据的关注来进行企业的管理、企业品牌、市场的管理等等,为我们带来了一个全新的数据领域。
这是给我们带来的机会,那么给我们带来的挑战是什么样的呢?因为社交数据并不是存在我们企业内部,也并不是我们企业自己拥有的数据,这就有了一个访问的问题。接下来对于社交数据来讲,它不再是我们传统的所熟悉的这种二维关系型的表结构的数据了,而更多的是各式各样的非结构化的状态,我们如何将这种非结构化的数据转变成我们便于理解、阅读、操作的数据呢?当然这也是Informatica为我们带来的一个功能。在Informatica整个的平台当中,首先我们提供了专门针对社交网络的数据接口,我们可以实现直接从社交网络当中获取相关的数据,其次针对这种非结构化的数据,我们可以实现有效的转化、格式的转化,可以将它转变成行列的二维关系格式,便于我们之后的处理、分析。
简单说一下移动计算,我们现在大家也都发现了,在我们个人的生活当中或者说个人的工作当中,PC机已经变得没有那么重要了,可能我们使用个人电脑、使用PC机只是一些简单的稳当处理,每天可能用不了多长时间,而我们更多的时间都被一些新兴的移动终端所占据,这些新的移动设备为我们带来的是一个前所未有的数据浪潮,它的数据规模是我们难以估计的,并且我们相信它会持续不断产生新的、大量的数据。
对于这些移动数据来讲,我们如何使用?同样也是给我们的一个挑战。对于这种大量的数据,比如说我们的网络日志、点击流等等,我们如何使用这些数据呢?这是一个很大的话题,在这里我只不过简单地提两句。当然也是从Informatica整个的平台的角度出发,我们可以帮助我们的企业有效的获取到这一部分数据,然后进行数据的检测,探查其中与我们感兴趣的事件相关的信息,并且可以自动化的响应。比如说我们获得一些数据,我们就可以进行非常精确式的客户营销等等。其实我们希望为企业提供一个新的功能,能够使我们有效地将这些数据应用到企业的发展当中去。
以上我们所探讨的三大技术方向都引领着大数据的崛起,大数据也被称为是下一步创新的前沿,大数据为我们企业带来的是无限的可能以及巨大的挑战,这就看我们如何应对它。
这是一项调查,截止到2015年,在全球500强企业当中,仍然有85%的企业无法有效地使用大数据当中所蕴含的竞争优势,但其实这东西也只是预测,因为现在才2012年,这个世界变化这么快,我们什么也不能说。更重要的是我们现在是否已经意识到大数据的到来,或者说是否已经开始为大数据的到来做准备,这是最重要的。
那么什么是大数据?大数据是由三个相关的但是并不相同的技术趋势的总称,包括大的交易数据、大的交互数据以及大数据处理,大的交易数据是以我们传统的那些分析型的数据库为代表的大的交易数据,而大的交互数据正是我们刚才所提到的社交数据、计算数据,大数据处理的典型代表就是我们所谈到的、我们所热议的Hadoop,由这些共同组成一个完整的大数据的定义。
其实这三块每一块都是一个创新的突破,将这三块组合到一起,给我们所带来的影响是非常巨大的,深刻的变革。这个也是Informatica的用武之地,因为我们在大数据的推动下势必会推动下一波的数据需求,而Informatica正是这一块的强中之强。我们在去年推出了专门基于大数据的版本,今年也做了重大的更新,在这方面我们意在为企业客户提供这种应对大数据的整体解决方案,帮助我们企业实现大数据价值的最大化以及降低大数据应对的成本。
接下来我们看看大概有几个方面或者说几个步骤来进行大数据的应对。我们要谈到数据集尘、数据整合或者说要谈到数据管理,第一点就是数据访问,Informatica通过一个完整并且统一的平台来为我们提供了各式各样的数据访问接口,无论是传统的方式到云端的服务,无论从社交数据到移动计算,还是与企业合作伙伴之间灵活的数据交互,所有这些方面中所涉及到的数据的源、数据的位置,我们都有相应的接口进行覆盖,我们可以轻松通过一个单一的平台来实现所有数据源的接入以及访问。
第二,全新的数据探查的能力,我们可以在不同的数据实体当中发现具有相关性、相似性的业务实体或者说主数据实体,并且可以自动识别哪些数据属于敏感数据,属于需要我保护的,比如说对于企业的机密数据或者说一些客户的隐私数据等等,也可以做到自动的识别以及自动的脱密或者漂白的处理。
第三,数据对于我们来说最重要的一个用途就是用来进行数据分析并且指导我们企业的业务规划、战略规划,数据的分析基础是数据的质量,没有一个好的数据质量,你分析的结果也是完全不可用的,或者说会起到极大的反方向的作用。在这方面通过Informatica的数据质量管理以及整体的工作流的管理,我们可以将IT人员、数据分析师、数据管理人员共同连接到整个的数据质量处理流程中来,让他们一起工作,一起进行数据质量的提高及数据质量的分析。
为了得到一个统一的完整的数据示图,我们数据集成是非常重要的一步,在这里通过Informatica数据集成的平台,我们可以实现各式各样的数据集成方案,包括批量的、增量的、时时的、流数据处理等等,以此为我们下游的应用、为我们的数据分析提供准确的、及时的数据。
通过Informatica最新发布的自然语言识别以及概率数据分析的功能,我们可以做到针对数据中的人、地点、事件等信息进行跨语言的模糊识别分析能力,这种在我们很多方面都是非常有用处的。
最后,融合了对Hadoop平台的支持,我们也是在今年推出基于Hadoop的平台框架,通过这样的方式,Informatica已经为我们企业做好了应对大数据的准备,通过这样一个完整的数据集成平台,我们可以有效地对我们所需要的数据进行有效的访问,进行强大的集成,包括将这种结构化与非结构化数据的整合,通过这种B2B的数据交互,可以实现企业与合作伙伴之间,或者社交网络与移动设备之间的数据访问、数据交互,另外通过数据质量产品来保证我们数据的可靠性,通过信息生命周期管理保障我们数据的安全性,这就是Informatica整体的数据解决方案平台,我们也可以看到,在这个平台中的每一个产品都可以帮助我们的企业提升我们数据的价值,降低我们数据的成本,我的演讲到此结束,谢谢大家。









