您现在的位置是:首页 > 数字化转型 >
北航怀进鹏:云计算与网络技术的机遇与挑战
摘要北航怀进鹏:云计算与网络技术的机遇与挑战...
怀进鹏:谢谢陈司长。各位来宾上午好!非常荣幸有机会和各位一起交流一下我在这一方面的一些理解和思考,有不当之处请各位批评指正。正像这一次会议的主题,把握机遇、创新发展,在最近几年里,在IT领域一直有一些热点的问题,也引起社会产业界和学术界的广泛关注,在一些方面正在开始大规模的应用和技术的探索。比如说在云计算,在CPS,智慧地球,网络安全,物联网等等,面对这样的一些新的概念,新的应用,以获知背后很多技术,究竟中国IT产业如何应对和发展,特别是结合中国信息产业的发展,在战略性新兴产业方面主要的热点技术问题背后的内容应该是什么?如何更有效的分析当前信息技术在快速发展、应用模式在不断创新所带来的最重大系统技术问题的一些再深入的思考,以及我们的机遇在哪里。所以我个人觉得,在当前的情况下,中国的软件技术应该如何发展,也许我们随着国际的大的背景一起去发展,这也许也是我们为别人做注解它的发展合理性和作为应用示范,也许在这样的背后我们看到共同的本质规律来寻找中国和世界的发展的机遇。
我向各位汇报的工作主要有三个方面:第一,互联网发展路在何方。第二,当前热点背后的动力。第三,结合我个人和所参加了解的工作,对未来网络化软件的机遇和问题在哪里谈一下。
当前我们都很清楚,前一段时间对IT领域是否仍能像以前那样有效来影响社会经济的生活,影响技术的发展。有很多预测和有新的规律,特别是由于社会经济生活中的一些大的问题,像能源、气侯问题出现以后,对IT技术还是有不同的想法。我个人认为IT领域仍然主导着全球高技术的出口和风险投资的重点,从最近几年来凤县投资和高技术出口方面所占的比例也是最大的。
第二,互联网的快速的发展,特别是以人为中心所带来应用的转变,对整个IT和应用领域,特别是对软件服务业带来了新的机会。
第三,IT进入了一个新的发展阶段,也就是把人类社会信息世界和物理世界所共同构成的当成新的信息官,从这个角度来看不光是互联网,也有物联网,移动计算,以及从人类社会当中看到的各种社会网络,这里面共同形成了一种人机物和谐的计算环境,这种计算环境也对很多我们过去的技术,新的产业提出了挑战。这是从积极的一个方面。
另外的一个方面,IT的发展也遇到了新的挑战和新的问题,我们分析一段时间技术和理论基础的时候,我们感觉到在IT领域最近十年来遇到靠渐进式改进难以继续发展的重大障碍,也就是说一些技术强会制约在未来五年到十年重大革命性突破。我们知道摩尔定律,从现在的技术和工艺来看只能持续到2020年,IT产业有可能面临新的变革,这也是最近一段时间比较热闹的,从新的计算模式,从计算和存储结构新的应用的方式提出了很多不同的内容,特别是对材料,对工艺,对半导体业带来了新的机会,存储强是第二个技术问题,随着多核处理器的增加,处理器和存储器性能差距又日益扩大,以及在功耗问题成为系统性能和功能的重要的一个因素。我们说在当前的IT技术当中,应用的发展一直是超前于技术的发展,因此对于IT这样一个发展的领域,应该如何来看待它技术后面的新的问题,这个技术强还体现在软件和数据的复杂性,曾经IDC研究报告谈到过这样一个问题,每18个月全球数据量翻一番,存储器的提高远落后于信息增长幅度,导致新的瓶颈,这不仅体现在我们对数据的复杂性的理解和把握,也体现对于大规模软件的处理能力的需求。过去的数据库假设是我们说数据是基本确定的,但是现在数据的采集和获取变得更加容易,各种类型的不确定的数据大量的引入系统,特别是移动和嵌入式系统的出现,给我们在未来的信息技术发展带来了很多新的活力。比如说软件复杂性强,过去网络单纯的单机和大机器系统的软件系统,应该说已经掌握了发展的规律,但是面对网络环境下的软件系统,不确定性导致它的复杂性,比过去传统的软件要更复杂。比如说我们现在常提的网络操作系统和云计算操作系统,它的非功能属性又在进一步增强,在满足基本功能要求的时候可信可靠性,伸缩性等一系列的问题对于系统提出了新的要求。
在互联网面前带来的从开发到服务无缝连接所形成的软件即服务新的应用模式,也为未来软件开发设计维护和在线更新演化提供了新的需求。特别是IT领域面对的一个新的问题,应用规模和资源的共享之间的矛盾,也日加突出,一个方面我们不断购买新的机器,另一方面机器被大量的闲置。CPU被临时率平均不到15%,在这样一个背景下如何来形成新的应用的能力,以解决我们现在都很清楚的电力的成本,已经成为当前数据中心的最重要的成本,大概在40%,而数据中心的用电是世界电能2%,已经成为第五大耗能产业。所以过去的绿色行业现在成为第五大耗能产业,这也深层次的需要我们重新的认识现有的资源的共享和能耗的问题。因此在这样一些背景下,我们怎么看待信息技术应该在重大变革孕育期之后,应该考虑的基础的问题。在基础理论和技术创新巨大的机会,特别是在应用模式的创新和系统技术的集成创新方面,这对中国和新兴产业的发展的后发优势和应用模式创新所带来新的对软件发展的机会,都是非常难得的。
因为我们看到互联网在不断发展和融合中,网络的资源正在不断的扩大,从计算的能力,从接入互联网的用户数,以及主机连接互联网的数,我们可以看到当前的一个互联网基本运行的状态,几乎无所不在的连接了我们所有可应用的内容,这就是我们常说的互联网已经成为全球的基础设施,它不在是简单的通讯、计算的平台,而变成我们的重要基础设施。
第二,当前由于互联网的快速发展,特别是人与社会,人与物理世界的沟通,使得大量的产生大规模的数据。比如说在零售业,每小时产生100万交易,产生2.5个PB的数据,在科学计算当中每秒要创造出40个TB,将在社会网络中大概有四个亿以上用户,在去年2月份经济学人曾经发表过一个专集谈无处不在的数据,特别提到数据在泛滥过程当中对数据的管理,数据的应用,展示数据时代作为新经济当中一个重要的资源,因此互联网的数据将成为国家级和企业的重要资源。我们也可以从另一个角度来看,美国总统顾问委员会在最近十年的报告分析计算机IT领域最盈利,最有增长性的内容,一直在数据处理方面永远是前三位,这都是和数据处理有关的。
所以在当前和未来一段时间,谁拥有大规模真实可运行的数据,并能够做有效的分析处理能力,将会成为一个企业,一个地区甚至一个国家的重要的内容。这种大规模的数据也正在改变着我们过去的研究方法,我在这里举一个例子,比如说微软,曾经花20年数百万美元开展的拼写检查,在谷歌做的时候我们也都清楚一件事实,我们英文讲的好是因为我们英文句子记的多,你多的英文越地道,你对俚语,大量句子使用就是重要的内容。他是基于十个亿大规模数据,已经不对词做检查,而是对整句,所以这个效率和准确性有很大的变化。从这种检查方法我们已经看到,我们过去单纯依靠对查辞典做匹配的方式是有效的,但是在未来的软件技术和应用系统的建设当中,统计物理学,实验物理学,概率分析将会成为软件设计和系统应用当中新的应用的领域。因此保持未来的核心竞争能力,谁拥有了大规模真实可运行的数据,并能够对它进行处理,谁将会具有最强的市场竞争能力和技术竞争能力。在这一点上我们可以看看谷歌是怎么走下来的,看看这些互联网新的巨头出现五一不是和他因为拥有大规模真实和可获得的数据处理能力直接相关的。
在这样一个数据背景下我们说网络作为计算和存储的中心,使得数据中心成为了计算机,因此从大规模的数据作为竞争力的基础,而数据中心成为互联网环境下的新的计算机,而数据中心的发展又成为当前无论是IT领域,特别是在行业,不同的行业当中,数据中心成为服务和计算的主力军,我们看传统的公司,谷歌等企业都在新的提出5000亿次,深入更高能够计算能力和存储能力的计算机和服务器,以支持未来的发展。IBM曾经对全球2600名大企业的CIO做调查,在未来五年内数据大集中和数据分析处理能力将会成为重要的内容。在这样一个背景下如何把计算作为一种公共服务,使得对社会其他的应用领域来看形成一个新的虚拟计算环境,来完成我们所谓的按需访问,按用量付费的新的应用模式。这也许就是我们信息技术,特别是软件技术在互联网应用的背景下,给我们带来的其中一种发展的方式,大数据中心和对数据的分析处理能力,将会成为互联网重要的一个吸纳能力和吸纳计算的重要的基础。
为什么有这样一个背景呢?实际上我们说IT技术的发展,一直有两架马车在推动。一个是重大的应用需求,一个是从技术本身发展的规律,在当前一段时间内,重大应用需求是带动信息技术发展的最重要的动力。从微软对于它的分析来看,提出作为计算机技术IT领域,在过去的发展过程当中经历了三大阶段,它也是从需求角度考虑了,比如说60年代以模拟方针作为基础带动的计算能力,存储能力和软件的发展,到80年代中期开始的以通讯为目标所形成的在电影、机票、订购,电子邮件形成的全球互联网的基础设施的雏形,为后面的大规模应用带来的机会。到本世纪开始以更大的实体虚拟化所建立的面向人和系统之间的交互,成为应用的一个主流,在这样三个背景下,信息技术都有很多的发展和新的革命性的技术的诞生。从IBM前首席执行官认为,它是从IBM的成长和发展的模式,每15年左右要发生一次变革,他是从65年大机器,80年PC95年互联网,以及对当前先后情况下不是硬件为主导进入了一个新的革命性的变化,就是应用模式的变化,这次主题从过去以硬件为主导,开始出现新的转折点,就是软件和服务形成新的方式。如果我们看过去微软从应用的角度看计算的发展,从IBM体系结构,大型机,PC机,互联网来看信息技术对整个应用的带动,那么从现在开始硬件的主导将融入于以服务和软件所提的新的形式。在这种背景下也有当前一段时间,以云计算、智慧地球,以及物联网为代表的大规模的应用方式作为未来及的一种主要的载体。特别是在去年的时候,美国政府又公布了关于美国创新的总统战略,特别强调在信息系统的基础设施的战略的方式,对于未来的IT领域的发展,特别是强调在云计算和移动方面作为主要的发展的平台,并且给出了在未来发展的时间表,就是构造为技术创新所需要的新的应用的内容。
不仅是产业部门,它的国家计划里面NSF投入了1500万来开展关于云计算领域中产学研的合作,特别强调向谷歌,微软、雅虎,IBM这些公司和大学研究方面的结合,以创造出新的发展机遇。因此,我们说互联网的发展,为软件和服务业创造了一种新的模式,它也形成了在当前情况下,计算技术从硬件为主导,向软件与服务为主导的一种新型的转变,这种转变我们再来看软件产业,软件技术的发展的重要节点。在80年代由于PC机的出现,微软作为一个历史贡献的巨人,使软件成为商品。到了90年代互联网的快速出现,以信息交换为代表的新的公司开始在IT领域唱主角。到今天网络服务业开始延伸,网络化软件和服务化软件成为当前软件行业和服务业结合的一个重要的内容。所以我们说当前的软件是零距离的服务软件,而是更有效的需要和应用的结合。因此互联网时代的软件路在何方,我们说互联网已经作为基础设施,数据中心就是一台大计算机,而对大多数人来讲,它主要是购买计算和服务,而不是一台单独的计算机。因此在我们看到网络随处可及的情况下,如何把这样一个巨大的资源,呈现在给用户,而不是我们所需要的计算的设备和存储的设备。因此购买服务而不是购买软件,是软件技术和软件产业转型的重要的内容。
所以如何建立新型的网络计算模式,基于数据中心,强调效能和可信的服务运营模式,来整合和共享资源,提升服务,建立按需服务的模式,来扩展我们低端计算的事物处理能力。由于有一天用不着随身带笔记本和设备,因为各种终端随处可及,我们的手机、车载系统都可以为我们获取信息和处理信息提供重要的支持,因此未来的软件和服务,数据服务应该成为一种新的模式,也就是说过去以硬件或者以网络为运营商的时代开始出现新的软件与数据服务的运营商。这种软件和服务数据运营商实际谷歌和百度已经为我们提供了一个可供借鉴的大规模应用能力。也就是说在用户和服务商方面是没有直接的联系,服务、服务商通过平台把自己的服务进行部署和进行有效的维护,通过软件和数据的服务运营商来对提供的服务进行验证和支持,形成可向社会公开发布的进行软件服务和数据服务的支持平台。运营商更多的是提供这样的运行支撑进行配置,集成、开发和应用组合,以便提供给用户所需要的应用服务。这已经不是我们传统的,这更多的是开放模式下由大规模有数据处理和服务运营能力的运营商来完成的。
最后我想简要的说一下关于未来发展的机遇。前面提到过PC时代创造了微软,微软创造了PC时代软件,最重要的内容是把握住了当时的软件发展的转折点,就是个人机大规模应用。网络时代的转折点第一波已经出现,并且正在开始转化,第一波出现在20年前,90年代后期谷歌的发展,这是以信息交换和初级的信息服务为代表。到今天网络应用的大规?;匀砑?,对系统,对资源提出了前所未有的挑战,就是我们如何管理运行和按需服务,就成为当前软件发展应该是重要的主流的方式。当前在学术界关于网络操作系统的研究,无外乎有三种方式,一个是传统操作系统,仍然基于内核,文件、调度的持续改进和优化,多核操作系统并行调动和优化也是研究重点。但是关于网络化操作系统相关技术,在最近几年的重要的会议当中和期刊当中,都有很多的论述,特别是对云计算体系结构,云存储虚拟化等等有关新的问题开始出现。在这个新的关注的问题当中,从业务可应用型的持续性,数据的锁定,海量数据的传输,性能问题,传输伸缩性的问题都有很多新的论述,这也把我们过去在传统操作系统的功能在进一步有效的延伸。所以我在这里向大家报告一下,我对这方面理解的几个问题,也是我自己和我自己的团队,我们在共同开展的一些工作。就是未来所谓云计算操作系统,在这里面谈操作系统只是借用传统的名词,我理解操作系统并不是我们通常所理解的含义。操作系统的最本质的内容是体现在对资源的调度和分配,也就是说对资源的管理的内容。在过去传统操作系统当中,从以资源管理为基础所发展出来的相应的重要技术和理论基础,形成了操作系统发展的持续的发展和今天的情况。操作系统实际上是面向主机或者单机系统的资源管理一组共性的功能级,当前的技术作为单机管理或者是多机管理的技术,基本处于平台期。但相对的所管理的内容是静态的,集中的,同购的资源,它的商业模式就是微软的模式,以产品的购买和升级为特征。但是作为一个类别来看,在互联网当中,有很多异构的系统,系统是动态的没有边界的,而且我们要提供新的应用模式,是以按需下载,及时更新,产品免费,服务收费所形成的一种无边界的端和后台的服务连接的。在这里面强调端也好,强调服务也好,都没有把我们未来的网络系统或者是我们共同现在理解的云计算系统作为一个整体的考虑,应该说有端就能延伸到后台,有后台就可以延伸到端,在这样一个互联网的应用模式下,实际上我们现有的应用有很多需要变革和需要新的讨论,也就是说从客户端设备延伸到互联网后台,支撑开放可成长
的信息系统,来按需组合服务。
但是在这里面就有很多新的问题,第一,对于现有系统的融错系统如何看待,它的可靠性和信任的关系,设备和设备之间,人和系统,系统和系统之间,当端设备和后台成为无缝连接的时候,对于我们现在的资源管理和调度将会有远不同于传统操作系统所看到的一些问题,它的基础研究和在系统技术,以及应用的方面都会有新的问题,因此在这里面有大量的工作是值得开展的。其中像海量资源的管理和信任问题,我们知道在一周的应用,只有其中三天对资源的需求从50台扩展到3000台,什么样系统具有如此规模的可扩展能力,这是第一个问题。
第二个问题我们知道08年奥运会订票瘫痪,网站瘫痪的问题。实际上还有大量的关于我们在终端软件配置部署和管理的问题,是否用户端软件先进后台,后台如何反映透明的资源,可信任相关联的人形成应用和服务的自由的下载。而且端和端之间,系统和系统之间应该建立一个什么样环境,所以在未来的资源管理系统,超越于当前操作系统不同的可信,可伸缩性,可靠性就变成重要的问题。
第二,以数据为中心的时代到来的时候,我们现在缺乏数据为中心的计算技术,传统的数据我们可以处理大规模海量数据,但是在数据科学的爆炸性发展,对象关的边缘学科计划都造成很多挑战。这里面举三个题,第一关于数据管理和分析方法和解决的方案,当数据以TB级数量在发展的时候,现有数据处理的能力一切都不够用。
第二,传统的数据处理,把数据放在存储一个地方,计算一个地方,互相关联找到内容。未来数据处理应该计算更主动的面向数据计算,而不是等着数据来计算。在这里最近惠普公司有一个新的方法,结合设计新的应用模式,但是面对大规模海量TB级增长的数据,现有的数据处理方法将无以面对我们现在所需要面对的,我们未来发展的数据处理。新型的数据搜索引擎,数据被严重的分割,严重的分布,没有本地的查询和分布式的连接,将会成为非常非常困难的一件事。在这里对搜索引擎大规模数据处理的能力,也提出了新的问题。
还有在社会网络的快速发展,也对我们当前的数据处理提出了非常严重的挑战,各种类型的数据,这是我们所面对发展的重要问题。
第三,网络化,大型软件的开发和验证技术。这里面和传统单机软件有很多不同,不同的软件来自开源代码,商业软件,自己开发软件,组合起来是不是有效的,如何保证系统的可靠性,如何去验证,这些问题使得未来的软件发展,一个方面软件运营商和服务商会成为新的发展方式的一种类型,特别是在移动计算当中,在新的小型服务当中是主导,但是对于大规模数据系统,对于大规模的应用系统,在软件开发和验证技术会带来挑战。
第四,互联网现在的发展,移动计算已经和互联网成为一家,在移动互联网计算中软件怎么发展,我个人认为黑霉软件最大的成功就是在2G时代模拟3G,我们现在手机不能用WORD,由于后台有效的服务,你的手机更多的是一个展现的形式,有一个屏幕可以上网,用不着手机可以展现内容,如何利用高速互联网和后台能力使得我们手机或者显示设备只是一个显示设备,这样移动计算和互联网会带来新的应用模式,因为移动互联网与互联网的有效的结合,特别是移动计算为我们日常应用和工作都会带来很多新的机会。所以软件按需计时服务是移动互联网应该采取的内容。
我个人最后小结一下,网络计算催生了想象力,这种新的计算模式和应用模式对中国的软件和互联网的应用是难得的机会,信息化更多的需要提供零距离的服务软件,而软件即服务以及数据中心所带来的新的网络化软件的发展,将会给我们带来很多新的机会。当然也有很多挑战,谢谢各位。
(本文不涉密)
责任编辑:
上一篇:东软卢朝霞:创新驱动 融合发展