您现在的位置是:首页 > 数字化转型 >
Nutanix陈世玮:软件定义, 硬件重构——新一代超融合数据中
摘要2015年4月15日,由中国计算机报主办,中国计算机行业协会、中国计算机用户协会、中国信息化推进联盟数据中心专业委员会协办的“2015年第八届中国数据中心大会”在京召开。以下内容是Nutanix公司亚太区顾问陈世玮发表的题目为《软件定义, 硬件重构——新一代超融合数据中心》的主题演讲。...
陈世玮:大家好,我是Nutanix在亚太区的技术顾问。我想在这个地方先来调查一下,谁没有听过虚拟化,看起来没有人举手,代表什么意思呢?大家都知道虚拟化,没错大家都知道。我们知道在中国虚拟化卖的最好的一个平台就是BMV,我本身就是从这边出来的,这边还有老同志也在会场。
一个问题如果在十年前我进各位讲说,我们大家来搞一下虚拟化吧,请问一下各位会怎么想,你可能会骂我是不是疯子,物理机都跑不好还搞个虚拟化。可是时代在变迁,按照因特尔的摩尔定律,每18个月CPU的效能是成长的一倍,所以我们有越来越多的效能可以空出来做使用,所以在2008年2009年在中国虚拟化开始蓬勃发展,大家都有目共睹。可是我今天来讨论的东西,各位以前在做虚拟化的时候,你底下用的这些IT的基础架构是什么,还是旧的基础架构。我今天为什么定一个题目叫做软件定义硬件重构,因为你的这些硬件不是代表他最适合虚拟化的,这些硬件是在于物理机时代使用的,我们怎么样来做到这些事情,我们讲到一个超融合的架构。
接下来我们看一个事情,第一个事情如果今天各位去开灯,你开灯会做一个功课,你的小孩说去写功课开灯,灯就亮了。接下来他可以写功课,很简单的事情,我们希望把事情简单化。你会去想背后的整个过程吗,这开灯的动作,你要什么?一个水力发电厂,三峡大坝,然后发电,然后经过传输线,传输之后灯才会亮,有人会这么想吗,有人会想这个问题吗,不会吗。一般人都不希望你还要自己去新建一个水坝,那一样,你在用谷歌,下一次我把这个图改成百度,在中国是连不上谷歌的,只能用百度。假设你用谷歌和百度会想说,今天谷歌里面到底放了多少台的物理机,他怎么样做虚拟化,他后面有多少个存储。你会去想吗,不会的,我只希望直接用它的服务,你绝对不会想说这是不是谷歌机房,你会想这些事情吗,不会吗。所以我们要做到什么样程度,我们希望做到一个叫超融合的,什么叫超融合的系统,大家知道在国内卖的很流行,还要到海外抢的,这是苹果手机。大家说苹果不好用举手,没有人举手,代表非常好用。你用苹果手机的时候你有没有把这个拆开看一下,我里面用的哪一家存储,我用的哪一家电池,我用的哪一家网络芯片,会去看的举手,没有人会去做,你只需要把苹果手机拿来用,这个手机就像一个砖头一样,你买了之后不装任何苹果商店里面东西,有没有用,没有用处。我们希望如果今天你的IT架构可以像苹果手机那么简单,那该有多好。所以我需要什么样的应用程序,我只要安装上去,我就可以去使用,很好用。我们就要把这个架构放上来,可是我们现在看一下,各位现在你们公司里面所看到的IT的系统架构长成什么样子,你要有你的服务器,你要有交换机,你要有存储,然后你要去搭建,搭建的时候我们看下面要画图,我哪一条线要加哪里去,我什么服务器接什么交换机,我在EMC呆过七年,在存储上面还要做很多其他工作,非常复杂。假设我有144个POD交换机,装接线就要花两到三天的时间,你要做这么复杂的事情就为了一个事情,我要把我的应用放上去,让我公司通过这个应用来赚钱,我们可以看到IT价值不基础建设,而只是在于商业上面逻辑怎么样设计这个应用,每一个人沟通协调,资料的传送,甚至他为一个硬件的采购,然后CPU采购多少,我的存储的部分要怎么样来做,我们希望把这些事情,唠叨的事情尽量往下移,不重要的我把这些IT基础架构部分,变成简单化。让我多一点时间去做什么事情,去做我的应用开发,我怎么样让我的使用者有更好的应用体验。
讲到这个东西的时候大家就会说,我当然就要把它放在云上面,云有两种云,一个叫公有云,一个是私有云。大家都知道公有云好不好用?好用啊,非常好用,你可能会用阿里巴巴,华为云都有可能。在公有云我们放上去当然好用,你不用去管理,就像我们用谷歌一样,我只要放上去不需要管下面架构。可是一个问题来了,如果贵公司里面有所为的私秘的一些数据是不可以外流的,你可以把你的虚拟机,你可以把你的数据丢到上面去吗,当然不行,违反规定。那我只好放在私有云,你放在私有云非常好,私有云我今天要创建一百个虚机,200个虚机我说的算,这是我公司的资产,我怎么创建就创建吗?公有云不一样,你创建一百台和200台收的钱不一样。所以私有云有它的弹性,可是你要考虑到今天你要作为一个私有云的时候,你要花多少心力,各位可以想想看你在公司里面搭建一个私有云的时候,你要去考虑你的网络怎么样解决,你要考虑存储,要买多大,服务器要买多少台,CPU要买哪一家的,所有种种都要考虑进来。接下来机房的配电怎么样接,最后的维护怎么样做,这都是私有云的坏处。
如果告诉你一件事情,我把两个人的好处全部放在一起,我在我的私有云环境里面搭建公有云架构多好,这是我们今天所讲的超融合的架构,我先从我们公司介绍起,我们是Nutanix,我们在2009年的时候成立云公司,一般的企业可以不可以使用到这样一个好处,可能一般企业说我没有长的像谷歌那么大,我们刚开始可以从三个节点开始,可以从小小的开始慢慢的成长。
我们在IDC的超融合系统里面,我们市占率是全世界第一的,所以可以看到右边有一个非常大的红色的点,这个地方是代表我们整个市占率,而且我们在创新上面来讲是一直排名第一名。当然我们就看到我们现在在现在环境里面,你可以看到现在的数据中心里面有什么呢?他里面的复杂度是非常高的,他每一个都是一个独立孤岛,什么叫做独立孤岛,举一个例子,假设今年你买了EMC存储,明年你又买了MIS,过一年可能又买联想的,华为的,买了之后每一家的管理工具是一样的吗?完全不一样吗,你管理的时候要分好几套去管理,我们只讲到存储的部分,如果今天讲到服务器,你有戴尔的,你有华为的,你有浪潮的,每一家所管理的这些工具也都不一样,你想想看原来三层次架构,交换机、服务器、网络,光纤服务器,加上存储,这些东西每一个都有不同的厂商,光管理起来就非常复杂。加上我搞的虚拟化上面,这上面有什么呢?有Vmr,你可能有十几套,二十套管理工具,你可能增加管理的复杂度。
我们没有办法预知整个扩展,举例来讲今天我想要部署一个桌面云,那公司交代我们说,我想要布建500个桌面云来使用,500个桌面云要花多大的硬件来支撑,你可能划的大或者小,你的老板说三年之后可能会成长到1500个,我要满足三年,我买了非常大的电冰箱存储,买了很多东西在上面,我插着电第一年跑了500个BDI,接下来两年我的人是慢慢成长上去,可是问题我浪费了两年的电,放在那个地方我要供电,我买那么大设备,我要供电,我要吹电风扇,这些都是潜在成本。我们要把这个东西拿掉,想尽办法拿掉,这时候有一个事情,未来是一个软件定义的数据中心,所有东西都是通过软件来定义的。但是没有人去谈一件事情叫做硬件重构。那硬件我们要怎么样来做到呢?软件定义是没有错的,但是硬件如何做到重构。当然希望你未来机房应该是长的像这样子,不像刚才那样,一看好乱。如果今天领导来巡视的时候,看到这样应该会比较高兴,如果看到刚才那样子可能会非常生气。
什么叫做超融合的架构,超融合的一个架构里面它有五大特点,第一,它综合了所有的运算跟存储。我在上面可以运行我的虚机,当然同时我提供了存储的空间让这个虚机可以在上面运行。第二,百分之百软件去定义,所有的东西都是通过软件来定义来做到的。第三,我会把所有的数据分散到各个节点里面去,为什么呢?我要保护,不要因为一个结点宕机死机了,其他的节点就没有办法保存我的数据,这不行,所以我的数据一定要分散到所有节点上面去。
第四,初步隔离,如果今天坏了,我是不是可以很快的做修复,你可以想象,你现在只有三个节点好了,假设刚开始三个节点,我们在国外的一个最大案例是2500个节点,这里面给各位说一下,请问一下我们集群可以到多大,告诉各位无限大,我们没有看到所谓的上限,所以这个集群是可以继续长大的,这个集群跟原本我们原来的集群是不一样的。你需要一个共享的盘,大家去共享,发生问题的时候,谁抢到那个盘谁就是老大,所以我们可以无限制的扩展。
我们提供了一些API,让原本既有的管理工具都可以通过API方式跟我们做集结,这一部分来讲就是我们提供五大特点。所以我们可以来看一下,一个数据中心的演进,我其实很想讲一个故事,数据中心1.0的时代,这是什么时代呢?就是十几年前开始打工的时候,就是小机吗,每一台小机就是独立的,里面的硬盘不能互通,每一个防疫个甲骨文或者什么,都是独立的,不需要用到别人的东西。但是一个非常大的问题,有时候有些小机,它的硬盘实在是太大了他可以扣出来给别人用,我觉得这是一种浪费。所以这时候就有一家公司出来了,那家公司叫做EMC,我在EMC呆了七年,他们就把这些硬盘抽出来做了一个什么东西呢?做了一个磁盘阵列,上面放了两个控制器,光纤交换机接一下,就可以去分享这些硬盘了,空间就节省掉了。3.0的时候就是有一家公司把CPU、内存池化,这样好处我要用多少就用多少。接下来Data center3.5,存储的厂商在中建加了一个SSD,干什么呢?加速,加速你整个存储的效能。可是各位有没有觉得这个架构还是怪怪的,有一天你会发现这两个存储的控制器再也撑不住了,为什么呢?我上面加的越来越多的一些服务器,我这个控制器有办法撑得住吗,撑不住,这时候谁最高兴,存储的厂商,他们会说哎呀你这个不能用了,我们换大一点好的,他好高兴呀。但是谁最生气,你老板,你们领导会说哎呀这不是刚买两年,为什么又不够了,当初谁去评估这个容量,这个效能谁评估的。当然还是存储厂商,存储厂商会讲一句话,你们是不是可以变成一个开发环境,我买一大台存储进来。但是你到底解决问题没有,你完全没有解决问题,你重新在换了一台更大台的存储,然后接下来做数据的转移、变迁,那就是风险。
所以这一部分来讲都是错的,所以我们来看一个数据中心应该要怎么样做,各位可以看到第一种情况,前面绿色就不谈了,因为这个太早时间了,我们看中间那一块,这一块的架构是不是各位现在正在使用的,没有错,上面Vmware下面EMC,可是到下一个时代是什么时代?大家说公私混合云,我们在一起做。私有云来讲KDN,国内很多人喜欢创新,自己搞开发,KDN也是一做云,Vmware也是一朵云。公有云AWS进来了,接下来华为、百度,这些云的公司一家一家开起来。我们如何在云的时代,让我们私有云跟我的公有云去做互相配合。我举一个例子来讲,我可以把虚机备份到公有云上面去,我需要不需要买磁带,不需要了,我备到公有云去了,公有云是什么呢?你开机收钱,不开机收基本费,这样比去备份磁带好多了,我们未来希望做到说你可以把你的虚机备份到公有云去,这是未来更新的想法。
传统的这些架构是不是适合虚拟化,其实说真的不太适合做虚拟化。我们要怎么样做到呢?我们来看一下,传统架构我们可以看到三层次架构,大家都很清楚,我们希望通过堆叠的架构,我们可以超融合,一个一个堆叠上去之后,你就有更大的池,不管是在运算方面,不管是在存储方面,你有更大的空间,更快效能。
当然我们想说,Nutanix怎么搞的呢?我们就是在这个里面放了四个节点,你可以把每一个节点想成是这是一个X86服务器,他就像一个X86服务器,这些服务器每一个X86服务器只负责六块盘,在这六块盘里面我们去起一个虚拟机,这个虚拟机就是一个存储的交换器,只是他是虚拟化,请问一下各位,EMC的UNS控制器里面是Windows,就是一个桌面系统,操作系统。那一样我们把这样操作系统,我们放在每一个节点上面,只是我们做了虚拟化,这些虚拟化控制器,我们把它集群起来,便成了一个大的NDFS集群,这个集群里面我们就把所有的盘集合起来变成一个大的资源池。你需要多少,我再给你多少就好了。所以我们就做成一个大的池,通过这个大的池给Vmware,我们就可以在上面运行我们的虚机。这样的一个架构我们称之为数据中心的4.0的版本,这才是未来数据中心的架构。
当然你说我刚开始买,我可以不可以从三个节点开始,可以。我们举例来讲,你的节点有16个,有4T的硬盘,你有128G内存,如果一开始我们公司规模不大,我先买三个节点,我总共CPU48,我内存有384G,当我不够的时候多加一个结点,就变成64核,内存更多,我能存储空间更高,连带着下面一个东西IOPS,存储的性能也跟着提高。所以可以看到你加的越多就越低,非常的简单。
这样一来我们就可以预估每一个节点能产生多少IOBS,当我的业绩在成长的时候,我就可以按照我的业绩去增加我的节点,我不是一次要全部买齐,我可以一个节点,一个结点慢慢加上去。我们还有把不同的型号混合在一起,你刚开始觉得没有用过试试看,我买一千的系列,这对我们来讲是比较低级的,但是觉得很好用的,我未来想买3000、6000个可以不可以,你可以把这些系列全部放在一个集群里面。所以我们集群里不是要买一模一样的集群,不需要,你可以混搭。
这一部分来讲就是一个传统做存储的时候,你要创建一个需要一个过程。你如果换到这样平台之后,所有的事情六个步骤变成一个步骤,就可以搞定了。当然一般在存储的角度来看,我们都会做所谓的备份,灾备的部分。所以我们从PO和TO概念来看,PO我们可以做到立即,PO等于0,这代表什么意思呢?在存储上面来讲就是同步。而PO我们可以不可以做到0,有,有一个东西可以做到0,帮助友商打一下广告,但是大部分来讲一般应用都用HA,这可能是几分钟做一个切换。在Nutanix来讲提供了四种解决方案,在备份和备云里面。
最后一个东西是双活高可能,同城双中心,两地三中心都听过吧,这在原本的方案要买非常昂贵的东西,我们在里面可以见到这样一个功能。我们可以做到同城双中心,这个双中心只要往来的封包在这范围之内都可以。我们可以做出N2N,你通常在存储里面只能做AB拷贝到BD去,我从北京到天津,他不能从天津回来,或者我想从北京做天津、上海、广州,我做不到,为什么呢?我只能支援两个,我们没有,我们可以多对多,一对多,N2N的架构,我们在做数据的复制的时候,我们是以虚机为单位,我们做压缩和去重,来加速压缩。当然我们提供了完整的一些快照和克隆和Vmware结合,他们在做部署的时候,我们也是帮助他们一起,所以让你更快速的部署。我们业提供所谓的想把虚机备份到Windows备份到AWS,可以通过这样功能来做。
双活高可用集群,这一部分我们也支持,你不用再去买昂贵的设备来做这些事情。当然人们在存储的时候我们会做一些事情,我们可以把你的数据做压缩,让你存的空间更小,帮助你做去重,我只要存一份就好了,这些都是存储上面基本的功能,我们都已经内详嵌在里面了。
我们提供了一些健康检查的功能,我们从这个页面可以看到针对虚机做健康检查,我们针对你的主机和服务器进行检查,我们可以针对这些东西做检查。我想跑报表可以不可以,可以的,里面这些功能都有。如果你今天新购买了一个节点,我原本只买了三个节点,我想要增加第四个节点,容易不容易,我如果今天有做一些展示,我会找业务或者直接CIO上台,请他帮助我做一个节点增加一个功能,他只要两个打对号,按OK,就把第四个节点加进去,你完全不用管进去,自动帮助你把数据分散平衡。我们也提供一个滚动式设计,假设我们版本是4.1的,明年搞不好有4.3版,5.0版都有可能,出来的时候我要升级我怎么做?很简单,我只要把我需要的ISO档案丢给其中一台节点,他就会帮助我做自动的升级。
我不知道各位有没有用过一些家用的无线路由器,我们的感觉就像这样子,非常简单。但是我觉得这个东西还不够吸引人,更吸引人的东西是这个,可以不可以想象一个事情,贵公司里面只有一种品牌的服务器的人举手,大家应该都是多品牌,有多品牌服务器,假设现在都用Vmware5.5版,现在最新版本是什么版本?6.0出来了吗,这之后可能过了半年之后一想我搞一个升级计划,可以想像你有不同的服务器要安装,你要怎么样来做,首先一个一个灌很复杂,你可能要一个月到两个月去计划,一个星期,两个星期去执行。但是如果告诉你,你未来只要做这个事情,我把ISO丢上去,我按一个键,把我从5.5版升级到6.0板,你也不用考虑虚机,他会自动移到别的地方去帮助你做升级之后移回来,我告诉你有这样功能会不会用,绝对会用,为什么呢?因为你不需要别人服务你,你自己就可以做完升级,都是一键可以全部做掉。
因为这些东西可以支援服务器虚拟化,桌面的虚拟化,大数据,这一部分也支援,分公司的服务和灾备。这跟虚拟化完全没有关系,你把这个东西放在新疆是最好用的,为什么呢?你可以想一想传统三层次架构,我交换机坏了,硬盘坏了,服务器坏了,你只好保修,这有没有办法做到,他不知道。但是如果我这种架构,你看到这三台机器,他的硬盘,我从总公司就可以知道,原来这是硬盘坏掉了,我就把硬盘灯打亮,我把硬盘寄过去,你把亮灯硬盘抽出来帮助我换进去就好了,不需要搞到三层次架构,为什么呢?因为我的就是这样。
这是我们所有全球的客户,你可以看到招商也有购买,三星。接下来这是我们相关的数据下载,如果你想要了解更多,你可以到我们这些网站上,这里面有很多视频,我们怎么样做运行,我们也有一些白皮书,中建还有一个Blog,我们也希望各位如果有空,你是技术人员可以看一下,让你更了解我们公司产品,写这个人是从Vmware过来的一个高手,他写东西非常详细。我今天演讲就到这边,不知道各位有没有什么问题,如果没有问题的话,就谢谢大家。
(本文不涉密)
责任编辑: