取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 存储 > 存储系统 > 正文
Docker都不懂,搞啥子存储嘛?
来源:高端存储知识  :西瓜哥 2015-07-02 16:36:36
现在搞存储太苦逼了。原来我们只管好存储就可以了,最多懂点OS知识就够了。后来不行了,你还需要懂ORACLE,VMware等等,最好还要懂应用,懂业务。 除了上通应用,下晓介质外,现在还要懂云。光懂Openstack是不够的,还有Docker。如果你不知道Docker的知识,不知道Docker对存储有什么要求的话,都不好意思说自己是搞存储的。

现在搞存储太苦逼了。原来我们只管好存储就可以了,最多懂点OS知识就够了。后来不行了,你还需要懂ORACLE,VMware等等,最好还要懂应用,懂业务。

除了上通应用,下晓介质外,现在还要懂云。光懂Openstack是不够的,还有Docker。如果你不知道Docker的知识,不知道Docker对存储有什么要求的话,都不好意思说自己是搞存储的。

大家知道,容器技术的出现是为了解决大规模部署服务器虚拟化带来的问题:开销、效率。服务器虚拟化造就了VMware,而容器技术的出现造就了Docker。Docker受到了资本的热捧,就是很多人把它看成了明天的VMware。西瓜哥也是这么认为的。

服务器虚拟化当时最大的驱动力就是隔离应用,让很多应用都可以跑在一套物理服务器上,相互之间不影响。当时基本没有存储什么事。但后来发现,存储其实是里面最重要的一环,因为VM需要通讯,需要迁移,重启后需要永久保存数据。因此,存储为了支持VMware就有了各种接口,从VAAI到现在的VVol等等。甚至现在VMware干脆搞了个VSAN,自己就把存储的事情干了。因此,你搞存储,不懂点VMware都不好意思。

但Hypervisor VM隔离应用的时候,采用的思路是把服务器虚拟化了。这种应用隔离的方式,当时看效率很高,但现在大规模部署以后,发现其灵活性和效率、开销都有很大改善空间。

Container容器就应运而生了,它只是在应用层面进行了隔离。所有的容器都可以共享同一个操作系统。也就是这是一种轻量级的应用隔离(感觉有点像原来说的应用虚拟化,但应用虚拟化没有解决好隔离的问题),物理机可以不用运行多个OS了,消耗的重复资源肯定也少了。而且,采用容器技术以后,Hypervisor也可以不需要了,少了硬件这层虚拟化,类似直通模式,应用的性能开销也变小了。

因此,很多人把Docker当成VMware未来最大的竞争对手,虽然目前双方还是合作居多,但西瓜哥从长远看来,竞争应该大于合作,就像Nutanix和VMware现在的关系转变一样。

那么Docker容器对存储有什么特殊的要求吗?

Docker容器是设计之初是面向临时事务的,任务完成后就消失了。它采用copy-on-write的方式实现一个重叠的文件系统。这种特点使得其采用本地磁盘就可以了。但随着Docker进入到了生产系统,不是所有的数据都是临时的,因此,对共享的健壮的数据存储服务提出了需求,就像VM的发展一样。

幸运的是,Docker提供了-v指令,允许装载外部的共享卷,引导影像也可以存在上面。但目前Docker的存储功能非常简单,这就意味着容器必须在数据交换的时候负责文件访问和锁控制。

Docker天生就是运行分布式应用(类似我们常说的第三平台应用),因此,存储必须也是分布式架构才能更好匹配。以后,Docker容器甚至可以运行到分布式存储上,使得数据离计算更近。。

Docker的自动化大量使用Restful API,因此,存储也需要支持相应的API。容器失效后,相应的存储容量应该及时收回。

Docker的存储和VMware的存储一样,也应该实现丰富的数据服务,如快照、复制、重删等等。

Docker技术还不成熟,因此,Docker的存储最好支持多种接口,如块、文件、对象等等,支持REST或者RPC,采用分布式软件的方式,而且最好和硬件解耦,以应对未来Docker技术的演进。

目前在Docker方面创业的存储公司很多,比较典型的是ClusterHQ,他们的产品叫Flocker。

\

其主要解决的是Docker容器的卷管理问题。大家知道Docker容器从一台物理机迁移到另外一台物理机是很容易的,但是数据卷却迁移不过来。对于有状态的业务来说,这种迁移没有意义。因此,Flocker配合外部的存储,通过Cinder接口或者专用接口,把数据也自动迁移过去。

\

西瓜哥看了一些他们宣传的案例。瑞士的一个老牌云服务提供商swisscom,通过使用Flocker技术,已经把Docker应用到其生产环境中(提供database-as-a-service服务)。

\

后面的分布式存储,采用了EMC的SERVER SAN ScaleIO。

\

而且据说EMC的SCALEIO和XTREMIO给Flocker提供了独立的接口,不是OPENSTACK环境也可以使用Flocker功能。如果其他存储厂商要提供类似的解决方案,比如华为的SERVER SAN FusionStorage,也要和Flocker去做对接,才能形成强大的生态系统。

而另外一个SDS的初创公司HEDVIG,虽然是做SDS,但它也拿Docker来营销,宣传自己是最适合docker的存储。

\

和其他SERVER SAN一样,其采用商业服务器,分布式架构,完全是软件定义的。

\

关键是其号称支持丰富的接口和功能,可以满足docker现在和未来的需要。

\

看到这里,你就知道如果不懂一点Docker,都不好意思说自己是搞存储的了吧。

不过大家也不用担心,简单了解一下Docker其实也不难。

西瓜哥喜欢通过阅读市场调查报告,来了解一项新技术。因此,今天和大家分享一下《容器使用现状》这篇最新的调查报告,是Devops.com和ClusterHQ在今年5月份刚刚发布的。

\

从调查的对象看,开发运维人员比较多。

\

从企业的规模看,基本是500人以下的中小企业。这说明容器技术目前主要还是应用在初创公司。

\

但是,居然有约94%的人在过去一年使用或者调研过容器技术,可见其火爆程度。

\

容器技术哪家强?我们看到,92.13%的用户都用了Docker,Linux内核自带的LXC排在第二,但只有不到1/3。因此,Docker几乎成了容器的代名词。

\

别以为容器技术主要用在开发测试环境,已经有38.72%的使用者用在了生产环境。

\

更加令人意外的是,未来一年打算在生产环境部署容器技术的占比高达65.45%。Surprised!

\

但是,容器技术部署到生产环境,还是有很多障碍。用户对安全、数据管理、网络、知识和技能、持续存储是最关注的TOP5个问题。

\

在基础架构上,居然有57.09%的用户把容器用在自己的数据中心,AWS位居第二,也超过一半。

\

容器编排工具,还是用Docker自带的Swarm最多。

\

因为是ClusterHQ做的问卷,特别调查了数据管理的重要性。大部分用户都表示很重要。

\

70%的用户居然把数据库或者其他有状态的服务的容器运行在生产环境上,这个就是存储厂商的机会了。

\

但是这些服务大部分是开源的第三平台的应用,我们没有看到ORACLE,不过有MySQL。

\

数据管理里面,大家最关注和与工作流的集成,数据的无缝移动,存储的弹性,高可用等问题。

\

很多人都认为容器会代替Hypervisor,调查结果可不是这样的,至少目前还不是。有73%的用户把容器跑在Hypervisor上。但西瓜哥认为,随着容器技术的成熟,Hypervisor会用得越来越少。

\

而容器选择的hypervisor,第一还是VMWare,约1/3。但我们也看到这个份额比VMware在企业网普通场景的份额要少很多。甚至我们看到有很多用户直接就采用云服务商提供的hypervisor,这说明容器场景下,Hypervisor的选择没有那么重要。

\

好了,相信大家看了今天的文章,对容器技术应该有了一些了解,特别是容器与存储相关的知识。希望今天的分享对大家有帮助,也不枉我找了怎么多资料,码了怎么多字。

编辑:闫春春
关键字:     Docker  存储 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。