本系列文章由UnitedStack有云SDN网络部PTL王为撰写。王为在奥斯汀峰会期间共观看了20余场技术讲座,综合之后再YouTube上观看的回放,对36个Session进行了介绍和评论。
这些网络技术讲座的观影指南涉及架构、功能与工具、开发与其他四大领域。我们将分主题系列发布,希望帮助国内的开发者、架构师和用户更好地了解OpenStack在SDN网络领域的最新发展。本文所介绍的相关讲座在 YouTube 均有完整视频(详见:https://www.youtube.com/user/OpenStackFoundation/videos,在 Youtube 上搜索对应名称即可)。
评分:★★★★
简介:开头科普了一下 OVN 的架构,一些做的不错的地方,然后着重介绍了这个 Release Cycle 中社区对 Scale 的进展和测试,以及其他一些目标。对 OVN 感兴趣的同学应该看一看。
评论: 标题虽然叫Practical,但遗憾的是实践的内容并不多,提到了社区做的 Scale测试,主要是利用Sandbox在20 台物理机上做 2000个Hypyervisor的控制平面模拟,IBM在实际物理环境中部署过90个Hypervisor的Scale,下一步要测试 300 台和 700 台的规模。
关于最近的进展,Scale上有一定提升,例如 ovsdb-nb 和 ovsdb-sb 分拆到两个进程等,但遗憾的是比较受人关注的 ovsdb 的多进程还在开发中,原生 NAT、摆脱 MQ 等一些关键 Feature 也还没有做完。部署上已经支持了 Puppet OpenStack,同时社区对 Rolling Upgrades 也比较重视,这方面做的也不错。下一步的目标主要还是 OVSDB 的 HA(关键 Feature)、L3 Gateway 和 NAT 的支持(关键 Feature)、Native 的 DHCP、MetaData 等等,还有一段路要走啊。
OVN 刚推出很多人看好,原因最主要是强大的社区,其次刚开始给出的设计文档也不错,遗憾的是刚拿出来的版本距离长期设计目标就差的很远(OVSDB 的 HA 问题,甚至目前还是单进程的!大量的非分布式实现等等),所以就让很多人忧虑 OVN 是不是太晚了。
一年多过去了,OVN 社区确实做出了很多努力,但遗憾的是前有 DragonFlow,后有 OpenDaylight OVSDB Netvirt 各种竞争,而且前者发展时间长、已有部署案例,后者在 HA、各种功能(SFC、VxLAN Gateway 等)也有所擅长,而且两者对如何解决数据库/资源同步问题都提出了自己的方案(versioned object、async sync)等,而OVN社区目前还没有考虑过这个问题,只能说留给OVN的时间已经不多了啊。
评分:★★★★☆
简介:开头科普了一下 OpenDaylight 的架构,然后介绍了在 OS M 版和 ODL Beryllium 版上的进展,特别是 V2 版 Driver 的情况,值得一看。
评论: V2 Driver 是一个关键性但复杂的事情,主要是增强了 HA 和 Scalability,这也得益于 OPNFV 的不断测试。其中的关键问题之一是数据库的不同步。做过类似 SDN 与 OpenStack 对接的开发者都知道,因为事涉两个系统,两个数据库,所以保持数据一致性是一个很麻烦但有很重要的问题,一旦处理不好,轻则状态不一致,重则大量脏数据充斥两个系统还无法轻易删除,最终无法维护。ODL 选择了一个相对简单一些的方案,就是将一个 Sync 操作拆开,拆一部分为独立的循环,这个思路可能是和以前的 Neutron agent 学的?
我们可以看到 API 返回过程实际是没变的,仍然是直接写数据库然后就返回,但此时状态时 Pending 的,由另一个独立线程周期去取 Pending 的数据,然后交给 ODL,这样来保证 API 操作的即时性和状态的一致性。
轻量测试框架看起来对用户不会有很大的影响,但是对开发真会方便很多,跑和 OpenStack 的集成测试不需要专门跑 ODL 了,简化很多。支持了基于 Port binding 的 OVS DPDK 集成(这样你可以混布 DPDK 和 非 DPDK 了!),100% 通过 Tempest 测试。在新版的 ODL 上,HA、稳定性、各种 Feature 也增强很多,可以认为 ODL 和 OpenStack 集成已经很靠谱了。
在下一个版本中,一方面是 v2 的继续增强,一方面是 SFC、FD.io、BGPVPN、L2GW 等这些的增强。按照 FD.io 的文档,FD.io 社区的计划也是通过 ODL 与 OpenStack 集成,按照目前的资料 FD.io 的性能特别是多流性能上就超出 OVS DPDK 一大截,值得期待。SFC 有其他 Session 做介绍,这里就不多说了。最后做一点科普,OpenDaylight 可以作为纯软的 OpenStack SDN 后端,具体的模块是 netvirt,也是以 OVSDB 来控制 OVS 完成网络功能,目前功能的完善程度还是比较高的。
评分:★★★
简介:这是一个在MarketPlace的短片演讲,主要介绍了ODL本身和其与OpenStack集成的好处,以及一些客户案例。
评论:对ODL不了解的同学可以看一看,看过 OpenStack and Opendaylight The Current Status and Future Direction 的同学就不用看了。
评分:★★★★★
简介:开头科普了DragonFlow的架构和意义,然后介绍了最新的进展,其中重点是 Plugable DB (你将可以愉快的使用 ETCD、RamCloud、Redis 等作为分布式的数据库后端)、Plugable 消息后端(你可以愉快的使用 0MQ)、分布式的 DNAT、DHCP 和 OVS 实现的安全组均已完成!
评论: 在2015年的温哥华Summit 会后总结上,笔者就向国内同僚介绍过 DragonFlow 这个生机勃勃架构的项目,主要 Contributor 中 Gal 和 Eran 都是很有创造力的人,最近随着国内的马力的加入让这个“小社区”更加充满活力,从他们的 Feature 介绍中也能看出里其发展之强。演讲着重介绍了关于数据库一致性的问题解决,和 ODL 重点讨论的那个事情是一样的,区别是二者的方法,DragonFlow 目前采用的是基于锁实现,类似于两步提交,但计划修改成基于版本的对象控制,这个计划其实和 ODL 的实现也是有类似的,但是这里不用状态这个字段,而是用版本,确实看起来更优雅但实现难度还是比较高的。
OpenStack 与 SDN 集成的两大痛点,一个消息问题,一个数据库问题,不同的社区给出了不同的解决方案(弃用 MQ 还是采用分布式 MQ?基于 CAS 的比较还是基于状态的异步处理?),很让人拭目以待。此外 DragonFlow 还公布了他们在 Scale 上的路线图,随着 0MQ 的引入,他们把理论的 Scale 已经提高到 4000 节点,但这还是不是终点,目前的目标是 10000 台节点!
DargonFlow 在更新速度上、架构上(他们在架构上在不断进化)都绝对不输目前 Neutron 几个其他 SDN 方案,唯一遗憾的是社区和声音都小了些,希望未来能有更多的慧眼识珠之人参与进来。
评分:★★★★
简介:这是一个 Walmart 出品的其网络结构设计 Case Study,主要技术是 MPBGP EVPN,对大型的 OpenStack 网络设计(VxLAN 网络设计)还是很有价值的,演讲附有珍贵的实际性能数据。
评论: Walmart 首先谈了他们的痛点:
1. 目前数据中心建设过程太过漫长,需要6-12个月;
2. 流程长、重复工作多、缺乏进度可视、相互依赖;
3. 传统网络架构需要很多网络工程师维护,应用喜欢二层而网络工程师喜欢三层,网络和安全由不同的人负责 。
据此,Walmart 希望一个支持裸机和虚机、支持大二层、安全、可靠、无厂商锁定的网络方案。最终他们选择MPBGP EVPN VxLan
组网。
MPBGP EVPN 在网络界已经不是新技术了,但和 OpenStack 结合其实不多,一来设备支持不那么丰富,二来社区有L2 POP
+ARP Responder
的解决方案(当然也有 MPBGP EVPN 的软件实现方案,BaGPipe!),此外 OpenContrail 作为开源软件 SDN 界的技术担当也一直支持,所以这个话题在 OpenStack 社区圈内讨论的不多,但是如果你想真的解决 VxLan 的广播问题,或者想扩展 VxLan 到 DCI,那 MPBGP EVPN 确实值得考虑。此外通过设备解决分布式路由?Ancast Gateway(简单的说就是分布式的 VRF)。网络架构整体是和 Spain-leaf 没什么区别,但重要的是 VxLan de/encap 是在 ToR 上做的。
最后,Walmart 给出了其性能测试数据,基于 Dell 和 Cisco 的硬件。有意思的是他们还有一个测试项叫 AppMix,混合了各种应用来模拟真实情况。另外还有 Walmart 给出的小包性能一般,瓶颈应该在软件或虚拟机上,不应该是 ToR 的问题。
对了,笔者在会上问了 Walmart 使用的控制器或自动换软件是什么,答案是目前在用 VTS,将来计划迁移到 Ansible 上,网络资源全部是预配置的。
评分:★★☆
简介:用一句话介绍就是 Overstock.com 是如何使用 Midonet 然后过上了幸福的生活的。
评论:演讲者之前网络设计和规划比较一般般,故障恢复需要数小时,用了 Midonet 和改善了架构后之后做到了零丢包,End。广告太硬了,差评。
编者注:本文作者为UnitedStack有云SDN网络部PTL王为。有关此次奥斯汀OpenStack Summit各个技术主题的演讲视频,可以在YouTube上完整观看。