Reddit引入Envoy支持架构改造,性能显著提升

news/2024/5/19 14:18:59

Reddit引入Envoy到其后端框架,作为服务到服务代理以支持其正在进行的架构改进。通过采用Envoy作为服务到服务第4层/第7层代理,他们发现在可观察性、易采用性和性能上有显著的改进。

Reddit引入Envoy到其后端框架,作为服务到服务代理以支持其正在进行的架构改进。随着其架构从单体架构发展到更小的服务,支持和调试其现有框架极为复杂,变得过于昂贵。通过采用Envoy作为服务到服务第4层/第7层代理,他们发现在可观察性、易采用性和性能上有显著的改进。

根据Reddit的资深软件工程师Courtney Wang的说法, 在过去的三年中,Reddit工程团队的规模和产品复杂性上已经有了显著的增加。这与其后端架构的改进并行进行,因为他们从单一应用程序转向,开始采用更加面向服务的架构 。这些改变已经增加了他们调试其应用程序方式的复杂性,从调查函数调用转变成了跟踪多个服务之间的RPC。此外,在提供新服务时,工程师需要考虑的注意事项数量也变多了,如今包括了解客户请求行为、重试处理、断路和粒度路由控制。

自从Reddit开始把服务从其整体中分离出来,他们一直在使用Airbnb的SmartStack作为其服务网格。当建立及拆除服务实例时,由SmartStack Nerve处理注册问题。Nerve是一个Ruby处理进程,在每个实例上运行边车并把它们注册到一个中央Zookeeper集群中。为了简化程序开发人员的工作,Reddit开发了Baseplate,这是一个提供健康检查界面和连接到Nerve抽象层的通用框架。

Reddit利用Synapse(每个实例的Ruby进程)来管理其服务端点的发现。Synapse读取Nerve填充的Zookeeper注册表,然后把端点条目写入本地HAProxy配置文件。HAProxy作为边车进程运行,处理下流服务流量的代理和负载平衡。

\"image\"

最初的Reddit服务架构(来源: Reddit)

尽管SmartStack的实现保持了相对不变和可操作性,但是,其不断发展的基础架构已经开始不断挑战SmartStack所能提供的极限。正如Courtney Wang所指出的,这导致团队重新评估服务网格的全景,看看替换它们是否有意义。他们希望解决的关键痛点是:

  • Nerve和Synapse只能接受静态配置、服务注册更新所需的Puppet配置更改以及跨其服务集群的更新
  • Synapse的HAProxy配置编写器只提供基本的路由定义
  • 由于HAProxy不理解Thrift(Reddit的主要内部协议),它们对通过HAProxy的流量的观察能力很低

在选取一个新的服务网格的候选者时,Courtney Wang指出,他们的关键需求是确保对性能无影响、获得代理中的第7层 Thrift的支持,并易于扩展及集成新工具。该团队决定采用Envoy,因为它符合这些要求,并且他们认为这些权衡是可以接受的。

Envoy最大的问题是缺乏一流Thrift的支持。Courtney Wang回忆道,他们和Turbine Labs(Turbine Labs最近宣布支持Envoy)合作,为Thrift支持合同开发。借助该合作关系,他们可以引入Thrift支持的代理、路由、请求/响应指标和速率限制。

他们部署Envoy的第一个步骤是取代HAProxy以获得基本的TCP代理支持。Nerve和Synapse仍将处理服务注册和发现,这意味着它们将无法利用Envoy的动态发现服务。这允许他们保持其服务发现层的稳定,同时将Envoy部署到生产环境中。通过并行运行HAProxy和Envoy,监听不同的端口,它们能够通过调整配置简单地回滚。这也允许它们针对其HAProxy配置审核Envoy配置,以验证其Synapse配置生成器的准确性。

\"image\"
引入Envoy过程中的Reddit架构(来源:Reddit)

Courtney Wang表示,Envoy现在已经顺利地为生产流量服务了近4个月了。他说,没有停止的问题,但是,描述了Envoy的网络连接处理与HAProxy的不同,导致在应用程序连接管理代码中出现意外错误。

借助Envoy和新的Thrift过滤器,他们发现在网络层有更好的可观察性,包括请求和响应指标,它们在应用程序代码没有更改前是无法获得的。因为HAProxy仍然作为边车运行,以便在此过渡期间快速回滚,所以,它们还未能对服务延迟进行准确测量。

随着在代理级采用Envoy管理第4层流量的成功,Reddit计划下一步是部署Enovy的发现服务API,该API 由集中式配置存储支持 。进一步达成的计划包括调查在边缘运行的Envoy,以取代HAProxy(针对核心Reddit后端应用程序服务)和AWS ALBs(针对其部分外部入口点)作为负载平衡器。Courtney Wang认为,这将提供更好的可观察性和服务路由控制,如:遮蔽入站流量和边缘的流量转移。最近,eBay进行了类似的迁移,利用Envoy取代外部入口点的物理负载平衡器,并报告了Courtney Wang及团队所期望实现的一些成功。Courtney Wang希望,更进一步采用Envoy将有助于团队把其单一的应用程序拆分成更小的服务。

阅读英文原文:Adopting Envoy as a Service-to-Service Proxy at Reddit


http://www.niftyadmin.cn/n/2008625.html

相关文章

spring事件机制_http://enjiex.iteye.com/blog/1070094

Java提供了事件机制,在使用spring的时候,我们可以把普通的java事件操作定义为bean集成到bean容器中,但还有一种更方便的方式,即使用spring已集成的事件支持。在使用Spring的事件支持时,我们需要关注以下几个对象&#…

解决Spring Cloud中Feign/Ribbon第一次请求失败的方法___http://www.jb51.net/article/106944.htm

这篇文章主要给大家介绍了关于解决Spring Cloud中Feign/Ribbon第一次请求失败的方法,文中给出了三种解决的方法,大家可以根据需要选择对应的方法,需要的朋友们下面来一起看看吧。前言 在Spring Cloud中,Feign和Ribbon在整合了Hyst…

行内元素有哪些?块级元素有哪些? 空(void)元素有那些?

首先:CSS规范规定,每个元素都有display属性,确定该元素的类型,每个元素都有默认的display值,如div的display默认值为“block”,则为“块级”元素;span默认display属性值为“inline”&#xff0c…

windows10安装nodeJs及环境配置

学习于https://www.cnblogs.com/zhouy...

微信nickname乱码(emoji)及mysql编码格式设置(utf8mb4)解决的过程__https://segmentfault.com/a/1190000004594385

自己的练习项目中涉及保存微信的nickname,之前一直正常使用,但是突然遇到一个之前没有遇到的问题。经过调试发现错误如下:Incorrect string value: \xF0\x9F\x99\x88\xF0\x9F... for column nickname at row 1 经过仔细查看发现可以获得nickn…

反编译java class并优雅的调试--http://www.blogjava.net/miaoyachun/archive/2013/02/22/395575.html

https://sourceforge.net/projects/realignmentjd/files/ 官方文档 用jd-eclipse 插件来反编译java class文件的输出还是挺nice的,虽然阅读方便了 但是对debug确造成一定的困扰,主要问题是line number的不match. Google了下遇到类似问题的真不少。最终找…

centos7安装最新版git_https://my.oschina.net/antsky/blog/514586

whoru 发表于 2年前 阅读 5961收藏 10点赞 1评论 1 腾讯云 普惠云计算 0门槛体验>>> 摘要: 介绍yum和源码包安装的具体方式 方式一、yum安装 # yum install git 通过yum方式安装,版本比较旧,CentOS6.5上安装好是1.7.1版。如果想安装最新版或…

SQLServer2008如何copydatabase--https://www.2cto.com/database/201411/351603.html

xjh测试有效 首页>数据库 > SQL Server > 正文SQLServer2008如何copydatabase2014-11-12 09:22:27 个评论 来源:tianshijianbing1989的专栏 收藏 我要投稿SQL Server 2008如何copy database: 方法一:使用Microsoft SQL Ser…