发布时间:2026/6/20 11:59:11
马克·布鲁克揭秘负载均衡系统经济学:M/M/c 模型延迟随服务器数量渐近改善
关于我我叫马克·布鲁克Marc Brooker喜欢打造实用且酷炫的东西热衷于构建大型项目。此外我还涉足机械加工、焊接、烹饪和滑雪等领域。我是西雅图亚马逊云服务AWS的一名工程师主要从事自主人工智能agentic AI相关工作尤其关注自主人工智能的安全性和策略。在此之前我参与过 EC2、EBS、数据库、无服务器计算以及无服务器数据库等项目。本博客所表达的观点仅代表我个人。链接我的出版物和视频Mastodon 账号 marcbrookerTwitter 账号 MarcJBrooker这个博客是由人工智能撰写的吗负载均衡系统的惊人经济学M/M/c 模型的表现或许和你想的不一样。假设有个系统有 c 台服务器每台只能处理一个并发请求且无内部队列。这些服务器在一个有无限队列的负载均衡器后面。平均来说无限数量的客户端每秒向负载均衡器发 c * 0.8 个请求。也就是说我们随 c 增加线性提高请求负载让每台服务器负载恒定。请求到服务器后平均要一秒处理。那客户端观察到的平均请求时间会怎么随 c 变化呢选项 A随着 c 增加平均延迟快速降低渐近趋近于一秒即排队时间趋近于零。选项 B保持恒定。选项 C呈线性改善。选项 D延迟呈线性恶化。凭直觉你觉得延迟会是哪条曲线呢我在 Twitter 上问了粉丝同样的问题得到了有趣的不同结果深入分析这个问题能找出正确答案。首先了解相关术语。在排队论里这是个 M/M/c 排队系统即泊松到达过程、指数分布的客户端服务时间和 c 台后端服务器。在电信流量工程中它是 埃尔朗Erlang 延迟系统或者因术语多样也叫 M/M/n。我们能用排队论的经典结果——埃尔朗 C 公式 _E 2,n(A)_ 来分析这个系统该公式根据服务器数量n 即 c和提供的流量 A 计算传入客户请求进入队列而非立即处理的概率。具体细节可参考 《电信流量工程手册》 第 194 页。以下是该曲线的基本形状用相同参数沿着蓝色线到半饱和点提供的负载为 2.5 rps能看到概率约为 13%。再看紫色线的半饱和点5 rps概率仅为 3.6%。所以半负载时5 台服务器的系统能不排队处理 87% 的流量负载和服务器数量都翻倍时能不排队处理 96.4% 的流量意味着只有 3.6% 的请求会有额外延迟。事实证明这种改善确实渐近趋近于 1。Twitter 投票的正确答案是 A。用平均值衡量延迟有争议尽管 也许不应该如此。为避免争议我们得知道百分位数是否以相同速率改善。用封闭形式计算有点复杂但这个系统简单我们能用蒙特卡罗模拟绘制结果。结果如下这完全是个好消息。中位数p50和平均线吻合得好高百分位数99 分位和 99.9 分位也有类似形状没隐藏问题。这对云计算和服务经济也是好消息。随着 c 增大相同利用率下能有更好延迟或相同延迟下实现更高利用率且每台服务器吞吐量不变。这不仅对大型服务有利因为大部分好处在 c 相对较小时就有了。在和规模及分布式系统相关的问题中很少有随 c 增加变容易的这就是其中一个。有一些合理的后续问题。我们随意选的 0.8 这个值会影响结果稳定性吗答案是肯定的但有一定限度。一旦平均到达率超过系统处理请求的能力队列就会无限增长延迟也趋于无穷大。在我们例子中请求负载超过 c 时就会这样。更一般地说这个系统要稳定λ/cμ 必须小于 1其中 λ 是平均到达率μ 是服务器处理请求的平均时间。M/M/c 模型中泊松到达和指数服务时间的假设对典型服务合理吗我觉得虽不完全对但有一定合理性。指数服务时间尤其不准实际服务更接近对数正态分布但这可能不重要以后再详细讨论。更新丹·波茨Dan Ports在我的 Twitter 帖子下回复了一个精彩的 Twitter 线程指向了 SoCC’14 的 《尾部延迟的故事硬件、操作系统和应用层的尾部延迟来源》该文章探讨了现实中的这种效应。脚注1. 有一定限度。一旦平均到达率超过系统处理请求的能力队列就会无限增长延迟趋于无穷大。在我们例子中请求负载超过 c 时就会这样。更一般地说这个系统要稳定λ/cμ 必须小于 1其中 λ 是平均到达率μ 是服务器处理请求的平均时间。 返回博客索引相关文章2021 年 8 月 5 日 » 延迟悄然来袭2021 年 4 月 19 日 » 尾部延迟的影响可能比你想象的更大2026 年 6 月 19 日 » 认识爱丽丝。爱丽丝很没耐心。其他文章2015 年 5 月 24 日 » 碳酸钠与拉面化意大利面

相关新闻

Gemini企业级集成:从对话模型到产业API中枢的范式迁移
2026/6/20 11:59:11

Gemini企业级集成:从对话模型到产业API中枢的范式迁移

1. 这不是模型退化,是产品逻辑的主动转向——从“全能型AI”到“可嵌入式工具链”的底层迁移Gemini 被吐槽“越来越烂”,这个说法在中文互联网上高频出现,但背后其实藏着一个被严重误读的事实:它根本没在“变烂”,而是…

阅读更多
ModelScope加速Ollama安装与模型拉取实战指南
2026/6/20 11:59:11

ModelScope加速Ollama安装与模型拉取实战指南

1. 项目概述:为什么“ModelScope 安装 Ollama”不是标题误写,而是国内实操者的真实生存策略你搜“Ollama 安装”,首页弹出的全是官网链接、GitHub README 和一堆英文教程;点进去,curl -fsSL https://ollama.com/instal…

阅读更多
深入解析Sunshine游戏串流服务器:架构设计与实战指南
2026/6/20 11:59:11

深入解析Sunshine游戏串流服务器:架构设计与实战指南

深入解析Sunshine游戏串流服务器:架构设计与实战指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine Sunshine是一款专业的自托管游戏串流服务器,为Moonlig…

阅读更多
求职简历 PPT 模板怎么选?实测优选百度文库 AI 智能模板,覆盖全行业高效落地
2026/6/20 12:59:12

求职简历 PPT 模板怎么选?实测优选百度文库 AI 智能模板,覆盖全行业高效落地

简介:想要高效打造高通过率简历 PPT,选对模板平台是关键。本文围绕求职场景深度解析百度文库简历 PPT 模板全链路优势,依托平台 18 亿专业资源、GenFlow4.0 智能底座、行业首创智能 PPT 能力,从产品底层逻辑、内容资源、排版设计、…

阅读更多
AI智能体工程师实战手册:从单点突破到生产就绪的四阶路线
2026/6/20 12:59:12

AI智能体工程师实战手册:从单点突破到生产就绪的四阶路线

1. 这不是一张“学习地图”,而是一份智能体工程师的实战作战手册你点开这篇内容,大概率不是为了收藏吃灰,而是正卡在某个环节:可能是刚跑通一个LangChain示例,却不知道下一步该往哪堆代码;也可能是老板甩来…

阅读更多
数字拼写转换:从规则解析到多语言自动化实现
2026/6/20 12:59:12

数字拼写转换:从规则解析到多语言自动化实现

1. 项目概述:数字拼写的核心价值与场景 “Spelling out numbers”,翻译过来就是“将数字拼写出来”。这听起来像是一个小学一年级的语文作业,对吧?但如果你真这么想,那可就大错特错了。在我十多年的内容创作和技术文档…

阅读更多
Agent 核心原理:从概念到可交付结果
2026/6/20 12:59:12

Agent 核心原理:从概念到可交付结果

聊《Agent 核心原理:从概念到可交付结果》之前,先说一句实在的:别急着背概念,先看它在真实项目里到底解决什么问题。 摘要 本文概述文章目标、核心观点和实践价值。 分类:AI Agent | 账号:Java技术那些事…

阅读更多
第16章 MemGPT / Letta —— Agent 记忆的「操作系统」
2026/6/20 12:59:11

第16章 MemGPT / Letta —— Agent 记忆的「操作系统」

论文: "MemGPT: Towards LLMs as Operating Systems" (2023)项目: github.com/letta-ai/letta (原 MemGPT)16.1 核心思想:把 LLM 当作操作系统类比:计算机操作系统管理内存的方式操作系统内存层次:┌──────────┐ 最快/最小│ 寄存器…

阅读更多
OpenClaw:企业级AI能力调度中间件实战指南
2026/6/20 11:59:11

OpenClaw:企业级AI能力调度中间件实战指南

1. OpenClaw不是“另一个Cursor”:它到底在解决什么真问题?OpenClaw这个名字最近在开发者圈子里突然密集出现,但很多人点开GitHub仓库第一眼就愣住了——界面简陋、文档稀疏、连个像样的Demo视频都没有。更困惑的是,它和Cursor、C…

阅读更多
别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)
2026/6/17 23:21:18

别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)

超越BERT:用Transformers库高效实现文本相似度计算的三种实战方案在自然语言处理领域,文本相似度计算是信息检索、问答系统和推荐系统等应用的核心技术。传统方法如TF-IDF或Word2Vec已逐渐被基于Transformer的预训练模型所取代。Hugging Face的Transform…

阅读更多
Prompt Engineering:重构人机协作的工程化方法论
2026/6/18 4:35:02

Prompt Engineering:重构人机协作的工程化方法论

1. 项目概述:这不是“写提示词”,而是重构人机协作的底层逻辑“Prompt Engineering”这个词,这两年被讲得太多,也太轻飘。很多人把它理解成“给AI发指令的技巧”,甚至简化为“多加几个形容词”“换种说法再试一次”。我…

阅读更多
Anthropic提示层归零:模型即协议的工程实践
2026/6/18 15:04:04

Anthropic提示层归零:模型即协议的工程实践

1. 项目概述:这不是一次普通更新,而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题一出来,我正在调试一个Claude调用链的终端前停了三秒。不是因为震惊,而是因为熟悉&…

阅读更多
洛雪音乐终极音源指南:一站式获取全网无损音乐的完整解决方案
2026/6/20 0:59:03

洛雪音乐终极音源指南:一站式获取全网无损音乐的完整解决方案

洛雪音乐终极音源指南:一站式获取全网无损音乐的完整解决方案 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 你是否厌倦了在不同音乐平台之间来回切换,只为找到一首歌的无…

阅读更多
Display Driver Uninstaller深度清理方案:显卡驱动残留问题的终极解决方案(2024版)
2026/6/20 0:59:03

Display Driver Uninstaller深度清理方案:显卡驱动残留问题的终极解决方案(2024版)

Display Driver Uninstaller深度清理方案:显卡驱动残留问题的终极解决方案(2024版) 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitco…

阅读更多
深入解析MC68HC908AS32A的SCI模块:从异步通信原理到寄存器实战配置
2026/6/20 0:59:03

深入解析MC68HC908AS32A的SCI模块:从异步通信原理到寄存器实战配置

1. 项目概述:深入MC68HC908AS32A的异步串行通信核心在嵌入式系统开发中,尤其是面对工业控制、车载电子或智能仪表这类需要设备间稳定对话的场景,串行通信接口(SCI)往往是工程师最可靠的老朋友。它不像并行总线那样需要…

阅读更多
GIT修改用户名
2026/6/20 3:11:17

GIT修改用户名

在GIT中修改用户名可按以下步骤操作: 查看当前git的用户名,使用命令git config --list或git config user.name。修改git用户名,使用命令git config --global user.name "xxx(新的用户名)",将其中…

阅读更多
Win11Debloat:让你的Windows系统重获新生的终极优化工具
2026/6/19 20:40:12

Win11Debloat:让你的Windows系统重获新生的终极优化工具

Win11Debloat:让你的Windows系统重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …

阅读更多
技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践
2026/6/20 7:34:01

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter m4s-converter是一个…

阅读更多