JavaScript 迭代模式深度性能对比：从 for 循环到链式调用的选型决策 - 简希博客

引言：一个被忽视的性能鸿沟

在日常开发中，我们几乎每天都在写遍历逻辑。大多数团队的 ESLint 规则只关心代码风格——用 forEach 还是 for...of，用 map 还是 reduce。但很少有人追问：同样的逻辑用不同方式写，到底差多少？

先看一组对比基准（Chrome V8，10 万元素数组，取 100 次运行中位数）：

迭代方式	耗时 (ms)	相对基准	额外分配
经典 `for` 循环	0.48	1.0x (基准)	无
缓存长度的 `for`	0.42	0.88x	无
`for...of`	1.32	2.75x	迭代器对象
`forEach`	2.15	4.48x	闭包上下文
`map` (收集结果)	3.80	7.92x	新数组
`reduce` (求和)	4.12	8.58x	累加器闭包
`[].map().filter().reduce()`	11.20	23.33x	3 个中间数组

同一个业务逻辑，链式 API 写法可以比经典 for 慢 20 倍以上。 这不是微优化，而是架构级决策的差异。

一、底层机制：V8 如何看待不同的迭代方式

1.1 经典 `for` 循环：零中间对象的直通路径

// ✅ 最佳性能：缓存 length 的单层 for
const arr = new Array(100_000).fill(0).map((_, i) => i);
let sum = 0;
for (let i = 0, len = arr.length; i < len; i++) {
  sum += arr[i];
}

V8 的 TurboFan 优化编译器对这类模式有专门的处理路径：

边界检查提升 (Bounds Check Elimination)：当循环变量 i 与 arr.length 的比较模式固定，且循环内无数组写入，V8 会将边界检查提升到循环外，只做一次。
内联缓存 (Inline Cache)：arr[i] 的访问在第一次执行后建立 IC，后续访问直接走 fast path。
无函数调用开销：循环体内联展开，零栈帧分配。

// ❌ 常见但糟糕：每次迭代都访问 length
for (let i = 0; i < arr.length; i++) {
  // 每次都要读取 arr.length 属性
  sum += arr[i];
}

// ✅ 纠正：缓存 length 到局部变量
for (let i = 0, len = arr.length; i < len; i++) {
  sum += arr[i];
}

在元素类型统一（单态数组）时，缓存 length 的差异约 12%。当数组元素类型混杂（多态数组），差异可扩大到 30%+。

1.2 `forEach`：隐形成本分析

// 看似简洁，实则背负沉重
arr.forEach((item, index) => {
  sum += item;
});

每遍历一个元素，forEach 都要做以下工作：

创建并调用回调函数：一次函数调用 ≈ 栈帧分配 + 上下文切换
this 绑定：即使你不用 thisArg，引擎仍需检查
稀疏数组处理：forEach 按规范必须跳过空槽 (holes)，每次迭代都需检查 hasOwnProperty
无法提前退出：break / continue / return 全部失效

// ❌ 常见错误：试图用 return 提前退出
arr.forEach(item => {
  if (item > 5000) return; // 无效！只是退出当前回调
  doWork(item);
});

// ✅ 正确替代：用 for...of 或 some/every
for (const item of arr) {
  if (item > 5000) break;
  doWork(item);
}

// 或者用语义正确的 every
arr.every(item => {
  if (item > 5000) return false; // 停止遍历
  doWork(item);
  return true;
});

1.3 `for...of`：[Symbol.iterator] 的协议开销

for (const item of arr) {
  sum += item;
}

for...of 比 forEach 快约 40%，但仍是经典 for 的 2-3 倍开销。原因：

每次迭代调用 iterator.next() 方法
返回 { value, done } 对象（但 V8 优化后实际不分配堆对象）
需要 try/finally 包裹以处理 iterator.return()

但对于非数组可迭代对象（Map、Set、NodeList），for...of 是唯一能与经典 for 性能接近的迭代方式。

二、链式调用的 TCO 问题（Total Cost of Ownership）

2.1 隐性中间数组

// ❌ 链式灾难：3 个中间数组 + 3 次完整遍历
const result = arr
  .map(x => x * 2)       // 第 1 次遍历 → 生成中间数组 A
  .filter(x => x > 100)  // 第 2 次遍历 → 生成中间数组 B
  .reduce((a, b) => a + b, 0); // 第 3 次遍历

在 10 万元素规模下，仅中间数组的内存分配就超过 2.4 MB，触发多次 GC。

2.2 单一遍历改写

// ✅ 一次遍历，零中间分配
let sum = 0;
for (let i = 0, len = arr.length; i < len; i++) {
  const doubled = arr[i] * 2;
  if (doubled > 100) {
    sum += doubled;
  }
}

2.3 惰性求值：transducer 模式

当业务逻辑确实需要组合多个转换步骤时，使用 transducer 模式避免中间数组：

// ✅ transducer：组合多个转换，只遍历一次
const compose = (...fns) => x => fns.reduceRight((v, f) => f(v), x);

const mapping = fn => reducer => (acc, val) => reducer(acc, fn(val));
const filtering = pred => reducer => (acc, val) => pred(val) ? reducer(acc, val) : acc;

const transduce = (xf, reducer, init, arr) => {
  let acc = init;
  const r = xf(reducer);
  for (let i = 0, len = arr.length; i < len; i++) {
    acc = r(acc, arr[i]);
  }
  return acc;
};

// 使用
const xf = compose(
  mapping(x => x * 2),
  filtering(x => x > 100)
);
const result = transduce(xf, (a, b) => a + b, 0, arr);

这种方式将 map + filter 融合为一次遍历，性能接近手动 for 循环，同时保持了声明式的可组合性。

三、高频场景选型指南

场景 1：纯数据聚合（求和、计数、最大值）

// ✅ 优先选择：经典 for
let sum = 0;
for (let i = 0, len = arr.length; i < len; i++) {
  sum += arr[i];
}

// ⚠️ 折中方案：reduce（语义清晰，但每次迭代都是函数调用）
const sum = arr.reduce((a, b) => a + b, 0);

场景 2：条件提前退出

// ✅ 最佳：经典 for + break
for (let i = 0, len = arr.length; i < len; i++) {
  if (predicate(arr[i])) {
    return arr[i];
  }
}

// ⚠️ 可用：some/every（语义正确 + 可退出）
const found = arr.some(item => {
  if (predicate(item)) { result = item; return true; }
  return false;
});

// ❌ 错误：forEach（无法退出）

场景 3：转换+筛选+聚合（管道场景）

// ✅ 热路径（执行频率 >100/s）：手动 for + 单一遍历
// ⚠️ 普通路径：transduce / 单次 reduce
// ❌ 原型/一次性代码：链式 map→filter→reduce

场景 4：稀疏数组处理

const sparse = new Array(100_000);
sparse[0] = 1;
sparse[50_000] = 2;
sparse[99_999] = 3;

// ✅ forEach / for...of 自动跳过空槽
sparse.forEach(v => console.log(v)); // 只输出 3 次

// ⚠️ 经典 for 不会跳过空槽（可能访问到 undefined）
for (let i = 0; i < sparse.length; i++) {
  if (sparse[i] !== undefined) { // 需要手动检查
    console.log(sparse[i]);
  }
}

四、实战决策树

需要遍历数组
├── 数据量 > 10,000 或执行频率 > 100/s
│   ├── 需要提前退出 (break)?
│   │   └── ✅ 经典 for + break
│   ├── 纯聚合/查找?
│   │   └── ✅ 经典 for（缓存 length）
│   └── 需要组合多个转换?
│       └── ✅ transduce / 手动单次遍历
│
├── 数据量 < 10,000 且执行频率低
│   ├── 需要返回新数组?
│   │   └── ⚠️ map / filter（可读性优先）
│   ├── 需要提前退出?
│   │   └── ⚠️ for...of + break
│   └── 纯副作用执行?
│       └── ⚠️ forEach（简洁优先）
│
└── 处理 Map / Set / NodeList 等非数组?
    └── ✅ for...of（唯一高性能路径）

总结

原则	说明
热路径用经典 for	渲染循环、事件处理、大数据转换
冷路径用声明式	配置处理、初始化、低频逻辑
链式调用避免超过 2 层	超过则考虑 transduce 或手写单次遍历
forEach 不用于可退出逻辑	用 for...of 或 some/every 替代
优先压测，而非臆测	用 jsbench.me 或 benchmark.js 验证你的场景

性能优化的核心不是记住所有规则，而是建立"优化意识"：在写每一行遍历代码时，清晰地知道你选择了哪种运行成本。 当你能在 forEach 和 for 之间做出有据可依的选择时，你就已经超越了 90% 的 JavaScript 开发者。