Node.js 内存管理深度解析：从 V8 垃圾回收到生产环境优化 - 简希博客

内存泄漏是 Node.js 服务端最常见的生产事故之一。理解 V8 的内存管理机制，才能写出真正健壮的服务。

一、V8 内存结构速览

V8 将堆内存分为几个区域：

关键数字：

新生代（New Space）：默认 16MB，存放短生命周期对象
老生代（Old Space）：默认 ~1.4GB（64位系统），存放长生命周期对象
单个 String 最大长度：~512MB

二、垃圾回收机制详解

2.1 新生代：Scavenge 算法

新生代采用 Cheney 的 Semi-space 算法，特点：速度快（~1ms），但空间利用率只有 50%。

晋升条件（对象从新生代移到老生代）：

经历过一次 Scavenge GC 仍然存活
To-Space 使用率超过 25%

2.2 老生代：Mark-Sweep-Compact

老生代使用三色标记算法：

白色：未访问（待回收）
灰色：已访问，但子节点未全部访问
黑色：已访问，子节点全部访问完毕

三、内存泄漏的典型场景

3.1 闭包持有大对象

// ❌ 内存泄漏：闭包持有 entireData 引用
function createHandler() {
  const entireData = await fetchHugeDataset(); // 100MB 数据
  return function processItem(id) {
    return entireData.find(item => item.id === id);
  };
}

// ✅ 修复：使用 Map 建立索引
function createHandler() {
  const entireData = await fetchHugeDataset();
  const index = new Map(entireData.map(item => [item.id, item]));
  return function processItem(id) {
    return index.get(id);
  };
}

3.2 全局缓存无淘汰策略

// ❌ 内存泄漏：缓存无限增长
const cache = {};

// ✅ 修复：使用 LRU 缓存
import LRUCache from 'lru-cache';
const cache = new LRUCache({
  max: 500,
  maxSize: 50 * 1024 * 1024,
  ttl: 1000 * 60 * 10,
});

3.3 EventEmitter 监听器泄漏

// ❌ 泄漏：每次请求都添加监听器，从不移除
app.get('/stream', (req, res) => {
  emitter.on('data', (chunk) => res.write(chunk));
});

// ✅ 修复：请求结束时移除监听器
app.get('/stream', (req, res) => {
  const handler = (chunk) => res.write(chunk);
  emitter.on('data', handler);
  res.on('close', () => emitter.off('data', handler));
});

3.4 定时器未清理

// ❌ 泄漏：客户端断开后定时器还在运行
app.get('/poll', (req, res) => {
  const timer = setInterval(async () => { /* ... */ }, 1000);
});

// ✅ 修复：监听客户端断开
app.get('/poll', (req, res) => {
  const timer = setInterval(async () => { /* ... */ }, 1000);
  req.on('close', () => clearInterval(timer));
});

四、生产环境监控与排查

4.1 暴露内存指标

app.get('/metrics/memory', (req, res) => {
  const used = process.memoryUsage();
  res.json({
    rss: (used.rss / 1024 / 1024).toFixed(2) + ' MB',
    heapTotal: (used.heapTotal / 1024 / 1024).toFixed(2) + ' MB',
    heapUsed: (used.heapUsed / 1024 / 1024).toFixed(2) + ' MB',
  });
});

4.2 告警阈值设置

const HEAP_WARN_THRESHOLD = 0.8;
const HEAP_CRIT_THRESHOLD = 0.9;

setInterval(() => {
  const { heapUsed, heapTotal } = process.memoryUsage();
  const ratio = heapUsed / heapTotal;
  if (ratio > HEAP_CRIT_THRESHOLD) {
    console.error(`[CRITICAL] Heap usage: ${(ratio * 100).toFixed(1)}%`);
  }
}, 30000);

五、Node.js 启动参数调优

# 调整老生代上限（建议：可用内存的 70% ~ 80%）
node --max-old-space-size=3072 server.js

# 启用并发标记（减少 GC 停顿）
node --concurrent-marking server.js

# GC 日志（排查问题时使用）
node --trace-gc --trace-gc-verbose server.js

六、总结

场景	工具	操作
日常监控	process.memoryUsage()	配合 Prometheus/Grafana
怀疑泄漏	Heap Snapshot	对比两个时间点的快照
GC 停顿	--trace-gc	分析 GC 频率和耗时

核心原则：

缓存必须有上限（数量或 TTL）
监听器/定时器必须有清理机制
大数据处理用 Stream，不要一次性加载
生产环境必须有内存监控和告警

理解 GC 机制不是为了炫技，而是为了在内存爆炸时知道该查哪里。

一、V8 内存结构速览

二、垃圾回收机制详解

2.1 新生代：Scavenge 算法

2.2 老生代：Mark-Sweep-Compact

三、内存泄漏的典型场景

3.1 闭包持有大对象

3.2 全局缓存无淘汰策略

3.3 EventEmitter 监听器泄漏

3.4 定时器未清理

四、生产环境监控与排查

4.1 暴露内存指标

4.2 告警阈值设置

五、Node.js 启动参数调优

六、总结

评论区