LogoSteve
  • 博客
  • 关于我
Prompt Caching TTL 是什么?
2026/03/30

Prompt Caching TTL 是什么?

TTL 就是 Prompt Cache 的存活时间。命中一次就刷新一次,空置太久就会过期。

TTL 是 Time To Live 的缩写,说白了就是缓存能活多久。

放在 prompt caching 里,它描述的是一段缓存前缀能够存活多久。

先看一个具体例子

牛奶保质期和它很像:

你去超市买了一盒牛奶,保质期 5 天(TTL = 5 天)

第 1 天  新鲜可用
第 2 天  还能喝
第 5 天  最后一天
第 6 天  过期丢掉

Prompt caching 的 TTL 也是这个逻辑:

00:00  第一次请求,前缀被写入缓存
02:30  有请求命中缓存,TTL 刷新回 5 分钟
07:29  再次命中,TTL 再次刷新
12:30  连续 5 分钟没人用,缓存过期并被清除
12:31  新请求到来,未命中,需要重新全价计算并写入缓存

各家 TTL 的常见差异

提供商TTL是否可配置命中后是否刷新
Anthropic Claude5 分钟否是
OpenAI几分钟到几小时否,机制不透明不透明
Google Gemini可由开发者自定义,默认 1 小时是是

Claude 常被讨论的 5 分钟 TTL,意思就是:只要后续请求还落在这个窗口里,缓存大概率还在;如果你停得太久,下一次就得重新写一遍。

全部文章

作者

avatar for Steve
Steve

分类

  • AI
先看一个具体例子各家 TTL 的常见差异

更多文章

Agent vs Harnessed Agent
AIDevelopment

Agent vs Harnessed Agent

Claude Code 适合高交互的探索;要把 Agent 拉进长程、可恢复、可审计的工程流程里,最后还是得靠代码去约束执行。

avatar for Steve
Steve
2026/03/30
如何看待 Agent 记忆?
AI

如何看待 Agent 记忆?

我更倾向按需记忆,而不是默认自动记忆。难点从来不是“要不要记”,而是记什么、什么时候记,以及怎么避免记忆变成噪音。

avatar for Steve
Steve
2026/03/30
Cursor Rules 入门指南:如何高效编写提示词
AI

Cursor Rules 入门指南:如何高效编写提示词

深入了解 Cursor 中的 Rules 分类与提示词结构,让 AI 成为你的顶级开发助手

avatar for Steve
Steve
2026/03/21
LogoSteve

Steve 的博客

© 2026 Steve