LogoSteve
  • 博客
  • 关于我
Prompt Caching TTL 是什么?
2026/03/30

Prompt Caching TTL 是什么?

TTL 就是 Prompt Cache 的存活时间。命中一次就刷新一次,空置太久就会过期。

TTL 是 Time To Live 的缩写,说白了就是缓存能活多久。

放在 prompt caching 里,它描述的是一段缓存前缀能够存活多久。

先看一个具体例子

牛奶保质期和它很像:

你去超市买了一盒牛奶,保质期 5 天(TTL = 5 天)

第 1 天  新鲜可用
第 2 天  还能喝
第 5 天  最后一天
第 6 天  过期丢掉

Prompt caching 的 TTL 也是这个逻辑:

00:00  第一次请求,前缀被写入缓存
02:30  有请求命中缓存,TTL 刷新回 5 分钟
07:29  再次命中,TTL 再次刷新
12:30  连续 5 分钟没人用,缓存过期并被清除
12:31  新请求到来,未命中,需要重新全价计算并写入缓存

各家 TTL 的常见差异

提供商TTL是否可配置命中后是否刷新
Anthropic Claude5 分钟否是
OpenAI几分钟到几小时否,机制不透明不透明
Google Gemini可由开发者自定义,默认 1 小时是是

Claude 常被讨论的 5 分钟 TTL,意思就是:只要后续请求还落在这个窗口里,缓存大概率还在;如果你停得太久,下一次就得重新写一遍。

全部文章

作者

avatar for Steve
Steve

分类

  • AI
先看一个具体例子各家 TTL 的常见差异

更多文章

Multi-Agent Worktree 是 Git Worktree 么?
Agent

Multi-Agent Worktree 是 Git Worktree 么?

是的,就是把 git worktree 用在 Agent 协作上:同一个仓库,多份工作目录,尽量别让并行改动互相踩文件。

avatar for Steve
Steve
2026/03/30
Agent vs Harnessed Agent
Agent

Agent vs Harnessed Agent

Claude Code 适合高交互的探索;要把 Agent 拉进长程、可恢复、可审计的工程流程里,最后还是得靠代码去约束执行。

avatar for Steve
Steve
2026/03/30
Prompt Caching 的生效范围是什么?
AI

Prompt Caching 的生效范围是什么?

Prompt caching 看的是前缀内容,不是 session 身份。只要前缀一致,它就可能跨对话,甚至跨用户复用。

avatar for Steve
Steve
2026/03/30
LogoSteve

Steve 的博客

© 2026 Steve