nativeBoy
V2EX  ›  程序员

roo code+deepseek,缓存命中很便宜!

By nativeBoy at 19 小时 11 分钟前 · 1120 次点击
我让 Roo code 从 0 规划写了个小项目,考虑到 deepseek 便宜就用官方的 deepseek ,结果用了 6M tokens 才完成,一看花费才 2 块钱!
看了一下,6M tokens 几乎都命中了缓存,所以便宜的很

相同场景,用中转站没有缓存命中,贵的要死!余额减得很快





deepseek 官方价格链接: https://api-docs.deepseek.com/zh-cn/quick_start/pricing/
12 条回复    2026-03-12 16:41:59 +08:00
iorilu
   1
iorilu  
   19 小时 0 分钟前
这缓存命中是什么原理

不太可能两人用一样提示词把

还是用了相似性, 差不多了就算一样, 就取缓存?
nativeBoy
   2
nativeBoy  
OP
   18 小时 54 分钟前
niubilewodev
   3
niubilewodev  
   18 小时 52 分钟前
是的,很多中转站没有缓存,用起来不比官方便宜。
66beta
   4
66beta  
   18 小时 47 分钟前
me too 但是公司买了 claude 不用自己花钱了
dbskcnc
   5
dbskcnc  
   18 小时 38 分钟前
deepseek v4 快点出来吧,如果能用 就不需要用 google 了
asd999cxcx
   6
asd999cxcx  
   18 小时 0 分钟前
官方上下文会不会不够?我看别人说火山的上下文会多一些
nativeBoy
   7
nativeBoy  
OP
   17 小时 54 分钟前
@asd999cxcx #6 当上下文达到 128K 时,roo code 会把上下文压缩
yangzzzzzz
   8
yangzzzzzz  
   17 小时 38 分钟前
chat 和 reasoner 用起来有什么区别吗
stefwoo
   9
stefwoo  
   17 小时 36 分钟前
@iorilu

缓存命中不是很简单吗?就是你第一轮对话的时候,会带上第一轮的数据。第二轮对话是带上第一轮和第二轮的数据。第三轮对话是带上前两轮的数据。然后你每次都会命中啊。相当于你每次发给他的就是增量的不太多,大部分都是对话的历史数据。
iorilu
   10
iorilu  
   17 小时 26 分钟前
@stefwoo 这就算缓存? 只能自己给自己缓存阿

我还以为是不同用户的请求, 匹配相似度, 相似就缓存

比如你发请求说, 写一个快速排序算法

另一个人也发类似请求, 那就直接返回一样内容
inc3ption
   11
inc3ption  
   17 小时 12 分钟前
@iorilu 就是 9 楼说的这样,除了第一轮会话外,后续会话都会命中缓存,一次会话轮数越多命中率就越高;反之不停的开新会话,整体的命中率就越低
listenerri
   12
listenerri  
   12 小时 6 分钟前
@inc3ption #11 是这样的话,如果子代理用的多了也费钱
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
© 2026 V2EX · 23ms · 3.9.8.5