最近在折腾 OpenClaw (小龙虾)+ n8n 工作流 做一些自动化任务,现在主要是薅 Google 的 $300 API credit 。
主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。
现在的问题是:
想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。
另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。
在各大主流 ai 问了一圈,投票如下:
云端模型(对标 Gemini 3 Flash )
Kimi K2.5-K2 ( 4 票)
DeepSeek R1 / V3.2 ( 1 票)
本地部署( 4090 )
DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)
GLM-4.7-Flash ( 30B A3B MoE )( 2 票)
目前的思路大概是:
主力:Gemini 3 Flash
云端备用:Kimi / DeepSeek
本地:跑一个 30B 左右模型兜底
不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:
Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?
有没有 性价比能接近 Gemini 3 Flash 的模型?
4090 本地模型现在比较稳的是不是还是 32B 这一档?
欢迎拍砖,主要想听听长期在用的经验。
主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。
现在的问题是:
想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。
另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。
在各大主流 ai 问了一圈,投票如下:
云端模型(对标 Gemini 3 Flash )
Kimi K2.5-K2 ( 4 票)
DeepSeek R1 / V3.2 ( 1 票)
本地部署( 4090 )
DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)
GLM-4.7-Flash ( 30B A3B MoE )( 2 票)
目前的思路大概是:
主力:Gemini 3 Flash
云端备用:Kimi / DeepSeek
本地:跑一个 30B 左右模型兜底
不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:
Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?
有没有 性价比能接近 Gemini 3 Flash 的模型?
4090 本地模型现在比较稳的是不是还是 32B 这一档?
欢迎拍砖,主要想听听长期在用的经验。
22 条回复 • 2026-03-12 22:17:59 +08:00
|
1
superkkk 13 小时 53 分钟前
千问 3.5 35B A3B 或者千问 coder next ,这俩还行,但是毕竟免费开源的,24g 显存可能不够
|
|
2
liu731 PRO |
|
4
skyemin 13 小时 38 分钟前
$300 API 现在还送吗
|
|
6
wsbqdyhm OP @skyemin 送的,但有各种限额。用 3.1p 一不小心就⚠️ API rate limit reached. Please try again later.
|
|
7
chungon 13 小时 28 分钟前
这个我也没找到替代,国产的试了一圈都没有它好用
|
|
8
resist 13 小时 19 分钟前
模型我认为目前好用的就是 gemini 和 chatgpt ,其他的都差点意思
|
|
9
eGlhb2Jhb2Jhbw 13 小时 1 分钟前
今天试了下本地部署 QWen3.5 35B-A3B 可用度很高,https://pinchbench.com/ 上评分超过了 gemini-3-flash-preview
|
|
10
FengMubai 12 小时 57 分钟前
3.1 lite
|
|
11
v2gba 12 小时 54 分钟前
3 flash 跑一天大概多少花费?
|
|
13
HaibaraDP 12 小时 43 分钟前
3.1 lite
|
|
14
xiafengjieying 11 小时 4 分钟前 via iPhone
3.1pro 有调用 api 么?
|
|
15
wsbqdyhm OP @xiafengjieying #14 有 3.1 预览版,250 次一天
|
|
17
wsbqdyhm OP @eGlhb2Jhb2Jhbw #9 4090 能跑不
|
|
18
Cusox 9 小时 32 分钟前
$300 大概能用多久
|
|
20
NakanoAzure 6 小时 45 分钟前
现在还能白嫖 api 吗,是不是多注册几个白嫖就行?
|
|
21
Deshun 6 小时 30 分钟前 via Android
Dear Developer,
Our review of your Gemini API activity indicates that your project Agent (id: gen-lang-client-0107) is using Gemini API in a manner that violates both the Gemini API Additional Terms of Service and the broader Google APIs Terms of Service for the Google API you are using. As a result of this violation, we have restricted your access to the corresponding APIs. You may respond to this decision by submitting an appeal. Please note that you should be logged in as the project owner to access the appeals page. Please take a moment to also review the Google APIs Terms of Service, the Gemini API Additional Terms of Service, and the Generative AI Prohibited Use Policy applicable to Gemini API so that you do not violate our terms and policies in the future. |
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
