wsbqdyhm
V2EX  ›  程序员

Gemini 3 Flash 用着挺香,但想找个更便宜的替代

By wsbqdyhm at 13 小时 58 分钟前 · 2156 次点击
最近在折腾 OpenClaw (小龙虾)+ n8n 工作流 做一些自动化任务,现在主要是薅 Google 的 $300 API credit 。

主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。

现在的问题是:
想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。

另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。

在各大主流 ai 问了一圈,投票如下:

云端模型(对标 Gemini 3 Flash )

Kimi K2.5-K2 ( 4 票)

DeepSeek R1 / V3.2 ( 1 票)

本地部署( 4090 )

DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)

GLM-4.7-Flash ( 30B A3B MoE )( 2 票)

目前的思路大概是:

主力:Gemini 3 Flash

云端备用:Kimi / DeepSeek

本地:跑一个 30B 左右模型兜底

不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:

Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?

有没有 性价比能接近 Gemini 3 Flash 的模型?

4090 本地模型现在比较稳的是不是还是 32B 这一档?

欢迎拍砖,主要想听听长期在用的经验。
22 条回复    2026-03-12 22:17:59 +08:00
superkkk
   1
superkkk  
   13 小时 53 分钟前
千问 3.5 35B A3B 或者千问 coder next ,这俩还行,但是毕竟免费开源的,24g 显存可能不够
liu731
   2
liu731  
PRO
   13 小时 47 分钟前
比它聪明的没它快,比它快的没它聪明
wsbqdyhm
   3
wsbqdyhm  
OP
   13 小时 40 分钟前
@liu731 2.5flash 体验怎么样? 之前用了一下 2.5 pro 弱智一样。
skyemin
   4
skyemin  
   13 小时 38 分钟前
$300 API 现在还送吗
liu731
   5
liu731  
PRO
   13 小时 38 分钟前
@wsbqdyhm 简单任务(<=5K Token )还不错。复杂任务不行
wsbqdyhm
   6
wsbqdyhm  
OP
   13 小时 28 分钟前
@skyemin 送的,但有各种限额。用 3.1p 一不小心就⚠️ API rate limit reached. Please try again later.
chungon
   7
chungon  
   13 小时 28 分钟前
这个我也没找到替代,国产的试了一圈都没有它好用
resist
   8
resist  
   13 小时 19 分钟前
模型我认为目前好用的就是 gemini 和 chatgpt ,其他的都差点意思
eGlhb2Jhb2Jhbw
   9
eGlhb2Jhb2Jhbw  
   13 小时 1 分钟前
今天试了下本地部署 QWen3.5 35B-A3B 可用度很高,https://pinchbench.com/ 上评分超过了 gemini-3-flash-preview
FengMubai
   10
FengMubai  
   12 小时 57 分钟前
3.1 lite
v2gba
   11
v2gba  
   12 小时 54 分钟前
3 flash 跑一天大概多少花费?
skyemin
   12
skyemin  
   12 小时 51 分钟前
@wsbqdyhm 咋操作呀 可以的话我也弄一下
HaibaraDP
   13
HaibaraDP  
   12 小时 43 分钟前
3.1 lite
xiafengjieying
   14
xiafengjieying  
   11 小时 4 分钟前 via iPhone
3.1pro 有调用 api 么?
wsbqdyhm
   15
wsbqdyhm  
OP
   10 小时 18 分钟前 via iPhone
@xiafengjieying #14 有 3.1 预览版,250 次一天
wsbqdyhm
   16
wsbqdyhm  
OP
   10 小时 17 分钟前 via iPhone
@skyemin #12 直接卡验证就行,v 卡双币的好像不行,我用的招行万事达可以,
wsbqdyhm
   17
wsbqdyhm  
OP
   10 小时 17 分钟前 via iPhone
@eGlhb2Jhb2Jhbw #9 4090 能跑不
Cusox
   18
Cusox  
   9 小时 32 分钟前
$300 大概能用多久
zyqbit
   19
zyqbit  
   9 小时 13 分钟前
@Cusox #18 我记得好像是 90 天有效期
NakanoAzure
   20
NakanoAzure  
   6 小时 45 分钟前
现在还能白嫖 api 吗,是不是多注册几个白嫖就行?
Deshun
   21
Deshun  
   6 小时 30 分钟前 via Android
Dear Developer,
Our review of your Gemini API activity indicates that your project Agent (id: gen-lang-client-0107) is using Gemini API in a manner that violates both the Gemini API Additional Terms of Service and the broader Google APIs Terms of Service for the Google API you are using. As a result of this violation, we have restricted your access to the corresponding APIs.
You may respond to this decision by submitting an appeal. Please note that you should be logged in as the project owner to access the appeals page.
Please take a moment to also review the Google APIs Terms of Service, the Gemini API Additional Terms of Service, and the Generative AI Prohibited Use Policy applicable to Gemini API so that you do not violate our terms and policies in the future.
Deshun
   22
Deshun  
   6 小时 30 分钟前 via Android
@Cusox 一天
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
© 2026 V2EX · 24ms · 3.9.8.5