v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

By v2exgo at 1 天前 · 10261 次点击

最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

74 条回复    2026-03-12 19:59:26 +08:00
wyntalgeer
   1
wyntalgeer  
   1 天前
真有人用中转写代码?
kfpenn
   2
kfpenn  
   1 天前
@wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
106npo
   3
106npo  
   1 天前 via Android
用中转站就做好会用来被蒸馏的打算呗
freak118
   4
freak118  
   1 天前
这玩意儿是不是搞个用户协议就完全免责了
daimaosix
   5
daimaosix  
   1 天前
用开源程序自建的中转自用应该 OK 的吧
harlen
   6
harlen  
   1 天前
我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
JoeDH
   7
JoeDH  
   1 天前
我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
gdkttt
   8
gdkttt  
   1 天前
还是不能贪便宜用中转站,还是老实去买官方的
xFrye
   9
xFrye  
   1 天前
都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
LunaSeki
   10
LunaSeki  
   1 天前
用中转都默认会被偷数据吧
一些 coding plan 也会默认授权用于训练
augustcc
   11
augustcc  
   1 天前
emm 无所谓的项目用中转。其他我都是用 team
evamayy
   12
evamayy  
   1 天前
中转一般数据都会上传的吧
lujiaosama
   13
lujiaosama  
   1 天前
中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
Lockroach
   14
Lockroach  
   1 天前
总结一下上面内容就是:用中转就做好数据被出售的预期。
akakcolin
   15
akakcolin  
   1 天前
你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
VeteranCat
   16
VeteranCat  
   1 天前
现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

这些中转站更是卖起来毫无心理负担。
Shielber
   17
Shielber  
   1 天前
我说我的 tg 号怎么用着好好的被封了
p2007
   18
p2007  
   1 天前
中转站基本没有任何信誉,不跑路就已经很难得了
everettjf
   19
everettjf  
   1 天前
开源项目写一些倒是无所谓。。。
tommyshelbyV2
   20
tommyshelbyV2  
   1 天前
用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
009694
   21
009694  
   1 天前 via iPhone
@freak118 灰产 随时可以跑路 需要什么用户协议😂
calmbinweijin
   22
calmbinweijin  
   1 天前
我可没有,我纯白,目前已亏 500R
jiirouwei
   23
jiirouwei  
   1 天前
用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
cat
   24
cat  
   1 天前
openrouter 和 vercel ai gateway 呢?
freak118
   25
freak118  
   1 天前
@calmbinweijin 这还能亏吗 中转的成本是啥
v2exgo
   26
v2exgo  
OP
   1 天前
@freak118 #25 cdn 服务器 都要钱的
a1exlism
   27
a1exlism  
   1 天前
用中转就怕这个,所以能自建一定是自建优先的
yuexiahaowu
   28
yuexiahaowu  
   1 天前
官司的破代码,心里有数,无所谓的
PC9528
   29
PC9528  
   1 天前
我用第三方中转已经默认会被拿去训练了...
crime1024
   30
crime1024  
   1 天前
没事 用来养虾额
lovelive1024
   31
lovelive1024  
   1 天前
中转都是默认没隐私
calmbinweijin
   32
calmbinweijin  
   1 天前
@freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
poorcai
   33
poorcai  
   1 天前
话说 team 账号现在怎么开通啊?官网没看到
kfpenn
   34
kfpenn  
   1 天前
@lujiaosama 有啊,cursor 的 share data 还不允许取消
ano
   35
ano  
   1 天前
@lujiaosama 想什么呢,包被拿去训练的,900%。
区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
timeance
   36
timeance  
   1 天前
幸好我用中转都是翻译黄油
sommio
   37
sommio  
   1 天前
像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
能降低 API 价格和同时增强国产模型的结果也算还可以了(
penisulaS
   38
penisulaS  
   1 天前   ❤️ 1
我的代码怀疑都是污染大模型的
nbndco
   39
nbndco  
   1 天前
中转就是默认蒸馏啊,只要不在乎就挺好的
dko
   40
dko  
   1 天前
拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
dockerhub
   41
dockerhub  
   1 天前
擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
v2exgo
   42
v2exgo  
OP
   1 天前
@dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
Meteora626
   43
Meteora626  
   1 天前
@lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
catazshadow
   44
catazshadow  
   1 天前 via Android   ❤️ 3
岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
isnullstring
   45
isnullstring  
   1 天前
用谁都一样,中转卖、官方的自己用
rfv2
   46
rfv2  
   1 天前 via Android
官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
unusualcat
   47
unusualcat  
   1 天前
1USDT 50 条会话?这玩意这么值钱啊!
v2exgo
   48
v2exgo  
OP
   1 天前
@unusualcat 要那种单次对话的
aarontian
   49
aarontian  
   1 天前
能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
goodboy95
   50
goodboy95  
   1 天前 via Android
我连用官方的都默认数据全交出去了
ideard
   51
ideard  
   1 天前
还好我是自建,免费的东西代价太大了
JoshTheLegend
   52
JoshTheLegend  
   1 天前
别说中转了,用官方的不都是默认全交的吗...
unixcs
   53
unixcs  
   1 天前 via Android
比起我的数据,我更想省点 token 的钱
unusualcat
   54
unusualcat  
   21 小时 32 分钟前
没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
v2exgo
   55
v2exgo  
OP
   21 小时 23 分钟前
@unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
LowBi
   56
LowBi  
   19 小时 45 分钟前
官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
MoozLee
   57
MoozLee  
   19 小时 24 分钟前   ❤️ 1
我的破代码被拿去蒸馏了,我有什么损失吗?
dabingbing
   58
dabingbing  
   18 小时 58 分钟前
在乎这个?
viking602
   59
viking602  
   18 小时 43 分钟前
@freak118 #4 中转站本身就不是什么正经营生 爱用就用的那种基本上
beijiaoff
   60
beijiaoff  
   17 小时 34 分钟前
@rfv2 我觉得从技术上完全可以。就是中转本身就是灰色的……
luckywuuuuu
   61
luckywuuuuu  
   17 小时 27 分钟前
@sommio 有的,gpt 网页版可以设置不用于模型训练。但是,这种东西只有大企业说的你还可以信一点。。。
ps: 其实正常人和公司不怕主流的大模型学习到了,因为激活这个信息的概率太低了,怕就怕别人不拿来训练拿来扒提示词
toriagpiosk
   62
toriagpiosk  
   17 小时 13 分钟前
前端时间就发现了,大量灰产组织开始和——AI API 中转站出现交易,其中很多都是公益站

<img src="https://tc.7zz.cn/i/2026/03/12/35c2a3d28a994684387b7f7b6df35934.png" alt="image" />
chi1st
   63
chi1st  
   17 小时 9 分钟前
官方就不用你数据了?你在 V 站的发言也早就被拿去训练了。。。
nVic
   64
nVic  
   17 小时 6 分钟前
@chi1st 一般来说你不会选择在 v 站发自己的敏感信息
zomco
   65
zomco  
   16 小时 22 分钟前
他不会以为我用中转站是干正经事的吧
jiangzm
   66
jiangzm  
   15 小时 38 分钟前
做中转站的真恶心
streamrx
   67
streamrx  
   15 小时 18 分钟前 via iPhone
用中转站不就是默认数据 100%会被使用和出售吗
click04
   68
click04  
   14 小时 47 分钟前
理论上中转站确实具有很高的超级权限:
1. 看到所有用户输入的信息
2. 编码/养虾场景可以在大模型响应中加上额外的任意命令
相当于把远程操作能力交给了一个没那么可信的组织。
有很多公益免费的站点不知道他们热衷建站的目的,为了技术平权?
boboboka
   69
boboboka  
   13 小时 46 分钟前
不知道是不是公益站会出现,我现在用的几个付费中转,倒是都说不会保存,也不知道是不是真的
635925926
   70
635925926  
   13 小时 39 分钟前   ❤️ 1
问题来了,能不能反向污染呢。比如搞一个项目的变量名全是拼音。
eya46
   71
eya46  
   13 小时 38 分钟前
官方的也一样,买的豆包 coding plan 明确写着可用于训练😒
evamayy
   72
evamayy  
   12 小时 43 分钟前
免费的才是最贵的,你以为你在用便宜的 API ,其实你自己才是产品
nyfwan123
   73
nyfwan123  
   10 小时 8 分钟前
我是做中转的 确实有人找我买过 但是我硬盘就 40 个 G 还有自己的数据 且都是老朋友在用 所以拒绝了采购
v2exgo
   74
v2exgo  
OP
   8 小时 48 分钟前
@click04 一些是用爱发电吧
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
© 2026 V2EX · 41ms · 3.9.8.5