Re: 学校要不要组建一个基于deepseek的模型服务器啊 - 信息科学技术学院(EECS)版 - 北大未名BBS

Re: 学校要不要组建一个基于deepseek的模型服务器啊

[复制链接] 浏览该主题帖

GALENCIAGA [离线]

akagi

2.9主序星

发帖数:146 原创分:0
关注
<ASCIIArt> #17830

4bit量化精度损失太大,而且你不能只考虑能塞下权重需要多少显存,r1类模型输出长度比较大,很吃kvcahe的 

LYMing (老玉米) 在 ta 的帖子中提到:

可以低成本部署

现在有4090 48g的涡轮卡,2.x万一张随便买

一套epyc的4u 8卡机箱,里面塞上48g x 8就能上deepseek 671b的q4km 

……

签名档

EVERYBODY LIES

NO EXCEPTIONS

发表于2025-02-01 16:56:34

请您先 登录 再进行发帖

快捷回帖
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入