Re: 学校要不要组建一个基于deepseek的模型服务器啊
4bit量化精度损失太大,而且你不能只考虑能塞下权重需要多少显存,r1类模型输出长度比较大,很吃kvcahe的
LYMing (老玉米) 在 ta 的帖子中提到:
可以低成本部署
现在有4090 48g的涡轮卡,2.x万一张随便买
一套epyc的4u 8卡机箱,里面塞上48g x 8就能上deepseek 671b的q4km
……
EVERYBODY LIES
NO EXCEPTIONS
本站规定,相同或相近内容的帖子一周内严禁在5个及5个以上讨论区内重复张贴,否则将受到禁言全站发文权限直至删除帐号的处罚。
多个id共同一文多发的,对参与多发的每个id按多发总数进行处罚
点击右上角“”分享该页面