Re: 各位大佬怎么看Deepseek - 信息科学技术学院(EECS)版 - 北大未名BBS

Re: 各位大佬怎么看Deepseek

[复制链接] 浏览该主题帖

znf [离线]

tensorglow

该用户不存在
<ASCIIArt> #17817

最初来源肯定不一样啦,筛选与合成方式肯定也是有差异的,那些数据拿来要清洗筛选什么的,质量会不同,规模也会不同,有的模态会合成许多数据,方式也不一样,但是数据分布应该都一样

cretaceous (ID_rampage) 在 ta 的帖子中提到:

愿听其详,现在这些厂的预训练数据主要来源是?差别在哪儿呢

发表于2025-01-30 19:42:47

请您先 登录 再进行发帖

快捷回帖
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入