Re: 各位大佬怎么看Deepseek
最初来源肯定不一样啦,筛选与合成方式肯定也是有差异的,那些数据拿来要清洗筛选什么的,质量会不同,规模也会不同,有的模态会合成许多数据,方式也不一样,但是数据分布应该都一样
cretaceous (ID_rampage) 在 ta 的帖子中提到:
愿听其详,现在这些厂的预训练数据主要来源是?差别在哪儿呢
本站规定,相同或相近内容的帖子一周内严禁在5个及5个以上讨论区内重复张贴,否则将受到禁言全站发文权限直至删除帐号的处罚。
多个id共同一文多发的,对参与多发的每个id按多发总数进行处罚
点击右上角“”分享该页面