Re: 中文互联网的入口垄断化速度怎么这么快?
比如以前拿贴吧数据当语料做预训练,就是用阴阳怪气一词多义做更丰富的语义抽取的
点击和停留那些用户画像和风控模型应该会用到
Linus (Linus) 在 ta 的帖子中提到:
预训练主要还是全互联网的吧,个人用户的聊天、点击、停留行为等数据对语言模型的能力有意义吗?
本站规定,相同或相近内容的帖子一周内严禁在5个及5个以上讨论区内重复张贴,否则将受到禁言全站发文权限直至删除帐号的处罚。
多个id共同一文多发的,对参与多发的每个id按多发总数进行处罚
点击右上角“”分享该页面