首页版面好友提醒登录
返回未名湖版

Baidu文心一言似乎仍是中译英的套皮

bossxuan阿轩 2023-09-01 08:29:04
21楼

主要还是数据准备的时候,因为中文语料不够,把文本对的文本英翻中用来训练。

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)



签名档

来自北大未名BBS微信小程序 (http://t.cn/A67L9Lm2)

--

coopyexp(B) 2023-09-01 08:40:34
22楼

没了 prompt中加“创意画”才有可能出

MrNerd (wsltxgd) 在 ta 的帖子中提到:

胸有成竹、夫妻肺片之类的问题还存在吗?

coopyexp(B) 2023-09-01 08:41:44
23楼

一格不是SD套皮,不然不至于这么拉胯

fxyang (飞枭|InnerMongolia) 在 ta 的帖子中提到:

会不会只有绘画部分是这样?比如它实际上调用了stable diffusion之类的成熟作画AI?

Monan沈雨良 2023-09-01 08:44:52
24楼



MrNerd (wsltxgd) 在 ta 的帖子中提到:

胸有成竹、夫妻肺片之类的问题还存在吗?

redlionzhousea 2023-09-01 08:45:20
25楼

天下文章一大抄,这是中国的传统了。

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


cruxL 2023-09-01 10:04:10
26楼

没办法的,中文互联网质量太差,纯中文语料怕是训练出来全是智障

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


orcaorca 2023-09-01 10:31:19
27楼

还是特色科技急功近利的产物,文心一言非常不实用,我还是习惯GPT

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


paruruhxhyjouetie 2023-09-01 10:52:18
28楼

问他某个领域的知名学者,文心给的答案全是国外学者名字,没有文化自信啊,感觉是抄的chatGPT的。


有一些中国特色的问题,文心就只能自己答,比如问22年左右的中国防疫,答的就比较笨。


BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


Youns尤恩 2023-09-01 11:30:44
29楼

科技以换皮为本

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)

签名档

拥有即失去

huixue北工大 2023-09-01 11:55:49
30楼

训练的库是海外的

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


jkun昵称先空着 2023-09-01 12:53:55
31楼

数据集是英文的,再怎么训练也扭不过来

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


jkun昵称先空着 2023-09-01 12:55:41
32楼

肯定不是,sd没有这么拉,Midjourney就是基于sd的效果的别好


这玩意肯定是百度用飞桨自己写的,感觉可能他们自己也放弃了

ghostplant (mavericks) 在 ta 的帖子中提到:

为啥还是拿开源的stable diffusion玩?自己的研发成果在哪儿?

coopyexp(B) 2023-09-01 13:06:02
33楼

部分数据可能是迁移学习出来的

paruruhxhy (jouetie) 在 ta 的帖子中提到:

问他某个领域的知名学者,文心给的答案全是国外学者名字,没有文化自信啊,感觉是抄的chatGPT的。


有一些中国特色的问题,文心就只能自己答,比如问22年左右的中国防疫,答的就比较笨。

coopyexp(B) 2023-09-01 13:06:33
34楼

没放弃,团队还百十来人呢🌚

jkun (昵称先空着) 在 ta 的帖子中提到:

肯定不是,sd没有这么拉,Midjourney就是基于sd的效果的别好


这玩意肯定是百度用飞桨自己写的,感觉可能他们自己也放弃了

vetxsyyuanyuan 2023-09-01 13:16:09
35楼

中文语料库不如英文质量高罢了。

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


MingMTC隔壁马大丁 2023-09-01 14:54:42
36楼

可能是训练语料是英翻中来的

BT (Bitalk | 太BT了) 在 ta 的帖子中提到:

这几个单词不需要进一步翻译了吧)


ghostplantmavericks 2023-09-01 16:22:15
37楼

也有可能基于sd fine tune一下,修修补补各种英译差别,最后还不如sd了。

jkun (昵称先空着) 在 ta 的帖子中提到:

肯定不是,sd没有这么拉,Midjourney就是基于sd的效果的别好


这玩意肯定是百度用飞桨自己写的,感觉可能他们自己也放弃了