一个关于大模型的小想法-基于思维链的新式编程语言
[复制链接] 分享:为什么没有一门语言,可以集成传统语言和大模型的优点?
为什么现在编写一个思维链这么慢,不同人实现一个功能设计的提示词还不一样,关键是还慢?
现在每个人写的提示词不一样,效果不一样,给的逻辑也不一样,能不能集成一些prompt?
比如
计算(1+2)*5=
当下
Prompt1--先计算括号内的内容
Prompt2--把括号内的内容与后面的数字相乘
能不能搞一个语言直接:llm.calculate[(1+2)*5]------->自动完成 prompt1和 2,并且会检查效果
再比如:生成一个漂亮的网页
Prompt1--先生成 HTML
Prompt2--先调用编译器测试能否跑通
Prompt3--如果跑通就进行下一步,不行的话重来
等等等
能不能搞一个语言直接:做一个函数库llm. creat(xxx.html)------>自动完成 prompt1和 2,并且会检查效果
/在函数库里面,什么 prompt 对应什么功能是固定的(标准化了就可以定向微调),已经经过微调的模型可以保证效果稳定的/
如果想再低代码,甚至可以用自然语言或者图形表示逻辑,或者是让 AI 自己提示补全代码中逻辑不足的地方(没设计的地方)
当下:
我可以想 做一个漂亮的网页直接让大模型搞一个(无法完成任务)
也可以传统的方法设计一个网页(可以完成任务,但是慢)
也可以用传统方法和大模型结合搞一个差不多的网页 (我觉得有一个最优点的集成,既省事又可以完成任务)
定性的目标:
比python,java这样的高级语言更高级,更省事
比普通自然语言,agent更稳定,更可靠
如果可以,这个语言的门槛比现有语言门槛更低!
只是一个很初步的想法,想问问大佬们有没有价值
这个语言如果要做,我觉得可能是开源的
现在的agent确实达不到预期
大模型也确实能帮我写代码
把prompt拆的足够细,然后随着大模型能力上升慢慢加函数集成,这样的方法有没有可能应对大模型性能不足
ANMEWM (西岭白鹭) 在 ta 的帖子中提到:
没读懂你的问题是啥
你描述的这些功能或能力很多人基于大模型都在做,但让用户买单或满意还有很大的难度,因为不够智能
签名档
来自北大未名BBS微信小程序 (http://t.cn/A67L9Lm2)
--
你是否在寻找SGLang:https://arxiv.org/abs/2312.07104v1
kling (kling001) 在 ta 的帖子中提到:
为什么没有一门语言,可以集成传统语言和大模型的优点?
为什么现在编写一个思维链这么慢,不同人实现一个功能设计的提示词还不一样,关键是还慢?
现在每个人写的提示词不一样,效果不一样,给的逻辑也不一样,能不能集成一些prompt?
……
楼主的idea很棒!基本上和现在主流的agent思路非常像,cot cop(chain of python),加上环境feedback,自动迭代优化。
我现在就在startup做这方面探索,欢迎交流~
kling (kling001) 在 ta 的帖子中提到:
为什么没有一门语言,可以集成传统语言和大模型的优点?
为什么现在编写一个思维链这么慢,不同人实现一个功能设计的提示词还不一样,关键是还慢?
现在每个人写的提示词不一样,效果不一样,给的逻辑也不一样,能不能集成一些prompt?
……
据我所知大语言模型实际输入的是Token序列。直接用自然语言,还是搞一套专用语言,都要解决【编译到Token序列】的问题。
搞个专用语言,虽然长度短但包含的信息更多更准确,编译难度更小或者编译的质量更高,是这个意思吗?还是想靠专用语言直接改变大语言模型的输入?
kling (kling001) 在 ta 的帖子中提到:
为什么没有一门语言,可以集成传统语言和大模型的优点?
为什么现在编写一个思维链这么慢,不同人实现一个功能设计的提示词还不一样,关键是还慢?
现在每个人写的提示词不一样,效果不一样,给的逻辑也不一样,能不能集成一些prompt?
……
我没理解错的话,你构想的是一门比高级编程语言更高一个层级的编程语言,它的编译需要调用llm,编译结果就是一段python代码(也可以是任意别的语言),我们现在直接用自然语言扮演这门语言的角色,所以不够精确,难以处理复杂需求
kling (kling001) 在 ta 的帖子中提到:
为什么没有一门语言,可以集成传统语言和大模型的优点?
为什么现在编写一个思维链这么慢,不同人实现一个功能设计的提示词还不一样,关键是还慢?
现在每个人写的提示词不一样,效果不一样,给的逻辑也不一样,能不能集成一些prompt?
……