焦点热文：超强进化！GPT-4正在改进自己，近万人联名封杀

首页 > 财经 > 国内 >

来源：富途牛牛发布时间：2023-04-05 20:26:49

来源：综合新智元、AI Explained

(资料图片仅供参考)

最近，似乎全世界都在围剿ChatGPT。

前一阵由马斯克、图灵奖得主Bengio等大佬联名发起的暂停高级AI研发的公开信，现在签名已经上升到9000多人。

即使全世界都对超级AI如临大敌，想赶紧悬崖勒马，恐怕也为时已晚。

因为，如今的AI，已经学会自我进化了！

前段时间，前谷歌大脑研究工程师Eric Jang发现：GPT-4能够以合理的方式批评自己的成果。

与其为大型语言模型（LLM）寻找完美的提示（让我们一步一步思考），不如让LLM评估自己的输出并立即纠正自己的错误。

甚至连特斯拉前AI总监，OpenAI研究科学家Andrej Karpathy大赞，这是一个很好的例子，说明我们还没有看到GPT-4的最大能力。

在Eric Jang给出的例子中，曾看到微软研究员发推说GPT-4根本无法写出「不押韵」的诗歌。

然而，当再去询问GPT-4是否完成了任务。这时，它道歉后，生成了一个不押韵的诗！可以说是满分。

这恰恰印证了GPT-4是有「反思」能力的。

最近，来自美国东北大学、MIT等机构研究者提出了Reflexion（反思）。这一方法赋予智能体动态记忆，以及自我反思的能力。

研究人员诺亚·希恩和阿什温·戈皮纳特写道:“人类利用曾经被认为是人类智力独有的决策过程，开发出新的技术来达到最先进的标准，这种情况并不是每天都会发生的。”“但是，这正是我们所做的。”

Reflexion 利用GPT-4的各种能力来进行不同的测试，并引入了一个框架，允许AI模拟类似人类的自我反思行为并评估其表现。在这个过程中，它引入了额外的步骤，在这些步骤中，GPT-4设计测试来质疑自己的答案，寻找错误和失误，然后根据发现的结果重写答案。

Reflexion智能体的整体架构

为了验证方法的有效性，研究人员评估了智能体在AlfWorld环境中完成决策任务的能力，以及在HotPotQA环境中完成知识密集型、基于搜索问答任务的能力。

在Alfworld测试中，Reflexion（反思机制）将GPT-4的成功率从73%左右提高到接近完美的97%，在134项任务中只有4项失败。

在另一项名为HotPotQA的测试中，GPT-4的准确率仅为34%，但应用反思机制的GPT-4的准确率显著提高，达到54%。

在HumanEval测试中，也就是测试模型编写代码的能力时，GPT-4准确率是67%，但通过反思机制，它的准确率跃升至令人印象深刻的88%。该测试包含了模型从未见过的164个Python编程问题。

有网友便表示，你可以通过要求 GPT-4 反思「你为什么错了？」，并为自己生成一个新的提示，将这个错误原因考虑在内，直到结果正确，从而将GPT-4的性能提高惊人的30%。

这样看来，就像Eric Jang所说，

我们现在可以考虑一种「后缀提示工程」，而不是巧妙的「前缀提示工程」。这将鼓励LLM在先前生成的解决方案中找到更正和不一致的地方。

编辑/new

标签：

分享到：QQ空间新浪微博腾讯微博人人网微信

上一篇：环球视点！瑞银在收购瑞信后首次召开股东大会：整合预计将耗时三至四年

下一篇：美股前瞻 | “小非农”弱于预期，三大股指期货震荡走低；不赞同降息！美联储梅斯特：年底前利率应升至5%以上

微软Bing市场份额不增反降，谷歌搜索“一哥”位置

微软将ChatGPT集成进Bing，并在GPT-4的推动下拥有自己的生成搜索体验，可谓抢尽“搜索一哥”谷歌的...更多

2023-05-15 18:27:36

一图读懂 | 美股期权隐含波动率排行榜 (5.15)

隐含波动率（IV）是对一支股票年内价格变动的预估，反映投资者对未来价格波动程度的预期，是期权定...更多

2023-05-15 18:44:03

财报前夕，腾讯股价一度涨超4%，这次业绩将会有怎

在财报发布的前夕，腾讯结束了连续一个月的股价下行趋势，在5月15日一度涨超4%，说明市场对本次腾讯...更多

2023-05-15 18:28:01

【环球新视野】北水抢筹科网股！加仓腾讯近12亿港

2023年5月15日，南向资金净买入16 53亿港元。$腾讯控股(00700 HK)$、$美团-W(03690 HK)$、$中国海洋石油(00883 HK)$分更多

2023-05-15 17:40:54

巴菲特看好的日本股市，要创33年新高了环球精选

坚实基本面推动日股上涨，同时外资流入和回购潮支撑日本股市情绪。“股神”又押对了？5月15日周一，...更多

2023-05-15 17:32:45

财报前瞻 | 获多名分析师看好，沃尔玛Q1业绩有

随着最新一轮财报季继续如火如荼地进行，本周零售行业成为了关注焦点。其中，$沃尔玛(WMT US)$将于5月18日更多

2023-05-15 16:35:32

环球要闻：每日期权追踪 | 罕见认错！特斯拉召

编者按：《每日期权跟踪》紧跟期权市场，关注博弈动向，为牛友提供多维度机会参考，助力牛友掌握投...更多

2023-05-15 16:36:38

港市速睇 | 港股午后强劲拉升！三大指数齐涨超1

富途资讯5月15日消息，港股三大指数午后强势拉升，恒指一度收复2万点关口。最终，恒指、国指涨1 75%，科指更多

2023-05-15 16:44:40

易点云(02416.HK)今起招股，发售价每股10-12港元

在数字经济浪潮下，中小企业数字化转型大势所趋！今年两会政府工作报告亦提出「加快传统产业和中小...更多

2023-05-15 16:43:09

每日快看：又一里程碑！港交所：“互换通”正式启

5月15日，港交所正式举行互换通上线仪式，香港政、经两界大佬齐聚金融大会堂，包括香港特区行政长官...更多

2023-05-15 15:30:17

微软Bing市场份额不增反降，

猜你喜欢

微软Bing市场份额不增反降，谷歌搜索“一哥”位置

一图读懂 | 美股期权隐含波动率排行榜 (5.15)

财报前夕，腾讯股价一度涨超4%，这次业绩将会有怎

【环球新视野】北水抢筹科网股！加仓腾讯近12亿港

巴菲特看好的日本股市，要创33年新高了环球精选

财报前瞻 | 获多名分析师看好，沃尔玛Q1业绩有

环球要闻：每日期权追踪 | 罕见认错！特斯拉召

港市速睇 | 港股午后强劲拉升！三大指数齐涨超1

易点云(02416.HK)今起招股，发售价每股10-12港元

每日快看：又一里程碑！港交所：“互换通”正式启

一图读懂 | 美股期权隐含波动率排行榜 (5.15)

加拿大要求剥离在加锂矿资产中矿资源等三家公司回应：影响不大

2023电信日|思特奇以科技创新为翼，携手运营商数字生态共飞腾

讯息：多国工商界人士对中国经济发展充满信心

业绩快报信息披露不准确震有科技被出具警示函

深圳纺织服装出口快速增长前三季度民营企业出口纺织服装333.7亿元

网易举行2023年Q1业绩电话会议网易云音乐原创音乐人超63万

建设绿色未来！比亚迪参与巴西太阳能建设生产光伏组件超200万块

48小时点击排行

图片新闻

没有稳定工作也可以进行贷款买车吗具体规定你知道吗？

安徽人民币各项存款余额增速全国第三企业融资成本稳中有降

中信银行上饶分行因员工行为管理不到位被罚50万

多家银行近期宣布暂停智能投顾业务申购投资者该怎么办？

关于我们

联系方式

供稿服务

版权声明

广告服务