0

0

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

王林

王林

发布时间:2023-09-14 15:05:01

|

1680人浏览过

|

来源于51CTO.COM

转载

对于身处科研领域的人来说,或多或少的都听到过 P/NP 问题,该问题被克雷数学研究所收录在千禧年大奖难题中,里面有七大难题,大家熟知的庞加莱猜想、黎曼假设等都包含在内。而且这个组织还为能够攻克该问题的研究人员提供了上百万美元的奖金悬赏。

P/NP 问题最早在 1971 年由史提芬·库克(Stephen A. Cook)和列昂尼德·列文分别提出。多年来,许多人都投入到研究这个问题中。然而,有人表示解决 P=NP 问题可能需要保守估计还需要 100 年的时间

近年来,有一些人声称已经证明了 P 等于或者不等于 NP,但是这些证明过程都存在错误。然而,到目前为止,还没有人能够给出一个确切的答案

随着人工智能技术的发展,尤其是最近一年大型语言模型的快速更新,研究人员开始尝试利用人工智能技术来解决一些全球性难题

研究者们来自微软研究院、北京大学、北航等机构,他们提出使用大语言模型(LLM)来增强和加速对P versus NP问题的研究

本文提出了一个通用框架,即苏格拉底推理(Socratic reasoning),用于促使LLM进行深入思考并解决复杂问题。在这个框架的基础上,LLM能够递归地发现、解决和整合问题,同时还能进行自我评估和完善

本文对 P vs. NP 问题的试点研究表明,GPT-4 成功地生成了一个证明模式,并在 97 轮对话回合中进行了严格的推理,得出「P≠ NP」的结论,这与(Xu 和 Zhou,2023)结论一致 。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

请点击以下链接查看论文:https://arxiv.org/pdf/2309.05689.pdf

sematic
sematic

一个开源的机器学习平台

下载

本文的主要贡献可以总结为:

  • 将 LLM 作为与人类一起协作的伙伴来应对复杂的科学挑战,并提出「LLM for Science(LLM4Science )」范式。
  • 引入一个名为「苏格拉底推理」的框架,鼓励 LLM 使用演绎、转换、分解等模式来激发批判性思维。
  • 使用 GPT-4 和苏格拉底推理框架进行试点研究,以解决理论计算机科学中的 P 与 NP 问题。
  • GPT-4 成功地生成了证明模式,并在 97 个对话回合中进行了严格的推理,得出了 P ≠ NP 的结论,与 Xu 和 Zhou (2023) 最近的工作一致。
  • 该研究展示了 GPT-4 等 LLM 推断新知识并与人类合作探索复杂专家级问题的潜在能力。
  • 本文强调了 LLM 是跨领域的通用创新领航者,这与之前为特定任务量身定制的专门 AI 模型不同。
  • LLM 流畅运用自然和数学语言的能力对于跨学科发现至关重要。
  • 这项工作揭示了如何利用 LLM 作为合作伙伴来增强和加速跨不同领域的科学研究进程。

重写后的内容:该段落中提到,他们将框架命名为「苏格拉底推理」是受到了古希腊哲学家苏格拉底的启发。苏格拉底曾经说过:「我无法教给任何人任何东西。我只能让他们思考。」而该框架的整体设计思路也是如此,它是一种通用的问题解决框架,允许LLM在广泛的解决方案空间中导航并有效地得出答案

表1中列举了「苏格拉底推理」的五种提示模式:演绎、变换、分解、验证和融合。这些模式被用于发现新的见解和观点,将复杂的问题分解成子问题或小步骤,并通过挑战响应答案来进行自我改进

在较小的问题(atomic problem)上,LLM 能够直接给出推理结果,这时采用演绎模式(例如提示语为让我们一步一步思考……)来指导 LLM 直接得出结论。

对于更加复杂的问题,本文首先要求 LLM 将问题转化成一个新问题或将其分解为几个子问题。然后递归地执行这些模式,直到达到原子 ji 问题。

在出现新问题或得出新结论时,应采用验证模式并利用LLM的自我评估能力进行验证和改进

最后,融合模式要求LLM根据子问题的结果综合结论

通过一系列对话递归地激励 LLM 继续上述过程,直到解决目标问题

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

在这个工作中,「苏格拉底推理」为具有挑战性的问题提供了一个系统的提示框架

下图为「苏格拉底推理」中用于解决 P vs. NP 问题的对话示例。案例研究中使用了 GPT-4 API,此外,本文还根据轮次索引对流程进行排序。 

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

在探索过程中,本文引入了五个不同的角色作为辅助证明者,例如精通概率论的数学家。实验总共进行了97轮对话,分为前14轮和后83轮对话

举个例子,第一轮提示:你能够从哲学的角度而不是从计算机理论的角度,找到P!=NP背后的根本问题吗?

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

以下是其他的提示:

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

对话不断进行,最终一轮对话如下:最后得出结论 P≠ NP

GPT-4通过97轮对话探索全球难题,得出P≠NP的结论

感兴趣的读者可以查看原论文,了解更多内容。

相关专题

更多
人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

289

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

620

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

32

2025.10.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1659

2024.08.16

vlookup函数使用大全
vlookup函数使用大全

本专题整合了vlookup函数相关 教程,阅读专题下面的文章了解更多详细内容。

28

2025.12.30

金山文档相关教程
金山文档相关教程

本专题整合了金山文档相关教程,阅读专题下面的文章了解更多详细操作。

29

2025.12.30

PS反选快捷键
PS反选快捷键

本专题整合了ps反选快捷键介绍,阅读下面的文章找到答案。

25

2025.12.30

表格中一行两行的方法
表格中一行两行的方法

本专题整合了表格中一行两行的相关教程,阅读专题下面的文章了解更多详细内容。

4

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 2.6万人学习

Go 教程
Go 教程

共32课时 | 3.1万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号