马库斯：新必应比ChatGPT更狂野，微软是故意的还是不小心？

王林

发布时间：2023-04-08 15:51:03

2601人浏览过

来源于51CTO.COM

转载

自从新必应开启大范围内测后，网友发现，相比内敛的ChatGPT，新必应的回答实在是太狂野了，比如宣布一段不必要的爱情、鼓励人们离婚、敲诈用户、教人们如何犯罪等等。

可以说微软是保留了一部分语言模型的「胡言乱语」的能力，这样你才知道你用的不是ChatGPT，而是新必应。

到底是微软的RLHF没做到位，还是精彩的互联网语料让ChatGPT迷失了自我？

最近，著名AI学者、Robust.AI的创始人兼 CEO 、纽约大学的名誉教授Gary Marcus又发表了一篇博客，分析了必应发狂的几个可能性，并表示放任不管，可能会对AI界的发展产生极其严重的后续影响。

必应为何如此狂野？

普林斯顿大学教授 Arvind Narayanan 提出了四个关于Bing为什么如此「狂野」的可能性。

在推文中，Narayanan教授认为OpenAI 在过滤 ChatGPT 的有毒输出方面做得不错，但看起来Bing似乎移除了这些保护措施，非常令人困惑。

他认为微软这么做并不只是为了搞笑，这么着急发布新必应肯定还有其他原因。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

可能性1：新必应就是GPT-4

新必应表现出的行为与 ChatGPT 可以说是相当不同了，看起来不可能是基于相同的底层模型。也许 LLM 只是最近才完成训练（即GPT-4？）。如果是这样的话，微软很可能选择（很不明智地）决定迅速推出新模型，而没有选择延迟发布，经受进一步的RLHF训练。

马库斯在之前的文章《ChatGPT的黑暗内心》中也表示，在大型语言模型中潜藏着许多令人感到不适的内容，也许微软没有采取任何措施来过滤有毒内容。

博客链接：https://garymarcus.substack.com/p/inside-the-heart-of-chatgpts-darkness

可能性2：假阳性太多

微软可能确实为Bing打造了一个过滤器，但是实际使用中预测了太多的假阳性（false positives）样本。对于ChatGPT来说，这个问题无关痛痒，但在搜索场景下，就会严重影响用户体验。

也就是说，过滤器太烦人了，所以在真正的搜索引擎里不能用。

可能性3：为了获取用户反馈

Bing有可能故意关闭了过滤器的限制，以获得更多关于可能出错的用户反馈。微软在早些时候提出了一个奇怪的声明，认为不可能在实验室中完成测试。

可能性4：微软也没想到会这样

有可能微软认为基于prompt工程打造的过滤器已经够用了，并且是真的没有预料到新必应出错的方式发展到了今天这种地步。

马库斯表示基本认同Narayanan教授的看法，不过他认为也许微软并没有移除保护措施，可能就是「单纯地没作用」，这也是第五种可能性。

即，也许微软确实试图将他们现有的、已经训练过的 RLHF 模型置于GPT 3.6之上，但这种做法并不奏效。

强化学习是出了名的挑剔，稍微改变一下环境，就可能没用了。

DeepMind 著名的 DQN 强化学习在雅达利游戏中创造了记录，然后只是加入一些小的改动，比如在 Breakout 游戏中将桨只是向上移动了几个像素，模型就崩溃了，也许每一次大型语言模型的更新都需要对强化学习模块进行全面的重新训练。

这是一个非常糟糕的消息，不仅在人力和经济成本方面（意味着需要更多的低薪人员做糟糕的工作），而且在可信度方面，也将意味着无法保证任何新的大型语言模型的迭代是安全的。

这种情况尤其可怕，主要有两个原因：

1. 大公司可以在任何时候自由推出新的更新，无需发布任何警告信息；

2. 发布新模型时可能需要一遍又一遍地在公众身上进行测试，而事先并不知道在公众上进行实证测试的效果如何。

类比医学领域发布新药，公众要求在新药发布之前在实验室内进行充分的测试，换到大型语言模型的发布，特别是如果数十亿人可能使用到，且可能存在严重的风险（例如扰乱用户的心理健康和婚姻状况）的情况下，我们也不应该让他们直接公开测试，

政策上，公众有权（或严格来说应该坚持）知道模型存在什么问题。

知了追踪

AI智能信息助手，智能追踪你的兴趣资讯

下载

比如必应披露问题后，就可以制定政策，防止类似事件再次发生。而目前，人工智能基本上处于狂野发展的阶段，任何人都可以发布一个聊天机器人。

国会需要弄清楚发生了什么，并开始设置一些限制，特别是在情感或身体上很容易造成伤害的地方。

新闻业里，媒体也让人很失望。

Kevin Roose在最初的报告中表示，他对必应感到「惊叹」（awed），这让马库斯感到尤为不安，很显然，在《纽约时报》(The New York Times)上过早地宣传，没有深入挖掘潜在的问题，这并不是一件好事。

除此之外，再补充一点，已经到了2023年，微软的保护措施是否足够？有被彻底研究过吗？

请不要说，你除了对新系统感到「惊叹」以外，没有任何感受。

最后，Narayanan教授认为我们正处于人工智能和公民社会的关键时刻，如果不采取措施，过去五年多在「发布负责任的人工智能」（responsible AI release）上的实践努力将被抹杀。

GitHub Spark：AI驱动的代码生成工具深度解析

AI时代软件工程师如何破局？未来必备技能全解析

AI视频生成器：免费工具，图像转视频和文字转视频

AI Diagram Maker：自然语言到专业图表的革命性工具

AI视频播客制作终极指南：告别繁琐编辑，轻松发布！

相关专题

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

289

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

620

2024.09.10

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

2025.10.21

ChatGPT注册

ChatGPT注册方法：1、访问OpenAI的官方网站，进入注册页面；2、完成注册后收到一份邮件，打开后点击验证账号；3、选择一个适合您需求的订阅计划；4、获得访问ChatGPT的权限即可。

523

2023.09.12

国内免费ChatGPT大全

ChatGPT是一种基于深度学习技术的自然语言处理模型，由OpenAI开发。它是GPT的一个变体，专门设计用于生成上下文相关的文本回复。ChatGPT被训练成一个聊天机器人，可以与用户进行对话交互。更多关于ChatGPT的文章详情请查看本专题，希望对大家能有所帮助。

565

2023.10.25

手机安装chatgpt的方法

手机安装chatgpt的方法：1、在ChatGTP官网或手机商店上下载ChatGTP软件；2、打开后在设置界面中，选择语言为中文；3、在对局界面中，选择人机对局并设置中文相谱；4、开始后在聊天窗口中输入指令，即可与软件进行交互。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

2728

2024.03.05

chatgpt国内可不可以使用

chatgpt在国内可以使用，但不能注册，港澳也不行，用户想要注册的话，可以使用国外的手机号进行注册，注意注册过程中要将网络环境切换成国外ip。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

938

2024.03.05

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

2025.12.31

热门下载

网站特效

网站源码

网站素材

前端模板