0

0

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

PHPz

PHPz

发布时间:2023-05-17 17:52:18

|

1520人浏览过

|

来源于51CTO.COM

转载

在GPT-4 32K还在内测阶段,OpenAI的劲敌直接把上下文长度打了上去。

就在今天,初创公司Anthropic宣布,Claude已经能够支持100K的上下文token长度,也就是大约75,000个单词。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

这是什么概念?

一般人用时大约5个小时读完等量内容后,还得用更多的时间去消化、记忆、分析。

对于Claude,不到1分钟就搞定。

把「了不起的盖茨比」整本书扔给它,大约有72k token,并将其中的一句话进行改动:

mr. carraway是一个在anthropic从事机器学习工具的软件工程师。

你敢相信?Claude仅花了22秒,就把改动的这句话找出来了。

众路网友纷纷表示,有了Claude 100K,手里的GPT-4 32K已经不香了。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

Claude 100k,倍儿香!

前段时间,在OpenAI的开发者社区中,许多人讨论GPT-4 32K正在推出。

而且,不少GPT-4的用户已经可以在自己的PlayGround上看到GPT-4 32k的选项。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

已经解锁这一版本的网友,让其访问了数百个来自卸载HyperWrite用户的数据点,GPT-4便准确地告诉他接下来该做怎样的改进。

他称赞道,GPT-4 32k是世界上最好的产品经理。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

32k都这么厉害了,那么,有了100K岂不更强了。

显然,OpenAI的强大对手Anthropic最先占据了优势。

100K token的上下文长度,意味着,你可以在Claude上传数百页的文本分析。并且对话的持续时间也被大大拉长,延长到数小时,甚至数天。

当然,除了长文本阅读之外,Claude还可以从文档中快速检索出你所需的信息。

你可以把多个文档,甚至一本书的内容当作prompt,然后提问。

以后遇到论文,甚至巨长篇幅的直接让Claude总结吧,这简直就是啃论文后辈们的福音。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

这种综合性的问题通常需要对文本中很多部分的内容有一个全面的认识,而在处理这种问题上,Claude可以说要比基于向量搜索的办法要强。

Claude还可以是你的「代码伴侣」,分分钟就能做个演示。

比如,上传一个240页的Langchain API文档,让它基于这个文档,用Anthropic的语言模型做一个Langchain的简单演示。

还可以把85页的公司年度报表(10k)喂给Claude。

然后,要求突出对潜在投资者最重要的项目,并解释其重要性。

此外,Claude 100k还能处理大约6小时的音频量。

比如说,AssemblyAI把一个卡马克的播客的内容转录成了58k个token量的文本,然后用Claude进行了总结和问答。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

最后,Claude总结了一下自己能干的事,覆盖可以说是非常全面了。

- 理解、总结和解释密集的文件,如财务报表、研究论文等

- 根据年报分析公司的战略风险和机遇

- 评估一项立法的利弊

- 识别法律文件中的风险、主题和不同形式的争论

- 阅读数百页的开发文档,回答技术问题

- 通过将整个代码库放入上下文中,并智能地构建或修改它来快速制作原型

当然,现在,Anthropic表示100K上下文还是一个测试版功能,在此期间将按照标准API定价来收费。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

官网也给出了具体价格:

Claude Instant

Prompt:$0.00163 / 1K tokens

Completion:$0.00551 / 1K tokens

Claude-v1

Prompt:$0.01102 / 1K tokens

Completion:$0.03268 / 1K tokens

比起OpenAI,这价格已经非常亲民了。

据OpenAI官网,GPT-4 32k的Prompt需要$0.06,Completion需要$0.12。

相当于,你得花5-6倍的价格给模型prompt。

网友称,Claude 100k比GPT-4 32k更快速、更便宜。

网友实测

这么重磅级的更新,一定少不了网友的体验。

有网友称100k简直难以置信,能够处理多篇完整的论文,部分完整的代码库,甚至一本250页的小说。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

顺便提一句,许多网友最先用Claude测试了一番,发现效果还不错。

最初,100K仅限在API中,Claude应用的默认模型仍然是9K。但很快,Claude应用界面也支持100K了。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一位网友用100页的「GPT-4技术报告」测试,结果只能用amazing来形容。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

还有人直接把太宰治的「人间失格」喂给了Claude,并用英文问故事中情节,完全给出了准确的回答。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

同时,这位网友把自己开发的Toolformer Zero完整源代码丢给它,Claude精准描述出这是用来做什么。

并且,Claude还称赞了代码的模块化,提供增加一些单元测试的建议。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

把「贝奥武夫」诗扔进去,分析下贝奥武夫这个人物性格,也是非常准确。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

英伟达科学家Jim Fan表示,这是Anthropic抛出的杀手锏。未来在上下文长度的军备赛正快速升温。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

对于支持100k的意义,网友称,泰裤辣!这很好地展示了为什么长文本对LLM很重要。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

还有好多网友纷纷暗示GPT-4。

Claude-100K的诞生,让AnthropicAI正式成为OpenAI的真正竞争者。

「许多人还在排队等候32k的GPT-4。这次,Claude将上下文窗口扩展到10万token,直接大幅跃升。

这也意味着包括OpenAI、谷歌在内的公司都要在这一领域竞争,这对用户来说是一个巨大的胜利。」

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

还有网友感慨时代进步太快了。

谷歌宣布PaLM 2擅长高级推理任务不到一天,而Anthropic的Claude现在可以在不到一分钟的时间内消化10万个token。人工智能的进步确实令人瞩目。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

不过,如果你输入的token少于9K,Antropic调用的似乎就是之前的模型了。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

百万token,不是梦

过去几年,斯坦福大学Hazy Research实验室一直在从事一项重要的工作,就是增加模型的序列长度。

在他们看来,这将开启机器学习基础模型的新时代。

研究人员在22年提出的FlashAttention算法证明了32k可行性。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

就连Sam Altman称我们要的是32k token。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

其实,不仅是32k,现在100k都实现了,百万token也不远了。

「绝对太野了!几年后,支持100万的token上下文长度会不会成为可能?」

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

前段时间,来自DeepPavlov、AIRI、伦敦数学科学研究所的研究人员发布了一篇技术报告,使用循环记忆Transformer(RMT)将BERT的有效上下文长度提升到「前所未有的200万tokens」,同时保持了很高的记忆检索准确性。

一次读完半本「三体」!GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定

论文地址:https://arxiv.org/abs/2304.11062

知了追踪
知了追踪

AI智能信息助手,智能追踪你的兴趣资讯

下载

该方法可以存储和处理局部和全局信息,并通过使用循环让信息在输入序列的各segment之间流动。

不过,虽然RMT可以不增加内存消耗,可以扩展到近乎无限的序列长度,但仍然存在RNN中的记忆衰减问题,并且需要更长的推理时间。

实际上,RMT背后是一个全新的记忆机制。

具体操作方法是,在不改变原始Transformer模型的前提下,通过在输入或输出序列中添加一个特殊的memory token,然后对模型进行训练以控制记忆操作和序列表征处理。

与Transformer-XL相比,RMT需要的内存更少,并可以处理更长序列的任务。

当然,在最终实现百万token之前,Claude 100k已经是相当大的起步了。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6041

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

781

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1044

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1086

2024.03.01

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

387

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

289

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

620

2024.09.10

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

3

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号