贾扬清公司高效率带头的大型推理成本排行榜出炉

王林

发布时间：2024-01-26 14:15:34

723人浏览过

来源于51CTO.COM

转载

「大模型的 API 是个亏本买卖吗？」

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

随着大语言模型技术的实用化，许多科技公司推出了大模型 API，供开发者使用。然而，我们不禁开始怀疑基于大模型的业务能否持续下去，尤其是考虑到OpenAI每天烧掉70万美元的情况。

本周四，AI 创业公司 Martian 为我们仔细盘算了一下。

大模型推理成本排行榜来了：贾扬清公司效率领跑

排行榜链接：https://leaderboard.withmartian.com/

Moshi Chat

法国AI实验室Kyutai推出的端到端实时多模态AI语音模型，具备听、说、看的能力，不仅可以实时收听，还能进行自然对话。

下载

The LLM Inference Provider Leaderboard is an open-source ranking of API inference products for large models. It benchmarks the cost, rate limits, throughput, and P50 and P90 TTFT for the Mixtral-8x7B and Llama-2-70B-Chat public endpoints of each vendor.

虽然互为竞争关系，但 Martian 发现各家公司的大模型服务在成本、吞吐量和速率限制方面存在显著的差异。这些差异超过了5倍的成本差异、6倍的吞吐量差异，甚至还有更大的速率限制差异。选择不同的API对于获得最佳性能至关重要，尽管只是业务开展的一部分。

根据当前排名，Anyscale 提供的服务在Llama-2-70B的中等服务负载下具有最佳的吞吐量。对于大型服务负载，Together AI在Llama-2-70B和Mixtral-8x7B上的P50和P90吞吐量表现最佳。

此外，贾扬清的 LeptonAI 在处理短输入和长输出提示的小任务负载时，表现出最佳的吞吐量。其达到的130 tks/s的P50吞吐量，是目前市面上所有厂商提供的模型产品中最快的。

知名 AI 学者、Lepton AI 创始人贾扬清在排行榜放出后第一时间进行了点评，让我们看看他是如何说的。

大模型推理成本排行榜来了：贾扬清公司效率领跑

贾扬清首先阐述了人工智能领域行业现状，然后肯定了基准测试的意义，最后指出 LeptonAI 将帮用户找到最好的 AI 基础策略。

1. 大模型 API 正在「烧钱」

如果模型在高工作负载基准测试中处于领先地位，那么恭喜，它正在「烧钱」。

LLM 推理公共 API 的容量就像是经营一家餐馆：有厨师，需要估算客流量。聘请厨师是要花钱的。延迟和吞吐量可以理解为「你为顾客做饭的速度有多快」。对于一个合理的生意，你需要有「合理」数量的厨师。换句话说，你希望拥有能够承载正常流量的容量，而不是在几秒钟内突然爆发的流量。流量激增意味着需要等待；反之，「厨师」则会无所事事。

在人工智能世界中，GPU 扮演着「厨师」的角色。基准负载是突发的。在低工作负载下，基准负载会混合到正常的流量中，并且测量结果可以准确表示服务在当前工作负载下的情况。

高服务负载场景则很有趣，因为会带来中断。基准测试每天 / 每周仅运行几次，因此不是人们应该期望的常规流量。想象一下，让 100 个人涌入当地的餐馆来检查厨师做菜的速度，结果会很不错。借用量子物理学的术语，这被称为「观察者效应」。干扰越强（即突发负载越大），其精度就越低。换句话说：如果您给某个服务突然提供高负载，并发现该服务响应速度非常快，那么您就知道该服务有相当多的闲置容量。作为投资者，看到这种情况，你应该质问：这种烧钱的方式负责任吗？

2. 模型最终会达到相似的表现

人工智能领域很喜欢竞争比赛，这的确很有趣。大家都会很快收敛到相同的解决方案，并且，由于 GPU 的原因，英伟达总是最终的赢家。这要归功于伟大的开源项目，vLLM 就是一个很好的例子。这意味着，作为提供商，如果您的模型性能比其他模型差很多，您可以通过查看开源解决方案并应用良好的工程来轻松赶上。

3.「作为客户，我不关心提供商的成本」

对于人工智能应用程序构建者来说，我们很幸运：总是有 API 提供商愿意「烧钱」。AI 行业正在烧钱来获得流量，下一步才是担心利润。

基准测试是一项乏味且容易出错的工作。无论好坏，通常都会发生成功者赞扬你而失败者指责你的情况。上一轮卷积神经网络基准测试就是如此。这不是一件容易的事，但基准测试将帮助我们在人工智能基础设施方面获得下一个 10 倍的收益。

基于人工智能框架和云基础设施，LeptonAI 将帮用户找到最好的 AI 基础策略。

批改网AI检测工具如何查看语法错误_批改网AI检测工具语法错误定位与修正建议【攻略】

怎么用AI帮你写出符合品牌调性的社交媒体内容日历？

不会写活动策划案？教你用AI一键生成完整方案，从创意到落地

百度ai助手太烦了怎么关百度ai助手一键屏蔽神器

豆包AI怎样写影评提示词_豆包AI影评提示词角度与结构【技巧】

相关标签:

ai for public 并发人工智能 https llama

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：探索人工智能在教育中的应用原因下一篇：Transformer的开创性作品被反对，ICLR评审引发质疑！公众指责暗箱操作，LeCun透露类似经历

作者最新文章

告别繁琐手动创建！MezzioTooling助你高效构建现代PHP应用

2025-09-15 11:32

如何解决复杂命令行任务的痛点，使用spryker/console让PHP命令开发更高效

2025-09-15 11:55

如何高效且灵活地管理电商订单计算？Spryker/Calculation模块助你一臂之力

2025-09-15 12:32

如何高效集成在线支付功能？Composer与iyzico/iyzipay-php助你轻松搞定！

2025-09-16 10:12

还在为Magento2慢吞吞的搜索发愁？AlgoliaSearch&Discovery助你打造闪电般的用户体验！

2025-09-16 10:34

如何解决电商库存管理混乱难题？Spryker/Stock模块助你轻松搞定！

2025-09-16 11:12

快速上手夸克浏览器AI搜索_夸克AI搜索保姆级图文教程

2025-10-14 20:48

夸克浏览器AI搜索无法使用_解决夸克AI搜索问题的有效方法

2025-10-15 14:04

夸克浏览器AI搜索设置教程_夸克AI搜索功能详细开启步骤

2025-10-18 13:32

夸克浏览器AI搜索结果不准_优化夸克AI搜索设置的技巧

2025-10-26 10:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

290

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

620

2024.09.10

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

2025.10.21

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1681

2024.08.16

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

2025.12.31

php网站源码教程大全

本专题整合了php网站源码相关教程，阅读专题下面的文章了解更多详细内容。

2025.12.31

视频文件格式

本专题整合了视频文件格式相关内容，阅读专题下面的文章了解更多详细内容。

2025.12.31

不受国内限制的浏览器大全

想找真正自由、无限制的上网体验？本合集精选2025年最开放、隐私强、访问无阻的浏览器App，涵盖Tor、Brave、Via、X浏览器、Mullvad等高自由度工具。支持自定义搜索引擎、广告拦截、隐身模式及全球网站无障碍访问，部分更具备防追踪、去谷歌化、双内核切换等高级功能。无论日常浏览、隐私保护还是突破地域限制，总有一款适合你！

2025.12.31

热门下载

网站特效

网站源码

网站素材

前端模板