0

0

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

王林

王林

发布时间:2024-06-11 22:10:02

|

1397人浏览过

|

来源于机器之心

转载

最近,来自全球的aamas 2024计算经济学竞赛上,卓世科技人工智能前沿实验室团队“zhuoshi technology ai cutting-edge laboratory”一举夺得两个核心赛道的冠军和亚军,展现出其在计算经济学和人工智能领域的强大竞争力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

冠军证书

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

亚军证书

AAMAS+2024是第23届国际自主智能体和多智能体系统会议(International Conference on Autonomous Agents and Multiagent Systems),这是智能体技术和多智能体系统领域内最大和最有影响力的会议之一。它汇集了来自世界各地的研究人员和实践者,共同探讨和分享该领域内最新的研究成果和发展动态。本次会议设有经济学挑战赛(AAMAS 2024 CE competition),旨在推动AI在经济学领域的研究。

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

                     

AAMAS 2024 CE Competition

本次比赛由中国科学院自动化研究所主办,吸引了来自中科大、南大、人大、爱丁堡、布里斯托、俄勒冈等海内外众多学术和科研机构的队伍参与。

本次竞赛的赛题为智能税收 (Optimal Tax) 问题,比赛设置两个赛道:

赛道一:智能税收-政府 挑战赛—— 模拟政府角色,调控税率和政府支出,最大化GDP和平衡财富分配。

赛道二:智能税收-个人挑战赛—— 模拟个人角色,调整工作时间和投资比例,最大化个人利益。

来自卓世科技的队伍“Zhuoshi Technology AI Cutting-edge Laboratory”首次参赛,分别拿下两赛道冠亚军。卓世科技人工智能前沿实验室团队致力于AI大模型前沿技术的研究,目前已经在Multi-Agent、模型量化压缩、MoE方向取得了重要突破。

难点和挑战:

ChatX翻译
ChatX翻译

最实用、可靠的社交类实时翻译工具。 支持全球主流的20+款社交软件的聊天应用,全球200+语言随意切换。 让您彻底告别复制粘贴的翻译模式,与世界各地高效连接!

下载

此次竞赛的难点和挑战在于,所面临的对手策略未知,需要训练智能体,能应对不同的对手策略,因此卓世科技设计了一种MARL+进化的训练框架。在该框架中,每类智能体(政府或家庭)维持一个长期策略池和短期策略池,长期策略池中保存历史策略参数(每隔50轮训练保存一次模型),短期策略池中维持最好的20个策略,具体而言,我们通过随机匹配对手,进行大量测试,挑选出top20的策略参数。长期策略池中维持了多种多样的策略,用于训练top20策略,使其具有鲁棒性。

在正赛1中,我们训练完成后,我们从top20的短期策略池中选取平均得分最高的策略作为提交比赛的智能体。在正赛2中,短期策略池中仍然维持top20的策略参数,与阶段1不同,我们从top20中再次进行对抗测试,从中选出top12的策略参数,与阶段1中的策略参数进行集成。我们尝试从这十几个策略中选择一部分进行集成。对于政府,我们选择10个策略,而对于家庭,我们选择12个策略。每个策略输出自己的动作,然后去掉一个最大值,去掉一个最小值,然后对剩下的动作取平均,以此作为最终的策略。主要是为了提高策略的鲁棒性。

领先35%强势夺冠:

卓世团队迎难而上,凭借以下技术方案亮点,在竞赛中脱颖而出,以领先第二名35个百分点的成绩强势夺冠!

  • 策略网络架构:采用Actor-Critic框架,Actor使用部分可观测状态,Critic包括全局状态。
  • 训练算法:采用MATD3算法,集中式训练和分布式执行。
  • 策略集成:挑选top K策略进行集成,提高模型鲁棒性。

策略网络架构上,卓世科技采用经典的Actor-Critic框架,其中Actor仅使用部分可观测的状态,Critic包括所有智能体部分观察和全局状态。为了缓解部分可观测问题,我们将历史4步的状态进行合并,具体而言,我们将每步的特征向量进行非线性变换,之后进行拼接,这类似于时空卷积结构,如图1所示。在训练算法上,我们采用了MATD3,这是一种改进MADDPG的算法,每次状态Q值估计都会输出两个值,并使用最小值作为目标Q值,这有利于缓解状态价值得过估计问题。训练上采用集中式训练和分布式执行,训练完成的Critic网络不再使用,Actor网络根据局部观察进行动作输出。

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

图 5 Actor和Critic网络结构

在训练完成的top K策略池中,我们挑选出最好的N个模型进行策略集成,以提高模型对位置策略的鲁棒性,如图2所示。

夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军

图 6 策略集成

综合以上策略,在赛道二,卓世团队以2845.58分、领先第二名35个百分点的成绩强势问鼎冠军!该得分是综合考虑家庭端工作时长和消费的表现,并与多只参赛队伍PK的最终得出。在赛道一,团队以1个百分点微弱之差夺得亚军!该得分是综合考虑政府端gdp增长率和贫富差距的基尼指数表现。团队在赛道一和赛道二取的成绩,得益于自主研发的分布式训练框架,在短时间内可与多样性的智能体进行对抗,学习足够鲁棒的策略模型, 体现团队在Multi-Agent方向拥有较强的技术储备和实战能力。

卓世科技CEO屠静赛后表示:“我们以卓越的AI技术实力和创新精神,在全球计算经济学领域舞台上赢得了荣誉,向全世界展现了中国AI力量的崛起。卓世科技将持续引领AI产业化落地,不断创新变革,助力各行各业找到真正的商业应用场景。我们致力于成为行业模型服务的领导者,与合作伙伴共同推进中国产业AI的落地化进程。”

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

319

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

229

2023.10.07

edge是什么浏览器
edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器,是Windows 10操作系统中默认的浏览器,其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容,供大家免费下载体验。

1254

2023.08.21

IE浏览器自动跳转EDGE如何恢复
IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法:1、更改默认浏览器设置;2、阻止edge浏览器的自动跳转;3、更改超链接的默认打开方式;4、禁用“快速网页查看器”;5、卸载edge浏览器;6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

373

2024.03.05

如何解决Edge打开但没有标题的问题
如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题(窗口空白或标题栏缺失),可尝试以下方法解决: 重启 Edge:关闭所有窗口,重新启动浏览器。 重置窗口布局:右击任务栏 Edge 图标 → 选择「最大化」或「还原」。 禁用扩展:进入 edge://extensions 临时关闭插件测试。 重置浏览器设置:前往 edge://settings/reset 恢复默认配置。 更新或重装 Edge:检查最新版本,或通过控制面板修复

831

2025.04.24

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

389

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

290

2024.01.09

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Python 教程
Python 教程

共137课时 | 6.9万人学习

Java 教程
Java 教程

共578课时 | 40.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号