0

0

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

WBOY

WBOY

发布时间:2024-06-20 18:20:20

|

732人浏览过

|

来源于机器之心

转载

北京时间 6 月 20 日凌晨,在西雅图举办的国际计算机视觉顶会 cvpr 2024 正式公布了最佳论文等奖项。

今年共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,另外还有2篇最佳论文提名和4篇最佳学生论文提名。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

计算机视觉(CV)领域的顶级会议是CVPR,每年都会吸引大量研究机构和高校参会。据统计,今年共提交了11532份论文,2719篇被接收,录用率为23.6%。

根据佐治亚理工学院对CVPR 2024的数据统计分析,从研究主题来看,论文数量最多的是图像和视频合成与生成(Image and video synthesis and generation)主题,共329篇。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

今年的参会总人数高于往年,且越来越多的人选择了线下参会。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

最佳论文

  • 论文 1:Generative Image Dynamics

  • 作者:Zhengqi Li、Richard Tucker、Noah Snavely、Aleksander Holynski

  • 机构:谷歌研究院

  • 论文地址:https://arxiv.org/pdf/2309.07906

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

Zhengqi Li(李正奇)是 Google DeepMind 的一名研究科学家。此前,他在康奈尔大学获得了计算机科学博士学位,师从 Noah Snavely 教授。他的研究成果曾多次获奖,包括 2020 年 Google 博士奖学金、2020 年 Adobe 研究奖学金、CVPR 2019 和 CVPR 2023 最佳论文荣誉奖、ICCV 2023 最佳学生论文奖。

摘要:该研究提出了一种对场景运动建模图像 - 空间先验的方法。该先验是从集合中学到的从真实视频序列中提取的运动轨迹,描绘了物体的自然振荡动力学,例如树木、衣服等物体在风中摇曳。该研究建模傅立叶域中密集的长期运动作为频谱体积(spectral volume),研究团队发现这非常适合用扩散模型预测。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

给定单个图像,该研究训练的模型使用频率协调扩散采样过程来预测频谱体积,还可以转换为跨越整个视频的运动纹理(motion texture)。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

                             该研究可以通过调整运动纹理的幅度来缩小(顶部)或放大(底部)动画运动。

与基于图像的渲染模块一起,预测的运动表征可用于许多下游应用,例如将静止图像变成无缝循环视频,或者允许用户与真实图像中的对象进行交互,产生逼真的模拟动态。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 论文 2:Rich Human Feedback for Text-to-Image Generation

  • 作者:Youwei Liang、Junfeng He、Gang Li、Peizhao Li、Arseniy Klimovskiy 等

  • 机构:加利福尼亚大学圣迭戈分校、谷歌研究院、南加州大学、剑桥大学、布兰迪斯大学

  • 论文地址:https://arxiv.org/pdf/2312.10240

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

从论文作者一栏我们可以看到,这项研究有多位华人参与,其中 Youwei Liang 是加利福尼亚大学圣迭戈分校电子与计算机工程系的一名博士生,在此之前,他是华南农业大学信息与计算机科学专业的本科生;Junfeng He 来自谷歌,此前他硕士毕业于清华大学。

摘要:最近,文本到图像(T2I)生成模型取得重大进展,能够根据文本描述生成高分辨率图像。然而,许多生成的图像仍然存在伪影 / 不可信、与事实不符、美观度低等问题。

受人类反馈强化学习(RLHF)成功用于大型语言模型的启发,该研究通过以下方式来丰富反馈信号:

  • 用文本标记不可信或不对齐的图像区域;

  • 对文本 prompt 中的单词在图像上被歪曲或缺失的情况,进行注释。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

该研究创建了 18K 生成图像数据集 RichHF-18K,并在 RichHF-18K 上收集了丰富的人类反馈,并训练多模态 transformer 来自动预测反馈。该研究证明预测的人类反馈可用于改进图像生成,例如通过选择高质量的训练数据微调和改进生成模型,或者通过创建掩码来修复有问题的图像区域。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

最佳论文亚军

  • 论文 1:EventPS: Real-Time Photometric Stereo Using an Event Camera

  • 作者:Bohan Yu、Jieji Ren、Jin Han、Feishi Wang、Jinxiu Liang、Boxin Shi

  • 机构:北京大学、上海交通大学等

  • 论文地址:https://openaccess.thecvf.com/content/CVPR2024/papers/Yu_EventPS_Real-Time_Photometric_Stereo_Using_an_Event_Camera_CVPR_2024_paper.pdf

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 论文 2:pixelSplat: 3D Gaussian Splats from Image Pairs for Scalable Generalizable 3D Reconstruction

  • 作者:David Charatan 、 Sizhe Lester Li 、 Andrea Tagliasacchi 、 Vincent Sitzmann

  • 机构:MIT、西蒙菲莎大学、多伦多大学

  • 论文地址:https://openaccess.thecvf.com/content/CVPR2024/papers/Charatan_pixelSplat_3D_Gaussian_Splats_from_Image_Pairs_for_Scalable_Generalizable_CVPR_2024_paper.pdf

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

最佳学生论文

  • 论文 1:BioCLIP: A Vision Foundation Model for the Tree of Life

  • 作者:Samuel Stevens 、Jiaman Wu 、Matthew J Thompson 、 Elizabeth G Campolongo 、 Chan Hee Song 、 David Edward Carlyn 、 Li Dong 、 Wasila M Dahdul 、 Charles Stewart 、 Tanya Berger-Wolf 、 Wei-Lun Chao 、 Yu Su

  • 机构:俄亥俄州立大学、微软研究院、加利福尼亚大学欧文分校、伦斯勒理工学院

  • 论文地址:https://arxiv.org/pdf/2311.18803

摘要:从无人机到个人手机,各种相机收集的自然世界图像日益成为生物信息的丰富来源。计算方法和工具的爆炸式增长,特别是计算机视觉,用于从科学和保护图像中提取生物学相关信息。然而,其中大多数都是为特定任务设计的定制方法,不容易适应或扩展到新的问题、上下文和数据集。研究者急需一个用于图像上一般生物体生物学问题的视觉模型。

为了实现这一目标,该研究策划并发布了 TREEOFLIFE-10M,这是规模最大、最多样化的生物图像数据集 ML-ready。基于此,研究者开发了基础模型 BIOCLIP,主要用于构建生命之树(tree of life),利用 TREEOFLIFE-10M 捕捉到的生物学独特属性,即植物、动物和真菌图像的丰富性和多样性,以及丰富的结构化生物学知识。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

                         TREEOFLIFE-10M 中 108 个门的树状图。

研究者在各种细粒度生物学分类任务上对本文方法进行了严格的基准测试,发现 BIOCLIP 的表现始终显著优于现有基线(绝对值高出 16% 到 17%)。

内在评估表明,BIOCLIP 已经学会了符合生命之树的分层表示,这揭示了其强大的通用性。

RoomGPT
RoomGPT

使用AI为每个人创造梦想的房间

下载
  • 论文 2:Mip-Splatting:Alias-free 3D Gaussian Splatting

  • 论文作者:Zehao Yu, Anpei Chen, Binbin Huang, Torsten Sattler, Andreas Geiger

  • 机构:图宾根大学、图宾根人工智能中心、上海科技大学、布赖特宁、布拉格捷克技术大学

  • 论文地址:https://arxiv.org/abs/2311.16493

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

摘要:最近,3D 高斯泼溅技术在新颖视图合成方面展示了令人印象深刻的成果,达到了高保真度和效率水平。然而,当改变采样率时(例如通过改变焦距或摄像机距离),强烈的伪影现象可能会出现。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

3D 高斯泼溅通过将 3D 对象表示为被投影到图像平面上的 3D 高斯函数,随后在屏幕空间中进行 2D 膨胀处理,如图 (a) 所示。该方法的内在收缩偏差导致退化的 3D 高斯函数超出采样限制,如图 (b) 中的 δ 函数所示,而由于膨胀操作,其渲染效果类似于 2D。然而,当改变采样率(通过焦距或相机距离)时,会观察到强烈的膨胀效应(c)和高频伪影(d)。

该研究团队发现这种现象的原因可以归因于缺乏 3D 频率约束以及使用了 2D dilation filter。为了解决这个问题,他们引入了一种 3D smoothing filter,该滤波器根据输入视图引起的最大采样频率来约束 3D Gaussian primitives 的大小,从而在放大时消除高频伪影。

此外,作者团队用 2D Mip filter 替换 2D dilation filter,这种滤波器模拟了 2D box filter,有效地缓解了走样和膨胀问题。研究者根据评估,包括在单尺度图像上训练和多尺度测试等场景,验证了这种方法的有效性。

最佳学生论文亚军

  • 论文:SpiderMatch: 3D Shape Matching with Global Optimality and Geometric Consistency

  • 作者:Paul Roetzer 、Florian Bernard

  • 机构:波恩大学

  • 链接:https://openaccess.thecvf.com/content/CVPR2024/papers/Roetzer_SpiderMatch_3D_Shape_Matching_with_Global_Optimality_and_Geometric_Consistency_CVPR_2024_paper.pdf

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 论文:Image Processing GNN: Breaking Rigidity in Super-Resolution

  • 作者:Yuchuan Tian, Hanting Chen, Chao Xu, Yunhe Wang

  • 机构:北京大学、华为诺亚方舟实验室

  • 链接:https://openaccess.thecvf.com/content/CVPR2024/papers/Tian_Image_Processing_GNN_Breaking_Rigidity_in_Super-Resolution_CVPR_2024_paper.pdf

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 论文:Objects as volumes: A stochastic geometry view of opaque solids

  • 作者:Bailey Miller、Hanyu Chen、Alice Lai、Ioannis Gkioulekas

  • 机构:卡耐基梅隆大学

  • 链接:https://arxiv.org/pdf/2312.15406v2

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 论文:Comparing the Decision-Making Mechanisms by Transformers and CNNs via Explanation Methods

  • 作者:Mingqi Jiang 、 Saeed Khorram 、 Li Fuxin

  • 机构:俄勒冈州立大学

  • 链接:https://openaccess.thecvf.com/content/CVPR2024/papers/Jiang_Comparing_the_Decision-Making_Mechanisms_by_Transformers_and_CNNs_via_Explanation_CVPR_2024_paper.pdf

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

其他奖项

大会还公布了 PAMI TC 奖,包括 Longuet-Higgins 奖、青年研究者奖、Thomas S. Huang 纪念奖三项。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

Longuet-Higgins 奖

Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的「计算机视觉基础贡献奖」,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。该奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。

今年获奖的论文是《Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation》。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

  • 作者:Ross Girshick, Jeff Donahue, Trevor Darrell and Jitendra Malik

  • 机构:UC 伯克利

  • 论文链接:https://arxiv.org/abs/1311.2524

青年研究者奖

青年研究者奖(Young Researcher Awards)旨在表彰年轻的科学家,鼓励他们继续做出开创性的工作。评选标准是获奖者获得博士学位的年限少于 7 年。

今年获奖者为 Angjoo Kanazawa(UC 伯克利)和 Carl Vondrick(哥伦比亚大学)。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

另外,Katie Bouman(加州理工学院)获得了青年研究者奖荣誉提名。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

Thomas Huang 纪念奖

在 CVPR 2020 上,为了纪念 Thomas S. Huang(黄煦涛)教授,PAMITC 奖励委员会批准设立 Thomas S. Huang 纪念奖,以表彰在 CV 研究、教育和服务方面被公认为楷模的研究人员。该奖项从 2021 年开始颁发。获奖者需要拿到博士学位至少 7 年,最好处于职业发展中期(不超过 25 年)。

今年的获奖者是牛津大学教授 Andrea Vedaldi。

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

更多信息可参考:https://media.eventhosts.cc/Conferences/CVPR2024/OpeningRemarkSlides.pdf

参考链接:

https://public.tableau.com/views/CVPR2024/CVPRtrends?%3AshowVizHome=no&continueFlag=6a947f6367e90acd982f7ee49a495fe2

相关文章

谷歌浏览器
谷歌浏览器

谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁,使用起来得心应手。这里提供了谷歌浏览器纯净安装包,有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
li是什么元素
li是什么元素

li是HTML标记语言中的一个元素,用于创建列表。li代表列表项,它是ul或ol的子元素,li标签的作用是定义列表中的每个项目。本专题为大家li元素相关的各种文章、以及下载和课程。

407

2023.08.03

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

405

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

291

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

622

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

32

2025.10.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1770

2024.08.16

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

150

2025.12.31

php网站源码教程大全
php网站源码教程大全

本专题整合了php网站源码相关教程,阅读专题下面的文章了解更多详细内容。

88

2025.12.31

视频文件格式
视频文件格式

本专题整合了视频文件格式相关内容,阅读专题下面的文章了解更多详细内容。

90

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Python 教程
Python 教程

共137课时 | 7万人学习

Java 教程
Java 教程

共578课时 | 41.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号