这个高光时刻,属于自动驾驶,属于大模型,更是属于中国团队。
就在刚刚,CVPR 2023 最佳论文新鲜出炉,2 篇论文从总量高达 9155 篇的投稿中脱颖而出。
(资料图片仅供参考)
对于这 2 篇最佳论文中的任何一个,可以说用 " 万里挑一 " 来形容都不足为过了。
第一篇名为 Planning-oriented Autonomous Driving(以路径规划为导向的自动驾驶),由上海人工智能实验室、武汉大学及商汤科技联合完成。
据了解,这是近十年来,计算机视觉三大顶级国际会议(CVPR、ICCV、ECCV)上,第一篇以中国学术机构作为第一单位的最佳论文。
第二篇名为 Visual Programming: Compositional visual reasoning without training(视觉编程:未经训练的组合视觉推理),由艾伦人工智能研究所发表。而在最佳论文的 " 候选名单 " 中,不乏谷歌、斯坦福大学、康奈尔大学等在内的顶尖企业和高校。竞争之激烈,可见一斑。
那么这两篇为何能在众多论文中成为佼佼者,我们继续往下看。
首次提出感知决策一体的自动驾驶通用大模型
自动驾驶历来被人们称为集 AI 技术之大成者。
一般在自动驾驶任务中,通常包含三大模块,分别是感知、预测和规划,不过主流方案通常是分开来处理具体任务。
由此导致的缺陷也是比较明显,要么是任务之间协调不足,要么是影响到了整体性能的提升。
基于这样的一个背景,这篇论文便首次提出了感知决策一体化的自动驾驶通用大模型——UniAD。
UniAD 是一个综合框架,将全栈驾驶任务整合到一个基于 Transformer 的端到端网络中。除了我们刚才提到的三个主任务之外,还包括六个子任务,包括目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划。
那么如此 " 大一统 " 的方式之下,结果又如何?
根据论文显示,在 nuScenes 真实场景数据集中,UniAD 的所有任务均达到 SOTA!
具体 " 实战 " 效果如下:在面对采访时,上海人工智能实验室青年科学家李弘扬介绍:凭借其充分的可解释性、安全性、与多模块的可持续迭代性,UniAD 是目前为止最具希望实际部署的端到端模型。
值得一提的是,除了这篇最佳论文之外,上海人工智能实验室和商汤科技在本届 CVPR 中均取得了不凡的表现。
两个单位还联合斩获了一篇最佳论文候选,共计 54 篇论文被接收。
通过编写代码解决计算机视觉任务的 AI
在第二篇论文中,研究人员提出了VISPROG,是一种神经符号结合(Neuro-Symbolic)的方法,用于在给定自然语言指令的情况下解决复杂和组合的视觉任务。
VISPROG 无需对任何特定任务进行专门训练。
相反,它利用大语言模型的上下文学习能力,生成类似 Python 代码的模块化程序,然后执行这些程序来获得解决方案和全面且可解释的理由。
生成的程序的每一行可能会调用多个现成的计算机视觉模型、图像处理程序或 Python 函数,来生成可能被程序的后续部分使用的中间输出。
研究人员在四个不同的任务上展示了 VISPROG 的灵活性,包括组合视觉问答、对图像对进行零样本推理、事实知识对象标签和以语言引导的图像编辑。研究人员表示:像 VISPROG 这样的神经符号方法是令人兴奋的,它可以轻松有效地对 AI 系统做扩展,满足人们可能希望执行的复杂任务需求。
CVPR 2023 其它奖项一览
除了 2 篇最佳论文之外,其它奖项也在刚刚的开幕式中逐一浮出水面。
最佳学生论文——
3D Registration with Maximal Cliques。
这篇论文的作者来自西北工业大学,提出了一种新的 3D 点云配准方法,能够获得最优的姿态假设。
最佳学生论文荣誉奖——DreamBooth: Fine Tuning Text-to-lmage Diffusion Models for Subject-Driven Generation。
来自谷歌,可以基于少量的图片,利用 text-to-image 模型将其转换到不同场景中,并且保持高分辨率。
这篇论文的方法已在 AI 绘画社区被广泛使用。
除此之外,大会还颁发了 PAMITC 奖,包括 Longuet-Higgins 奖、年轻研究者奖以及 Thomas Huang 纪念奖。Longuet-Higgins 奖——
年轻研究者奖——Thomas Huang 纪念奖——关于本届最佳论文更细致的内容,可戳下方链接查看详情:两篇最佳论文地址:
[ 1 ] https://arxiv.org/abs/2212.10156
[ 2 ] https://arxiv.org/abs/2211.11559
参考链接:
[ 1 ] https://twitter.com/cvpr/status/1671545306838626306?s=46&t=iTysI4vQLQqCNJjSmBODPw
[ 2 ] https://mp.weixin.qq.com/s/8svV4yxRi6TikcRivgHr_A
[ 3 ] https://finance.eastmoney.com/a/202306212759316444.html
[ 4 ] https://github.com/OpenDriveLab/UniAD
[ 5 ] https://blog.allenai.org/visual-programming-ca58c7af51cd
上一篇:轻度烧烫伤用冷水冲洗后_被水烫伤可以用牙膏吗-全球时快讯
下一篇:最后一页
这个高光时刻,属于自动驾驶,属于大模型,更是属于中国团队。就在刚刚
1、病情分析:被热水烫伤后,很多人通常会用牙膏、酱油、酱油等涂抹烫
截至2023年6月21日收盘,沈阳机床(000410)报收于8 12元,下跌2 99%,换
6月11日至13日,全球最大的单品牌汽车俱乐部MGCC(MG车主俱乐部)在银
广州今年龙舟水果然偏少。今年龙舟水期间,广州观测站录得277 1毫米降
鲁中网记者徐梦迪“今年特别想尝尝网红棕子是什么味道。”“每个人的口
根据海南省统计局发布的数据,今年1-5月份,海南全省社会消费品零售总
现代汽车将出售两家在华工厂
6月21日,恒力石化召开2022年度暨2023年第一季度业绩说明会,公司董事
又是一年毕业季的到来,在这些意义重大的日子,用全新的vivoS17系列记
乐山新闻网站是由市委宣传部主管的全民所有制事业单位,乐山地区唯一有
一、山西省临汾市天气预报1、侯马市气象台2023年6月16日14时35分发布大
活动合影。红网时刻衡阳6月21日讯(通讯员许莉)为更好地传承端午节文
6月21日零时,备受关注的平天高速公路玉泉隧道及剩余路段建成通车试运
Yourbrowserisnotsupported饲养员为“丫丫”准备了新鲜的竹子和竹笋,
记者:王涛 制作:贾雪婷 实习生:刘颖编辑:李春满审核:董方方
在安徽安庆经开区,伴随着机械工作的声音,一座绿色智慧工厂已然屹立。
指股网财经网提供袁世凯银元价格(2023年06月20日),袁世凯头像银元最
现在越来越多的小伙伴对于保时捷透露了赛车部门正在研发的一款非常独特
“起笔忆江南,执伞行天下。”在第十九届中国国际动漫节“江湖”主题剧
美有错吗?清华大学女生获世界小姐选美冠军惨遭网暴:将出国读博
据发稿前的非官方数据,6月20日A股收盘,沪指跌15 45点,跌幅0 47%,报
中国网财经6月21日讯信用中国(北京)近期发布的消息显示,中交隧道局(北
基金的封闭期一般是指自然日,即包括非交易日。封闭式基金通常由新成立
前几天我们见证了一个历史。一段不慎的私域群发文案,引发了一个大面积
X 关闭
X 关闭