喜报丨我院本科生韦嘉嘉的一作论文被CCF A类国际顶级会议CVPR 2026接收
近日,在软件工程学院吴炜滨副教授指导下,2023级本科生韦嘉嘉以第一作者身份首次投稿的学术论文“Ref4D-VideoBench: Four-Dimensional Reference-Based Evaluation of Text-to-Video Generative Models”被CCF A类国际顶级会议CVPR 2026接收。

会议简介
CVPR全称为IEEE/CVF Conference on Computer Vision and Pattern Recognition(IEEE/CVF国际计算机视觉与模式识别会议),是相关学科领域最具权威性与影响力的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际顶级学术会议,由IEEE计算机协会(IEEE Computer Society)和国际计算机视觉基金会(Computer Vision Foundation)联合举办。
CVPR创办于1983年,旨在促进计算机视觉和模式识别领域的学术交流与合作,展示该领域最新的研究成果和技术突破,其涵盖主题非常广泛,今年会议将聚焦多模态大模型、具身智能、图像和视频生成、3D视觉等前沿研究主题。根据权威的谷歌学术指标(Google Scholar Metrics)最新统计,CVPR的H5指数在全球所有学术出版物中排名第二,仅次于Nature。
论文介绍
随着视频生成模型的快速发展,AI生成的视频正被逐渐应用于影视制作、游戏与虚拟世界内容生产等场景。在这些现实应用场景中,除了保证画面观感,模型生成的视频还需要与用户给定的文本提示保持高度一致。与此同时,随着视频生成模型的迭代速度不断加快,依赖人工打分的评测方式成本高、周期长,难以支撑模型训练与应用过程中的高频评测需求。因此,如何对视频生成模型进行全面且富有解释性的自动化评测,以便为模型训练与优化提供丰富的反馈信息,并在实际应用中实现持续的质量监测,成为了学术界与工业界共同面对的关键问题。现有针对视频生成模型的评测方法通常以单一指标为主,无法同时覆盖不同的评测维度。部分评测方法即使同时考虑了多种评测维度,仍无法提供富有解释性的诊断信息来细粒度地指出模型生成的视频中存在的问题。
针对此问题,本论文提出了一个面向视频生成模型的可解释自动评测框架:Ref4D-VideoBench。Ref4D-VideoBench从基础语义、事件时序、运动、世界知识四个维度来系统全面地对视频生成模型的生成质量进行评测,并提供更清晰具体的判定依据来细粒度地指出模型生成结果中存在的问题,为后续视频生成模型的优化提供了丰富的反馈信息。以图中案例为例,在同一用户文本提示下,不同模型的生成结果可能在表面观感上接近,但在基础语义对齐(关键对象与属性是否正确)、事件时序一致性(关键动作/事件是否发生、关键动作/事件时序是否正确)、运动一致性(运动与用户提示是否一致、运动是否连贯自然)、世界知识一致性(生成视频中的场景/现象是否符合常识与物理规律)等方面存在显著差异。现有视频生成模型评测方法往往会因为表面观感的一致性而无法正确判定两个模型生成质量的优劣,而本论文所提出的方法却可以精准识别出两个模型的生成结果在细节上的显著差异,并提供富有解释性的判定依据。此外,针对多种前沿的视频生成模型的系统评测结果显示,相比于现有的视频生成模型评测方法,本论文所提出的方法表现出了与人类评估显著更高的一致性。

指导老师
学院构建以“一人一事”项目制为基础的创新育人体系,韦嘉嘉同学在大二年级便加入了学院吴炜滨副教授的课题组接受科研训练并开展学术研究。
吴炜滨,中山大学副教授,博士生导师,中国计算机学会软件工程专业委员会执行委员。主要研究方向包括可信人工智能、大模型、计算机视觉、智能软件工程等,重点关注深度学习模型的可靠性、安全性、可解释性与隐私性。主持国家自然科学基金项目、华为/招联校企合作项目等多个科研项目。为多个国际顶级会议和期刊的审稿人/领域主席,如ICML、ICLR、ICCV、CVPR、ACL、TPAMI等。近年来在CVPR、AAAI、FSE等人工智能、软件工程领域的CCF A类国际顶级会议上发表论文20余篇,其中指导本科生以第一作者身份发表CCF A类国际顶级会议论文4篇。

学生研究体会
作为本科生能在国际顶级会议发表论文,是一件令人振奋也充满挑战的事情。对我而言,这段经历还与转专业紧密交织。在大一时主持的大创项目里,我第一次接触并尝试应用机器学习解决实际问题,这段经历激发了我继续深入探索的兴趣,也促使我决定转入软件工程专业。平转到软工后,学院平等开放的文化氛围及老师们的指引帮助,让我逐渐适应了在软工的学习和生活。出于对科研的兴趣,我选择在大二上学期加入吴老师课题组,在补修课程的同时逐步进入科研节奏,并在这个过程中学会了更高效的时间管理。经过半年左右的系统学习,我掌握了机器学习与深度学习的基本知识,为后续研究打下了坚实基础。同时,广泛阅读领域前沿论文让我更清楚当前工作的空白与难点所在,启发了我后续idea的形成。但对于本科生来说,从idea的形成到最终落地的每个环节往往容易因缺乏经验而半途停滞,因此我由衷感谢吴老师在选题调研、实验设计、论文写作等关键阶段给予我的悉心指导与帮助。与此同时,在整个项目实施的过程中,我深刻认识到团队合作的重要性,实验的推进离不开全体团队成员的互相信任与齐心协力。完整经历科研全流程也让我感受到:科研就像一场充满未知的探索,过程中难免遇到许多挑战,但努力与坚持一定会带来丰富收获与成长。


