3月7日,中国科学院自动化研究所研究员徐常胜应邀来我校作学术报告。活动由信息工程学院党委副书记、院长孟祥佳主持。信息工程学院全体教师参会。

报告会上,徐常胜围绕多模态大模型的前沿研究进行了系统阐述。他指出,相较于仅关注视觉或语言模态的大模型,多模态大模型能够从图像、文本、声音等多种数据类型中学习通用特征与共性知识,具备更强的通用性与表达能力,也更贴近人类的认知方式,是推动人工智能迈向更高智能水平的关键方向。他进一步分析,尽管当前多模态大模型在跨模态检索、跨模态生成等任务中表现优异,已取得一系列重要进展,但在面向开放世界的实际应用场景中,仍面临诸多尚未解决的挑战。针对这一现状,他深入剖析了理想的多模态视觉系统所应具备的关键能力,并提出了一种基于解耦视觉架构的多模态大模型Libra。此外,徐常胜分享了团队在多模态大模型跨域迁移、小样本迁移领域的研究成果与实践进展,并围绕多模态预训练模型面临的骨干网络适用性、模型精简性、模型公平性等关键问题进行系统总结,对行业未来发展方向作出了前瞻性展望。

本次报告会内容丰富、视野开阔、见解深刻、理论性强,为学院教师搭建了一个高水平的学习交流平台和互动空间。通过深入学习,大家对多模态大模型技术的发展趋势、应用场景及实际落地中的关键问题有了更清晰认识和更深入理解,进一步激发了学院教师的学术热情和科研动力。与会人员纷纷表示,后续将深入消化报告内容,积极转化学习成果,积极探索挖掘多模态前沿技术在课堂教学与科研实践中的结合点与应用潜力,紧密对接学科发展前沿,切实推进学科专业建设提质增效。