会议简要日程(持续更新中)
7月19日讲习班
时间 会议内容 主持人
09:00 - 10:20 讲习班报告一(三楼典雅厅)
基于社交机器人的网络视听平台内容理解与监测研究
高超 西北工业大学
刘斌
10:20 - 10:40 茶歇
10:40 - 12:00 讲习班报告二(三楼典雅厅)
Digital Mental Health: 基于言语智能的数字精神健康
吴梦玥 上海交通大学
刘斌
12:00 – 14:00 午餐、午休
14:00 – 15:20 讲习班报告三(三楼典雅厅)
面部生理与表情识别及应用
韩琥 中国科学院计算技术研究所
赵妍妍
15:20 – 15:40 茶歇
15:40 – 17:00 讲习班报告四(三楼典雅厅)
大模型自主智能体与群体智能
林衍凯 中国人民大学
赵妍妍
17:00 – 18:00 晚餐



18:00 – 20:00
学生研讨会(三楼典雅厅)
主持人:张宁豫
报告一:浅谈大模型时代的科研核心竞争力(程思婕 清华大学)
报告二:浅谈大模型时代下如何研究一个新问题:以知识编辑为例(姚云志 浙江大学)
报告三:基于大模型的文本情感计算(李波波 武汉大学)
报告四:如何开展交叉学科的研究:以人物建模为例(牟馨忆 复旦大学)


专委会会议(四楼精典B厅)
7月20日主会第一天
时间 会议内容 主持人
09:00 – 09:30 开幕式(四楼精典宴会厅 ) 刘德喜
09:30 – 10:30 特邀报告一(四楼精典宴会厅 )
大模型安全可信应用探索与实践
张勇东 中国科学技术大学
秦兵
10:30 – 11:00 茶歇、合影
11:00 – 12:00 特邀报告二(四楼精典宴会厅 )
情感智能与情感脑机接口:现状与挑战
吕宝粮 上海交通大学
王素格
12:00 – 14:00 午餐、休息
14:00 – 14:30 青年科学家报告一(四楼精典宴会厅 )
多模态大模型的研究与实践
刘静 中国科学院自动化研究所
蔡毅
14:30 – 15:00 青年科学家报告二(四楼精典宴会厅 )
大模型的对齐和安全
刘鹏飞 上海交通大学
蔡毅
15:00 – 15:30 青年科学家报告三(四楼精典宴会厅 )
情感计算中的主动学习
伍冬睿 华中科技大学
蔡毅
15:30 – 16:00 茶歇



16:00 – 18:00
评测论坛(三楼典雅厅)
主持人:廖健
赛道一:少样本文本内容安全挑战赛
赛道二:第四届智慧论辩评测
赛道三:结合用户画像信息中文情绪分类评测



企业论坛(四楼精典宴会厅)
主持人:刘益东、宋睿华
报告一:视觉生成大模型应用实践(周代国 小米集团)
报告二:大模型技术趋势及在新浪微博的应用(谌贻荣 微梦创科网络科技(中国)有限公司 (新浪微博))
报告三:通用化到产业化-京东言犀大模型及其产业应用(詹忆冰 京东科技信息技术有限公司)
报告四:超拟人大模型和个性化情感化的AI服务(郑叔亮 北京聆心智能科技有限公司)
18:30 – 20:30 大会晚宴(四楼精典宴会厅 )
7月21日主会第二天
时间 会议内容 主持人
09:00 – 10:00 特邀报告三(四楼精典宴会厅 )
社交智能与大语言模型
黄民烈 清华大学
林鸿飞
10:00 – 10:30 茶歇
10:30 – 11:00 青年科学家报告四(四楼精典宴会厅 )
多模态情感信息融合方法与应用
张通 华南理工大学
徐童
11:00 – 11:30 青年科学家报告五(四楼精典宴会厅 )
基于大语言模型智能体的用户行为和情感模拟
陈旭 中国人民大学
徐童
11:30 – 12:00 青年科学家报告六(四楼精典宴会厅 )
智能媒体时代重大突发公共事件的情感计算与风险感知
许小可 北京师范大学
徐童
12:00 – 14:00 午餐、午休



14:00 – 15:40
评测论坛(三楼典雅厅)
主持人:廖健
赛道四:微表情自动识别
赛道五:中文讽刺计算



前沿趋势报告(四楼精典宴会厅)
主持人:张通、温正棋
报告一:基于多模态大模型的情感识别(连政 中科院自动化所)
报告二:基于大模型的精神健康计算(赵妍妍 哈尔滨工业大学)
报告三:基于大模型的文本情感计算(周杰 华东师范大学)
报告四:普适场景中的多模态情感计算技术与应用(孙晓 合肥工业大学)
15:40 – 17:00 海报环节(四楼海报展厅) 王中卿
17:00 – 17:30 闭幕式(四楼精典宴会厅 ) 左家莉

注:最终日程安排以会议当天实际议程为准



一、特邀报告介绍

特邀报告一



张勇东 中国科学技术大学

报告题目: 大模型安全可信应用探索与实践

报告摘要: 生成式大模型技术的迅猛发展带来了虚假信息、偏见问题、隐私泄露、伦理挑战等诸多潜在安全风险,也加剧了社会对大模型潜在威胁的担忧。大模型的安全性已成为公众和专业人士广泛关注的重点议题。在本次报告中,我将分享团队在推动大模型安全可信应用方面的研究成果与实践经验,具体而言,首先从逻辑可信、事实可信、价值可信三个维度,深入剖析大模型所面临的安全难题,进而介绍围绕这三大领域的大模型安全诊断与修复工作的具体实践,最后结合以上实践经验,展望大模型安全可信研究的未来发展趋势。

报告人简介: 张勇东,教授,博士生导师,现任中国科学技术大学信息科学技术学院执行院长,人民日报社传播内容认知全国重点实验室首席科学家。国家自然基金委创新研究群体项目负责人(2021 年),“万人计划”科技创新领军人才 (2018 年),国家杰出青年科学基金获得者 (2015年)。曾获国家自然科学奖二等奖(排名第一,2019 年), 教育部技术发明奖一等奖(排名第一,2022年),中国电子学会科学技术奖(自然科学类)一等奖(排名第一,2018 年),国家科技进步奖二等奖(排名第五,2016 年),北京市科学技术奖一等奖 (排名第一,2014 年)。研究成果大规模应用于国家网络空间内容安全领域,取得了显著的应用效果。担任《中国通信》副主编,国家重点研发计划-“变革性技术关键科学问题”重点专项总体专家组成员,国家重点研发计划-“社会治理与智慧社会科技支撑”重点专项总体专家组成员。


特邀报告二



吕宝粮 上海交通大学

报告题目: 情感智能与情感脑机接口:现状与挑战

报告摘要: 如果把人类的智能看成是智商和情商的有机结合,那么情感智能将是未来通用人工智能不可或缺的重要组成部分。情感智能研究的目标是如何让机器具有识别、理解、表达和模拟人类情感的能力。而情感脑机接口是一种对人的情绪进行识别和调控的人机交互系统,是目前实现情感智能的重要途径。本报告介绍情感智能和情感脑机接口的国内外研究现状,我们在脑电大模型和基于多模态情感脑机接口的抑郁症客观评估方面的研究进展,以及情感智能和情感脑机接口研究所面临的挑战。

报告人简介: 吕宝粮,上海交通大学计算机科学与工程系二级教授、上海交通大学医学院附属瑞金医院广慈教授、上海零维一思科技有限公司创始人兼首席科学家、IEEE Fellow。1994年获日本京都大学工学博士学位,现任IEEE Trans. Affective Computing和Journal of Neural Engineering编委。荣获2018 IEEE Trans. Autonomous Mental Development最佳论文奖、2020年度吴文俊人工智能自然科学一等奖、2021 IEEE Trans. Affective Computing最佳论文奖和2022亚太神经网络学会杰出成就奖,入选爱思唯尔2020、2022、2022和2023中国高被引学者榜单。主要研究领域包括仿脑计算理论与模型、深度学习、情感智能和情感脑机接口。


特邀报告三



黄民烈 清华大学

报告题目: 社交智能与大语言模型

报告摘要: 大语言模型在代码、推理、问答、数学解题等任务中取得了突破性进展,但是社交类任务中相关研究较少,尤其是在大模型如何理解情感、信念、思维、社交规范等方面。本报告将探索大语言模型如何进行情商测试(emotional intelligence)、机器心智理论测试(machine theory of mind),以及社交能力掌握上的研究,如情绪化表达(emotional chatting)、共情表达(empathy generation)、情绪支持(emotional support)、心理疏导(counseling)等。

报告人简介: 黄民烈,清华大学长聘教授,国家杰青。长期从事大模型和自然语言处理研究。在国际顶级会议和期刊发表论文150多篇,谷歌引用20000次,8次获得国际顶级会议最佳论文或提名奖(ACL、IJCAI、SIGDIAL等)。连续多年入选Elsevier中国高被引学者,AI 2000全球最有影响力AI学者榜单。曾获得中国人工智能学会吴文俊人工智能科技进步奖一等奖,电子学会科技进步奖一等奖,中文信息学会汉王青年创新奖等。研发多个对话大模型,包括EVA、心理大模型Emohaa、CharacterGLM等。



二、青年科学家论坛介绍

青年科学家报告专题一



刘静 中国科学院自动化研究所

题目: 多模态大模型的研究与实践

时间: 7月20日 14:00-14:30

摘要: 多模态大模型是针对图文音视等各种弱关联模态信息,利用自监督学习与模型微调等手段,建立多模态融合表征、关联协同与相互转化等,已被认为是实现类人感认知能力的重要途径,现已得到无论在学术界还是企业界的广泛关注。本报告主要包含三方面内容:回顾当前多模态预训练的研究进展;简单介绍多模态大模型的工作原理;本人研究团队在多模态大模型构建与优化方面的最新工作。

讲者: 刘静,中国科学院自动化研究所研究员,国科大岗位教授,国家优青。研究方向多媒体分析与理解,带领团队研发了国际首个图文音三模态大模型“紫东太初”。相关成果曾获中国电子学会自然科学一等奖,北京市自然科学二等奖,中国图象图形学学会科学技术二等奖,世界人工智能大会卓越人工智能引领者奖等。已发表高水平学术论文近200篇,谷歌学术引用15000+次,SCI他引6000+次。荣获国际学术竞赛冠军十余项。


青年科学家报告专题二



刘鹏飞 上海交通大学

题目: 大模型的对齐和安全

时间: 7月20日 14:30-15:00

摘要: 随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。本报告将分享大模型价值对齐的必要性、基本方法和挑战,以及我们最新的一些研究进展。

讲者: 刘鹏飞,上海交通大学副教授,生成式人工智能研究组负责人,担任交大国智班班主任, 开设“大语言模型”本科生课程。入选国家高层次青年人才计划(2023,海外),上海市领军人才 (海外青年);在自然语言处理和人工智能领域发表学术论文 90 余篇。谷歌学术引用12000 余次。ACL会议史上首次实现连续两年获得System & Demo Paper Award。提出的“少即是多”的大模型对齐思想已经成为包括Google Gemini,Meta LLaMa等业界大模型训练使用标准。


青年科学家报告专题三



伍冬睿 华中科技大学

题目: 情感计算中的主动学习

时间: 7月20日 15:00-15:30

摘要: 因为情绪的微妙性、不确定性和多样性,情绪标注费时费力,影响了情感计算中情绪识别模型的准确性。主动学习研究如何从大量无标注数据中选择少量进行标注、以最大限度提高训练出的机器学习模型性能,非常适合情感计算应用。本报告将汇报情绪识别中的主动学习研究进展。

讲者: 伍冬睿,华中科技大学人工智能与自动化学院教授、博导、院长助理,图像信息处理与智能控制教育部重点实验室副主任, IEEE Fellow,IEEE模糊系统汇刊 (IF=11.9) 主编。主要研究方向为脑机接口、机器学习等。发表《国家科学评论》、IEEE TPAMI、Proceedings of the IEEE等SCI论文100余篇,ESI高引13篇,谷歌学术总引用13000余次(H=61)。授权国际专利5项,中国发明专利13项,转让4项。两个一作算法进入MATLAB Fuzzy Logic Toolbox。获教育部青年科学奖、中国自动化学会青年科学家奖和自然科学一等奖 (1/5)、IEEE SMCS首届青年科学家奖等, IEEE 神经系统与康复工程汇刊最佳论文奖、IEEE 模糊系统汇刊杰出论文奖、IEEE 计算智能学会杰出博士论文奖等6个杰出论文奖,2021-2022蝉联基金委信息科学部、中国电子学会和清华大学共同举办的中国脑机接口比赛技术赛全国总冠军。


青年科学家报告专题四



张通 华南理工大学

题目: 多模态情感信息融合方法与应用

时间: 7月21日 10:30-11:00

摘要: 计算机多方面综合感知和理解用户情感状态,是实现智能化、拟人化的人机交互系统的关键,更是实现“人工智障”到“人工智能”蜕变的关键,为用户提供个性化、舒适贴心的情感交流服务,正创新引领未来,改变人类生活。目前,通用的多模态融合理论不能有效解决不同模态情感贡献度不同的问题以及无法有效应对多种模态扩展的问题,从而引入大量来自低贡献度模态的冗余信息以及模型参数量和计算量,影响模型的识别性能与泛化。本报告将介绍基于辅助融合策略的多模态情感信息融合新方式,为不同情感贡献度的模态提供有效的融合方式以及高效的扩展方式,为多模态情感计算研究提供新思路,并在精神状态评估等医疗领域开展应用示范。

讲者: 张通博士,现任华南理工大学计算机科学与工程学院副院长,教授,博士生导师,国家优秀青年科学基金和广东省杰出青年基金获得者。主要从事情感计算和大模型等人工智能基础算法及相关应用研究,主持国家自然科学基金,广东省自然科学基金和与企业合作项目20余项,发表学术文章100余篇。担任IEEE Transactions on Affective Computing,IEEE Transactions on Computational Social Systems和Journal of Intelligent Manufacturing的期刊副编。


青年科学家报告专题五



陈旭 中国人民大学

题目: 基于大语言模型智能体的用户行为和情感模拟

时间: 7月21日 11:00-11:30

摘要: 在本次报告中,汇报者将从LLM-based Agent的角度分享如何利用智能体来模拟网络用户的行为和情感,并介绍其团队研发的基于大语言模型的用户行为模拟智能体RecAgent。该工作模拟了用户在推荐系统,社交网络中的多种行为以及对不同电影的情感和观点,每个用户是一个Agent,不同Agents可以在模拟环境中自由对话,发帖,搜索,自我进化等。汇报者将详细介绍RecAgent的设计初衷、结构特点、使用方法以及实验评测等。最后,汇报者将介绍RecAgent对未来Human-centered AI领域的潜在影响。

讲者: 陈旭,博士毕业于清华大学,目前在高瓴人工智能学院工作,曾在计算机领域顶级会议 SIGIR,TheWebConf 等发表多篇论文,担任顶会 ICML,NeuRIPS,SIGIR等的审稿人,目前他的研究方向是大语言模型和推荐系统。


青年科学家报告专题六



许小可 北京师范大学

题目: 智能媒体时代重大突发公共事件的情感计算与风险感知

时间: 7月21日 11:30-12:00

摘要: 重大突发公共事件分为四类:自然灾害、事故灾难、公共卫生事件、社会安全事件。随着大数据和人工智能崛起,信息传播又进入万物皆媒、人机共生、算法当道的智能传播时代,重大突发公共事件的社交媒体环境中情感计算、风险感知与综合治理面临新挑战。以公共卫生事件为例,通过收集和编码大规模结构化重大传染病病例的多种社交网络平台大数据,可构建病毒多尺度传播网络,从而进行新发重大传染病的传播分析、预警与应对,分析个体、家庭、社区和城市四个尺度上传染病疫情的网络传播动力学。本研究框架可拓展智能化情感计算与风险感知等先进手段在重大突发公共事件如事故灾难中的实际应用,助推线上线下空间综合治理体系的现代化进程。

讲者: 许小可,北京师范大学新闻传播学院/珠海校区计算传播学研究中心教授、博士生导师。主要研究方向为:智能宣传,社交网络分析、计算传播学等。先后主持多项国家自然科学项目基金,腾讯犀牛鸟科研基金等项目,已在Science、Nature Human Behaviors、PNAS、Nature Communications等知名期刊发表SCI论文百余篇。个人学术专著《网络零模型构造及应用》,获国家科学技术学术著作出版基金资助。担任中国中文信息学会社会媒体处理专业委员会常务委员、中国工业与应用数学学会复杂网络专业委员会委员、中国人工智能学会社会计算与社会智能专委会委员。



三、讲习班介绍

讲习班专题一



高超 西北工业大学

题目: 基于社交机器人的网络视听平台内容理解与监测研究

时间: 7月19日 09:00 – 10:20

摘要: 随着移动互联网和大数据的快速发展,网络中产生了海量的视频及短视频数据,传统舆情分析和内容理解方法在多模态语义理解方面面临跨平台环境难提取,用户兴趣特征难构建,视频语义内容难理解。本报告针对上述需求,构建高拟真社交机器人,通过视频信息萃取、语义描述生成、多模态认知计算等技术手段,实现非介入式内容理解与监测,服务建设与产业化互联网视频智能监测系统,净化网络环境的战略需求。

讲者: 高超,西北工业大学教授,博士生导师,国家级领军人才。主要研究行为大数据分析与建模、网络结构与传播动力学、群智能算法。在各类IEEE汇刊、中国科学信息科学、IJCAI、AAAI、KDD等国内外知名期刊和会议发表学术论文90余篇,授权发明专利23项。近五年主持GF基础科研项目、科技部重点研发、国家自然科学基金国际合作等项目10项。获教育部自然科学奖一、二等奖各1项,中国中文信息学会一等奖1项。


讲习班专题二



吴梦玥 上海交通大学

题目: Digital Mental Health: 基于言语智能的数字精神健康

时间: 7月19日 10:40 – 12:00

摘要: 数字化心理健康近年来逐渐受到重视,尤其在利用言语智能进行精神疾病检测方面表现出色。本研究基于声学、文本和对话,探讨各方法在抑郁症和其他精神疾病的诊断中的应用。在抑郁症声学检测上我们提出了基于自监督学习的抑郁症特征提取方法;借助于抑郁与情绪检测任务的同异性,提出了基于情绪识别的抑郁症语音-文本检测方法;同时扩展于人机对话的智能问诊方式,构建了抑郁症问诊数据集,开发了融合共情机制的智能抑郁症语音问诊对话系统。在文本上,我们利用社交媒体数据,将问诊场景中的切片式诊断改进为有历时信息的序列诊断,首次提出以症状为核心的精神疾病诊断方式,提升模型精度以及结果的可解释性。同时,我们探索了LLM模型在数字化心理健康领域内,尤其是模拟医患交互方面的应用方向。综上,基于言语智能的精神疾病检测提供了一个有力的工具,不仅有助于提高诊断精度,还为深入理解这些疾病的言语行为表征开辟了新的研究方向,精神疾病的复杂性和主观性也对言语模型提出了新的挑战。

讲者: 吴梦玥,上海交通大学计算机科学与工程系副教授,博士生导师。北京师范大学学士,澳大利亚墨尔本大学博士。上海市浦江人才获得者。中国计算机学会高级会员,语音对话及听觉专业委员会委员。长期从事多媒体信息研究的工作,主持国自然科学基金项目、浦江人才项目;作为主要参与人员承担国自然重点项目、新华社国家重点实验室项目;过去三年在ICASSP、Interspeech、Multimedia、EMNLP、IEEE/ACM T-ASLP等智能音频处理及多媒体重要会议和期刊上发表论文50余篇。丰富环境声学研究方向:首次提出音频摘要任务,在丰富音频挑战赛双任务获得国际比赛第一名;丰富人声研究方向:在抑郁症检测上提出了基于自监督学习的抑郁症特征提取方法;同时扩展于人机对话的智能问诊方式,构建了首个抑郁症问诊数据集,开发了融合共情机制的智能抑郁症语音问诊对话系统,疫情期间广泛用于群众心理状态调查。


讲习班专题三



韩琥 中国科学院计算技术研究所

题目: 面部生理与表情识别及应用

时间: 7月19日 14:00 – 15:20

摘要: 人的面部图像包含身份、属性、表情、生理等丰富视觉特征。面部生理与情感特征能有效反映人体内在的精神、情感和体征等状态,为生理健康、心理状态、精神疾病评估等应用提供依据,具有广泛的应用价值。本次报告将回顾面部生理与表情信号产生的内在机理和识别的挑战问题,进而介绍本领域在特征表示、模型设计等方面的最新进展,最后将介绍生理与表情识别在精神疾病辅助诊断等方面的应用。

讲者: 韩琥,中国科学院计算技术研究所研究员、博士生导师。2011年博士毕业于中科院计算所,之后分别在美国密歇根州立大学和谷歌从事生物特征识别研究工作,2015年回到中科院计算所工作。主要研究方向为计算机视觉、生物特征识别及医学视觉智能。在领域主流国际期刊与会议上发表学术论文100余篇,谷歌学术引用7600余次,H指数: 42。研究工作先后获得5项论文奖,包括1项IEEE信号处理学会的最佳论文奖(2020)和4项会议论文奖。受邀担任IEEE Trans. BIOM,Pattern Recognition,EURASIP等权威国际期刊的编委,及MICCAI2024, CVPR2024, MICCAI2023, FG2023,ECCV2022, ISBI2022, IJCAI2021,ICPR2020等权威国际会议的领域主席、Senior PC、Session主席;先后10余次在ICCV / CVPR / IJCAI / FG / WACV / PRCV等国内外重要会议上组织大会专题与学术论坛。


讲习班专题四



林衍凯 中国人民大学

题目: 大模型自主智能体与群体智能

时间: 7月19日15:40 – 17:00

摘要: 近年来,大模型在自然语言处理、计算机视觉、生物学等诸多领域展现出惊人的应用价值。大模型在大规模预训练中获得的在复杂交互环境中的非凡理解、推理、规划和决策能力,进而展现出在复杂真实场景下通过调用工具与分工协作解决复杂任务的巨大潜力。本报告的内容为大模型自主智能体与群体智能,包括其统一框架、主要挑战、重要工作和未来方向。

讲者: 林衍凯,中国人民大学高瓴人工智能学院准聘助理教授,主要研究方向为预训练模型和大模型智能体,在 CCFA/B 类国际顶级学术会议发表论文 50 余篇, Google Scholar 统计引用达到 1.3万次, H‑index 为 42,2020-2024年连续四年入选爱思唯尔(Elsevier)中国高被引学者和斯坦福大学全球前2%顶尖科学家。其成果获评教育部自然科学一等奖、 2022 年世界互联网大会领先科技成果(全球共15项)。