报告人:汪静国
时间:2025年12月24日9:30
形式:线上直播

报告题目:可编程信任:多智能体大型语言模型中的信任校准与信息传递
报告专家简介:汪静国博士,美国德克萨斯大学阿灵顿商学院信息系统Eunice and James L. West讲席教授。复旦大学计算机科学学士,纽约州立大学布法罗运筹学硕士、管理科学和系统博士。研究领域包括信息系统、信息安全和隐私。相关研究成果发表在MIS Quarterly、 Information Systems Research、 Management Science、Journal of the Association for Information Systems等期刊。研究获得德克萨斯大学阿灵顿和美国自然科学基金的资助。担任Journal of the Association for Information System期刊的Senior Editor。
报告内容简介: 随着多智能体 AI 系统的兴起,大型语言模型(LLM)之间的信任与信息传递质量正成为系统可靠性的关键。本研究聚焦于多智能体环境中 LLM 作为“信息接收方”时的信任校准问题,并采用互信息(Mutual Information)定量刻画信息传输的有效性。基线实验表明,即使在激励完全一致、不存在说谎动机的前提下,LLM 接收方仍表现出系统性“低信任”,显著低估发送方提供的信息。为应对这一问题,我们比较了两类干预:其一是心理学启发的社会机制(如自我介绍、角色互换),试图模拟人类的信任建立过程;其二是基于提示工程的框架,通过直接修改接收方的人格与行为设定(如明确的“信任指令”和操作规则)。结果显示,所有干预均能显著提升互信息,其中 提示工程类干预整体优于心理学启发方法,而“直接信任指令”效果最为显著,且 Brier 得分验证了这一结论的稳健性。通过跨任务验证(如信任博弈),我们进一步发现,这些干预在结构不同的任务中同样能提升模型间的信任与合作。此外,嵌入分析表明,行为改善伴随着模型内部“信任表征”的语义转移。本研究表明,LLM 接收方的信任行为是 可系统调节和设计的,为构建高效、可靠的企业级 AI 工作流与多智能体系统提供了重要的理论基础和实践启示。
观看方式:拔尖计划2.0全国线上书院直播

