首次 {用自然语}:言解释图神,经网络

2025-07-28 11:10:42      来源:央视网新闻

【导读】GraphNarrator是Emory大学研究团队开发的首个为图神经网络生成自然语言解释的工具。通过构造和优化解释伪标签,再将这些标签蒸馏到一个端到端模型中,使模型能直接输出高质量的自然语言解释,让复杂的图神经网络决策过程变得透明可理解,且在多个真实数据集上验证了其有效性。

图神经网络(GNN)已成为处理结构化数据的核心工具,广泛应用于社交网络、药物设计、金融风控等场景。

然而,现有GNN的决策过程高度复杂,且常常缺乏透明度:为什么模型做出这样的预测?关键依据在哪?这成为阻碍其大规模落地的重要瓶颈。

已有方法多基于「重要子图提取」或「节点-边归因」,如GNNExplainer、PGExplainer等,但它们只能输出结构片段,不具备人类可读性,且缺乏对文本属性节点的处理能力(如文献图、商品图)。

Emory大学的研究团队提出了首个面向图神经网络的自然语言解释生成器GraphNarrator,首次实现从GNN输入输出中,生成高质量的自然语言解释,让图神经网络从「黑盒模型」变为「有理有据的决策体」。

GraphNarrator聚焦于一种重要的图类型Text-AttributedGraphs(TAGs),即节点特征为自然语言文本(如论文摘要、商品介绍、疾病描述等)。

论文贡献包括:

提出首个自然语言解释框架,将TAG图解释从结构层面扩展至语言层;

统一结构化与语言信息,桥接图结构推理与LLM理解能力;

开源工具链,提供高质量伪标签构造器+自监督蒸馏方法,便于迁移至任意GNN任务。

论文第一作者为Emory大学博士生BoPan,长期从事图学习与可解释人工智能方向研究。

共同第一作者为USC硕士生ZhenXiong和Emory大学博士生GuanchenWu,通讯作者为Emory计算机系副教授LiangZhao。

该研究获得ACL2025主会接收,提出首个面向图神经网络的自然语言解释生成器GraphNarrator。

让GNN开口说话

GraphNarrator总体包含三步:

1.构造解释伪标签(Pseudo-labelGeneration)

使用saliency-based解释方法提取「重要文本+关键邻居节点」,形式是每个特征(节点、边、token)的重要性。

将这些结构转化为结构化Prompt,和问题与预测一起输入GPT模型,生成可解释伪标签。

2.优化伪标签(FilteringviaExpert-DesignedCriteria)

通过两大标准筛选质量更高的伪标签:

忠实性(faithfulness):与模型预测一致,研究人员通过互信息(mutualinformation)的方式计算生成的文字解释与输入、输出之间的忠实性。

简洁性(conciseness):信息浓缩、可读性强,鼓励长度更短

GraphNarrator通过专家迭代(ExpertIteration)同时优化这两个目标,确保教师模型(teachermodel)生成高质量的解释。

3.蒸馏解释器(TrainingFinalExplainer)

将伪标签蒸馏进一个端到端模型(文章中使用LlaMA3.18B),直接输入图结构与文本,即可自动输出解释语句。

忠实、可读、用户更爱看!数据集

研究人员在多个真实世界的Text-AttributedGraph(TAG)数据集上对GraphNarrator进行了系统评估,包括:

Cora:论文引文图,节点为论文,文本为摘要

DBLP:作者合作图,文本为论文列表

PubMed:生物医学文献图

对比方法:

各主流LLM(LLaMA3.1-8B、GPT‑3.5、GPT‑4o)Zero-shot生成解释

SMV:基于GPT‑4o的saliency解释模板转换方法

GraphNarrator(基于LLaMA3.1-8B)

评估目标是检验GraphNarrator生成的自然语言解释是否忠实、准确、可读、受用户喜爱。

评测结果

研究人员通过自动方式和人工方式评测该方法生成的解释质量。

自动评测中,GraphNarrator在Simulatability上全面领先(+8‐10%),证明解释内容高度还原了GNN预测;

PMI‑10%覆盖率提升显著(平均+8.2%),表明能捕捉到最重要的token;Brevity(解释长度/输入长度)下降超13%,验证其「短小精炼」能力。

人工评测中,有计算语言学背景的评审从易读性、洞察力、结构信息、语义信息4个方向打分(1–7分制)。

结果表明各项均优于GPT‑4o、SMV,尤其在结构理解上优势明显(+33%),解释更流畅、逻辑清晰,获得真实用户的更高信任。

  李瀚明表示,乌鲁木齐机场的国际航线虽然多,但不强。比如国际航班量占比较少,国际航班密度不够,国际航线集中在中亚、西亚。香港航线实际上是乌鲁木齐唯一一条向东直飞的国际和地区航线。

责编:赏书意编辑

上戏内蒙古委培班年终止招生

  根据美国CNBC网站梳理的数据,通用汽车及其合资公司在华市场份额从2015年的15%左右降至去年的8.6%,中国市场盈利占通用汽车全部盈利的比例也有所下降。2022年,斯特兰蒂斯集团表示只在中国地区保留其旗下Jeep品牌的进口业务。

陈赫问王勉和谁逛街

  6月13日9时,国家防总针对广西、福建启动防汛四级应急响应,派出两个工作组分赴广西、福建协助指导;新增针对河北、内蒙古启动抗旱四级应急响应,并继续维持针对河南、山东的抗旱四级应急响应,两个工作组正在两省协助指导。

美媒竟将台湾与以伊冲突挂钩

  携程数据显示,今年一季度,可免签入境中国的新加坡游客同比增长10倍,马来西亚游客同比增长9倍,法国、西班牙、泰国游客均同比增长约4倍。 端午小长假期间,平台入境游订单量同比增长115%。来自美国、英国、澳大利亚、韩国和马来西亚的游客最多。

保密协议

  [环球时报特约记者 任重]英国政府当地时间13日以“打击普京的战争机器”为由宣布50项新制裁,对象包括5家中国实体。中国驻英国使馆发言人当天回应说,英国政府罔顾国内国际民意,不断火上浇油,不但没有反思自己的恶劣行径,反而罗织罪名制裁中国及其他国家企业,充分暴露了英方的虚伪嘴脸。中方敦促英方立即纠正错误,撤销对中国企业的制裁。

伊朗宣布将打击美在中东所有利益

  绵阳拥有中国工程物理研究院、中国空气动力研究与发展中心等国家级科研院所18家,国家级创新平台25家,全社会研发经费(R&D)投入强度位居全国前列。

巴西热气球坠落人死亡

  一是湖北枝江酒业股份有限公司被要求补税8500万元,因这笔税款被追溯至1994年,使得税务“倒查30年”成为舆论焦点。二是宁波博汇化工科技股份有限公司3月份收到当地税务要求补税5亿元的通知,最近企业宣布停产。/p>

中国冥币在海外杀疯老外烧个不停

  公器私用,将地质调查、矿产开发等权力作为敛财纳贿的工具,搞权钱交易,利用职务便利为他人在企业经营、项目承揽、矿权审批等方面谋利,并非法收受巨额财物;/p>

陈立农青春为名全球巡回演唱会

  坚持因地制宜、科学抗旱,河库灌区及时开闸放水,增加流量,采取疏通渠道、维修涵闸等措施,做到远送多浇、有水可浇;引黄灌区根据抗旱需水情况,及时开闸放水,争取多引黄河水;平原灌区发挥机电井作用,采取有效措施保障机井通电,并组织投入各类排灌机械179.4万台,努力增加抗旱播种面积。丘陵岗区利用坑、塘、堰、坝等小型水利工程组织抗旱播种。夏播以来,全省累计抗旱浇水7977.3万亩次,播种进度与常年相当。