香侬科技GNN-LM：基于全局信息的图神经网络语义理解模型笔记

发布时间：2023-12-31 16:00

LM任务

$Modeling(LM)任务\\ input \ c_t=(w_1，w_1…，w_{t-1}) \\ output \ p(w_t\vert c_t) \\ {\tiny c即context，即由上下文预测下一个单词或字符是什么} \\ 常规方法BaseLM：h_t=f(c_t)\in R^d,p(w_t\vert c_t) =Softmax(Wh_t)\\ Evaluation \ Metric: \href{https://www.zhihu.com/question/58482430}{perplexity}$

本网络

基于图神经网络的语义理解模型的GNN-LM，它将传统的NLP的闭卷模式，转变为开卷模式：在推理过程中允许参考训练数据。

输入的样例为query，首先在训练数据中通过K近邻（KNN）寻找相似的样例为邻居。通过图神经网络GNN建立输入样例与邻居的关系。

KNN

We further combine GNN-LM with kNN-LM (Khandelwal et al., 2019), an orthogonal technique enhancing language models, to improve the overall performance of our model.¹

近邻查询的结果展示：

图的构建

$\\ A:点的类型，\{a_o取自input，a_n取自retrive\} \\ R:边的类型，\{r_{inter}不同contex，r_{intra}同contex\}\\ 函数：\tau 点类别查询 , \Phi 边类别查询$

其中计算attention的方法：

GNN+KNN

注：本文使用的KNN除以了超参数T，以将尖峰平滑
BaseLM选择一个sota的LM训练后freeze

参考文献

GNN-LM: LANGUAGE MODELING BASED ON GLOBAL CONTEXTS VIA GNN
【AI Drive】第104期 - 香侬科技孟昱先：GNN-LM 从“闭卷考试”到“开卷考试”
求通俗解释NLP里的perplexity是什么？
代码

Generalization through Memorization: Nearest Neighbor Language Models ↩︎

相关推荐

Java开发学习(十三)----基于注解开发定义第三方bean及注解开发总结

python 库是什么

Java利用Easyexcel导出excel表格的示例代码

性能提升19倍，DGL重大更新支持亿级规模图神经网络训练

hcip--第三天随堂作业

Python文本数据及其可视化

Spring MVC详解(学习总结)

Java 设计模式最佳实践：二、创建型模式

Python数据可视化库汇总整理

docker环境搭建redis sentinel哨兵集群

服务器上安装yolov4环境及其详细训练过程

python r是什么

【计算机毕业设计】奶茶在线点单微信小程序

ReID行人重识别(训练+检测，附代码)，可做图像检索，陌生人检索等项目

TDSQL PG版再升级，深度参与开源生态建设

从研发效能的视角谈“故障复盘”

第一篇：微信小程序商城实战所需基础知识（共十篇）

神经网络到底是怎样一回事，神经网络是什么意思

python数据分析环境准备_python数据分析+实战1Python语言及工作环境准备

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号