[论文笔记] A Survey on Knowledge Graphs: Representation, Acquisition and Applications

论文题目:A Survey on Knowledge Graphs: Representation, Acquisition and Applications

作者:Shaoxiong Ji, Shirui Pan, Erik Cambria, Pekka Marttinen, Philip S. Yu

单位:Aalto University, Monash University, Nanyang Technological University, University of Illinois

期刊:IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS

发表日期:2021.03.30

快速总结

本文从以下四点总结了KG的相关工作及近期进展:

  • Knowledge Representation Learning (KRL)
  • Knowledge Acquisition
  • Knowledge Aware Application
  • Temporal Knowledge Graph

以下先详细记录第二部分Knowledge Aquisition,也就是知识图谱的获取。

Knowledge Aquisition

知识图谱的获取主要包括关系抽取(Relation Extraction)、知识图谱补全(Knowledge Graph Completion,KGC)及其他与实体(entity)相关的任务(例如实体识别-Entity Recognition和实体对齐-Entity Alignment)。

其他一些相关任务还包括三元组分类(Triple Classification)、关系分类(Relation Classification)和开放知识充实(Open Knowledge Enrichment)等。

这里主要介绍KGC、Entity Discovery和关系抽取。

Knowledge Graph Completion

KGC的子任务包括link prediction,entity prediction和relation prediction。

Embedding-based Models

以entity prediction为例,这类方法先使用TransE等算法在已有的三元组上学习向量表示,然后分别用不同的entity向量代替head/tail entity来计算每个候选entity的分数并按此排序。

Relation Path Reasoning

虽然Embedding方法在某些数据集上获得了很好的效果,但其无法建模复杂的关系路径(relation path)。为了解决该问题,研究者采用了随机游走推理方法(random walk inference)。
例如Paht-Ranking Algorithm首先按照路径约束的组合选取一条关系路径,然后采用最大似然分类。

RL-based Path Finding

此类方法将两个实体间的关系路径搜索建模为马尔科夫决策过程(Markov decision process, MDP)。它们使用policy-based RL agent在与KG环境交互的过程中学习搜索能拓展推理路径的关系步骤(step of relation),并使用策略梯度(policy gradient)来训练RL agent。

Rule-based Reasoning

此类方法通过构建logical rule进行KGC。例如以下logic rule:

(Y, sonOf, X) <- (X, hasChild, Y) ^ (Y, gender, Male)

这些logical rule可以使用AMIE等规则挖掘工具。也有研究尝试将规则和embedding进行结合。

Meta Relational Learning

也称为few-shot relational learning,旨在训练模型根据少数几个例子预测新的关系事实(relational fact)。

Triple Classification

该任务目的是分辨测试集中的三元组是否正确,是一个二元分类任务。一般是通过将三元组的分数和一个阈值(threshold)进行对比来判断的。

Entity Discovery

Relation Extraction