TransE算法的整理
TransE 1 TransE的作用 TransE 作用 就是把三元组翻译成embedding词向量的方法 三元组,也就是(头实体,关系,尾实体)的形式,头实体和尾实体统称为实体。为了简化起见,我们用(h,r,t)来表示三元组。其中 h表示头实体 r表示关系 t表示尾实体 我们的目标是将知识库中所有的实体、关系表示成一个低维的向量。我们把三元组(h,r,t)对应的向量表示为(h,r,t)。 h 表示头实体对应的向量 r 表示关系对应的向量 t 表示尾实体对应的向量 这样,“姚明”这个实体就不再是一个孤立的符号了,而是一个低维的稠密的向量。它看起来就像下面这样: [0.01, 0.04, 0.8, 0.32, 0.09, 0.18] 上面这个向量的维度是6维,真实情况下向量的维度会比这个大,但具体取多大并没有一个统一的标准,一般取为50~200左右。 2 TransE的基本思想 TransE模型认为一个正确的三元组的embedding向量 ( h , r , t ) (h,r,t) ( h , r , t ) 会满足公式: h + r = t h+r=t h + r = t (头实体embedding加上关系embedding会等于尾实体embedding) 如果是一个错误的三元组,那么它们的embedding之间就不满足这种关系。 3.TransE的目标函数