推荐系统 Word2vector

霸气de小男生 提交于 2019-12-29 21:29:23

在使用Uni-gram模型时(也就是词袋法)时,会导致数据非常稀疏。那么我们在训练模型时,就需要更多的数据。会导致存储和计算开销激增。
One-hot-Representation 是最常用的词表示方法。它的优点是简单直观,容易理解。但是会出现词向量维数爆炸的问题,因为有多少个词,词向量就有多少维度,计算开销太大。OneHot还有一个问题,两个在词义上相似的词,在词向量上却没有相似性。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!