特牛网址导航

词嵌入模型-CSDN博客

网友收藏
文章浏览阅读2.6k次。词嵌入模型为什么需要词嵌入模型余弦相似度可以度量两个向量的相似程度,我们自然想到可以将单词或者文本用向量表示,来判断两者的相似程度,而词嵌入模型则是一种实现方式,将所有出现的单词作为一个词袋库,将onehot向量进行压缩表示成(50到300维)的向量,利用中间层的隐藏向量,讲单词变成向量表示,方便后续的模型输入(如bert等)与他相似的工作tf-idf:字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降,但忽视了词序关系主题模型:是一种基于概率图的生成式模_词嵌入模型
标签:词嵌入模型