#语料

根据语料 计算词向量

根据语料计算词向量,两种模式CBOW和skip-gram #-*-coding:utf-8-*-importosfromgensim.modelsimportword2vecclassMySentences(object):def__init__(self,dirname):self.dirname=dirn...
代码星球 代码星球·2020-08-09

基于《美国当代英语语料库COCA词频20000》提取的纯单词文件

最近在背单词,为了能提高效率,找到一个比较有名的《美国当代英语语料库COCA词频20000》来源应该是:http://www.wordfrequency.info/,当然是收费的。免费的可以在这里下载pdf文件:http://vdisk.weibo.com/s/ctvvyfhPYLfj由于是pdf文件,且包含大量其他不...