import gensim
sentences = [['你好', '呀',], ['今天', '天氣',"很好"],['開心','高興']]
# train word2vec on the this sentences
model = gensim.models.Word2Vec(sentences,min_count=1)
# get the detail
print(model.wv.vocab)
#get the words
words = model.wv.vocab
for word in words:
print(word)
# 獲取model中的詞 #在gensim 1.0.0 以前的版本可以使用:
model.vocab
#在 gensim 1.0以後的版本使用:
model.wv.vocab
第一個輸出結果:
{'你好': <gensim.models.keyedvectors.Vocab object at 0x121f58a90>,
'呀': <gensim.models.keyedvectors.Vocab object at 0x1220ffa10>,
'今天': <gensim.models.keyedvectors.Vocab object at 0x12216ae90>,
'天氣': <gensim.models.keyedvectors.Vocab object at 0x1221f1410>,
'很好': <gensim.models.keyedvectors.Vocab object at 0x12220acd0>,
'開心': <gensim.models.keyedvectors.Vocab object at 0x12220ad50>,
'高興': <gensim.models.keyedvectors.Vocab object at 0x12220ad90>}
第二個輸出結果:
你好
呀
今天
天氣
很好
開心
高興