Word2vec bin文件转txt文件

淩亂°似流年 2022-03-10 11:46 1020阅读 0赞

深度学习模型训练时,常常需要下载pretrained embedding,而embedding保存的格式常有.bin和txt。

将.bin文件转为.txt文件。

dependencies:python gensim

  1. from gensim.models.keyedvectors import KeyedVectors
  2. model = KeyedVectors.load_word2vec_format('file.bin', binary=True)
  3. model.save_word2vec_format('file.txt', binary=False)

将txt格式转为gensim格式:

  1. word_vectors=KeyedVectors.load_word2vec_format('/path/to/fasttext/embeddings.txt', binary=False)
  2. word_vectors.save('/path/to/converted')

作者:codefisher
链接:https://www.jianshu.com/p/558c6bb74210
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,1020人围观)

还没有评论,来说两句吧...

相关阅读

    相关 word2vec

    Word2Vec 是一种词嵌入模型,用于将文本中的单词映射到一个固定大小的向量空间中。它的主要目的是通过计算单词之间的相似度来增强自然语言处理的性能。Word2Vec 通常用于

    相关 word2vec学习笔记[]

    谷歌已经使用Deep Learning技术开发了许多新方法来解析语言,目前,谷歌开源了一款基于Deep Learning的学习工具——word2vec,这是首款面向大众的Dee