Spherical Text Embedding 摘要速覽

https://github.com/yumeng5/Spherical-Text-Embedding
https://arxiv.org/abs/1911.01196

無監督文本向量表示技術在NLP任務很重要,然而之前的文本向量表示在笛卡爾空間訓練得到,這樣的話 在文本相似度、文檔聚類任務上,訓練階段 和 預測階段 是有一定差距的。
爲了解決這個問題,我們提出了 一種 無監督 詞彙 和 段落向量 聯合訓練 的 生成式模型,爲了在球面空間訓練,我們開發了一種有效的 有收斂保證的 基於Riemannian優化的 優化算法,
我們的 文本向量 在多個任務達到業界最高水平,包括 詞相似度 和 文檔聚類。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章