GitHub上最全中華古詩詞數據庫又火了

  https://www.ithome.com/" target="_blank">IT 之家</a> 12 月 26 日消息 近期,GitHub 上最全中華古詩詞數據庫再次登上熱榜,又火了一把。根據介紹,chinese-poetry 最全中華古詩詞數據庫集合了唐宋兩朝近一萬四千古詩人, 接近 5.5 萬首唐詩加 26 萬宋詩. 兩宋時期 1564 位詞人,21050 首詞。該項目已經獲得了 22.6k 個「star」以及 4.2k 個「fork」。
  GitHub 項目:<a href="https://github.com/chinese-poetry/chinese-poetry">https://github.com/chinese-poetry/chinese-poetry</a&gt;
  最全的中華古典文集數據庫,包含 5.5 萬首唐詩、26 萬首宋詩、2.1 萬首宋詞和其他古典文集。詩人包括唐宋兩朝近 1.4 萬古詩人,和兩宋時期 1.5 千古詞人。數據來源於互聯網。
  爲什麼要做這個倉庫? 項目作者表示,古詩是中華民族乃至全世界的瑰寶,我們應該傳承下去,雖然有古典文集,但大多數人並沒有擁有這些書籍。從某種意義上來說,這些龐大的文集離我們是有一定距離的。而電子版方便拷貝,所以此開源數據庫誕生了。此數據庫通過 JSON 格式分發,可以讓你很方便的開始你的項目。
  古詩採集沒有記錄過程,因爲古詩數據龐大,目標網站有限制,採集過程經常中斷超過了一個星期。2017 年新加入全宋詞,<a href="https://jackeygao.github.io/r/words/crawl-ci.html" target="_blank">全宋詞爬取過程及數據分析。</a>
  <strong>高頻詞分析圖</strong>
  宋詞受歡迎的詞牌名
  宋詞高頻詞
  宋詞作者作品榜
  唐詩高頻詞
  唐詩作者作品榜
  宋詩高頻詞
  宋詩作者作品榜
  <strong>數據集</strong>
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章