兩個有趣的AI項目

  最近看到一個比較有意思的 AI 項目,叫 AI 時間線,顧名思義,就是藉助 AI 來創建某個關鍵字的時間線。主頁界面很簡單,就是一個輸入框。

  

  我在輸入辛亥革命後,就會生成下圖的時間線,將辛亥革命的各個關鍵點都列了出來。我看到這個效果覺得很驚豔,會有很多場景需要這類時間線,例如某段感興趣的歷史、某個產品的更新過程等。

  

  作者說這個項目是在過年期間花了半天時間完成的,現在是 2 人全職,靠廣告收入,還能盈利,目前項目也已開源,源碼在 Github 上可以訪問。源碼是用 Java 編寫的,我在大學裏學過,之後就再也沒用過,還好源代碼並不多,翻翻找找,發現了些關鍵技術。

  項目中會涉及兩個大模型,百度的千帆大模型和阿里的百鍊大模型,兩者都提供了 API 供第三方調用,付費方式有包資源包和後付費,具體沒怎麼細看。

一、千帆大模型

  千帆大模型可以直接用百度賬號登錄,登錄後需要創建應用,創建後可以得到 API Key 和 Secret Key。

  

  創建完成後,就能到示例代碼一欄,調試對外的 API。例如選擇 chat 接口,選擇應用後,默認會填充 client_id 和 client_secret。

  

  請求中的 body 需要自定義指令,其中“辛亥革命”是我輸入的關鍵詞,這樣才能讓 AI 去生成內容。

[
  {
    "role": "user",
    "content": "辛亥革命的發展歷史,每行按照時間:事件格式輸出,以冒號分隔"
  }
]

  在 AI 執行完畢後,會在 body 中增加一個對象,包含生成的內容。

[
  {
    "role": "user",
    "content": "辛亥革命的發展歷史,每行按照時間:事件格式輸出,以冒號分隔"
  },
  {
    "role": "assistant",
    "content": "辛亥革命是中國近代史上的一次重要革命,它結束了中國的君主專制制度,建立了中華民國。
以下是辛亥革命的發展歷史,按照時間:事件格式輸出:\n\n1911年10月10日:武昌起義爆發,標誌着辛亥革命的開始。\n
1912年1月1日:孫中山在南京宣誓就任中華民國臨時大總統,中華民國正式成立。\n1912年2月12日:清朝最後一位皇帝溥儀宣佈退位,
中國君主專制制度結束。\n1912年3月11日:《中華民國臨時約法》公佈,確立了中華民國的民主共和制度。\n1912年4月1日:
孫中山辭去臨時大總統職務,讓位給袁世凱。\n1913年3月20日:宋教仁遇刺,成爲二次革命的導火索。\n1915年12月12日:
袁世凱宣佈接受帝位,改國號爲中華帝國,復辟帝制。\n1916年3月22日:袁世凱取消帝制,中華帝國結束。\n1917年7月1日:
張勳復辟,擁立溥儀再次登基,但僅持續了12天。\n1917年7月14日:張勳復辟失敗,溥儀再次退位。\n1919年10月10日:
中華民國北洋政府頒佈《中華民國國歌》。\n1921年1月1日:孫中山在廣州就任非常大總統,繼續推動民主革命。\n
1922年6月16日:陳炯明叛變,孫中山被迫離開廣州。\n1923年2月21日:孫中山返回廣州,繼續領導革命運動。\n
1925年3月12日:孫中山在北京逝世,享年59歲。\n1927年4月18日:蔣介石在南京成立中華民國國民政府,成爲國民政府主席。\n
1928年12月29日:張學良宣佈東北易幟,中華民國實現了形式上的全國統一。\n1949年10月1日:中華人民共和國成立,
中華民國政府遷往臺灣。\n\n辛亥革命雖然結束了中國的君主專制制度,但中國此後仍然經歷了多次內戰和政治動盪,
直到中華人民共和國的成立,才最終實現了國家的相對穩定和統一。" } ]

二、百鍊大模型

  百鍊大模型需要用阿里雲的賬號登錄,單擊阿里雲 AccessKey 獲取來創建 AccessKey。注意,AccessKey Secret 只能在生成時查看,需要額外存儲,否則就不能再查看了。

  

  然後就是開通百鍊大模型服務,訪問百鍊大模型控制檯。在模型廣場/應用廣場,均可點擊開通模型調用服務。開通調用服務後才能測試模型體驗、調用模型或應用體驗服務。開通後,還會短信提醒。

  

  

  現在可以在模型體驗一欄,選擇模型調試,輸入系統人設,例如“你是一個歷史學家”,再輸入指令,點擊執行就能得到結果,默認選擇的是通義千問模型。

  

  自定義的指令如下,其中“辛亥革命”是我輸入的關鍵詞。

請根據時間線按照給定的格式列出辛亥革命的發展歷史,每行一條內容,輸出格式如下:
1998年:北京京東世紀貿易有限公司成立
2004年:京東正式涉足電子商務領域

  本文並未涉及到代碼層,只是稍微講解了下 AI 的應用,在此基礎上,就能組織邏輯完成自己所需要的業務,兩個平臺的文檔都比較豐富,消化需要點時間。接下來拋磚引玉,再看一個有趣的 AI 項目。

三、AI 爬蟲

  在網上還看到一個基於 AI 的爬蟲項目,基於 OpenAI 提供的 AI 大模型,讓 AI 簡化很多繁瑣的操作,其實就是用指令爬取 DOM 中的內容。

  以往都是需要自己用規則去匹配,例如下面這段 PHP 代碼,pq 相當於 jQuery 中的 $ 符號,根據匹配規則去查找 DOM 節點,然後做一系列操作。

for($i = 1; $i <= 10; $i++) {
    //...抓取本地頁面...
    phpQuery::newDocument($html);  //初始化對象$urls = array();
    foreach(pq('.search-hos-info dl dt a') as $item) {
      array_push($urls, pq($item)->attr('href')); //醫院詳情    
    }
}

  而現在就不需要了,直接輸入各類指令即可,描述的越清楚越好。

  // 讓 AI 獲取圖片鏈接, 並去重 (描述越詳細越好)
  const srcResult = await crawlOpenAIApp.parseElements(
    highlyHTML,
    '獲取圖片鏈接, 不要source裏面的, 並去重'
  )

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章