ai 大模型

原創

2024-04-30 12:43

國內鏡像
https://hf-mirror.com/

國外

https://huggingface.co/

使用

pip install transformers

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

# 加載模型和分詞器
model = AutoModelForSeq2SeqLM.from_pretrained('t5-small')
tokenizer = AutoTokenizer.from_pretrained('t5-small')

# 編碼輸入文本
input_text = "Translate English to French: Hello, how are you?"
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# 生成輸出文本
outputs = model.generate(input_ids)
decoded_output = tokenizer.decode(outputs[0])

print(decoded_output)

大模型上下文長度1040k 換算成漢字大約多少字

上下文長度爲 1040k 詞元，如果每個詞元代表一個漢字，那麼上下文長度就是 1040 萬個漢字。因爲“k”代表千（kilo），所以 1040k 意味着 1040,0000。在中文文本中，通常一個詞元對應一個漢字，所以我們可以直接將詞元數轉換爲漢字數

如果我們假設一個詞元平均代表一個單詞，並且一個單詞平均有 5 個字符（這在英語中是一個合理的估計），那麼 1,040,000 詞元大約對應於：

1,040,000 詞元 * 5 字符/詞元 = 5,200,000 字符

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

如何優雅的使用ollama

入門開源大語言模型，最好的工具就是ollama，這是一款簡單的大模型本地部署框架，支持基於命令行的方式運行多種大語言模型，並提供了相應的Python和JS SDK，可以基於此方便實現Chatbot UI。這篇文章就以京東雲智算平臺爲例（其

京東雲開發者

2024-05-17 23:56:39

KubeKey v3.1 發佈：快速自定義離線安裝包

日前，KubeKey v3.1 正式發佈。該版本主要對離線場景部署、離線包製作以及向 Kubernetes v1.24+ 升級進行了優化。 KubeKey 簡介 KubeKey 是 KubeSphere 社區開源的一款高效集羣部署工具，運

2024-05-17 23:16:50

記一次有點抽象的滲透經歷

0x01 獲取webshell 在各種信息蒐集中，發現某個ip的端口掛着一個比較老的服務。首先看到了員工工號和手機號的雙重驗證，也不知道賬號是什麼結構組成的，基本上放棄字典爆破這一條路。於是乎打開之前用燈塔的掃描結果，看看文件泄露是否

2024-05-17 23:16:30

MySQL 核心模塊揭祕 | 16 期 | InnoDB 表鎖

本文介紹了 InnoDB 支持哪幾類表鎖，以及它們分別都用在什麼場景下，還介紹了其中兩類表鎖爲什麼要存在。作者：操盛春，愛可生技術專家，公衆號『一樹一溪』作者，專注於研究 MySQL 和 OceanBase 源碼。愛可生開源社區出品，

2024-05-17 12:02:59

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

本文分享自華爲雲社區《通過HPA+CronHPA組合應對業務複雜彈性伸縮場景》，作者：雲容器大未來。背景在k8s集羣中，容器水平自動伸縮(HPA)，可以根據容器資源的使用量，在設置好的副本範圍內，自動擴縮容工作負載副本數(repli

2024-05-17 10:59:32

前端面試題 - vue的雙向綁定原理是什麼？

前端面試題 - vue的雙向綁定原理是什麼？ vue2的雙向數據綁定是通過數據劫持結合發佈者訂閱者模式的方式來實現。通過object.defineProperty來劫持各個屬性的setter，getter，在數據變化時發佈消息給訂閱者，

2024-05-17 00:41:12

win 環境下 docker 的使用整理

1、下載： https://www.docker.com/products/docker-desktop/ 如果電腦分多個盤，建議下載到可用存儲較大的盤，安裝的時候默認安裝到 C 盤，安裝完成後雙擊啓動如果出現【Docker

2024-05-17 00:25:04

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

OpenAI的每次發佈，感覺都會幹翻一個行業。昨晚GPT-4o的發佈，情感陪伴這個賽道像是又要掀起一番驚天鉅變。各位創業老闆們摩拳擦掌，無數創意精英又要踏入新的征程。開源社區一定也異常興奮，相信Huggingface和Github馬上又會

2024-05-16 23:56:27

通過MVEL表達式和Apache Chain職責鏈模式解耦MQ消息處理節點的實踐應用

導讀本文主要講解了MVEL表達式和責任鏈設計模式相結合一起的消息處理解決方案設計、解耦消息處理節點以及方便代碼維護擴展。通過“訂單拆單消息”的接入作爲具體實踐案例，簡要闡述了MVEL表達式和Apache Chain職責鏈設計模式應用場景。

2024-05-16 23:56:24

京東秒送售後系統退款業務重構心得| 京東零售技術團隊

一、重構背景 1.1、退款京東秒送秒送退款有2套結構，代碼邏輯混亂；其中秒送、天選部分售後單是和平生pop交互退款，部分是和售後中臺交互退款；並且兼容3套邏輯；痛點：代碼繁重，缺乏合理性的設計，後續迭代開發以及維護成本高，同時增加

2024-05-16 23:56:23

教你如何搞定springboot集成kafka

本文分享自華爲雲社區《手拉手入門springboot+kafka》，作者：QGS。安裝kafka 啓動Kafka本地環境需Java 8+以上 Kafka是一種高吞吐量的分佈式發佈訂閱消息系統，它可以處理消費者在網站中的所有動作流數據。

2024-05-16 22:58:25

O2OA平臺流程催辦怎麼做

O2OA平臺設計了靈活的消息提醒數據交互方式，開發者可以根據自己的需要，來消費消息提醒數據，也可以將消息提醒數據接入到Kafka消息中間件來實現消息的準實時提醒。本篇主要介紹如何在O2OA服務器中設置流程的催辦提醒消息。催辦

2024-05-16 22:48:44

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

終於要講解我們親愛的掘金了。掘金是一個非常不錯的平臺。所以很多朋友會把博客發佈到掘金上。發佈到掘金要填寫的內容也比較多。今天給大家介紹一下如何用blog-auto-publishing-tools這個工具自動把博客發佈到掘金平臺上去。前

2024-05-16 21:38:44

報名開啓！2024 開源之夏丨Serverless Devs 課題已上線！

Serverless 是近年來雲計算領域熱門話題，憑藉極致彈性、按量付費、降本提效等衆多優勢受到很多人的追捧，各雲廠商也在不斷地佈局 Serverless 領域。 Serverless Devs 是一個由阿里巴巴發起的 Serverless

2024-05-16 21:13:49

CaffeineCache Api介紹以及與Guava Cache性能對比| 京東物流技術團隊

一、簡單介紹： CaffeineCache和Guava的Cache是應用廣泛的本地緩存。在開發中，爲了達到降低依賴、提高訪問速度的目的。會使用它存儲一些維表接口的返回值和數據庫查詢結果，在有些場景下也會在分佈式緩存上再加上一層本地緩存，

2024-05-17 23:56:43

24小時熱門文章

最新文章

最新評論文章