GPT生成過程中的Top_p和Top_k

原創

2023-10-01 12:51

一、背景

GPT生成的代碼中，往往有很多需要設置的參數，例如top_p、top_k等。下面介紹一下這些參數意義和提出的原因。

二、Top_K

top_k是一個經典的方法，表示從候選的K個值中選擇一個。在GPT生成的過程中也是類似的問題。選取K個tokens，哪些tokens的概率最高。然而Top_K存在一些問題，就是對於開放的問題，回答不夠好，隨機性不夠強。因此提出了Top_P的算法。

三、Top_P

top_p算法表示，滿足概率之和大於p的最小tokens集合。這樣在下一個詞不確定的情況下，可以採樣更多的詞，在下一個詞確定的情況下，可以減少模型的幻覺的問題（採樣的詞更少）。

四、總結

對於不同的方法，針對的場景不同，在需要開放性問題回答的時候，採取Top_P的方法，增加一下隨機性，在確定性的問題時，採取Top_K的方法。實際過程中，Top_P和Top_K可以同時使用，並且像beam搜索和greedy的方法也可以交替使用。但是需要考慮實際的場景，避免模型幻覺問題。

五、參考

huggingface的博客

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

easy excel——初篇

1、知識體系　　easy excel是處理Excel文檔的框架，它的知識體系由三部分組成　　第一部分，環境搭建，演示示例（HelloWorld）　　第二部分，讀Excel文件。　　　　首先，編寫Java實體類，創建Excel表格。

2024-05-19 14:02:15

C# SoundPlayer播放資源文件中嵌入的.wav文件

using System.IO; using System.Media; using System.Windows.Forms; using Namespce.Properties; public static class Speake

2024-05-19 14:00:35

./configure --with-debug --prefix=/Users/root/opt/nginx/debug_nginx

% ./configure --with-debug --prefix=/Users/root/opt/nginx/debug_nginxchecking for OS + Darwin 21.6.0 x86_64checking for

2024-05-19 13:58:25

瞭解顯卡

從零開始認識顯卡硬件　　ROG Strix RTX 4080爲例：供電接口：8pin接口，單個提供225w供電，高功耗可使用多個　　該4080提供6個供電接口：　　還有背插顯卡，無需外接供電，需搭載特定主板和轉

2024-05-19 13:57:35

C語言枚舉類型所佔字節大小實例解析

一 C語言中枚舉所佔多少字節呢？這個問題最近一個項目中，遇到了才進行總結。看來很多問題，踩坑了才知道珍惜啊。二實例解析 #include <stdio.h> typedef enum { IIR_TYPE_LOW_SH

2024-05-19 13:50:44

Android/iOS版本號機制簡介

Android和iOS 有各自的版本號機制，但都根據版本號的用途，分爲了2類：程序向的構建版本號：用戶不可見影響APP的功能：覆蓋安包（低版本覆蓋高版本會提示異常或失敗）影響APP商店提審：每個提審包都必須必上一次版本號高

2024-05-19 13:49:04

JavaScript Promise Time Limit Function All In One

JavaScript Promise Time Limit Function All In One LeetCode 2637. Promise Time Limit errors function timeLimit(fn: Fn,

2024-05-19 13:48:44

解決 WSL 無響應問題

打開 windows 子系統只有窗口沒有響應，通過命令行執行 wsl 命令也沒有響應。經查詢問題在於其所依賴的服務 LxssManager 停止工作，應重啓該服務。而通過 service.msc 找到該服務之後，發現無法對其進行操作。於

洛水·錦依衛

2024-05-19 13:44:43

pg_probackup 包含新建表空間的備份及恢復

https://zhuanlan.zhihu.com/p/615986944

規格嚴格-功夫到家

2024-05-19 13:43:13

【PG】PostgreSQL 預寫日誌(WAL)、checkpoint、LSN

https://blog.csdn.net/weixin_48154829/article/details/134373235

規格嚴格-功夫到家

2024-05-19 13:43:13

Django測試與持續集成：從入門到精通

title: Django測試與持續集成：從入門到精通 date: 2024/5/18 16:38:41 updated: 2024/5/18 16:38:41 categories: 後端開發 tags: Django 測試 CI

2024-05-19 13:38:23

[轉帖]【全網首發】一些可以顯著提高 Java 啓動速度方法原創

https://heapdump.cn/article/4136322?from=pc 我們線上的業務 jar 包基本上普遍比較龐大，動不動一個 jar 包上百 M，啓動時間在分鐘級，拖慢了我們在故障時快速擴容的響應。於是做

濟南小老虎

2024-05-19 13:29:31

Ubuntu2404安裝以及部署docker

Ubuntu2404安裝以及部署docker 背景不喜歡ubuntu 總是變來變去的. 自己玩還行, 部署生產能被坑死. 如果都是自己管理的ubuntu還好加上很多op部署的, 純粹自己找沒趣了安裝正常選擇就可以. 主要是想

濟南小老虎

2024-05-19 13:29:31

美團一面問我i++跟++i的區別是什麼

美團一面問我i++跟++i的區別是什麼面試官：“i++跟++i的區別是什麼？” 我：“i++是先使用然後再執行+1的操作，++i是先執行+1的操作然後再去使用i” 面試官：“那你看看下面這段代碼，運行結果是什麼？” public stat

2024-05-19 13:22:21

項目管理案例-關於第三方公司提供的組件質量欠佳的問題

項目管理案例-關於第三方公司提供的組件質量欠佳的問題背景商用密碼應用安全性評估（簡稱密評），是指按照有關法律法規和標準規範，對網絡與信息系統使用商用密碼技術、產品和服務的合規性、正確性、有效性進行檢測分析和評估驗證的活動。依據《

2024-05-19 13:21:31

24小時熱門文章

最新文章

最新評論文章