貝葉斯優化如何工作？

原創

2020-07-08 04:10

本文來自，Duane Rich。Answer: Duane Rich, Researcher Scientist at Lyft

問題

目標是爲一些”昂貴的“函數找到近似最小值。這些函數接受一個實數向量 $x$ ，然後計算很長時間後才返回一個標量。所以我們可以在這裏想象一個一維的情形：

點狀線表示一個我們無法確定的函數，我們僅能通過函數上的一些點來評估這個函數。但是這個評估過程是很耗時的，不妨設我們只有10次機會來評估。那麼你怎麼來找到這個函數的潛在最小點呢？

Here is a dumb idea:

隨機採樣

隨機選擇10個點進行評估。

這麼做確實有用，但是我們可能找不到最小點。或許我們可以有更好的方法。

那麼我們可以根據已知的點來選擇接下來的點麼？

貝葉斯優化（使用高斯過程）

採樣一些輸入(x)-輸出(y)（少於10），然後用它們來猜測出一個真實的函數以及所謂的高斯過程。然後用這個猜測出的函數來決定接下來在哪裏進行評估。評估這個點，然後將這個點加入我們的輸入-輸出集中，再一次推測出一個新的函數。不斷重複直到我們使用完了我們的評估機會。如果高斯過程能更好的猜測出真實的函數，那麼我麼肯定能比隨機採樣做的更好。

如果您不知道高斯過程是什麼，我可以告訴你一些重要的信息。這是從其輸入和輸出樣本中推論出一個函數（就像我們在上面看到的那樣）的一種方式。不僅如此，它還提供了輸出的分佈。因此，當您猜測某個給定x處的函數輸出時，GP也會告訴我們在給定範圍內找到它的可能性。如果您想了解更多，這裏有一些更深入的內容。

接下來我們從我們那“昂貴的函數”中採樣出4個數據點，把它們交給高斯過程，我們就可以推測出其餘的函數，他們大致長這樣：

那條很粗的綠線就是推測出的真實的函數。每個綠色的條子就是標準置信區間。

那麼問題來了，有了這些猜測出來的信息。我們應該從哪個點開始檢驗呢？首先我們需要關注兩個事情：

我們應該評估我們認爲會產生低輸出值的點，也就是說，我們應該對實線低的點進行評估。
我們應該檢查那些我們把握不那麼大的區域。在上圖中，我們明顯對0.6-0.8的區間比[0.15, 0.3]小。換句話說，我們應該檢查將最大程度地減少方差的區域。

對於以上兩點是關於“探測-開發”之間的平衡。你是想去尋找新的區域還是開發現有區域中的金礦？我們將開發偏好表示爲一個函數叫做"acquisition function"。這個函數是關於 $x$ 的，它會產生一個數值來告訴我們如何在這兩種偏好之間進行選擇。這個函數的計算量很小，因此我們可以對它進行優化，然後使用這個 $x$ 來指導我們的下一個搜索目標。

講了這麼多，那麼"acquisition function"是什麼樣子的呢？其實有很多選擇，但是我會使用expectation of improvement的函數。即，評估下一個預期改進最高的點。

如果：

$\mu(x)$ 是推測出的函數值，即綠線在 $x$ 上的值。
$\sigma(x)$ 是在 $x$ 點的輸出的標準偏差（即成比例的綠色帶子）。

那麼我們的acquisition/expectation of improvement 爲( $A(x)$ ):

其中， Φ(⋅)和 $N(.)$ 分別是一個標準正態分佈的分佈函數和概率密度函數。其實理不理解這個式子並不重要。只需要知道它是對 $低的\mu(x)和高的\sigma(x)$ 的平衡即可。

讓我來看看這個函數是怎麼工作的，你可以在下圖中看到 $A(x)$ 在各個點中對應的值。

由上圖可知，我們應該檢查x=1這一點。

然後不斷重複上述過程。‘

我們遺漏了什麼？

雖然這個例子展示了這種方法的核心部分，但是並沒有展現這個方法的全貌：

通常，我們會在多個維度上進行最優化。高斯過程可以很自然的拓展到多個維度，但是隨着維度的增加太高，實驗的效率會顯著降低。
我們堅持假設我們對真實函數的評估是有噪音的。噪音可以很輕易的建模進高斯過程中。高斯過程會找到跟所有點最接近的函數。
對高斯過程的本身的參數進行微調是一種藝術。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

2024年DataOps趨勢預測：AI不會取代數據工程師

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

數字化轉型新篇章：企業通往智能化的新範式

早在十多年前，一些具有前瞻視野的企業以實現“數字化”爲目標啓動轉型實踐。但時至今日，可以說尚無幾家企業能夠在真正意義上實現“數字化”。在實現“數字化”的征途上，人們發現，努力愈進，彷彿終點愈遠。究其原因，還在於轉型一直落後於技術邊界的拓展

2024-04-29 21:22:20

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

軟件測試從自動化到智能化，大模型開始加入

隨着科技的飛速發展，軟件行業也在不斷地演進和創新。作爲軟件行業的關鍵環節之一，軟件測試行業也在經歷着前所未有的變革。從最初的手動測試，到自動化測試，再到如今的智能化測試，軟件測試行業正在經歷一場深刻的技術革命。在這場革命中，Testin雲測

2024-04-19 00:53:25

裁員了！別錯過2024年大數據工程師必備的10項技能

在當今快速發展的世界中，數據被視爲新的石油。隨着對數據驅動洞察的日益依賴，大數據工程師的角色比以往任何時候都更爲關鍵。這些專業人員在管理和優化組織內的數據操作中扮演着至關重要的角色。在本文中，我們將探索2024年大數據工程師必須具備的十

2024-04-16 11:00:53

DevOps已死？2024年的DevOps將如何發展

隨着我們進入2024年，DevOps也隨之發生變化。新興的技術、變化的需求和發展的方法正在重新定義有效實施DevOps實踐。 IDC預測顯示，未來五年，支持DevOps實踐的產品市場繼續保持健康且快速增長，2022年-2027年的複合年增長

2024-04-08 12:51:44

從模型到部署，教你如何用Python構建機器學習API服務

本文分享自華爲雲社區《Python構建機器學習API服務從模型到部署的完整指南》，作者：檸檬味擁抱。在當今數據驅動的世界中，機器學習模型在解決各種問題中扮演着重要角色。然而，將這些模型應用到實際問題中並與其他系統集成，往往需要構建API

2024-04-08 10:33:17

測試左移已經開始影響DevOps的發展？

在軟件開發的早期，該過程通常是開發人員編寫代碼，再將其交給質量保證（QA）進行測試。這種瀑布開發方法可能會導致質量問題和延遲，因爲問題是在週期後期發現的。一、瞭解DevOps和測試左移 DevOps是Development和Operati

2024-04-07 12:48:37

黑盒Prompt優化：提升大模型反饋效果的新思路

隨着人工智能技術的快速發展，大模型在各種應用場景中發揮着越來越重要的作用。然而，如何提升大模型的反饋效果，使其更加準確、高效地爲用戶提供服務，一直是研究者和開發者關注的焦點。本文提出了一種新的思路——黑盒Prompt優化，旨在通過改進輸入提

2024-03-29 00:01:17

分佈式數據庫技術的演進和發展方向

這些年大家都在談分佈式數據庫，各大企業也紛紛開始做數據庫的分佈式改造。那麼，所謂的分佈式數據庫到底是什麼？採用什麼架構？優勢在哪？爲什麼越來越多企業選擇它？分佈式數據庫技術會向什麼方向發展？帶着這些疑問，一探究竟吧！參與文末的話題互動

2024-03-26 11:34:43

利用RAG技術打破大模型幻覺

隨着人工智能技術的不斷進步，大模型在各個領域中發揮着越來越重要的作用。然而，大模型幻覺問題一直是制約其進一步發展的瓶頸。爲了解決這一問題，研究者們不斷探索新的技術和方法。近年來，一種名爲RAG（檢索增強生成）的技術備受關注，它通過結合知識圖

2024-03-21 00:28:34

24小時熱門文章

HTTP URL 詳解

最新文章

最新評論文章