【題解】【中國大學MOOC】(北京大學)人工智能與信息社會測驗——6基於神經網絡的智能系統II

1.典型的“雞尾酒會”問題中,提取出不同人說話的聲音是屬於

編號 選項
A 強化學習
B 非監督學習
C 監督學習
D 線性迴歸

2.____有跟環境進行交互,從反饋當中進行不斷的學習的過程

編號 選項
A 非監督學習
B 監督學習
C 線性迴歸
D 強化學習

3.在Q-Learning中,所謂的Q函數是指

編號 選項
A 狀態值函數
B 狀態動作函數
C 動作值函數
D 策略函數

4.Q函數Q(s, a)是指在一個給定狀態s下,採取某一個動作a之後,後續的各個狀態所能得到的回報的___。

編號 選項
A 期望值
B 最小值
C 最大值
D 總和

5.在強化學習的過程中,學習率α越大,表示採用新的嘗試得到的結果比例越____,保持舊的結果的比例越____。

編號 選項
A 大;小
B 大;大
C 小;大
D 小;小

6.在ε-greedy策略當中,ε的值越大,表示採用隨機的一個動作的概率越____,採用當前Q函數值最大的動作的概率越____。

編號 選項
A 小;大
B 小;小
C 大;大
D 大;小

7.在強化學習過程中,____表示隨機地採取某個動作,以便於嘗試各種結果;____表示採取當前認爲最優的動作,以便於進一步優化評估當前認爲最優的動作的值。

編號 選項
A 探索;探索
B 探索;開發
C 開發;開發
D 開發;探索

8.用於監督分類的算法有

編號 選項
A 神經網絡
B 支持向量機
C 線性迴歸
D 決策樹

9.在強化學習中,主體和環境之間交互的要素有

編號 選項
A 動作
B 狀態
C 強化
D 回報

10.在支持向量機分類算法中,用於支撐兩個類別最寬分解線的這些樣本點稱爲_______

支持向量
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章