1.典型的“雞尾酒會”問題中,提取出不同人說話的聲音是屬於
編號 | 選項 |
---|---|
A | 強化學習 |
B | 非監督學習 |
C | 監督學習 |
D | 線性迴歸 |
2.____有跟環境進行交互,從反饋當中進行不斷的學習的過程
編號 | 選項 |
---|---|
A | 非監督學習 |
B | 監督學習 |
C | 線性迴歸 |
D | 強化學習 |
3.在Q-Learning中,所謂的Q函數是指
編號 | 選項 |
---|---|
A | 狀態值函數 |
B | 狀態動作函數 |
C | 動作值函數 |
D | 策略函數 |
4.Q函數Q(s, a)是指在一個給定狀態s下,採取某一個動作a之後,後續的各個狀態所能得到的回報的___。
編號 | 選項 |
---|---|
A | 期望值 |
B | 最小值 |
C | 最大值 |
D | 總和 |
5.在強化學習的過程中,學習率α越大,表示採用新的嘗試得到的結果比例越____,保持舊的結果的比例越____。
編號 | 選項 |
---|---|
A | 大;小 |
B | 大;大 |
C | 小;大 |
D | 小;小 |
6.在ε-greedy策略當中,ε的值越大,表示採用隨機的一個動作的概率越____,採用當前Q函數值最大的動作的概率越____。
編號 | 選項 |
---|---|
A | 小;大 |
B | 小;小 |
C | 大;大 |
D | 大;小 |
7.在強化學習過程中,____表示隨機地採取某個動作,以便於嘗試各種結果;____表示採取當前認爲最優的動作,以便於進一步優化評估當前認爲最優的動作的值。
編號 | 選項 |
---|---|
A | 探索;探索 |
B | 探索;開發 |
C | 開發;開發 |
D | 開發;探索 |
8.用於監督分類的算法有
編號 | 選項 |
---|---|
A | 神經網絡 |
B | 支持向量機 |
C | 線性迴歸 |
D | 決策樹 |
9.在強化學習中,主體和環境之間交互的要素有
編號 | 選項 |
---|---|
A | 動作 |
B | 狀態 |
C | 強化 |
D | 回報 |
10.在支持向量機分類算法中,用於支撐兩個類別最寬分解線的這些樣本點稱爲_______
支持向量