【題解】【中國大學MOOC】（北京大學）人工智能與信息社會測驗——6基於神經網絡的智能系統II

原創

2020-05-04 11:58

1.典型的“雞尾酒會”問題中，提取出不同人說話的聲音是屬於

編號	選項
A	強化學習
B	非監督學習
C	監督學習
D	線性迴歸

2.____有跟環境進行交互，從反饋當中進行不斷的學習的過程

編號	選項
A	非監督學習
B	監督學習
C	線性迴歸
D	強化學習

3.在Q-Learning中，所謂的Q函數是指

編號	選項
A	狀態值函數
B	狀態動作函數
C	動作值函數
D	策略函數

4.Q函數Q(s, a)是指在一個給定狀態s下，採取某一個動作a之後，後續的各個狀態所能得到的回報的___。

編號	選項
A	期望值
B	最小值
C	最大值
D	總和

5.在強化學習的過程中，學習率α越大，表示採用新的嘗試得到的結果比例越，保持舊的結果的比例越。

編號	選項
A	大；小
B	大；大
C	小；大
D	小；小

6.在ε-greedy策略當中，ε的值越大，表示採用隨機的一個動作的概率越，採用當前Q函數值最大的動作的概率越。

編號	選項
A	小；大
B	小；小
C	大；大
D	大；小

7.在強化學習過程中，表示隨機地採取某個動作，以便於嘗試各種結果；表示採取當前認爲最優的動作，以便於進一步優化評估當前認爲最優的動作的值。

編號	選項
A	探索；探索
B	探索；開發
C	開發；開發
D	開發；探索

8.用於監督分類的算法有

編號	選項
A	神經網絡
B	支持向量機
C	線性迴歸
D	決策樹

9.在強化學習中，主體和環境之間交互的要素有

編號	選項
A	動作
B	狀態
C	強化
D	回報

10.在支持向量機分類算法中，用於支撐兩個類別最寬分解線的這些樣本點稱爲_______

支持向量

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【題解】【中國大學MOOC】（北京大學）人工智能與信息社會測驗——6基於神經網絡的智能系統II

1.典型的“雞尾酒會”問題中，提取出不同人說話的聲音是屬於

2.____有跟環境進行交互，從反饋當中進行不斷的學習的過程

3.在Q-Learning中，所謂的Q函數是指

4.Q函數Q(s, a)是指在一個給定狀態s下，採取某一個動作a之後，後續的各個狀態所能得到的回報的___。

5.在強化學習的過程中，學習率α越大，表示採用新的嘗試得到的結果比例越，保持舊的結果的比例越。

6.在ε-greedy策略當中，ε的值越大，表示採用隨機的一個動作的概率越，採用當前Q函數值最大的動作的概率越。

7.在強化學習過程中，表示隨機地採取某個動作，以便於嘗試各種結果；表示採取當前認爲最優的動作，以便於進一步優化評估當前認爲最優的動作的值。

8.用於監督分類的算法有

9.在強化學習中，主體和環境之間交互的要素有

10.在支持向量機分類算法中，用於支撐兩個類別最寬分解線的這些樣本點稱爲_______

【學習筆記】【深度學習的數學】第0章——引言

【學習筆記】【統計學習方法】第1章——統計學習及監督學習概論

【學習筆記】【機器學習】第1章——緒論

【題解】【中國大學MOOC】（東北大學）大學計算機--Python算法實踐測驗——第七週：樹的實現

【題解】【中國大學MOOC】（東北大學）大學計算機--Python算法實踐測驗——第二週：分支程序設計

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

【題解】【中國大學MOOC】（北京大學）人工智能與信息社會測驗——6基於神經網絡的智能系統II

1.典型的“雞尾酒會”問題中，提取出不同人說話的聲音是屬於

2.____有跟環境進行交互，從反饋當中進行不斷的學習的過程

3.在Q-Learning中，所謂的Q函數是指

4.Q函數Q(s, a)是指在一個給定狀態s下，採取某一個動作a之後，後續的各個狀態所能得到的回報的___。

5.在強化學習的過程中，學習率α越大，表示採用新的嘗試得到的結果比例越____，保持舊的結果的比例越____。

6.在ε-greedy策略當中，ε的值越大，表示採用隨機的一個動作的概率越____，採用當前Q函數值最大的動作的概率越____。

7.在強化學習過程中，____表示隨機地採取某個動作，以便於嘗試各種結果；____表示採取當前認爲最優的動作，以便於進一步優化評估當前認爲最優的動作的值。

8.用於監督分類的算法有

9.在強化學習中，主體和環境之間交互的要素有

10.在支持向量機分類算法中，用於支撐兩個類別最寬分解線的這些樣本點稱爲_______

5.在強化學習的過程中，學習率α越大，表示採用新的嘗試得到的結果比例越，保持舊的結果的比例越。

6.在ε-greedy策略當中，ε的值越大，表示採用隨機的一個動作的概率越，採用當前Q函數值最大的動作的概率越。

7.在強化學習過程中，表示隨機地採取某個動作，以便於嘗試各種結果；表示採取當前認爲最優的動作，以便於進一步優化評估當前認爲最優的動作的值。