爲了這個羞羞的項目,我差點成爲“鑑黃師”

全世界只有3.14 % 的人關注了

爆炸吧知識

轉自:大數據文摘

編譯:蔣寶尚、魏子敏

給男同學們一個機器學習,他們能研究所有他們能想到的問題。

當然,根據這本真實存在的暢銷書,他們真的能想到的話題也不多????

開個玩笑,不過今天確實要給大家介紹一個不太一樣有點羞羞的機器學習項目,也就是嘿嘿嘿的時候,最加深感情的某種動作的分析,英文俗稱“blowjob”或者“oral sex”。

儘管內容敏感,整體來看,這是個頗爲學術的研究項目,由柏林一家公司Very Intelligent Ecommerce Inc所委託開啓。這個項目的最終目的也很有趣,是爲一項名爲Autoblow AI的項目設計進行的調研工作。

關於這個項目Autoblow AI,讀者可以自行谷歌... ...

在這個項目中,研究者研究包括108小時的色情視頻的訓練數據,並基於這些數據建立了一個模型(當然這也就意味着,研究者需要對這108個小時的視頻進行詳細標註)。

之後,模型對視頻中的口情色內容分成了十六種不同的經典類型。模型的核心是採用深度學習在程序上生成仿真動作。經過驗證,該模型的效果優於馬爾科夫鏈。

據悉,用機器學習對這一類情色內容進行分析,屬於前無古人的項目。分析結果爲未來爲未來的研究奠定了基礎。

先把這份神奇的paper獻上:

https://www.autoblow.com/bjpaper/

儘管整體研究頗爲嚴謹,但基於項目的敏感性,此項目的作者選擇保持匿名。仍然感興趣的同學可以繼續往下讀,以下是這位研究者的論文,或者說一份研究自述????

機器學習和大數據分析在數字世界中變得越來越重要。性產業也不例外。

例如:與過濾色情片完全相同的技術可以很容易地對其進行分類和標記。一些網站也使用類似Netflix的推薦系統推薦視頻。這些只是人工智能的一些實際應用。

在這項工作中,對這個未經探索的項目進行研究,特別側重於對男性的口情色動作分析是非常有勇氣的。

該項目的具體操作過程爲:

首先,量化了口情色動作中最“常見”或“典型”的動作,從而改善了Autoblow AI所使用的模式的真實性。具體來說,使用量化技術來識別16種“典型”或“常見”運動,從而構建更加複雜的運動模塊。

其次,研究者使用以前的結果來研究運動的過程生成。設計一個基於深度學習的模型,用於從隨機噪聲中產生獨特但真實的序列。然後將該模型與一個簡單的馬爾可夫鏈模型進行了定量比較,證明了設計的正確性。

最後,研究者討論了未來的研究是可能的,在同一數據集的背景下,繼續改進的奧托布洛人工智能和性玩具在總體上。

最後,在繼續改進Autoblow AI和性玩具的背景下,將討論如何使用相同數據集進行未來研究。

數據集

對AAA級色情視頻進行分析時,只採用男性口情色部分。具體數據的標準,有審查員手工標記,然後使用自定義的用戶界面記錄口與***的距離。該位置記錄爲整數,其中1000表示軸的尖端,0表示基部。

自定義的用戶界面

爲了分析,使用線性插值將視頻和註釋標準化爲每秒16幀。最終將109小時的視頻數據集處理成6270467個標準化幀。

動作分析

進行這種分析,有助於對Autoblow AI的編程方式有一個基本的瞭解。Autoblow AI有十種模式,每種模式代表一系列動作。

動作的不同只是上或者下運動的速度的不同。瞭解這些之後,對性產品的優化非常有幫助,因爲速度的不同可以由爲電機控制。

兩個到三個不同的動作連續釋放也可以創造複雜的動作模式。下面的圖表描述了基於三動作模式的分析。

可以清楚地看到運動具有周期性。也可以看到隨着時間變化動作的狀態,包括停頓和中斷。基於上千個這樣的片段,然後就可以建立機器學習模型從而識別出“常見”或“典型”的動作。

接下來,是驗證時間。

K均值聚類算法

研究者開始了對K-均值算法的研究,也就是Lloyd’s算法。這個算法雖然有很多缺點,但是它運行速度也很快。

將每個視頻分割成一秒的窗口,每個窗口的位置順序給出一組16維向量。然後用K-均值找到16個聚類。產生的結果和每個集羣的100個樣本如下所示:


爲了進一步驗證假設,研究者使用了一種最近發展起來的數據降維技術,即UMA。可以使使數據在2維空間和3維空間中可視化。

注意類別5和2的數據,它們分別代表頂部和底部附近的小活動點,這些小活動位於相對的“點”。另外類別1和5(它們都代表頂部附近的動作)彼此相鄰。在每一端的“點”之間也有一條密集的線,這條線似乎貫穿所有代表低強度動作(5,1,12,7,3,13,2)的數據點。

可以花很多時間來分析這個圖表,目前,這些驗證足以讓我們相信數據之間呈現某種趨勢。因此可以使用這些數據建立更加複雜的動作模型。

程序生成

如上所述,一個完整的模式是從一系列的動作中創建的。研究者確定了在一秒鐘內發生的典型動作。

因此,下一步是找到共同的運動順序。

這個問題與自然語言問題的處理有很多相似之處,例如“你猜下一個詞是什麼意思”。下面的漫畫最能說明這個問題。

因此,可以使用類似的技術。

首先建立一個基於馬爾可夫鏈的簡單模型作爲基線。然後,研究者設計了一個深度學習模型作爲替代方案,並對這兩種模式進行了定量比較.

馬爾可夫鏈模型

馬爾可夫鏈背後的原理很簡單:假設下一步要去的地方只取決於我們在哪裏,而不是我們去過的地方。例如,假設我們剛剛做了運動,在此基礎上,我們知道我們再次做這個運動的概率是50%,接下來我們做另一個動作的概率是30%,第三個動作的概率是15%,等等。然後,我們可以根據這些概率生成一個“唯一”序列,方法是根據概率隨機選擇下一個動作。

因此,採用此模型,需要計算一種模式由另一種模式引起的頻率,驗證概率與直覺是否一致。然後利用這些概率來生成唯一的序列,並使用簡單的移動平均進行平滑處理。結果如下:

馬爾可夫模型有自身的侷限性,它的侷限性也正是由於它的假設引起的。馬爾可夫模型下的假設是,下一狀態概率僅取決於當前狀態。事實上,這個假設並不是非常靈活。

另一個問題是,簡單的馬爾科夫鏈模型需要了解前幾個狀態的“最優”數來執行預測。這往往與現實不想符。如果最後3個狀態是A,B和C,也許在此之前發生的事情並不重要;但是如果它們是X,Y和Z然而情況就會不一樣。

Dense Neural Network (DNN) Model

在這一部分中,設計了一種基於先前狀態預測下一個狀態的DNN結構。

使用一個簡單的兩層體系結構,把最後最後16個狀態輸入進去,輸出範圍在在0到1之間,共有16個概率發生。這些概率意味着下一個狀態發生的機率。

所有狀態都是獨熱編碼,用零矢量表示“缺失”狀態(例如,在視頻開始之前)。通過縱向連接先前的狀態向量來創建輸入。在此項目中只訓練80%的數據,因爲剩下的20%數據要用於測試與比較。另外,使用交叉熵作爲損失函數。

模型的性能取決於如何分割訓練數據和測試數據;爲了處理隨機誤差帶來的影響,需要重複10次及更多次的實驗,每次使用不同的隨機種子來分割訓練數據。這對於分析和比較是很重要的。

下面,研究者定性地說明了該模型從隨機噪聲產生的一個序列:

  DNN Sequence

模型比較

定性地說,DNN模型魯棒性更好,因爲它被鎖定在單一狀態的可能性要小得多。

然而,通常,對於預測來說,首先要考慮的是準確性。

比較:如果選擇概率最高的下一個狀態作爲“預測”,那麼馬爾可夫模型的分類精度是多少?如果當前狀態的最高概率是(P_S),那麼當前狀態爲(S)時,平均精度顯然也是(P_S)。然後,通過乘以該狀態出現的頻率(F_S)並對所有狀態進行求和,得到總精度;或者,簡潔地:[sum_{s=1}^{16}p_s *f_s]

這給出的準確率約爲58.08%,略低於神經網絡的平均精度,但還不能確定其中一個優於另一個。

然而,在這種情況下,分類的準確性是一個誤導性的指標。實際上不是在構建真正的分類器,而是一個序列生成器。不期望以前的16個狀態能唯一地識別每一個“下一個狀態”,所以不期望很高的精確度。

在這個問題中,假設是:錯誤的方式都相同。這與實際目標不相符。因此,必須使用一個引入“相對錯誤”的度量。

引入“相對錯誤”之後,對模型的比較有非常大的幫助。例如,你在試着預測是否下雨。如果你說你百分之百肯定明天會下雨,如果沒有,那麼是你預測錯了。如果你說你80%肯定明天會下雨,但你還是錯了;但你沒有完全肯定地說錯,因爲至少你考慮到了你可能錯了。從某種意義上說,你只錯了80%。

用同樣的框架和前面的假設爲馬爾可夫模型計算這個度量。如果給定當前狀態(S)下一個狀態(I)的概率爲(p_{is}),那麼當前狀態爲(S)時選擇該狀態時的錯誤是(2*(1-p_{is})).如果(n_{is})是狀態(I)跟隨狀態(S)的次數,那麼,所有當前和下一個狀態的總錯誤顯然是:

[ 2 * rac{sum_{s=1}^{16} sum_{i=1}^{16} n_{is} * (1 - p_{is})}{sum_{s=1}^{16} sum_{i=1}^{16} n_{is}} ]

使用本文所使用的數據,計算所得爲1.126。換句話說,平均而言,馬爾可夫模型在所有類別中都有7.6個百分點的錯誤。

這看起來並不是很多,但它仍然是一個改進。因此,DNN模型有更少的錯誤率。

具體而言,由於DNN模型中的分類精度和平均絕對誤差都是優越的,可以有把握地說它是一個更棒的模型。

未來的研究

最後,在繼續改進Autoblow AI和性玩具的背景下,討論使用相同數據集進行的未來研究。

第一:可以改進程序生成。簡單的DNN架構的替代方案包括循環神經網絡,卷積神經網絡和生成對抗網絡。打算研究更復雜的技術來改善序列的真實性。但是,這些需要與物理硬件的限制相平衡。

第二:研究者認爲類似的分析可以適用於其他情色行爲。

第三:希望將研究擴展到圖像識別和視頻分類。現在已經有了一種模型,可以用於識別靜止幀中是否存在口情色行爲,並且正在研究更復雜的視頻分析問題。接下來的研究重點可以放到將性玩具與看不見的色情內容同步方面。

我們期待着繼續探索這個未知又神祕的空間。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章