人扮AI?拒絕假數據,從源頭開始!

近日,各媒體爭相競傳一條消息,智能助手Duplex,是人扮AI。前段時間谷歌智能助手Duplex的發佈會上,Duplex能模仿人類打預約電話,甚至還會發出人類慣用的語氣詞,接電話的店員甚至沒有意識到,電話的另一端根本就不是真人。

然而,你可能沒注意到的是,當開發者們共同致力於讓AI變得更像人時,有些創業公司卻打起來了另外的算盤:讓人冒充AI。

人扮AI?拒絕假數據,從源頭開始!
谷歌CEO介紹Duplex | Google

對於這些公司來說,這一招既可以省下大量的研發費用,還可以忽悠到投資。正如ReadMe公司的CEO格雷戈裏·科貝格(Gregory Koberger)所說的那樣,“把活兒交給真人,能讓你跳過大量技術和業務發展方面的挑戰。”

人扮AI?拒絕假數據,從源頭開始!
他在推特上吐槽道:“如何建立一家AI創業公司?

僱傭大量廉價勞動力假扮成假扮人類的AI。

等着AI被髮明出來。”

這種做法已經是業界周知的祕密了,但是大部分消費者還矇在鼓裏。

創業第一步——假裝有AI

前不久,據《華爾街日報》報道,谷歌允許大量第三方應用的開發者讀取Gmail用戶的郵件。在被曝光的第三方公司中,聖何塞的艾迪森軟件公司(Edison Software)就在用假的AI。他們的AI工程師會瀏覽用戶的個人郵件,來改善所謂的“智能回覆”功能。不過,他們的隱私政策並未提及人類會看到用戶的郵件。
人扮AI?拒絕假數據,從源頭開始!
其實,早在2008年,就有一家名爲Spinvox的公司作假了。他們號稱能將語音留言轉化爲文字,結果被指控這些工作都是海外電話中心的人工來完成的。

2016年,據彭博社報道,在X .ai和Clara這樣的日程應用公司,人類員工每天都要花12小時假扮AI聊天機器人。這項工作太令人頭腦發麻了,以至於員工們說他們期待機器人能真正取代人類。

2017年,業務支出管理應用Expensify承認,他們通過人工轉寫收據,而不像對外聲稱的那樣用“智能掃描技術”。掃描過的收據會被髮布到亞馬遜的勞力衆包平臺Mechanical Turk上,然後接受低薪的人來閱讀和轉寫這些收據。

人工並不便宜

在某些情況下,人類被用於訓練AI系統,來提升AI的精確度。例如,名叫Scale的公司用大量的人類工作者,向自動駕駛系統和其他AI系統提供訓練數據。此外,谷歌的Duplex也用到了人類訓練者。
人扮AI?拒絕假數據,從源頭開始!
M聊天界面 | Facebook

Facebook曾在2015年推出虛擬助手M的測試版。M能預約和提供禮物建議等,只不過,它也是由人工協助的。當時我們用不到它,因爲它只對舊金山灣區的1萬人開放,而現在,Facebook徹底關閉了這一項目。雖然我們用不上它了,Facebook表示M的特性將會保留在聊天應用Messenger裏。

這種人工協助AI的出發點其實是好的,AI系統會在人類的協助下學會應答各種指令,最終變得更加智能。然而,它的代價還是有點大。

人扮AI?拒絕假數據,從源頭開始!

首先,Facebook需要大量昂貴的勞動力,因此將服務擴大不太可行。

其次,當M完成一項任務時,用戶總是會提出更難完成的要求。就這樣,M要達到的自動化程度遠遠超過了當前的機器學習技術。

AI技術應該更加透明

心理學家艾莉森·達西(Alison Darcy)表示,“作爲心理學家,我們有倫理準則作爲指導。其中,不去欺騙人們就是非常明確的一項。”
人扮AI?拒絕假數據,從源頭開始!

Woebot可以提供心理方面的支持 | Woebot

研究表明,當人們認爲自己在和機器而非人類交談時,他們更願意袒露心聲,這是因爲精神衛生方面的求助常常和污名化聯繫起來。南加州大學的研究團隊用虛擬心理諮詢師Ellie測試了這一研究。他們發現,當患有PTSD的退伍軍人知道Ellie是AI,而不是人類操作的機器時,他們更有可能坦誠講述自己的症狀。

另外一些人認爲,公司們應該一直公開自己的服務是如何運行的。

“我不喜歡人們假裝成AI。”羅謝爾·拉普蘭(Rochelle LaPlante)說,他爲很多提供假AI服務的公司工作過。
人扮AI?拒絕假數據,從源頭開始!
“對於我來說,這不太誠實,而且有欺騙的意味。我希望自己正在使用的東西不是這樣的。而從工作者的角度來看,這就像是我們被推到了幕後。我不希望我提供勞動的公司轉變態度,而且向客戶隱瞞真相。”

這樣的道德困境也出現在試圖讓AI更像人類的項目中,例如谷歌的Duplex。該項目在最初演示的時候,AI 並沒有向打電話的對象表明身份。Duplex立刻引發了爭議,人們擔心這種略帶欺騙性的技術會被有心之人利用。

“人們對AI已經有很多主要的擔憂了,而缺乏透明並不能幫助我們解決問題。”達西說。

其實,人造數據的假象,也是層出不窮,我們要學會從源頭解決這個問題。

比如,如何解決渠道統計數據刷量作弊的現象!針對這項問題,做渠道統計的APP推廣公司shareinstall推出了以渠道鏈接取代渠道包的方法,精確定位APP的各個安裝渠道,並且精確度是100%。

大致原理如下:

開發者在分享的h5頁面上集成shareinstall web sdk,發佈分享鏈接時在url上動態的拼接任意的自定義參數(如推廣渠道號,邀請碼,遊戲房間號等等); 當某一終端訪問該h5頁面時,shareinstall web sdk將同時確定該設備的個性化信息和採集自定義參數,上傳至shareinstall服務器, 待用戶通過該h5頁面安裝app後首次打開時(如當前設備已安裝該app,將直接拉起app),使用shareinstall Android/iOS sdk從shareinstall服務器再取回暫存的自定義參數。 開發者根據各自的需求,在分享鏈接自定義各種動態參數。比如通過在分享鏈接url中附帶app邀請人的用戶id,就可達到免填邀請碼的效果。對戰類遊戲app通過在url中附帶遊戲房間號,新老用戶都可通過該url鏈接直接進入邀請人的對戰房間,更多使用場景均取決於開發者的需求。

只需要在開始植入SDK,後面的整個渠道統計過程都是自動的,沒有人爲插手的可能,完全規避了數據刷量作弊的現象。只有精準的數據反饋,才能便於移動開發者針對運營情況,對下一步的產品開發或升級優化做出合理的預估和決策。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章