人扮AI？拒絕假數據，從源頭開始！

原創

一隻技術怪

2020-02-21 13:14

近日，各媒體爭相競傳一條消息，智能助手Duplex，是人扮AI。前段時間谷歌智能助手Duplex的發佈會上，Duplex能模仿人類打預約電話，甚至還會發出人類慣用的語氣詞，接電話的店員甚至沒有意識到，電話的另一端根本就不是真人。

然而，你可能沒注意到的是，當開發者們共同致力於讓AI變得更像人時，有些創業公司卻打起來了另外的算盤：讓人冒充AI。

谷歌CEO介紹Duplex | Google

對於這些公司來說，這一招既可以省下大量的研發費用，還可以忽悠到投資。正如ReadMe公司的CEO格雷戈裏·科貝格（Gregory Koberger）所說的那樣，“把活兒交給真人，能讓你跳過大量技術和業務發展方面的挑戰。”

他在推特上吐槽道：“如何建立一家AI創業公司？

僱傭大量廉價勞動力假扮成假扮人類的AI。

等着AI被髮明出來。”

這種做法已經是業界周知的祕密了，但是大部分消費者還矇在鼓裏。

創業第一步——假裝有AI

前不久，據《華爾街日報》報道，谷歌允許大量第三方應用的開發者讀取Gmail用戶的郵件。在被曝光的第三方公司中，聖何塞的艾迪森軟件公司（Edison Software）就在用假的AI。他們的AI工程師會瀏覽用戶的個人郵件，來改善所謂的“智能回覆”功能。不過，他們的隱私政策並未提及人類會看到用戶的郵件。

其實，早在2008年，就有一家名爲Spinvox的公司作假了。他們號稱能將語音留言轉化爲文字，結果被指控這些工作都是海外電話中心的人工來完成的。

2016年，據彭博社報道，在X .ai和Clara這樣的日程應用公司，人類員工每天都要花12小時假扮AI聊天機器人。這項工作太令人頭腦發麻了，以至於員工們說他們期待機器人能真正取代人類。

2017年，業務支出管理應用Expensify承認，他們通過人工轉寫收據，而不像對外聲稱的那樣用“智能掃描技術”。掃描過的收據會被髮布到亞馬遜的勞力衆包平臺Mechanical Turk上，然後接受低薪的人來閱讀和轉寫這些收據。

人工並不便宜

在某些情況下，人類被用於訓練AI系統，來提升AI的精確度。例如，名叫Scale的公司用大量的人類工作者，向自動駕駛系統和其他AI系統提供訓練數據。此外，谷歌的Duplex也用到了人類訓練者。

M聊天界面 | Facebook

Facebook曾在2015年推出虛擬助手M的測試版。M能預約和提供禮物建議等，只不過，它也是由人工協助的。當時我們用不到它，因爲它只對舊金山灣區的1萬人開放，而現在，Facebook徹底關閉了這一項目。雖然我們用不上它了，Facebook表示M的特性將會保留在聊天應用Messenger裏。

這種人工協助AI的出發點其實是好的，AI系統會在人類的協助下學會應答各種指令，最終變得更加智能。然而，它的代價還是有點大。

首先，Facebook需要大量昂貴的勞動力，因此將服務擴大不太可行。

其次，當M完成一項任務時，用戶總是會提出更難完成的要求。就這樣，M要達到的自動化程度遠遠超過了當前的機器學習技術。

AI技術應該更加透明

心理學家艾莉森·達西（Alison Darcy）表示，“作爲心理學家，我們有倫理準則作爲指導。其中，不去欺騙人們就是非常明確的一項。”

Woebot可以提供心理方面的支持 | Woebot

研究表明，當人們認爲自己在和機器而非人類交談時，他們更願意袒露心聲，這是因爲精神衛生方面的求助常常和污名化聯繫起來。南加州大學的研究團隊用虛擬心理諮詢師Ellie測試了這一研究。他們發現，當患有PTSD的退伍軍人知道Ellie是AI，而不是人類操作的機器時，他們更有可能坦誠講述自己的症狀。

另外一些人認爲，公司們應該一直公開自己的服務是如何運行的。

“我不喜歡人們假裝成AI。”羅謝爾·拉普蘭（Rochelle LaPlante）說，他爲很多提供假AI服務的公司工作過。

“對於我來說，這不太誠實，而且有欺騙的意味。我希望自己正在使用的東西不是這樣的。而從工作者的角度來看，這就像是我們被推到了幕後。我不希望我提供勞動的公司轉變態度，而且向客戶隱瞞真相。”

這樣的道德困境也出現在試圖讓AI更像人類的項目中，例如谷歌的Duplex。該項目在最初演示的時候，AI 並沒有向打電話的對象表明身份。Duplex立刻引發了爭議，人們擔心這種略帶欺騙性的技術會被有心之人利用。

“人們對AI已經有很多主要的擔憂了，而缺乏透明並不能幫助我們解決問題。”達西說。

其實，人造數據的假象，也是層出不窮，我們要學會從源頭解決這個問題。

比如，如何解決渠道統計數據刷量作弊的現象！針對這項問題，做渠道統計的APP推廣公司shareinstall推出了以渠道鏈接取代渠道包的方法，精確定位APP的各個安裝渠道，並且精確度是100%。

大致原理如下：

開發者在分享的h5頁面上集成shareinstall web sdk，發佈分享鏈接時在url上動態的拼接任意的自定義參數（如推廣渠道號，邀請碼，遊戲房間號等等）；當某一終端訪問該h5頁面時，shareinstall web sdk將同時確定該設備的個性化信息和採集自定義參數，上傳至shareinstall服務器，待用戶通過該h5頁面安裝app後首次打開時（如當前設備已安裝該app，將直接拉起app），使用shareinstall Android/iOS sdk從shareinstall服務器再取回暫存的自定義參數。開發者根據各自的需求，在分享鏈接自定義各種動態參數。比如通過在分享鏈接url中附帶app邀請人的用戶id，就可達到免填邀請碼的效果。對戰類遊戲app通過在url中附帶遊戲房間號，新老用戶都可通過該url鏈接直接進入邀請人的對戰房間，更多使用場景均取決於開發者的需求。

只需要在開始植入SDK，後面的整個渠道統計過程都是自動的，沒有人爲插手的可能，完全規避了數據刷量作弊的現象。只有精準的數據反饋，才能便於移動開發者針對運營情況，對下一步的產品開發或升級優化做出合理的預估和決策。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

人扮AI？拒絕假數據，從源頭開始！

探究職業發展的關鍵：能力模型解讀

如何在低代碼平臺中引用 JavaScript ？

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

Shareinstall一個渠道鏈接可取代100個渠道包！

App個性化安裝——程序第三方安裝的新舞臺！

App推廣技術要點：shareinstall個性化安裝和營銷效果統計淺談！

APP推廣好壞衡量標準：用戶留存度該怎麼提高？

關於多渠道打包的那些事兒~

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結