智源研究院學術副院長唐傑:數據在開放共享的同時,隱私保護機制也要並舉

10 月 31 日,由北京智源人工智能研究院主辦的 2019 北京智源大會在國家會議中心開幕,會期兩天。智源大會是北京創建全球人工智能學術和創新最優生態的標誌性學術活動,定位於“內行的 AI 盛會”。 爲推動行業數據開放共享,支撐人工智能基礎研究與關鍵技術研發,大會現場,北京智源人工智能研究院宣佈成立數據開放研究中心。該中心旨在制定數據開放標準,研究數據開放核心技術,搭建數據開放共享平臺。智源研究院學術副院長唐傑擔任數據開放研究中心主任。此次大會上,北京市科委主任許強、智源研究院院長黃鐵軍和數據開放研究中心主任唐傑共同爲研究中心揭牌。 大會現場,數據開放研究中心主任唐傑接受了InfoQ等少數媒體的採訪,唐傑就數據開放研究中心的情況做了詳細介紹,並就數據安全、AI發展現狀等熱門話題發表了自己的看法。

推動數據開放共享

據唐傑介紹,數據開放研究中心大概從今年6、7月份開始策劃,“最早北京人工智能研究院主要想做幾件事:第一是智源學者;第二是聯合實驗室,第三是社區,總的來講,我們是希望智源成爲一個平臺性的組織,上面有學者、聯合實驗室、有各種社區。”

在實際推進過程中,聯合實驗室推進較慢,因爲像這樣重量級的項目一般都需要經過多次論證,到現在,智源才論證成立了京東、曠視兩個聯合實驗室,未來這十個聯合實驗室仍需要很長時間建設,即便在並行操作的情況下。

因此,智源的專家們就在思考:是否能夠打造一個數據平臺?在這個數據平臺上能夠支持更加廣泛的、容易的、輕量級的共享,且能在上面建立出面向學者和企業級的任務型競賽。這樣就可以加快迭代,否則依託這種聯合實驗室來做相對比較慢,而且聯合實驗室一發布出來後,有些公司還會有顧慮比如對競爭對手的考量。這是數據開放共享研究中心設立的原因之一。

唐傑表示,另外一個很重要的原因是,如何做數據脫敏、數據隱私、如何讓數據更安全是數據開放中非常重要的研究內容。

據InfoQ瞭解,數據開放研究中心的具體工作內容包括以下幾個方面:

開放標準:制定數據開放和共享系列標準,包括人工智能數據開放許可協議、人工智能數據資源開放管理規範等。

關鍵技術:研究隱私數據泄露風險模型;按照數據使用場景,研究相應的數據開放技術。

開放數據集:創建行業關鍵數據集,通過自動抓取、標註、與外部單位合作等方式,構建一批高質量的數據集。

共享平臺:搭建數據開放共享平臺,提供數據開放與共享服務,推動人工智能行業發展。

談到數據安全、隱私問題,唐傑表示,從研究的角度講,數據脫敏、數字隱私保護是一個“矛和盾”、“盾和矛”的問題,因爲你在這裏想辦法怎麼將數據保護起來,但總會有人想辦法攻擊進來,這兩個方面是不停的在發展,可能有的階段是“道高一尺”,有的階段是“魔高一丈”。

目前解決的辦法主要有幾種,一種是加密共享技術,可以將數據用私鑰加密後再進行共享,接下來在加密數據上構建模型。一種是聯邦學習,聯邦學習並不分享數據,而是分享模型,在在模型層面上做共享,這個時候數據沒有開放出來。

採訪中,唐傑表示,近期AI技術在逐漸朝着實用性發展,如時下熱度頗高的安防、交通、醫療等都是AI非常重要的應用領域。

談到現在比較火的自動駕駛,唐傑對其發展前景表示樂觀,“我認爲在未來有限的時間裏是可以實現的“。他表示,自動駕駛技術發展越來越快,幾乎每年都有很大的變化,在國內的特定領域,自動駕駛已經成型。未來隨着技術的發展,它是一定可以實現的,但這個實現需要政府、民衆等各方的努力,此外,有必要花一些時間消除人們對於自動駕駛的恐懼,很多人認爲自動駕駛危險性很高,其實無人駕駛可能人駕駛還更安全一些。“我個人樂觀估計,希望能夠在未來六到九年實現,希望我的預言成真”。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章