阿里巴巴高級算法專家威視:組建技術團隊的一些思考

因爲信任,所以簡單。

本文是我從2019年1月底接手CRO線NLP算法團隊以來,在團隊組建、能力建設、以及管理上的一些思考,全部是沒有科學論證的主觀判斷,不過都進行了實踐。我沒有任何管理學背景知識,把拙見沒羞沒臊地寫出來,是爲了拋磚引玉,和同學們交流討論。

團隊的定位是什麼?——做正確的事

定位

團隊的定位是重要的事情之一,有了偏差,後續做得越多錯得越多。確定團隊的定位花了我很長時間,中間還發生了一次組織變化,和兩任主管有多次討論。

首先,這個團隊配置在CRO線,肯定要爲風險管理業務服務;同時,這又是一支能力團隊,還要考慮和業務團隊的協同關係。最終,我確定了3點:

1、能力建設爲主,同時也需要有業務抓手;

2、不做業務團隊已經做得好的事情;

3、立志高遠,勇攀高峯,要做就做到最好。

壁壘與價值

不誇張地說,現在是NLP領域的大航海時代,新算法層出不窮,日新月異,後浪各種把前浪碾死在沙灘上。尤其是 BERT 橫空出世之後,整個 NLP 的研究範式都發生了變化,從原來的 task-specific 的模型結構設計轉變到語言模型 pretrain+ 下游任務 finetuning 的模式,預訓練模型是含金量高的工作。研究一下預訓練模型,你會發現這是個需要海量金錢+數據+技術才能玩的遊戲。

這就陷入兩難:如果搞預訓練模型,沒那麼多資源;如果不搞,用開源模型做下游任務,實際上很難有什麼技術壁壘。其實就算你真的搞出什麼新算法可以充當技術壁壘,可能兩三個月之後就又有人做出了更強的結果。

困境的根源在於,目前 NLP 算法這個領域發展速度太快了,在高速變化的領域是很難形成壁壘的。所以,我們需要結合自身所處的環境,尋找變化不那麼快的東西。

我經過好多天的考慮之後,認爲沉澱風險管控知識可以作爲壁壘。原因:1)風險知識隨時間有變化,但速度明顯比算法慢很多;2)CRO 線在這方面有一定積累,也需要用於實際業務管控,並沉澱到產品。

所以,團隊的宗旨我定義爲:基於知識驅動的 NLP 算法團隊。爲 CRO 線乃至集團沉澱風險知識,並提供不同層次的服務:

圖-4層服務體系

最近,CRO 線在清華舉辦了 AI 與安全研討會,會上張鈸院士談到了第三代人工智能,尤其強調了其中知識的核心作用;我們走訪中科院信工所,對方的宗旨也是建設基於知識驅動的算法,和業界發生的共鳴,更堅定了我們走這條道路的決心和信心。

團隊需要什麼能力?

先要搞清楚團隊所處的環境。

阿里是一個什麼結構的組織?

有人說是矩陣式的,有人說是樹+網狀的,我不知道確切的答案。不過,如果把每個小團隊看作節點的話,有 2 點是確定的:

1、體量巨大,各種節點(業務、產品、工程、算法)種類繁多數量大。

2、單元節點之間比較容易發生跨大團隊甚至跨 BU 的聯繫,條件合適可以發生協同關係。

繼續觀察,你會發現:

1、你所需要的一切資源幾乎都能找到提供者,而且往往不止一個。

2、你也可以給各種需求節點提供服務,只要還在你的能力範圍內。

3、由於規模巨大,需求節點和資源節點相互之間往往不知道對方在哪。

基於以上,我認爲一個身處中臺的算法團隊,需要具備 4 項能力:連接-生產-傳播-服務。

圖-能力中臺的算法團隊需要具備的能力

四項能力

連接

就是尋找到自己所需要的資源,篩選出其中最優的,建立長期穩定的合作關係。比如算法團隊需要的爬蟲、標註工具、分佈式模型訓練工具、模型的評測工具等,都能在公司範圍內獲取,就沒必要刀耕火種從頭開始自己建設了。

生產

這是傳統意義上算法工程師的工作,指獲取數據後產出效果和效率達標的算法模型,並上線。

對算法的要求,主管的主管早有論述:算法要全!算法要強!算法要快!算法要便宜!精煉簡潔,振聾發聵,細化一下就有:

圖-對算法的要求

傳播

針對中臺的算法團隊提的要求,因爲你需要讓目標業務節點知道你的存在,知道你的能力項,以及細節。ATA 是個不錯的對內傳播途徑,之前在 CV 團隊時,很多業務方是通過 ATA 找到我的。

服務

如果是專屬某業務的算法團隊,只需要考慮該業務下的 SLA 即可;如果是中臺的算法團隊,還需要考慮如何滿足不同業務節點的需求,同時又不至於做開發和維護成本很高的個性化定製,避免隨着接入業務的增長各種資源的開銷也隨着線性增長。

能力雷達圖

團隊的能力雷達圖是由成員的個人能力長板組成的。(話越短意思越長)

圖-團隊能力雷達圖

組織與個人的關係

爲什麼需要一個組織呢?

先從一個現象出發:在小區業主和物業公司的糾紛鬥爭中,業主獲勝的概率很低。從人數、個體的教育背景和素質來看,業主都佔據絕對優勢,可是爲什麼會輸?

粗略分析,大體有三個原因:

1、共同利益,目標明確。物業的目標非常清晰,就是爲了從業主那裏賺錢,這也是物業人員的共同利益。業主人多,情況各有不同,各自的利益訴求差異大,容易被分化。

2、組織嚴密,相互協同。物業內部有明確的分工,平時也長期一起工作,相互間有信任感,能夠進行配合。業主彼此之間往往是陌生人,缺乏信任感,難以統一行動,是原子化的散點。

3、局部相對優勢。相對單個業主,物業具有明顯力量優勢。比如,物業有資金,而業主因爲缺乏信任很難籌措資金。

好,看出來了,小規模組織的力量可以超過大規模原子化散點存在的個體集合的力量。

組織爲個人提供什麼?

1、組織能使資源增效組織能把各種資源組合成有機的整體,使各種分散的力量形成合力,從而產生大於這些資源和力量機械總和的效能。這個原理 2000 多年前亞里斯多德就論述過了,後來馬克思又更嚴密地論述過一次。

2、組織是實現目標的依託

個人可以依託組織的能力和資源去做事,而組織的能力和資源遠大於個人,所以依託組織的時候,個人能夠實現比單打獨鬥模式大得多的目標。

舉個例子,我們團隊做了 UGC 場景效果超越開源模型的預訓練模型,每個同學都可以在這個預訓練模型的基礎上去做下游的有監督學習任務,起點就比別人高。

個人爲組織提供什麼?

是否有短板不是那麼重要,關鍵是要有長板,能夠對組織的能力雷達圖做貢獻。

這一節留一個思考題:公司設置主管這個職位的目的是什麼?是爲了像幼兒園阿姨那樣,保障每一個小朋友都有自己喜歡的玩具,高高興興上學來,平平安安回家去?

招聘團隊需要的人才

招聘爲什麼特別重要?

世界有個普遍規律:在前序階段做嚴格的控制會大大降低後序階段的實現難度,比如數據標註、寫代碼、模型中的預處理等等。人招進來之後是要用要管的,招聘的時候高標準嚴要求,後續管理會輕鬆很多;如果降低標準甚至放水,後續管理付出的代價遠遠高於招聘時偷懶省的功夫。

所以,我花了至少 1/3 的時間在招聘上。對的,至少 1/3 ,你沒有看錯。從 2019 年 2 月到現在,社招弄了 300+ 份簡歷;校招 100+ 份簡歷。在這裏特別要感謝團隊裏球夫、天逸、開陽3位同學,犧牲了大量業餘時間做簡歷評估和初面。從統計數據看,每 100 份簡歷產生 2-3 個offer,入職 1-2 個人。從 100 份簡歷中招來的人絕對比 10 份簡歷中招來的省心很多。

我給算法團隊找來過不少人,both 社招 and 校招,具體的展開討論見彩蛋部分的【招聘】。

招聘要考察哪些能力?

招聘,首先要確定 job model 。限於篇幅,這裏只討論“生產”環節所需要的能力。所處的時代背景:快速變化,新算法層出不窮。

不變的是什麼:數學基礎、計算機基礎、動手能力。

我們很難預測新技術的具體實現,但是當新技術出現的時候,需要能夠快速地分析、學習、掌握。而且,我們經常要解決從來沒有遇到過的新問題,這就要求候選人在面對沒見過的問題時具備分析判斷,在具體約束條件下找完整解決方案的能力。另外,在複雜的業務場景裏,問題經常沒有確定性的答案,我們往往通過對過程的合理性來判斷整個方案是否合乎要求。尋找答案的過程很少有一帆風順的,大概率會遭遇挫折,非常需要候選人不斷嘗試不斷修正去抵達終點。

至於教育背景、之前從業經歷,反而不怎麼重要。我不贊成對於畢業好幾年的社招候選人還要參考畢業學校、最高學位,甚至本科學校是否 985 ——如果一個人能力強,是不需要靠學校學位來旁證的,直接用行動證明就行了。

對於候選人的考察,我往往從基礎的硬技能、創新性/開放性思維、精神素質三方面考察。

硬技能

數學:概率論與數理統計、矩陣論、隨機過程。

計算機基礎:操作系統、組成原理、數據結構。

算法能力:領域內主流模型的演進,優缺點對比;在具體設定的場景下選擇合適的方案。動手:C++/python/Java (什麼?你說matlab?工業界裏這個不算編程語言)。

有人說,面試過程中要求做代碼測試,就像相親時要求看存款證明一樣殘暴。我贊同這個說法,因爲不少候選人聽到要寫代碼就高傲地拒絕了。我給大家推薦一個在線代碼測試工具:http://collabedit.com

從我長期的觀察情況看,發展得好的算法同學,動手能力都比較強。畢竟,算法工程師,首先是一個工程師。

創新性/開放性思維

其實我還經常幹比代碼測試更令人髮指的事情——做智力題。這個不是我的創新,是跟 Google 等公司學來的,而且是直接找網上流傳的面試題換個馬甲來用。

前面的硬技能,看的往往是結果;這裏對思考能力的考察,看的是過程:是否有方法論,思路是否清晰,是否言之有據。所以,這種問題的面試方式往往是討論式。

如果候選人能夠完成,最後再請TA做個總結,觀察歸納要點的能力,視線的高度。

有些候選人結束面試後仍然會繼續思考,給出更好的回答。

精神素質

公司對人才的要求是:樂觀、皮實、聰明、自省。

你看,四個詞裏面有兩個都在強調堅韌不拔。在面試過程中,我會看候選人在解題不順時的表現,有時甚至故意小刺激一下觀察候選人的反應,偶爾還會故意中途改變限制條件。阿里內部競爭激烈,經常需要擁抱變化,如果心理承受力脆弱,是不適合當同路人的。

還有一點很重要:自我驅動力。這是從降低對內管理成本來要求的,後面會具體說。

在我看來,硬技能、創新性/開放性思維和精神素質缺一不可。即使這三方面我都滿意了,如果主管,主管的主管, HR 對候選人明確提出疑慮,我一般不申辯直接放棄掉。因爲,他們比我 level 高,閱人無數,往往不會錯。

有的同學會問:這樣子做,會不會錯失優秀人才?是的,我的方式幾乎可以確保招進來的同學肯定是好的,但會漏掉一些優秀的候選人,不過這不會造成嚴重的後果。相比之下,招進來不合格的人纔會有大麻煩。

用人

主管的角色是什麼?

以前有句話,叫做“火車跑得快,全靠車頭帶”,這說的是前動車時代。動車和高鐵爲什麼比傳統的火車速度更快?根本原因是:大多數車廂都能提供動力。

同樣的,如果一個團隊完全靠主管來驅動,來提供動力,主管很容易成爲團隊的瓶頸。我的團隊成員,很多都是自己領域的高手,專業能力在我之上,我就應該順應實際情況,不要拿自己的愚見去束縛同學們的發揮。因此,我的角色更多的是眺望遠方,掌握方向盤,有時踩一下剎車;團隊大多數同學一起構成動力引擎。

圖-動車/高鐵跑得快,是因爲大多數車廂都提供動力

對內管理模式

一個不恰當的比喻:放羊。

這麼做,堂而皇之的理由是“因爲信任,所以簡單”。技術層面的原因,對算法類同學做過程管理性價比太低。

算法類工作,創造性在其中佔據重要地位,而創造性很難在過程中量化度量,也很難從外部觀測現象來判斷。比如:身邊的同學坐在工位直視屏幕目不轉睛,我不知道他到底是在思考論文中的公式還是在回味昨天晚上看的電影。再比如,我base在杭州,沒辦法知道團隊內base北京的同學是不是在工作時間打遊戲。

所以,我選擇信任我的同學,只在一些必須監管的事項上把關,比如數據安全、安全生產等,其他事項一般不做過程管理,只做結果管理。得益於招聘時把關嚴格,絕大多數同學的自我驅動力都比較強,我並不用操心偷懶的事情;相反,偶爾需要操心一下少部分同學拼過了頭的問題。關於這一點,更多的內容見彩蛋中的【認真生活,快樂工作】。

肯定有同學問:上面說的是不擔心出工不出力,那麼,怎麼解釋出力的問題呢?你難道不指導同學做項目嗎?

我一般只給出項目的目標,有時給一個粗略的方案設想,有時不給。公司對於P6同學已經有“獨當一面拿結果” 的要求,大家都應該具備獨立作戰的能力。而且,按照前面說的,團隊內大部分同學都應該是提供動力的車廂,沒必要依賴我。人是否有自我意志?這個問題我不知道答案。但我知道,如果一個人認爲主意是自己想出來的,決定是自己做的,會更有動力去實現。嘗試做決策,嘗試完成不確定的任務,都有利於自己的成長。

思考題:管理有很多種style。有的主管喜歡自己做需求分析,然後拆解細化到原子級的技術問題,讓下屬做執行。這種模式,和“放羊”模式相比,從主管視角,以及下屬視角看,各有什麼優缺點?

綜合以上兩點,我覺得放羊是可行的。而且,放羊這件事,羊倌也是要做很多工作的:選擇合適的天氣,找到草地,把羊羣帶到草地,放哨保護羊羣,是不是?如果還要把青草割好餵給羊吃,那成什麼了?

羊倌應該把更多的精力花在尋找豐美的草地,購買強壯的羊,與其他羊倌交流這些事情上,要是成天忙於餵羊,督促偷懶的羊快點吃草,拉開打架的羊這些內部事務,羊羣怎麼發展壯大?更多的展開見彩蛋中的【因爲信任,所以簡單】。

鼓舞團隊信心,最好的方式是什麼?

痛痛快快地贏一次。如果不夠,就兩次。

接手團隊的時候,在商業化方向上局勢是很差的:去年三次PK競品都輸了,穩定性問題頻發以至於新版本都無法發佈……團隊好幾個人都撲在這一個陣地上乾得很苦但就是拿不到結果。

這個時候我要是去發表個類似《至暗時刻》裏丘吉爾那樣讓人熱血沸騰的演講是否可以解決問題?可能有短暫的強心劑作用,但是不長久,因爲實際困難沒解決。何況,我也肯定不具備丘吉爾的演說能力。最有用的辦法,還是分析失敗的原因,制定正確的打法,指導同學們獲得一次成功。鼓舞信心最好的方式還是靠實實在在的成功。

結果大家都看到了,今年我們PK競品的戰績是N:0,付費調用量上漲25倍以上。大家肯定好奇:正確的打法是什麼樣的呢?我放在後面《正確地做事》那一節講。

做有吸引力的事情

目標要定得高一些,有挑戰性,達成的時候內心的成就感會更高一些。這個很容易理解,就好比你打遊戲,虐了個菜,沒多少快感;如果能贏下之前屢戰屢敗的對手,一定會興奮很久。我跟部分同學說過,大家的眼光不要侷限在三號樓,也不要侷限在聚橙路,而是要放眼世界。

目標定得太低,不僅不能逼出自己的潛力,還容易讓自己關注於一些雞毛蒜皮的小問題。

前幾天,我的主管在一個項目 kick off 會上說,當你回首往事時,要有一件做過的事情能夠拿出來吹牛逼,人生纔有意義。深以爲然。

過程即享受

在阿里的工作肯定是辛苦的,我沒看到過誰能隨隨便便就成功。如果只是衝着收入來做工作,難免在過程中會感覺到很多痛苦。物質的刺激是短暫的,不管是加薪、年終獎,或者 option ,興奮高興個幾天就過去了。如果喜歡自己做的事情,專注於工作本身,從中源源不斷地獲得成就感,就能做到雖然辛苦但是不痛苦。我家做飯的阿姨是拆遷戶,坐擁 N 套房,每天仍然跑幾家做飯,我問她爲什麼?她說,以前是開蒼蠅館子的,拆遷後沒得開了,但是自己就是喜歡做飯。理想狀況下就是要招聘這種人。

採取什麼工作模式?——正確地做事

四個在線化

互聯網的本質是連接,最大價值也是連接。

這句話不知道是誰說的,第一次聽說是在《計算機網絡》課程上。互聯網連接的可以是人和人,人和文檔,人和數據,人和代碼,人和……和一切你工作中需要的東西。

接手團隊之後,我發現同學們的工作模式真的是自耕農一般:各做各的模型,各用各的數據,各讀各的 paper ,完全是原子化的散點存在。說得不客氣一點,除了聚餐的時候,平時感覺不到這是一個組織。也就是說,身處中國頂級互聯網公司,大家卻像農業社會時期一樣在進行生產,當着不折不扣的“碼農”。

團隊裏一個同學說得很好:相互間建立信任關係的最好辦法是發生工作上的協同。我覺得,要發生工作上的協同,前提就是把工作相關的資源都在線化,與組織成員發生連接,於是,我設想做4個在線化。

圖-文檔、數據、代碼、評測在線化

1、文檔在線化

春節期間我建了個團隊語雀,自己做頂層設計,寫好框架,然後讓同學們把業務、技術、資源、技術影響力等等和工作相關的內容都填寫其中。這樣子,每個同學都可以看到團隊的各種信息和資源,以及其他人的工作。目前團隊的語雀還對部分關聯緊密的兄弟團隊完全開放。

2、數據在線化

如果同學們各自管理自己的數據,形成數據孤島不說,發生機器重裝,或者轉崗、離職,往往數據就丟了。接手的時候,能清理出來的有標籤數據遠遠低於應有的數量,就是因爲一直沒有做數據的在線化管理。團隊裏的言奇同學做了樣本大表項目,已經完成了將整個智能認知團隊的全面標籤數據在線化。這一點非常重要,後續在開發各種新模型,以及做預訓練模型時,就擁有不同業務不同場景不同風險的大量數據,在短時間內取得了良好的效果。

3、代碼在線化

這個正在進行中,預期 S2 結束時完成,出發點是:

a.代碼是團隊重要的技術資產,應該統一管理,提高安全性。

b.在線化後方便團隊協作,共享優秀代碼

c.基礎性模塊代碼統一,降低維護成本

4、評測在線化

也在進行中,設想是在一些特定任務上做幾種經典模型和確認無誤的主流模型,能夠一鍵實現自己的模型和前者的自動化比對,提升工作效率。除此之外還有個作用:經典模型的結果可以作爲baseline,幫助驗證深度模型的正確性。因爲,你做了一個深度模型,效果好也就罷了,效果不好的時候都搞不清楚是模型不適用,還是自己的代碼寫錯了。

找對前進的方向

主管最重要的職責之一是當同學們迷茫的時候明確前進的方向。

接着前面商業化的例子,詳細情況是這樣的:我們通過阿里雲對外輸出文本風險識別的算法能力做商業化,比如涉政、色情低俗、廣告、辱罵等。我接手的時候,有 3-4 個同學全職投入這項工作,他們工作非常努力,幹得也很辛苦,但是效果並不好, PK 競品的時候並無勝算。出了什麼問題呢?

分析之後,我發現以下問題:

1、確實是一個內容維度的問題,但只使用了分類模型一種方式。

分類模型適合解決靜態標準的問題,並不適合及時響應業務上的快速變化。模型迭代更新的速度做到極限也只能是 T+1 或者 T+2 天,且人力消耗高。之前的主管爲了解決這個問題,在分類模型中塞了一個風險詞包,由算法同學維護更新,接到運營反饋的 badcase 之後手動添加到風險詞包,然後定時推送到分類模型應用中。這個複雜的機制帶來了詞典的頻繁構建,結果導致應用的穩定性問題頻發,甚至已經無法更新。

2、缺乏頂層設計,同學們各自爲戰。

幾個風險各自單獨做模型,技術選型高度自由,百花齊放,starspace、SVM、CRF、kenlm、textCNN 都有,難以統一提升能力,維護的難度大。

3、做了過多的個性化定製,導致後續維護和升級的成本非常高。

幾乎爲每一個稍微大一點的用戶都單獨做了模型,付費調用量不大,模型倒是有了好幾十個。同學們頻繁地做模型的迭代更新(每週都至少有 1-2 次),佔用大量人力。

怎麼辦呢?

建設技術體系去解決某一類問題,而不是某個技術點去解決某一個問題;結合安全業務的特點,設計可以強化通用算法效果的基礎能力或處理框架。

——上面兩句話不是我說的,來源於前主管。(插一句:本文還有一些內容來源於前主管和主管,向主管學習是提升自己的一個重要途徑。)

具體來說,解法有幾點:

1、明確風險詞包、相似性檢索、分類模型、風險知識圖譜 4種手段適合完成的任務,且相互配合。

2、把風險詞包從分類模型中拆出來,降低應用的複雜度,以及模型迭代的頻率,解決穩定性問題。

3、分類模型的結構儘可能統一,標準儘可能不變,持續把效果做強。

4、自從 BERT 提出以來,NLP 問題的基本範式從原來的 task-specific 的模型結構設計轉變到語言模型 pretrain+ 下游任務 finetuning 的模式。工作重點應該轉向預訓練模型與知識蒸餾。

由於目前對內的內容交互風險管控業務也在我的團隊內,我就貼一張全局視角的問題分析與解決方案。

圖-全局視角的UGC風險管控思路

明確解法之後,同學們快速做了實踐,到 4 月份就基本扭轉了被動的局面,隨後打了翻身仗,付費調用量增長 25 倍。現在模型的更新週期降低到以月爲週期,穩定性大幅度提升,同學們也不再疲於奔命;而且,投入的人力也明顯下降了。

績效的考覈

績效考覈決定了收益的分配,也是團隊最重要的事情之一。

如果把團隊比作一個模型,考覈的標準就是 loss function。loss function 一旦確定,模型的優化方向也就定了,團隊成員會按照利益最大化原則沿着這個方向調整自己的 action 。

所以,考覈標準的設計需要體現團隊的定位、價值和需求;在執行的過程中需要滿足平等性。

圖-績效考覈的3個維度

業務結果

阿里有個文雅的說法是:爲過程鼓掌,爲結果付酬。

還有個話糙理不糙的說法是:沒有過程的結果是垃圾,沒有結果的過程是放屁。

你覺得哪一句對你的胃口就看哪一句。

配置在業務BU的算法團隊,幫助業務目標達成肯定是首要任務。今年以來,AI 行業也都漸漸擠出泡沫,迴歸本質,開始強調創造業務價值了。

能力進步

從價值觀上講,今天的最好表現是明天的最低要求。

從業務需求講,量級越來越大,業務形態越來越複雜,老算法是解決不了新問題的。

從團隊利益講,成員的能力進步可以擴展團隊的能力雷達圖。

參加百阿的時候,一位講師的發言我到現在都記得:在座的各位最終都是要離開阿里的,離開的時候無非兩種情況:1,公司不要你了;2,你不要公司了。怎麼離開,取決於是你的能力提高快,還是公司對能力的要求提高快。

技術影響力

什麼是技術影響力?

有形物:Paper 、競賽成績、著作、專利、 ATA 文章等。

無形物:對內對外合作、對外 PR 、對內分享、組織機構任職、參會做報告等。

爲什麼要建設技術影響力?

1、團隊的四項基本能力:連接、生產、傳播、服務,其中“傳播”就需要技術影響力。

2、 CRO 線的使命“四心”中,有一條叫“讓監管單位放心”。技術影響力是讓監管放心的有效方式之一。

3、商業化需要資質:搞過投標的同學都知道。

4、招聘需要名氣:對候選人講解我們的技術水平時,如果用內部業務舉例,不容易產生共鳴;但是如果直接亮出頂會論文、刷榜名次之類的,對方馬上就懂了。

5、個人的市場價值需要證明:這些東西都可以作爲個人技術品牌,到哪都能帶着。

假定一個場景,有人問:“你說這個業務做得好,說明你的算法水平高。會不會換一個人能夠做得更好?”你打算怎麼回答這個問題?

再假定一個場景,你打算給自己團隊的算法能力定性爲“xx領先”或者“xx第一梯隊”,如果沒有硬核的技術影響力做支撐,是否還能理直氣壯?

平等性

團隊協作的基礎是團結,團結的基礎是平等。

平等性最重要的體現,就是在考覈過程中儘可能只衡量以上三項,不去考慮地域、教育背景、從業經歷、之前表現、顏值、性別、個人動向等等其他因素。我認爲:結果體現的就是能力,直截了當,最能服衆。

當然,這個世界上是否有完全客觀的判斷?或者,完全客觀的判斷如果存在,是不是就是最合適的?我不知道答案。不過,我覺得不能因爲做不到完全的平等而放棄追求平等。

廣告

按照慣例,it’s the timefor employment ad 。我們需要研究這些領域:

1、安全場景特有的問題

1.1 無限制條件下的攻擊與防禦

現實世界裏,違規者的變形變異方法是不受約束的,思路非常廣,讓人防不勝防。我們需要研究無限制條件下的攻擊與防禦以提升我們對於業務(尤其是信息治理與商品)中層出不窮的變形變異,這屬於核心能力。

1.2 模型的可解釋性

是AI的一大發展趨勢。我們作爲安全AI,這張牌更需要打出來,體現安全領域的特色;也需要給業務同學提供人可以理解的原因,放心地做決策。

1.3 小樣本學習

安全場景經常因爲不可抗力不能蒐集到足夠的樣本,或者長尾風險因爲成本的原因無法去做樣本收集,必須要發展只憑借少量樣本快速獲取“夠用”的模型的手段。

2、預訓練與知識蒸餾

自從 BERT 提出以來,NLP問題的基本研究範式從原來的 task-specific的模型結構設計轉變到語言模型預訓練+下游任務微調的模式。這是歷史必然的趨勢,不可扭轉。

2.1 預訓練

預訓練模型自身的提高,可以帶來分類、檢索、 NER 等 NLP 基本任務(這些都是我們需要具備的核心能力)的水平提高,且有利於 NLP 技術體系的統一化。可以把我們的各種應用算法能力比喻爲船,預訓練模型是水,水漲就能船高。

2.2知識蒸餾

由於目前還存在模型複雜度和計算資源的尖銳矛盾,對於我們這種業務量動輒十幾億的情況,模型的計算效率具有非常重要的財務意義。如何在儘可能保障效果的前提下降低計算資源的消耗具有非常現實的意義。

3、更基礎的數據科學

3.1 對數據規律的發現與分析

3.2 弱監督/半監督學習

3.3 噪聲數據的處理

現在有一種傾向是把重心放在模型的優化上,嘗試變換各種模型來提升效果,但對數據本身的分析往往是缺少的,沒有耐心去分析badcase,挖掘數據規律。我們實際業務中遇到的數據雖然量很大,但質量並不高,如果能有比較高的數據敏感性,分析數據的規律,可能並不需要太複雜的模型,只需要根據數據規律進行有針對性的調整採樣,就能夠提升算法表現以及訓練效率。

3.4 遷移學習

包括同種語言內不同 domain 語料之間的遷移;以及多語言之間的遷移。

我們的工作很有挑戰,也很辛苦,確定自己想來再釘釘我,北京杭州兩地可選。

彩蛋

感謝你耐心地堅持看到這裏,作爲獎勵,我故意把正文裏一些重要內容放在了這裏,尤其是像招聘這種主管的核心技能。

招聘

招聘是主管的基本功;招聘做好了,團隊已經成功了一半。

之前在 CV 團隊,不光給自己招,也給幾乎所有兄弟團隊招,很高興地看到這些同學已經在建功立業了。先擺一下這幾年來招聘任務的量:

圖-幾年來累積的招聘任務數量

大家肯定會問:這麼多簡歷,哪來的?

我所在的 BU 在外知名度還不算高,很少能收到主動投遞的簡歷,所謂的合作獵頭從來就沒起到過作用,只能自己想辦法。來源包括:1)採蜜;2)社交網站;3)內推;4)去各種會上收。希望以後團隊的對外影響力越來越大,我能夠躺着被簡歷淹死。

再掰開了說,以採蜜爲例,就有很多苦操作,比如之前社招簡歷是每天夜裏12點超期釋放,就天天蹲守;校招公海池是每天晚上 8 點開閘,就要天天拼手速;還有候選人被其他 BU 持有不放,就各種協調乃至扯皮…… 舉個例子,大團隊內有位同學,當初我是在出差路上,出租車上掛上 VPN 搶到的簡歷。

在招聘中,我發現一個現象:當你只接觸過百級別的候選人時,不容易招到人;但是如果你接觸過千級別的候選人,招聘的難度明顯下降了。原因大約是,在廣撒網的過程中積累了一個高可能性的候選人池子,池子的規模大到一定程度,產生合適的候選人就不那麼難了。

關於“嫡系”

從 CV 團隊換到 NLP 團隊接手的時候, HR 詢問是否需要從原團隊帶一個人到新團隊。

我考慮之後答覆不帶。因爲,我需要快速地和新團隊的同學們建立信任感,並且全心全意地依靠他們。如果我帶一個同學過去,新團隊的同學怎麼看?他們會在心裏說:看,那個人是主管帶過來的,是親信。這樣很容易在我和同學之間產生距離與疑慮。同樣的,原來團隊的同學會想:看,主管帶走的那個人是他最信任的,我不是。

團隊的持續發展需要海納百川,搞出類似“嫡系”和“非嫡系”這種分羣,長久來看是會制約團隊能達到的的高度,也會制約主管的高度。

因爲信任,所以簡單

除了出勤之類,在工作成果的真實性上主管也只能選擇信任下屬,原因很簡單:如果 10 個下屬每週報告的結果,主管都去親手驗證一遍,可能一個星期還不夠。

但是,信任同時也是很容易被打破的——一旦主管發現下屬報告的結果有故意虛報浮誇的部分,後續就很難再默認信任 TA 。類似的,某些人的週報總是花團錦簇高歌猛進,但是一年下來模型的效果效率並沒有提升,大家只能選擇默認不相信。

前面說的都是主管要信任下屬,大家思考一個問題:下屬是否需要默認信任主管呢?爲什麼?

認真生活,快樂工作

阿里有句老話:加班是對的,不加班也是對的,只有不完成工作是不對的。

我從內心裏不喜歡長時間高強度加班。爲了趕一下進度,階段性地溫和加班一下,是可以接受的。如果長期需要高強度加班,那一定是主管的計劃、評估或者安排出了問題。最近剛和兩個同學聊過,因爲他們回家太晚或者週末來公司加班,我擔心是自己有什麼做錯了。

當然了,這一點我自己做得也不好,尤其是接手初期百廢待興的時候,經常工作到很晚,週末做幾個面試。前些天做新六脈神劍培訓,傳橙官說得特別好:“認真生活,快樂工作”這一條,主管要以身作則,帶頭做好——如果你自己都苦哈哈的,下面的同學怎麼快樂得起來?深以爲然,於是我打算堅決落實領導指示,定個小目標:每週三天按時下班,目前已經堅持了三個星期。

參考文獻

我是吳軍的粉,在這裏推薦幾本他的著作:

《見識》《態度》《格局》《浪潮之巔》《全球科技通識》

本文中一些內容的源頭來自以上書籍。

有些書我給團隊內的同學送過,不過大多數人都沒有看,這件事情我違背了自發性原則。

作者介紹

張榮,花名威視,現任職阿里巴巴 CRO 線 NLP 算法團隊 leader ,長期聚焦於 NLP 、圖像識別、視頻分析算法領域,面向整個經濟體提供信息治理、數據安全、商品、人機等多個方向的算法能力,並通過商業化服務於社會。目前致力於基於風險知識的 NLP 算法建設。

本文轉載自公衆號阿里巴巴中間件(ID:Aliware_2018)。

原文鏈接

https://mp.weixin.qq.com/s/gxhqbOIWUSYRxLBsizFD2A

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章