小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

作為面試官,如何判斷一個面試者的深度學(xué)習(xí)水平?

 timtxu 2017-05-20

編者按:作為一個快速成長的AI初創(chuàng)企業(yè),竹間智能很欣喜地看到,正有越來越多的普通人關(guān)注人工智能領(lǐng)域。但不可否認(rèn),無論是AI創(chuàng)業(yè)還是對深度學(xué)習(xí)的研究,已經(jīng)產(chǎn)生了一些泡沫。為此我們邀請了竹間智能深度學(xué)習(xí)科學(xué)家趙寧遠(yuǎn),來為大家講述一下,一個合格的深度學(xué)習(xí)工程師應(yīng)該具有的素質(zhì)與能力。希望對有意加入這一領(lǐng)域的年輕人有所幫助。

圖片來源于網(wǎng)絡(luò)

深度學(xué)習(xí)雖然并不是新鮮事物,尤其近幾年發(fā)展迅速,但還遠(yuǎn)稱不上是一個“成熟”領(lǐng)域。就算是“傳統(tǒng)”機(jī)器學(xué)習(xí),其中所包含的思想和方法也千差萬別。因此,我們并不強(qiáng)求面試者必須要懂哪些tricks或者某類特定的方法。坦白說沒有面試官(在我看來,就算是Hinton本人)能對機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的每個領(lǐng)域都了如指掌,所以我們會盡量避免用一些自己主觀的理解去考別人

因此,我們的原則是希望面試者有比較好的機(jī)器學(xué)習(xí)基礎(chǔ),比較優(yōu)秀的編程能力,以及分析和解決實際問題的能力(或者說,critical thinking)。當(dāng)然,對深度學(xué)習(xí)的理解和實際經(jīng)驗會是一個加分項,但是crash course或者用于炫技的冷知識并不能取代扎實的基本功(比方說把Andrew Ng的機(jī)器學(xué)習(xí)課程吃透,將Deep Learning的一本書學(xué)好)。

經(jīng)過快兩年的發(fā)展,竹間智能已經(jīng)成長為一個擁有一百多位AI工程師與研發(fā)人員的大家庭。在NLU與人類情感、情緒識別上也取得了一些突破,很多我曾經(jīng)面試過的年輕工程師已經(jīng)成為業(yè)務(wù)骨干。所以冒著聽起來過分自大的風(fēng)險,想來分享一下在這方面我所關(guān)心的一些問題:

1. 在使用一種方法(無論是深度學(xué)習(xí)或是“傳統(tǒng)”方法)的時候,面試者對它的優(yōu)點和局限性是否都有所認(rèn)識。在面對不同的問題的時候,我們希望面試者可以通過獨立思考做出一個informed choice,而不是因為“上周看了一篇paper是這樣做的”或者“BAT/FLAG就是這樣做的”。

2. 面試者是否有完整的機(jī)器學(xué)習(xí)項目經(jīng)驗。這意味著從理解需求開始,到收集數(shù)據(jù)、分析數(shù)據(jù),確定學(xué)習(xí)目標(biāo),選擇算法、實現(xiàn)、測試并且改進(jìn)的完整流程。因為我們希望面試者對于機(jī)器學(xué)習(xí)在實際業(yè)務(wù)中所帶來的影響有正確的判斷能力。當(dāng)然,如果是可以通過python/或是結(jié)合Java/Scala來完成所有這些事情就更好啦。

3. 面試者是否具備基本的概率/統(tǒng)計/線性代數(shù)的知識——數(shù)學(xué)期望,CLT,Markov Chain,normal/student’s t distribution(只是一些例子),或是PCA/SVD這些很基礎(chǔ)的東西。另外(最理想的),希望面試者對于高維空間的一些特性有直覺上的認(rèn)識。這部分并不是強(qiáng)行要求背公式,只要有理解就可以。畢竟這不是在面試數(shù)學(xué)系的教職——我們只是希望面試者可以較好地理解論文中的算法,并且正確地實現(xiàn),最好可以做出改進(jìn);另外,在深度學(xué)習(xí)的調(diào)參過程中,比較好的數(shù)學(xué)sense會有助于理解不同的超參數(shù)對于結(jié)果的影響。

4. 面試者是否有比較好的編程能力,代碼習(xí)慣和對計算效率的分析能力(這個一般會按照最基本的算法工程師的要求來看,從略)

5. 面試者在機(jī)器學(xué)習(xí)方面,對基本的概念是否有所了解(譬如說,線性回歸對于數(shù)據(jù)的假設(shè)是怎樣的),以及對于常見的問題有一定的診斷能力(如果訓(xùn)練集的正確率一直上不去,可能會出現(xiàn)哪些問題——在這里,我們希望面試者能夠就實際情況,做一些合理的假設(shè),然后將主要的思考邏輯描述清楚)。我們會根據(jù)面試者所掌握的方法再比較深入地問一些問題,而且我們希望面試者不僅僅是背了一些公式或算法,或是在博客或知乎上看到了一些名詞(比如VC維度,KKT條件,KL divergence),實際上卻不理解背后的理論基礎(chǔ)(有時候這些問題確實很難,但“知道自己不知道”和“不知道自己不知道”是差別很大的)。打個比方,如果面試者提到核技巧,那么給到一個實際的線性不可分的數(shù)據(jù)(譬如XOR,或者Swiss Roll),面試者能清楚地設(shè)計,并通過實際計算證明某個kernel可以將此數(shù)據(jù)轉(zhuǎn)化到一個高維并線性可分的空間嗎?

6. 在深度學(xué)習(xí)方面,我們希望面試者具備神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(BP),以及常見的目標(biāo)函數(shù),激活函數(shù)和優(yōu)化算法。在此基礎(chǔ)上,對于常見的CNN/RNN網(wǎng)絡(luò),我們當(dāng)然希望面試者能夠理解它們各自的參數(shù)代表什么,比較好的初始參數(shù),BP的計算,以及常見超參數(shù)的調(diào)整策略——這些相信Ian Goodfellow的Deep Learning一書都有非常好的介紹——我們也希望面試者能夠在具體領(lǐng)域有利用流行框架(可能是tensorflow——但是這并不是必須的)搭建實際應(yīng)用的經(jīng)驗。當(dāng)然,我們希望面試者讀過本領(lǐng)域的paper,并且手動驗證過他們的想法,并且可以對他們方法的優(yōu)缺點進(jìn)行分析。當(dāng)然,如果面試者有更多興趣,我們可以探討更深入的一些問題,比如如何避免陷入鞍點,比如通過引入隨機(jī)噪音來避免過擬合,比如CNN的參數(shù)壓縮,比如RNN對于動力系統(tǒng)的建模,比如基于信息理論的模型解釋,等等等等,在這些方面,我們是抱著與面試者互相切磋的心態(tài)的。

7. 通常上面我們說的都是監(jiān)督學(xué)習(xí),往往結(jié)果是回歸或分類。當(dāng)然,也許面試者還精通RL/transfer learning/unsupervised learning這些內(nèi)容,那么我們可以逐一討論。

此外,如果面試者應(yīng)聘的是某一個特定領(lǐng)域的職位,那么當(dāng)然地,我們會希望他同時具備很強(qiáng)的領(lǐng)域知識,這里就不展開說明了。

在很短的時間內(nèi)想要全面地了解一個人確實非常困難。調(diào)查顯示,往往面試官自以為很準(zhǔn)的“感覺”,其實是一個糟糕的performance predictor。我希望可以結(jié)合相對客觀的基礎(chǔ)問題,以及面試者自身的特長,來對面試者的理論和實戰(zhàn)能力做一個判斷。基礎(chǔ)扎實,有實戰(zhàn)經(jīng)驗并且有一技之長的面試者通常會是非常理想的候選人。

最后的一點小tip,我真誠地希望面試者對問題有自己的思考和理解、有自己的體系,argument都是能夠自洽的。堅持自己的觀點并與面試官爭論,遠(yuǎn)遠(yuǎn)好過為了面試而去背誦所謂的標(biāo)準(zhǔn)答案。

歡迎批評指正。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多