|
周末推薦一下老宋同學整理的Github項目:songyingxin/NLPer-Interview?,該倉庫主要記錄 NLP 算法工程師相關的面試題: https://github.com/songyingxin/NLPer-Interview
老宋目前是百度算法工程師,也是知乎老宋的茶書會專欄作者,以下主要來自老宋對該倉庫的描述,點擊"閱讀原文"直達該倉庫主頁面,推薦Star,內容相當豐富。 本倉庫主要記錄本人對 NLP 相關知識的積累,之前筆記做的很多,考慮到秋招已至, 在復習的過程中, 慢慢將這些知識屢清楚,然后將相關的知識筆記整理成專題,來幫助我更好的復習。 同時,開源出來,希望大家能幫助我補一補相關的技術棧,看看我哪方面比較弱,同時也幫助諸位秋招中的伙伴更好的復習。如果希望一起做的同學,可以聯(lián)系我, 畢竟一個人做這么多,的確有點難,還好我前期筆記做的比較全。 推薦使用 Typora 編輯器打開, 所見即所得。 Contents1. 編程語言基礎該文件夾下主要記錄 python 和 c 的一些語言細節(jié), 畢竟這兩大語言是主流,基本是都要會的,目前還在查缺補漏中。
2. 數學基礎該文件夾下主要記錄一些數學相關的知識,包括高數,線性代數,概率論與信息論, 老宋親身經歷,會問到, 目前尚在查缺補漏中。
3. 計算機基礎理論知識這部分內容一般不怎么考,因此,沒有把重心放在上面,至少現在幾乎沒有遇到問這方面的, 有意思的是,投了阿里某部的NLP算法,居然來了個不懂NLP的來面,全程真的瞎聊,全是開發(fā)。 4. 機器學習基礎這部分已經開始進入正題了,事實證明,部分大廠會提及一些基礎的機器學習算法知識,因此,這部分我覺得幾個核心的模型是要會的。
5. 深度學習基礎這部分主要講述深度學習方面的基礎知識,是核心點,但很多情況下,很多面試官的題基本差不多,不過我個人覺得,有這種全局的,全面的知識框架是有益的。
5.1 基礎理論部分
5.2 基本單元
5.3 調參相關
5.4 Tricks
6. 統(tǒng)計自然語言處理這部分前期的筆記做的不多,因此還沒怎么開始。 7. 深度學習自然語言處理這部分算是核心的知識了,這部分還需要逐漸完善,時間有點緊啊。
7.1 詞向量三部曲
7.2 預訓練語言模型
7.3 Attention 機制7.4 文本分類7.5 語義匹配7.6 閱讀理解8. 源碼閱讀這部分主要推薦一些自己閱讀過的一些源碼,有些源碼是 NLP 相關, 有些是深度學習相關的,部分源碼我個人有做注釋,會相應的列出來。 9 . 老宋渣渣算法面經這部分主要是自己面試過程中的一些感悟, 哎, 快面到自閉了。 Reference[1] DeepLearning-500-questions -- 一個很好的倉庫 [2] Algorithm_Interview_Notes-Chinese -- 知識比較舊了,但也很好 其他主要是自己的日常積累和看的論文。 關于AINLP AINLP 是一個有趣有AI的自然語言處理社區(qū),專注于 AI、NLP、機器學習、深度學習、推薦算法等相關技術的分享,主題包括文本摘要、智能問答、聊天機器人、機器翻譯、自動生成、知識圖譜、預訓練模型、推薦系統(tǒng)、計算廣告、招聘信息、求職經驗分享等,歡迎關注!加技術交流群請?zhí)砑覣INLPer(id:ainlper),備注工作/研究方向 加群目的。 |
|
|