小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

清華大學(xué)馬少平教授:那些年,我們做過的AI...

 黑馬_御風(fēng) 2017-05-05


本文經(jīng)許可轉(zhuǎn)載自馬少平老師微博

二次轉(zhuǎn)載請(qǐng)聯(lián)系原作者


馬少平老師的這篇,寫得真心好。人工智能不是玄學(xué),作為實(shí)踐者一路走來,都是踏踏實(shí)實(shí),在具體的工程中,無數(shù)的坑踩過來。今天AI潮起,必然還會(huì)潮落。每一次的盛夏,都不可避免一次寒冬。有一種觀點(diǎn)認(rèn)為AI冬天不會(huì)再來,這是我不認(rèn)同的。只有踏踏實(shí)實(shí)的實(shí)踐者,才能不管冬夏,都能堅(jiān)定地走下去,不斷開創(chuàng)。如Hinton,如馬老。


——來自文因互聯(lián)CEO鮑捷的朋友圈



最近,有不同人問了我同一個(gè)問題:是什么淵源,走上了人工智能這條路。說實(shí)話,別說是人工智能,就連進(jìn)入計(jì)算機(jī)行業(yè),都完全是陰差陽錯(cuò)的結(jié)果,并不是我的主動(dòng)選擇。


1977年,文革結(jié)束后,突然傳來消息,要回復(fù)高考了,當(dāng)時(shí)我還在讀高中,對(duì)于怎么填報(bào)志愿,一概不知。班主任老師的意見是,什么專業(yè)你自己選,學(xué)校一定要報(bào)清華北大。我問這兩所學(xué)校的差別,老師說,北大偏文理,清華偏理工。我想了想,覺得自己喜歡理工,就選擇了清華,但是還是不知道選擇什么專業(yè),在那個(gè)小縣城里,沒有任何資料可供參考。剛好在本地的報(bào)紙上刊登了一些學(xué)校的專業(yè)目錄,在清華大學(xué)欄目下,我看到了“自動(dòng)控制”四個(gè)字,雖然不知道自動(dòng)控制是干什么,但憑感覺是個(gè)自己喜歡的專業(yè),于是就報(bào)了這個(gè)專業(yè)。


高考結(jié)束后,有一天突然收到了被清華大學(xué)電子工程系錄取的通知書,這電子工程系是干什么的一概不知,中學(xué)的老師也沒有人知道。剛好一個(gè)老師在北京工作的親戚來探親,他是文革前畢業(yè)的大學(xué)生,老師很熱心的幫我咨詢。這位親戚看完錄取通知書后,很神秘的對(duì)我說:這是一個(gè)保密專業(yè),就沒有任何下文了。


來到學(xué)校報(bào)到后,才知道我讀的就是電子工程系的自動(dòng)控制專業(yè),此外還有計(jì)算機(jī)和無線電兩個(gè)專業(yè)。1979年,電子工程系更名為計(jì)算機(jī)系,而原來的無線電系則從四川綿陽搬回北京,更名為電子工程系。


而當(dāng)時(shí)我們教研組的一些老師,張鈸老師、林饒瑞老師、石純一老師、黃昌寧老師等,則從更早的時(shí)候,就在探討開拓新的研究方向,并選擇了人工智能,從1978年就開始招收人工智能方向的研究生,1979年在我系本科中開設(shè)人工智能導(dǎo)論課,由林堯瑞老師主講。我就是在那個(gè)課上首次接觸了人工智能,印象中教材是一本油印的教材,內(nèi)容包括至少現(xiàn)在在大多數(shù)人工智能教材中還會(huì)講的A*算法、α-β剪枝算法、定理證明等。之后又開設(shè)了lisp語言課,由陸玉昌老師主講,做過的作業(yè)包括八皇后問題等。最后的考試有多個(gè)題目可選,我選擇了使用α-β剪枝算法實(shí)現(xiàn)五子棋下棋程序,雖然水平并不高,但也可以下棋了。這應(yīng)該是我最早實(shí)現(xiàn)的人工智能程序,而α-β剪枝算法正是IBM的深藍(lán)所采用的基本算法框架。


1982年本科畢業(yè)后,我繼續(xù)在清華讀碩士,研究方向是有關(guān)汽車自動(dòng)駕駛的,也就是現(xiàn)在火熱的無人車,論文題目為“汽車行駛的計(jì)算機(jī)實(shí)時(shí)控制及性能函數(shù)對(duì)系統(tǒng)參數(shù)靈敏度的計(jì)算”。當(dāng)然那個(gè)時(shí)候受各種條件的限制,做的還比較簡單,我的論文中只實(shí)現(xiàn)了左右轉(zhuǎn)彎、躲避固定障礙物等的簡單控制。實(shí)驗(yàn)室購買了一輛二手的日本車,經(jīng)改裝后作為實(shí)驗(yàn)用車,在實(shí)際測試時(shí)為了觀察汽車軌跡是否合理,在車上裝了一桶水,通過一個(gè)水管流水,記錄車的運(yùn)行軌跡,計(jì)算機(jī)用的是TRS-80,用的是basic編程語言。


1984年碩士畢業(yè)留校后,我開始從事專家系統(tǒng)構(gòu)建方面的研究工作,和研究生一起,先后實(shí)現(xiàn)了好幾個(gè)專家系統(tǒng),包括貨船積載專家系統(tǒng)、火車編組站調(diào)度專家系統(tǒng)和某軍事設(shè)備故障診斷專家系統(tǒng)等,還申請(qǐng)了一個(gè)863項(xiàng)目,機(jī)器人故障診斷系統(tǒng)。做專家系統(tǒng)的關(guān)鍵是整理專家知識(shí),為了能跟專家對(duì)話,需要花費(fèi)很多時(shí)間學(xué)習(xí)相關(guān)的領(lǐng)域知識(shí),基本上可以稱得上半個(gè)專家了。比如為了做火車編組站調(diào)度專家系統(tǒng),自學(xué)了很多編組站調(diào)度方面的書籍,多次去山海關(guān)火車站向調(diào)度人員請(qǐng)教、學(xué)習(xí),到后來,我們也基本可以勝任調(diào)度員的工作了,只是做的不如專業(yè)調(diào)度員快,但我們做的方案基本被對(duì)方所認(rèn)可。掌握了相關(guān)知識(shí)后,進(jìn)一步總結(jié)整理知識(shí),最后實(shí)現(xiàn)的專家系統(tǒng),可以達(dá)到專業(yè)調(diào)度員的水平,并且速度要快的多,極大的減輕了調(diào)度人員的工作強(qiáng)度,提高了工作效率。


我做的最成功的一個(gè)專家系統(tǒng)是90年代中期為某企業(yè)做的一個(gè)市場調(diào)查報(bào)告自動(dòng)生成專家系統(tǒng),是我們系為該企業(yè)做的一個(gè)信息化系統(tǒng)的一個(gè)組成部分。根據(jù)以往企業(yè)撰寫的市場調(diào)查報(bào)告,總結(jié)了若干模板和寫作知識(shí),根據(jù)企業(yè)收集的市場數(shù)據(jù),自動(dòng)完成市場調(diào)查報(bào)告。為了使得報(bào)告內(nèi)容看起來更加自然和富有變化,我們總結(jié)了很多寫作知識(shí),所完成的報(bào)告,基本可以達(dá)到人的水平。該專家系統(tǒng),結(jié)合我們系為該企業(yè)做的信息化系統(tǒng),可以用語音的形式播報(bào)市場調(diào)查報(bào)告,并配合語音的進(jìn)度,自動(dòng)在計(jì)算機(jī)屏幕上,顯示各種圖表等,相關(guān)的同步信息,也是由專家系統(tǒng)自動(dòng)生成的。


從1992年,我又開始從事漢字識(shí)別方面的研究工作,選擇了被認(rèn)為難度最大的脫機(jī)手寫體漢字識(shí)別,也就是對(duì)寫在紙上、經(jīng)掃描得到的漢字圖象做識(shí)別。1994年我在職攻讀博士學(xué)位,研究方向就是有關(guān)脫機(jī)手寫體漢字識(shí)別方面的。在單字漢字識(shí)別研究的基礎(chǔ)上,我們組最早研究了漢字識(shí)別后處理方法,也就是說,在單個(gè)漢字識(shí)別的基礎(chǔ)上,利用漢字在句中的上下文關(guān)系,自動(dòng)糾正識(shí)別結(jié)果,提高識(shí)別率。在一次863組織的漢字識(shí)別評(píng)測現(xiàn)場,我們的系統(tǒng)以句子為單位,先是顯示單字識(shí)別結(jié)果,再顯示后處理后的結(jié)果。限于當(dāng)時(shí)的技術(shù)水平,又加上評(píng)測用的漢字寫的不是很工整,識(shí)別結(jié)果錯(cuò)誤很多,以至于很多句子看不懂,但是經(jīng)后處理后,大多數(shù)識(shí)別錯(cuò)誤的漢字得以糾正,人看懂已經(jīng)完全沒有問題了。當(dāng)后處理結(jié)果顯示出來后,我還清楚的記得,現(xiàn)場觀眾一片嘩然的叫好聲。


大概在1997年前后,突然有幾個(gè)公司宣布要做《四庫全書》數(shù)字化的工作,有的公司還在人民大會(huì)堂搶先召開新聞發(fā)布會(huì),試圖搶占先機(jī)。這些公司完全沒有想到這件事情的難度,試圖采取人工錄入的方式,完成《四庫全書》的數(shù)字化工作,最終導(dǎo)致失敗,只有采用了我們的漢字識(shí)別技術(shù)的書同文公司最終取得了成功,完成了《四庫全書》全部的數(shù)字化工作,這也是我一生中可以保留下來的一件有意義的工作。


《四庫全書》數(shù)字化難度在哪里呢?為什么用人工錄入方式的嘗試均以失敗告終呢?《四庫全書》共收錄古籍3503種、79337卷、裝訂成36000余冊(cè),含有約8億個(gè)漢字。臺(tái)灣曾經(jīng)出版過影印版,在頁面縮小到原來頁面的四分之一后,全套書總重量仍然達(dá)到了2.5噸的重量,可以想象這套書有多少。這么大的量,又是繁體字,錄入也好,校對(duì)也好,都帶來了極大的難度。而以漢字識(shí)別為基礎(chǔ)的數(shù)字化方案,從識(shí)別到校對(duì),可以提供一套確實(shí)可行的解決方案,最終歷時(shí)兩年時(shí)間,終于完成了《四庫全書》的全部數(shù)字化工作。這其中也遇到了幾個(gè)技術(shù)難題,比如缺少訓(xùn)練用樣本等,為此我們提出了一種樣本生成技術(shù)解決訓(xùn)練樣本少的問題,并提出了一種增量式學(xué)習(xí)方法,實(shí)現(xiàn)了邊訓(xùn)練邊識(shí)別,可以滾動(dòng)式地構(gòu)建古籍識(shí)別系統(tǒng),這對(duì)古籍?dāng)?shù)字化是一個(gè)非常重要的技術(shù)。可惜在報(bào)教育部獎(jiǎng)時(shí),被某權(quán)威人士認(rèn)為是“現(xiàn)有技術(shù)的簡單應(yīng)用”而落選。


在做《四庫全書》數(shù)字化的過程中,接觸到了信息檢索,當(dāng)時(shí)互聯(lián)網(wǎng)開始普及,google也剛剛成立不久,意識(shí)到搜索引擎在將來的網(wǎng)絡(luò)化社會(huì)將是一個(gè)十分重要的工具。在經(jīng)過一番調(diào)研之后,決定將小組的工作轉(zhuǎn)向搜索引擎相關(guān)技術(shù)的研究。在黃昌寧老師的建議下,我們先從參加TREC評(píng)測開始(TREC是信息檢索領(lǐng)域的一個(gè)著名的會(huì)議,以各種評(píng)測聞名),一方面可以通過參加評(píng)測獲得數(shù)據(jù),另一方面也可以相對(duì)快速地檢驗(yàn)我們的研究成果,和國際上優(yōu)秀團(tuán)隊(duì)一絕高低。經(jīng)過大約兩年的學(xué)習(xí)、研究,小組于2002年首次參加TREC評(píng)測,就獲得了一項(xiàng)第一名,這也是TREC舉辦以來,亞洲參加評(píng)測單位首次獲得第一名,在此之前亞洲最好成績是第4。從此一發(fā)不可收拾,小組連續(xù)10年每年都至少有一個(gè)第一名。也正是由于有了這樣的成績,從2007年開始,和搜狗公司共建清華大學(xué)-搜狗公司搜索技術(shù)聯(lián)合實(shí)驗(yàn)室,雙方合作9年,就搜索引擎技術(shù)共同開展合作研究,并于2016年將聯(lián)合實(shí)驗(yàn)室升級(jí)為天工智能計(jì)算研究院,為此搜狗公司捐贈(zèng)了1.8億人民幣用于研究院的建設(shè)。這期間雙方不僅在國際頂級(jí)會(huì)議和期刊上聯(lián)合發(fā)表了多篇論文,大多數(shù)研究成果還用于搜狗搜索引擎中,有效的提升了搜狗搜索引擎的性能。


這么多年來,在人工智能的若干個(gè)方向上做了一些研究,看似是些不同的方向,但是相互之間也是有很多關(guān)聯(lián)的,很多基礎(chǔ)知識(shí)是通用的。比如在漢字識(shí)別后處理中,我們就引入了專家系統(tǒng)中的黑板模型,將多種不同的知識(shí)融入到漢字識(shí)別后處理,有效提高了后處理的性能。在做信息檢索研究時(shí),尤其是初期,很多漢字識(shí)別中用到的機(jī)器學(xué)習(xí)方法,也起到了非常重要的作用。


回首往事,一直艱難地走在人工智能之路上,在人工智能的寒冬期,多少誘惑不為所動(dòng),因?yàn)榭春萌斯ぶ悄艿奈磥恚辉诮裉烊斯ぶ悄艿?strong>火熱期,更要保持冷靜的頭腦,因?yàn)槿斯ぶ悄苓€遠(yuǎn)遠(yuǎn)沒有達(dá)到人們所期望的那樣,還有很長的路要走。努力吧,路在前方!


-END-

  

將門招聘

將門創(chuàng)投正在招募編輯、運(yùn)營類全職/實(shí)習(xí)生崗位,工作地點(diǎn)在北京三元東橋附近,期待熱愛技術(shù)的你到來,和我們一起見證技術(shù)創(chuàng)新的傳奇!


歡迎發(fā)送簡歷至>>dream@thejiangmen.com


詳情>>將門招聘 | 如果你也和我們一樣,相信技術(shù)是引爆下一輪商業(yè)變革的核武器


將門是一家專注于發(fā)掘、加速及投資技術(shù)驅(qū)動(dòng)型創(chuàng)業(yè)公司的創(chuàng)業(yè)服務(wù)和投資機(jī)構(gòu)。


將門創(chuàng)業(yè)服務(wù)專注于為技術(shù)創(chuàng)新型的創(chuàng)業(yè)公司連接標(biāo)桿用戶和落地行業(yè)資源。


將門技術(shù)垂直社群專注于幫助技術(shù)創(chuàng)新型的創(chuàng)業(yè)公司提供來自產(chǎn)、學(xué)、研、創(chuàng)領(lǐng)域的核心技術(shù)專家的技術(shù)分享和學(xué)習(xí)內(nèi)容。


將門投資基金專注于投資通過技術(shù)創(chuàng)新激活商業(yè)場景,實(shí)現(xiàn)商業(yè)價(jià)值的初創(chuàng)企業(yè)。關(guān)注領(lǐng)域包括:機(jī)器智能、物聯(lián)網(wǎng)、自然人機(jī)交互、企業(yè)計(jì)算。


獲取將門投資>>bp@thejiangmen.com

    

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多