|
近日,愛分析在京舉辦了2019愛分析·中國(guó)數(shù)據(jù)智能高峰論壇,數(shù)據(jù)智能領(lǐng)域眾多獨(dú)角獸企業(yè)、投資人和專業(yè)人士共聚一堂,共同分享、探討行業(yè)趨勢(shì)。愛分析邀請(qǐng)到了一覽群智CEO胡健進(jìn)行了主題演講。 胡健認(rèn)為,過去幾十年,人工智能經(jīng)歷了發(fā)展的三個(gè)階段:專家智能、數(shù)據(jù)驅(qū)動(dòng)的AI、大數(shù)據(jù)驅(qū)動(dòng)的AI。接下來在五到十年之內(nèi),肯定會(huì)出現(xiàn)下一代的人工智能的進(jìn)步,大知識(shí)驅(qū)動(dòng)的AI。 現(xiàn)將其主題演講實(shí)錄分享給讀者。 胡?。悍浅s幸愛分析邀請(qǐng),有機(jī)會(huì)跟大家分享數(shù)據(jù)智能方面的思考以及我們?cè)谶@方面的實(shí)踐。 人機(jī)結(jié)合是未來大勢(shì)所趨我喜歡兩部電影,一個(gè)是《終結(jié)者》,一個(gè)是《鋼鐵俠》,完全不同的設(shè)計(jì)場(chǎng)景,最終產(chǎn)生的結(jié)果也是完全不一樣。 《終結(jié)者》設(shè)計(jì)場(chǎng)景是,機(jī)器完全具有智能,要消滅人類,或者奴役人類。 《鋼鐵俠》是輔助人,是智能的助理?!朵撹F俠》產(chǎn)生的結(jié)果是,讓人成為一個(gè)超人,成為美國(guó)的英雄。 對(duì)人來說,從倫理上的選擇非常明確,我們的目標(biāo)是讓機(jī)器服務(wù)我們,讓我們成為超人,而不是讓我們成為機(jī)器的奴隸。 從技術(shù)角度來看,雖然現(xiàn)在的人工智能技術(shù)能在很多決策上幫助我們,但是機(jī)器更擅長(zhǎng)計(jì)算、存儲(chǔ)以及模式識(shí)別的能力,人更有同理心,具備理解、分析和決策能力,這兩者是天然的互補(bǔ)。 機(jī)器加上人工,讓機(jī)器取代簡(jiǎn)單的重復(fù)性的工作,讓人做一些更有創(chuàng)造性,更加重要的工作。所以無論從倫理角度,還是技術(shù)角度來說,我相信人機(jī)結(jié)合肯定是未來大勢(shì)所趨。 人工智能發(fā)展四步走但理想很豐滿,現(xiàn)實(shí)很骨感。某種意義上,現(xiàn)階段的人工智能屬于弱人工智能,就是“弱智”階段。 當(dāng)前的人工智能完全是基于數(shù)據(jù)推理的方式。第一,沒法理解人類的情感,沒法跟人進(jìn)行正常乃至深度的交流;第二,無法應(yīng)對(duì)在復(fù)雜場(chǎng)景下的決策和規(guī)劃的問題。 現(xiàn)階段人工智能的落地都是快速反饋,單場(chǎng)景感知的智能。就像剛出生的孩子一樣,看得見,聽得見,但是需要長(zhǎng)時(shí)間的培訓(xùn)才能看得懂,聽得懂。 因此,接下來人工智能和數(shù)據(jù)智能很重要的任務(wù)怎么讓機(jī)器或者軟件具有大腦。 整個(gè)數(shù)據(jù)智能或者人工智能發(fā)展有四步:專家智能、數(shù)據(jù)驅(qū)動(dòng)的AI、大數(shù)據(jù)驅(qū)動(dòng)的AI以及大知識(shí)驅(qū)動(dòng)的AI。 第一步是專家智能。60年代的時(shí)候,很多專家用一些規(guī)則,或者用一些符號(hào)邏輯的方式,把邏輯規(guī)則化,希望盡可能的用自動(dòng)化的流程取代工作。 的確,這在很多場(chǎng)景中是有價(jià)值的,能夠提升勞動(dòng)效率,但是本身用規(guī)則的方式去解決這個(gè)問題,專家就只有這么多,寫的規(guī)則非常復(fù)雜,適用性非常有限。 因此,很長(zhǎng)一段時(shí)間專家?guī)熘R(shí)庫陷入停滯狀態(tài)。 后來推出機(jī)器學(xué)習(xí)算法,我們?cè)诤芏嘈?shù)計(jì)算上實(shí)現(xiàn)非常大的突破,幫助我們?cè)诤芏鄨?chǎng)景中做預(yù)測(cè)。但此類門檻比較高,需要做特征工程,另外,還要選擇不同的算法,它是比較小眾的應(yīng)用場(chǎng)景。 一直到2011年深度學(xué)習(xí)出現(xiàn),不需要懂算法,直接端到端的產(chǎn)品,里面具體參數(shù)不用設(shè)計(jì),直接出成果,直接到大數(shù)據(jù)驅(qū)動(dòng)的人工智能。 最近一直提“大力出奇跡”,它不是算法的進(jìn)步,是算力對(duì)于數(shù)據(jù)使用的進(jìn)步,是大數(shù)據(jù)驅(qū)動(dòng)的人工智能。 但這種深度學(xué)習(xí)有很大的瓶頸。 第一,特點(diǎn)性問題,沒法解釋什么東西起作用,在很多關(guān)鍵的場(chǎng)景中沒法應(yīng)用。 第二,泛化性問題,所謂大數(shù)據(jù)驅(qū)動(dòng)人工智能,需要大量的數(shù)據(jù)去學(xué)習(xí),才能學(xué)出很好的模型。這與人不同,人作為生物,有一套理論初步框架,有一套常識(shí)圖譜,常識(shí)圖譜的框架下,給幾張圖片就能產(chǎn)生非常好的泛化效果。 大知識(shí)驅(qū)動(dòng)的人工智能即將到來所以我們認(rèn)為接下來在五到十年之內(nèi),肯定會(huì)出現(xiàn)下一代的人工智能,很多人提到大知識(shí)驅(qū)動(dòng)的人工智能。 大知識(shí)驅(qū)動(dòng)的人工智能,我們面臨的挑戰(zhàn),首先是大。 傳統(tǒng)知識(shí)庫是有限的,但現(xiàn)在有大知識(shí),數(shù)據(jù)庫上云,包括人的數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)能夠構(gòu)建知識(shí)圖譜。 因?yàn)橐挥[群智大部分核心人員都是從微軟研究院出來的,曾經(jīng)在微軟研究院做搜索、數(shù)據(jù)挖掘。 搜索是人工智能、數(shù)據(jù)第一次大規(guī)模的商業(yè)應(yīng)用,很多人會(huì)問,NLP或者知識(shí)圖譜的市場(chǎng)規(guī)模和視覺相比,哪個(gè)大一點(diǎn)? 其實(shí)很顯然,因?yàn)樽匀徽Z言,知識(shí)圖譜已經(jīng)得到證明。搜索這個(gè)市場(chǎng)是巨大的市場(chǎng),搜索本身核心的技術(shù),都在用open的數(shù)據(jù)構(gòu)建超大規(guī)模的知識(shí)圖譜,用知識(shí)圖譜去理解文檔,理解用戶的查詢,最終實(shí)現(xiàn)查詢跟文檔的精準(zhǔn)匹配。 本身從搜索角度,它是一個(gè)通用的查詢的決策引擎。 我們從微軟出來以后在想,是否能將這樣的技術(shù)應(yīng)用于企業(yè)與行業(yè),如何將通用的知識(shí)圖譜與行業(yè)知識(shí)圖譜相結(jié)合,解決行業(yè)的問題。這是我們做一覽群智這家公司的初心。 解決人工智能應(yīng)用的核心問題,打造通用知識(shí)圖譜最核心的問題,是怎樣從海量的多源異構(gòu)數(shù)據(jù)中抽取知識(shí),構(gòu)建關(guān)系,把不同的數(shù)據(jù)進(jìn)行消歧融合,并構(gòu)建知識(shí),這是第一個(gè)知識(shí)構(gòu)建問題。 第二個(gè)問題,怎樣理解語義。比如,現(xiàn)在大部分人機(jī)對(duì)話,siri以及各領(lǐng)域的人機(jī)對(duì)話,不理解語義,這是現(xiàn)階段的困難。我堅(jiān)信接下來利用自然語言處理技術(shù),特別是語義理解技術(shù)的快速發(fā)展,會(huì)形成巨大的突破。就像前幾年視覺技術(shù)的突破一樣。 第三個(gè)是知識(shí)賦能的問題,有大的知識(shí),怎么和生物技術(shù)、和語言技術(shù)結(jié)合?我們有通用的知識(shí)圖譜,怎么訓(xùn)練識(shí)別特定的引擎,目標(biāo)是基于四到五張圖片能做識(shí)別引擎。目前的情況是,現(xiàn)在還需要標(biāo)注成千上萬張圖片。 我們的行業(yè)類似于搜索行業(yè),我們現(xiàn)階段要做的事情是落地智能平臺(tái)。 一覽群智智能決策平臺(tái)包括四個(gè)基礎(chǔ)產(chǎn)品,分別解決了數(shù)據(jù)融合和快速打通數(shù)據(jù)閉環(huán)的問題、知識(shí)圖譜的構(gòu)建問題、關(guān)聯(lián)分析的問題,以及AI模型的訓(xùn)練問題,即為決策問題。這是基于我們團(tuán)隊(duì)多年經(jīng)驗(yàn),總結(jié)出的一套產(chǎn)品,或者方法論。 具體而言,一覽群智智能決策平臺(tái)輔助決策系統(tǒng),由“感知-理解-分析-決策”四部分構(gòu)成。 首先,我們的產(chǎn)品解決的問題是從多源異構(gòu)數(shù)據(jù),從公開的行業(yè)數(shù)據(jù),包括物聯(lián)網(wǎng)數(shù)據(jù)中抽取出結(jié)構(gòu)化的信息,形成通用知識(shí)圖譜。這過程中我們需要用自然語言理解,以及知識(shí)抽取,去構(gòu)建知識(shí)圖譜。 當(dāng)有了知識(shí)圖譜以后,用基礎(chǔ)的機(jī)器學(xué)習(xí)產(chǎn)品,可以降低很多行業(yè)人員、從業(yè)人員使用人工智能產(chǎn)品的門檻,就能快速的構(gòu)建決策性產(chǎn)品。 有決策產(chǎn)品以后,產(chǎn)品不是取代人,而是幫助人在決策過程中理解數(shù)據(jù),在人機(jī)交互中,快速利用人的決策能力。 構(gòu)建了這樣一套框架體系后,用常識(shí)圖譜結(jié)合在公安、媒體具體的細(xì)分領(lǐng)域的數(shù)據(jù),去賦能行業(yè)。 接下來具體講講我們?cè)趲讉€(gè)細(xì)分領(lǐng)域做的應(yīng)用場(chǎng)景。 知識(shí)圖譜在各行業(yè)中的應(yīng)用第一個(gè)智能決策平臺(tái)在公安行業(yè)應(yīng)用。 因?yàn)楣灿袛?shù)據(jù),能夠商業(yè)化落地。當(dāng)前的功能偏向于事后分析,歸類完數(shù)據(jù)之后,出了案件,用圖譜也好,數(shù)據(jù)中臺(tái)也好,業(yè)務(wù)中臺(tái)也好,抓住犯人。 另外一個(gè)場(chǎng)景是銀行。 人工智能真正把人從簡(jiǎn)單工作中解放出來,一覽群智智能審單專家系統(tǒng)去年在國(guó)內(nèi)某大型銀行成功上線,首次將人工智能技術(shù)與國(guó)際單證業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)了人工智能領(lǐng)域在單證業(yè)務(wù)中從無到有的突破。 效果非常明顯,從數(shù)量上看,原來審單團(tuán)隊(duì)需要2000名本碩高級(jí)人才,現(xiàn)在只需要100名通用人才。而且,審單效率大幅提高,基本杜絕了滯后的現(xiàn)象。對(duì)于大量票據(jù),將其關(guān)鍵要素處理出來,同時(shí)用知識(shí)圖譜匹配,這個(gè)技術(shù)在保險(xiǎn)、銀行、證券等行業(yè),都有大量的需求。 另外一個(gè)是反洗錢的產(chǎn)品。 大家知道反洗錢,整個(gè)金融的血液是資金,所有的金融犯罪都是跟資金有關(guān)系的,比如說貪污受賄、恐怖性融資等。 所以對(duì)整個(gè)金融體系,像國(guó)家金融監(jiān)管要求的一樣,必須要上反洗錢的系統(tǒng)。 目的很明確。 第一,要做到預(yù)防,是通過人工加規(guī)則的方式。比如這個(gè)人以前沒有放款,突然對(duì)外打了一筆巨額的資金,可能有問題。再比如你是做蘋果生意的,突然給做礦生意的人打了一筆巨額資金,這就需要上報(bào)給人民銀行。 這些可能的問題,首先要經(jīng)過人工審核,比如一天一個(gè)銀行將近八萬筆有可能的嫌疑,但是需要通過人工變成兩百筆。 現(xiàn)階段的方式存在的問題是反應(yīng)很慢。如果用我們的模型,第一,可以快速識(shí)別是不是洗錢交易。第二,我們能做到實(shí)時(shí)交付,可以有效的杜絕金融犯罪的行為。 以上是我們的理解和一些落地的場(chǎng)景。 每一次技術(shù)革命,都會(huì)帶來焦慮,但是,每次的結(jié)果都是人活的更幸福。接下來人工智能的新篇章肯定是以人為本,最重要的問題是讓機(jī)器具有人性,能跟人更好的理解交流,同時(shí)讓人成為超人,讓人的技能得到放大。 謝謝各位。 |
|
|