|
作者 | 何帆(最高人民法院法官)
新年新氣象,除了一堆互聯網大佬高調宣布“未來已來”,一則關于南京中院將引進“法律機器人”(即所謂“阿爾法法官”)輔助辦案的報道,也在法律圈激起波瀾。有法官私下吐槽,人工智能那么“能”,有本事以后別讓我們加班結案??!好在南京中院今天下午及時辟謠:該院從未設立“機器人項目部”,所謂引入“法律機器人”項目,純屬個別企業(yè)捏造。
引起我注意的,是南京中院聲明中的一段話:“司法是具有經驗和價值判斷性質的工作,再聰明的機器或軟件都不能完全替代法官的工作,只能為法官提供辦案支持與輔助?!痹谖铱磥?,至少在現階段,這一認識是理性的。
脫離常識的創(chuàng)新走不遠
這是個浮躁的年代,有踏實做事的,也有賣狗皮膏藥的。一個概念還不具備技術基礎,就已大張旗鼓賣到濫,等趴在上面埋頭研發(fā)的團隊搞出名堂,概念已貶到與情懷等值了。其實,奇點臨近也好,未來已來也好,在商言商,商業(yè)公司為了融資和營銷,有他們的口號策略??稍谌斯ぶ悄軉栴}上,法院還是應當立足本位,保持清醒,不要被兜售概念、囊中無物的技術公司“綁架”或忽悠。
是的,我們要建設“智慧法院”,要大力推進信息化3.0建設,可我們需要的智慧和智能,第一要務還是輔助和服務法官辦案,而不是替代司法裁決、淘汰辦案法官。另一方面,即使是智能輔助和服務,也需要滿足三個標準:
一是要切實解決問題,而不是花樣和噱頭。
二是要體現技術含量,附加內容增量,不能僅僅立足于互聯互通。你能說檢察官戴著藍牙耳機出庭就叫“互聯網 公訴”么?你能說法官把當事人拉到微信群調解里就叫“互聯網 審判”么?
三是要符合常識和司法規(guī)律。有人說,未來所有庭審都可以在網絡上進行。是的,在遠程調解、證人和專家作證方面,互聯網確實有無可比擬的優(yōu)勢,但還是解決不了證據原件質證的問題。目前號稱實現互聯網庭審的,主要也是簡單無重大爭議,且征得當事人同意的案件。用一位資深法官的話說,巨變時代,必須創(chuàng)新,但違背常識的創(chuàng)新,注定無法持續(xù)。
人工智能的燃料和引擎
60多年前,科技領域就一直吆喝人工智能,到上世紀70年代才偃旗息鼓。為什么中斷?因為技術本身的實現程度支撐不起足夠多的應用,又無法在商業(yè)中深度滲透,投資者看不到巨額投入后的效果,遇冷是必然的事。
互聯網和云計算的進步,讓人工智能熱潮復興,機器的“深度學習”概念再度火起來。深度學習得以復興,關鍵點有兩個:一是互聯網提供了“海量數據”;二是云計算提供了遠超以往的計算能力。這兩點就像燃料和引擎,疊加起來,就可以讓人工智能技術加速。
截至目前,法律人工智能的發(fā)展,主要體現在語音識別、圖像識別、文本分析和數據整合領域,雖然技術飛躍程度不高,但已推動了某些法律行業(yè)的功能轉型,甚至導致部分中小律所的生存危機。例如,美國Blackstone Discovery公司推出的法律文本分析系統,就斷了許多律所的財路。這個系統分析150萬份法律文件,成本還不到10萬美元,關鍵是準確度還比人工分析高出40%。除此之外,還有LegalZoom對法律文件服務領域的挑戰(zhàn),Onomatics對商標分析服務領域的挑戰(zhàn),Lex Machina對專利服務領域的挑戰(zhàn),Wevorce對離婚訴訟服務領域的挑戰(zhàn),等等。
司法大數據的局限
具體到我國,最高法院構建的“中國裁判文書網”,為法律人工智能的發(fā)展提供了“燃料”,而各個大數據公司所孜孜努力的,正是“盤活”這些“燃料”的算法。
然而,不要以為囤積了一大堆司法數據,人工智能就隨之實現了。這里面需要考慮三個問題:
第一,“體量”并不代表“質量”。有大數據公司對中國裁判文書網上的海量文書進行識別,發(fā)現有相當一部分是“冗余數據”,有的是“一份文書,不同案號”,有的則是因為重復傳送或錯誤傳送。從法律適用角度看,相當一部分簡單案件的文書,也沒有數據挖掘價值。
第二,“大”并不代表“準”。消費者未必是理性的,可商家仍要根據客戶的購買數據調整營銷策略,但判案子不像買東西。同樣是停車場的保管責任糾紛,100個法官可能有100種判法,其中25個判法類似,但不能說這25個判法就一定代表著正確的方向。司法是判斷的技能,簡單的數量比對是數學,但不是算法。
第三,現在并不代表未來。隨著查詢檢索和智能推送技術的發(fā)展,類案文書的說理和考量未必多元,反而會更加趨同。如若不信,不妨搜一搜有多少離婚案件的判詞愛用“人生如夢”,結果肯定會嚇您一跳。換言之,目前所謂的人工智能是以之前的數據為基礎,試圖解決未來的類似問題,但是,技術和社會是不斷發(fā)展變化的,類似問題在不同時期會有不同解決方案。所以,我們對“智能”的期盼,既包括裁判規(guī)則的類似應用,也包含為既有規(guī)則的改變和反思提供數據積累。
走向智慧法院之路
潑完冷水,該談談建設意見了。對于人工智能在司法領域的應用,我個人還是持開放和樂觀態(tài)度??傮w來看,或許有以下幾步可以走。
第一步:通過智能語音識別技術,將審判輔助人員從記錄或咨詢事務中解脫出來
一次到某法院旁聽庭審,發(fā)現從法官、檢察官到律師,說話都一句一頓,是他們在字斟句酌么?不是,因為大家都怕書記員記錄跟不上。很多法官私下開玩笑,這哪兒是庭審為中心,簡直是以書記員為中心。書記員抽調不來,庭開不了;書記員記得太慢,口開不了。
引入智能語音識別技術進行庭審記錄,乃至法官合議記錄和審委會討論記錄,已被證明是可行的。不過,即使是這一小步,也存在諸多技術瓶頸。例如,多人交互發(fā)言的“分音”問題。從語音到文字的轉換是進步,但哪句話是誰說的,也得有一個識別過程。特別是復雜案件的庭審和討論,一會兒原被告一會兒律師,一會兒偵查員一會兒專家證人,你一言我一語,如果不對照音頻視頻,誰還記得每句話出自何人。目前的解決思路,一是識別話筒位置,二是預先存檔識別。但,這個問題不解決,就匆匆撤掉書記員,只會讓一線法官叫苦不迭。
與之類似的,還有訴訟引導工作。諸如 “立案去哪個窗口,要提交哪些材料”之類的簡單問題,當然可以放心交給“導訴機器人”,由它們通過語音識別技術自動回答。不過,但凡做過訴訟服務工作的法官,就知道當事人的訴求五花八門,絕不止咨詢一個法律問題或收費標準那么簡單。在現階段,“導訴機器人”還是錦上添花的事物,無法做到包打天下。對這個問題,必須有清醒認識。
第二步:將智能圖像和文件識別技術嵌入法官辦案系統,將法官從簡案處理和繁瑣文牘中解脫出來
前已述及,許多大數據公司和專業(yè)輔助機構已經取代傳統律所,成為圖像識別、文本分析領域的“龍頭”。律所可以通過流程外包、工作轉包或直接購買等方式,獲取相關服務。對法院而言,一些訴訟事務可以交給律師來做(如提交某個領域的法律分析報告),但一些與審判流程和裁判形成密切相關的基礎工作,必須由自己完成。
在我看來,目前最需要做的,是為“智慧法院”鋪路,即以法院日常工作為場景,構建多部門多用戶的互聯系統,打通數據壁壘,提升司法運行的效率。構建當事人\律師—審理法官—執(zhí)行法官—相關部門的互聯互通網絡。 這其中,有的屬于數據化問題,如電子閱卷、EMS快遞單打印、文書表格打印、電子簽章套紅打印等;有的需要進一步加強系統集成,如電子送達、串案套改、核心信息自動嵌入文書、立案與審判信息雙向流轉補充等;有的則需要適當引入人工智能技術,如類型化案件中裁判文書的自動生成(尤其是要素式、表格式、令狀式裁判文書)、類案智能推送、同案不同判警示、文書常見錯誤提示等。
需要強調的是,目前的人工智能技術,已基本實現第一步和第二步齊頭并進,在不少法院也已初見成效。但是,語音識別和圖像識別只是入門環(huán)節(jié)。所謂輔助辦案,主要是能適應不同專業(yè)場景,輔助法官判斷和決策,達到這一步,還有漫長的路要走。
第三步:通過數據提純、算法測試和專業(yè)訓練,讓系統變得更加智能,輔助法官決策判斷
實現這一步,是以海量數據為基礎,以類型化案件為突破口,通過提煉裁判規(guī)則、研發(fā)最優(yōu)算法、歸納既有經驗,在類型化案件中實現以裁判規(guī)則、審判經驗歸納為基礎的有限智能化。之所以強調“有限”,是因為它的智能程度,取決于我們能否找出共性的可以計算的問題,也取決于系爭案件能否類型化。于此,既可以針對某幾類案件的全部,也可以針對某一類案件的具體問題。可以預見的是,在類型化案件中,有可能形成統一的智能化算法;在不那么規(guī)格化的案件中,至少可以做到法律依據提醒、政策比較和類案參考。在此基礎上,深度智能化才有可能。
機器的深度學習也有快慢,你喂它吃粗糧土糧,成長就粗燥緩慢;你喂它吃精糧細糧,成長就日新月異。很多法院都有錯覺,以為把幾千萬份裁判文書數據扔給機器,它就能全知全能、無案不精,實際上,離開科學算法和測試反饋,系統根本不可能變得智能。
所以,推動機器在法律領域的深度學習,必須跨越三個門檻:
第一個是足夠的數據體量和質量。集全法院、檢察院和律師行業(yè)的各類數據,通過關聯比對、系統洗冗進行清洗、融合,獲得足夠的有效數據。
第二個是提取共性規(guī)則,研發(fā)科學算法。這里的規(guī)則,包括法律、司法解釋、指導性案例和參考性案例,也包括從海量文書中提取出來的裁判規(guī)則和共性因素。這項工作,光靠工程師無法完成,光靠一個或兩個法律人也根本搞不定,它需要匯聚許多資深法律人的力量,一個法條一個法條,一個案由一個案由,一個請求權基礎一個請求權基礎,一個罪名一個罪名,去攻克,去提煉,才有可能初見成效。
第三個是法律人的深度參與。美國科技博客VentureBeat近日撰文預測2017年人工智能的發(fā)展,就提出,人工智能若想取得長足進步,就必須仰仗更專業(yè)的人工訓練。只有在專業(yè)領域有遺留成就的人,才能推動機器進行更“深度”的學習。 我有個朋友參加某法院的審判輔助系統建設招標和演示,事后吐槽說,管錢管技術的副院長來了,技術、行裝部門的負責人也來了,可就是看不到一個審判部門的人,難道這項工作和法官沒有關系嗎?
其實,工程師可以解決算法問題,但在機器的深度學習方面,法律人才是真正的“導師”。算法的基礎是裁判規(guī)則,而規(guī)則要靠人去提煉。提煉完畢之后,還得有法律人給數據打上標簽,或是作為訓練集,或是作為測試集,交給機器判斷,再由法律人反饋,深度學習才能成為可能。
我們應該認識到,智慧法院的立足點和出發(fā)點,是法院的智慧。法院的智慧來源于法官,而非技術公司。法院的人工智能,說到底是把法官的智慧整合好、利用好。不在這一點上下功夫,做研發(fā),就不可能有智慧法院。認為只要投入資金、貢獻數據、購買服務,就能建設好“智慧法院”,是天方夜譚;沒有法官的智慧參與,認為技術公司能包攬一切,也是緣木求魚。
第四步:也許真會有“阿爾法法官”呢?但既然距離第三步成功還很遙遠,就先別惦記第四步了吧
總之,法律人工智能是大方向,是看得見的未來,但還需要巨大的研發(fā)投入,換言之,“投入多少人工,就有多大智能”。那些以人工智能為噱頭,卻沒有實際投入的項目,遲早會被淘汰。眼下最需要做的,是踏踏實實推進機器深度學習,將法官從重復勞動和繁瑣事務中解放,從技術上健全法律統一適用和結果預判機制。現在就嚷嚷機器人審判的,十個有ten個在吹牛逼。換句話說,你連法條都馴服不了,還指望能馴服數據?
未來已來,而我們任重道遠!
|
|
|