小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

使用AI大模型搭建檔案知識助理

 你好122 2024-08-17 發(fā)布于江西

自從2022年底ChatGPT發(fā)布以來,AI大模型真正進入快速發(fā)展和應用落地的階段,在各個領域快速催生出大量的應用,總體包括“文生文”、“文生圖”、“文生視頻”、“文生音頻”、“圖生圖”、“圖生視頻”等AIGC(Artificial Intelligence Generated Content,內(nèi)容生成式人工智能)應用方向。另外在一些細分領域,也出現(xiàn)了很多應用大模型能力賦能生產(chǎn)、提質(zhì)增效的應用。

在檔案行業(yè),也有很多先驅(qū)在探索大模型的應用方向,并且有一些實際行動,為我們呈現(xiàn)出全新的理念和應用模式。但受限于各種因素的影響,筆者認為大模型在檔案收、管、存、用等基礎業(yè)務層面的應用具有很強的基礎設施、業(yè)務數(shù)據(jù)等壁壘,應用效果還有待實踐檢驗。今天,我們來聊聊大模型在檔案領域的一個典型應用——檔案知識助理。

01

為什么要做檔案知識助理

檔案知識助理雖然沒有很強很深的技術壁壘,但它很可能為我們檔案從業(yè)者提供一個非常高效、友好的檔案知識獲取窗口,這是我們所有檔案人都需要的,它具有普適性。而且也是我們檔案人學習AI、應用AI的一個很好的入門方向,每個人都可以去積極嘗試,搭建屬于自己的知識助理。

使用AI大模型搭建檔案知識助理

02

為什么要用AI大模型來做檔案知識助理

檔案知識助理其實就是一個檔案知識庫,并借助大模型強大的的對話能力、泛化能力、學習能力、理解能力、邏輯推理能力來提供知識服務。

使用AI大模型搭建檔案知識助理

知識庫其實并不是一個陌生的概念和產(chǎn)品,早在ANI(Artificial Narrow Intelligence,弱人工智能)早期,就有不少公司具備提供所謂的“智能知識庫”產(chǎn)品和服務的能力,例如筆者曾接觸過的智能客服行業(yè),大都具備基于ANI的知識庫產(chǎn)品。雖然目前我們還未正式進入AGI(Artificial General Intelligence,通用人工智能)時代,但基于大模型的知識庫與ANI早期的智能知識庫已不可同日而語了。請看下圖對比:

使用AI大模型搭建檔案知識助理

通俗來講,用大模型來實現(xiàn)知識庫產(chǎn)品,具有以下優(yōu)勢:

  • 可以直接上傳雙層pdf或word文檔,不需要做復雜的整理;

  • 對用戶所提問題的理解能力強,可以實現(xiàn)多輪對話,具備更強的上下文理解能力;

  • 在知識庫之外,可以實現(xiàn)聯(lián)網(wǎng)搜索,拓寬知識覆蓋面;

  • 可以將知識問答集成到第三方平臺,例如微信群、飛書、釘釘?shù)龋?/p>

  • 可以實現(xiàn)本地化部署,更加安全;本地部署可以對大模型做預訓練和微調(diào),更加靈活。

下面,我們就用兩種方式來搭建檔案知識助理,并對其進行實際效果測試。第一種是完全本地化的模式,這種模式受限于筆者硬件配置,并未做大模型的預訓練和微調(diào),而是直接使用了原生的大模型;另一種方式是使用釘釘?shù)腁I助理來搭建,這種模式屬于借用第三方平臺,不支持本地化部署。

03

搭建本地化檔案知識助理

1、系統(tǒng)架構及搭建步驟

使用AI大模型搭建檔案知識助理

注:這個架構不是企業(yè)級應用架構,只適用于我們自己嘗試,如果要做企業(yè)級應用,那數(shù)據(jù)庫就要分布式部署,另外訪問量和數(shù)據(jù)量大的話,也要做集群來提高穩(wěn)定性,語言模型也需要用參數(shù)量更大的。

整個系統(tǒng)完全本地化部署,底層使用ollama來運行大語言模型和向量模型,上層WebUI應用使用FastGPT實現(xiàn),中間層使用OneAPI來做通信,應用數(shù)據(jù)和向量化數(shù)據(jù)分別存儲在MongoDB和PgSql中。如需了解具體的部署步驟,可觀看以下教程:

詳細視頻請在 數(shù)字羅塞塔計劃 公眾號文章中觀看

部署完成后,F(xiàn)astGPT和OneAPI需要做若干配置,并導入知識庫文件,才能初步實現(xiàn)知識問答。

2、本地化大模型的應用效果

完成上述的系統(tǒng)部署和初始化后,我們直接導入了一些國家標準和行業(yè)標準文件(必須是雙層pdf或者word等可編輯文件,圖片和普通pdf不支持)。來看看實際檢索效果和原文的對比吧:

隨便輸入了一個問題,大模型直接給出的答案是不對的,如下圖:

使用AI大模型搭建檔案知識助理

但在下方的知識庫引用中,大模型成功匹配到了知識庫文件中的內(nèi)容。如下圖:

使用AI大模型搭建檔案知識助理

筆者又同樣試了其他很多問題(不超出知識庫的內(nèi)容范疇),并且不斷調(diào)整分段長度和相關度設置,大模型給出的直接回答依然不完美;但畢竟在知識庫引用中能精確匹配到答案了,總體感覺還不錯。期待后續(xù)有條件的朋友能夠完成模型的微調(diào),再給大家呈現(xiàn)出更好的結果。

04

使用釘釘AI助理搭建檔案知識助理

1、搭建步驟

使用釘釘AI助理搭建,就很簡單了,只需要安裝一個最新版本的釘釘。這個就不是本地化部署了,借助的是AI助理背后的強大底模(應該是非開源版的通義千問)。看下圖,直接按步驟操作即可:

使用AI大模型搭建檔案知識助理

需要注意的是:按照上圖步驟創(chuàng)建的助理,是公開的,也就是說發(fā)布后所有釘釘用戶都能搜索到并使用;如果你點擊步驟2后,直接在右側分欄下方點擊“創(chuàng)建AI助理”,那么這個助理就是面向組織內(nèi)部使用的,組織外的人看不到。這兩種方式會影響后面上傳知識文件的方式,前者只能本地上傳,后者可以選擇企業(yè)組織搭建的知識庫。

另外還需要配置一個簡單的Prompt,用來限制大模型的輸出范圍。請注意:千萬不要配置冗余的Prompt,如果你不會寫,就空著,或者寫一個簡單的,劣質(zhì)的Prompt就像畫蛇添足,會極大的干擾大模型的輸出。配置完成的助理,如下圖所示:

使用AI大模型搭建檔案知識助理

2、用釘釘搭建檔案知識助理的應用效果

上效果!我們問一個同樣的問題,看看AI助理和本地化大模型熟優(yōu)熟劣。

使用AI大模型搭建檔案知識助理
使用AI大模型搭建檔案知識助理

答案相當正確,也相當完整。而且給出了知識來源,用戶點擊知識來源后,可以向AI助理的所有者申請查看、下載的權限。

使用AI大模型搭建檔案知識助理

05

對比總結

第一點

釘釘AI助理無需部署,配置簡單,給的直接回答更準確,而且可以查看引用的知識庫原文,支持權限申請。適合于個人或中小企業(yè)日常工作簡單應用。

第二點

本地化知識庫,部署相對復雜,配置有難度,給的直接回答不準確,而且會有幻覺出現(xiàn)(這個在進行預訓練和微調(diào)后,肯定會有改善);也可以查看引用的知識庫原文,匹配度總體較高,但不支持權限申請。適合于搭建企業(yè)級私有的、安全的本地知識庫應用。

END

數(shù)字羅塞塔計劃公眾號致力于作為中立的第三方客觀公正地表達自己對于檔案信息化領域的看法和觀點。真理越辯越明,我們也衷心歡迎越來越多的人投身到檔案數(shù)字資源管理和保存這一領域的研究中來并發(fā)表真知灼見,共同為人類文明的傳承而努力奮斗!

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多