|
前幾天,我發(fā)了一篇文章:DeepSeek + Dify :零成本搭建企業(yè)級本地私有化知識庫保姆級喂飯教程,在公眾號,知乎,星球上,很多朋友都跟著進行了實操,也給了我很多的反饋。 在此,我專門做一下集中答疑,希望朋友們少走彎路,主要集中在以下兩點: 一、Dify 和 ollama 關(guān)聯(lián)時,使用本機IP,還是跑不通怎么辦?如果使用本機內(nèi)網(wǎng)IP聯(lián)不通的話,可以嘗試把指定 Ollama 的 API 地址改為 ![]() docker compose downdocker compose up -d二、知識庫 embedding 模型使用哪個比較好?原本為了降低教程難度,我就使用了deepseek-r1模型作為embedding模型來使用了,使用效果也勉強過得去. 但是,deepseek-r1畢竟不是專門的embeddinig模型,他不是專門為了嵌入場景訓(xùn)練的。 所以,使用deepseek-r1作為嵌入模型時,有些問題回答的不是很盡如人意。因此,我又測試了其他幾款專業(yè)embedding模型,綜合結(jié)果顯示:bge-m3 效果最好,這里推薦大家使用 bge-m3 作為嵌入模型。 一)安裝 bge-m3 模型bge-m3 模型安裝和deepseek-r1完全一樣,一個命令即可安裝: ![]() Embedding 模型那么多,為什么選擇 nomic-embed-text ? BGE (BAAI General Embedding) 專注于檢索增強llm領(lǐng)域,經(jīng)本人測試,對中文場景支持效果更好,當然也有很多其他embedding模型可供選擇,可以根據(jù)自己的場景,在ollama上搜索“embedding”查詢適合自己的嵌入模型。 ![]() 二)配置 Embedding 模型![]() ![]() 三)創(chuàng)建知識庫![]() 四)上傳資料![]() 五)保存并處理![]() ![]() 六)知識庫創(chuàng)建完成![]() 七)測試效果對比可以看到,使用bge-m3之前,對于有些問題的回答,答非所問,雖然有時候答案是對的,但是那是蒙的,并沒有引用到正確的知識庫對應(yīng)的信息。 使用了bge-m3之后,很明顯答案有理有據(jù),推理依據(jù)是正確的上下文,而非猜測。 所以,知識庫回答效果跟Embedding模型有很大關(guān)系,需要根據(jù)實際場景進行選型。 ![]() ![]() 如果還有疑問,可以加我微信私聊:ao-ai-coding,也可以通過飛書文檔查看試試答疑,答疑內(nèi)容會在這個文檔內(nèi)實時更新,文檔地址:https://i3k3w6il9z./docx/O8XSdRrt3o30Jmx8ZTccVgY0nLg?from=from_copylink 我是阿坡,專注于AI+RPA自動化提效。 如果在RPA學(xué)習過程中有任何問題,歡迎加我v:ao-ai-coding,拉你進RPA實戰(zhàn)交流群。 我和明鑒老師在平時和學(xué)員交流溝通的過程中,經(jīng)常會遇到,智能體玩的很好的小伙伴,有提效的需求;玩RPA很好的小伙伴,有內(nèi)容創(chuàng)作的需求。 所以,我們覺得是時候讓 RPA和智能體 來一個合體了! 我敢說,你要是學(xué)會了 RPA+智能體,分分鐘起飛!簡直是降維打擊! 因為看到了這個趨勢,我們研發(fā)了一個小冊子,目的是讓更多人能夠了解什么是RPA和智能體,也能讓大家實操學(xué)會怎么樣玩轉(zhuǎn)RPA和智能體! 我們這個小冊子主要提供一個文檔和一個技術(shù)交流群,群里會交流各種好玩的 RPA+智能體 的技術(shù)!低成本的學(xué)習自動化提效,享受效率人生! 內(nèi)容大綱可看下圖,干貨滿滿,內(nèi)容會持續(xù)完善更新,并在群內(nèi)進行講解答疑! ![]() |
|
|