DeepSeek dify 本地知識庫：真的太香了

芥子c1yw3tb42g 2025-02-18 發(fā)布于陜西

展開全文

群友一直希望我做一個dify的教程，我把去年的dify鏟了，重新安裝了一遍。同時基于以前的文章提問，以及群友的問題，我先做一個知識科普，不感興趣的可以繞過這塊。

國產(chǎn)AI之光！DeepSeek本地部署教程，效果媲美GPT-4

服務器繁忙，電腦配置太低，別急deepseek滿血版來了

DeepSeek+本地知識庫：真的太香了(修訂版)

DeepSeek+本地知識庫：真是太香了（企業(yè)方案）

本地DeepSeek下載慢，中斷、內(nèi)網(wǎng)無法安裝方案來了

最輕量級的deepseek應用，支持聯(lián)網(wǎng)或知識庫

deepseek一鍵生成小紅書爆款內(nèi)容，排版下載全自動！睡后收入不是夢

知識科普

關于模型

大語言模型（LLM）是通過深度學習技術，基于海量歷史文本數(shù)據(jù)訓練出的概率生成系統(tǒng)。

能力邊界

知識時效性：模型知識截止于訓練數(shù)據(jù)時間點
推理局限性：本質是概率預測而非邏輯運算，復雜數(shù)學推理易出錯（deepseek的架構有所不同）
專業(yè)領域盲區(qū)：缺乏垂直領域知識
幻覺現(xiàn)象：可能生成看似合理但實際錯誤的內(nèi)容

更新機制

全量重訓練：需重新處理TB級數(shù)據(jù)，消耗數(shù)千GPU小時（這個我們直接排除）
微調(Fine-tuning)：用領域數(shù)據(jù)調整模型參數(shù)，成本仍較高（這個也需要一定的成本）
上下文學習：通過提示詞臨時注入知識，但受限于上下文長度（這個我們通過外掛知識庫實現(xiàn)）

綜上，我們能做的更新機制就是給它通過提示詞上下文臨時注入知識。

關于知識庫

維度	廣義知識庫	模型知識庫
數(shù)據(jù)來源	外部結構化/非結構化數(shù)據(jù)（文檔、數(shù)據(jù)庫等）	預訓練模型內(nèi)嵌的知識（如GPT的訓練數(shù)據(jù)）
更新方式	手動或API動態(tài)更新（如企業(yè)知識庫）	依賴模型重訓練或微調
知識范圍	垂直領域或特定業(yè)務場景（如產(chǎn)品手冊）	通用知識（訓練數(shù)據(jù)截止時間前的信息）

我們之前說的知識庫都是廣義知識庫。

在關于模型哪里我們說了，我們可以通過提示詞臨時注入知識，給大模型，但是大模型的上下文是有長度限制的，我們通過各種技術把最合適的內(nèi)容挑選出來，然后給大模型。

關于嵌入模型

嵌入模型是一種將高維離散數(shù)據(jù)（文本、圖像等）轉換為低維連續(xù)向量的技術，這種轉換讓機器能更好地理解和處理復雜數(shù)據(jù)。

舉一個例子來理解向量，你正在玩一個叫做'猜詞'的游戲。你的目標是描述一個詞，而你的朋友們要根據(jù)你的描述猜出這個詞。你不能直接說出這個詞，而是要用其他相關的詞來描述它。例如，你可以用'熱'、'喝'、'早餐'來描述'咖啡'。嵌入模型就是將一個詞轉化為其他相關詞的專用模型。

'熱'、'喝'、'早餐' 可以理解為向量。不過向量值是在向量空間的特定位置，在這個空間里語義相近的詞會自動聚集起來。所以就有了相似度的概念，相似度越高，越匹配。

我們使用的bge-m3 只能向量化出1024維。

 ollama show bge-m3:latest
    architecture        bert
    parameters          566.70M
    context length      8192
    embedding length    1024
    quantization        F16

為什么沒有匹配到知識

知識預處理

1，上傳文檔

2，將文檔分割成適當大小的文本塊

3，使用embedding模型將每個文本段轉換為向量

4，將向量和原文存儲到向量數(shù)據(jù)庫中

查詢處理階段

1，將用戶輸入問題轉換為向量

2，在向量庫中檢索相似內(nèi)容

3，將檢索到的相關內(nèi)容作為上下文提供給LLM

我們用的本地應用工具，一般都是粗粒度分段，向量化的質量沒法保證。

本地知識庫安全嗎？

根據(jù)上一步，我們可以知道本地知識庫+本地大模型是安全的。

本地知識庫+遠端api的大模型，會把片段上傳。

dify安裝

前提條件

假設你已經(jīng)安裝了docker，docker安裝不同的架構安裝方式不一樣，這里就不做教程了。已經(jīng)登錄了docker

安裝完docker以后，記得調整docker鏡像的存儲地址。

已經(jīng)安裝了docker，并且登錄了
已經(jīng)安裝了git win上docker安裝地址： https://docs./desktop/setup/install/windows-install/#wsl-2-backend

安裝

下載dify

通過官網(wǎng)下載，如果你沒有魔法，可以從網(wǎng)盤里那對應的

# 進入要下載的目錄，打卡命令提示行工具，cmd或者powershell
cd E:\ai\code
#下載
git clone https://github.com/langgenius/dify.git
# 國內(nèi)鏡像站
https:///dify_ai/dify

如果沒有git環(huán)境，可以直接從網(wǎng)盤下載壓縮包。

我們下載以后，只關注docker文件夾和README_CN.md即可。

清理（非必須）

由于我的dify安裝的比較早，是0.7.x版本，為了給大家演示，就把原來的鏟了。如果你以前安裝過dify，使用以下命令清理歷史鏡像

cd docker 進入目錄
# 清理歷史鏡像
docker-compose down -v --rmi all

創(chuàng)建配置

我們進入dify目錄下的docker目錄中,比如我的 E:\ai\code\dify\docker

# 以示例創(chuàng)建一個.env的文件，執(zhí)行下面命令
cp .\.env.example .env

修改dify綁定ip

API 服務綁定地址，默認：0.0.0.0，即所有地址均可訪問。剛開始我以為是控制dify對外暴露的服務的，改成了127.0.0.1,然后出現(xiàn)以下的502，折騰了我快3個小時。

修改端口（非必須）

默認占用的是80和443端口，如果你本機已經(jīng)部署了其他的應用，占了該端口，修改.env文件中的下面兩個變量

EXPOSE_NGINX_PORT=8001
EXPOSE_NGINX_SSL_PORT=8443

上傳文件大小

默認上傳圖片大小是10MB,上傳視頻大小是100MB,文件默認是50MB,如果有需要修改下面對應的參數(shù)

# Upload image file size limit, default 10M.
UPLOAD_IMAGE_FILE_SIZE_LIMIT=10
# Upload video file size limit, default 100M.
UPLOAD_VIDEO_FILE_SIZE_LIMIT=100
# Upload audio file size limit, default 50M.
UPLOAD_AUDIO_FILE_SIZE_LIMIT=50