小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

顛覆傳統(tǒng) OCR 技術,用 AI 打造高質(zhì)量文檔!

 kibcat 2024-08-26 發(fā)布于美國

Image

在如今信息爆炸的時代,如何高效處理大量掃描文檔成了每個大家日常生活工作中必備技能。

今天,給大家推薦的一款基于 LLM 的 OCR 掃描 PDF 開源工具 LLM-Aided OCR。

結合了多模態(tài)大語言模型(LLM)和 OCR 技術,能夠幫助你輕松將掃描 PDF 轉換為高精度的 Markdown 文檔,提升工作效率不止一點點。

Image

GitHub:https://github.com/Dicklesworthstone/llm_aided_ocr

工具特點

  • PDF 轉圖像:使用 pdf2image 將 PDF 轉換為圖像,支持處理特定頁面范圍;

  • OCR 處理:使用 Tesseract 進行 OCR 處理,從圖像中提取文本;

  • 高效錯誤糾正:通過 LLM 進行 OCR 錯誤修正,可以使用本地 LLM,也可以使用 API(如 OpenAI、Anthropic);

  • 智能文本分塊:將全文分割成更易于處理的 chunks,保留自然句子邊界;

  • Markdown 格式化:將文本轉換為標準的 Markdown 格式;

  • 質(zhì)量評估:使用 LLM 比較原始 OCR 文本和處理后的輸出,提供質(zhì)量評分和解釋。

簡單來說

  1. 首先將 PDF 文件轉為圖像;

  2. 然后進行 OCR 掃描處理,從圖像中提取文本;

  3. 再結合本地 LLM 或 API 服務(如 OpenAI、Anthropic)糾正 OCR 掃描提取到的錯誤;

  4. 最后將掃描后的 PDF 文件轉換成高準確度、高質(zhì)量的 Markdown 文本;

  5. 同時還與原始 OCR 文本和處理后的輸出進行對比。

最后

以上,就是 LLM-Aided OCR 工具的介紹。

有了該工具,那些掃描后的文檔可一鍵轉換為高質(zhì)量、高準確度的文本,更易于閱讀。

文中所提到的所有開源項目與工具,已收錄至 GitHubDaily 的開源項目列表中。

該列表包含了 GitHub 上諸多高質(zhì)量、有趣實用的開源技術教程、開發(fā)者工具、編程網(wǎng)站等內(nèi)容。

從 2015 年至今,累計分享 3500 個開源項目,Star 增長 24000 ,有需要的,可訪問下方 GitHub 地址自取:

GitHub:https://github.com/GitHubDaily/GitHubDaily

Image

好了,今天的分享到此結束,感謝大家抽空閱讀,我們下期再見,Respect!

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多