|
導讀 本期將介紹并演示C++ OpenCV使用PaddleOCR做文字識別的步驟與效果。 介紹百度深度學習框架PaddlePaddle開源的OCR項目PaddleOCR近期霸榜github。使用測試后發(fā)現(xiàn)識別效果很好,對于簡單的應用(車票車牌身份證等),直接用項目提供的模型即可使用。特殊應用,可自己訓練后使用。上篇文章已介紹了Python OpenCV使用步驟,文章鏈接如下: 讓OCR更簡單 | PaddleOCR+OpenCV實現(xiàn)文字識別步驟與代碼演示本文將介紹C++ OpenCV使用PaddleOCR做文字識別步驟。 效果展示第一部分使用Halcon OCR實例中的部分圖片驗證,測試效果如下視頻: 第二部分使用車牌識別圖片驗證,測試效果如下視頻: 實現(xiàn)步驟(1) 下載PaddleOCR 2.0源碼: https://github.com/PaddlePaddle/PaddleOCR ![]() 解壓后: ![]() (2) 下載paddle_inference_install_dir文件并解壓: https://www./documentation/docs/en/guides/05_inference_deployment/inference/windows_cpp_inference_en.html ![]() 解壓后: ![]() (3) 下載OpenCV Release版并解壓,這里使用4.4.0版本: ![]() (4) CMake編譯PaddleOCR源碼:使用版本我這里選擇現(xiàn)成的VS2017 x64,CMake 3.16,注意下面藍色部分中3個目錄配置,然后依次Config和Generate,生成ocr_system.sln。 ![]() (5) 打開ocr_system.sln,選擇x64 Release模式,生成ALL_BUILD,生成成功后,Release文件夾會生成ocr_system.exe。 (6) 下載識別模型(輕量級和通用型模型),下載地址: https://github.com/PaddlePaddle/PaddleOCR ![]() 輕量級模型(模型文件小約9.4M,識別速度快,時間約為通用型模型一半,識別效果一般情況夠用,相較通用型模型差一些): ![]() 通用型模型(模型文件大約155M,識別速度慢,識別效果相較輕量級模型更好): ![]() (7) 將其他所需文件復制到ocr_system.exe同目錄,包括config.txt(配置文件)、ppocr_keys_v1.txt(字庫文件) ![]() ![]() config.txt配置如下,注意修改下面紅色部分路徑為自己的 ![]() 所需文件如下: ![]() (8) cmd運行測試:ocr_system.exe config.txt 1.png ![]() ![]() (9) 如果想將功能添加到自己項目中,可以查看main.cpp做參考 ![]() 上面效果預覽中的2個視頻效果就是我加了MFC界面的簡單應用,大家也可以自己嘗試。視頻中的MFC Demo源碼與素材均已上傳至知識星球中,需要的朋友可以加入獲取。 |
|
|
來自: F2967527 > 《PaddleOCR》