|

??MinerU是一款一站式開(kāi)源高質(zhì)量數(shù)據(jù)提取工具,支持從PDF、網(wǎng)頁(yè)和電子書中提取數(shù)據(jù),并轉(zhuǎn)換為Markdown格式。
??鏈接:
https://github.com/opendatalab/MinerU
主要能力: ?? 多功能提?。褐С諴DF文檔、網(wǎng)頁(yè)和多格式電子書的高質(zhì)量數(shù)據(jù)提取。 ??? 跨平臺(tái):兼容Windows、Linux和macOS平臺(tái),支持CPU和GPU加速。 ?? Markdown轉(zhuǎn)換:能夠?qū)⑻崛〉膬?nèi)容轉(zhuǎn)換為Markdown格式,保留原始文檔的結(jié)構(gòu)和格式。 ?? 開(kāi)源工具:包含多個(gè)開(kāi)源組件,如PaddleOCR、PyMuPDF和pdfminer.six。 ?? 詳細(xì)文檔:提供詳細(xì)的安裝和使用指南,支持二次開(kāi)發(fā)和自定義配置。


精心制作免費(fèi)視頻教程: https://space.bilibili.com/209746320
|