pdf-craft
Weekly Pick
pdf-craft 是一个开源工具,可将 PDF 文件转换为 Markdown 和 EPUB 格式,利用 AI 自动修复 OCR 错误,支持 GPU 加速,适用于技术文档、书籍数字化和论文研究等场景。
• Copy the embed code to showcase this product on your website
• Share on X to spread the word about this amazing tool
pdf-craft 是一个功能强大的 PDF 处理工具,能够将 PDF 文件转换为 Markdown 和 EPUB 格式。它通过 AI 技术自动修复 OCR 错误,并支持 GPU 加速以提高处理速度。主要特性包括:PDF 转 Markdown(纯本地运行,智能过滤无关元素,自动处理跨页文本顺接,图表和公式自动提取为图片)、PDF 转 EPUB(智能构建书籍结构和目录,提取并保留注释和引用,支持中断恢复分析,LLM 辅助校正 OCR 错误)。技术亮点包括结合 DocLayout-YOLO 进行布局分析,使用 OnnxOCR 进行文本识别,集成 layoutreader 优化阅读顺序,并可接入 DeepSeek 等 LLM 服务。pdf-craft 适用于技术文档阅读、书籍数字化、论文研究和学习材料整理等多种场景。