西安旲博智能科技有限公司

智能命名、自动标签、精准 OCR：paperless-gpt 助你节省数小时

浏览次数：366615次发布时间：2025-06-10

paperless-gpt 与 paperless-ngx 无缝配合，可生成 AI 驱动的文档标题和标签，为您节省数小时的手动分类时间。虽然其他工具可能提供 AI 聊天功能，但 paperless-gpt 通过 LLMs 超级增强 OCR 功能，确保高精度，即使面对复杂的扫描图像也能如此。

主要亮点

1、LLM-Enhanced OCR

利用大型语言模型（OpenAI 或 Ollama）实现优于传统 OCR 的效果——将杂乱或低质量的扫描件转换为具有上下文感知能力的高保真文本。

2、使用专业的 AI OCR 服务

LLM OCR：使用 OpenAI 或 Ollama 从图像中提取文本。

Google Document AI: 利用 Google 强大的 Document AI 进行 OCR 任务。

Azure Document Intelligence: 使用 Microsoft 的企业级 OCR 解决方案。

Docling Server: 自托管 OCR 和文档转换服务。

3、自动生成标题、标签和创建日期

不再需要猜测。让 AI 来命名和分类。您可以轻松查看建议并在需要时进行修改。

4、支持 Ollama 中的推理模型

使用推理模型（如 qwen3:8b ）可以大大提高准确性。这是隐私和性能之间的完美平衡！当然，如果您有足够的 GPU 或 NPU，更大的模型将提升体验。

5、自动生成对应方

自动从您的文档中识别并生成对应人，使您更容易跟踪和组织您的沟通。

6、可搜索和可选择的 PDF

生成带有透明文本层的 PDF，这些文本层精确地定位在每个单词上，使您的文档既可搜索又可选择，同时保留原始外观。

7、广泛的定制选项

提示模板：调整你的 AI 提示以反映你的领域、风格或偏好。

标签：决定文档如何被标记——手动、自动或通过基于 OCR 的工作流。

PDF 处理：配置 OCR 增强的 PDF 如何处理，可选择本地保存或上传到 paperless-ngx。

8、简单的 Docker 部署

几个环境变量，你就可以开始了！与 paperless-ngx 一起轻松配置。

使用大型语言模型提升文档管理效率，paperless-gpt 是一款基于 AI 的文档管理工具，具有多项创新功能。其核心功能包括利用 LLM 增强 OCR 技术，显著提升扫描件转化为高保真文本的质量，并支持多种 OCR 服务。AI 自动生成文档的标题、标签和创建日期，用户可进行审核和修改。此外，工具能够自动识别文档中的通信对象并生成可搜索的 PDF，保持原始外观的同时方便查找。支持广泛自定义与简单 Docker 部署，并提供统一的 Web UI，增强用户体验与管理便利性。

相关链接：https://github.com/icereed/paperless-gpt

上一篇： 15+图表类型 + 免费生成 + 私有部署 = AntV m...

下一篇： MNN TaoAvatar - 本地智能数字人可做虚拟客服...

详细内容

CONTENT

智能命名、自动标签、精准 OCR：paperless-gpt 助你节省数小时

联系我们

给我们留言

QQ在线客服

咨询热线