logo
Docling
Prodigy
初始化搜索
    docling-project/docling
    • 首页
    • 概念
    • 示例
    • 集成
    • 参考
    docling-project/docling
    • 首页
      • 安装
      • 用法
        • 支持的格式
        • 增强功能
      • 常见问题
    • 概念
      • 架构
      • Docling 文档
      • 序列化
      • 分块
      • 插件
    • 示例
        • 简单转换
        • 自定义转换
        • 批量转换
        • 多格式转换
        • 在 GPU 系统上,使用 CUDA 启用 flash_attention_2
        • 使用远程模型的 VLM 管道
        • 图形导出
        • 表格导出
        • 多模态导出
        • 强制进行整页 OCR
        • 使用 tesseract 进行自动 OCR 语言检测
        • 使用自定义 OCR 模型的 RapidOCR
        • 加速器选项
        • 简单翻译
        • CSV 文件转换
        • 自定义 XML 转换
        • 序列化
        • 混合分块
        • 高级分块与序列化
        • 使用 Haystack 进行 RAG
        • 使用 LangChain 进行 RAG
        • 使用 LlamaIndex 进行 RAG
        • 视觉基础
        • 使用本地 VLM 标注图像
        • 使用远程 VLM 标注图像
        • 图形增强
        • 公式增强
        • 使用 Milvus 进行 RAG
        • 使用 Weaviate 进行 RAG
        • 使用 Granite 进行 RAG [↗]
        • 使用 Azure AI Search 进行 RAG
        • 使用 Qdrant 进行检索
    • 集成
        • Bee Agent Framework
        • Crew AI
        • Haystack
        • LangChain
        • LlamaIndex
        • txtai
        • Apify
        • Data Prep Kit
        • InstructLab
        • NVIDIA
        • Prodigy
        • RHEL AI
        • spaCy
        • Cloudera
        • DocETL
        • Kotaemon
        • OpenContracts
        • Vectara
        • 文档转换器
        • 管道选项
        • Docling 文档
        • CLI 参考

    Prodigy

    Docling 作为 Prodigy 的 Prodigy-PDF 插件 配方提供。

    更多详情请参阅此博客文章。

    • 🌐 Prodigy 首页
    • 🔌 Prodigy-PDF 插件
    • 🧑🏽‍🍳 pdf-spans.manual 配方
    上一个
    NVIDIA
    下一个
    RHEL AI
    使用 Material for MkDocs 制作