logo
Docling
InstructLab
正在初始化搜索
    docling-project/docling
    • 主页
    • 概念
    • 示例
    • 集成
    • 参考
    docling-project/docling
    • 主页
      • 安装
      • 使用
        • 支持的格式
        • 增强功能
      • 常见问题
    • 概念
      • 架构
      • Docling 文档
      • 序列化
      • 分块
      • 插件
    • 示例
        • 简单转换
        • 自定义转换
        • 批量转换
        • 多格式转换
        • 在 GPU 系统上,通过 CUDA 启用 flash_attention_2
        • 使用远程模型的 VLM 流水线
        • 图表导出
        • 表格导出
        • 多模态导出
        • 强制整页 OCR
        • 使用 tesseract 自动进行 OCR 语言检测
        • 使用自定义 OCR 模型的 RapidOCR
        • 加速器选项
        • 简单翻译
        • CSV 文件转换
        • 自定义 XML 转换
        • 序列化
        • 混合分块
        • 高级分块与序列化
        • 使用 Haystack 的 RAG
        • 使用 LangChain 的 RAG
        • 使用 LlamaIndex 的 RAG
        • 视觉定位
        • 使用本地 VLM 标注图片
        • 使用远程 VLM 标注图片
        • 图表增强
        • 公式增强
        • 使用 Milvus 的 RAG
        • 使用 Weaviate 的 RAG
        • 使用 Granite 的 RAG [↗]
        • 使用 Azure AI Search 的 RAG
        • 使用 Qdrant 进行检索
    • 集成
        • Bee Agent Framework
        • Crew AI
        • Haystack
        • LangChain
        • LlamaIndex
        • txtai
        • Apify
        • Data Prep Kit
        • InstructLab
        • NVIDIA
        • Prodigy
        • RHEL AI
        • spaCy
        • Cloudera
        • DocETL
        • Kotaemon
        • OpenContracts
        • Vectara
        • 文档转换器
        • 流水线选项
        • Docling 文档
        • CLI 参考

    InstructLab

    Docling 为 InstructLab 提供文档处理能力,使用户能够解锁文档中隐藏的知识,并将其提供给 InstructLab 进行微调,以使 AI 模型与用户的特定数据对齐。

    更多详细信息请参见这篇博文。

    • 🏠 InstructLab 主页
    • 💻 InstructLab GitHub
    • 🧑🏻‍💻 InstructLab UI
    • 📖 InstructLab 文档
    上一页
    Data Prep Kit
    下一页
    NVIDIA
    使用 Material for MkDocs 制作