Docling
Vectara
正在初始化搜索
docling-project/docling
主页
概念
示例
集成
参考
Docling
docling-project/docling
主页
主页
安装
安装
使用
使用
支持的格式
增强功能
常见问题
常见问题
概念
概念
架构
Docling 文档
序列化
分块
插件
示例
示例
🔀 转换
🔀 转换
简单转换
自定义转换
批量转换
多格式转换
在 GPU 系统上,使用 CUDA 启用 flash_attention_2
使用远程模型的 VLM 流水线
图表导出
表格导出
多模态导出
强制整页 OCR
使用 tesseract 进行自动 OCR 语言检测
使用自定义 OCR 模型的 RapidOCR
加速器选项
简单翻译
CSV 文件转换
自定义 XML 转换
✂️ 序列化与分块
✂️ 序列化与分块
序列化
混合分块
高级分块与序列化
🤖 使用 AI 开发框架进行 RAG
🤖 使用 AI 开发框架进行 RAG
使用 Haystack 进行 RAG
使用 LangChain 进行 RAG
使用 LlamaIndex 进行 RAG
视觉定位
🖼️ 图片标注
🖼️ 图片标注
使用本地 VLM 标注图片
使用远程 VLM 标注图片
✨ 增强开发
✨ 增强开发
图表增强
公式增强
🗂️ 更多示例
🗂️ 更多示例
使用 Milvus 进行 RAG
使用 Weaviate 进行 RAG
使用 Granite 进行 RAG [↗]
使用 Azure AI Search 进行 RAG
使用 Qdrant 进行检索
集成
集成
🤖 Agentic / AI 开发框架
🤖 Agentic / AI 开发框架
Bee Agent 框架
Crew AI
Haystack
LangChain
LlamaIndex
txtai
⭐️ 精选
⭐️ 精选
Apify
Data Prep Kit
InstructLab
NVIDIA
Prodigy
RHEL AI
spaCy
🗂️ 更多集成
🗂️ 更多集成
Cloudera
DocETL
Kotaemon
OpenContracts
Vectara
参考
参考
Python API
Python API
文档转换器
流水线选项
Docling 文档
CLI
CLI
CLI 参考
Vectara
Docling 在
Vectara
中可用作文档解析器。
💻
Vectara GitHub 组织
vectara-ingest GitHub 仓库
📖
Vectara 文档
回到顶部