跳到内容

CLI 参考

本页提供了我们命令行工具的文档。

docling

用法

docling [OPTIONS] source

选项

名称 类型 描述 默认值
--from 选择 (docx | pptx | html | image | pdf | asciidoc | md | csv | xlsx | xml_uspto | xml_jats | json_docling) 指定要从中转换的输入格式。默认为所有格式。
--to 选择 (md | json | html | html_split_page | text | doctags) 指定输出格式。默认为 Markdown。
--headers 文本 指定在获取 URL 输入源时使用的 HTTP 请求头,格式为 JSON 字符串
--image-export-mode 选择 (placeholder | embedded | referenced) 文档的图片导出模式(仅适用于 JSON、Markdown 或 HTML)。在 placeholder 模式下,输出中仅标记图片的位置。在 embedded 模式下,图片以 base64 编码字符串的形式嵌入。在 referenced 模式下,图片以 PNG 格式导出并从主导出文档中引用。 ImageRefMode.EMBEDDED
--pipeline 选择 (standard | vlm) 选择处理 PDF 或图片文件的管道。 PdfPipeline.STANDARD
--vlm-model 选择 (smoldocling | granite_vision | granite_vision_ollama) 选择用于 PDF 或图片文件的 VLM 模型。 VlmModelType.SMOLDOCLING
--ocr / --no-ocr 布尔值 如果启用,位图内容将使用 OCR 进行处理。 True
--force-ocr / --no-force-ocr 布尔值 将任何现有文本替换为通过完整内容生成的 OCR 文本。 False
--ocr-engine 文本 要使用的 OCR 引擎。当未设置 --allow-external-plugins 时,可用值包括:easyocr, ocrmac, rapidocr, tesserocr, tesseract。使用 --show-external-plugins 选项可查看允许外部插件时的选项。 easyocr
--ocr-lang 文本 提供 OCR 引擎使用的语言列表,以逗号分隔。请注意,每个 OCR 引擎对语言名称有不同的值。
--pdf-backend 选择 (pypdfium2 | dlparse_v1 | dlparse_v2 | dlparse_v4) 要使用的 PDF 后端。 PdfBackend.DLPARSE_V2
--table-mode 选择 (fast | accurate) 在表格结构模型中使用的模式。 TableFormerMode.ACCURATE
--enrich-code / --no-enrich-code 布尔值 在管道中启用代码增强模型。 False
--enrich-formula / --no-enrich-formula 布尔值 在管道中启用公式增强模型。 False
--enrich-picture-classes / --no-enrich-picture-classes 布尔值 在管道中启用图片分类增强模型。 False
--enrich-picture-description / --no-enrich-picture-description 布尔值 在管道中启用图片描述模型。 False
--artifacts-path 路径 如果提供,指定模型工件的位置。
--enable-remote-services / --no-enable-remote-services 布尔值 使用连接到远程服务的模型时必须启用。 False
--allow-external-plugins / --no-allow-external-plugins 布尔值 必须启用才能从第三方插件加载模块。 False
--show-external-plugins / --no-show-external-plugins 布尔值 列出设置 --allow-external-plugins 选项时可用的第三方插件。 False
--abort-on-error / --no-abort-on-error 布尔值 如果启用,遇到第一个错误时将中止处理。 False
--output 路径 保存结果的输出目录。 .
--verbose, -v 整数 设置详细级别。-v 用于信息日志,-vv 用于调试日志。 0
--debug-visualize-cells / --no-debug-visualize-cells 布尔值 启用调试输出,可视化 PDF 单元格 False
--debug-visualize-ocr / --no-debug-visualize-ocr 布尔值 启用调试输出,可视化 OCR 单元格 False
--debug-visualize-layout / --no-debug-visualize-layout 布尔值 启用调试输出,可视化布局聚类 False
--debug-visualize-tables / --no-debug-visualize-tables 布尔值 启用调试输出,可视化表格单元格 False
--version 布尔值 显示版本信息。
--document-timeout 浮点数 处理每个文档的超时时间,单位为秒。
--num-threads 整数 线程数 4
--device 选择 (auto | cpu | cuda | mps) 加速器设备 AcceleratorDevice.AUTO
--logo 布尔值 Docling 标志
--help 布尔值 显示此消息并退出。 False