Pipeline Module

pipeline.py

End-to-end conversion pipeline linking DOCX reading, classification, and DITA writing.

Responsibilities

This orchestrator performs orchestration only and avoids doing any structural transformations, which are delegated to collaborators.

class dita_sop_converter.pipeline.ConverterPipeline(classifier=None)

Bases: object

DOCX → DITA conversion orchestrator.

The pipeline enforces directory creation ahead of writing to eliminate lazy I/O errors during media conversion.

run(input_path, output_dir, map_id=None)

Execute the pipeline.

Return type:

str

Parameters: