Class●Since v0.0

MarkdownHeaderTextSplitter

Splitting markdown files based on specified headers.

MarkdownHeaderTextSplitter(
  self,
  headers_to_split_on: list[tuple[str, str]],
  return_each_line: bool = False,
  strip_headers: bool = True,
  custom_header_patterns: dict[str, int] | None = None
)

Parameters

Name	Type	Description
`headers_to_split_on`*	`list[tuple[str, str]]`	Headers we want to track
`return_each_line`	`bool`	Default:`False` Return each line w/ associated headers
`strip_headers`	`bool`	Default:`True` Strip split headers from the content of the chunk
`custom_header_patterns`	`dict[str, int] \| None`	Default:`None` Optional dict mapping header patterns to their levels. For example: `{"": 1, "": 2}` to treat `Header` as level 1 and `Header*` as level 2 headers.