transform_documents

transform_documents(
  self,
  documents: Sequence[Document],
  unwanted_tags: Union[List

Parameters

Name	Type	Description
`documents`*	`Sequence[Document]`	A sequence of `Document` objects containing HTML content.
`unwanted_tags`	`Union[List[str], Tuple[str, ...]]`	Default:`('script', 'style')`
`tags_to_extract`	`Union[List[str], Tuple[str, ...]]`	Default:`('p', 'li', 'div', 'a')`
`remove_lines`	`bool`	Default:`True`
`unwanted_classnames`	`Union[Tuple[str, ...], List[str]]`	Default:`()`
`remove_comments`	`bool`	Default:`False`