PySparkDataFrameLoader

PySparkDataFrameLoader(
  self,
  spark_session: Optional[SparkSession] = None,
  df: Optional[Any]

Bases

BaseLoader

Name	Type	Description
`spark_session`	`Optional[SparkSession]`	Default:`None` The SparkSession object.
`df`	`Optional[Any]`	Default:`None` The Spark DataFrame object.
`page_content_column`	`str`	Default:`'text'`
`fraction_of_memory`	`float`	Default:`0.1`