Revision as of 20:56, 7 December 2021

External

Internal

Overview

Spark is a third generation unified analytics engine for large-scale data processing. It natively supports batch processing and stream processing. Stream processing is implemented as micro-batching. It uses HDFS as state backend.

Subjects

Concepts

Organizatorium

Spark SQL
PySpark/Spark SQL in interactive mode on JupyterHub.

@@ Line 13: / Line 13: @@
 =Subjects=
 * [[Spark Concepts|Concepts]]
+=Organizatorium=
+* Spark SQL
+* PySpark/Spark SQL in interactive mode on [[JupyterHub]].

Spark: Difference between revisions

Revision as of 20:56, 7 December 2021

Contents

External

Internal

Overview

Subjects

Organizatorium

Navigation menu

Spark: Difference between revisions

Revision as of 20:56, 7 December 2021

External

Internal

Overview

Subjects

Organizatorium

Navigation menu

Search