目录

PySpark - 讨论

Apache Spark是用Scala编程语言编写的。 为了用Spark支持Python,Apache Spark社区发布了一个工具PySpark。 使用PySpark,您也可以使用Python编程语言中的RDD。 正是由于一个名为Py4j的库,他们才能实现这一目标。 这是一个介绍性教程,涵盖了数据驱动文档的基础知识,并解释了如何处理其各种组件和子组件。
↑回到顶部↑
WIKI教程 @2018