spark 2.2.0 action操作python版

原創

豆筱豆1993

2018-09-03 20:48

import os
import sys
os.environ['SPARK_HOME'] = '/opt/spark'
sys.path.append("/opt/spark/python")

from pyspark import SparkContext
from pyspark import SparkConf

def reducetest():
    sc = SparkContext("spark://node0:7077", "reduce")
    list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    listRdd = sc.parallelize(list)
    count =listRdd.reduce(lambda x,y:x+y)
    print count
    sc.stop
def collecttest():
    sc = SparkContext("spark://node0:7077", "collec")
    list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    listRdd = sc.parallelize(list)
    collect =listRdd.collect()
    print collect
    sc.stop
def counttest():
    sc = SparkContext("spark://node0:7077", "count")
    list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    listRdd = sc.parallelize(list)
    count =listRdd.count()
    print count
    sc.stop
def taketest():
    sc = SparkContext("spark://node0:7077", "take")
    list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    listRdd = sc.parallelize(list)
    three =listRdd.take(3)
    print three
    sc.stop
def saveAstextFiletest():
    sc = SparkContext("spark://node0:7077", "saveAstextFile")
    list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    listRdd = sc.parallelize(list)
    listRdd.saveAsTextFile("/count")
    #print three
    sc.stop
def countByKeytest():
    sc = SparkContext("spark://node0:7077", "countByKey")
    listtest = [("class1","elo"), ("class2","jave"), ("class1","tom"), ("class2","smi")]
    listRDD = sc.parallelize(listtest)
    count = listRDD.countByKey()
    print count
def f(x):
    print(x)
def foreachtest():
    sc = SparkContext("local", "foreach")
    sc.parallelize([1, 2, 3, 4, 5]).foreach(f)


if __name__ == '__main__':
    #reducetest()
    #collecttest()
    #counttest()
    #taketest()
    #saveAstextFiletest()
    #countByKeytest()
    foreachtest()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

spark 2.2.0 action操作python版

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

基於docker的elasticsearch 7.5.1 搭建

蜜罐的一些想法

docker 環境下 supervisor中出現的一些問題

基於docker的kibana 7.5.1搭建

git 配置上傳到gitlab（Windows7）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結