原创 04RDD五大特性

RDD是基礎: Resilient Distributed Dataset 彈性分佈式數據集 五大特性: A List of partitions 分區列表 A function for computing ea

原创 03讀取文件並排序

#!/usr/bin/python # -*- coding:UTF-8 -*- # 文件名:ReadFile.py __author__ = "haohao" # 讀取文件並排序 from pyspark import Sp

原创 19類型判斷模式匹配

1.類型判斷 Scala中一切的父類是Any。 AnyRef是Any的子類,它是引用類型的父類。 AnyVal是Any的子類,它是所有值類型的父類。 AnyVal的子類有9個(基本數據類型):Byte,Short,Int,Long

原创 22隱式轉換

1.隱式轉換 其實就是添加一個關鍵字[implicit],這種轉換是自動執行的,將一種類型轉換爲另一種類型 //定義隱式類: implicit def m(x:Double) = x.toInt val i:Int = 3.

原创 20optionFuture

1.option類型 用來表示可能有值,也可能沒有值。 分別有兩個子類:Some,None。 //option參數相當於一個元組 val op:Option[(String,Int,Boolean)] = Some("hao",

原创 00idea快捷鍵

IntelliJ Idea 常用快捷鍵列表 Ctrl+Alt+t 選擇代碼塊 try catch Alt+回車 導入包,自動修正 Ctrl+N 查找類 Ctrl+Shift+N 查找文件 Ctrl+Alt+L 格式化代碼

原创 06分支循環

1.分支if object IfDemo{ /* java中有?:(三目運算符),但必須有返回值。 Scanner sc = new Scanner(System.in); int input = sc.nextInt

原创 16Lazy,函數,並行

1.Lazy關鍵字 添加到變量之前,做到延遲加載,只有調用的時候纔會執行計算。 類似於單例中的懶漢模式--> 不調用方法之前對象是不存在的。 1-構造方法私有化(無參) 2-創建一個靜態私有變量數據類型是當前類的數據類型且不進

原创 15練習

object ZuoYe{ def main(args:Array[String]):Unit = { //創建一個list集合 val list1 = List(1,2,3,4,5,6,7) //將list

原创 os.remove出現拒絕訪問

os.rmdir() 刪除單級目錄 os.remove() 刪除一個文件 os.removedirs() 遞歸刪除空目錄 os.rep() 路徑分隔符(window和Linux不一致) 使用os.remove刪除非空文件

原创 18伴生類

1.伴生類和伴生對象 存在一個class類,另有一個重名的object類,則object類就是class類的伴生類。 伴生類創建的對象的就是伴生對象。類和伴生類之間可以互相訪問私有成員。 class Animal { var

原创 09方法的定義

0.Scala中嚴格區分方法和函數。 1.方法的定義 1.1標準形式: def 方法名(參數列表):返回值類型 = {方法體} 1.2有隱式轉換,自動推斷,可省返回值類型: def 方法名(參數列表) = {方法體} 如果

原创 04變量常量

1.變量和常量(var和val) ①Scala中不要明確表示數據類型,會自動進行推斷(隱式轉換)。 ②val可以看作是java中final修飾一個常量;使用val修飾不能不賦值; 默認匿名變量使用val修飾;不能改其引用內存地址

原创 通過pytesseract識別驗證碼

準備工作: 1.使用國內源安裝庫pytesseract pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytesseract 2.安裝tesseract 自己下載安

原创 ord()函數

介紹 – 摘自菜鳥教程 ord() 函數是 chr() 函數(對於8位的ASCII字符串)或 unichr() 函數(對於Unicode對象)的配對函數,它以一個字符(長度爲1的字符串)作爲參數,返回對應的 ASCII 數值,或