原创 hadoop學習筆記—基礎篇

HDFS( Hadoop Distribute File System)結構 NameNode 名字節點 存儲元數據 元素數據保存在內存中 保存文件block datanode之間的映射關係 DataNode 數據節點 存儲文件內容 文件

原创 java集合操作

import java.util.ArrayList; import java.util.Iterator; /** * 集合中添加不重複對象 */ public class ArrayListPerson { pu

原创 linux學習筆記-基本命令

常用命令(區分大小寫) 格式:命令字 參數 ls顯示目錄內容 ls -l 文件和文件基本信息 ls -a顯示所有文件包括隱藏文件 ls -s 文件和文件大小 ls -lash(多個命令混合使用) 如果一個混合命令是一個單詞則需要加連個”-

原创 java集合操作-去重

import java.util.*; /** * 兩個集合,去重 */ public class ElementInList { /** * 去除兩個集合中重複的元素 * * @pa

原创 Spark入門-什麼是Spark

·spark認識 Spark使用Scala語言進行實現,它是一種面向對象、函數式編程語言,能夠像操作本地集合對象一樣輕鬆地操作分佈式數據集,在Spark官網上介紹,它具有運行速度快、易用性好、通用性強和隨處運行等特點。 spark特點 ·

原创 Java集合

import java.util.Iterator; import java.util.Map; import java.util.Set; import java.util.TreeMap; /** * 單詞統計 * 利用

原创 centos下安裝JDK

1.Linux安裝時會自帶Open JDK需要卸載 查看系統自帶JDK版本 打開終端輸入:(使用root賬戶登錄) -->java - version 2.查看JDK版本信息輸入命令 -->rpm -qa | grep java 3

原创 linux下關閉防火牆

1.使用root賬戶登錄 2.查看防火牆狀態信息 輸入命令 systemctl status firewalld 永久性關閉防火牆--啓動後生效不會自動啓動 systemctl disable firewalld -----如果

原创 java設計模式-單例模式

單例模式–餓漢式 public class Single { private static Single single = new Single(); // 將構造函數私有 防止被實例化 private S

原创 java學習之隊列的實現

import java.util.LinkedList; /** * 使用LinkedList模擬棧 */ public class Queue { private LinkedList linkedList;

原创 java HashMap操作對象

首先創建一個Person類,實現equals,hashCode和compareTo方法 public class Person implements Comparable<Person> { private String

原创 java設計模式-克隆模式(複製模式)

java中有深克隆和淺克隆的說法,clone方法在Object類中,該方法被protect修飾,我們無法直接調用,只能實現Cloneable接口,重寫clone方法,我們舉個作家和書本的栗子說明 首先解釋深克隆,創建作家類 pub

原创 spark MLlib學習-卡方檢測

spark-卡方檢測 卡方檢測基本原理 卡方檢測基本步驟 代碼實現 運行結果 代碼塊 import org.apache.log4j.{Level, Logger} import org.apache.spark.mllib

原创 java設計模式六大原則

java程序設計六大原則 總原則:開閉原則(Open Close Principle) 開閉原則就是對擴展開發,對修改關閉,我們在對已有的程序進行拓展時,不能去修改源代碼,而是拓展源代碼,實現一個熱插拔效果。總之,既要保證不修改源碼,又要

原创 spark MLlib 學習

spark GraphX-用戶關係 import org.apache.spark.graphx.{VertexRDD, VertexId, Graph, Edge} import org.apache.spark.rdd.RDD