原创 vim 縱向編輯技巧

一. 插入  ctrl + v 進入 VISUAL BLOCK 縱向編輯模式 通過方向鍵選定列 I 選中列首插入;A選中列尾插入 插入內容 esc 二. 刪除 ctrl + v 方向鍵選中 d 參考 https://www.ibm.com

原创 遠程獲取文件

1. wget 2. scp 3. python -m SimpleHTTPServer 8003 啓動http服務    wget 機器/文件路徑   獲取文件, 文件路徑取決於該服務啓動的路徑,可通過 機器名:8003在瀏覽器中查看文

原创 hadoop streaming bistreaming ustreaming

1. 問題1 close failed in file object destructor: sys.excepthook is missing lost sys.stderr

原创 vim insert VISUAL模式

vim中使用鼠標右鍵粘貼,失敗。vim的模式: 網上解法: 1. 普通模式下輸入“:set mouse-=a”,有效 2. .vimrc中添加: if has('mouse') set mouse-=a endif 失效 查資

原创 SQL

date nums tag 2019-3-11 1 A 2019-3-11 2 B 2019-3-12 4 A 2019-3-12 5 B select nu-nums,F.tag from (   select *   from    

原创 知識圖譜二 -- DeepDive

https://blog.csdn.net/alitech2017/article/details/80134104 https://blog.csdn.net/xgjianstart/article/details/70214852 知

原创 知識圖譜一 -- 知識圖譜架構、DeepDive中文抽取示例

一. DeepDive DeepDive (http://deepdive.stanford.edu/) 是斯坦福大學開發的信息抽取系統,能處理文本、表格、圖表、圖片等多種格式的無結構數據,從中抽取結構化的信息。系統集成了文件分析、信息提

原创 設置secureCRT不掉線的方法

Options—>Global Options—>General—>Default Session—>Edit Default Settings—>Terminal—>Anti-idle 選中Send protocol NO-OP eve

原创 HQL - HiveQL

use namespace dba_ns; #選定數據庫 set user_write_ugi:hdfs://nmg01-xxxx-hdfs.dmop.xxxxx.com:54310/app/ecom/fcr/bigdata_dump/u

原创 linux tmp自動清理

線上機器總是報內存不足,df -h 發現存儲空間佔滿,df -i ,發現是tmp中臨時文件佔滿,下面兩個連接,可以修改系統清除tmp文件的時間間隔 https://www.cnblogs.com/kerrycode/p/5759941.h

原创 流式計算引擎

批量計算:收集數據-存入DB-取出分析,先將數據存進去,再處理 區別: 1. 與批量計算累積數據不同,流式計算將大數據平攤到各個結點上,連續進行小批量的傳輸,流動,計算完後拋棄 2. 批量計算維護一張表,對錶進行各種邏輯操作,流式計算相反

原创 數據展示

review html case,起 server 將文件放在html文件夾下,在 html 存放目錄下,運行 nohup python -m CGIHTTPServer 8888 &#端口號自定義 #coding:utf-8 impor

原创 screen - nohup

通常情況下我們都是爲每一個任務開一個遠程終端窗口,因爲他們執行的時間太長了。必須等待它執行完畢,在此期間可不能關掉窗口或者斷開連接,否則這個任務就會被殺掉,一切半途而廢了 1. 爲什麼關掉窗口/斷開連接會使得正在運行的程序死掉 進程組(p

原创 hadoop streaming 使用總結

hadoop client: 客戶端可以讓用戶訪問集羣,hadoop client 使用手冊,通過配置hadoop-site.xml文件,實現訪問不同集羣,同時該客戶端目錄的 xx/xx/hadoop/bin/hadoop 是你配置的ha

原创 git 常用命令彙總

闖將倉庫之後,常用命令: git clone ssh you git address # 將倉庫clone到本地 git add readme.txt # 添加文件 git commit -m"add readme" #評論 git p