台部落随机???

spark 上傳額外的文件的方法當pyspark 運行在cluster mode下的時候 driver不能直接獲取到client上的文件所以要把一些文件上傳上去 pyspark_submmit 在提交的時候有三個參數和上傳文件

2020-06-26 16:33:34

HDFS 權限設置 hdfs 系統的權限和 linux 相似分爲三個部分所有者第一列對應權限位2,3.4位用戶組第二列對應權限位5,6,7位其他人對應權限位8,9,10位 hdfs的用戶是和本地

2020-06-26 16:33:23

pytorch張量的保存和恢復 tensor本身就是對象如果想要保存和恢復對應的對象使用 torch.save 和 torch.load即可就像picke的load 和dump一樣 t2 = torch.randn([102

2020-06-26 16:33:22

pyspark RDD 的介紹和基本操作 RDD介紹雖然現在pyspark已經支持了DataFrame 但是有的時候不得不用一下RDD 但是官方文檔很多地方說的不明不白所以自己做了實驗在這裏總結一下。 RDD是用位置來做映射

2020-06-26 16:33:22

hdfs kill 任務先說結論 hdfs 上的hadoop 任務直接在終端ctrl+C是不行的任務一旦提交到集羣上就會繼續運行所以應該使用 yarn application -kill application_157

2020-06-26 16:33:22

crontab是linux 下的定時工具但是有很多坑 1. 第一個坑 crontab 命令中 % 如果原始命令中帶有 % 那麼很可能會執行失敗因爲crontab中的%號有特殊含義需要使用轉義字符去轉義例如下面這個命令

2020-06-26 16:33:22

go 中的array和slice array 和slice 類似但是也有區別 array array是定長的, 類似於c語言裏面的數組可能修改內容但是不能夠擴容 array 的類型本身包含了長度信息比如定義時 array1

2020-02-20 16:44:04