原创 docker 給現有鏡像瘦身

在 Dockerfile 中, 每一條指令都會創建一個鏡像層,繼而會增加整體鏡像的大小。而commit也是層的增加。 這其實也很好理解,例如git,你對某個文件增加了一行,又刪除了一這一行,雖然最新版文件看起來沒有了,但其實歷史還

原创 ssh 祕鑰對登錄突然不好使了

問題:客戶端連接服務器ssh服務,之前突然好使的祕鑰對登錄突然報錯 sign_and_send_pubkey: signing failed: agent refused operation 解決:雖然不知道什麼原因,以下命令可以

原创 k8s grafana數據持久化

問題:k8s搭建的grafana容器只要一重啓,配置的dashboard,添加的用戶等就會重置,從而得出,grafana沒有數據持久化。 解決: 1.先在集羣建立持久花存儲pvc 然後掛在到容器/var目錄 volumeMou

原创 Failed to start Ceph object storage daemon osd.14

問題:ceph集羣osd變爲down的狀態,並且重啓osd也一直失敗。 分析: [root@shnode183 ~]# systemctl status ceph-osd@14 ● [email protected] - Ce

原创 shell sh: 1: source: not found

問題:shell腳本里加source命令報錯 sh: 1: source: not found 解決: $ls -l which sh /bin/sh -> dash $sudo dpkg-reconfigure dash #Se

原创 ceph集羣全部停機開機

需求:機房停電,或者需要搬遷,需要所有ceph節點關機 操作; 關機: 第一步: 先在admin節點執行以下命令關閉集羣流量 ceph osd set noout ceph osd set norecover ceph os

原创 aws redhat7.6安裝ceph

問題1:aws redhat自帶的yum 源缺少很多庫,所以需要加第三方源 解決: yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.n

原创 梗概Kubernetes中的Pause容器爲內部鏡像源

問題:公司內網由於防火牆的原因,上不了外網,而這個時候k8s集羣pods以來的pasue容器是依賴的外部鏡像源,這會造成k8s節點重啓後無法起pods. 解決: 我們知道在kubelet的配置中有這樣一個參數: kubernete

原创 k8s pods中shell 腳本里無法調出jobs的後臺進程

問題:k8s pods中用戶執行的job經常要跑多線程,所以會使用 &方式,這時候job直接執行完當前shell退出了,造成用戶實際執行的任務沒有執行。 分析:此問題剛開始採用jobs方式判斷,發現服務器在腳本里執行jobs是可以

原创 查看Linux網卡的UUID

# yum provides “*/nmcli” # yum -y install NetworkManager #systemctl start NetworkManager #nmcli con

原创 protheus hang住 的問題,卡在TSDB過程中無法啓動

問題:k8s發生pods遷移,prometheus重啓,重啓過程中CPU和內存同時瘋狂增加,最後報pods網絡問題。 錯誤分析: prometheus TSDB寫錯誤,所以重啓會瘋狂攫取CPU內存資源,最後也無法讀取TSDB數據,

原创 mds備用的全部無法重啓mds unable to obtain rotating service keys; retrying

問題:ceph集羣突然mds全都無法啓動,查詢日誌報錯mds unable to obtain rotating service keys; retrying。 分析:節點時間不一致,ceph不但要求系統時間一致,還要求bios時

原创 cephfs 快速統計目錄大小和文件數

用於快速統計cephfs目錄下存放的數據量: 命令格式: getfattr -d –m ceph.dir.* -m表示匹配模式 使用了getfattr命令,來獲取文件系統給出的擴展屬性 例: getfattr -d -m cep

原创 k8s nginx ingress 顯示證書錯誤

問題:ingress-controller會報錯,error obtaining PEM from secret kube-system/kubernetes-dashboard-certs: no keypair or CA c

原创 ceph常見問題解決

問題1:3 monitors have not enabled msgr2 解決:#ceph mon enable-msgr2 問題2:mon node82 is low on available space 解