原创 事故分析
16:45 完成發佈 00:42發生宕機 container-node lac56 7:45 完成nq發佈 20:00發生宕機 nq55/nq56/nq39/nq42/nq13 17:21 hotfix statc
原创 高性能網絡調優
思路: 1、調整sysctl.conf * net.ipv4.tcp_tw_recycle = 1 * net.ipv4.tcp_tw_reuse = 1 * net.ipv4.tcp_timestamps = 1
原创 協議tcp/http常見問題&知識點
tcp 鏈接 建立鏈接的時候 什麼情況會出錯 http 錯誤碼 http頭部信息監測 tcp建立連接過程 , 可能會出現什麼問題失敗 tcp建立連接 傳輸數據過程 關閉鏈接過程 time_wait情況 可能潛在危
原创 nginx 配置ssl 實現https
轉載:http://seanlook.com/2015/05/28/nginx-ssl/ 背景 項目組突然出現一起事故 ,所有的頁面無法訪問,崩潰了。。 經排查是證書問題 排查方法: 查看線上配置-證書所在文件 root@:/
原创 c語言鏈接問題
連接錯誤示例 連接過程中常見的錯誤是符號未找到(undefined reference)和符號重定義(redefinition)。由於在編譯器在處理各個符號的時候,已經沒有了各個C語言源文件的概念,只有目標文件。因此對於這
原创 事故分析2
影響: 小迪 [email protected] 帳號 10.0.63.186 節點 主掛了 redis就掛了 9.29 8:40用戶感知到了 報警信息: onealert 沒有報警 nq66 osd fd過高 gq1,
原创 使用fio測試磁盤I/O性能
fio測試 ———————— [1]. https://wsgzao.github.io/post/fio/
原创 socket學習
socket概念 基於tcp/udp之上 封裝的抽象層 http協議 發現和解決系統性能問題 查看服務器的併發連接數 linux ss命令 比 netstat命令 更高效 且可以查看 tcp socket 鏈接狀
原创 http協議如何實現緩存cache
兩個head字段 client: if-modified-since if-none-match server: last-modified entity-tag (Etag) ETag 依靠使用客戶端(瀏覽器)的緩存機
原创 我們需要專職的QA嗎?
這個文章必然是有爭議的,我在我的微博上討論過很多次了,每次都是很有爭議的。有不同的觀點,有爭論總是一件好事,這樣可以引發大家的思考。所以,對於我的這篇博文,如果你贊同我的觀點,我會感到高興,如果你會去認真地深入思考,我也會高興,如
原创 db 分庫分表分區系統知識
不分庫分表害處 擴展性差 單機宕機對用戶影響極大 高併發 性能瓶頸 why 互聯網,每天幾十億的pv對數據庫很大的負載 數據量足夠大 單服務器資源(cpu 磁盤 內存 io 負載)有限 單數據庫擴展能力有限 單表幾
原创 kubernetes node上 containerd進程意外退出導致pod創建失敗問題排查
問題背景: 接performance team報問題,平時一直在跑的deploy job 出現了大面積的fail, 排查步驟: 接到客戶報問題後,第一反應,肯定是查看pod信息 通過kubectl -n performance get p
原创 Prevent Jenkins concurrent build job with same parameter
Optional Solutions Option 1: Install new Jenkins plugin: block-same-builds Plugin Information: Plugins page: https://
原创 k8s volumeMounts 功能 使用時subPath 參數
寫pod的yaml文件時,如果想使用雲存儲,則volumeMounts這個property, mountPath 爲container內部目錄 而subPath 雖然緊跟mountpath, 最容易被誤解爲本地路徑,其實其爲遠端雲存儲
原创 工具JQ remove json文件中 value爲空的元素
remove name 爲null or learnBranch爲空的site信息 raw-learn-instances.json文件 [{ "createdDate": "154", "frontend": "ultr