原创 事故分析

16:45 完成發佈 00:42發生宕機 container-node lac56 7:45 完成nq發佈 20:00發生宕機 nq55/nq56/nq39/nq42/nq13 17:21 hotfix statc

原创 高性能網絡調優

思路: 1、調整sysctl.conf * net.ipv4.tcp_tw_recycle = 1
 * net.ipv4.tcp_tw_reuse = 1
 * net.ipv4.tcp_timestamps = 1

原创 協議tcp/http常見問題&知識點

tcp 鏈接 建立鏈接的時候 什麼情況會出錯 http 錯誤碼 http頭部信息監測 tcp建立連接過程 , 可能會出現什麼問題失敗 tcp建立連接 傳輸數據過程 關閉鏈接過程 time_wait情況 可能潛在危

原创 nginx 配置ssl 實現https

轉載:http://seanlook.com/2015/05/28/nginx-ssl/ 背景 項目組突然出現一起事故 ,所有的頁面無法訪問,崩潰了。。 經排查是證書問題 排查方法: 查看線上配置-證書所在文件 root@:/

原创 c語言鏈接問題

連接錯誤示例 連接過程中常見的錯誤是符號未找到(undefined reference)和符號重定義(redefinition)。由於在編譯器在處理各個符號的時候,已經沒有了各個C語言源文件的概念,只有目標文件。因此對於這

原创 事故分析2

影響: 小迪 [email protected] 帳號 10.0.63.186 節點 主掛了 redis就掛了 9.29 8:40用戶感知到了 報警信息: onealert 沒有報警 nq66 osd fd過高 gq1,

原创 使用fio測試磁盤I/O性能

fio測試 ———————— [1]. https://wsgzao.github.io/post/fio/

原创 socket學習

socket概念 基於tcp/udp之上 封裝的抽象層 http協議 發現和解決系統性能問題 查看服務器的併發連接數 linux ss命令 比 netstat命令 更高效 且可以查看 tcp socket 鏈接狀

原创 http協議如何實現緩存cache

兩個head字段 client: if-modified-since if-none-match server: last-modified entity-tag (Etag) ETag 依靠使用客戶端(瀏覽器)的緩存機

原创 我們需要專職的QA嗎?

這個文章必然是有爭議的,我在我的微博上討論過很多次了,每次都是很有爭議的。有不同的觀點,有爭論總是一件好事,這樣可以引發大家的思考。所以,對於我的這篇博文,如果你贊同我的觀點,我會感到高興,如果你會去認真地深入思考,我也會高興,如

原创 db 分庫分表分區系統知識

不分庫分表害處 擴展性差 單機宕機對用戶影響極大 高併發 性能瓶頸 why 互聯網,每天幾十億的pv對數據庫很大的負載 數據量足夠大 單服務器資源(cpu 磁盤 內存 io 負載)有限 單數據庫擴展能力有限 單表幾

原创 kubernetes node上 containerd進程意外退出導致pod創建失敗問題排查

問題背景: 接performance team報問題,平時一直在跑的deploy job 出現了大面積的fail, 排查步驟: 接到客戶報問題後,第一反應,肯定是查看pod信息 通過kubectl -n performance get p

原创 Prevent Jenkins concurrent build job with same parameter

Optional Solutions Option 1:  Install new Jenkins plugin: block-same-builds Plugin Information:  Plugins page: https://

原创 k8s volumeMounts 功能 使用時subPath 參數

寫pod的yaml文件時,如果想使用雲存儲,則volumeMounts這個property, mountPath 爲container內部目錄 而subPath 雖然緊跟mountpath, 最容易被誤解爲本地路徑,其實其爲遠端雲存儲

原创 工具JQ remove json文件中 value爲空的元素

remove name 爲null or learnBranch爲空的site信息 raw-learn-instances.json文件 [{     "createdDate": "154",     "frontend": "ultr