通過彙編揭開String中數據結構神祕面紗

String(字符串),是編程語言中表示文本的數據類型。接觸編程的你一定每天都會見到。那看似渺小的string(字符串),裏面到底還隱藏着多少的祕密?大家平時天天使用的東西,你真的瞭解它嗎?可能平時很多人並不會深入研究它,如果你的能力還不錯,不妨看看下面幾個問題。要是對他們還存在困惑,那恭喜你,你找到了你要提升的方向。
⼀、思考
在 Swift 開發使⽤字符串的過程中,你是否有思考過以下問題?
1 個字符串變量佔⽤多少內存?
字符串 str1、str2 的底層存儲有什麼不同?通過彙編揭開String中數據結構神祕面紗
如果對 str1、str2 進⾏拼接操作,str1、str2 的底層存儲⼜會發⽣什麼變化?
通過彙編揭開String中數據結構神祕面紗
如果你能準確地回答以上問題,那說明對 Swift 字符串的底層存儲機制還是⽐較瞭解的。
⼆、1 個字符串變量佔⽤多少內存?

⽅法 1:MemoryLayout
⾸先,可以藉助 Swift ⾃帶的 MemoryLayout 來測試⼀下通過彙編揭開String中數據結構神祕面紗
⽅法 2:彙編
另外,我們也可以藉助⼀個強有⼒的底層分析助⼿—彙編語⾔,來窺探⼀下 String 的底層存儲實際上分析其他語法、系統庫的底層,都可以藉助彙編語⾔

⽐如多態的原理、泛型的原理、Array 的底層、枚舉的底層等等
另外,不僅僅是 Swift,C、C++、OC 的底層分析,依然可以藉助彙編語⾔
畢竟你寫的每⼀⾏有效代碼,最終都是要轉成機器指令(0 和 1)
⽽機器指令是跟彙編指令⼀⼀對應的,每⼀條機器指令都能翻譯成與之對應的彙編指令
能讀懂彙編指令,就相當於能讀懂機器指令,知道 CPU 具體在⼲嘛(操作了什麼寄存器,操作了哪塊內存)
本教程的代碼是直接跑在 Mac 的命令⾏(CommandLineTools)項⽬上
因此展示的彙編代碼是基於 X64 的 AT&T 格式彙編,並⾮ iOS 真機設備的 ARM 彙編其實不同種類的彙編之間有極⼤的相似性,只是有些指令的叫法不⼀樣
跟微軟的 Visual Studio ⼀樣,Xcode 也內置了⾮常⽅便的反彙編功能,可以輕鬆查看每⼀句代碼對應的彙編指令,打開反彙編界⾯的步驟如下
在某⼀⾏需要調試的代碼打上斷點(反彙編界⾯會在斷點調試狀態下顯示出來)

菜單: Debug >

譯爲彙編,

譯爲反彙編
通過彙編揭開String中數據結構神祕面紗

運⾏程序,看到反彙編界⾯
通過彙編揭開String中數據結構神祕面紗

如果你的反彙編經驗⼗⾜,根據第 16、17 ⾏的彙編就可以推敲出來,String 是佔⽤ 16 個字節因爲它⽤了 rax、rdx 寄存器存放字符串 str 的內容,⽽ rax、rdx 都是 8 字節的
彙編的內容太多了,因爲時間和篇幅關係,⽂章⾥並不會對每⼀句彙編指令進⾏詳細地講解,更多的是 想說明彙編的重要性。
三、字符串的底層存儲

窺探內存
此前我寫了個可以窺探 Swift 變量內存的⼩⼯具:https://github.com/CoderMJLee/Mems 現在⽤它來窺探下字符串的 16 字節⾥⾯,究竟存儲着什麼數據
默認情況下按照 8 個字節⼀組來顯示內存數據

傳遞參數

是按照 1 個字節⼀組來顯示內存數據

通過彙編揭開String中數據結構神祕面紗

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,認真觀察最初 str1 的 16 個字節數據,你發現了什麼?
它直接將所有字符的 ASCII 值存儲在 str1 的 16 字節中
最後 1 個字節 0xea 中的 0xa 就是字符的數量,也是共 10 個字符
拼接
通過彙編揭開String中數據結構神祕面紗

可以發現,當對 str1 進⾏拼接 "ABCDE" 的時候
它最終是將 "0123456789ABCDE"⼗五個字符的 ASCII 值都存儲在了 str1 的 16 字節中最後 1 個字節 0xef 中的 0xf 就是字符的數量,也是共 15 個字符
可以看得出來,⽬前 16 個字節已經存滿了,那如果再拼接 1 個字符呢?通過彙編揭開String中數據結構神祕面紗
可以看到,str1 ⾥⾯存儲的數據發⽣了⾮常⼤的變化,每⼀個字符的 ASCII 值不⻅了, 那⾥⾯的 16 字節具體是什麼含義呢?
所有字符('0'~'9'、'A' 到 'F')的 ASCII 值⼜存到哪去了呢?
其他情況
如果⼀開始初始化的時候(未拼接之前),字符串的內容就是超過 15 個字符呢?通過彙編揭開String中數據結構神祕面紗
相信你能猜到是這個結果
這 16 個字節⾥⾯並沒有出現任何⼀個字符的 ASCII 值

⽽且這 16 個字節跟

還是有所區別

雖然它們的字符串內容都是"0123456789ABCDEF" 如果對 str2 進⾏拼接操作
通過彙編揭開String中數據結構神祕面紗

不難發現:這時 str2 的 16 字節⼜發⽣了變化,跟
如何解決上述疑問?

是有點相似的

上述的種種疑問,光看打印出來的內存數據是⽆法解決的,但是都可以利⽤【!!!彙編!!!】來解 決,分析彙編指令,⽴⻢就得出結論,因爲⽂章的篇幅有限,平時⼯作也⽐較忙,我把上述問題的詳細 剖析過程錄製成了⻓達 2 個多⼩時的視頻,有興趣的朋友可以⽤ 1.5~2 倍速度觀看
鏈 接 :https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA 提取碼:kzrk
視頻對於沒有彙編基礎的朋友來說,可能會有點難度,最好挑⼀個頭腦清醒的時間去觀看
看完視頻後,希望⼤家能夠確切地感受到彙編語⾔的重要性,不要永遠只停留在編寫⾼級語⾔代 碼、沉迷於語法糖的層⾯

四、最後
其實,通過彙編探索String底層,並不只是爲了研究字符串,我們更希望你通過彙編提升自己的編程能力。不只是彙編,數據結構與算法也是助你程序生涯更進一步的必備寶典。不僅如此,掌握這些能力,你還能玩轉軟件破解、外掛,這是我此前⽤【彙編\C++】編寫的⼀個外掛:https://github.com/CoderMJLee/SeemygoPVZCheat 通過彙編揭開String中數據結構神祕面紗 er可能有人會說,我現在不需要接觸這些,也能夠完成工作。沒錯,如果你只是安於現狀,大可不必多費精力折磨自己。但是,如果你想提升自己能力,突破自我,彙編完全可以助你在編程領域更上一層樓,絕對是你在突破自我道路上的一把利器。不過,如今的軟件技術發展迅猛,不提升自己,就會落後。技術落後和技術不精的開發者,是一定會被市場所淘汰。高端的編程人員纔是企業真正爭奪的香餑餑,唯有不斷的探索學習更多技術,才能在這⽚領域中站穩腳跟。總之,你自己決定你會成爲哪一類人,你的高度也由你自己決定。
聽到這裏,如果你對彙編、數據結構與算法等編程技巧愈發感興趣,歡迎你加⼊我們的大家庭,×××:×××。在這⾥你可以得到和IT界名師一對一交流的機會。讓我們共同進步,起航揚帆。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章