計算機體系結構一種量化方法筆記(1)

1.1介紹

計算機技術在大約70年的時間裏取得了驚人的進步

第一臺通用電子計算機誕生了。今天,不到500美元

會買一部性能和世界上最快的手機一樣好的手機

計算機在1993年以5000萬美元的價格購買。這一迅速的進步

從製造計算機的技術進步和

計算機設計。

儘管技術進步在歷史上相當穩定,

由於更好的計算機體系結構而產生的進展不太一致。

在電子計算機誕生的前25年裏,兩股力量都做出了重大貢獻,

每年提高約25%的績效。遲到的

20世紀70年代出現了微處理器。微處理器的能力

隨着集成電路技術的進步

業績增長率約爲每年35%。

這種增長速度,加上量產的成本優勢

微處理器,導致越來越多的計算機業務

在微處理器上。此外,計算機市場上的兩個重大變化

使它比以往任何時候都更容易成功的商業與一個新的架構。

首先,彙編語言編程的虛擬消除減少了

目標代碼兼容性的需要。二是創建標準化,

獨立於供應商的操作系統,如UNIX及其克隆版Linux,降低了

推出新架構的成本和風險。

這些變化使得成功地開發一套新的體系結構成爲可能

使用更簡單的指令,稱爲RISC(精簡指令集計算機)

架構,在20世紀80年代早期。基於RISC的機器引起了人們的注意

關於兩種關鍵性能技術的設計,教學的開發-

級別並行性(最初通過管道,後來通過多個

指令問題)和緩存的使用(最初是簡單的形式,後來使用

更復雜的組織和優化)。

基於RISC的計算機提高了性能標準,迫使先前的體系結構

跟上或消失。數字設備Vax不能,所以

被RISC架構所取代。英特爾迎接挑戰,主要是通過翻譯

80x86指令內部轉換成類似RISC的指令,允許它採用

許多創新最初是在RISC設計中首創的。晶體管計數

在20世紀90年代後期,翻譯更復雜的

x86體系結構變得微不足道。在低端應用中,比如手機,

x86轉換開銷在電源和硅領域的成本有助於

RISC架構,ARM,成爲主導。
圖1.1顯示了架構和組織的結合

增強導致業績以每年的速度持續增長17年

超過50%——這在計算機行業是前所未有的。

20世紀這種戲劇性的增長率的影響是四倍。

首先,它大大增強了計算機用戶的可用能力。爲了

在許多應用中,高性能微處理器的性能優於

不到20年前的超級計算機。
在這裏插入圖片描述其次,這種成本性能的顯著提高導致了新一代計算機的出現。個人電腦和工作站是在80年代隨着微處理器的出現而出現的。在過去的十年裏,智能手機和平板電腦的興起,許多人將其作爲自己的主要計算平臺,而不是PC機。這些移動客戶端設備正越來越多地使用互聯網訪問包含100000臺服務器的倉庫,這些服務器的設計就像是一臺巨大的計算機。第三,摩爾定律所預言的半導體制造業的進步導致了微處理器計算機在整個計算機設計領域的主導地位。傳統上由現成邏輯或門陣列製成的微型計算機被用微處理器製成的服務器所取代。甚至大型計算機和高性能超級計算機都是微處理器的集合。先前的硬件創新導致了計算機設計的復興,強調了建築創新和技術改進的有效利用。這一增長速度進一步加劇,到2003年,高性能微處理器的速度是單純依靠技術(包括改進的電路設計)所能獲得的速度的7.5倍,即每年52%,而每年35%。這一硬件復興導致了第四次衝擊,即對軟件開發的衝擊。自1978年以來,這種50000倍的性能改進(見圖1.1)允許現代程序員用性能換取生產力。除了像C和C++這樣的面向性能的語言,還有更多的編程語言,如Javaand SCALLA。此外,像JavaScript和Python這樣的腳本語言,甚至更具生產力,隨着編程框架如AngularJS和Django越來越受歡迎。爲了保持生產力並試圖縮小性能差距,使用實時編譯器和基於跟蹤的編譯的解釋器正在取代傳統的編譯器和past的鏈接器。軟件部署也在改變,通過Internet使用的軟件即服務(SaaS)取代了必須在本地計算機上安裝和運行的收縮包裝軟件。應用程序的性質也在改變。語音、聲音、圖像和視頻正變得越來越重要,可預測的響應時間對用戶體驗至關重要。谷歌翻譯就是一個鼓舞人心的例子。此應用程序設置爲支持CellPhoneTopoIntitSameraataNobject,圖像通過Internet無線發送到倉庫級計算機(WSC),該計算機可識別照片中的文本並將其翻譯爲您的母語。你也可以用它說話,它會把你說的話翻譯成另一種語言的音頻輸出。它翻譯90種語言的文本和15種語言的語音。圖1.1也顯示了這17年來的堅忍不拔。根本原因是,幾十年來半導體工藝的兩個特點不再適用。1974年,羅伯特·丹尼德觀察到,即使由於每個晶體管的尺寸較小而增加了晶體管的數量,在給定的硅面積內,功率密度也是恆定的。
值得注意的是,晶體管可以走得更快,但功耗更低。2004年左右,由於電流和電壓無法持續下降,並且仍然無法保持集成電路的可靠性,丹尼德的比例縮放結束。這一變化迫使微處理器行業使用多個高效處理器或核心,而不是單一的低效率處理器,2004年,英特爾取消了其高性能單處理器項目,並與其他公司一道宣佈,提高性能的道路將是通過每個芯片多個處理器,而不是通過更快的單處理器。這個里程碑標誌着一個歷史性的轉變,從僅僅依賴指令級並行(ILP)(本書前三個版本的主要關注點)到數據級並行(DLP)和線程級並行(TLP),後者在第四個版本中出現並在第五個版本中得到擴展。第五版還添加了WSCs和請求級並行(RLP),在本版中進行了擴展。編譯器和硬件在沒有程序員注意的情況下密謀利用ILP,而DLP、TLP和RLP是顯式並行的,需要重新構造應用程序,以便利用顯式並行。在某些情況下,這很容易;在許多情況下,這對程序員來說是一個重大的新負擔。Amdahl定律(第1.9節)規定了每個芯片的有用核心數量的實際限制。如果任務的10%是串行的,那麼不管你在芯片上放了多少內核,並行的最大性能收益都是10。最近結束的第二個觀察是摩爾定律。1965年,戈登·摩爾(Gordon Moore)曾著名地預言,每片芯片上的晶體管數量將每年翻一番,1975年修正爲每兩年一次。這一預測持續了大約50年,但不再成立。例如,在這本書的2010年版中,最新的英特爾微處理器有11700000個晶體管。如果摩爾定律繼續下去,我們本可以預計2016年微處理器將擁有1872000萬個晶體管。相反,等效的英特爾微處理器只有17.5億個晶體管,或者比摩爾定律預測的少10倍。組合

由於摩爾定律的減慢和晚餐規模的結束,晶體管不再有太大的改善,微處理器的不變功率預算,用多個能量效率高的處理器替換單功耗處理器,實現Amdahl定律的多處理限制

導致處理器性能的改善放緩,即每20年翻一番,而不是像1986年到2003年那樣每1.5年翻一番(見圖1.1)。提高能源性能成本的唯一途徑是專業化。未來的微處理器將包括幾個特定於領域的核心,這些核心只能夠很好地執行一類計算,但它們的性能明顯優於通用核心。本版新的第7章介紹了特定於域的體系結構。

本文是關於架構的思想和伴隨的編譯器的改進,這些改進使得在過去的一個世紀裏不可思議的增長率成爲可能,戲劇性的變化的原因,以及對架構、編譯器的挑戰和最初有希望的方法,這是一種計算機設計和分析的定量方法,它使用程序、實驗的經驗觀察,以及模擬程序。這是本文所述的計算機設計的風格和方法。本章的目的在於展示以下章節和附錄所依據的量化基礎。這本書的寫作不僅是爲了解釋這種設計風格,而且也是爲了激勵你參與到這一進程中來。WebelieveThisApproach將爲未來的計算機服務,就像它爲過去的隱式並行計算機服務一樣。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章