計算機體系結構

標籤: 暫無標籤

21

更新時間: 2013-08-25

廣告

計算機體系結構是指那些對程序員可見的系統屬性,還包括設計思想與體系結構。

簡介
計算機體系結構(ComputerArchitecture)是程序員所看到的計算機的屬性,即概念性結構與功能特性。按照計算機系統的多級層次結構,不同級程序員所看到的計算機具有不同的屬性。一般來說,低級機器的屬性對於高層機器程序員基本是透明的,通常所說的計算機體系結構主要指機器語言級機器的系統結構。經典的關於「計算機體系結構(computerarchitecture)」的定義是1964年C.M.Amdahl在介紹IBM360系統時提出的,其具體描述為「計算機體系結構是程序員所看到的計算機的屬性,即概念性結構與功能特性」 。
計算機體系結構

  計算機體系結構

基本概念
計算機體系結構就是指適當地組織在一起的一系列系統元素的集合,這些系統元素互相配合、相互協作,通過對信息的處理而完成預先定義的目標。通常包含的系統元素有:計算機軟體、計算機硬體、人員、資料庫、文檔和過程。其中,軟體是程序、資料庫和相關文檔的集合,用於實現所需要的邏輯方法、過程或控制;硬體是提供計算能力的電子設備和提供外部世界功能的電子機械設備(例如感測器、馬達、水泵等);人員是硬體和軟體的用戶和操作者;資料庫是通過軟體訪問的大型的、有組織的信息集合;文檔是描述系統使用方法的手冊、表格、圖形及其他描述性信息;過程是一系列步驟,它們定義了每個系統元素的特定使用方法或系統駐留的過程性語境。
計算機體系結構

  計算機體系結構

廣告

8種屬性
1·機內數據表示:硬體能直接辨識和操作的數據類型和格式
計算機體系結構

  計算機體系結構

2·定址方式:最小可定址單位、定址方式的種類、地址運算
3·寄存器組織:操作寄存器、變址寄存器、控制寄存器及專用寄存器的定義、數量和使用規則
4·指令系統:機器指令的操作類型、格式、指令間排序和控制機構
5·存儲系統:最小編址單位、編址方式、主存容量、最大可編址空間
6·中斷機構:中斷類型、中斷級別,以及中斷響應方式等
7·輸入輸出結構:輸入輸出的連接方式、處理機/存儲器與輸入輸出設備間的數據交換方式、數據交換過程的控制
8·信息保護:信息保護方式、硬體信息保護機制。
發展歷程
計算機系統已經經歷了四個不同的發展階段。
計算機體系結構

  計算機體系結構

第二階段
從60年代中期到70年代中期,是計算機系統發展的第二代。在這10年中計算機技術有了很大進步。多道程序、多用戶系統引入了人機交互的新概念,開創了計算機應用的新境界,使硬體和軟體的配合上了一個新的層次。實時系統能夠從多個信息源收集、分析和轉換數據,從而使得進程式控制制能以毫秒而不是分鐘來進行。在線存儲技術的進步導致了第一代資料庫管理系統的出現。計算機系統發展的第二代的一個重要特徵是出現了「軟體作坊」,廣泛使用產品軟體。但是,「軟體作坊」基本上仍然沿用早期形成的個體化軟體開發方法。隨著計算機應用的日益普及,軟體數量急劇膨脹。在程序運行時發現的錯誤必須設法改正;用戶有了新的需求時必須相應地修改程序;硬體或操作系統更新時,通常需要修改程序以適應新的環境。上述種種軟體維護工作,以令人吃驚的比例耗費資源。更嚴重的是,許多程序的個體化特性使得它們最終成為不可維護的。「軟體危機」就這樣開始出現了。1968年北大西洋公約組織的計算機科學家在聯邦德國召開國際會議,討論軟體危機課題,在這次會議上正式提出並使用了「軟體工程」這個名詞,一門新興的工程學科就此誕生了。
總結
軟體開發的「第四代技術」改變了軟體界開發計算機程序的方式。專家系統和人工智慧軟體終於從實驗室中走出來進入了實際應用,解決了大量實際問題。應用模糊邏輯的人工神經網路軟體,展現了模式識別與擬人信息處理的美好前景。虛擬現實技術與多媒體系統,使得與用戶的通信可以採用和以前完全不同的方法。遺傳演算法使我們有可能開發出駐留在大型并行生物計算機上的軟體。
基本原理
計算機體系結構解決的是計算機系統在總體上、功能上需要解決的問題,它和計算機組成、計算機實現是不同的概念。一種體系結構可能有多種組成,一種組成也可能有多種物理實現。
計算機體系結構
計算機系統結構的邏輯實現,包括機器內部數據流和控制流的組成以及邏輯設計等。其目標是合理地把各種部件、設備組成計算機,以實現特定的系統結構,同時滿足所希望達到的性能價格比。一般而言,計算機組成研究的範圍包括:確定數據通路的寬度、確定各種操作對功能部件的共享程度、確定專用的功能部件、確定功能部件的并行度、設計緩衝和排隊策略、設計控制機構和確定採用何種可靠技術等。計算機組成的物理實現。包括處理機、主存等部件的物理結構,器件的集成度和速度,器件、模塊、插件、底板的劃分與連接,專用器件的設計,信號傳輸技術,電源、冷卻及裝配等技術以及相關的製造工藝和技術。
分類
馮式分類法
1972年馮澤雲提出用最大并行度來對計算機體系結構進行分類。所謂最大并行度Pm是指計算機系統在單位時間內能夠處理的最大的二進位位數。設每一個時鐘周期△ti內能處理的二進位位數為Pi,則T個時鐘周期內平均并行度為Pa=(∑Pi)/T(其中i為1,2,…,T)。平均并行度取決於系統的運行程度,與應用程序無關,所以,系統在周期T內的平均利用率為μ=Pa/Pm=(∑Pi)/(T*Pm)。用最大并行度對計算機體系結構進行的分類。用平面直角坐標系中的一點表示一個計算機系統,橫坐標表示字寬(N位),即在一個字中同時處理的二進位位數;縱坐標表示位片寬度(M位),即在一個位片中能同時處理的字數,則最大并行度Pm=N*M。
由此得出四種不同的計算機結構:
①字串列、位串列(簡稱WSBS)。其中N=1,M=1。
②字并行、位串列(簡稱WPBS)。其中N=1,M>1。
③字串列、位并行(簡稱WSBP)。其中N>1,M=1。
④字并行、位并行(簡稱WPBP)。其中N>1,M>1。
技術革新
計算機體系結構以圖靈機理論為基礎,屬於馮·諾依曼體系結構。本質上,圖靈機理論和馮·諾依曼體系結構是一維串列的,而多核處理器則屬於分散式離散的并行結構,需要解決二者的不匹配問題。
首先,串列的圖靈機模型和物理上分佈實現的多核處理器的匹配問題。圖靈機模型意味著串列的編程模型。串列程序很難利用物理上分佈實現的多個處理器核獲得性能加速.與此同時,并行編程模型並沒有獲得很好的推廣,僅僅局限在科學計算等有限的領域.研究者應該尋求合適的機制來實現串列的圖靈機模型和物理上分佈實現的多核處理器的匹配問題或縮小二者之間的差距,解決「并行程序編程困難,串列程序加速小」的問題。
計算機體系結構

  計算機體系結構

在支持多線程并行應用方面,未來多核處理器應該從如下兩個方向加以考慮。第一是引入新的能夠更好的能夠表示并行性的編程模型。由於新的編程模型支持編程者明確表示程序的并行性,因此可以極大的提升性能。比如Cell處理器提供不同的編程模型用於支持不同的應用。其難點在於如何有效推廣該編程模型以及如何解決兼容性的問題。第二類方向是提供更好的硬體支持以減少并行編程的複雜性。并行程序往往需要利用鎖機制實現對臨界資源的同步、互斥操作,編程者必須慎重確定加鎖的位置,因為保守的加鎖策略限制了程序的性能,而精確的加鎖策略大大增加了編程的複雜度。一些研究在此方面做了有效的探索。比如,SpeculativeLockElision機制允許在沒有衝突的情況下忽略程序執行的鎖操作,因而在降低編程複雜度的同時兼顧了并行程序執行的性能。這樣的機制使得編程者集中精力考慮程序的正確性問題,而無須過多地考慮程序的執行性能。更激進的,TransactionalCoherenceandConsistency(TCC)機制以多個訪存操作(Transaction)為單位考慮數據一致性問題,進一步簡化了并行編程的複雜度。
主流的商業多核處理器主要針對并行應用,如何利用多核加速串列程序仍然是一個值得關注的問題。其關鍵技術在於利用軟體或硬體自動地從串新程序中派生出能夠在多核處理器上并行執行的代碼或線程。多核加速串列程序主要有三種方法,包括并行編譯器、推測多線程以及基於線程的預取機制等。在傳統并行編譯中,編譯器需要花費很大的精力來保證擬劃分線程之間不存在數據依賴關係。編譯時存在大量模糊依賴,尤其是在允許使用指針(如C程序)的情況下,編譯器不得不採用保守策略來保證程序執行的正確性。這大大限制了串列程序可以挖掘的併發程度,也決定了并行編譯器只能在狹窄範圍使用。為解決這些問題,人們提出推測多線程以及基於線程的預取機制等。然而,從這種概念提出到現在為止,這個方向的研究大部分局限於學術界,僅有個別商業化處理器應用了這種技術,並且僅僅局限於特殊的應用領域。我們認為動態優化技術和推測多線程(包括基於線程的預取機制)的結合是未來的可能發展趨勢。
馮·諾依曼體系結構的一維地址空間和多核處理器的多維訪存層次的匹配問題。本質上,馮·諾依曼體系結構採用了一維地址空間。由於不均勻的數據訪問延遲和同一數據在多個處理器核上的不同拷貝導致了數據一致性問題。該領域的研究分為兩大類:一類研究主要是引入新的訪存層次。新的訪存層次可能採用一維分散式實現方式。典型的例子是增加分散式統一編址的寄存器網路。全局統一編址的特性避免了數據一致性地考慮。同時,相比於傳統的大容量cache訪問,寄存器又能提供更快的訪問速度。TRIPS和RAW都有實現了類似得寄存器網路。令另外,新的訪存層次也可以是私有的形式。比如每個處理器和都有自己私有的訪存空間。其好處是更好的劃分了數據存儲空間,已洗局部私有數據沒有必要考慮數據一致性問題。比如Cell處理器為每個SPE核設置了私有的數據緩衝區。另一類研究主要涉及研製新的cache一致性協議。其重要趨勢是放鬆正確性和性能的關係。比如推測Cache協議在數據一致性未得到確認之前就推測執行相關指令,從而減少了長遲訪存操作對流水線的影響。此外,TokenCoherence和TCC也採用了類似的思想。程序的多樣性和單一的體系結構的匹配問題。未來的應用展現出多樣性的特點。一方面,處理器的評估不僅僅局限於性能,也包括可靠性,安全性等其他指標。另一方面,即便考慮僅僅追求性能的提高,不同的應用程序也蘊含了不同層次的并行性。應用的多樣性驅使未來的處理器具有可配置、靈活的體系結構。TRIPS在這方面作了富有成效的探索,比如其處理器核和片上存儲系統均有可配置的能力,從而使得TRIPS能夠同時挖掘指令級并行性、數據級并行性及指令級并行性。
多核和Cell等新型處理結構的出現不僅是處理器架構歷史上具有里程碑式的事件,對傳統以來的計算模式和計算機體系架構也是一種顛覆
2005年,一系列具有深遠影響的計算機體系結構被曝光,有可能為未來十年的計算機體系結構奠定根本性的基礎,至少為處理器乃至整個計算機體系結構做出了象徵性指引。隨著計算密度的提高,處理器和計算機性能的衡量標準和方式在發生變化,從應用的角度講,講究移動和偏向性能兩者已經找到了最令人滿意的結合點,並且有可能引爆手持設備的急劇膨脹。儘管現在手持設備也相對普及,在計算能力、可擴展性以及能耗上,完全起步到一台手持設備應該具備的作用;另一方面,講究性能的伺服器端和桌面端,開始考慮減少電力消耗趕上節約型社會的大潮流。
Cell本身適應這種變化,同樣也是它自己創造了這種變化。因而從它開始就強調了不一樣的設計風格,除了能夠很好地進行多倍擴展外,處理器內部的SPU(SynergisticProcessorUnit協同處理單元)具有很好的擴展性,因而可以同時面對通用和專用的處理,實現處理資源的靈活重構。也就意味著,通過適當的軟體控制,Cell能應付多種類型的處理任務,同時還能夠精簡設計的複雜。
圖書信息
內容簡介
《計算機體系結構》在介紹計算機系統結構的基本概念、原理、結構和分析方法的基礎上,著重闡述了計算機系統的并行化技術,旨在幫助學生在建立計算機系統的完整概念,充分掌握計算機系統結構的最新研發思想與技術。
《計算機體系結構》共分5章。第1章論述計算機系統的概念及其設計原則,通過對馮·諾依曼計算機模型指令集的分類,簡要闡述計算機系統發展的脈絡及與體系結構發展密不可分的核心領域的現狀與發展,最後簡單介紹幾種先進的微體系結構;第2章論述流水線的基本概念、分類及性能計算方法,並以DLX模型為實例詳細描述流水線執行的關鍵技術,並對流水線中相關和衝突問題進行重點闡述;第3章通過指令級并行概念的介紹,詳細闡述實現指令級并行的關鍵技術和演算法;第4章為「存儲系統」,重點講述虛擬存儲系統,Cache存儲系統及并行主存系統;第5章詳細介紹輸入輸出系統,講述匯流排類型、控制及通信方式,並詳細闡述中斷系統及匯流排與CPU及存儲器的通信原理。
《計算機體系結構》可作為高等院校計算機專業的高年級本科生,或研究生的教材,也可作為從事計算機體系結構或嵌入式系統設計的工程技術人員的參考書。

圖書目錄

第1章 概述
第2章 流水線技術
第3章 指令級并行
第4章 存儲體系
第5章 輸入輸出系統
參考文獻

廣告

廣告