必威电竞|足球世界杯竞猜平台

推土機(jī)架構(gòu)
來(lái)源:互聯(lián)網(wǎng)

推土機(jī)(Bulldozer)是AMD公司研發(fā)的一款微處理器架構(gòu),采用32納米硅氧化物絕緣層(SOI)工藝,特點(diǎn)是模塊化設(shè)計(jì),每個(gè)模塊包含兩個(gè)處理器核心。

簡(jiǎn)介

推土機(jī)架構(gòu)的每個(gè)模塊都將集成2M L2緩存和8MB的L3緩存。該架構(gòu)采用了全新的控制結(jié)構(gòu)和運(yùn)算單元,尤其在整數(shù)運(yùn)算和浮點(diǎn)運(yùn)算方面的性能有所提升。推土機(jī)架構(gòu)的重點(diǎn)開發(fā)領(lǐng)域包括時(shí)鐘發(fā)生器、電源管理器、L1緩存等。AMD計(jì)劃在2011年推出基于該架構(gòu)的服務(wù)器級(jí)處理器Interlagos和桌面處理器Zambezi,后者面向中高端市場(chǎng),采用新的Socket AM3 r2接口插槽。新處理器支持新的內(nèi)存控制器,可提高內(nèi)存帶寬表現(xiàn),并支持動(dòng)態(tài)頻率提升技術(shù)(turbo core)。

嶄新技術(shù)

革新的Turbo Core技術(shù)

Turbo Core技術(shù)旨在加速未充分利用的工作負(fù)載,使時(shí)鐘速度更快。在多種工作負(fù)載下,Turbo Core技術(shù)可使性能提升高達(dá)500兆赫茲。與傳統(tǒng)核加速技術(shù)不同,Turbo Core技術(shù)可加速所有核,而非僅部分核。此外,對(duì)內(nèi)存控制器進(jìn)行了優(yōu)化,以提高內(nèi)存吞吐量。

新接口新工藝

推土機(jī)處理器采用Socket AM3+接口,941個(gè)針腳,支持DDR3-1866內(nèi)存和高級(jí)節(jié)能技術(shù)。AM3+將是AMD的最后一代PGA封裝,后續(xù)將改為L(zhǎng)GA封裝。Fusion融合處理器將使用LGA AF1新接口,支持DisplayPort 1.2標(biāo)準(zhǔn)、PCI-E 3.0規(guī)范和四通道內(nèi)存。

加強(qiáng)型內(nèi)存控制器

AMD首次推出集成內(nèi)存控制器,并在此代產(chǎn)品中全面提升內(nèi)存控制器性能。通過(guò)對(duì)內(nèi)存控制器效率的重新設(shè)計(jì),實(shí)現(xiàn)了30%的內(nèi)存性能提升。此外,內(nèi)存支持1600MHz頻率,可額外提升20%性能,總體吞吐量提升50%。

同時(shí)支持AVX指令和SSE指令

FLEX FP技術(shù)是AMD最具創(chuàng)新性的浮點(diǎn)計(jì)算技術(shù)之一。每個(gè)模塊都有一個(gè)FLEXFP進(jìn)行浮點(diǎn)運(yùn)算。在128位編碼下,AMD的執(zhí)行數(shù)量是競(jìng)爭(zhēng)對(duì)手的兩倍。在256位AVX編碼下,Bulldozer可將兩個(gè)浮點(diǎn)運(yùn)算單元合并執(zhí)行。因此,Bulldozer可在高性能計(jì)算、媒體編解碼等領(lǐng)域表現(xiàn)出色。

更先進(jìn)的電源管理技術(shù)

每個(gè)模塊內(nèi)的第二個(gè)整數(shù)核心所需的電路僅占總核心面積的12%,芯片級(jí)別的電路增加僅為5%。更多的核心和更少的空間有助于提高單位功耗和成本的性能。Bulldozer在最大時(shí)鐘供電的百分比下,無(wú)論在正常應(yīng)用狀態(tài)還是閑置狀態(tài)下,都有著良好的能耗表現(xiàn)。AMD還在各個(gè)能耗單位上進(jìn)行了優(yōu)化,以便在各種情況下關(guān)閉電源。

架構(gòu)特點(diǎn)

內(nèi)核設(shè)計(jì)全面模塊化

推土機(jī)架構(gòu)是AMD自K7以來(lái)的一次重大變革,核心架構(gòu)和功能性均有較大變化。模塊化設(shè)計(jì)使處理器的功能更具靈活性,同時(shí)也易于控制成本。物理結(jié)構(gòu)可根據(jù)市場(chǎng)需求進(jìn)行調(diào)整,以適應(yīng)產(chǎn)品生產(chǎn)及成本控制需求。處理器核心模塊由兩個(gè)核心組成,共享二級(jí)緩存和預(yù)取、解碼單元,所有模塊共享8MB三級(jí)緩存和北橋模塊。AMD表示,將每個(gè)擁有雙整數(shù)核心的推土機(jī)模塊視為一個(gè)獨(dú)立的單元即可。

高效的集群多線程架構(gòu)

推土機(jī)架構(gòu)采用了基于集群的多線程技術(shù),即Cluster-Based Multi-threading (CMT)。每個(gè)模塊可同時(shí)運(yùn)行兩個(gè)線程,兩個(gè)內(nèi)核可執(zhí)行兩個(gè)互不影響的線程。CMT技術(shù)的效能高于傳統(tǒng)的多線程方案。AMD表示,單個(gè)“推土機(jī)模塊”可實(shí)現(xiàn)約80%的多線程性能提升。

強(qiáng)化的浮點(diǎn)和整數(shù)計(jì)算性能

推土機(jī)架構(gòu)的集群化多線程架構(gòu)使其浮點(diǎn)和整數(shù)計(jì)算性能得以增強(qiáng)。每個(gè)模塊中的兩個(gè)線程都具有獨(dú)立的整數(shù)運(yùn)算單元,共享浮點(diǎn)單元。這種設(shè)計(jì)可更有效地提高處理器在基本應(yīng)用中的性能。Bulldozer的每個(gè)模塊還具備兩條128Bit FMAC(乘法累加運(yùn)算)流水線,以滿足新增的AVX指令集擴(kuò)展的需求。

制作工藝“兩級(jí)跳”

推土機(jī)架構(gòu)采用32nm制程,預(yù)計(jì)32nm工藝將于2010年第三季度開始試產(chǎn),28nm工藝于2010年第四季度上馬,超低功耗版28nm工藝則排在2011年第一季度。這意味著AMD將在2010年完成產(chǎn)品生產(chǎn)工藝升級(jí)的“兩級(jí)跳”。

AMD推土機(jī)接口升級(jí)

推土機(jī)架構(gòu)將采用新的AM3+接口,擁有941個(gè)針腳,支持DDR3 1866內(nèi)存和高級(jí)節(jié)能技術(shù)。AM3+是AMD最后一代PGA封裝,后續(xù)將改為L(zhǎng)GA封裝。Fusion融合處理器將使用LGA AF1新接口,觸點(diǎn)多達(dá)1591個(gè)。

架構(gòu)解析

CMP和SMT

CMP和SMT分別是通過(guò)復(fù)制物理核心和共享資源來(lái)擴(kuò)展處理器在多線程軟件中的性能。CMP的優(yōu)點(diǎn)是直接有效,但成本高昂,受工藝限制。SMT優(yōu)點(diǎn)是成本較低,但效率因負(fù)載而異。AMD認(rèn)為SMT在理想條件下可等同于CMP,但在非理想條件下,SMT效率低于CMP。

推土機(jī)架構(gòu)分析

推土機(jī)架構(gòu)采用32nm SOI工藝,模塊化設(shè)計(jì),每個(gè)模塊包含兩個(gè)處理器核心。每個(gè)核心具有各自的整數(shù)調(diào)度器和四個(gè)專有的管線,共享一個(gè)浮點(diǎn)調(diào)度器和兩個(gè)128位FMAC乘法累加器。L1緩存有所不同,每個(gè)核心具有16KB L1數(shù)據(jù)緩存,每個(gè)模塊具有64KB雙向L1指令緩存。兩個(gè)核心共享L2緩存,模塊之間共享L3緩存及北橋AMD表示,平均計(jì)算下,一個(gè)單獨(dú)的“推土機(jī)”核心執(zhí)行兩個(gè)線程可以達(dá)到1.8核CMP的效率。

參考資料 >

.百度學(xué)術(shù)搜索.2024-10-30

.百度學(xué)術(shù)搜索.2024-10-30

推土機(jī)架構(gòu)處理器.百度學(xué)術(shù)搜索.2024-10-30

生活家百科家居網(wǎng)