發(fā)布日期:2022-07-15 點(diǎn)擊率:29
在2003年熱點(diǎn)芯片研討會(huì)上,英特爾公布了一款90nm定制處理器,它能以高達(dá)的實(shí)測(cè)數(shù)據(jù)率進(jìn)行TCP/IP輸入處理。這種包含46萬(wàn)個(gè)晶體管的實(shí)驗(yàn)芯片整合了一個(gè)相對(duì)傳統(tǒng)的處理數(shù)據(jù)路徑,但以非傳統(tǒng)的方式運(yùn)用內(nèi)容可尋址存儲(chǔ)器(CAM)和控制流程。它顯示出在90nm時(shí)代有可能實(shí)現(xiàn)完全可編程的協(xié)議處理,但設(shè)計(jì)師們必須等待一段時(shí)間才能利用這項(xiàng)技術(shù)的優(yōu)勢(shì)。
這款內(nèi)部代號(hào)為T(mén)IPP的處理器是使用軟件可編程方法來(lái)進(jìn)行TCP/IP卸載處理研究活動(dòng)的一部分。英特爾位于美國(guó)俄勒岡州的微處理器研究實(shí)驗(yàn)室正在執(zhí)行這項(xiàng)研究。該項(xiàng)目不僅限于專(zhuān)用處理器,而且還致力于解決在傳統(tǒng)處理器上處理TCP/IP時(shí)如何保護(hù)操作系統(tǒng)和應(yīng)用程序的問(wèn)題。
接近10Gbps的線速度需要專(zhuān)用的TCP/IP處理器。英特爾的器件是采用其先進(jìn)的90nm邏輯工藝制造的2.2×微型裸片。該處理器被設(shè)計(jì)用于進(jìn)行輸入處理,最終將成為比它大兩三倍的系統(tǒng)級(jí)芯片(SoC)的一個(gè)內(nèi)核,這樣的SoC將負(fù)責(zé)處理全部的TCP/IP終端問(wèn)題。
英特爾研究員Jianping Xu概括了在10Gbps線速處理中面臨的關(guān)鍵問(wèn)題。根本問(wèn)題是時(shí)間,即為了滿足10Gbps以太網(wǎng)的需求,處理器必須每67納秒處理一個(gè)數(shù)據(jù)包。這樣的任務(wù)超越了通用計(jì)算技術(shù)所能達(dá)到的能力。但Xu表示:“基于軟件的解決方案可以對(duì)協(xié)議的改變做出響應(yīng),這種能力讓我們值得嘗試基于處理器的方法。”
除了速度外,TCP處理是非常復(fù)雜的,需要對(duì)協(xié)議信息進(jìn)行解復(fù)用、包過(guò)濾和協(xié)議處理。因?yàn)門(mén)CP數(shù)據(jù)包不能保證按正確的順序到達(dá),所以數(shù)據(jù)包必須在運(yùn)行過(guò)程中被重新排序。
英特爾的研究小組設(shè)計(jì)了一種專(zhuān)用架構(gòu),包括一個(gè)流水線執(zhí)行單元以及與之緊密結(jié)合的緩存RAM、兩個(gè)CAM和輸入/輸出緩沖器,還有一個(gè)用于發(fā)送控制的專(zhuān)用模塊。一個(gè)本地指令ROM使用存儲(chǔ)在其中的112位寬的控制字來(lái)驅(qū)動(dòng)處理器。該架構(gòu)使用CAM來(lái)重新排列數(shù)據(jù)包,但CAM是通過(guò)序列號(hào),而不是借助分類(lèi)操作來(lái)訪問(wèn)數(shù)據(jù)包。
英特爾研究員Regnier在一篇論文中描述了雙處理器Xeon系統(tǒng)在TCP/IP處理和卸載協(xié)議處理中的應(yīng)用。該論文比較了對(duì)稱(chēng)多重處理方法與非對(duì)稱(chēng)方法的效率。對(duì)稱(chēng)方法只把Linux TCP/IP堆棧當(dāng)成另一項(xiàng)內(nèi)核任務(wù)來(lái)處理,而非對(duì)稱(chēng)方法使用一個(gè)Xeon處理器專(zhuān)門(mén)處理TCP/IP,另一個(gè)則充當(dāng)純粹的Linux應(yīng)用處理器。這項(xiàng)對(duì)比顯示了卸載協(xié)議處理的優(yōu)勢(shì),即使在傳統(tǒng)硬件上也是如此。
TIPP處理器的實(shí)現(xiàn)具有特別的指導(dǎo)意義。英特爾使用了這一兩年來(lái)所討論的大量先進(jìn)設(shè)計(jì)技術(shù)。其中許多技術(shù)旨在解決已知的90nm工藝問(wèn)題:功耗和漏電流。
功耗是該芯片的一個(gè)嚴(yán)重問(wèn)題。當(dāng)供電電壓為且工作在最高速度時(shí),這款裸片面積不到8mm2的器件必須消耗約6.4瓦功率。考察功率消耗的詳細(xì)情況可以使問(wèn)題變得更明朗:當(dāng)中心電壓為左右時(shí),執(zhí)行單元和指令ROM部件的功耗在250W/cm2以上。
在90nm工藝中,造成功耗問(wèn)題的一個(gè)重要因素是漏電流。漏電還使某些結(jié)構(gòu)更難設(shè)計(jì)。為了改善這個(gè)問(wèn)題,英特爾的研究小組使用了雙閾值電壓工藝和自適應(yīng)“體偏置”(body bias)技術(shù)。該器件還采用了一種新穎的寄存器文件設(shè)計(jì),可容忍較高的漏電水平。
據(jù)Xu透露,大部分設(shè)計(jì)是綜合的,但關(guān)鍵的高速路徑,即執(zhí)行內(nèi)核和指令ROM是定制設(shè)計(jì)。該設(shè)計(jì)方案還使用了半動(dòng)態(tài)觸發(fā)器。設(shè)計(jì)的次要部分工作在更低的頻率下。
作者: 張國(guó)勇