嚴(yán)格說來,中國臺(tái)灣廠商至今仍從未在 x86 處理器市場缺席,即使這塊領(lǐng)域早已被 Intel 和 AMD 牢牢的支配著,少有其他廠商的生存空間。
在2019 年11 月18 日,位于美國德州奧斯丁的Centaur(中文翻譯為「半人馬」),發(fā)布了x86 世界首款內(nèi)建人工智能輔助處理器的「服務(wù)器級(jí)SOC」CHA,原生八核心,四通道DDR4,可雙處理器組態(tài),并支持連AMDZen2 都尚未提供的AVX-512 指令集。繼 2008 年 5 月 29 日發(fā)布的 Nano(凌瓏)系列處理器后,相隔超過十年,總算催生出全新的微架構(gòu)與處理器產(chǎn)品。
這家已成立25年的公司Centaur,早在1999年9月16日,被威盛電子(VIA)以5,100萬美元的價(jià)碼,從IDT所收購,成為威盛的子公司,并構(gòu)成威盛旗下x86處理器的技術(shù)基礎(chǔ)。
值得注意的是,威盛電子也在當(dāng)年8月3日,從國家半導(dǎo)體(National Semiconductor),以足足超過3倍的價(jià)格(1億6,700萬美元),買下了Cyrix。但其技術(shù)血脈,卻徹底絕滅,還在Cyrix III處理器上演了「貍貓換太子」、從Cyrix轉(zhuǎn)為Centaur技術(shù)的戲碼。Cyrix唯一留下的貢獻(xiàn),僅限于從Intel取得的交互技術(shù)授權(quán),如Socket 370使用到的P6系統(tǒng)總線(可能還得加上一些跟Cache設(shè)計(jì)有關(guān)的知識(shí)),確保威盛不會(huì)被Intel的法務(wù)部門找麻煩。
不過當(dāng)歷史上如過江之鯽的x86 處理器廠商,一家家的消失在歷史的洪流,一個(gè)一個(gè)逐漸被眾人所遺忘,Centaur 可存活至今的理由,源自于公司創(chuàng)辦人Glenn Henry 對(duì)于成本「斤斤計(jì)較」的堅(jiān)持,可說到了走火入魔的程度,包含威盛x86處理器曾經(jīng)讓人「津津樂道」的「半速浮點(diǎn)運(yùn)算」。
在了解Centaur 的產(chǎn)品設(shè)計(jì)哲學(xué):簡單(Simple)、迅速(Fast)、便宜(Cheap)之前,我們得先瞧瞧現(xiàn)已高齡77 歲、但仍以半退休狀態(tài)延續(xù)職場生涯的Glenn Henry,究竟是何方神圣,會(huì)如此偏執(zhí)的將1980 年代RISC的誕生初衷,貫徹于x86處理器產(chǎn)品設(shè)計(jì),并開辟出一條遠(yuǎn)離x86 雙雄激戰(zhàn)區(qū)的「精巧低廉」發(fā)展路徑──盡管下場好像也不是太好看。
出身自IBM 院士的Glenn Henry
Centaur 創(chuàng)辦人兼前任總裁Glenn Henry 生于1942 年7 月26 日,在IBM 展開其職業(yè)生涯,并在1985 年因RISC 的先驅(qū)研究成果(IBM RT PC, PowerPC 的前身),得到了IBM 院士( Fellow)的頭銜,擁有汗多達(dá)三百份的專利。
但他本人后來興趣轉(zhuǎn)向于「將RISC 的精神,引入高度普及的x86 指令集相容處理器」,而IBM 高層對(duì)此并不感興趣,所以他在1988 年離開了任職21 年的IBM,轉(zhuǎn)戰(zhàn)Dell ,成為該公司歷史上第一位研發(fā)部門副總裁,并在1993 年升任管理產(chǎn)品線的資深副總裁。
那時(shí)Glenn Henry 注意到一個(gè)問題:他無法在市面上買到售價(jià)低于160 美元的個(gè)人電腦處理器,這也變成降低個(gè)人電腦零售價(jià)格的最大障礙。如果沒經(jīng)歷過1990年代初期,各位可能很難想像那時(shí)的x86 處理器有多昂貴:在1994年第一季,連486DX2 66MHz 都要440 美元,更不用講793 美元的Pentium 60MHz 了。
有鑒于此,Glenn Henry 在1994 年離開Dell,重操舊業(yè),投入于x86 指令集相容處理器的研究。有趣的是,當(dāng)時(shí)在MIPS 工作的某位「前IBM 人」Tom Whiteside,希望Glenn Henry 可打造出同時(shí)兼容于MIPS 與x86 指令集的處理器,將MIPS 推入個(gè)人電腦市場,這也是Centaur 此名的由來:半人半馬。
無獨(dú)有偶的,在那時(shí),IBM 也提出了通吃PowerPC 與x86 的PowerPC615。大家都想「滲透」個(gè)人電腦市場,設(shè)法分一杯羹,特別當(dāng)銷售x86 處理器的利潤還是極為豐厚的時(shí)候。
令人難以置信的超低研發(fā)費(fèi)用與超短開發(fā)時(shí)程
不過他們拿著這個(gè)混合式處理器架構(gòu)的提案,繞了眾多研發(fā)MIPS指令集兼容處理器的廠商們(那時(shí)很多人做MIPS)一大圈后,最后只剩下一間公司愿意買單:IDT,然后Centaur 就在1995年成立了。
但Glenn Henry 和他的老板IDT CEO Len Perham,很快的承認(rèn)殘酷的現(xiàn)實(shí):MIPS 沒有機(jī)會(huì)進(jìn)入個(gè)人電腦市場,專注于x86 會(huì)更有價(jià)值,Centaur 就開始以極度拮據(jù)的預(yù)算,在x86 處理器踏出了第一步,因?yàn)橐訫IPS 兼容處理器和SRAM 做為主要業(yè)務(wù)的IDT,并不是什么有錢的大公司,支付不起像Intel 和AMD 那樣巨大的研發(fā)團(tuán)隊(duì)。
Glenn 只能采取精兵政策,從擺明放棄研制x86 處理器的IBM 和TI,挖來對(duì)x86 有經(jīng)驗(yàn)的工程師,在德州奧斯丁的Somerset PowerPC 研發(fā)中心弄來PowerPC 工程師,并從前東家Dell 找來個(gè)人電腦專家,組成了大約40 人的研發(fā)團(tuán)隊(duì)。
接著奇跡就降臨了:Centaur 僅用不到一年的時(shí)間,就Tape Out初代的C6 處理器(第一代WinChip)設(shè)計(jì),并在1996 年7月,首次Windows 操作系統(tǒng)開機(jī)成功。更駭人聽聞的是,研發(fā)經(jīng)費(fèi)僅1,000 萬到1,500 萬美元,很可能連Intel P6(Pentium Pro)的十分之一都沒有。
開發(fā)成本縮減至此,就算Centaur 只吃下1% 的x86 處理器市場占有率,都足以養(yǎng)肥自己了。況且這筆錢還有一半是由日本的MIPS 處理器廠商N(yùn)KK 所分擔(dān)的,他們?cè)诋?dāng)時(shí)被當(dāng)作IDT 部分產(chǎn)品的替代來源。
Centaur 如何打造如此夸張的世界奇觀?在AMD 的K5 創(chuàng)造者M(jìn)ike Johnson 口中「毫無道理可循」的x86 指令集不是出了名的難搞嗎?這就跟他們堅(jiān)守的三原則:簡單(Simple)、迅速(Fast)、便宜(Cheap)密不可分了。
成本至上,揚(yáng)棄超標(biāo)量流水線和動(dòng)態(tài)分支預(yù)測(cè)
1990 年代初期,「一個(gè)指令跑不夠,你可以執(zhí)行兩個(gè)」的超標(biāo)量處理器(Superscalar)流水線,與「以古鑒今」預(yù)測(cè)分支是否發(fā)生、確保指令流水線不會(huì)停擺的動(dòng)態(tài)分支預(yù)測(cè)(Dynamic Branch Prediction),是奠定高效能處理器的重要技術(shù)指標(biāo),也激增了處理器的結(jié)構(gòu)復(fù)雜度。
信奉精簡教條的Glenn Henry 卻不吃這套,吃了砰陀鐵了心,要用最短的時(shí)間、最低的成本,做出最便宜的產(chǎn)品,所有的晶體管預(yù)算都要砸在刀口上,不允許任何一絲一毫的贅肉。
就這點(diǎn)來看,Centaur 的理念,和同時(shí)期的Rise 與同年成立的Transmeta,完全如出一轍,并不打算跟Intel 硬拼,而是希望在低價(jià)電腦和筆電市場開拓一片全新的藍(lán)海。唯一的差別只有Rise認(rèn)清時(shí)勢(shì)急流勇退,Transmeta 如同蠟炬般的燒盡資金,資源消耗最少的Centaur 卻依舊幸存至今。
Centaur 揚(yáng)棄超標(biāo)量流水線的主因很簡單:有效率的超標(biāo)量流水線,須搭配大量的配套措施(像可讓指令解碼器同時(shí)擷取兩個(gè)指令的雙通道指令Cache),太過復(fù)雜,遲至2000年揭露的C5X,才算邁進(jìn)超標(biāo)量流水線的世界,只是C5X 也因成本因素,默默的不見,直到2008 年的Nano(CN)才重現(xiàn)曙光。
關(guān)于不做動(dòng)態(tài)分支預(yù)測(cè),就是純粹的精算了,Centaur 預(yù)估在C6 引進(jìn)類似Intel Pentium 的動(dòng)態(tài)分支預(yù)測(cè)功能,會(huì)提升5% 效能,但將明顯增大芯片面積,得不償失。
Centaur 將極為有限的資源,集中在認(rèn)定的效能瓶頸,如便于提高主頻速率、集中加速最經(jīng)常被執(zhí)行簡單指令的微指令轉(zhuǎn)譯,用較高容量的Cache、位址轉(zhuǎn)譯后備緩沖區(qū)(Translation Lookaside Buffer,TLB)和分頁表目錄Cache(Page Directory Cache,PDC),設(shè)法彌補(bǔ)缺少超標(biāo)量流水線和動(dòng)態(tài)分支預(yù)測(cè)的不足。所有的努力,僅局限于一款「最高效益的表露處理器」。
也難怪微處理器報(bào)導(dǎo)(MicroprocessorReport)主編曾戲稱:Centaur 做的不是「超標(biāo)量(Superscalar)」,而是「超級(jí)標(biāo)量(Super “Scalar”)」處理器。
所以Centaur 那神奇般的超低研發(fā)成本和超短開發(fā)時(shí)間,并不是沒有代價(jià)的。你就知道Glenn Henry 這個(gè)人有多摳,完全的「臺(tái)式中小企業(yè)經(jīng)營法」。
順便一題,為何這時(shí)所有Intel 競爭者的產(chǎn)品命名,從Cyrix 6×86 / 6x86MX、NexGenNx686、AMD K6、Rise mP6 等,通通都要用到「6」?道理很簡單,因?yàn)橐笳髯返纳螴ntel Pentium Pro(P6)的「第六世代x86 處理器微架構(gòu)」。
但1997 年10 月13 日問世的WinChip(C6),本質(zhì)上根本是一顆「導(dǎo)入先進(jìn)技術(shù)的80486」,別說超標(biāo)量流水線,連動(dòng)態(tài)分支預(yù)測(cè)也付之闕如,甚至連效能測(cè)試項(xiàng)·目,只有未對(duì)超標(biāo)量最佳化的Winstone97 才勉強(qiáng)可搬的上臺(tái)面,那個(gè)「C6」,實(shí)在是受之有愧。
奇謀而短、小步快跑的閃擊式產(chǎn)品研發(fā)路線
反過來說,天下武功,唯快不破,極短的產(chǎn)品開發(fā)時(shí)程,也帶來更密集的產(chǎn)品更迭,盡速修正前代產(chǎn)品的弱點(diǎn),并縮短進(jìn)入市場的時(shí)間(Time To Market),迎合市場需求。初代WinChip 才剛上市沒多久,1997 年11 月Centaur 就宣布微幅改良版的C6+ 計(jì)劃,并在1998 年5 月19 日就公開樣品,當(dāng)年9 月WinChip 2 產(chǎn)品就登場,速度相當(dāng)驚人。
在1998 年,Centaur 大約每季銷售25 萬顆WinChip系列處理器,推算一年約100 萬顆,主要客戶都在美國以外的市場。按照當(dāng)時(shí)個(gè)人電腦年度出貨量,Centaur 的確有達(dá)到1% 市占率的目標(biāo)。在1999 年被威盛購并時(shí),初代WinChip(C6)在兩年半的時(shí)間,累積了150 萬顆的銷售量,這并不包含WinChip 2 和WinChip 3(C6+)的數(shù)字。
奇謀而短、小步快跑的打「機(jī)遇戰(zhàn)」,看不見的副作用,莫過于混亂的產(chǎn)品時(shí)程表,親身體驗(yàn)過某些「老板導(dǎo)向」企業(yè)文化的科技產(chǎn)業(yè)工作者,都會(huì)有一股強(qiáng)烈的即視感。
以C6+ 來說,根據(jù)倍頻比例、制程、核心/ IO 分離式電壓和Cache容量,就可分成WinChip 2、WinChip 2A、WinChip 2B 和WinChip 3 這4 種產(chǎn)品線。在Centaur 被威盛購并后的5 年內(nèi),更是毫無邏輯可言,連筆者都有點(diǎn)同情威盛的產(chǎn)品行銷人員,看了二十幾年的處理器產(chǎn)品時(shí)程表,還沒見過這么夸張的案例。
C6+ 改進(jìn)C6 的兩個(gè)主要缺點(diǎn):缺少動(dòng)態(tài)分支預(yù)測(cè)(4096 個(gè)單位元分支歷史表),和貧弱的浮點(diǎn)/ MMX 效能(將其管線化并可同時(shí)執(zhí)行兩個(gè)指令),并新增AMD 3DNow ! 指令集。
其實(shí)為了改善3D 應(yīng)用的效能,Centaur 原先計(jì)劃自行定義53 個(gè)SIMD浮點(diǎn)指令(耗用12 個(gè)x86 運(yùn)算碼)與22 個(gè)可直接定址(有別于80×87 的愚蠢堆疊架構(gòu))的80 位元浮點(diǎn)暫存器,并完全符合IEEE 754 浮點(diǎn)數(shù)規(guī)范,看似非常的前瞻,也明顯優(yōu)于AMD 的3DNow! 與Cyrix 的MMX-FP。
看在微軟希望所有x86 處理器廠商,統(tǒng)一采用相同SIMD 浮點(diǎn)指令的份上,與當(dāng)時(shí)AMD CEO Jerry Sanders 很大方的愿意開放3DNow! 讓業(yè)界共襄盛舉,Centaur 就拋棄了這念頭,投奔AMD的懷抱,況且假若謠傳中的Intel MMX2 使用到重復(fù)的運(yùn)算碼,屆時(shí)將會(huì)對(duì)Centaur 帶來莫大的麻煩。
在1997 年底透露的「C6 強(qiáng)化方案」還有一項(xiàng)未能實(shí)行:新增256kB 二級(jí)Cache,這檔事倒是對(duì)Centaur 的母公司IDT 相當(dāng)有意義,畢竟IDT 的本業(yè)除了MIPS 相容處理器,還有SRAM。
但經(jīng)過Centaur 仔細(xì)盤算后,評(píng)估在0.25μm 制程時(shí),加掛256kB 二級(jí)Cache,將幾乎倍增芯片面積(58 mm2→113 mm2),而加倍一級(jí)Cache的效果相去無幾,但面積成長不多(58 mm2→75 mm2),自然著毋庸議的在WinChip 3 選擇了后者。
低價(jià)電腦一直是Centaur的大好機(jī)會(huì),Cyrix 在1997 年3 月,發(fā)布x86 處理器史上第一顆整合繪圖和音效的系統(tǒng)單芯片MediaGX,促使Centaur 在產(chǎn)品時(shí)程表擺上了如法泡制的WinChip 2+NB(整合北橋),也與威盛(VIA)、矽統(tǒng)(SiS)和揚(yáng)智(ALi)等臺(tái)灣芯片組廠商,洽談北橋芯片的技術(shù)授權(quán),預(yù)定在1999 年第一季量產(chǎn)。
但WinChip 2+ 和WinChip 2+NB 在1998 年底即無疾而終,死因不明,但可合理判斷原因不外乎「談不攏芯片組授權(quán)」、「研發(fā)能量不足」,或著「可能有買家快要來購并了」。而WinChip3 的表訂時(shí)脈,就更加遙不可及了。
「半速浮點(diǎn)運(yùn)算器」的傳奇
在21 世紀(jì)初期經(jīng)歷過Cyrix III 和早期C3/Eden(C5A/B/C/N 核心)處理器的個(gè)人電腦玩家,或多或少聽聞「威盛處理器的浮點(diǎn)運(yùn)算頻率只有主頻一半」的傳奇故事,而坊間謠傳的解釋多半是「為了提高良率」,這說法完全大錯(cuò)特錯(cuò)。
Intel Pentium Pro 三位總工程師之一的Robert Colwell,在其回憶錄《The Pentium Chronicles》的第五章「產(chǎn)品量產(chǎn)階段(TheProduction Phase)」,引用了一段冷笑話,突顯在這個(gè)跟時(shí)間賽跑的「死線期」,工程團(tuán)隊(duì)到底在想些什么。
兩個(gè)男性工程學(xué)系的學(xué)生,騎車穿過校園。其中一人好奇的問「你這臺(tái)綠色腳踏車是怎么來的?」另一人回答「我昨天獨(dú)自散步,一邊走一邊想著我的作業(yè)時(shí),有位漂亮女孩騎著這臺(tái)腳踏車,在我面前停下,一下車,馬上脫個(gè)一絲不掛,要求我?guī)ё呦胍臇|西。」發(fā)問者就猛點(diǎn)頭表示同意,「好選擇,因?yàn)槟切┮路憧赡艽┎幌隆埂?/span>
這種「實(shí)用主義」在當(dāng)你面臨最嚴(yán)酷的時(shí)間壓力時(shí),就是再自然也不過的「政治正確」。
Centaur 在1998 年底披露的WinChip 4(代號(hào)C4,數(shù)字終于一致),企圖藉由從頭全新設(shè)計(jì)的11 級(jí)指令流水線(主頻目標(biāo)500MHz 以上)、號(hào)稱x86世界最強(qiáng)大的動(dòng)態(tài)分支預(yù)測(cè)機(jī)制、大型化的位址轉(zhuǎn)譯后備緩沖區(qū)、有限度的超標(biāo)量(指令解碼器可在同時(shí)鐘周期內(nèi)解碼一個(gè)復(fù)雜指令和一個(gè)簡單指令,兩個(gè)MMX /3DNow! 指令可配對(duì)執(zhí)行)和非循序指令執(zhí)行(限于存儲(chǔ)器載入回存),拉近與其他競爭對(duì)手的效能差距。
Winchip 4 也采取和同時(shí)期的Rise mP6 神似的「執(zhí)行單元開工前,提前存取數(shù)據(jù)Cache」等手段,將指令流水線「塞好塞滿」。
毫無疑問,Glenn Henry 堅(jiān)持WinChip 4 依循「簡單、迅速、便宜」的「Centaur 登山寶訓(xùn)」,并表示「謀略優(yōu)于電晶體(Tricks are better than transistors.)」與暫存器更名(非循序指令執(zhí)行)是「魔鬼的工作(Work of the Devil)」。eetop編輯
但問題來了,Centaur 一方面想提高WinChip 4 的主頻,另一方面又不愿意多花時(shí)間,重新設(shè)計(jì)可跟上高主頻的深度流水線化浮點(diǎn)運(yùn)算器,該怎么辦?很簡單,原封不動(dòng)的移植WinChip 2 的浮點(diǎn)運(yùn)算器,兩個(gè)時(shí)鐘周期當(dāng)一個(gè)用,讓它只跑主頻一半的時(shí)脈就好了,一切功德圓滿,皆大歡喜,讓原本性能就偏弱的浮點(diǎn)運(yùn)算,從此變成威盛x86 處理器的超級(jí)大劣勢(shì),到了2003 年的C5XL 核心VIA C3 才解決。這「謀略」有多「厲害」,就見仁見智了。eetop編輯
在威盛體系取代Cyrix
威盛在1999 年6 月30 日與8 月5 日,先后宣布購并Cyrix 和Centaur。第一個(gè)標(biāo)上威盛品牌的x86 處理器,是Cyrix 代號(hào)「Joshua(約書亞)」的Cyrix III,在2000 年2 月22 日進(jìn)入市場,但極為短命,活不到半年就夭折。
Centaur 為了配合新東家的產(chǎn)品發(fā)展策略,Socket 7 腳位的WinChip 4(C4)僅停留于工程樣品階段,轉(zhuǎn)為Socket 370 的C5A(威盛代號(hào)Samuel)。「理論上」C5A 應(yīng)沿用大半的C4 設(shè)計(jì),但很明顯的,光動(dòng)態(tài)分支預(yù)測(cè)的部分,C5A 就省略掉了C4 原訂的分支目標(biāo)位址Cache(Branch Target Address Cache,BTAC),已知資料也顯示流水線結(jié)構(gòu)也有所差異,總之C5A 沒有照單全收C4 的改進(jìn)項(xiàng)目,恐怕也是為了降低成本。請(qǐng)大家再跟著喊一次:簡單、迅速、便宜。
C5A 從開工到Tape Out,從IBM 0.25μm 轉(zhuǎn)進(jìn)臺(tái)積電0.18μm 制程,僅花了兩個(gè)月的時(shí)間。更在2000 年6 月6 日,一舉取代Cyrix,「鳩占鵲巢」的搶走Cyrix III 這個(gè)原本不屬于Centaur 的名號(hào)。如夢(mèng)似幻般的Cyrix M3「Jalapeno」微架構(gòu)與相對(duì)應(yīng)的Socket 370 處理器「Mojave」亦無以為繼,替Cyrix 劃下了充滿遺憾的句點(diǎn)。
在2019 年,AMD 結(jié)束了最早源自于MediaGX 的Geode LX 產(chǎn)品線,意味著Cyrix 的技術(shù)血脈,從此永遠(yuǎn)斷絕。威盛之所以做出這樣的決定,要嘛既有Cyrix 團(tuán)隊(duì)的人才大量流失(據(jù)聞Joshua 剛「殺青」沒多久,團(tuán)隊(duì)就解散了),要嘛威盛本來就不打算讓Cyrix 活下來,要嘛威盛高層也認(rèn)同Glenn Henry 的那一套省錢之道,要嘛三者皆有。eetop編輯
當(dāng)x86 雙雄開始在低價(jià)市場大打出手
但威盛進(jìn)軍x86 處理器市場的時(shí)機(jī)卻極度微妙。站在更遠(yuǎn)的角度觀察1999 年的x86 處理器市場,就不難理解國家半導(dǎo)體和IDT 急著脫手旗下x86 處理器部門的緣由──Intel 和AMD 早就盯上了低價(jià)市場,這讓他們手上的x86 處理器業(yè)務(wù),變成欲除之而后快的燙手山竽。
在1998 年11 月,Cyrix 在美國的零售通路還保有22% 占有率,但在1999 年2 月,Intel 發(fā)動(dòng)高主頻Celeron 大攻勢(shì)之后(同時(shí)AMD 也用K6-2 展開搶攻),Cyrix 產(chǎn)品競爭力一落千丈,只能低價(jià)促銷,美國零售通路占有率瞬間被侵蝕到剩下不到5%,單季銷量量跌至150 萬顆,產(chǎn)品平均單價(jià)更從49 美元一路滑落到42 美元,而品牌電腦和筆電市場就更毫無還手之力。講的白話一點(diǎn)就是「大環(huán)境惡化」,時(shí)不我與。
Centaur 的總體銷售量跟Cyrix 相比,還差得遠(yuǎn)了,搞不好累積一整年,還比不過人家最慘澹的一季。這一點(diǎn)都不奇怪,要不然為何Cyrix 的購并價(jià)碼會(huì)是Centaur 的3 倍還要多一些。
但過去只想靠著賣便宜芯片過著安穩(wěn)日子的Centaur,已經(jīng)主導(dǎo)威盛的x86 處理器技術(shù)發(fā)展,面對(duì)迎面而來的龐大競爭壓力,可是想逃也逃不了,他們還有那個(gè)本錢繼續(xù)死守「簡單、迅速、便宜」法則嗎?還是為了執(zhí)著于家傳寶訓(xùn),而付出了更慘痛的代價(jià)?
聯(lián)系客服
微信登錄中...
請(qǐng)勿關(guān)閉此頁面