昨天是英特爾中國研究院成立20周年,英特爾所在的融科大樓著實“火”了一把,但并沒有影響他們一年一度的媒體開放日。
相隔不到12小時后,在大洋彼岸的“架構(gòu)日”(Architecture Day)活動中,英特爾也接連放出大招,公布了多項重大消息。
其中最引人關(guān)注的就是“牙膏廠”終于擠出了10nm芯片,有望在2019年下半年開始出貨。
在摩爾定律已經(jīng)發(fā)展到盡頭的今天,英特爾在10nm工藝制程上遇到巨大困難,本來2到3年提高工藝制程的計劃一拖再拖。以至于從2015年發(fā)布Skylake架構(gòu)的芯片以來,英特爾一直在14nm上小修小補。
甚至傳言稱英特爾在10nm工藝制程上遇到巨大困難,可能完全放棄10nm計劃。
而英特爾突然宣布明年將推出下一代Sunny Cove架構(gòu)的酷睿與至強芯片。終于從“湖”(Lake)變成“海”(Cove)。
Sunny Cove是一種基于10nm工藝構(gòu)建的增強型微架構(gòu)。 雖然它仍然來自之前的Skylake,但是已被改進以并行執(zhí)行更多指令,并具有更低的延遲,同時芯片緩存也比之前擴大很多。Sunny Cove芯片的一級緩存比Skylake大50%,至于2級緩存大小則會取決于芯片的市場定位。
Sunny Cove包括對AVX-512指令的支持。 AVX-512涵蓋許多不同的擴展和功能,一些是通用矢量算法,另一些是專門用于神經(jīng)網(wǎng)絡(luò)等工作負載。
除此之外,Sunny Cove還包含加速加密和數(shù)據(jù)壓縮工作負載的新指令,在這些新指令上相比前代有75%的性能提升。
但英特爾推出的并非完全是10nm芯片,而是通過Foveros技術(shù)將不同性能、不同部分封裝在一起,僅高性能部分使用的是10nm工藝制程。
英特爾在推出Sunny Cove的同時,也宣布了其業(yè)界首創(chuàng)的邏輯芯片3D堆疊技術(shù)Foveros。該技術(shù)之前已經(jīng)應(yīng)用在存儲芯片上,但用在CPU上仍有困難。
Foveros允許將復(fù)雜的邏輯芯片堆疊在一起,從而提供更大的功能,使處理器不同部分的組件與相應(yīng)的制造工藝匹配。
例如,高性能CPU內(nèi)核可能構(gòu)建在性能最高的10nm工藝上,但集成USB、Wi-Fi、以太網(wǎng)、PCIe的I/O連接部分不需要這么高的性能。
因此,對于芯片的這一部分使用性能稍低的14nm甚至22nm工藝可能更有意義:性能仍然足夠好,但功耗和成本要低得多。Foveros意味著處理器可以按照不同的制程集成這些組件。
使用Foveros,這些不同的組件可以并排緊密包裝在一起,實現(xiàn)更高的密度和更小的芯片面積。
英特爾預(yù)計未來不同的CPU任務(wù)將越來越多地分成芯片組,然后以混合和匹配方式組合芯片。諸如I/O和電力輸送等低功耗組件將被放入芯片底部,而高性能邏輯部分則堆疊在頂部。
英特爾表示,F(xiàn)overos產(chǎn)品將在2019年下半年出貨,該技術(shù)已準備好進行大規(guī)模生產(chǎn),它不僅僅面向?qū)S没蚨ㄖ铺幚砥鳎€包括主流消費級CPU。首批產(chǎn)品將采用22FFL(低功耗FinFET)工藝,將10nm計算單元堆疊在芯片頂部。
10nm部分將包含Sunny Cove高功率核心和四個Atom內(nèi)核,它與現(xiàn)代手機上的ARM處理器類似,對于較輕的工作任務(wù)使用低功耗Atom內(nèi)核,而Sunny Cove用于計算量更大的任務(wù)。
該芯片還將針對超移動系統(tǒng)優(yōu)化,芯片尺寸僅為12×12×1mm,待機功率為2mW。
英特爾放棄第10代集成顯卡,推出全新的第11代(Gen11)集成顯卡,它配備64個增強型執(zhí)行單元,比此前的英特爾第9代集成顯卡(24EU)多出一倍以上,運算能力突破1 TFLOPS。
新的集成顯卡將使用基于圖塊的渲染方法,該方法將圖像劃分為單獨渲染的圖塊。這樣會減少GPU所需的內(nèi)存帶寬。
該芯片包含兩個解碼器和一個編碼器,英特爾重新設(shè)計了HEVC / H.265編碼器。它將支持4K甚至8K視頻流,并且支持HDR和AMD的FreeSync技術(shù)。
英特爾表示,在中等畫質(zhì)和1080p條件下,第11代集成顯卡已經(jīng)可以運行游戲《鐵拳》了,這在第9代集成顯卡上是不可能的。
新的集成顯卡將在2019年與10nm處理器一起推出,因此很可能與新的Sunny Cove核心搭配組合。
英特爾還強調(diào),公司計劃推出新架構(gòu)的獨立顯卡,代號為“Xe”,預(yù)計將于2020年出貨。
除了以上內(nèi)容,英特爾還宣布推出深度學習參考堆棧(Deep Learning Reference Stack),這是一個集成、高性能的開源堆棧,基于英特爾至強可擴展平臺進行了優(yōu)化。
它的開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問英特爾平臺的所有特性和功能。深度學習參考堆棧經(jīng)過高度調(diào)優(yōu),專為云原生環(huán)境而構(gòu)建。
該版本可以降低集成多個軟件組件所帶來的復(fù)雜性,幫助開發(fā)人員快速進行原型開發(fā),同時讓用戶有足夠的靈活度打造定制化的解決方案。
操作系統(tǒng):Clear Linux操作系統(tǒng)可根據(jù)個人開發(fā)需求進行定制,針對英特爾平臺以及深度學習等特定用例進行了調(diào)優(yōu);
編排:Kubernetes*可基于對英特爾平臺的感知,管理和編排面向多節(jié)點集群的容器化應(yīng)用;
容器:Docker容器和Kata容器利用英特爾?虛擬化技術(shù)來幫助保護容器;
函數(shù)庫:英特爾? 深度神經(jīng)網(wǎng)絡(luò)數(shù)學核心函數(shù)庫(MKL DNN)是英特爾高度優(yōu)化、面向數(shù)學函數(shù)性能的數(shù)學庫;
運行時:Python*針對英特爾架構(gòu)進行了高度調(diào)優(yōu)和優(yōu)化,提供應(yīng)用和服務(wù)執(zhí)行運行時支持;
框架:TensorFlow*是一個領(lǐng)先的深度學習和機器學習框架;
部署:KubeFlow*是一個開源、行業(yè)驅(qū)動型部署工具,在英特爾架構(gòu)上提供快速體驗,易于安裝和使用。
最后,還有一個小插曲。
今年從特斯拉跳槽加盟的架構(gòu)大神Jim Keller,還現(xiàn)場diss了那些高喊“摩爾定律已死”的友商(此處應(yīng)指老黃)。他說摩爾定律依然會持續(xù)下去。
他說英特爾的工作讓他激動又覺得有趣,滿心想要大干一場,干更大的一場~
摩爾定律沒有死,你同意Jim Keller嗎?
— 完 —
活動報名
加入社群
聯(lián)系客服