在昨天凌晨于舊金山舉辦的首屆Qualcomm AI Day會(huì)議上,高通除了發(fā)布驍龍665、730 730G三款新系統(tǒng)芯片面向智能手機(jī)、平板電腦和其他移動(dòng)設(shè)備
在昨天凌晨于舊金山舉辦的首屆Qualcomm AI Day會(huì)議上,高通除了發(fā)布驍龍665、730/730G三款新系統(tǒng)芯片面向智能手機(jī)、平板電腦和其他移動(dòng)設(shè)備之外,還正式宣布了自家第一款專用人工智能處理器Qualcomm Cloud AI 100系列,專為數(shù)據(jù)中心推理計(jì)算使用。外媒評(píng)論稱,高通此舉無(wú)疑是向英偉達(dá)和英特爾“發(fā)起挑戰(zhàn)”。
高通進(jìn)軍云端AI加速器市場(chǎng)
卷積神經(jīng)網(wǎng)絡(luò)和其他人工智能(AI)技術(shù)在過(guò)去十年中對(duì)處理器領(lǐng)域的影響是不可避免的。幾乎所有處理器制造商、軟件供應(yīng)商都渴望投資開發(fā)AI方面的新功能,并實(shí)現(xiàn)升級(jí)突破。
在這十年開始時(shí),一個(gè)完全沒(méi)有存在的市場(chǎng)在過(guò)去幾年中成為研究和收入的中心,并且已經(jīng)有一些處理器供應(yīng)商已經(jīng)建立了自己的市場(chǎng)地位。
人工智能的這個(gè)現(xiàn)代時(shí)代仍處于早期階段,市場(chǎng)尚未找到上限;數(shù)據(jù)中心繼續(xù)批量購(gòu)買AI加速器,并且該技術(shù)的部署也越來(lái)越多地在消費(fèi)者處理器中出現(xiàn)。在許多人認(rèn)為仍在爭(zhēng)奪的市場(chǎng)中,全球的處理器標(biāo)記正在試圖弄清楚它們?nèi)绾纬蔀橐淮凶畲蟮男绿幚砥魇袌?chǎng)之一的主導(dǎo)力量。簡(jiǎn)而言之,人工智能“淘金熱”正在全面展開。
人工智能“淘金熱”吸引了科技界各個(gè)角落的關(guān)注。其范圍從GPU和CPU公司到FPGA公司,定制ASIC芯片等等。但在人工智能的所有這些方面,最有利可圖的市場(chǎng)是這個(gè)層次結(jié)構(gòu)的頂端市場(chǎng):數(shù)據(jù)中心。由于運(yùn)營(yíng)商希望購(gòu)買大量的分立處理器,因此數(shù)據(jù)中心市場(chǎng)是擴(kuò)展性的、昂貴的,并且仍在實(shí)現(xiàn)跨越式發(fā)展。
而現(xiàn)在,最后一位坐在數(shù)據(jù)中心AI市場(chǎng)旁邊的巨頭終于采取行動(dòng)了——高通正以激進(jìn)的方式進(jìn)入人工智能加速器市場(chǎng)。高通公布了他們的第一款分立式專用AI處理器,即Qualcomm Cloud AI 100系列。該公司專為人工智能市場(chǎng)而設(shè)計(jì),并以高通公司承諾成為一個(gè)廣泛的軟件堆棧為后盾,希望到2020年將自己打造成為人工智能加速器的主要供應(yīng)商之一。
Cloud AI 100系列加速器基于7納米芯片工藝,將于2020年推出產(chǎn)品,樣片預(yù)計(jì)將在今年晚些時(shí)候向客戶公布。這款芯片的目標(biāo)是根據(jù)數(shù)字化的語(yǔ)音或圖片數(shù)據(jù)流分析來(lái)制定決策。
高通高管基斯·克里辛(Keith Kressin)表示,這不是手機(jī)處理器的簡(jiǎn)單改版。據(jù)外媒報(bào)道,高通聲稱Cloud AI 100的峰值性能是Snapdragon 855和Snapdragon 820的3-50倍,與傳統(tǒng)的FPGA相比,它的推理速度提高了約10倍。此外,Cloud AI 100的運(yùn)算性能可以遠(yuǎn)超100 TOPs,不過(guò)高通并未透露不同精度下的峰值。
Qualcomm Cloud AI 100架構(gòu):專用推理ASIC
高通正在為數(shù)據(jù)中心市場(chǎng)開發(fā)一系列AI推理加速器。雖然不是一個(gè)從上到下的計(jì)劃,但這些加速器將采用各種外形和TDP,以滿足數(shù)據(jù)中心運(yùn)營(yíng)商的需求。在這個(gè)市場(chǎng)中,高通公司希望憑借在市場(chǎng)上提供最高效的推理加速器而獲勝,其性能遠(yuǎn)高于目前的GPU和FPGA領(lǐng)跑者。
首先,這些新部件將采用7納米工藝制造——可能是臺(tái)積電以性能為導(dǎo)向的7納米HPC工藝。該公司將提供多款芯片,但目前尚不清楚它們是否實(shí)際設(shè)計(jì)了多個(gè)處理器。而且,這是一個(gè)全新的設(shè)計(jì),從頭開始;所以它并沒(méi)有說(shuō)Snapdragon 855的所有AI體位都被放大了。
事實(shí)上,最后一點(diǎn)可能是最重要的。雖然高通公司今天沒(méi)有為加速器提供架構(gòu)細(xì)節(jié),但該公司已經(jīng)明確表示這是一款A(yù)I推理加速器,僅此而已。它沒(méi)有被稱為AI訓(xùn)練加速器,也沒(méi)有被稱為GPU。它只是被用于AI推理——有效地執(zhí)行預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
高通公司的聲明非常強(qiáng)烈地指出基礎(chǔ)架構(gòu)是人工智能推理ASIC——類似谷歌的TPU系列——而不是更靈活的處理器。當(dāng)然遠(yuǎn)非第一家專門為AI處理而構(gòu)建ASIC的廠商,但其他AI ASIC要么專注于低端市場(chǎng),要么留作內(nèi)部使用(谷歌的TPU再次成為主要的例子),高通公司正在談?wù)搶I加速器出售給客戶以供數(shù)據(jù)中心使用。而且,相對(duì)于競(jìng)爭(zhēng)對(duì)手而言,他們所談?wù)摰膬?nèi)容更像ASIC,而不是類似GPU的設(shè)計(jì),每個(gè)人都期望在2020年從領(lǐng)先的英偉達(dá)(NVIDIA)和積極的新人英特爾中脫穎而出。
Qualcomm的Cloud AI 100處理器設(shè)計(jì)如此專注于AI推理,這對(duì)其性能潛力至關(guān)重要。在處理器設(shè)計(jì)范圍內(nèi),架構(gòu)師可以靈活平衡效率;芯片越接近固定功能ASIC,它就越有效。正如GPU如何在CPU上實(shí)現(xiàn)AI性能的巨大飛躍一樣,高通希望在GPU上做同樣的事情。
當(dāng)然,問(wèn)題在于更具固定功能的AI ASIC正在放棄靈活性。無(wú)論是處理新框架,新處理流程還是全新神經(jīng)網(wǎng)絡(luò)模型的能力還有待觀察。但高通公司將在這里進(jìn)行一些重要的權(quán)衡,最重要的問(wèn)題是這些是否是正確的權(quán)衡,以及整個(gè)市場(chǎng)是否已為數(shù)據(jù)中心規(guī)模的AI ASIC做好準(zhǔn)備。
同時(shí),高通公司必須解決的另一個(gè)技術(shù)問(wèn)題是Cloud AI 100系列,這是他們第一個(gè)專用的AI處理器。不可否認(rèn),每個(gè)人都必須從某個(gè)地方開始,而在高通的情況下,他們希望將他們?cè)谌斯ぶ悄芊矫娴膶I(yè)知識(shí)轉(zhuǎn)化為數(shù)據(jù)中心的人工智能。該公司的旗艦Snapdragon SoC已經(jīng)成為一股不可忽視的力量,高通公司認(rèn)為他們?cè)诟咝гO(shè)計(jì)和信號(hào)處理方面的經(jīng)驗(yàn)將使公司在這方面占據(jù)重要地位。
無(wú)論是公司的龐大規(guī)模,他們都能夠迅速提高產(chǎn)量。雖然這并沒(méi)有幫助他們對(duì)抗NVIDIA和英特爾這兩大競(jìng)爭(zhēng)對(duì)手——這兩者都可以分別在臺(tái)積電及其內(nèi)部晶圓廠擴(kuò)大規(guī)模——但它使得高通公司在無(wú)數(shù)小型硅谷初創(chuàng)公司中也有明顯的優(yōu)勢(shì),這些初創(chuàng)公司也在追求AI ASIC方面的突破。
為什么要競(jìng)逐數(shù)據(jù)中心推理市場(chǎng)?
除了技術(shù)方面的考慮之外,今天宣布的另一個(gè)重要因素是高通公司追求AI推理加速器市場(chǎng)的原因。簡(jiǎn)而言之,答案就是利潤(rùn)和金錢。
對(duì)人工智能推理市場(chǎng)最終規(guī)模的預(yù)測(cè)差別很大,但高通公司認(rèn)為到2025年數(shù)據(jù)中心推理加速器市場(chǎng)可能會(huì)達(dá)到170億美元。如果事實(shí)證明這是真的,那么它將代表一個(gè)相當(dāng)大的市場(chǎng)。否則高通會(huì)錯(cuò)過(guò)。一個(gè)可以完全與當(dāng)前芯片制造業(yè)務(wù)相媲美的產(chǎn)品。
此處值得注意的是,這顯然是推理市場(chǎng),而不是整個(gè)數(shù)據(jù)中心推理+訓(xùn)練市場(chǎng)。這是一個(gè)重要的區(qū)別,因?yàn)殡m然培訓(xùn)也很重要,但培訓(xùn)的計(jì)算要求與推理有很大不同。雖然可以使用相對(duì)低精度的數(shù)據(jù)類型——如INT8(有時(shí)更低)——執(zhí)行準(zhǔn)確的推理,但目前大多數(shù)培訓(xùn)需要FP16或更多。這需要一種非常不同類型的芯片,特別是當(dāng)我們談?wù)揂SIC時(shí),而不是像GPU那樣更通用的東西。
這也可以擴(kuò)展到規(guī)模:雖然訓(xùn)練神經(jīng)網(wǎng)絡(luò)可能需要大量資源,但只需要完成一次。然后它可以多次復(fù)制到推理加速器的農(nóng)場(chǎng)。因此,與培訓(xùn)一樣重要的是,潛在客戶只需要比具有培訓(xùn)功能的處理器更多的推理加速器。
與此同時(shí),盡管該公司沒(méi)有明確表示,但很明顯高通公司正打算取消市場(chǎng)領(lǐng)導(dǎo)者NVIDIA,即使在這些早期,他們已經(jīng)用AI處理器建立了一個(gè)小型帝國(guó)。目前,NVIDIA的Tesla T4、P4和P40加速器構(gòu)成了數(shù)據(jù)中心AI推理處理器的支柱,數(shù)據(jù)中心收入整體上證明對(duì)NVIDIA來(lái)說(shuō)非常有利可圖。因此,即使整個(gè)數(shù)據(jù)中心市場(chǎng)沒(méi)有像預(yù)期的那樣增長(zhǎng),它仍然會(huì)非常有利可圖。
高通還不得不提防來(lái)自英特爾的威脅,英特爾公開表達(dá)了他們自己的人工智能市場(chǎng)計(jì)劃。該公司有幾個(gè)不同的AI計(jì)劃,從低功耗Movidius加速器到最新的Cascade Lake Xeon可擴(kuò)展CPU。然而,對(duì)于高通公司闖入的特定市場(chǎng)賽道而言,最大的威脅可能是英特爾即將推出的Xe GPU,這些GPU將來(lái)自該公司最近重建的GPU部門。與高通一樣,英特爾也在力爭(zhēng)趕超NVIDIA,因此人工智能推理市場(chǎng)正面臨著激烈的競(jìng)爭(zhēng)與演化,沒(méi)有一個(gè)巨頭希望自己在這場(chǎng)角逐中落敗而歸。
沖刺終點(diǎn)線?
除了高通公司的雄心外,在接下來(lái)的12個(gè)月左右,公司的重點(diǎn)將是收獲和組建第一批客戶。要做到這一點(diǎn),該公司必須表明它對(duì)Cloud AI 100系列所做的事情是認(rèn)真的,它可以在硬件上提供,并且它可以與競(jìng)爭(zhēng)對(duì)手的軟件生態(tài)系統(tǒng)的易用性相匹配。這一切都不容易,這就是為什么高通公司現(xiàn)在需要開始,遠(yuǎn)遠(yuǎn)超過(guò)商業(yè)貨運(yùn)開始的時(shí)間。
雖然高通公司多年來(lái)一直對(duì)服務(wù)器和數(shù)據(jù)中心市場(chǎng)抱有各種各樣的夢(mèng)想,但描述這些努力的最禮貌的方式可能是“過(guò)于雄心勃勃”。例如,高通公司的Centriq系列基于ARM的服務(wù)器CPU,該公司推出在2017年大張旗鼓地宣布,只有整個(gè)項(xiàng)目在一年內(nèi)崩潰。除了Centriq的優(yōu)點(diǎn)外,高通公司仍然是一家主要針對(duì)芯片制造方面的移動(dòng)處理器和調(diào)制解調(diào)器的公司。因此,為了讓數(shù)據(jù)中心運(yùn)營(yíng)商投資Cloud AI系列,高通公司不僅需要為第一代提供一個(gè)偉大的計(jì)劃,而且還要為未來(lái)幾代人制定計(jì)劃。
這里的結(jié)果是,在年輕的、不斷增長(zhǎng)的推理加速器市場(chǎng)中,數(shù)據(jù)中心運(yùn)營(yíng)商更愿意嘗試新的處理器而不是CPU。因此,我們沒(méi)有理由相信Cloud AI 100系列無(wú)論如何都不能取得適度的成功。但高通公司要說(shuō)服其他仍然謹(jǐn)慎的數(shù)據(jù)中心運(yùn)營(yíng)商,高通公司的產(chǎn)品值得投入如此多的資源。
與此平行的是等式的軟件方面。到目前為止,NVIDIA成功的很大一部分就是他們的人工智能軟件生態(tài)系統(tǒng)。這本身就是他們十年前的CUDA生態(tài)系統(tǒng)的擴(kuò)展,到目前已經(jīng)讓GPU競(jìng)爭(zhēng)對(duì)手AMD陷入困境。高通方面的優(yōu)勢(shì)是,最流行的框架,運(yùn)行周期和工具已經(jīng)建立,TensorFlow、Caffe2和ONNX這些是它布局中的“大目標(biāo)”。這就是為什么高通公司承諾提供廣泛的軟件堆棧,因?yàn)樗梢宰龅竭@一點(diǎn)。但高通公司確實(shí)必須在這一方面加快速度,因?yàn)樗麄兊能浖褩?shí)際運(yùn)行的程度可以決定整個(gè)項(xiàng)目的成敗。高通需要提供良好的硬件和良好的軟件才能在這里取得成功。
但至少目前,高通公司今天發(fā)布的公告仍是一個(gè)“預(yù)告片”,還有很長(zhǎng)的路要走。該公司制定了一項(xiàng)雄心勃勃的計(jì)劃,旨在闖入日益增長(zhǎng)的人工智能推理加速器市場(chǎng),并提供與開放市場(chǎng)上其他任何產(chǎn)品不同的處理器。雖然這中間的過(guò)渡將會(huì)是一個(gè)挑戰(zhàn),高通公司對(duì)推理加速器市場(chǎng)的需求卻只增不減。它是能夠?yàn)槠溟_發(fā)處理器的能力。以及它們?nèi)绾文軌虮苊庀萑肫湎惹胺?wù)器處理器計(jì)劃的那種失誤。
最重要的是,高通不會(huì)簡(jiǎn)單地采用推理加速器市場(chǎng):它們將不得不為它而戰(zhàn)。這是NVIDIA失去的市場(chǎng),英特爾也在關(guān)注它,更不用說(shuō)來(lái)自GPU廠商,F(xiàn)PGA供應(yīng)商和其他ASIC廠商的所有小型廠商。任何和所有這些都可以在新興技術(shù)的年輕市場(chǎng)中快速上升和下降。因此,雖然它還差不多一年,但2020年正在迅速成為人工智能加速器市場(chǎng)的第一場(chǎng)大戰(zhàn)。
高通高管基斯·克里辛(Keith Kressin)表示,該公司將使用其在移動(dòng)領(lǐng)域的技術(shù)專長(zhǎng),并借助其利用最新制造技術(shù)設(shè)計(jì)芯片的能力。而這款芯片的關(guān)鍵特征在于能耗效率。這個(gè)市場(chǎng)到2025年的規(guī)模預(yù)計(jì)可達(dá)170億美元。