高通宣布Cloud AI 100系列將借助技術(shù)設(shè)計(jì)芯片

2019-04-11 10:31:00 來(lái)源：前瞻網(wǎng)

在昨天凌晨于舊金山舉辦的首屆Qualcomm AI Day會(huì)議上，高通除了發(fā)布驍龍665、730 730G三款新系統(tǒng)芯片面向智能手機(jī)、平板電腦和其他移動(dòng)設(shè)備

在昨天凌晨于舊金山舉辦的首屆Qualcomm AI Day會(huì)議上，高通除了發(fā)布驍龍665、730/730G三款新系統(tǒng)芯片面向智能手機(jī)、平板電腦和其他移動(dòng)設(shè)備之外，還正式宣布了自家第一款專用人工智能處理器Qualcomm Cloud AI 100系列，專為數(shù)據(jù)中心推理計(jì)算使用。外媒評(píng)論稱，高通此舉無(wú)疑是向英偉達(dá)和英特爾“發(fā)起挑戰(zhàn)”。

高通進(jìn)軍云端AI加速器市場(chǎng)

卷積神經(jīng)網(wǎng)絡(luò)和其他人工智能(AI)技術(shù)在過(guò)去十年中對(duì)處理器領(lǐng)域的影響是不可避免的。幾乎所有處理器制造商、軟件供應(yīng)商都渴望投資開發(fā)AI方面的新功能，并實(shí)現(xiàn)升級(jí)突破。

在這十年開始時(shí)，一個(gè)完全沒(méi)有存在的市場(chǎng)在過(guò)去幾年中成為研究和收入的中心，并且已經(jīng)有一些處理器供應(yīng)商已經(jīng)建立了自己的市場(chǎng)地位。

人工智能的這個(gè)現(xiàn)代時(shí)代仍處于早期階段，市場(chǎng)尚未找到上限;數(shù)據(jù)中心繼續(xù)批量購(gòu)買AI加速器，并且該技術(shù)的部署也越來(lái)越多地在消費(fèi)者處理器中出現(xiàn)。在許多人認(rèn)為仍在爭(zhēng)奪的市場(chǎng)中，全球的處理器標(biāo)記正在試圖弄清楚它們?nèi)绾纬蔀橐淮凶畲蟮男绿幚砥魇袌?chǎng)之一的主導(dǎo)力量。簡(jiǎn)而言之，人工智能“淘金熱”正在全面展開。

人工智能“淘金熱”吸引了科技界各個(gè)角落的關(guān)注。其范圍從GPU和CPU公司到FPGA公司，定制ASIC芯片等等。但在人工智能的所有這些方面，最有利可圖的市場(chǎng)是這個(gè)層次結(jié)構(gòu)的頂端市場(chǎng)：數(shù)據(jù)中心。由于運(yùn)營(yíng)商希望購(gòu)買大量的分立處理器，因此數(shù)據(jù)中心市場(chǎng)是擴(kuò)展性的、昂貴的，并且仍在實(shí)現(xiàn)跨越式發(fā)展。

而現(xiàn)在，最后一位坐在數(shù)據(jù)中心AI市場(chǎng)旁邊的巨頭終于采取行動(dòng)了——高通正以激進(jìn)的方式進(jìn)入人工智能加速器市場(chǎng)。高通公布了他們的第一款分立式專用AI處理器，即Qualcomm Cloud AI 100系列。該公司專為人工智能市場(chǎng)而設(shè)計(jì)，并以高通公司承諾成為一個(gè)廣泛的軟件堆棧為后盾，希望到2020年將自己打造成為人工智能加速器的主要供應(yīng)商之一。

Cloud AI 100系列加速器基于7納米芯片工藝，將于2020年推出產(chǎn)品，樣片預(yù)計(jì)將在今年晚些時(shí)候向客戶公布。這款芯片的目標(biāo)是根據(jù)數(shù)字化的語(yǔ)音或圖片數(shù)據(jù)流分析來(lái)制定決策。

高通高管基斯·克里辛(Keith Kressin)表示，這不是手機(jī)處理器的簡(jiǎn)單改版。據(jù)外媒報(bào)道，高通聲稱Cloud AI 100的峰值性能是Snapdragon 855和Snapdragon 820的3-50倍，與傳統(tǒng)的FPGA相比，它的推理速度提高了約10倍。此外，Cloud AI 100的運(yùn)算性能可以遠(yuǎn)超100 TOPs，不過(guò)高通并未透露不同精度下的峰值。

Qualcomm Cloud AI 100架構(gòu)：專用推理ASIC

高通正在為數(shù)據(jù)中心市場(chǎng)開發(fā)一系列AI推理加速器。雖然不是一個(gè)從上到下的計(jì)劃，但這些加速器將采用各種外形和TDP，以滿足數(shù)據(jù)中心運(yùn)營(yíng)商的需求。在這個(gè)市場(chǎng)中，高通公司希望憑借在市場(chǎng)上提供最高效的推理加速器而獲勝，其性能遠(yuǎn)高于目前的GPU和FPGA領(lǐng)跑者。

首先，這些新部件將采用7納米工藝制造——可能是臺(tái)積電以性能為導(dǎo)向的7納米HPC工藝。該公司將提供多款芯片，但目前尚不清楚它們是否實(shí)際設(shè)計(jì)了多個(gè)處理器。而且，這是一個(gè)全新的設(shè)計(jì)，從頭開始;所以它并沒(méi)有說(shuō)Snapdragon 855的所有AI體位都被放大了。

事實(shí)上，最后一點(diǎn)可能是最重要的。雖然高通公司今天沒(méi)有為加速器提供架構(gòu)細(xì)節(jié)，但該公司已經(jīng)明確表示這是一款A(yù)I推理加速器，僅此而已。它沒(méi)有被稱為AI訓(xùn)練加速器，也沒(méi)有被稱為GPU。它只是被用于AI推理——有效地執(zhí)行預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

高通公司的聲明非常強(qiáng)烈地指出基礎(chǔ)架構(gòu)是人工智能推理ASIC——類似谷歌的TPU系列——而不是更靈活的處理器。當(dāng)然遠(yuǎn)非第一家專門為AI處理而構(gòu)建ASIC的廠商，但其他AI ASIC要么專注于低端市場(chǎng)，要么留作內(nèi)部使用(谷歌的TPU再次成為主要的例子)，高通公司正在談?wù)搶I加速器出售給客戶以供數(shù)據(jù)中心使用。而且，相對(duì)于競(jìng)爭(zhēng)對(duì)手而言，他們所談?wù)摰膬?nèi)容更像ASIC，而不是類似GPU的設(shè)計(jì)，每個(gè)人都期望在2020年從領(lǐng)先的英偉達(dá)(NVIDIA)和積極的新人英特爾中脫穎而出。

Qualcomm的Cloud AI 100處理器設(shè)計(jì)如此專注于AI推理，這對(duì)其性能潛力至關(guān)重要。在處理器設(shè)計(jì)范圍內(nèi)，架構(gòu)師可以靈活平衡效率;芯片越接近固定功能ASIC，它就越有效。正如GPU如何在CPU上實(shí)現(xiàn)AI性能的巨大飛躍一樣，高通希望在GPU上做同樣的事情。

當(dāng)然，問(wèn)題在于更具固定功能的AI ASIC正在放棄靈活性。無(wú)論是處理新框架，新處理流程還是全新神經(jīng)網(wǎng)絡(luò)模型的能力還有待觀察。但高通公司將在這里進(jìn)行一些重要的權(quán)衡，最重要的問(wèn)題是這些是否是正確的權(quán)衡，以及整個(gè)市場(chǎng)是否已為數(shù)據(jù)中心規(guī)模的AI ASIC做好準(zhǔn)備。

同時(shí)，高通公司必須解決的另一個(gè)技術(shù)問(wèn)題是Cloud AI 100系列，這是他們第一個(gè)專用的AI處理器。不可否認(rèn)，每個(gè)人都必須從某個(gè)地方開始，而在高通的情況下，他們希望將他們?cè)谌斯ぶ悄芊矫娴膶I(yè)知識(shí)轉(zhuǎn)化為數(shù)據(jù)中心的人工智能。該公司的旗艦Snapdragon SoC已經(jīng)成為一股不可忽視的力量，高通公司認(rèn)為他們?cè)诟咝гO(shè)計(jì)和信號(hào)處理方面的經(jīng)驗(yàn)將使公司在這方面占據(jù)重要地位。

無(wú)論是公司的龐大規(guī)模，他們都能夠迅速提高產(chǎn)量。雖然這并沒(méi)有幫助他們對(duì)抗NVIDIA和英特爾這兩大競(jìng)爭(zhēng)對(duì)手——這兩者都可以分別在臺(tái)積電及其內(nèi)部晶圓廠擴(kuò)大規(guī)模——但它使得高通公司在無(wú)數(shù)小型硅谷初創(chuàng)公司中也有明顯的優(yōu)勢(shì)，這些初創(chuàng)公司也在追求AI ASIC方面的突破。

為什么要競(jìng)逐數(shù)據(jù)中心推理市場(chǎng)？

除了技術(shù)方面的考慮之外，今天宣布的另一個(gè)重要因素是高通公司追求AI推理加速器市場(chǎng)的原因。簡(jiǎn)而言之，答案就是利潤(rùn)和金錢。

對(duì)人工智能推理市場(chǎng)最終規(guī)模的預(yù)測(cè)差別很大，但高通公司認(rèn)為到2025年數(shù)據(jù)中心推理加速器市場(chǎng)可能會(huì)達(dá)到170億美元。如果事實(shí)證明這是真的，那么它將代表一個(gè)相當(dāng)大的市場(chǎng)。否則高通會(huì)錯(cuò)過(guò)。一個(gè)可以完全與當(dāng)前芯片制造業(yè)務(wù)相媲美的產(chǎn)品。

此處值得注意的是，這顯然是推理市場(chǎng)，而不是整個(gè)數(shù)據(jù)中心推理+訓(xùn)練市場(chǎng)。這是一個(gè)重要的區(qū)別，因?yàn)殡m然培訓(xùn)也很重要，但培訓(xùn)的計(jì)算要求與推理有很大不同。雖然可以使用相對(duì)低精度的數(shù)據(jù)類型——如INT8(有時(shí)更低)——執(zhí)行準(zhǔn)確的推理，但目前大多數(shù)培訓(xùn)需要FP16或更多。這需要一種非常不同類型的芯片，特別是當(dāng)我們談?wù)揂SIC時(shí)，而不是像GPU那樣更通用的東西。

這也可以擴(kuò)展到規(guī)模：雖然訓(xùn)練神經(jīng)網(wǎng)絡(luò)可能需要大量資源，但只需要完成一次。然后它可以多次復(fù)制到推理加速器的農(nóng)場(chǎng)。因此，與培訓(xùn)一樣重要的是，潛在客戶只需要比具有培訓(xùn)功能的處理器更多的推理加速器。

與此同時(shí)，盡管該公司沒(méi)有明確表示，但很明顯高通公司正打算取消市場(chǎng)領(lǐng)導(dǎo)者NVIDIA，即使在這些早期，他們已經(jīng)用AI處理器建立了一個(gè)小型帝國(guó)。目前，NVIDIA的Tesla T4、P4和P40加速器構(gòu)成了數(shù)據(jù)中心AI推理處理器的支柱，數(shù)據(jù)中心收入整體上證明對(duì)NVIDIA來(lái)說(shuō)非常有利可圖。因此，即使整個(gè)數(shù)據(jù)中心市場(chǎng)沒(méi)有像預(yù)期的那樣增長(zhǎng)，它仍然會(huì)非常有利可圖。

高通還不得不提防來(lái)自英特爾的威脅，英特爾公開表達(dá)了他們自己的人工智能市場(chǎng)計(jì)劃。該公司有幾個(gè)不同的AI計(jì)劃，從低功耗Movidius加速器到最新的Cascade Lake Xeon可擴(kuò)展CPU。然而，對(duì)于高通公司闖入的特定市場(chǎng)賽道而言，最大的威脅可能是英特爾即將推出的Xe GPU，這些GPU將來(lái)自該公司最近重建的GPU部門。與高通一樣，英特爾也在力爭(zhēng)趕超NVIDIA，因此人工智能推理市場(chǎng)正面臨著激烈的競(jìng)爭(zhēng)與演化，沒(méi)有一個(gè)巨頭希望自己在這場(chǎng)角逐中落敗而歸。

沖刺終點(diǎn)線？

除了高通公司的雄心外，在接下來(lái)的12個(gè)月左右，公司的重點(diǎn)將是收獲和組建第一批客戶。要做到這一點(diǎn)，該公司必須表明它對(duì)Cloud AI 100系列所做的事情是認(rèn)真的，它可以在硬件上提供，并且它可以與競(jìng)爭(zhēng)對(duì)手的軟件生態(tài)系統(tǒng)的易用性相匹配。這一切都不容易，這就是為什么高通公司現(xiàn)在需要開始，遠(yuǎn)遠(yuǎn)超過(guò)商業(yè)貨運(yùn)開始的時(shí)間。

雖然高通公司多年來(lái)一直對(duì)服務(wù)器和數(shù)據(jù)中心市場(chǎng)抱有各種各樣的夢(mèng)想，但描述這些努力的最禮貌的方式可能是“過(guò)于雄心勃勃”。例如，高通公司的Centriq系列基于ARM的服務(wù)器CPU，該公司推出在2017年大張旗鼓地宣布，只有整個(gè)項(xiàng)目在一年內(nèi)崩潰。除了Centriq的優(yōu)點(diǎn)外，高通公司仍然是一家主要針對(duì)芯片制造方面的移動(dòng)處理器和調(diào)制解調(diào)器的公司。因此，為了讓數(shù)據(jù)中心運(yùn)營(yíng)商投資Cloud AI系列，高通公司不僅需要為第一代提供一個(gè)偉大的計(jì)劃，而且還要為未來(lái)幾代人制定計(jì)劃。

這里的結(jié)果是，在年輕的、不斷增長(zhǎng)的推理加速器市場(chǎng)中，數(shù)據(jù)中心運(yùn)營(yíng)商更愿意嘗試新的處理器而不是CPU。因此，我們沒(méi)有理由相信Cloud AI 100系列無(wú)論如何都不能取得適度的成功。但高通公司要說(shuō)服其他仍然謹(jǐn)慎的數(shù)據(jù)中心運(yùn)營(yíng)商，高通公司的產(chǎn)品值得投入如此多的資源。

與此平行的是等式的軟件方面。到目前為止，NVIDIA成功的很大一部分就是他們的人工智能軟件生態(tài)系統(tǒng)。這本身就是他們十年前的CUDA生態(tài)系統(tǒng)的擴(kuò)展，到目前已經(jīng)讓GPU競(jìng)爭(zhēng)對(duì)手AMD陷入困境。高通方面的優(yōu)勢(shì)是，最流行的框架，運(yùn)行周期和工具已經(jīng)建立，TensorFlow、Caffe2和ONNX這些是它布局中的“大目標(biāo)”。這就是為什么高通公司承諾提供廣泛的軟件堆棧，因?yàn)樗梢宰龅竭@一點(diǎn)。但高通公司確實(shí)必須在這一方面加快速度，因?yàn)樗麄兊能浖褩?shí)際運(yùn)行的程度可以決定整個(gè)項(xiàng)目的成敗。高通需要提供良好的硬件和良好的軟件才能在這里取得成功。

但至少目前，高通公司今天發(fā)布的公告仍是一個(gè)“預(yù)告片”，還有很長(zhǎng)的路要走。該公司制定了一項(xiàng)雄心勃勃的計(jì)劃，旨在闖入日益增長(zhǎng)的人工智能推理加速器市場(chǎng)，并提供與開放市場(chǎng)上其他任何產(chǎn)品不同的處理器。雖然這中間的過(guò)渡將會(huì)是一個(gè)挑戰(zhàn)，高通公司對(duì)推理加速器市場(chǎng)的需求卻只增不減。它是能夠?yàn)槠溟_發(fā)處理器的能力。以及它們?nèi)绾文軌虮苊庀萑肫湎惹胺?wù)器處理器計(jì)劃的那種失誤。

最重要的是，高通不會(huì)簡(jiǎn)單地采用推理加速器市場(chǎng)：它們將不得不為它而戰(zhàn)。這是NVIDIA失去的市場(chǎng)，英特爾也在關(guān)注它，更不用說(shuō)來(lái)自GPU廠商，F(xiàn)PGA供應(yīng)商和其他ASIC廠商的所有小型廠商。任何和所有這些都可以在新興技術(shù)的年輕市場(chǎng)中快速上升和下降。因此，雖然它還差不多一年，但2020年正在迅速成為人工智能加速器市場(chǎng)的第一場(chǎng)大戰(zhàn)。

高通高管基斯·克里辛(Keith Kressin)表示，該公司將使用其在移動(dòng)領(lǐng)域的技術(shù)專長(zhǎng)，并借助其利用最新制造技術(shù)設(shè)計(jì)芯片的能力。而這款芯片的關(guān)鍵特征在于能耗效率。這個(gè)市場(chǎng)到2025年的規(guī)模預(yù)計(jì)可達(dá)170億美元。