微軟發(fā)布的超級(jí)計(jì)算機(jī)無(wú)疑成為一把利器居于世界超算 Top5 之列

2020-05-22 10:03:59 來(lái)源：機(jī)器之心

昨晚，微軟 Build 2020 大會(huì)發(fā)布的超級(jí)計(jì)算機(jī)則無(wú)疑成為了 Azure 在 AI 方面的一把利器，擁有超過(guò) 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps

昨晚，微軟 Build 2020 大會(huì)發(fā)布的超級(jí)計(jì)算機(jī)則無(wú)疑成為了 Azure 在 AI 方面的一把利器，擁有超過(guò) 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps 的網(wǎng)絡(luò)連接，居于世界超算 Top5 之列。

云計(jì)算廠商之所以需要大刀闊斧地建立超算中心，其原因在于通過(guò)云化的形式和高效的軟件服務(wù)，云計(jì)算廠商可以將超大規(guī)模的計(jì)算力共享給客戶，重復(fù)利用，靈活調(diào)度，以獲得最大的經(jīng)濟(jì)效益。

目前，微軟的超級(jí)計(jì)算機(jī)主要用于訓(xùn)練超大規(guī)模 AI 模型(這同時(shí)也是 OpenAI 的強(qiáng)項(xiàng))，與上一代 AI 模型相比，超大型 AI 模型是對(duì)現(xiàn)有 AI 模型的升級(jí)，它具有自我監(jiān)督的優(yōu)勢(shì)，這意味著它們可以通過(guò)暴露數(shù)據(jù)各部分之間的關(guān)系來(lái)從數(shù)據(jù)生成標(biāo)簽，這被認(rèn)為對(duì)實(shí)現(xiàn)人類智能至關(guān)重要。

受新冠疫情的影響，門票原本為 2395 美元的微軟 Build 2020 完全在線上舉行。

雖然變?yōu)榫€上舉行，但微軟對(duì)于 Build 2020 依舊充滿了誠(chéng)意，納德拉這樣說(shuō)道：這是另一種以新方式交付的 Microsoft Build。舉辦數(shù)字活動(dòng)為開(kāi)發(fā)人員社區(qū)提供了難得的機(jī)會(huì)，他們可以聚在一起以獲得真正的全球體驗(yàn)。而由此 Build 2020 也比以往更加注重開(kāi)發(fā)人員。

比肩全球 Top 5 的 AI 超級(jí)計(jì)算機(jī)、Windows 應(yīng)用生態(tài) UI 和 API 大統(tǒng)一、Edge 瀏覽器多項(xiàng)功能更新、Microsoft Teams 大升級(jí)、諸多基于 Azure 云計(jì)算的功能更新……一連串的產(chǎn)品發(fā)布、升級(jí)，也讓 Build 2020 有了頗多看點(diǎn)。

一聯(lián)手 OpenAI，自研超算中心

毫無(wú)疑問(wèn)的是，在這場(chǎng)硬核的開(kāi)發(fā)者大會(huì)上，微軟與 OpenAI 共同構(gòu)建的 AI 超級(jí)計(jì)算機(jī)吸引了最多的眼球，被微軟稱之為可躋身全球前五。

2019 年 7 月 22 日，微軟宣布將向 OpenAI 投資 10 億美元，以共同開(kāi)發(fā)用于 Microsoft Azure 云平臺(tái)的新技術(shù)，作為交換，OpenAI 同意將其部分知識(shí)產(chǎn)權(quán)許可給 Microsoft，然后該公司將其商業(yè)化并出售給合作伙伴，并在 OpenAI 致力于開(kāi)發(fā)下一代計(jì)算硬件時(shí)在 Azure 上訓(xùn)練和運(yùn)行 AI 模型。

OpenAI LP CEO、原 YC 總裁 Sam Altman 與微軟公司 CEO 薩提亞·納德拉(Satya Nadella)

在微軟的 Build 2020 開(kāi)發(fā)者大會(huì)上，合作伙伴關(guān)系的第一個(gè)成果以一臺(tái)新型超級(jí)計(jì)算機(jī)的形式得以展示。

該計(jì)算機(jī)專為訓(xùn)練 OpenAI 的 AI 模型而設(shè)計(jì)，是單個(gè)系統(tǒng)，算力十分強(qiáng)大，它擁有超過(guò) 285000 個(gè) CPU 內(nèi)核、10000 個(gè) GPU 和 400Gbps 的網(wǎng)絡(luò)連接。

根據(jù)「TOP 500」組織編制的全球超級(jí)計(jì)算機(jī) 500 強(qiáng)榜單顯示，算力排名前五的計(jì)算怪獸分別包括：

1)美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室的Summit系統(tǒng)(148.6 petaflops);

2)Lawrence Livermore國(guó)家實(shí)驗(yàn)室的Sierra(94.6 petaflops);

3)由中國(guó)國(guó)家并行計(jì)算機(jī)工程與技術(shù)研究中心(NRCPC)開(kāi)發(fā)的“神威-太湖之光”超級(jí)計(jì)算機(jī)(93.0 petaflops)

4)由中國(guó)國(guó)防科技大學(xué)(NUDT)開(kāi)發(fā)的天河2A(61.4 petaflops)

5)戴爾制造的Frontera Dell C6420(23.5 petaflops)。

微軟表示，與世界 TOP500 超級(jí)計(jì)算機(jī)相比可比肩 Top 5，則意味著它在中國(guó)國(guó)家超級(jí)計(jì)算機(jī)中心的天河 2A 后面，在德克薩斯高級(jí)計(jì)算機(jī)中心的 Frontera 之前，其算力峰值每秒可以執(zhí)行 23.5 到 61.4 個(gè)萬(wàn)億浮點(diǎn)運(yùn)算。

從性能上來(lái)說(shuō)，得益于在 Azure 上托管，這臺(tái)超級(jí)計(jì)算機(jī)擁有現(xiàn)代云計(jì)算基礎(chǔ)設(shè)施的各種優(yōu)點(diǎn)，包括快速部署、可持續(xù)發(fā)展的數(shù)據(jù)中心、并可以訪問(wèn)所有 Azure 服務(wù)。

超高性能將用來(lái)訓(xùn)練更高級(jí)別的超大規(guī)模人工智能模型，并為機(jī)構(gòu)和開(kāi)發(fā)人員提供了超大型 AI 模型和訓(xùn)練這一模型所需的架構(gòu)。

通過(guò)培訓(xùn)優(yōu)化工具和超級(jí)計(jì)算資源，數(shù)據(jù)科學(xué)家和商業(yè)客戶便可以輕松利用 Scale AI 功能。深入了解語(yǔ)言語(yǔ)法，識(shí)別概念中的差別，完成復(fù)雜任務(wù)。

所謂超大型人工智能模型是針對(duì)小型模型而言的，小型人工智能模型使用許多帶有標(biāo)簽的示例來(lái)學(xué)習(xí)單個(gè)任務(wù)，例如在語(yǔ)言之間進(jìn)行翻譯，識(shí)別對(duì)象等。

而超大型模型可以通過(guò)檢查數(shù)十億頁(yè)的公開(kāi)文本來(lái)學(xué)習(xí)。這種類型的模型可以如此深入地吸收語(yǔ)言，語(yǔ)法，知識(shí)，概念和上下文的細(xì)微差別，以至于可以勝任多項(xiàng)任務(wù)：總結(jié)冗長(zhǎng)的講話，調(diào)節(jié)實(shí)時(shí)游戲聊天中的內(nèi)容，在成千上萬(wàn)個(gè)法律文件中甚至找到相關(guān)段落從搜尋 GitHub 生成代碼。

超大型 AI 模型以新的方式來(lái)學(xué)習(xí)文本 Craighton Berman 的藝術(shù)

「這些模型令人興奮的是它們將實(shí)現(xiàn)的功能的廣度?！梗瑵撛诘暮锰庍h(yuǎn)遠(yuǎn)超出了一種 AI 模型的微小進(jìn)步。微軟首席技術(shù)官凱文·斯科特(Kevin Scott)說(shuō)?！高@是關(guān)于能夠一次在自然語(yǔ)言處理中完成一百項(xiàng)令人興奮的事情，以及在計(jì)算機(jī)視覺(jué)中完成一百項(xiàng)令人興奮的事情，當(dāng)您開(kāi)始看到這些感知領(lǐng)域的組合時(shí)，您將擁有很難的新應(yīng)用程序甚至現(xiàn)在都無(wú)法想象。」

另外，從技術(shù)角度來(lái)看，超大型模型具有「自我監(jiān)督」的優(yōu)勢(shì)，優(yōu)于大型模型。在所謂的「自我監(jiān)督」學(xué)習(xí)中，這些 AI 模型可以通過(guò)檢查 Internet 上數(shù)十億頁(yè)的公共文檔(維基百科條目，自出版的書籍，說(shuō)明手冊(cè)，歷史課程，人力資源指南)來(lái)學(xué)習(xí)語(yǔ)言。

這些改進(jìn)有點(diǎn)像從基礎(chǔ)閱讀水平跳到對(duì)語(yǔ)言的更復(fù)雜和細(xì)微的理解。

此外，自我監(jiān)督也意味著它們可以通過(guò)暴露數(shù)據(jù)各部分之間的關(guān)系來(lái)從數(shù)據(jù)生成標(biāo)簽，這被認(rèn)為對(duì)實(shí)現(xiàn)人類智能至關(guān)重要。

二開(kāi)源全球最大語(yǔ)言模型

毫無(wú)疑問(wèn)的是，用于設(shè)計(jì)超級(jí)計(jì)算機(jī)的軟件工具都可能為 Microsoft 帶來(lái)新的市場(chǎng)機(jī)會(huì)。通過(guò)規(guī)?；?AI 計(jì)劃，這家科技巨頭正在提供資源，以優(yōu)化的方式在 Azure AI 加速器和網(wǎng)絡(luò)上訓(xùn)練大型模型。

Microsoft 一直有自己的大型 AI 模型家族，今年早些時(shí)候，它還向研究人員開(kāi)源了世界上最大的公開(kāi)可用的 AI 語(yǔ)言模型，即用于自然語(yǔ)言生成的 Microsoft Turing 模型。該模型已用于改善 Bing，Office，Dynamics 和其他生產(chǎn)力產(chǎn)品的許多不同的語(yǔ)言理解任務(wù)。

這些模型家族只需使用大量數(shù)據(jù)和超級(jí)計(jì)算資源對(duì)其進(jìn)行一次培訓(xùn)，公司便可以采用「經(jīng)過(guò)預(yù)訓(xùn)練」的模型，并可以使用更小的數(shù)據(jù)集和資源對(duì)不同的任務(wù)進(jìn)行微調(diào)。

例如，過(guò)去一年中，基于自然語(yǔ)言理解的「微軟圖靈模型(Microsoft Turing)」用于改善各種生產(chǎn)力產(chǎn)品。它在 Bing 中具有顯著先進(jìn)的字幕生成和問(wèn)答功能，在某些市場(chǎng)中將搜索問(wèn)題的答案提高了多達(dá) 125%。

在 Office 中，同一模型推動(dòng)了智能查找功能的發(fā)展，從而使在 Word 中的搜索更加輕松，Key Insights 功能可提取重要的句子以快速定位 Word 中的關(guān)鍵點(diǎn)，而 Outlook 的「建議的答復(fù)」功能會(huì)自動(dòng)生成對(duì)電子郵件的可能答復(fù)。Dynamics 365 Sales Insights 還使用它根據(jù)與客戶的互動(dòng)向賣方建議操作。

對(duì)于希望訓(xùn)練超大型 AI 模型但又不需要專用超級(jí)計(jì)算機(jī)的客戶，微軟還提供了以分布式和優(yōu)化方式在這些集群上訓(xùn)練大型 AI 模型的工具。通過(guò)一組同樣為超級(jí)計(jì)算機(jī)提供動(dòng)力的 AI 加速器和網(wǎng)絡(luò)提供了對(duì)強(qiáng)大計(jì)算的訪問(wèn) 。

在 Build 會(huì)議上，Microsoft 宣布它將很快開(kāi)始開(kāi)放其 Microsoft Turing 模型以及在 Azure 機(jī)器學(xué)習(xí)中對(duì)其進(jìn)行培訓(xùn)的原材料的開(kāi)源。

微軟首席項(xiàng)目經(jīng)理 Phil Waymouth 說(shuō)：「我們希望能夠構(gòu)建這些非常先進(jìn)的 AI 技術(shù)，使人們最終可以輕松地使用它們來(lái)幫助他們完成工作并更快地實(shí)現(xiàn)目標(biāo)?！?/p>

比如部署在國(guó)家超算廣州中心的天河二號(hào)，研究人員根據(jù)應(yīng)用的需求以及實(shí)際的硬件環(huán)境，對(duì)開(kāi)源的 OpenStack 進(jìn)行大量的定制和優(yōu)化，并結(jié)合容器技術(shù)，打造企業(yè)級(jí)解決方案 KylinCloud 云平臺(tái)，為政府部門和企事業(yè)單位的信息化建設(shè)和大數(shù)據(jù)處理提供資源支撐。

事實(shí)上，從部署規(guī)模的維度來(lái)看，云計(jì)算的底層也是一種超級(jí)計(jì)算機(jī)——通過(guò)數(shù)據(jù)中心級(jí)操作系統(tǒng)，把不同地域的超大規(guī)模的物理服務(wù)器，聚合成一臺(tái)超級(jí)計(jì)算機(jī)，統(tǒng)一調(diào)度和使用。所以，現(xiàn)在云計(jì)算和超算更像是不同維度的概念，前者側(cè)重信息技術(shù)的交付模式，后者側(cè)重體現(xiàn)系統(tǒng)的構(gòu)建。

三搶下云計(jì)算 AI 第一把交椅?

全世界的科技巨頭在云端的戰(zhàn)火不斷升級(jí)，而云計(jì)算對(duì)于微軟和納德拉來(lái)說(shuō)，其意義更為重要。

在鮑爾默宣布要退休的時(shí)候，微軟 CEO 這個(gè)職位沒(méi)被當(dāng)作一個(gè)美差。彭博社甚至還發(fā)表了一篇標(biāo)題為「為什么你不想成為微軟的首席執(zhí)行官」的文章。而納德拉就在這樣的危機(jī)存亡時(shí)刻，接手微軟，此時(shí)的微軟市值縮減到 3000 多億美元，不及 1999 年微軟輝煌時(shí)刻的一半。

在納德拉接手微軟之后，云計(jì)算成為微軟的「重頭戲」，微軟的股價(jià)也在納德拉的努力之下，不僅達(dá)到了 1999 年巔峰的 6000 億美元市值，更是不斷上漲直到現(xiàn)在的 1.39 萬(wàn)億美元。

在全球云市場(chǎng)，微軟目前市場(chǎng)占有率第二，占有 17.9% 的市場(chǎng)份額，僅次于巨頭亞馬遜。在競(jìng)爭(zhēng)激烈的云市場(chǎng)中，AI 算力或許會(huì)成為巨頭們的下一法寶。

眾所周知，在當(dāng)今 AI 技術(shù)研發(fā)和產(chǎn)業(yè)落地過(guò)程中，所需「算力」逐年遞增。根據(jù) OpenAI 發(fā)布的 AI 計(jì)算量報(bào)告，自 2012 年以來(lái)，AI 計(jì)算量每年增長(zhǎng) 10 倍，而從 AlexNet 到 AlphaGo Zero，最先進(jìn) AI 模型對(duì)計(jì)算量的需求已經(jīng)增長(zhǎng)了 30 萬(wàn)倍。

在云計(jì)算 Top5 公司中，據(jù) CCS Insight 調(diào)查報(bào)告顯示，擁有 AlphaGo 的谷歌在 AI 領(lǐng)域一直處于領(lǐng)先的地位，領(lǐng)先于微軟等其他科技巨頭。

對(duì)于微軟來(lái)說(shuō)，在 Azure 推出 AI 超算平臺(tái)，提升了 Azure AI 服務(wù)，并通過(guò) GitHub 提供其大型 AI 模型，通過(guò)可以為客戶提供差異化的服務(wù)，提升了微軟在 AI 領(lǐng)域的服務(wù)能力，吸引更多開(kāi)發(fā)者使用 Azure。而谷歌在 AI 領(lǐng)域的優(yōu)勢(shì)或?qū)⒉粡?fù)存在。

微軟首席技術(shù)官凱文·斯科特(Kevin Scott)表示：「通過(guò)開(kāi)發(fā)用于訓(xùn)練大型 AI 模型的領(lǐng)先基礎(chǔ)架構(gòu)，我們使所有 Azure 變得更好?！埂肝覀冋诮ㄔ旄玫挠?jì)算機(jī)，更好的分布式系統(tǒng)，更好的網(wǎng)絡(luò)，更好的數(shù)據(jù)中心。所有這些使整個(gè) Azure 云的性能，成本和靈活性更好。」