You are browsing the Hong Kong website, Regulated by Hong Kong SFC (CE number: BJA907). Investment is risky and you must be cautious when entering the market.
​AMD會成為最強攪局者嗎?
格隆匯 11-22 15:08

本文來自格隆匯專欄:半導體行業觀察

最近,AMD正式發佈了其Instinct MI200系列GPGPU加速卡,進一步進軍GPGPU市場。

與傳統的GPU不同,MI200系列主要針對的並不是遊戲和渲染應用,而是高性能計算(如人工智能,科學計算)應用,即GPGPU(general-purpose GPU)。這樣的定位顯然與Nvidia主推的基於CUDA生態的GPGPU(如A100)相同,因此可能在GPGPU市場的競爭格局產生影響。當然,MI200並非AMD的第一款GPGPU。在這之前,AMD也推出過MI50和MI100系列GPGPU,雖然在整個市場上聲勢並不大,但是也積累了不少設計和軟件方面的經驗。這次推出的MI200系列的性能可謂不俗,在科學計算常用的64位浮點數(FP64)性能可達Nvidia最新款GPGPU A100的近5倍,而在人工智能常用的16位浮點數(FP16)方面也可達到A100的1.2倍,搭配的內存方面內存大小可達A100的1.6倍,內存帶寬也是A100的1.6倍。與Nvidia全力投入人工智能常用的低精度FP16不同,MI200仍然兼顧了科學計算常用的FP64,這可能也是想在某種程度上與Nvidia實現差異化競爭。

在架構方面,AMD在MI200中也使用了其引以為豪的chiplet高級封裝技術,而這也使MI200成為首款使用chiplet技術的多晶片(multi-die)GPU。具體來説,MI200的基本chiplet單元稱為CDNA-2晶片,每個CDNA-2晶片擁有290億個晶體管,包含有112個計算單元(CU),並且搭載了4個HBM2E內存接口,以及8個用於封裝內互聯的Infinity Fabric Link。每個MI200 GPU則是把兩個這樣的CDNA-2 chiplet使用2.5D封裝技術封裝在一起。另外,一個容易被忽略的細節是,MI200擁有CPU和GPU之間支持內存一致性(coherency)的互聯,這使得MI200配合AMD的CPU有機會實現CPU和GPU共享內存空間,這樣就能減少CPU到GPU內存複製造成的額外開銷。

總體來説,AMD MI200的硬件性能可以與Nvidia A100相媲美,在一些高性能科學計算領域甚至比起A100更強。考慮到明年Nvidia可能會發布A100的下一代GPU並且預計有大幅性能提升,AMD的MI200暫時還不太可能直接取代Nvidia佔據GPGPU性能最強的寶座,但是這樣的性能已經足以使得AMD的GPGPU成為Nvidia GPU一個有力的替代性方案,尤其全球半導體持續缺貨的形勢也使得許多雲端高性能計算的大客户有考慮Nvidia替代型解決方案的動力。

AMD的GPGPU生態逐漸進入主流

事實上,Nvidia能佔領GPGPU和AI加速芯片領跑地位不僅僅是依靠其強大的芯片性能,圍繞芯片性能的CUDA軟件生態也是Nvidia的一個重要護城河。具體來説,如何能給開發者提供一個易用的軟件接口,能與上游主流生態框架(例如人工智能領域的PyTorch,TensorFlow等)相集成,並且能較為簡單地就能充分利用芯片的性能,是一個需要長期積累的過程,同時一旦成功則會形成一個很高的護城河。

在這方面,AMD的軟件生態相對於Nvidia的CUDA而言,處於後發地位,這也是阻礙AMD真正進入GPGPU主流市場的重要瓶頸。然而,隨着AMD多年來在這方面的投入,AMD的相關生態也在逐漸成為主流可選項之一。

最初,在GPGPU加速人工智能剛剛進入主流視野中時(2012-2015年),就在Nvidia已經大局投入CUDA生態時,AMD卻沒有官方動作,想要在AMD的GPU上做高性能計算還需要藉助第三方OpenCL,開發並不容易。AMD從2015年底開始真正由官方推出一套能支持人工智能等高性能計算的生態環境(ROCm),相比Nvidia的CUDA(2007年推出)落後了整整八年的時間。雖然在ROCm推出之初並沒有得到業界大規模應用,但是好在AMD並沒有放棄這項投資。在經過五年多的努力之後,今天ROCm相對於剛推出時的狀態而言,其成熟程度已經接近了主流選項之一。舉例來説,目前ROCm已經完成了和主流人工智能框架TensorFlow和PyTorch的整合,在PyTorch中甚至絕大多數接口都和CUDA版本完全一致,這就大大降低了開發難度。

公平地説,目前AMD的一套軟件開發生態已經達到了“可用”的狀態,但是相較於CUDA生態還有一些距離。首先,在訓練方面,ROCm做單卡訓練已經不成問題,性能也不錯,但是分佈式訓練仍然需要一些額外的支持。另一方面,在推理方面,AMD仍然缺乏對應Nvidia TensorRT這樣的高性能推理工具鏈,因此如果想要在AMD的GPU上做高性能人工智能推理還需要做大量的工作。這或許也是AMD在這次發佈MI200的時候,仍然把重點放在了環境較為簡單的科學計算,而對人工智能只是兼顧。

由於目前AMD的ROCm已經到達了可用的狀態,我們預計下一步AMD會繼續和對於雲端計算有大量需求的互聯網巨頭合作,一起進一步共同開發ROCm生態環境。對於互聯網巨頭來説,他們有足夠的技術團隊來支持和開發基於AMD平台的人工智能訓練和部署軟件,同時他們也有動力去做這件事情,因為擁有AMD和Nvidia兩個供貨商,比起只有Nvidia一個選項來説,無論是從芯片供應穩定性還是芯片售價來説,都會好很多。而AMD也可以藉助這樣的合作共同開發來進一步打磨軟件生態以及芯片架構,預計會在未來三到五年內會真正成為Nvidia在GPGPU領域真正的競爭對手。

AMD的服務器市場勢頭強勁

這次AMD發佈MI200進一步增強了其在雲端服務器市場的地位。這個月早些時候,AMD剛剛公佈了和Facebook(現名Meta)的合作計劃,其CPU將正式進入Facebook的雲端服務器中心。而在這之前,AMD還公佈了和谷歌的合作計劃,可見目前AMD的CPU在雲端服務器市場正在逐漸蠶食Intel的份額。而在雲端人工智能加速卡領域,MI200的發佈也將成為一個重要的里程碑,雖然它不能直接取代Nvidia的GPU,但是我們認為AMD距離成為主流GPGPU供貨商僅僅一步之遙。更重要的是,雲端的CPU和GPU之間存在很強的協同效應,一旦AMD的CPU和GPGPU同時成為雲端服務器中心的主流選項,那麼兩者之間的協同效應將使得AMD在這個市場擁有更強的話語權(這也是Nvidia一直在尋求收購ARM的主要原因,因為Nvidia也希望能在CPU領域擁有更強的自研能力)。同時,由於AMD同時在CPU和GPU方面有積累,其之前已經投入多年的共享內存空間技術也可望隨着AMD的CPU和GPU成為服務器領域的主流選項而獲得更多應用,從而進一步提升AMD的該市場的技術實力。我們認為,未來AMD在服務器領域的與機會獲得更多的市場份額和話語權,同時這個市場的競爭格局也將隨之發生改變。

Follow us
Find us on Facebook, Twitter , Instagram, and YouTube or frequent updates on all things investing.Have a financial topic you would like to discuss? Head over to the uSMART Community to share your thoughts and insights about the market! Click the picture below to download and explore uSMART app!
Disclaimers
uSmart Securities Limited (“uSmart”) is based on its internal research and public third party information in preparation of this article. Although uSmart uses its best endeavours to ensure the content of this article is accurate, uSmart does not guarantee the accuracy, timeliness or completeness of the information of this article and is not responsible for any views/opinions/comments in this article. Opinions, forecasts and estimations reflect uSmart’s assessment as of the date of this article and are subject to change. uSmart has no obligation to notify you or anyone of any such changes. You must make independent analysis and judgment on any matters involved in this article. uSmart and any directors, officers, employees or agents of uSmart will not be liable for any loss or damage suffered by any person in reliance on any representation or omission in the content of this article. The content of the article is for reference only and does not constitute any offer, solicitation, recommendation, opinion or guarantee of any securities, virtual assets, financial products or instruments. Regulatory authorities may restrict the trading of virtual asset-related ETFs to only investors who meet specified requirements. Any calculations or images in the article are for illustrative purposes only.
Investment involves risks and the value and income from securities may rise or fall. Past performance is not indicative of future performance. Please carefully consider your personal risk tolerance, and consult independent professional advice if necessary.
uSMART
Wealth Growth Made Easy
Open Account