為確保AMD能夠為更強大的公有雲提供支持,公司首席資訊官Hasmukh Ranjan積極擁抱兩個世界:雲推動的業務轉型,和大規模工程工作負載。
Hasmukh Ranjan正站在雲的十字路口。作為一家晶片製造商,AMD是公有雲計算引擎的重要提供商,Ranjan的主要職責之一,就是支持為雲提供動力的半導體工程。但作為消費者,Ranjan和所有CIO一樣,必須決定把賭注投放在哪裡最合適。對於AMD最關鍵的工程應用來說,答案仍然是他們自己的數據中心——而不是雲。
這是因為像AMD這樣的晶片製造商需要超大核心的計算能力和內存,以及數PB的存儲空間來運行他們的設計應用。儘管如此,在上任一年之後Ranjan表示,AMD有近95%的業務應用都是運行在公有雲上的。他說,只是AMD為製造處理器而創建的龐大工程應用並沒有運行在雲端。
他說:「在工程方面,雲提供商沒有我們所需的那種高端設備,」他指出,AMD的設計應用需要每個核心鋼彈64GB,「而且我們擴展到了高達2TB~4TB的系統。」
他表示,這些龐大的需求繼續在三個方面增長——「多樣性、速度和數量」,指的是AMD不斷擴大的產品組合、AMD設計工作的高速度、以及晶片設計過程中產生的大量數據。
正是因為如此,Ranjan預計AMD的數字基礎設施將在未來一段時間內還保持混合的狀態,業務流程在雲端,工程在本地環境,直到公有雲廣泛支持大量高性能計算工作負載。然而,Gartner分析師Sid Nag指出,AWS等雲廠商提供的實例最多可達224個核心,而且很多企業已經開始在雲端運行高性能計算工作負載了。
晶片設計的本質性轉變
Ranjan說,AMD並非所有的晶片工程流程都是在本地執行的,他指出,AMD有10%到15%的計算是運行在雲端的,這在行業中是很典型的。
由於工程要求,大多數晶片製造商從頭到尾與Cadence Design Systems、Synopsys和西門子等電子設計自動化(EDA)供應商在本地展開合作,服務於最終設計藍圖,也就是從數據中心一直到製造商合作夥伴和晶圓廠,這種緊密集成的過程保證了數據的完整性和安全性。
但這種情況正在發生變化。Ranjan指出,Marvell Semiconductor與AWS在今年2月宣布建立合作夥伴關係,這表明半導體企業希望在生產中更多地使用雲。根據公告,Marvell選擇AWS作為EDA雲提供商,以採用雲優先的方式設計晶片。
Ranjan說:「但由於技術原因和商業原因,這個行業在採用公有雲方面還是比較慢的,高端系統方面,本地環境和雲之間的價格差異可能是非常非常大的。」
雖然晶片設計和製造沒有太大變化,但有分析師表示,所有半導體企業都與雲提供商建立了緊密的合作夥伴關係。例如,他們一起設計並構建了專門的高性能計算雲服務,以滿足這個非常重要的垂直領域的一些工作負載需求。
麻省理工學院斯隆管理學院高級講師、Global Opportunity Initiative項目創始人George Westerman指出,在本地或者是高性能計算雲上運行工程設計的決策過程,對於任何企業來說都是相同的:訪問成本、數據傳輸的延遲成本、網路安全方面的問題。
Cadence、Synopsis、Marvell等主流供應商和晶片設計服務商的高性能計算雲,本質上是半導體行業的行業雲,唯一的區別就是晶片製造商直接與他們的製造合作夥伴或晶圓廠展開合作,遷移本地工程設計用於生產產品。
位於美國加州聖何塞的技術製造諮詢公司TechInsights產品總監Risto Puhakka說:「半導體方面要比雲端現在可以處理的規模更大。這些數據流非常龐大,創建了專用的管道將這些數據轉移到台積電那裡,為他們的晶圓加工製作掩模。」
IT轉型
隨著Ranjan獲得和培養了更多的工程人才以生產出最好的產品,他也在改造公司的數字基礎設施以實現業務目標——儘可能多地使用雲。例如,Ranjan說,AMD最近把他們的SAP應用轉移到了公有雲中。
此外他還負責確保AMD擁有龐大的數據存儲庫和分析功能,以便為他的工程團隊提供足夠的資源。在這方面,AMD在AWS、微軟Azure、Google Cloud Platform和Oracle Cloud上實施了領先的數據湖庫、自動化應用和AI 算法,所有這一切都符合AMD最高管理層的願望,即通過晶片進步更好地為所有雲客戶提供高性能計算工作負載,Ranjan正在通過為工程師們提供最先進的混合平台用於設計晶片來解決這個問題。
Ranjan說,一切似乎都在朝著積極的方向發展。
「大部分計算都發生在我們位於美國的大型數據中心——一個在亞特蘭大,其餘的分布在世界各地,」他補充說,AMD有54%的伺服器機齡不到兩年。「我們非常前沿。這不僅可以實現非常高效的計算,而且也是可持續發展的最佳選擇。」
AI的價值
在商業方面,半導體行業過去十年中一直處於供求關係的大起大落中。疫情減緩了材料供應,進而拖累了製造過程並導致晶片嚴重短缺。Ranjan 說,由於可能出現的經濟衰退減緩了對消費設備、個人電腦和伺服器的需求,這種短缺最近有所緩解(汽車行業除外)。
但對AMD、英特爾和Nvidia等廠商來說,保持強勁需求的是雲管理程序的持續增長,以及最近對機器學習模型和平台(如ChatGPT)的需求高漲。
Ranjan的設計師們也是AI的一大消費者,這些工具正穩步地融入到AMD的設計流程中。除了來自Cadence、Synopsis和西門子的高度專業化EDA工具之後,他們的半導體工作流程還需要源代碼管理系統,而且越來越多地需要AI。
他說:「我們正試圖用現有的AI新技術和工具來完善這一環境,這些技術正處於不同的部署階段,有些是內部開發的,有些是與不同的AI供應商合作的。」
順勢而為
雖然Ranjan與雲的關係可能不算是很典型,但他的核心工作與所有企業的CIO一樣:讓IT投資與整個組織的業務需求和目標保持一致。
因此Ranjan認為,CIO需要比業務方面領先半步,以擴展和支持公司不斷發展的需求,並提供公司各個支持方所需的基礎設施,包括業務和技術。
這是一種平衡的藝術,但CIO在最高管理層中的角色已經隨著行業的整體數字化轉型而發生演變。IT部門不再只是一個成本中心;恰恰相反,他說。
「我的夢想是為公司創造價值,並與公司的業務保持一致,我首先要確定的是我創建的解決方案是否100%符合公司不斷變化的業務需求。我渴望每天都處於那種模式。」