亞馬遜雲科技大中華區產品部總經理 陳曉建先生
在「百模大戰」的當下,以大模型為代表的生成式AI正在以前所未有的速度快速成為人工智慧發展方向的排頭兵。然而,生成式AI並不僅僅只有大模型,在10月下旬,亞馬遜雲科技舉辦的生成式AI構建者大會上,亞馬遜雲科技大中華區產品部總經理陳曉建在做主題為「賦能生成式AI新時代,助力數據和AI普惠」的演講時提到,整個生成式AI應用就像是浮在海面的冰山,露在海面上方能被大多數人看到的冰山一角就像是基礎模型,而在冰川的底部同樣需要諸如如加速晶片,資料庫,數據分析,數據安全服務等基礎模型以外的服務來支撐。那麼,生成式AI到底能夠為創新性企業帶來怎樣的運營和服務改善?亞馬遜雲科技又能在生成式AI領域貢獻什麼?在這場匯集產業上下游的生成式AI構建者大會上已經有了答案。
此次大會設立了三大分會場,分別探討應用基座、數據戰略和AI原生等生成式AI領域的熱門話題。同時,為了幫助更多的開發者體驗到生成式AI時代開發的魅力,大會還設立了開發者論壇和動力訓練營。這些活動旨在為開發者提供實用的指導和支持,能夠幫助開發者更好地理解和應用生成式AI技術。另外,西門子集團、金山辦公軟體以及科思創中國等亞馬遜雲科技生成式AI創新的代表客戶也在此次大會上分享了各自的創新案例,為參會者提供了寶貴的經驗和啟示。
而作為大會的舉辦方,亞馬遜雲科技目前正在致力於應用場景、工具和基礎設施、數據基座、AI原生應用構建和生成式AI服務五個關鍵層面,以幫助企業和開發者充分挖掘生成式AI的潛力。亞馬遜CEO Andy Jassy曾經說過,「我們的目標是讓任何人都能夠獲得和大型企業一樣先進的基礎設施和成本來實現自己的創新」。目前,亞馬遜雲科技提供了完整的端到端的生成式AI技術堆棧,從底層的加速層如加速晶片,存儲優化,到中間層模型構建工具和服務,再到最上層的生成式AI相關應用,每一層都在針對客戶的不同需求持續創新。亞馬遜雲科技希望藉助相關產品和服務,實現生成式AI技術的普惠化,賦能更多的企業和個人開發者加速創新。
在如何實現生成式AI的普惠化的問題上,陳曉建特別詳細的闡述了亞馬遜雲科技所關注的五個關鍵因素。
首先,選擇合適的應用場景,從典型場景入手創新業務模式。陳曉建認為,增強客戶體驗,提升員工生產力與創造力,優化業務流程是應用場景帶給企業的業務價值的主要三個方面。在演講時,他援引麥肯錫諮詢2023年6月發布的生成式AI生產力前沿技術報告,報告中指出,在生成式AI技術帶來的經濟效益中,大約3/4來自營銷與銷售、產品與研發、軟體工程和客戶運營四大類主要的職能,這也恰恰是生成式AI應用方向的主力。為此,Salesforce將Amazon Bedrock和Amazon Titan集成到其生成式AI產品中,使客戶能夠在Salesforce Data Cloud上輕鬆安全地使用其數據,以構建生成式AI應用。
作為案例,海爾創新設計中心利用生成式AI能夠實現文生圖、圖生圖、定量圖和全場景圖四個方面的提效,上線後,自動化設計系統應用讓相關業務的操作周期縮短了20%。與此同時,國內遊戲領域頭部企業沐瞳科技也正藉助Amazon Bedrock優化遊戲開發相關業務流程。
第二,藉助專門構建的生成式AI工具和基礎設施,快速構建高性價比的生成式AI應用。在這個方向上,亞馬遜雲科技推出的Amazon Bedrock服務與Amazon SageMaker Jumpstart結合,助力對基礎模型有著不同需求的客戶輕鬆、安全地選擇基礎模型。目前,Amazon Bedrock提供了廣泛的基礎模型以供選擇,包括Meta、Anthropic、Cohere、AI21 Labs、Stability AI等第三方領先供應商,以及亞馬遜雲科技自研的Amazon Titan模型家族。其無需編寫代碼就可以實現的託管代理Amazon Bedrock Agent,可以自動分解和編排任務,通過API連接到相關的數據源,並且可以連接到後端的Amazon Lambda來執行任務。另外,Amazon SageMaker JumpStart可以獲得更多的來自工業界和學術界的開源模型,同時其還提供了一個深度的定製環境和評估功能。
在更為關注的性價比方向上,亞馬遜雲科技提供了廣泛、高靈活的高性能、低成本訓練方案。比如英傳達最新GPU晶片H100 Tensor Core的Amazon EC2 P5實例,與上一代相比速度快6倍,訓練成本節省40%;採用亞馬遜雲科技自研的機器學習推理晶片Amazon Inferentia2的Amazon EC2 Inf2實例相比其他類似EC2實例性價比高40%;同樣採用亞馬遜雲科技自研機器學習訓練晶片Amazon Trainium的Amazon EC2 Trn1實例,與同類實例相比訓練成本節省高達50%。
第三,夯實數據基座,使用私有化數據,打造差異化競爭優勢。亞馬遜雲科技提供了端到端的數據服務,從存儲到查詢、分析數據到通過商業智能,機器學習和生成式AI來使數據發揮作用,以及能夠輕鬆集成和治理數據,通過有效的安全策略管理數據的應用和開放的服務。例如,針對生成式AI領域的用戶個人資訊、會話資訊管理、私域知識庫等應用場景,亞馬遜雲科技為Amazon OpenSearch Service、Amazon Aurora PostgreSQL和 Amazon RDS for PostgreSQL加入了向量資料庫功能。而數據集成方面,亞馬遜雲科技提出「Zero-ETL」的願景,推出的Aurora Zero ETL for Redshift Integration,允許存儲在Amazon Aurora中實時產生的業務數據,無需ETL工具,以自動的方式同步到數據倉庫Amazon Redshift中,以供近實時的進行海量數據的聚合分析。數據治理方面,亞馬遜雲科技提供Amazon DataZone這一全新的數據治理服務,以減少企業內部成員訪問數據和使用分析工具時繁重的工作量。
會上,西門子大禹團隊特別分享了在亞馬遜雲的技術支持下所量身打造了以人工智慧生成的方式進行交互的智能聊天機器人「小禹」。其中最大的亮點在於「RAG 架構 向量資料庫」設計:核心主體知識庫以向量方式構建,能夠存儲超大規模的向量數據。另外RAG架構極大地拓展了大模型的可用性,允許對新增部分使用相同的模型處理,無需調整模型。並且,由於亞馬遜雲科技提供了包括向量資料庫、生成式AI在內的一系列核心技術,整個解決方案指南完成度高達80%
第四,藉助雲原生服務,加速AI應用構建,助力業務敏捷創新。陳曉建認為,通過亞馬遜雲科技面向百萬客戶所鑄就的經驗,在生成式AI的今天,更多的客戶更需要的是一個生成式AI的原生架構,並為此拆分成五個細則。首先以微服務化和事件驅動架構為核心的設計框架,鬆耦合的去處理每個功能模塊之間的互相依賴;優先Serverless可以幫助我們從繁重的基礎架構的運維、部署中解脫出來,從而有更多的精力關注到更該關注的業務邏輯和創新之中;數據決策優先,像資產一樣重視數據,數據能力作為應用的核心競爭壁壘加入到生成式AI應用的設計理念中來;安全圍欄,影響面控制,減小爆炸半徑,將安全與數據的合規與保護放在前所未有的重要地位;避免重複造輪子,除了技術本身,在DevOps,基礎設施即服務,自動化等現代應用治理理念持續投入,促進企業內部的應用資產與實踐的分享,構建高效敏捷的構建者文化。
最後,藉助開箱即用的生成式AI服務,消除重複性工作並專注創新。對此,亞馬遜雲科技提供了Amazon CodeWhisperer人工智慧的編程夥伴,其可以實時提供編程的代碼建議,然後從根本上提升開發人員的生產力。其相比沒有使用該工具的開發者,在整個完成任務的速度上快了57%,成功率高了27%。另外,Amazon Whisperer推出了自定義功能,能夠生成優於之前的代碼建議,它允許客戶使用私有代碼庫安全地定製 CodeWhisperer代碼建議,這些私有代碼庫可涵蓋內部API、資料庫、最佳實踐和架構模式等。同時,亞馬遜雲科技還將Amazon Quicksight Q功能與Amazon Bedrock提供的大語言模型功能相結合,為Amazon QuickSight提供生成式BI功能。
目前,亞馬遜雲科技通過開箱即用的生成式AI服務及工具,已幫助超過一千家中小企業和初創公司快速實現生成式AI創新,已賦能超過十萬計的中國開發者。
「開發生成式AI應用是一個充滿挑戰的系統工程,並不是單純的產品和服務拼接」陳曉建最後特別補充道,「如何加速客戶最終應用的商業化落地,除了亞馬遜本身的資源以外,我們同樣需要構建強大的合作夥伴生態,與它們一起助力解決生成式AI應用構建中的各種技術問題,加速應用落地。除了雲服務之外,我們還提供解決方案架構師、產品技術專家、人工智慧實驗、數據實驗室、快速原型團隊、專業服務團隊、培訓與認證部門等多個資源共同助力客戶成功,同時我們還攜手生態合作夥伴與初創圈構建生成式AI的完整體系,進一步助力生成式AI技術的落地。」