宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

2023年07月27日 首頁 » 熱門科技

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

世界的十字路口在紐約,生成式AI的十字路口今天也在紐約。

亞馬遜雲科技紐約峰會素有小re:Invent之稱,今年的發布主要圍繞生成式AI展開。其實從去年10月到今年4月,我們已經看到亞馬遜雲科技在生成式AI上的不斷投入。

目前已經形成了三層架構形態,底層的Amazon EC2 Trn1n和Amazon EC2 Inf2實例正式可用,中間層的生成式人工智慧服務Amazon Bedrock預覽版,頂層的自動代碼生成工具Amazon CodeWhisperer正式可用。

今天亞馬遜雲科技把生成式AI的三層架構規劃為加速、構建、應用,並再度擴展其邊界。亞馬遜雲科技資料庫、數據分析和機器學習全球副總裁Swami Sivasubramanian也希望可以真正幫助各行各業能把生成式AI用起來。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

亞馬遜雲科技資料庫、數據分析和機器學習全球副總裁Swami Sivasubramanian

GPU生成式AI的加速器

俗話說底層基礎決定上層建築,我們先從底層講起。說到人工智慧的底層,大家都會想到GPU,其高度的並行計算能力,對加速人工智慧模型的訓練和推理已經是必備條件。

可以提供多種算力能力的亞馬遜雲科技肯定也少不了GPU實例的更新,亞馬遜雲科技和英偉達有著12年的合作歷史,所以合作GPU實例也是順理成章,宣布了Amazon EC2 P5實例正式可用。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

Amazon EC2 P5實例提供8個英偉達H100 Tensor Core GPU,具有640 GB高帶寬GPU內存,同時提供第三代AMD EPYC處理器、2TB系統內存和30TB本地NVMe存儲。該實例還提供了3200 Gbps的聚合網路帶寬並支持GPUDirect RDMA,從而繞過CPU進行節點間通信,實現更低的延遲和高效的橫向擴展性能。與上一代基於GPU實例相比,訓練時間最多可縮短6倍(從幾天縮短到幾小時),降低高達40%的培訓成本。

其實現階段正是生成式AI的爆發階段,企業對於H100的需求也是爆發性的,使用GPU這件事上不管在全球任何一個區域都是毋庸置疑的。

更多的模型,更快速的構建

現在很多企業都在倡導通用模型的重要性,但是亞馬遜雲科技卻在這一點上選擇,集合更多的模型來服務客戶。

Amazon Bedrock是允許用戶通過API訪問AI21 Labs開發的Jurassic-2多語種大語言模型系列、Anthropic開發的大語言模型Claude、Stability AI開發的文生圖基礎模型Stable Diffusion,以及亞馬遜雲科技自有的Amazon Titan模型。

今天Amazon Bedrock不僅做了模型的擴展,同時進行了原有模型的升級。增加了Cohere的模型,Cohere是一家成立於2019年的初創公司,最近其也完成了2.7億美元的C輪融資。Cohere可以幫助企業快速部署對話式AI聊天機器人、生成式搜尋引擎、文本摘要總結、增強向量搜索等。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

同時Amazon Bedrock針對Anthropic和Stability AI的模型進行更新,包括Anthropic最新的語言模型Claude 2.0和Stability AI將在Amazon Bedrock上發布的最新版文生圖模型套件Stable Diffusion XL 1.0 (SDXL 1.0)。

Claude 2.0在業內有很多種說法,一度有Claude成為ChatGPT最佳代替品的討論,堪稱媲美 GPT-4。而且其可以支持高達100K token的上下文,所以Claude一次讀上百頁的文檔都不在話下,對於有智能文檔處理需求的客戶是一個福音。

Amazon Bedrock想做的是在模型上給到客戶選擇的同時,又不是那麼難選,因為亞馬遜雲科技已經經過了篩選。

現在很多企業在使用模型上,最大的難點可能不在模型本身,而是構建應用的能力。亞馬遜雲科技大中華區技術專家團隊總監王曉野提到,現在企業要面臨的問題是使用模型後獲得了什麼,如果通過模型重塑應用後效果提升,但是成本成倍增加,企業可能從ROI層面考慮。

亞馬遜雲科技做的就是把部署成本降低,應用難度降低,更容易快速讓企業用上生成式AI。當然對於模型訓練,企業也比原來更加注重數據質量,因為訓練不是數據越多越好,更重要的是數據質量,同時你的數據也是你的差異化因素。

Amazon Bedrock另一個更新就是代理功能(Agents),這將進一步加速交付生成式AI應用程序。Amazon Bedrock代理功能可以擴展基礎模型以理解用戶請求,將複雜任務分解為多個步驟,而且這些都是自動和託管的。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

通過Agents結合模型能力企業可以為內部或外部實現自動化的構建。Swami在現場也舉了生成一個退休計劃的例子,在不需要提供更多資訊的情況下,Agents會通過程序訪問到自己的過往的數據,以及一些外部資訊,最終制定好符合的計劃。

Agents是對程序自動化工作需求的一個補足,通過Agents大家可以構建自己的生成式AI應用,大大加強用自己的數據構建。

在構建層,亞馬遜雲科技還推出適用於Amazon OpenSearch Serverless的向量引擎,Amazon OpenSearch Serverless提供了向量資料庫的檢索能力,控制模型的表現需要給予更多的資訊,把這些資訊存在某個資料庫里,然後通過向量資料庫先檢索出來相近的知識,再給到模型就會得到相對較好的回答。未來,所有亞馬遜雲科技的資料庫都將具有向量功能,幫助客戶簡化運營,方便集成數據。

真實需求驅動多元應用場景

亞馬遜雲科技一直也在場景上通過生成式AI進行賦能,編程助手Amazon CodeWhisperer可以使開發者的開發速度平均提升57%,開發效果提升27%。

今天則從三個場景進行了擴展,第一個場景是Amazon CodeWhisperer正式可用,並與Amazon Glue實現集成,數據流開發要把數據從不同數據源轉移到另一個地方,這就需要撰寫大量的代碼。

AWS Glue當時就是2017年在紐約發布的,一個完全託管的,提取、轉換和加載(ETL)服務,客戶能夠輕鬆準備和加載他們的數據到Amazon S3、Amazon Redshift、Amazon RDS中,以及加載數據到運行在 Amazon EC2 上的資料庫,來進行查詢和分析。

現在Amazon CodeWhisperer就可以幫助Amazon Glue用戶優化使用體驗、提高開發效率。開發人員可以用自然語言(英語)編寫特定任務,比如利用json文件中的內容創建一個Spark DataFrame。

第二個場景是Amazon QuickSight新增生成式BI功能,將Amazon Bedrock提供的大語言模型能力與支持自然語言問答的Amazon QuickSight Q相結合。

第三個場景是Amazon HealthScribe構建醫療應用程序,Amazon HealthScribe符合HIPAA(《健康保險責任與保護法》),能夠幫助醫療軟體供應商構建臨床應用程序,Amazon HealthScribe通過Amazon Bedrock的支持,讓醫療軟體供應商能夠更快、更輕鬆地將生成式AI功能集成到其應用程序中。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

而且Amazon Entity Resolution正式可用,讓現在無需移動數據就可以幫助企業輕鬆分析、匹配和關聯相關記錄,這些記錄可能存儲在應用程序、不同的數據獲取渠道和數據存儲中。以前廣告和廣告主需要通過統一的ID來進行特定人群的推送,這就需要先將數據篩選好再給到電商平台,現在則可以在保護隱私的前提下就能做到模式識別,進行精準推薦。

總之,今年的亞馬遜雲科技紐約峰會既有情理之中,也有意料之外,情理之中是三層架構的進一步完善,意料之外是應用場景的多元化,以及GPU實例未來在中國的落地值得期待。

亞馬遜雲科技,加速企業生成式AI旅程所需的一切

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新