2024 亞馬遜云科技中國峰會第二天精彩繼續上演!亞馬遜云科技大中華區產品總經理陳曉建分享了構建和應用生成式 AI 的多款重磅創新產品。亞馬遜云科技大中華區解決方案架構總經理代聞以橋梁設計做精巧比喻,從三個方向分享生成式 AI 時代下,架構的演進與迭代。
亞馬遜云科技在創新方面從未止步。當下企業在擁抱生成式 AI 技術,開展應用落地的過程中面臨新的挑戰,主要體現在:底層算力資源短缺;缺乏合適的工具,用于訪問和部署世界一流模型,從而進行端到端的生成式 AI 應用構建;缺少匹配自身需求的,可開箱即用快速上手的應用。為了幫助企業克服上述挑戰,亞馬遜云科技打造三層生成式 AI 技術棧,從而讓生成式 AI 普惠化。
生成式 AI 技術棧底層
可靠基礎設施,支撐基礎模型訓練和推理陳曉建在此次峰會中表示,生成式 AI 應用開始于基礎模型的訓練和推理,這是兩種對算力有大量需求的工作負載,也是限制企業模型開發邁出步伐的關鍵制約因素。為了幫助企業降低經濟壓力,亞馬遜云科技推出了一系列專門構建的、高性價比的芯片和計算實例供企業選擇,用于運行模型的訓練和推理工作負載。
對于使用英偉達 GPU 的客戶
亞馬遜云科技依然是卓越選擇
基于英偉達的全新 GPU 資源的系列實例建立在亞馬遜云科技的高性能存儲和網絡服務基礎之上,支持廣泛的編排選項和開源框架,通過 EFA 網絡,允許企業配置高達2萬個 GPU 的超級集群來支持最大工作負載。而當英偉達想建造世界上最快的 GPU 超級計算機時,他們同樣選擇了亞馬遜云科技。Project Ceiba 這個項目是亞馬遜云科技為英偉達構建的 AI 超級計算機,由英偉達和亞馬遜云科技聯合開發,它搭載超過2萬個英偉達最新的 Grace 架構的 Blackwell 200 超級芯片和亞馬遜云科技第四代 EFA 網絡,每個超級芯片可提供高達 800 Gbps 的網絡帶寬,其算力將能達到驚人的 414 exaflops。
為了給中國區的客戶提供運行生成式 AI 工作負載的更好性價比,亞馬遜云科技正式在中國區域推出基于英偉達 A10G GPU 的 Amazon EC2 G5 實例,幫助企業運行高性價比的生成式 AI 工作負載。
自研芯片,提供生成式 AI 極致性價比
亞馬遜云科技每一代自研芯片都在持續提升性價比和能效,陳曉建表示,亞馬遜云科技在定制芯片領域的投資帶來了機器學習訓練和推理成本的大幅下降,基于 Amazon Trainium 的 Trn1 EC2 實例和基于 Amazon Inferentia 芯片的 Inf2 EC2 實例,與基于英偉達 GPU 的 Amazon EC2 實例相比,可分別將訓練成本降低高達50%,推理成本降低高達40%。
重磅發布:國內領先基礎大模型
上線 Amazon SageMaker JumpStart
除了芯片,訓練和推理也需要合適的軟件工具。因此,亞馬遜云科技推出了 Amazon SageMaker,幫助企業微調和部署模型。而伴隨生成式 AI 時代的來臨,多卡并行訓練已經是業界常態,為此,亞馬遜云科技推出了 Amazon SageMaker HyperPod,專門助力大規模分布式訓練,縮短基礎模型的訓練時間。
此外,Amazon SageMaker 的另一項重要服務就是 Amazon SageMaker JumpStart,它可以幫助客戶獲取、微調和部署來自業界最新公開的可用預訓練基礎模型,包括 Meta Llama 3、Cohere Command 等。此外,Amazon SageMaker JumpStart 還為機器學習從業者提供深度模型定制和評估功能,允許其通過已經使用的環境輕松訪問基礎模型。
由此,亞馬遜云科技在峰會上宣布來自零一萬物的 Yi-1.5 6B/9B/34B 基礎模型和百川智能的 Baichuan-2 7B 基礎模型在中國區正式同步上線 Amazon SageMaker JumpStart,為本地企業和全球所有的開發者提供用于開發生成式 AI 應用的更多基礎模型選擇。
Amazon Bedrock
四大差異化價值讓生成式 AI 觸手可及
技術棧的中間層對于大部分企業來說更加重要,構建生成式 AI 應用通常是從選用既有的基礎模型開始,而不是直接參與構建基礎模型。所以如何選擇更加適合自身業務的模型,便成為了企業首先需要作答的問題。
模型選擇
Amazon Bedrock 是一項全面托管的服務,用戶可以通過單一的 API 訪問來自 Al21 Labs、Anthropic、Cohere、Meta、Mistral Al、Stability AI 和亞馬遜等領先人工智能公司的高性能基礎模型。
值得一提的是最新推出的 Amazon Titan Text Embeddings V2 模型,它是亞馬遜云科技自研的 Embedding 模型,針對 RAG 工作流程進行了優化。另一款最新推出的 Titan Text Premier 基礎模型是 Titan Text 系列中先進的型號,旨在為各種企業應用程序提供卓越的性能。
為了幫助企業在選擇模型時做出快速、合理的判斷,亞馬遜云科技正式推出了 Amazon Bedrock 模型評估功能,可將模型評估時間從數個星期壓縮至幾個小時。
模型定制
除了為企業提供來自世界領先人工智能公司的模型,Amazon Bedrock 還支持企業自定義模型的導入。企業可以將基于 Amazon SageMaker 或其他工具開發的存儲在 Amazon S3 里面的定制模型導入到 Amazon Bedrock 中,以完全托管的 API 形式進行訪問,而無需管理底層基礎設施,收獲前所未有的生成式 AI 應用程序構建體驗。目前,Amazon Bedrock 自定義模型導入已提供預覽版,支持 Llama、Mistral 和 Flan-T5 三種流行的開放模型架構,同時還將在未來進一步擴展支持范圍。
生成式 AI 應用可謂百花齊放,企業該如何脫穎而出?答案,就藏在數據之中。即在生成式 AI 應用的構建過程中,利用企業的自有數據,打造差異化競爭優勢。
從數據準備到數據運用,亞馬遜云科技打造了一套全面的數據服務體系,涵蓋數據庫、數據湖、數據治理、數據分析、機器學習和生成式 AI 五大維度。該體系可以幫助企業連接現有的數據源,定制面向生成式 AI 應用構建的高質量企業數據資源,配合 Amazon Bedrock 提供的微調、持續預訓練、檢索增強生成(RAG)等功能,打造與企業業務相關的生成式 AI 應用。
為了進一步幫助企業使用 RAG 技術優化模型的個性化響應,亞馬遜云科技正式推出了 Amazon Bedrock 的知識庫功能。作為一種完全托管的 RAG 功能,它允許企業使用上下文相關的內部數據自定義基礎模型響應。Amazon Bedrock 上的知識庫會自動執行端到端的 RAG 工作流程,使用者無需編寫自定義代碼來集成數據源和管理查詢。
應用集成
在企業的生成式 AI 應用構建過程中,除了基礎模型提供的通用能力,企業還希望其能夠完成一些特定的任務,如預定旅行、提交保險理賠等。為此,Amazon Bedrock 的 Agent 功能便提供了一種工具,允許開發人員定義特定的任務、工作流程或決策過程,增強控制和自動化,同時確保與預期用例保持一致。
為了便于企業以高效協作的方式構建生成式 AI 應用程序,亞馬遜云科技還提供了一站式生成式 AI 應用開發工作站 Amazon Bedrock Studio。借助 Amazon Bedrock Studio,開發者可以使用簡單易用的交互界面進行模型選擇、模型評估,還可以與團隊成員協作,共同試驗,創建和完善生成式 AI 應用。
負責任的 AI
在企業構建生成式 AI 應用的過程中,確保安全合規仍然是重中之重。以安全、可信和負責任的方式部署生成式 AI,同樣也是亞馬遜云科技的“行動綱領”。
亞馬遜云科技致力于開發公平且準確的人工智能和機器學習服務,并為客戶提供負責任地構建人工智能和機器學習應用程序所需的工具和指導,結合安全第一的理念和最佳實踐,幫助客戶創建以人為本的包容性 AI。亞馬遜云科技承諾以負責任的方式構建服務,同時重點考慮公正性、隱私性和安全性、可解釋性、可治理性、穩健性、透明性6大方面。
企業在構建生成式 AI 應用程序時,通常希望其客戶和應用之間的交互是安全并遵守企業指導方針的。針對這一需求,亞馬遜云科技推出了 Amazon Bedrock 的 Guardrails 功能,它可以幫助企業輕松實施生成式 AI 應用程序的保護措施,并根據自身需求和負責任Al政策進行定制。同 Amazon Bedrock 上基礎模型原生提供的保護能力相比,Amazon Bedrock 的 Guardrails 功能可幫助企業用戶阻止多達85%的有害內容。
生成式 AI 技術棧上層
開箱即用的生成式 AI 應用
對于一部分企業來說,與其從構建生成式 AI 應用入手,不如直接使用生成式 AI 應用,快速、輕松地獲得當前主流基礎模型的優勢,實現業務側的成功。為此,亞馬遜云科技構建了強大的生成式 AI 助手 Amazon Q,幫助企業達成加速軟件開發、發揮業務數據價值等目標。目前,Amazon Q Developer、Amazon Q Business、Amazon Q in Connect、Amazon Q in QuickSight 均已正式可用。
Amazon Q Developer
重塑軟件開發生命周期
Amazon Q Developer 可以協助開發人員完成從編碼、測試、升級應用到故障排查、安全掃描和修復、優化云資源等繁瑣重復的工作,讓開發者把更多時間專注于創新體驗的開發,加快應用部署速度。
在實際應用中,Amazon Q Developer 共包含三大核心應用場景。
大規模消除技術冗余;
提高開發人員生產力;
近乎實時生成代碼建議和推薦幫助開發人員更快、更安全地進行構建。
Amazon Q Business
讓每一個企業都用好生成式 AI
為了幫助企業發揮大量難以訪問和解析的數據的價值,亞馬遜云科技推出了具有從任意數據中獲取洞見能力的 Amazon Q Business。通過它,企業員工可以通過連接企業數據庫,來提問關于公司政策、產品信息、業務結果、代碼庫、人員等諸多問題,從而總結數據邏輯、分析趨勢并就數據進行對話。
此外,陳曉建還特別提到了 Amazon Q Business 中的 Amazon Q Apps 的功能。在 Amazon Q Apps 的幫助下,員工可以用自然語言描述他們想要的應用程序類型,或者只需告訴 Amazon Q Apps 從 Amazon Q 幫助解決問題的對話中執行即可。
現場,亞馬遜云科技一名營銷人員要求 Amazon Q Apps 創建一個應用程序,使用者只需輸入特定場景、使用的產品、業務挑戰和業務收益,就可以自動生成一篇引人入勝的營銷文章。幾秒鐘后,Amazon Q Apps 就會創建可在整個組織中與其他營銷人員共享的該款應用程序。
為了進一步幫助企業借力生成式 AI,亞馬遜云科技正式宣布:Amazon Q Developer 和 Amazon Q Business 截止到6月30號免費試用,歡迎各位開發者積極嘗試,共同體驗 Amazon Q 的強大能力。
創造更美好的科技未來
亞馬遜云科技全方位助力人才成長
在開發者社區構建方面,為了讓更多的開發者有機會低門檻體驗到前沿的生成式 AI 服務,亞馬遜云科技正式推出了云上探索實驗室 CloudLab 平臺,所有的開發者只需掃碼進入云上探索實驗室,即可在24小時之內盡情構建。同時,還有為中國開發者量身定做的課程“從基礎到應用:LLM 全景培訓”,在中國峰會舉行期間,該課程將免費提供。
生成式 AI 時代,構建應用有什么不一樣的方法?有何種新的架構趨勢?亞馬遜云科技大中華區解決方案架構總經理代聞從橋梁發展歷程入手,提出橋梁的發展和構建,是由基礎材料,建筑架構和多元化需求三者共同作用的結果,而技術的發展往往也是如此。
基礎組件能力決定架構設計
代聞提出,最基礎的組件,例如材料、技術往往決定了我們能采用的架構。對于信息技術來說,最基礎的材料就是算力。
作為云計算行業的引領者,亞馬遜云科技深知技術架構從來都不是一蹴而就的。回顧近20年的發展歷史,亞馬遜云科技一直持續在基礎技術方面不斷創新,來尋求技術上的持續突破。自2006年推出 Amazon EC2 服務以來,Amazon EC2 經歷了令人矚目的創新之路。從最初的70種實例類型增長到超過750種,亞馬遜云科技在虛擬化技術和硬件加速方面正持續進步。
此外,亞馬遜云科技在處理器領域的自研之路同樣引人注目。從2018年的 Amazon Graviton 到2023年的 Amazon Graviton4,亞馬遜云科技充分展示了在 Graviton 的研發中,性能、能效比以及針對特定工作負載優化方面的重大進展。
現如今,亞馬遜云科技的諸多托管服務都全面采用了 Graviton 架構,如 Amazon DocumentDB、Amazon Aurora、Amazon RDS 等,這些服務不僅提高了性能,還降低了成本,為客戶提供了更高的性價比。
架構體系創新拓展核心能力
代聞認為,構建的風險管理意識非常重要,企業在構建時,往往要面臨著大量的不確定性,各種風險因素層出不窮,因此架構韌性成為了重中之重。通過單元化架構,亞馬遜云科技將 IAM 拆分成細小的計算和存儲單元,實現了高可用性和極小的故障影響范圍。這種設計不僅保障了服務的穩定性,也使得 IAM 能夠每秒處理超過10億個 API 調用,成為全球范圍內的領先服務。
多元技術融合驅動架構創新
代聞認為,架構創新的第三大驅動力量是多元技術融合。通過 Zero-ETL 集成,亞馬遜云科技消除了數據提取、轉換和加載的復雜性,使得用戶可以無縫地將數據從 Amazon DocumentDB 同步到 Amazon OpenSearch Service,或者將 Amazon DynamoDB 的數據直接用于 Amazon Redshift 的分析。這種無縫集成不僅簡化了數據流動,也提高了數據的價值和業務的敏捷性。
此次峰會上,代聞宣布了以下重大發布:
隨著技術的不斷進步,亞馬遜云科技將繼續推動架構的演進,連接我們對未來的想象。通過創新的服務和架構,突破技術壁壘,讓生成式 AI 更加普惠。
(審核編輯: 諾謹)
分享