亞馬遜云科技Amazon Bedrock模型再更新，Anthropic最新版Claude4模型現已上線

亞馬遜云科技

2025-08-06 16:24 2325

北京2025年8月6日 /美通社/ -- 亞馬遜云科技宣布，Anthropic最新一代模型Claude Opus 4.1與Claude Sonnet 4，現已在Amazon Bedrock全面上線。這批新型雙模推理模型支持在即時響應與"深度思考"模式間動態切換，為編碼、高級推理及多步驟工作流樹立了全新行業標桿，能夠在復雜且長耗時的任務中保持穩定性能，驅動AI Agents將耗時數小時的工作壓縮至分鐘級完成。

將Claude Opus 4.1和Claude Sonnet 4引入Amazon Bedrock，為客戶提供了Anthropic最先進模型的選擇，簡化了客戶借助企業級安全保障和負責任的AI管控機制，構建更優質、更具變革性應用程序的流程。

評估方法說明：
1.使用pass@1指標，結合bash、編輯器工具對Opus 4.1、Opus 4和Sonnet 4進行測試。在10次試驗中取平均值，單次嘗試修補，測試時不進行額外計算，采用核采樣（nucleus sampling）方法，設置top_p值為0.95。
2.本文報告的所有分數均基于默認Agent框架（"Terminus 1"），并在5次試驗中取平均值。
3.Claude在MMMLU上的得分，取自14種非英語語言得分的平均值。
4.Opus 4.1、Opus 4和Sonnet 4在AIME上的測試采用核采樣方法，設置top_p值為0.95。

全新的Claude 4模型從根本上改變了團隊處理復雜項目的方式。對于那些需要持續投入精力和深厚專業知識的大型企業而言，這一變革尤為顯著。Claude 4雙模推理模型支持客戶在即時響應與深度推演間靈活選擇，這些模型可徹底改變企業將AI應用于復雜任務和日常高容量業務操作的方式。兩款模型均旨在為跨數千個步驟的多步驟工作流，提供更強大、更自主的AI Agents支持。Claude Opus 4.1也是Anthropic迄今為止功能最強的模型，編程能力冠絕業界。

Claude Opus 4.1如同一位精明能干的協作伙伴，在Agentic搜索與研究、內容創作以及記憶和上下文管理方面表現出色，能夠綜合提煉深刻見解、產出高質量內容并實現高效總結。

Claude Opus 4.1可直接替代Opus 4，它在實際編碼和Agent任務中，展現出更出色的性能和精準度。Anthropic表示，Claude Opus 4.1是其迄今為止最智能的模型，且在編碼和Agent領域處于行業領先地位。該模型具備先進的編碼能力，能夠獨立規劃并執行復雜的端到端開發任務，同時根據用戶風格進行調整，并始終保持高質量輸出。此外，該模型還改進了前端代碼生成功能，在有效處理復雜邏輯的同時，能輸出高質量的視覺效果。

另外，Opus 4.1具備出色的長期任務處理能力和復雜問題解決能力，是持續推理和長鏈行動中的理想虛擬協作伙伴。它還能提升AI Agents的性能，使其能夠以極高的準確度應對復雜的多步驟任務。

Claude Sonnet 4則以高效性著稱，將敏捷思維與實用智能完美融合，適用于各類項目。憑借速度與性能的平衡，Claude Sonnet 4可在各項任務間無縫切換，秉持務實態度，確保首次執行即能圓滿完成。

Claude Sonnet 4在編碼和推理能力上，均超越了其前代產品Claude Sonnet 3.7，并在性能與成本優化之間實現了平衡，非常適合處理大批量應用場景，成為大多數生產應用的理想之選。Claude Sonnet 4的應用范圍十分廣泛，既能為實時客戶支持Agent提供支持，也能處理代碼審查、漏洞修復等日常開發任務，還可作為特定任務的子Agent同時處理搜索、數據分析或內容合成等多項任務。旅游和酒店業客戶可以借助Claude Sonnet 4實時處理客戶請求，并以近乎實時的速度提供個性化回復。

這兩款模型均具備 "深度思考"功能，使Claude能夠在深度推理和行動執行兩種模式間靈活切換。Claude可根據需要進行數據分析，并在工作過程中不斷提高準確性，從而更精準地預判并執行后續步驟。

Anthropic公司增長與營收部門負責人Kate Jensen表示："Claude Opus 4和Claude Sonnet 4將AI從一種工具，轉變為每個人、每個團隊的真正協作伙伴。我們的客戶將看到項目周期大幅縮短——在許多情況下，能從數周縮短至數小時。Claude 4系列模型在編碼、高級推理及多步驟工作流方面樹立了新標桿，同時能全面理解業務背景并輸出精準結果。其真正的突破在于，Claude承擔了大量繁重工作，讓團隊人才得以專注于戰略性工作。"

核心信息

新一代Claude模型標志著Agentic AI能力的重大飛躍，徹底改變了企業將AI應用于專業復雜任務和日常高容量運營的方式。Claude Opus 4.1和Claude Sonnet 4不再局限于內容生成，而是更像專業的虛擬協作伙伴，能夠在復雜任務中保持專注，留存相關上下文信息，無需提供持續指導即可提供完整的解決方案。

這一能力革新了企業應對挑戰的方式，從軟件開發到營銷策略制定均可適用。對于日常用戶而言，這意味著他們可以使用更懂自身需求的AI，且該AI能獨立承擔項目中更大比例的工作。

數據解讀：

兩款模型均配備20萬token的上下文窗口，能讓用戶處理和生成大篇幅內容（如文檔分析和研究工作），且始終保持內容質量與連貫性。token是模型可處理的最小文本數據單位（例如一個單詞、短語或單個字符）。較長的響應在豐富的代碼生成和內容創作中效果尤為顯著。
據Anthropic介紹，Claude Opus 4.1在SWE-bench基準測試中，將其頂尖的編碼性能提升至74.5%，實現了穩定且顯著的進步，助力開發人員及其應用始終保持領先地位。與前代產品相比，Claude Opus 4.1能夠更專注更精準地瀏覽大型代碼庫，并擅長處理長時間運行的任務，對編碼Agent的規劃和協調能力也有所提升。除編碼外，Opus 4.1還增強了Claude的深度研究和數據分析能力，尤其是在細節追蹤和Agent搜索方面。
兩款模型能夠在提供快速直接答案與逐步推理解答之間靈活切換，在關鍵行業基準測試中，大幅提升了多步驟工作流程的性能表現。

據Anthropic公司稱，Claude Opus 4.1和Claude Sonnet 4預示著未來AI系統，將在創意工作和知識型工作中成為能力日益強大的合作伙伴。例如，它們可在企業中承擔更多專業角色，如處理日常分析工作、跨部門協作，甚至在極少監督的情況下管理完整的工作流程。

更多詳情，請參閱Amazon Bedrock上Anthropic的Claude。

消息來源：亞馬遜云科技