Mistral Medium 3於昨日發布,將該模型定位為對企業AI部署經濟學的直接挑戰。
這家總部位於巴黎的初創公司,成立於2023年,由前Google DeepMind和Meta AI研究人員創立,發布了其聲稱能提供前沿性能的產品,運營成本僅為可比模型的八分之一。
「Mistral Medium 3提供前沿性能,同時成本低一個量級,」該公司表示。
該模型代表Mistral AI迄今為止最強大的專有產品,與包括Mistral 7B、Mixtral、Codestral和Pixtral在內的開源產品組合區分開來。
每百萬輸入標記0.4美元和每百萬輸出標記2美元的價格,使Medium 3顯著低於競爭對手,同時保持性能平衡。人工分析機構的獨立評估將該模型定位為「領先的非推理模型之一,Medium 3與Llama 4 Maverick、Gemini 2.0 Flash和Claude 3.7 Sonnet不相上下。」
該模型在專業領域表現尤為突出。
人類評估顯示其在編碼任務中的優越性能,Mistral AI代表Sophia Yang指出,「Mistral Medium 3在編碼領域表現出色,整體性能優於一些規模更大的競爭對手。」
基準結果顯示,Medium 3在各類測試類別中的表現達到或超過Anthropic的Claude Sonnet 3.7,而在編碼和推理等專門領域中,則大幅超越Meta的Llama 4 Maverick和Cohere的Command A。
該模型的128,000標記上下文窗口為標準配置,其多模態特性使其能夠處理文檔和視覺輸入,支持40種語言。
但與使Mistral聞名的模型不同,使用者將無法對其進行修改或在本地運行。
目前,開源愛好者最佳的資源是Mixtral-8x22B-v0.3,這是一個運行8個22億參數專家的專家混合模型。除了Mixtral,該公司還提供超過十種不同的開源模型。
它也最初可用於企業部署,而非通過LeChat(Mistral的聊天機器人界面)進行家庭使用。Mistral AI強調該模型的企業適應能力,支持持續預訓練、全面微調,以及集成到企業知識庫中以用於特定領域的應用。
來自金融服務、能源和醫療保健行業的測試客戶正在測試該模型以增強客戶服務、個性化業務流程和複雜數據集分析。
API將立即在Mistral La Plateforme和Amazon Sagemaker上推出,並計劃與IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex進行即將到來的集成。
這一公告在社交媒體平台上引發了相當大的討論,AI研究人員讚揚了這一成本效益的突破,同時指出專有性質可能成為潛在限制。
該模型的封閉源代碼狀態標誌著Mistral從其開放權重產品的轉變,儘管該公司暗示未來會有新產品發布。
「隨著Mistral Small在3月推出,Mistral Medium今天發布,毫無疑問我們正在為接下來的幾周準備一些『大型』產品,」Mistral的開發者關係負責人Sophia Yang在公告中調侃道。「即使是我們的中型模型,在性能上也遠遠超越了Llama 4 Maverick等標誌性開源模型,我們對即將推出的內容感到興奮。」
Mistral的幻覺產生率低於平均模型,這是一個好消息,考慮到其規模。
它的性能優於Meta Llama-4 Maverick、Deepseek V3和Amazon Nova Pro等幾個模型。目前,幻覺產生率最低的模型是Google最近推出的Gemini 2.5 Pro。
此次發布正值這家位於巴黎的公司商業增長驚人,儘管自去年發布Mistral Large 2以來一直保持低調。
Mistral最近推出了一個企業版本的Le Chat聊天機器人,該版本可與Microsoft SharePoint和Google Drive集成,首席執行官Arthur Mensch告訴路透社,他們在「過去100天內業務增長了三倍,特別是在歐洲和美國以外的地區。」
該公司的估值目前達到60億美元,通過運營自己的計算基礎設施並減少對美國雲服務提供商的依賴,展示了其技術獨立性——這一戰略舉措在與特朗普總統對科技產品徵收關稅後的緊張關係中,在歐洲引起了共鳴。
Mistral聲稱以消費者友好的價格實現企業級性能的主張,是否能在實際部署中得到證明,仍有待觀察。
但目前,Mistral已將Medium 3定位為一個引人注目的折衷方案,這在一個通常認為規模越大(且價格越高)就越好的行業中。
編輯:Josh Quittner和Sebastian Sinclair