Mistral AI’ın 675 milyar parametreyle eğitilen yeni modeli: Mistral Large 3

Mistral AI’ın en gelişmiş modeli olarak konumlanan Mistral Large 3; Amazon Bedrock ve Hugging Face’ten erişime sunuldu.
Mistral AI’ın en gelişmiş modeli olarak konumlanan Mistral Large 3; Amazon Bedrock ve Hugging Face’ten erişime sunuldu.
Paris merkezli yapay zeka girişimi Mistral AI, 675 milyar parametreyle geliştirilen yeni Mistral Large 3 modelini ve 3B, 8B ve 14B adlı üç yeni modelden oluşan Ministral 3 ailesini tanıttı.
Serinin amiral gemisi Mistral Large 3, girişimin bu zamana kadar geliştirdiği en yetekli model olarak konumlanıyor. 41 milyar aktif parametre kullanan bu model, Nvidia’nın 3.000 adet H200 GPU’sundan gücünü alıyor.
Post-eğitim sürecinden sonra genel talimatlarda piyasanın önde gelen modelleriyle başabaş performans sergileyen Mistral Large 3, İngilizce ve Çince dışındaki çok dilli sohbetlerde ve görüntü anlama yeteneklerinde sınıfının en iyisi olarak konumlanıyor.
Modelin temel ve talimatla ince ayarlanmış versiyonları Apache 2.0 lisansıyla yayımlandı ve akıl yürütme odaklı bir versiyonunun yakında geleceği belirtildi. Large 3, LMArena liderlik tablosunda da önemli bir pozisyon elde etti.
Diğer tarafta yer alan Ministral 3 serisi, 3B, 8B ve 14B parametre boyutlarıyla, kenar (edge) ve yerel kullanım senaryoları için en iyi maliyet-performans oranını sunuyor. Bu serideki her bir model boyutu için temel, talimatlı ve akıl yürütme varyantları, yerel çok modlu ve çok dilli yeteneklerle birlikte sunuluyor.
Şirket, Ministral 3’ün gerçek dünya kullanım durumlarında eşdeğer modellere kıyasla daha az token üretmesine rağmen performansını koruduğunu ve akıl yürütme varyantlarının kendi ağırlık sınıflarında en son teknoloji ürünü doğruluk elde ettiğini vurguluyor.
Mistral 3; Mistral AI Studio, Amazon Bedrock, Azure Foundry ve Hugging Face dahil olmak üzere birçok platform üzerinden kullanıma sunulmuş durumda.
