۱۷:۱۴ - ۱۴۰۴/۰۹/۱۲

Mistral ۳ رونمایی شد؛/ ۱۰ مدل متن‌باز هوش مصنوعی از گوشی تا پهپاد!/ انقلاب در دنیای AI

Mistral AI، بزرگ‌ترین استارتاپ هوش مصنوعی اروپا، خانواده مدل‌های Mistral ۳ را منتشر کرد؛ شامل مدل‌های قدرتمند و متن‌باز که هم روی دستگاه‌های کوچک و هم سیستم‌های ابری اجرا می‌شوند. این مدل‌ها با تمرکز ویژه روی زبان‌های غیرانگلیسی و قابلیت ...

Mistral ۳ رونمایی شد؛/ ۱۰ مدل متن‌باز هوش مصنوعی از گوشی تا پهپاد!/ انقلاب در دنیای AI

به گزارش پایگاه خبری تحلیلی اندیشه قرن، Mistral AI، مهم‌ترین استارتاپ هوش مصنوعی اروپا، از انتشار جاه‌طلبانه‌ترین بسته محصولات خود خبر داد: خانواده Mistral 3 که شامل ۱۰ مدل متن‌باز است و می‌توانند روی هر دستگاهی از گوشی هوشمند گرفته تا پهپادهای خودران و سیستم‌های ابری اجرا شوند.

خانواده مدل‌های هوش مصنوعی Mistral 3 شامل  Mistral Large 3  و مجموعه‌ای از مدل‌های کوچک‌تر موسوم به  Ministral 3  است که برای کاربردهای رایانش لبه بهینه‌سازی شده‌اند. همه این مدل‌ها تحت مجوز Apache 2.0 منتشر شده‌اند که نشان‌دهنده رویکردی متفاوت و آزادتر از عرضه مدل‌ها متن‌باز توسط گوگل، OpenAI و آنتروپیک است.

معرفی مدل‌های هوش مصنوعی متن‌باز Mistral 3

مدل پرچمدار این استارتاپ با نام Mistral Large 3 از معماری «ترکیب متخصصان» (MoE) با ۴۱ میلیارد پارامتر فعال که از استخر  ۶۷۵ میلیارد پارامتری  این مدل برداشته می‌شود، استفاده می‌کند. این مدل می‌تواند  متن  و  تصویر  پردازش کند و پنجره زمینه آن تا  ۲۵۶ هزار توکن  است. همچنین گفته شده که این مدل به‌طور خاص با  زبان‌های غیرانگلیسی  آموزش دیده که در میان مدل‌های پیشگام اتفاقی نادر است.

براساس بنچمارک‌هایی که Mistral منتشر کرده است، مدل Mistral Large 3 (675B) در تست‌های MMMLU و GPQA-Diamond از DeepSeek-3.1 (670B) و Kimi-K2 (1.2T) بهتر عمل کرده است. همچنین در تست‌های AMC و SimpleQA از مدل دیپ‌سیک بهتر ظاهر شده اما کمی ضعیف‌تر از Kimi-K2 بوده است.

کوچک‌ترین مدل‌ها که Ministral 3 نام دارند روی دستگاه‌هایی با حداقل  ۴ گیگابایت حافظه ویدیویی  قابل اجرا هستند، بنابراین می‌توانند روی لپ‌تاپ، گوشی‌های هوشمند و سیستم‌های امبد اجرا شوند و نیازی به اینترنت ندارند. ۹ مدل Ministral 3 در سه اندازه ( ۳ ، ۸ و ۱۴ میلیارد پارامتر ) و سه نوع مختلف برای کارکردهای گوناگون ساخته شده است. این سه نوع عبارت‌اند از:

  • مدل‌های پایه برای شخصی‌سازی
  • مدل‌های تنظیم‌شده با دستورات برای چت عادی و تکمیل تسک
  • مدل‌های بهینه برای استدلال به‌منظور تفکر منطقی پیچیده و اجرای گام‌به‌گام عملیات‌ها

مدل‌های جدید Mistral 3 از امروز در سرویس‌های مختلفی ازجمله Mistral AI Studio، آمازون Bedrock، آزور Foundry و هاگینگ فیس (Large 3 و Ministral) در دسترس قرار گرفته است.

منبع : دیجیاتو

مطالب مرتبط