MiniMax Відкритий вихідний код перший модель інферування: на рівні DeepSeek, Обчислювальна потужність вартість лише близько 53 тисяч доларів США

Gate News bot повідомляє, що MiniMax 17 червня оголосив про п'ять днів важливих оновлень. Сьогодні перший реліз – відкритий вихідний код перша модель висновків MiniMax-M1.

Згідно з офіційним звітом, MiniMax-M1 у кількох бенчмарках зрівнявся з DeepSeek-R1, Qwen3 та іншими відкритими моделями, наближаючись до найбільш передових моделей за кордоном.

Офіційний блог також зазначає, що на основі двох великих технологічних інновацій процес навчання MiniMax-M1 виявився ефективним «більше ніж очікувалося», всього за 3 тижні та 512 блоків H800 GPU було завершено етап навчання з підкріпленням, а вартість оренди обчислювальної потужності склала лише 53,47 тисячі доларів США. Це на порядок менше, ніж спочатку очікувалося.

Джерело новини: Jin10

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити