谷歌Відкритий вихідний кодGemma-3:媲美DeepSeek,Обчислювальна потужність 暴降

robot
Генерація анотацій у процесі

Золоті дані 13 березня, вчора ввечері генеральний директор Google (GOOG.O) Сундар Пічаї оголосив, що відкритий вихідний код останньої багатомодової великої моделі Gemma-3, яка пропонує низькі витрати та високу продуктивність. У Gemma-3 є чотири параметри: 10 мільярдів, 40 мільярдів, 120 мільярдів і 270 мільярдів. Проте навіть для найбільшого параметра 270 мільярдів потрібно лише одну H100 для ефективного розрахунку, що в 10 разів менше обчислювальної потужності, і вона є найсильнішою серед невеликих параметрів на сьогодні. Згідно з даними сліпого тестування LMSYS ChatbotArena, Gemma-3 випереджає лише DeepSeek R1-671B, але перевищує відомі моделі OpenAI o3-mini, Llama3-405B тощо.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити