Китайський штучний інтелект наздогнав: DeepSeek випустив модель R1, що викликає технічне перевагу США

robot
Генерація анотацій у процесі

Китайська лабораторія штучного інтелекту DeepSeek нещодавно представила свою модель розуміння коду відкритого джерела DeepSeek-R1, що спричинило широке зацікавлення у галузі. Ця модель відома як «модель розуміння» і, за ствердженнями, вона має подібну продуктивність на деяких тестах Бенчмарк штучного інтелекту до o1 від OpenAI. R1 вже було опубліковано на платформі розробки штучного інтелекту Hugging Face під ліцензією MIT, і користувачі можуть застосовувати його комерційно без обмежень.

DeepSeek стверджує, що R1 в Бенчмарк тестах перевершив o1, включаючи Американську олімпіаду з математики (AIME), MATH-500 та SWE-bench Verified. AIME використовує інші моделі для оцінки мислення, MATH-500 фокусується на текстові завдання, а SWE-bench Verified тестує завдання з програмування.

R1 модель має переваги, але обмежується політикою

За даними, як розумова модель, R1 має унікальну здатність до самоперевірки, що робить його надійнішим у фізиці, науці та математиці порівняно з традиційними моделями. Незважаючи на те, що розумова модель зазвичай потребує більше часу для обчислення, від кількох секунд до кількох хвилин (, її висока точність має велику перевагу при розв'язанні складних проблем.

Технічний звіт вказує, що R1 містить 6710 млрд параметрів, що значно перевищує багато існуючих моделей. Кількість параметрів зазвичай пропорційна здатності моделі вирішувати проблеми, що робить R1 величезною моделлю. Однак, D

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити