Китайський штучний інтелект наздогнав: DeepSeek випустив модель R1, що викликає технічне перевагу США

2025-01-26 08:25:35

Генерація анотацій у процесі

Китайська лабораторія штучного інтелекту DeepSeek нещодавно представила свою модель розуміння коду відкритого джерела DeepSeek-R1, що спричинило широке зацікавлення у галузі. Ця модель відома як «модель розуміння» і, за ствердженнями, вона має подібну продуктивність на деяких тестах Бенчмарк штучного інтелекту до o1 від OpenAI. R1 вже було опубліковано на платформі розробки штучного інтелекту Hugging Face під ліцензією MIT, і користувачі можуть застосовувати його комерційно без обмежень.

DeepSeek стверджує, що R1 в Бенчмарк тестах перевершив o1, включаючи Американську олімпіаду з математики (AIME), MATH-500 та SWE-bench Verified. AIME використовує інші моделі для оцінки мислення, MATH-500 фокусується на текстові завдання, а SWE-bench Verified тестує завдання з програмування.

R1 модель має переваги, але обмежується політикою

За даними, як розумова модель, R1 має унікальну здатність до самоперевірки, що робить його надійнішим у фізиці, науці та математиці порівняно з традиційними моделями. Незважаючи на те, що розумова модель зазвичай потребує більше часу для обчислення, від кількох секунд до кількох хвилин (, її висока точність має велику перевагу при розв'язанні складних проблем.

Технічний звіт вказує, що R1 містить 6710 млрд параметрів, що значно перевищує багато існуючих моделей. Кількість параметрів зазвичай пропорційна здатності моделі вирішувати проблеми, що робить R1 величезною моделлю. Однак, D

MATH-0.7%

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
GT 2025 Q2 Burn Completed
29k Популярність
Join Gate VIP to Win MacBook
14k Популярність
Trump’s Tariff Policy
59k Популярність
4Altcoin ETF Watch
3k Популярність
5Gate xStocks Trading Share
8k Популярність
6Gate Square Writing Contest Phase 1
5k Популярність
7Gate Alpha Trading Share
10k Популярність
8Dr.Han Joins Gate Square
46k Популярність
9Gate Square Creator Spark Program
151k Популярність

Закріпити

карта сайту