Tin tức từ bot Gate, MiniMax đã thông báo vào ngày 17 tháng 6 rằng họ sẽ phát hành các cập nhật quan trọng trong năm ngày liên tiếp. Hôm nay là bản đầu tiên với mô hình suy diễn mã nguồn mở đầu tiên MiniMax-M1.
Theo báo cáo chính thức, MiniMax-M1 đã thực hiện nhiều bài kiểm tra chuẩn tương đương với các mô hình mã nguồn mở như DeepSeek-R1, Qwen3, gần với các mô hình tiên tiến nhất ở nước ngoài.
Blog chính thức cũng đề cập, dựa trên hai đổi mới công nghệ lớn, quá trình đào tạo MiniMax-M1 hiệu quả đến mức "vượt quá mong đợi", chỉ mất 3 tuần và 512 khối GPU H800 đã hoàn thành giai đoạn đào tạo học tăng cường, chi phí thuê tính toán chỉ 53,47 triệu USD. Điều này thấp hơn một bậc so với mong đợi ban đầu.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Mô hình suy diễn đầu tiên Mã nguồn mở MiniMax: Đối thủ cạnh tranh với DeepSeek, Khả năng tính toán chi phí chỉ khoảng 53 triệu đô la.
Tin tức từ bot Gate, MiniMax đã thông báo vào ngày 17 tháng 6 rằng họ sẽ phát hành các cập nhật quan trọng trong năm ngày liên tiếp. Hôm nay là bản đầu tiên với mô hình suy diễn mã nguồn mở đầu tiên MiniMax-M1.
Theo báo cáo chính thức, MiniMax-M1 đã thực hiện nhiều bài kiểm tra chuẩn tương đương với các mô hình mã nguồn mở như DeepSeek-R1, Qwen3, gần với các mô hình tiên tiến nhất ở nước ngoài.
Blog chính thức cũng đề cập, dựa trên hai đổi mới công nghệ lớn, quá trình đào tạo MiniMax-M1 hiệu quả đến mức "vượt quá mong đợi", chỉ mất 3 tuần và 512 khối GPU H800 đã hoàn thành giai đoạn đào tạo học tăng cường, chi phí thuê tính toán chỉ 53,47 triệu USD. Điều này thấp hơn một bậc so với mong đợi ban đầu.
Nguồn tin: Jin Shi