A Golden Finance reporta que a equipe da Ali Qwen lançou oficialmente o seu mais recente resultado de pesquisa - o modelo de linguagem QwQ-32B, que, com apenas cerca de 1/21 dos parâmetros do DeepSeek-R1, alcançou um avanço de desempenho através de aprendizagem por reforço.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
A Golden Finance reporta que a equipe da Ali Qwen lançou oficialmente o seu mais recente resultado de pesquisa - o modelo de linguagem QwQ-32B, que, com apenas cerca de 1/21 dos parâmetros do DeepSeek-R1, alcançou um avanço de desempenho através de aprendizagem por reforço.