Qwen3

2025-05-03 08:50
98
1
Qwen3 Main Image

特点

Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。

独特支持在单一模型内无缝切换思考模式(适用于复杂逻辑推理、数学和编程)和非思考模式(适用于高效、通用对话),确保在各种场景下达到最佳性能。

显著增强其推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。

卓越的人类偏好对齐,在创意写作、角色扮演、多轮对话和指令执行方面表现出色,提供更自然、吸引人和沉浸式的对话体验。

擅长代理能力,能够在思考和非思考模式下与外部工具精确集成,并在复杂的基于代理的任务中达到开源模型中的领先性能。

支持 100 多种语言和方言,具备强大的多语言指令执行和翻译能力。

 

模型概述

发布时间:2025年4月28日

类型:因果语言模型

参数数量:总计 235B,激活 22B

 

和其他模型对比

参考:https://qwenlm.github.io/blog/qwen3/

全部评论

admin
2025-05-03 08:51
test