Qwen3
2025-05-03 08:50
98
1
特点
Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。
独特支持在单一模型内无缝切换思考模式(适用于复杂逻辑推理、数学和编程)和非思考模式(适用于高效、通用对话),确保在各种场景下达到最佳性能。
显著增强其推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
卓越的人类偏好对齐,在创意写作、角色扮演、多轮对话和指令执行方面表现出色,提供更自然、吸引人和沉浸式的对话体验。
擅长代理能力,能够在思考和非思考模式下与外部工具精确集成,并在复杂的基于代理的任务中达到开源模型中的领先性能。
支持 100 多种语言和方言,具备强大的多语言指令执行和翻译能力。
模型概述
发布时间:2025年4月28日
类型:因果语言模型
参数数量:总计 235B,激活 22B
和其他模型对比
参考:https://qwenlm.github.io/blog/qwen3/
全部评论