阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

zhiyongz 阅读: 2025-03-06 09:52:10 评论:0

快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging FaceModelScope开源,大家也可通过Qwen Chat直接进行体验!
【本文结束】出处:快科技

部分内容源于互联网,请仔细甄别真实性!如涉及关于钱的内容,更请谨慎对待!网址:https://tashuo.net/articles/58891.html

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容