全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符
2024-06-07 14:59:00 人浏览

大模型领域,开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型,为这场争论提供了最新的答案。

6月7日,通义千问推出开源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整体性能相比Qwen1.5-110B大幅提升!一举超越了美国最强的开源模型Llama3-70B,更是将文心4.0等中国众多闭源模型甩在身后,登上最强开源大模型的宝座。

OpenCompass大模型测评榜单上,Qwen1.5-110B已领先于文心4.0等一众中国闭源模型

对比当前最优的开源模型,Qwen2-72B在多项能力上均处于领先

Qwen2系列模型除了技术性能上的提升,还展现了更多的应用潜力。其多语言处理、长文本处理、代码生成、数学和逻辑推理等能力,已经在MMLU、GPQA、HumanEval等国际测评中得到了验证。

代码及数学能力也得到了显著提升

此前存在一种观点认为在大模型的开发上,闭源模型因为其庞大的投资和资源积累,相较开源模型具有不可比拟的优势,导致了一种看似共识的观念:开源模型难以追赶闭源模型的步伐。

单一的公司的闭源模型,如果有大量资金和资源投入,的确可以在短期内推动技术的发展,这一点在OpenAI上已经得到了验证。而且不可否认,选择闭源的OpenAI在性能上仍然是业界最强。

而这次阿里云Qwen2的发布,表明开源模型同样能够达到甚至超越闭源模型的高性能。这不仅让开源模型落后闭源模型的论调不攻自破,也再次证明了开源大模型不仅不会越来越落后,在技术上更是有着无限的可能。开源大模型能够做到足够强,并且会越来越强。

同时这也是对开源价值的再一次阐释,Qwen系列的开源模型除了为技术社区贡献了一项重要的资源,也鼓励了全球性的创新合作,进一步强化了开源大模型生态系统的活力和包容性。

值得一提的是,阿里云在1个月前刚刚发布中文场景性能超过GPT-4的闭源模型——通义千问2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。

所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。

本资讯链接:财经众议院
声明:本文版权归原作者所有,发布此文为传递更多市场信息,不代表财经众议院的观点和立场,请自行参考。