凤泊鸾飘网凤泊鸾飘网

阿里云通义千问720亿参数模型宣布开源

12月1日,阿里阿里云通义千问720亿参数模型Qwen-72B宣布开源。云通义千与此同时,问亿他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。参数

据了解,模型Qwen-72B是宣布基于3T tokens高质量数据进行训练的模型,在10个权威基准测试中表现出色,开源超越了闭源的阿里GPT-3.5和GPT-4。

阿里云是云通义千国内最早开源自研大模型的科技企业,通义千问是问亿第一个全尺寸开源的大模型,从18亿、参数70亿、模型140亿到720亿参数规模。宣布用户可以在魔搭社区直接体验Qwen系列模型的开源效果,也可以通过阿里云灵积平台调用模型API,阿里或者在阿里云百炼平台上定制大模型应用。此外,阿里云人工智能平台PAI为通义千问全系列模型提供了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

开源模型Qwen-1.8B在推理2K长度的文本内容时只需3G显存,可以在消费级终端上进行部署。而Qwen-Audio可以感知和理解各种语音信号,包括人声、自然声、动物声和音乐声等。用户可以输入一段音频,并要求模型对音频进行理解,甚至进行文学创作、逻辑推理和故事续写等任务。

阿里云CTO周靖人表示,开源生态对于推动中国大型模型的技术进步和应用实践至关重要。通义千问将继续投入开源,并希望成为“AI时代最开放的大型模型”,与合作伙伴共同推动大型模型生态建设。

审核编辑:黄飞

赞(71)
未经允许不得转载:>凤泊鸾飘网 » 阿里云通义千问720亿参数模型宣布开源