1月30日,基于首个全国产算力平台“飞星一号”训练的
V3.5在合肥正式发布,七大核心能力全面提升,数学、语言理解、能力超-4Turbo。同时,
星火语音也正式发布,首批37个主流语种语音识别效果超过WhisperV3,推动万物互联时代下、汽车、等场景变革
·V3.5七大能力全面提升·
2023年10月24日,科大讯飞携手,宣布首个支撑万亿参数训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,基于“飞星一号”,讯飞星火启动了对标-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。
基于首个全国产算力平台训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4Turbo,代码达到GPT-4Turbo96%,多模态理解达到GPT-4V91%。
科大讯飞董事长刘庆峰、研究院院长刘聪向现场观众展示讯飞星火V3.5的能力提升。比如,搭载讯飞星火V3.5的“讯飞智文”,拥有文档一键生成、撰写助手、多语种文档生成、自动配图、多种模板选择、提供演讲备注等功能。刘聪现场演示了如何根据一篇word文档,使用讯飞智文制作“合肥市2024年春节旅游推广策略”PPT。
在短短几十秒内,超20页内容丰富的PPT一气呵成,不仅内容合乎逻辑,生动详实,而且自主生成了大量和图表。
·星火语音大模型效果国际领先·
以智能语音起家的科大讯飞,语音能力一直走在世界前列。“大模型带来了语音技术发展的全新机会。”刘庆峰表示,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”
科大讯飞
他介绍,星火语音大模型效果国际领先,汉语、英语、法语、俄语等首批37个主流语种的语音识别效果超过WhisperV3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。“通过星火语音大模型的评测效果,科大讯飞继续保持了全球领先的水平。”
·星火开源-13B深度适配国产算力·
共享源代码、开发出更好的软件,是广大、高校、企业自主研发热衷于开源的关键原因,也是共建第一生态的重要途径。会上,基于首个全国产化算力平台“飞星一号”的开源大模型——星火开源-13B正式发布。
本次开源拥有130亿稠密参数(13B),包含基础模型iFlytek⁃Spark-13B-base、精调模型iFlytek⁃Spark-13B-chat,开源了微调工具iF⁃lytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中成绩名列前茅,在文本生成、语言理解、、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实用性大幅提升,在处理复杂的自然语言任务时更加得心应手。