您现在的位置是:首页 > 人工智能 >
100%的国产大模型,距离世界顶级有多远
2024-07-05 16:41:46作者:于帆来源:
摘要在自主可控的底座下进化国产大模型非常有必要,刘庆峰表示:“我们既要认识到差距,又要有充分的信心,要能够科学理性地给出从源头技术,到生态,再到产业应用落地的一整套打法,要以长期主义来打造真正自主可控的AI产业生态。” ...
近日,科大讯飞在北京召开讯飞星火大模型V4.0(以下简称为讯飞星火V4.0)发布会。据了解,讯飞星火V4.0是基于首个能训练千亿以上浮点参数大模型的国产万卡算力集群“飞星一号”训练而成的。
(本文不涉密)
责任编辑:于帆
科大讯飞董事长刘庆峰在会上表示:“我们的建筑不能建在别人的院子里,国家不能没有通用大模型底座能力。”
大模型底座能力决定发展高度。讯飞星火V4.0能否在当前胶着的大模型市场态势中突出重围?号称超越GPT-4 Turbo的讯飞星火V4.0,距离世界级大模型还有多远?国产班底的讯飞星火4.0最核心的能力是什么?
新版本强在哪
根据官方发布信息,讯飞星火V4.0七大核心能力全面升级,领先国内大模型,在多个方面实现对GPT-4 Turbo的整体超越。在8个国际主流测试集中,讯飞星火V4.0均取得第一名的成绩。纸面数据的超越用户感受不深,发布会现场展示的讯飞星火V4.0首秀则称得上震撼。
发布会上,科大讯飞展示了讯飞星火V4.0在语音识别方面的强大能力。
第一,多方言多语种免切换语音识别。官方在现场演示了一段包含安徽话、上海话、四川话、粤语等方言和汉语、英语、法语混杂的语音识别。对比GPT-4 Turbo,科大讯飞不仅在识别外语上达到同等水准,更具备中国特色,实现了对复杂的中文方言的识别。根据官方信息,讯飞星火V4.0支持37个语种、37种方言“自由对话”。第二,强干扰环境下的语音识别。官方共展示了两个例子。一个是电影《寒战》中梁家辉与郭富城各说各话的吵架场景,另一个是现场三位科大讯飞研究员同时对着屏幕讲话。讯飞星火V4.0成功识别人耳难以分辨的交错声音,并对发言人进行标注。第三,语音打断。科大讯飞现场展示了讯飞智能驾舱,一位中国人和一位外国人分坐主驾与副驾,两人除了可以无缝切换语种甚至方言与讯飞星火V4.0交互,更多次展示“语音打断”效果。这代表讯飞星火V4.0不再是僵硬的语音聊天工具,它懂得了人类交谈习惯,可以无缝回复,“更像人了”。
万物互联时代,语音成为人机交互的重要窗口,是当前国际上人工智能竞争的焦点之一。科大讯飞基于自主可控的平台,实现国产软硬件的语音产业链自主可控及语音技术的多语种覆盖,毫无疑问达到国际领先水准。
发布会现场还展示了讯飞星火V4.0针对长文本知识问答的幻觉治理成果,业界首发内容溯源功能。将《西游记》和英文版《哈利波特》的文档发给讯飞星火V4.0后提问,“哈利波特的魔杖与孙悟空的金箍棒有什么不同”,答案从多角度论证两者的相异性。答案中间夹杂多个旗帜图案,点击旗帜图案便可溯源得出答案的原文片段。
这一功能类似美国独角兽企业Perplexity AI 的搜索功能,让答案有据可查,尽力避免大模型“乱说话”。长文本、长语音、长图文,讯飞星火V4.0可以根据多模态信息进行多模态溯源。将文件上传至“个人空间”,由此可生成个人的专属知识库,大模型可生成更为个性化的内容。
往何处变更强
讯飞星火V4.0给用户带来许多惊喜,但同时,刘庆峰坦言,在代码能力和多模态能力方面,讯飞星火V4.0仍落后于GPT-4 Turbo。在他看来,目前中美人工智能仍有差距,一旦GPT-5发布,国产大模型与其差距可能会进一步拉大。以讯飞星火V4.0为代表的国产大模型往何处变,才能更强?
科大讯飞将讯飞星火V4.0定义为“懂你的AI助手”。其推出个性化的智能体功能,通过设置结构化的指令模板,用户即可完成助手功能设定,回答内容可以从星火大模型现有语料库中获取,也可以在专属知识库中获取。从测试成果看,尚有改善空间。如记者向“电影剧情大师”智能体提问《大话西游》系列电影相关内容,讯飞星火V4.0在回答电影孙悟空的扮演者以及两部电影剧情的问题上,表现不佳。
讯飞星火V4.0继续升级迭代,训练数据以及算力投入是其关键。刘庆峰表示:“在中国,一定要考虑用更小的算力、更少的数据,做出更优质的落地成果,这样才能够在未来打赢这一场人工智能红利赋能产业的‘仗’。”
美国南卡罗来纳大学人工智能研究所在2023年发表的论文《对“大”基础模型中幻觉现象的调查》中指出,目前常见的减轻幻觉问题的方法,包括利用外部知识源增强模型的准确性,使用提示技术提高内容的可靠性,在监督环境内微调模型,试用教师-学生模型架构,模型蒸馏以减少模型容量等。
讯飞星火V4.0是在“飞星一号”万卡集群上完成训练的,这是科大讯飞携手华为建设的首个支撑万亿参数大模型训练的万卡国产算力平台。所谓万卡集群,核心在于将数万块GPU计算单元组合构建的高性能计算资源。
虽然目前国产万卡集群与国际万卡集群相比,在硬件性能、软件生态、系统集成与稳定性等方面仍存在一定的差距,但唯有“自主可控”的算力底座才能实现“中国通用人工智能的大未来”。
在自主可控的底座下进化国产大模型非常有必要,刘庆峰表示:“我们既要认识到差距,又要有充分的信心,要能够科学理性地给出从源头技术,到生态,再到产业应用落地的一整套打法,要以长期主义来打造真正自主可控的AI产业生态。”
(本文不涉密)
责任编辑:于帆