您现在的位置是:首页 > 特别推荐 >

三六零前瞻布局CoE架构大模型 与OpenAI o1思维链模式不谋而合

2024-09-18 15:29:04作者:来源:信息主管网

摘要360集团创始人周鸿祎认为,OpenAI o1遵循的可能是“双系统理论 Dual Process Theory”,核心在于两种系统并非独立而是协同运作。由此推测,其内部构建的更加智能的模型或许是 GPT和o系列结合思维链的融合系统,前者用于“快思考”,后者实现“慢思考”。...

近日,Open AI正式发布了具有强大推理能力、代号为OpenAI o1-preview(以下简称:“o1”)新一代大语言模型。基于强化学习和“思维链”,o1大幅优化了记忆、检索、推理机制,提升了大模型解决复杂问题的能力。对此分析人士指出,这与三六零(601360.SH,下称“360”)集团在两个多月前的ISC.AI2024发布的CoE技术架构理念相同、方法类似,并且在实践效果上也相对接近。这显示,国内国际的大模型发展基本同步、同频,CoE技术架构和“思维链”机制,或将共同引领大模型领域的发展方向,成为大模型发展的下一个范式。
 
360集团创始人周鸿祎认为,OpenAI o1遵循的可能是“双系统理论 Dual Process Theory”,核心在于两种系统并非独立而是协同运作。由此推测,其内部构建的更加智能的模型或许是 GPT和o系列结合思维链的融合系统,前者用于“快思考”,后者实现“慢思考”。而CoE(Collaboration-of-Experts,专家协同)架构则集合了数量更多的大模型和专家模型,是通过思维链和“多系统协同”的方式实现“快思考”和“慢思考”。
 
分析人士也解读,思维链(CoT,Chain-of-Thought)能够将复杂的步骤分解为更简单的部分,并可尝试不同的策略,从而大幅提高其推理能力。与之相对,更早发布的360 CoE技术架构,是通过多模型协作的方式获得其所接入的所有大模型本不具备的能力。比如,CoE架构能够通过意图识别模型,更加理解用户的实际需求;通过任务分解路由模型,让各大模型、小模型之间协同配合。基于“慢思考”理念的多重技术优化,让整个架构更为智能、高效。
 
据了解,o1思维链机制和CoE技术架构,都比此前国际主流的MoE(Mixture-of-Experts,混合专家)架构更进一步。
 
在此前的测试中,集各家所长的基于CoE架构的混合大模型以80.4测试总分大幅超越GPT-4o的69.22分,且在11个能力维度上全面领先。即使是面对全新发布的o1大模型,CoE技术架构也展现出优势。目前,CoE架构已接入国内16家主流大模型厂商的54款大模型,并落地应用到360AI搜索、360AI浏览器等多款产品中,其产品应用更是领先于代表国际水平的OpenAI等大模型厂商。
 
三六零2024年半年报显示,在CoE技术架构赋能下,AI对互联网产品的重塑,大幅提升了360产品的用户体验,有效增强了用户付费意愿。2024年上半年,360互联网增值业务收入达5.89亿元,同比增长14.67%;其中订阅服务收入1.48亿元,同比增长110.45%,已超过去年全年。作为代表性AI办公服务,360AI大会员自今年4月正式发布,不到一个半月时间已累计超过15万用户。
 
业内人士认为,此次o1大模型的发布,进一步印证了360提出的CoE架构的前瞻性与实用性,凭借丰富的应用场景和强大的技术支撑,有望进一步巩固360在AI领域的领先地位。同时,360在大模型领域的持续创新和深度探索,不仅为整个行业拓宽了技术发展的思路,还带来了更加领先的技术解决方案及标准化的参考框架,为行业内的参与者树立了标杆。

(本文不涉密)
责任编辑:路沙

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们