您现在的位置是:首页 > 人工智能 >
大模型开“卷”行业应用
2023-12-08 17:49:58作者:中国信息化周报编辑部来源:中国信息化周报
摘要大模型是新质生产力的重要组成部分,对各行各业影响之大可以说史无前例,将引领千行百业数智化创新发展。通用大模型擅长处理多种任务,是技术的制高点,也是头部互联网企业的必争之地。国内外互联网巨头纷纷入局大模型赛道,微软GPT-3 GPT-4、华为盘古大模型、百度文心一言、阿里通义千问、腾讯混元大模型、科大讯飞的星火认知大模型等各显神通。 ...
微软公司创始人比尔·盖茨表示,自1980年首次看到图形用户界面以来,以GPT为代表的大模型是他所见过的最具革命性的技术进步。毫无悬念,大模型已经成为2023年科技圈当仁不让的“顶流”。大模型的出现,加速了群雄并起、资本活跃的光辉时代的到来,让AI(人工智能)再次拥有了高光时刻。
众所周知,AI由模型、数据、算力三要素构成。相比于传统的识别型AI(小模型),以GPT为代表大模型在数据、模型等方面均带来了不同程度的革新,赋予了大模型更强的通用性。对此,百度集团执行副总裁、百度智能云事业群总裁沈抖曾打过这样一个比方:大模型出现前的AI像是氧气——本身很有价值,但自己不会燃烧,必须找到可燃物才能把发挥价值。这里的“可燃物”,指的就是落地场景。
大模型的四个特征
华为盘古大模型、百度文心一言、阿里通义千问、腾讯混元大模型和科大讯飞的星火认知大模型都是当前国内在人工智能领域具有代表性的大模型。这些大模型企业在2C(消费)领域均有布局,但更多的精力放在推动2B(行业)应用方面。总体来看,上述大模型有如下共同之处。
第一,具有开放性。这些模型通常都是由各自公司的云平台提供服务,开放给开发者和企业使用。通过API接口、SDK工具包或特定的开发平台,开发者能够拥有使用模型的能力,进行应用的开发和部署。
第二,技术架构先进。这些模型通常基于深度学习技术和算法进行训练,具有强大的多语言翻译、理解、推理和生成能力,它们不断地进行迭代和优化,以提供更好的性能和服务。
第三,模型规模大。这些模型都是大规模的AI模型,具有非常多的参数,在多种语言和任务方面表现出色。它们的训练数据覆盖了广泛的领域和应用场景,能够提供较为全面和准确的信息处理。
第四,应用场景广泛。这些模型在多轮对话、逻辑推理、文本生成、情感搜索、小度智能音箱等场景中表现较好;腾讯混元大模型在微信、QQ、游戏等场景中更有优势;华为盘古大模型则在华为云、手机等场景中有着良好的应用。
从技术特点上来看,不同的大模型在技术实现上有差异,例如华为盘古大模型采用了全栈自主创新的技术;而阿里通义千问则开源了部分的模型参数;百度文心一言则基于百度的跨模态大模型ERNIE-ViLG,具备跨模态、跨语言的深度语义理解与生成能力。
行业是必争之地 “卷”应用才刚刚开始
大模型是新质生产力的重要组成部分,对各行各业影响之大可以说史无前例,将引领千行百业数智化创新发展。通用大模型擅长处理多种任务,是技术的制高点,也是头部互联网企业的必争之地。国内外互联网巨头纷纷入局大模型赛道,微软GPT-3/GPT-4、华为盘古大模型、百度文心一言、阿里通义千问、腾讯混元大模型、科大讯飞的星火认知大模型等各显神通。毋庸置疑,大模型的市场竞争将会更加白热化,如果类比PC互联网时代和移动互联网时代,全球范围内的大模型底层平台很可能不会超过三个。因此基于通用大模型的行业应用将是成功与否的关键。毕竟大模型的“华山论剑”不是纸上谈兵,必须在应用场景中取得“战绩”,这也是大模型赋能生产力的关键。各家的大模型在各行业的应用情况也就是这场战事的焦点。
看参数
从大模型的参数来看,微软没有直接开发 GPT-3/GPT-4,而是与 OpenAI 合作,将 GPT-3/GPT-4集成到微软的产品和服务中,例如 Microsoft 365、Azure 等。GPT-3 大约只有 1750 亿个参数,一年后发布的GPT-4就拥有大约 1.8 万亿个参数,学习了截止到今年4月份的人类知识,分布在 120 个神经网络层之上,迭代速度是最惊人的。
华为的盘古NLP大模型,是业界首个超千亿参数的中文预训练大模型,它利用大数据预训练,将多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。
关于文心一言的参数级别,目前尚无具体公开数据。但根据相关报道,文心大模型 4.0 的参数量大于所有已公开发布参数的 LLM( Large Language Model 的缩写,指的是大型语言模型),预计能突破万亿级别;阿里通义千问2.0、正式发布千亿级参数大模型通义千问2.0;腾讯混元大模型是一款由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens;科大讯飞星火大模型具备超千亿参数规模。
看落地
微软更新了其 Office的套件,为用户提供智能写作和自动生成文档的功能。微软还将GPT-3/GPT-4应用于其人工智能网络安全工具 Microsoft Security Copilot中,该工具可以帮助网络管理员快速响应和消除安全威胁。从行业应用的落地来看,微软目前在医疗保健、金融服务、通信行业取得进展。
在医疗保健方面,GPT-3/GPT-4具有“通用结构化”能力,能从大规模临床文本中提取患者有效信息。虽然GPT—4仅接受了“通用”互联网数据而非特定医学数据的训练,但依然够根据指定的医学标准构建复杂的临床研究,并在处理医疗图像和其他生物数据方面发挥更多作用。GPT-3/GPT-4技术可以用于辅助医疗诊断和治疗。
在金融服务方面,GPT-3/GPT-4可以用于自动化客户服务、生成投资建议、风险评估等。
在通信行业, GPT-4可以用于构建通信行业GPT,提高服务质量和效率。
此外,GPT-3/GPT-4还可应用在教育、媒体和娱乐、零售和电商等领域。
华为的盘古大模型已应用在金融、制造、医药研发、煤矿、铁路等行业。在金融领域,盘古金融大模型可以应用于信贷风险评估、投资决策、市场预测等多个方面。广发证券利用盘古大模型优化财务智能预警系统,将精度从79%提升到90%;广东省农信社通过盘古金融OCR大模型提升字段识别精度至91%。
在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。
在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。
在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美元。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。
在智能办公与教育方面,汉得信息加入百度文心一言生态圈,通过融合百度智能对话技术,推进B端人工智能。
阿里的通义千问在电商行业,可以提升渠道体验,提高渠道效率,进而影响线上渗透率的提升,改变用户的消费习惯。通过接入落地,有可能改变电商流量结构及场景构成,影响整体的运营策略和打法。同时,图文、视频的UGC生成工具得到优化,平台商家运营效率可得到提升。
在智能家居领域,通义千问可以作为智能家居的入口之一,通过与天猫精灵等智能音箱产品的结合,为用户提供更加智能化的家居体验。
在智能办公场景中,通义千问可以应用于钉钉等办公软件,提高办公效率,协助企业实现智能化管理。
腾讯混元大模型在专业设计场景中有较好的应用。例如,在广告业务中,通过腾讯混元文生图,可以高效地进行广告创作,提升创作效率达10倍以上,同时降低设计成本。在医疗领域,它可以帮助医生进行智能导诊,迅速了解患者需求,并为他们找到合适的科室或其他专业的医疗服务。
目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部业务和产品已经接入腾讯混元大模型进行测试,并取得初步效果。
百度的文心一言在金融、医疗健康、旅游、专业咨询服务、内容创作与AI作画方面的应用展示了其在跨模态、跨语言情景下的深度语义理解与生成能力,以及在搜索问答、内容创作生成、智能办公等众多领域的应用潜力。
在金融行业,海通证券成为百度文心一言的首批生态合作伙伴之一,计划将文心一言与海通证券现有文本深度融合,探索打造行业专用知识库,实现金融科技创新。
在专业咨询服务上,百度文心一言首个落地医疗行业的产品GBI-Bot,结合了百度灵医智惠在医疗健康行业的技术积累和GBI专业数据库,提供医疗咨询问答等服务。毕马威成为百度文心一言的首批生态合作伙伴和国内咨询行业首个合作伙伴,计划将百度智能对话技术应用于金融、汽车、制造、消费品、医药、教育等多个行业。
在旅游行业中,中青旅成为百度文心一言的首批生态合作伙伴,将利用对话式语言模型为客户提供服务。
教育和汽车是科大讯飞星火认知大模型主要的落地行业。
在教育行业,科大讯飞的AI学习机T20 Pro/T20在全国5万所小学广泛使用,通过星火认知大模型,这些学习机可以为学生提供个性化的学习资源、自动批改作业和智能导学等服务。
在汽车行业,科大讯飞为汽车行业提供多轮、多区域多模态智能汽车人机交互范式,服务用户累计达4200万人。星火认知大模型可以帮助汽车实现更智能的人机交互,提高驾驶安全性和舒适性。
此外,科大讯飞的星火认知大模型还在医疗、金融、法律等多个领域发挥作用,例如协助医生进行智能诊断、为企业提供智能客服等。
看策略
华为的盘古大模型主要用于2B场景,并对盘古大模型根据应用特点做了规划和细分。华为有盘古NLP大模型、盘古CV大模型、盘古多模态大模型、盘古预测大模型、盘古科学计算大模型五种通用类型。
盘古CV大模型基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型,赋能行业用户利用少量场景数据对模型微调即可实现特定场景任务。
盘古多模态大模型融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。盘古预测大模型面向结构化数据,基于神经网络Transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。
盘古科学计算大模型面向气象、医药、水务、机械、航天航空等领域,融合AI数据建模和AI方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用AI模型更快更准确地解决科学计算问题。
百度文心一言大模型 4.0 的主要开拓策略有三个方面。第一,提供定制化服务。根据企业客户的具体需求,为客户定制开发适合其业务场景的模型和应用。第二,技术输出和合作。与行业伙伴共享技术成果,共同打造端到端的解决方案,助力企业提升业务效率和竞争力。第三,构建产业生态。通过与各类企业、开发者、合作伙伴开展紧密合作,构建起强大的生态系统,推动人工智能技术在各行业的广泛、深入应用。
文心一言自8月31日面向全社会开放,用户规模达到7000万,场景4300个,应用2492个。
目前,飞桨和文心生态已凝聚800万开发者,服务22万家企事业单位,创建了80万个模型。文心大模型 4.0 已经在多个行业进行开拓,包括金融、医疗、教育、零售、能源等。
阿里通义大模型提出了八大行业模型:通义灵码——智能编码助手、通义智文——AI阅读助手、通义听悟——工作学习AI助手、通义星尘——个性化角色创作平台、通义点金——智能投研助手、通义晓蜜——智能客服、通义仁心——个人专属健康助手、通义法睿——AI法律顾问。
八大行业模型面向当下最受欢迎的多个垂直场景,使用专业数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在文旅、电力、政务、医保、交通、制造、金融等领域的落地。
大模型未来: 路在何方
尽管大模型在行业应用中各自精彩,竞相绽放,但面临的挑战却惊人的相似。中国工程院院士张亚勤指出,大模型目前面临的局限性包括时效性、准确性、效率以及隐私保护等。特别是大模型的计算效率低下问题,与人类大脑的高效性形成了鲜明的对比。人类大脑拥有860亿个神经元和近1万个突触,却只需要20瓦的能量,重量还不到1.5公斤;而GPT4这个万亿参数模型则需要巨大的算力和能源,与人脑相比相差1,000多倍。概括来说,挑战主要来自以下几方面。第一,算力资源有限。构建和训练大规模AI模型需要大量的计算资源和存储空间,而我国的计算资源相对有限,这将成为限制这些大模型发展的一个因素。第二,数据隐私和安全问题。AI模型需要大量的数据进行训练,如何在保护用户隐私的同时,合法合规地收集和使用数据,成为需要解决的问题。第三,关键技术有瓶颈。在AI芯片和深度学习框架等关键技术上,仍然存在需要突破的瓶颈。这可能会影响大模型的性能和效率。第四,法规和伦理问题。AI大模型的应用涉及伦理和法律问题,如AI决策的公平性和透明性,AI模型的责任归属等。第五,生态建设。目前我国的AI生态仍然比较分散和碎片 化,缺乏统一的标准和规范。需要深入思考如何推动生态建设。
构建生态
这些大模型都采用了大规模的预训练技术,通过海量数据的训练,提高了模型的泛化能力和性能。这些大模型都致力于构建开放、合作的生态系统,殊途同归,与众多开发者和企业合作,推动人工智能技术的应用。
华为盘古大模型主要采取“为行业而生”的定位,通过与合作伙伴共同构建行业大模型,将盘古大模型应用于多个行业场景。华为云盘古大模型3.0分为L0基础大模型、L1行业大模型、L2场景模型三层架构。
百度文心一言则注重发展大模型应用生态,发布AI原生应用商店,以及国内首个大模型全链路生态支持体系,赋能伙伴商业增长,共建、共享繁荣的大模型产业生态。
阿里通义千问主要通过打造“模型超市”,降低大模型的使用门槛,让更多的企业和开发者能够便捷地获取和使用大模型。
科大讯飞星火和腾讯混元大模型则主要通过开放平台和工具,以及提供技术支持和培训,吸引更多的开发者参与到大模型的应用开发中来。
开源之道
公开资料显示,除阿里通义千问大模型开源外,华为盘古大模型、百度文心一言大模型、腾讯混元大模型和科大讯飞的星火认知大模型目前尚未开源。阿里云在2023年8月3日宣布开源通义千问70亿参数模型,包括通用模型Qwen—7B和对话模型Qwen—7B—Chat。这两款模型已经在魔搭社区上线,开源、免费、可商用。这一举动也让阿里云成为国内首个加入大模型开源行列的大型科技企业。阿里巴巴通过其旗下的开源平台,例如阿里云、天猫等,提供了相应的API接口和技术支持,同时也积极参与开源社区的贡献和技术交流。百度文心一言的文生图能力来自文心跨模态大模型ERNIE-ViLG,这个模型的能力来源于开源模型。百度表示,在大模型训练中,他们使用的是全球互联网公开数据,符合行业惯例。因此,尽管文心一言本身并不是开源项目,但它的一些功能是建立在开源模型的基础之上的,其部分技术可能以开源的形式对外提供,让更多的开发者能够使用和参与到文心一言的技术研发中。华为云相关负责人曾在华为开发者大会2023媒体沟通环节表示,华为云盘古大模型全栈技术均由华为自主创新,没有采用任何开源技术。 另外,由于华为云盘古大模型定位于赋能千行百业,将聚集无数行业大数据,因此未来盘古大模型不会开源。但通过华为云平台,华为提供了盘古大模型的API接口,便于开发者和企业进行二次开发和应用。
目前大模型的开源还主要在算法、API服务、开发工具的使用上,未来需要构建全栈化的开放生态,打造标准算法集、大模型平台、大模型数据集等于一体的开放平台。
大模型的应用之路才刚刚开启。场景需求碎片化、研发和应用计算成本高以及长尾场景数据较少等问题依然存在,从实验室场景中训练出的模型算法在真实场景中的表现也还需要进一步观察,但可以肯定的是,尽管前路漫漫,更多的期待仍然值得拥有,更多的惊喜仍就值得等待。
(本文不涉密)
责任编辑:杨光
上一篇:机器人产业发展破局关键
下一篇:以数字消费助推元宇宙可持续发展