您现在的位置是:首页 > 头条新闻 >
什么因素会影响AI图片识别速度?
摘要当下我们面对信息极度爆发和过度碎片化的繁杂商业结构,在组织人数较少的阶段,还可以依靠人员记录反馈的方式来获取数据,而当组织愈发庞大 ...
当下我们面对信息极度爆发和过度碎片化的繁杂商业结构,在组织人数较少的阶段,还可以依靠人员记录反馈的方式来获取数据,而当组织愈发庞大、覆盖区域愈发广博、终端门店愈发密集的阶段,人性本惰的特性就会成为组织获取客观数据最大的障碍点。
根据目前工业界的技术发展现状和趋势,从经济、效率、数据真实性几方面综合评估,人工智能解决方案目前依然是企业数字化解决方案的最优方案之一。
在零售领域整个门店执行相关的业务流程中,AI在很多环节都能发挥作用,并解决传统方式解决不了的问题。依靠AI实现海量场景识别,可以及时、高效、客观获取终端及各节点的数据,从而还原货架真相,驱动智慧零售。
在AI应用中,图像识别技术占据着极为重要的地位。事实上,一次完整的图片识别流程包括:图片上传->图像识别及KPI计算->结果回传。
那么其中有哪些因素会影响到AI图片识别的速度呢?
图片上传
该环节主要影响因素:
1、单张图片的体积(分辨率)大小。不同品类、场景、KPI,识别对于图片分辨率的要求不同,一般从200K-4M都有可能。越大的图片分辨率,需要上传的时间越长。
2、上传时的网络环境。店内网络环境直接影响网络传输的延时和带宽,对于一些网络信号不佳的门店环境(如负1层),上传速度将可能成为整体识别速度瓶颈。并且上传速度取决于门店环境和网络运营商,一般来说图像识别供应商无法控制这一过程。
图像识别及KPI计算
该环节主要影响因素:
1、单模型推理速度。考虑到图像识别是复杂的计算过程,AI供应商一般会将模型放到GPU设备运行,一般对于简单识别场景,如仅需判断SKU有无,其所需架构的模型非常少,识别实现便可以达到很快的速度。但对于实际零售场景中高近似度产品和多遮挡的情况,如系列包装、大小瓶、塑料袋装易变形产品的识别,就需要使用计算机视觉加复杂的专家推理引擎进行配合,才能实现较好的业务指标。
单模型最大的障碍点是对复杂业务场景或SKU数量较多的品牌,难以保证识别的高精度结果,往往在F1中的召回率%会异常高,造成很多产品的漏识别或者串识别。
2、业务复杂度。随着图像识别技术在实体零售领域的不断深化使用,品牌方的业务需求越来越复杂,一般来说已经不能够通过单一模型完成全部识别内容,需要不同种类、不同功能模型组合使用,以实现最终的全部业务需求。一般情况除简单分销指标外,还需要同步输出Facing数、陈列层数、SOS货架份额、黄金面位、价格、POSM等,这些需要多层复合模型的计算,以及需要货架拼接并高精度去重才能实现。
目前朗镜已与多个云供应商深度合作,使用业界专业显卡设备,并从深度学习框架和底层cuda计算引擎入手,对模型执行深度计算分析,并利用IO优化、模型剪枝、提升计算并行度等一系列手段提升推理速度。优化后单位推理速度相比baseline提升40%以上。
一个典型的模型运行体系如下:
可以看到,越复杂的业务和KPI涉及到越多的模型,势必消耗更多资源,拉升识别时间。这些模型之间可能存在依赖关系(如商品检测后才能运行商品分类),如何分析、建立不同模型之间的关系,并将互不依赖的部分尽可能并行计算,是影响全链路识别速度的关键问题之一。
通过模块化识别引擎,能够动态拆卸识别目标及计算过程,按需取用,针对具体项目仅保留最核心的识别逻辑。同时朗镜将识别过程抽象为有向图模式,利用图依赖优化识别过程,针对无依赖的节点能够轻易并发执行,尽可能提升识别速度。
结果回传
主要取决于网络环境。
朗镜科技(Trax中国)将世界领先的AI图像识别技术运用在消费品零售领域,运用计算机视觉技术对商品进行深度学习,通过拍摄图片轻松获取零售终端货架商品表现,如黄金SKU铺货率、货架占比、排面占比、商品名称规格、陈列情况、促销执行情况、是否缺货等,真实还原货架实情。
我们的优势
1、成熟的图片分辨率评估能力。朗镜针对不同品类和不同场景所需要的图片分辨率,具备充分的实际经验,能够兼顾图像识别需要和上传速度,给出最佳的平衡。
2、快速的模型推理过程。对于单个模型的推理过程,朗镜进行了深度计算优化,大幅度提升模型推理速度,单位推理速度相比baseline提升40%以上。
3、灵活高效的识别引擎架构。朗镜具备模块化识别引擎,能够动态拆卸识别目标及计算过程,针对具体项目仅保留最核心的识别逻辑。同时朗镜将识别过程抽象为有向图模式,利用图依赖优化识别过程,针对无依赖的节点能够轻易并发执行,尽可能提升识别速度。
我们的价值
1、提高工作效率。业务员访店记录时间由30min降到2min。
2、降低数据错误率。通过拍照模式,精准识别,检查人工错误和作假数据,极大降低终端数据获取错误率。
3、促进业绩增长。AI人工智能替代人工获取线下零售终端数据,极大解放了销售人员的生产力,将更多的时间投入在提高销售业绩的主要环节即与消费者沟通和运营管理。
朗镜科技(Trax中国)前沿的计算机视觉、机器学习、物联网平台和众包服务平台,可将零售货架图片转化为颗粒化、可执行的货架和门店层面洞察,从而为消费品品牌和零售商提供门店执行解决方案,提升执行能力,增加销量及市场份额。
(本文不涉密)
责任编辑:路沙