使命:通过产品和服务满足人们美好生活需要
当前位置: 首页 > 新闻  > 行业洞察 > 人工智能

紫光华智:以算法为矛,破AI落地难之盾

2021/6/3 14:20:44 人评论

近年来,机器视觉一直在重构着行业的产业链,扎了“AI”这剂强心针,百行百业数字化转型正在加速落地。一个属于AI视觉的大时代,正在呼啸而来,智能算法与澎湃算力开始了不断演进的步伐。

近年来,机器视觉一直在重构着行业的产业链,扎了“AI”这剂强心针,百行百业数字化转型正在加速落地。一个属于AI视觉的大时代,正在呼啸而来,智能算法与澎湃算力开始了不断演进的步伐。

很多人认为,智能算法已经开始趋于同质化,精度差别也只有几个百分点,算法已经无法成为企业的核心竞争力。但事实并非如此,在许多场景与实际运用中,例如碰到千万级别以上的数据,这些百分点的差别便会非常的显著,并且对整体的应用及落地产生较大的影响,这就是算法的价值。

紫光华智自去年在MIT Scene Parsing Benchmark场景解析评测中获得榜首成绩后,今年在全球权威的ICDAR Robust Reading大赛榜单中,凭借领先的AI技术优势,在文本行检测与识别两项任务中均斩获第一,一举刷新榜单记录。

▲紫光华智分别位居文本行检测榜单&文本行识别榜单No.1

紫光华智CTO周斌表示:“此次成绩打榜并不是我们的目的,实属无心之举。紫光华智一直以满足客户需求为导向和使命,将领先的AI技术落地到客户实际应用中,给客户带去实实在在的效能与效率,助力各行各业的智能化转型,普惠AI技术,赋能各行各业,这是我们持续投入研发AI技术的目的,也是我们紫光华智的战略目标。”

虽然紫光华智成立仅仅三年时间,但其继承着紫光集团、新华三在AI、芯片、存储、云计算、大数据、物联网等领域的多种强大基因,换句话而言,在其AI视觉的“枪”里,早已经装满了赋能百行百业进行数字化转型升级的“弹药”。

理解了这点,再回过头看紫光华智对于视觉技术的执着与投入,战略便能更加的清晰——智能化转型上半场是AI蓄能,企业在算法、算力、数据等维度抢占制高点,下半场是AI产业化落地,智能化的技术及应用渗透到各行各业中,只有保持技术不断迭代,才能生存下来。

中国的商业环境一向残酷,有的企业站稳脚跟,有的企业就会被对手挤掉,只有围绕着用户需求做技术创新才能决定未来的话语权。

如何破解算法落地难问题

在AI赋能传统产业中,真要打磨出可用的产品,既需要团队掌握AI视觉算法等核心技术,又需了解到百行百业各场景的真实需求,在这种背景下,落地成了AI企业当前最大的难题,既要回答“什么是用户需要的”,又要审视“什么是企业可以提供的”,用户端与技术端必须协调一致,才能让AI落地创造价值。

对于当前智能算法的落地,周斌认为落地难可以分为以下三种情况:

一是场景的多样性问题,算法训练的场景难以完全覆盖算法部署的场景,一个算法在当前场景中表现不错,但换了另外一个场景可能就会有各种问题,场景的多样性包括场景背景不同、目标视角不同、目标自身的差异性等因素,这些因素的变化可能对算法指标都会带来影响;

二是需求的碎片化,尤其像泛行业的算法需求,市场是细分的,需求是碎片化的,因此算法定制化程度很高,通用性较差,这无形中就增加了研发投入成本;

三是针对不同芯片平台的适配部署,当前算法技术发展速度远快于芯片工具链适配的速度,例如新出来的一项技术效果提升很明显,但想落地时却发现某些芯片平台并不支持该算法中的新算子,或者支持,但效率较低,难以实际部署,这显然就阻碍了该算法落地的进程。

为了解决这些问题,紫光华智针对性地提出应对之策:

针对场景多样性的问题,首先要从数据上入手,通过多种方式、多个渠道来获取尽量丰富的数据,扩充训练集和测试集;再通过算法和模型的优化,来增加算法模型的泛化能力,防止过拟合到某些特定场景;通过设置合理的工勘指导,提供在各种场景中最合适的部署、安装、调试参数,以发挥出算法的最优效果;

针对碎片化的算法需求,紫光华智推出了AI开放平台,该平台为用户开放模型训练、算法构建与部署能力,同时为第三方算法开放接入能力,帮助用户快速落地定制化算法,缩短AI应用开发周期,降低算法开发、使用成本;

针对不同芯片的适配部署,紫光华智与多家芯片厂商建立了长期合作关系,协同开发,在不同芯片上快速适配新算子的支持,以加速新算法的落地。

解除了算法落地难的后顾之忧,算法才有了长足发展的土壤。

▲非机动车牌智能识别

算法进步强化AI实战‍

算法的进步,是技术创新的量变。文本行检测、识别与我们的生活场景息息相关,如视频图片上文字审核,票据识别,手写体识别,车牌识别等,在榜首的“皇冠”下,随着业务的拓展,有着需要攻克众多难题的“重”。周斌透露,在具体的应用中,算法的表现跟场景息息相关,例如如图像分辨率、光照情况等不同,都会有不同的表现。为了提升在落地项目中算法的表现,紫光华智往往会采取相应的措施:

一是调整相机的位置、角度、视场角,或者增加一些配置来达到最优的效果;

二是从一开始便对模型的泛化性提出了相应的要求,支撑各种场景设备的接入分析。“我们的算法模型针对各类场景构建了充分的测试集和训练集,以及一个强大的数据管理团队,使模型泛化性能足够应对各类场景需求。” 周斌介绍道。

算法的落地,是技术创新的质变。产品技术的成熟度与场景应用的吻合度的结合,攻克下来的难题,能给企业带来技术领先的窗口期,技术的世界没有太多捷径,需要持续的投入与时间方能有所收获。

▲机动车牌智能识别

寻找差异点持续推进

从另一个维度看,紫光华智作为行业后来者,要想在传统巨头近身肉搏大打价格战与新巨头跨界整合夹击中生存下来,要寻找自身能力与竞争对手的差距,不断的提升自身能力,弥补自身的不足,才能在实际业务中更好的满足客户需求。

“OCR技术便是其中一个差异点,通过技术的打磨与提升,华智将领先的文本检测和识别技术充分应用到各个领域。”周斌补充道:

在道路交通场景,非机动车管理费神费力,不同地区非机动车牌格式和文本字符差异巨大,紫光华智车牌识别算法可自动读取车牌信息,实现非机动车的智能化管理,同时有效遏制了非机动车偷盗事件的发生。针对机动车管理,紫车牌识别算法为监管部门在交通违法识别、高速违停等违法事件管理提供了有效帮助;

在教育、金融等场景,不同证件票据格式不一,字符类型多样,字段长短不一,识别难度巨大。紫光华智文本识别算法可精确读取证件票据的文本信息,避免了人工手动录入产生的错误,同时大幅提升了输入工作效率,提高了工作智能化水平;

在城市管理场景,城市街道中沿街商铺为了吸引客户存在设置多个招牌、招牌颜色各异、招牌大小不一、随意变更招牌等问题,不仅影响市容市貌也存在安全隐患。紫光华智街面OCR识别算法可准确识别不同招牌的文本和语义信息,提升城市智能化管理能力和效率,助力城市精细化管理……

这是一个“如果用户体验不到差异性,所有的技术都不存在”的时代。在此次专访中,周斌多次提及“持续”、“用户”,这也是紫光华智未来市场策略的主心骨,围绕用户需求,持续创新。

客观地说,算法的持续投入是场持久战,它的潜力原本就被低估。在当前AI视觉的产业中,仍然缺少真正意义上的领军者,紫光华智对智能算法及AI视觉的加码投入,势必会开发出新的市场潜能。


相关资讯

  • 畅游VR世界MyndVR让老人足不出户周游世界

    【CNMO新闻】MyndVR是一个专为老年人设计的VR平台,他们为老年人准备了大量的视频内容以供欣赏,近日该公司与HTC的Vive X加速器合作推出了MyndVR 2.0,这款新设备让老人们足不出户便可体验畅游世界的感觉。VR体验  之前版本的MyndVR基于移动的耳机,但最新版本则是在HT…

    2019/4/28 9:22:12
  • 世界上最美的3位美女机器人,其中中国的与真人真假难辨

    说到机器人,可能大多数人印象中的应该都是充满了科技感,但实际上随着时代的快速前进,机器人早就已经和真人真假难辨了,就比如我们中国科技大学所制造出来的美女机器人,而接下来小编就要给大家介绍到世界上最美的三位美女机器人,你们觉得哪个国家制造出来的机器人最美…

    2019/4/25 8:15:03
  • 从“Al换脸”到模仿人类灵感,Al深度伪造技术引发担忧!

    人工智能的强大毋需多言,其富有的惊人创造力令人叹为观止,但当Al脱离了人类的掌控,它的可怕之处同样是你无法想象的…近日,Google开发出一款Al程序,通过简单几步就可以让你创作出虚拟的“巴赫和声”(巴赫:欧洲音乐之父)。该程序因其开创性和趣味性的特点而广受赞誉…

    2019/4/18 9:07:38
  • 遛狗已经不流行 “遛”智能购物车成为新潮流

    近日,有关于LG为韩国超市开发智能跟随购物车的新闻被各大媒体报道,各路网友都觉得好新奇,好有趣。

    2018/11/14 14:11:44

共有条评论 网友评论

验证码: 看不清楚?