4月,AI领域的各种新模型开启“炸场”模式,根据DataLearner官方收集的数据统计,2023年4月份,全球在大语言模型和图像生成领域有20多个重要的模型发布。
【资料图】
通用视觉模型大战
AI视觉技术新突破
1
今年4月,Meta发布了人工智能模型Segment Anything Model(SAM),可以通过一个点或边界框,在待预测图片上给出交互提示,精准识别分割画面上的指定物体。Meta官方表示这是有史以来最大的分割数据集,同时Meta还将该模型及数据集在GitHub上开源,以促进机器视觉通用基础大模型的进一步研究。
无独有偶,智源研究院视觉团队也推出了通用分割模型SegGPT(Segment Everything In Context),用户只用给出一个或几个示例图像和意图掩码,模型就能明白用户意图,“有样学样”地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。
接连发布的两大模型,大幅降低了图像识别的门槛,让AI视觉技术领域迎来新的大变革,通用视觉大模型之战一触即发。不管是SAM还是SegGPT,都意味着视觉模型已经“理解”了图像结构。两大模型的能力相结合,能把任意图像从像素阵列解析为视觉结构单元,实现机器像人类视觉那样理解各类场景,这对自动驾驶、安防、智能家居、工业视觉等众多行业来说都将会是一次飞跃式的提升。
AI视觉应用广泛
千亿市场有待挖掘
2
所谓AI视觉,就是研究如何让机器“看得见”,即用摄像机和计算机代替人眼提取和分析图像的特征,并训练模型检测和识别新的图像数据,从而建立一个能够从图像或多模态数据中获取“信息”的人工智能系统,以达到超越人类视觉智能的效果。当前,AI视觉的研究方向涉及语义感知、定位追踪和几何属性等诸多不同主题,是目前人工智能最热门的细分领域,商业成熟度较高。
信息来源于@艾瑞咨询研究院
随着AI技术的广泛应用,AI视觉技术实际上是普通人感知最深的AI技术,应用在生活的方方面面。从OCR识别、人脸验证、刷脸支付到智能货柜,背后都离不开AI视觉技术的支持。在日常交通中,道路上的摄像头已经可以精准识别出车型、车辆颜色、车牌号,同时还能判断出驾驶人是否在打电话,以及驾驶座前方是否有遮挡物等违规行为,大大提升了交警的工作效率。
国海证券研究表示,2021年中国AI视觉产品的市场规模占整个人工智能行业的49.6%,AI视觉技术核心产品、带动相关产业市场规模达990亿元、3079亿元,到2025年预计分别达1873亿元、5771亿元。得益于深度学习技术的快速发展,AI视觉技术已在交通、安防、金融、制造、零售等多领域实现规模化商用。
AI技术落地
助力驾驶安全新体验
3
自2017年《新一代人工智能发展规划》实施以来,人工智能发展已成为中国的国家战略之一,并得到一系列政策及规范性文件的支持和推动。随着资本、政策的进一步推动以及技术日趋成熟,AI产业落地速度明显提速。AI视觉技术已成功部署在电子、汽车、农机等多个工业制造业,以及文化、旅游、广电等其它行业。
目前,AI技术在我国已经逐步应用到交通系统中。AI赋能交通,可以提高交通的机动性、道路的通行能力,更能极大的保证道路交通的安全。智慧交通的最高“境界”是人、车、路的协同,目前我国人、车、路的协同并不充分。单就智能驾驶这一细分领域来说,当前驾驶安全监管的智能化程度仍有待提高,传感器设备的普及程度低、升级成本高,导致了一系列驾驶安全问题。如何将人工智能深度赋能安全驾驶,成为各大企业竞相追逐的目标。
作为全球领先的物联网解决方案提供商,移为通信(300590)早已在智慧交通领域深耕多年,致力于积极推动AI技术的落地,针对驾驶安全监管难、智能化程度低等行业痛点,利用AI视觉技术探索优化智能驾驶新的可能,研发出一套行之有效的解决方案。
移为通信正在研发的新一代视频车联网智能终端融合了基于AI视觉技术和多传感器的人工智能识别算法,可对驾驶员的状态和行为进行实时监测。通过对大量驾驶员视频、图像资源的深度学习分析,抽象、归纳、分析出有风险的驾驶操作,对司机疲劳驾驶、打电话或超速驾驶、跟车过近等危险驾驶行为进行预警,降低事故发生率,提升驾驶安全。
新产品结合了高清音视频影像技术和移为通信在智慧交通领域的先进经验,适用于多种行业领域,包括保险理赔、驾驶员培训、分心驾驶监测、车内乘客状态监控以及事故报告等,可以有效解决诸多行业痛点。
未来,移为通信将持续创新,结合前沿的AI视觉技术,积极拓展物联网领域新的应用,以“万物在线的未来,随处可见的移为”为愿景,探索互联世界的更多可能。