讲计算机视觉之前,先和大家简单区分一下两个概念“机器视觉”和“计算机视觉”,这两个技术都是通过对图像的获取、处理、结合人工智能算法,实现机器/计算机的“看到”、“看懂”之目的,都可以划分到人工智能行业。
机器视觉通过CMOS和CCD摄取图像,主要用于工业,包括物体定位、特征检测、缺陷判断、目标识别、计数和运动跟踪。计算机视觉比机器视觉更加复杂,通过各种成像系统(包括视频)获取图像信息,由计算机代替人脑观察理解,做出判断和决策。接下来,重点讲解计算机视觉(ComputerVision,CV)。CV是AI细分领域目前最大的一个分支,2017年国内市场规模约为15.45亿元,2019年约60亿元,2022年有望达到146亿元(数据来源:网络资料整理)。在CV领域,我国无论在市场空间,还是在技术上都处于领先地位。目前CV应用最大的领域是安防,其次是金融和手机,也正在逐渐渗透到娱乐、家居、交通(包括自动驾驶)、医疗等领域。计算机视觉行业根据技术层级从上到下,分为基础层、技术层和应用层。基础层最靠近“云”,应用层最靠近“端”。借用下图吧。注:图片来源网络,侵删CV界(算法)四大独角兽分别是旷视科技、依图科技、商汤科技、云从科技,这四家公司分别成立于2012/2013/2014/2015年。女孩子们最熟悉的美图秀秀技术就来源于旷视科技。在安防领域落地项目较多的是云从和依图,都分别和20-30个省份的城市有合作。在手机领域,商汤和旷世的落地项目更多,都和oppo、vivo、小米等手机品牌有合作。从技术流程上看,CV识别分为六个过程:图像获取、预处理、图片分割、特征提取、机器判别、建模、应用。注:图片来源网络,侵删第一步镜头获取图像后的一系列的动作都是由计算机完成,其中数据量、运算力和算法模型是决定CV最终输出结果速度、准确率等的关键因素;这三者也是各CV公司之间竞争的核心。之后会发文分享CV细节。