您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 总结/报告 > 2017年上半年度视频内容识别行业浅析
2017年年上半年年度像素的世界已经延伸到图像以外,虽然视频对于机器器学习研究⼈人员来说⼀一直都是个挑战,但现在的技术能够使得从视频中提取信息变得跟从图像中提取信息⼀一样简单。⼈人⼯工智能这个新兴“⼯工具”的出现,为⼈人类加速前往⾼高度智慧化形态提供能量量,重构着整个视频⾏行行业的结构和协作⽅方式。这份分析报告并⾮非针对⼈人⼯工智能领域全局观,解构视频⾏行行业,围绕国内视频内容识别这⼀一垂直领域的创业公司展开讨论,从市场、产品、技术、商业模式、⼈人才等多个维度出发,浅析⼈人⼯工智能技术在视频中的发展⽅方向,为⼤大家了了解整个⾏行行业趋势做⼀一点点贡献。前⾔言⽬目录1⼈人⼯工智能概述1.⼈人⼯工智能概述2.计算机视觉发展3.视频内容识别发展背景及现状分析4.典型公司产品对⽐比5.未来趋势预判⼈人⼯工智能概述数据样本累积完成运算速度大幅提升存储技术成熟算法瓶颈突破政策法规推进从1956年年达特茅斯会议上⼈人⼯工智能的诞⽣生开始,到如今⼈人⼯工智能已经发展了了61年年,2017年年能够形成⻛风⼝口,却经历了了⼀一个快速⼜又曲折的转变,以云存储、⼤大数据为代表的技术⾰革命爆发,让深度学习样本量量级得到⼀一个⻜飞跃算法得以施展,⽆无论是硬件还是软件的⻜飞速发展,都是为⼈人⼯工智能技术的持续前进⽴立下不不少功劳。阿⼈人⼯工智能概述下⼀一批投资引爆点智能医疗阿无人驾驶阿智能安防阿文娱社交⼈人⼯工智能已经在全球医疗影像⽅方⾯面取得了了突破进展传统⻋车⼚厂在⽆无⼈人⻋车研发上领先科技公司智能安防成为⼈人⼯工智能产业化第⼀一“着陆场”以服务于直播监测和⼴广告营销为主要发⼒力力⽅方向⽬目录2计算机视觉发展1.⼈人⼯工智能概述2.计算机视觉发展3.视频内容识别发展背景及现状分析4.典型公司产品对⽐比5.未来趋势预判计算机视觉发展GARTNER技术成熟度曲线从成熟度曲线来看,语⾳音更更靠前⼀一点,然后是计算机视觉,特别是安防领域,封闭的场景,有⼀一些孤岛化分布的⼤大量量数据可以⽤用于训练,在这些领域它是有先发优势的。探索期市场启动期发展期应⽤用成熟期市场认可度认知智能虚拟助理理⼯工业机器器⼈人计算机视觉语⾔言计算计算机视觉发展传统算法时代的计算机视觉⼤大致可以分为以下4个步骤:图像预处理理、特征提取、特征筛选、推理理预测与识别。需要⼤大量量的经验,需要你对这个领域和数据特别了了解,然后设计出来特征还需要⼤大量量的调试⼯工作。深度学习时代的计算机视觉效果远超传统机器器学习算法⼈人脸识别⽅方⾯面:DeepID算法物体检测⽅方⾯面:RegionCNN算法、FasterR-CNN⽅方法、FACEBOOK提出来的YOLO⽹网络、SingleShotMultiBoxDetector物体跟踪⽅方⾯面:DeepTrack算法算法⽇日趋成熟⽬目录3视频内容识别发展背景及现状分析1.⼈人⼯工智能概述2.计算机视觉发展3.视频内容识别发展背景及现状分析4.典型公司产品对⽐比5.未来趋势预判静态内容识别视频内容识别智能安防智能家居直播监控⼴广告营销⾦金金融服务三位分析搜索⾰革命(以图搜图/电商导购)照⽚片管理理(标签分类检索/美颜特效)技术要求及应⽤用分类应⽤用详情视频内容识别技术⾏行行业分布特点视频内容识别技术因为⻔门槛⽐比较⾼高,⽬目前在这个领域内做得⽐比较好的技术公司⽐比较少,我们对其作了了⼀一个统⼀一的整理理,⼀一共24家,分别从事⼴广告营销、游戏、企业服务、医疗健康、⾦金金融、娱乐、电⼦子商务等领域。视频内容识别融资规模融资阶段主要集中于A轮,天使轮、B轮、C轮、IPO的公司数量量⽐比较平均,整个⾏行行业处于稳步上升中。根据新浪微博年年报显示,短视频播放量量同⽐比增⻓长了了700%以上,搜索视频内容,并进⾏行行审查和归类等将是许多媒体公司和平台公司必做的功课,可以极⼤大的降低⼈人⼒力力成本。因此专注于⽂文娱类的公司数量量遥遥领先,其中以服务于直播监测和⼴广告营销为主要发⼒力力⽅方向。*所有数据根据IT桔⼦子公开资料料整理理⽂文娱(46%)安防(25%)电⼦子商务(8%)企业服务(13%)智能家居(4%)智能消费(4%)⽬目录4同质化公司产品对⽐比1.⼈人⼯工智能概述2.计算机视觉发展3.视频内容识别发展背景及现状分析4.典型公司产品对⽐比5.未来趋势预判2012年年成⽴立于北北京2012年年8⽉月获得天使轮数百万⼈人⺠民币2013年年7⽉月获得A轮数百万美元2013年年底开始,先后在世界昀权威的⼈人脸检测(FDDB评测)、⼈人脸关键点定位(300-W评测),和⼈人脸识别(LFW评测)获得三个世界第⼀一。2015年年5⽉月获得B轮2500万美元2016年年11⽉月获得B+轮2000万美元2016年年12⽉月获得C轮1亿美元·⼤大事件·估值:最⾼高估值20亿美元视频内容识别典型分析·核⼼心⼈人才·核⼼心⼈人才-⾸首席科学家——孙剑微软亚洲研究院⾸首席研究员,带领的团队于2015年年获得图像识别国际⼤大赛五项冠军(ImageNet分类,检测和定位,MSCOCO检测和分割);2016年年7⽉月正式加⼊入旷视(Face++)担任⾸首席科学家。-CTO&联合创始⼈人——唐⽂文斌清华研究⽣生阶段,专注社交挖掘和图像检索,曾获ECMLbeststudentpaperrunner-up和googletopcodertarget。百度百科:唐⽂文斌-CEO——印奇从本科开始在MSRA(微软亚洲研究院)实习加全职⼯工作共四年年时间,研发了了微软当时核⼼心的⼈人脸识别系统,被⼴广泛应⽤用在X-box和Bing等微软产品中。⼈人才⽐比例例公司已经组建了了20⼈人的核⼼心研发团队,汇集了了美国哥伦⽐比亚、英国⽜牛津、⾹香港中⽂文、新加坡南洋理理⼯工等⼀一批出⾊色的机器器视觉研究⼈人才,团队中有6⼈人曾经获得过国际信息学奥林林匹克⾦金金牌。全公司技术⼈人员超80%,开发和科研的⽐比例例⼤大约是2:8左右。视频内容识别典型分析·核⼼心技术·动态⼈人脸识别实现视频流中⼈人脸检测、关键点定位及⼈人脸识别功能的毫秒级响应,使得⼈人脸识别技术可以在实际场景中实现⾮非配合式快速处理理,可⼴广泛应⽤用于地产、安防、交通等领域。Face++提供了了⼈人脸检测、83个关键点检测与跟踪、⼈人脸分析、1:1⼈人脸⽐比对或1:N⼈人脸搜索的能⼒力力,它普遍适⽤用于图⽚片与实时视频流,能够应对复杂的光照并⽀支持多种⼈人脸姿态。可检出不不⼩小于16*16像素的⼈人脸,并可在移动设备上实时跟踪⼈人脸(20帧/秒)。开发者在此基础上做进⼀一步开发,即可轻松实现美颜、⾯面部贴图、身份验证、任务识别、照⽚片聚类等功能。01/证件识别02/识别证件中的关键字段内容,并⽀支持证件版本判断、图⽚片质量量检测和真实性判断。提供身份证、驾照和⾏行行驶证识别。⽬目前已被⽀支付宝、中信银⾏行行等300多家⾦金金融机构使⽤用。身份证识别可识别⼆二代身份证上正反⾯面的⽂文字,并区分出临时身份证、复印件、屏幕翻拍或后期合成图⽚片。同时提供身份证照⽚片质量量检测,提前判断是否存在残缺、光斑暗影、⻆角度过⼤大等问题,提⾼高识别准确度。利利⽤用Face++的OCR技术,开发者的产品可以识别出身份证、驾照、⾏行行驶证上的⽂文字,快速采集证件内的⽂文本信息。视频内容识别典型分析·核⼼心技术·图像识别04/利利⽤用Face++的图像识别技术,开发者的产品可以识别出图⽚片中的⽂文字、场景和物体。检测图⽚片中的场景与物体,返回检测出的场景与物体名称,以及相应的置信度。场景检测可以检测出照⽚片中的场景,包括⼭山川湖海海、或是常⻅见的城市设施:电影院、图书馆、医院、体育场、⻋车站等。物体检测可以检测出多达200种物体,包括⻝⾷食物饮料料、蔬菜花卉、猫狗宠物、交通⼯工具、⾬雨雪雷雷电等。⼈人体识别03/通过云、硬件级解决⽅方案,实现对关键点实时标注和变化的检测,完成在线上及线下场景进⾏行行实名验证过程中,对照⽚片攻击、切换攻击、⾯面具攻击、遮挡攻击的防御。检测并定位图⽚片中的⼈人体,返回⾼高精度的⼈人体矩形框坐标。⼈人体检测是对⼈人体进⾏行行分析和处理理的第⼀一步。所有检测出的⼈人体都可以进⼀一步进⾏行行⼈人体属性分析,获取更更完整的⼈人体相关信息。视频内容识别典型分析动态⼈人脸识别01/·前端展示·证件识别02/视频内容识别典型分析⼈人体识别03/·产品展示·图像识别04/视频内容识别典型分析·典型案例例·Face++⼈人脸⽐比对⼈人脸检测/关键点⼈人脸搜索智能房产智能安防⽀支付宝滴滴联想美图秀秀Camera360魔漫相机世纪佳缘朋友印象蚂蚁⾦金金服⼤大楼SOHO3Q2017博鳌亚洲论坛2016G20峰会Face++⼈人⼯工智能云开放平台的API已经服务了了近7万开发者,已被调⽤用62亿次;身份认证平台⽬目前已为1.2亿⼈人(注意不不是1.2亿次)提供了了刷脸服务,覆盖了了85%的⾦金金融市场智能化应⽤用;智慧安防和智能商业产品也覆盖到25个省。视频内容识别典型分析·奖项/榜单·2012年年⿊黑⻢马⼤大赛总决赛冠军福布斯亚洲30位30岁以下年年轻领袖(30under30)(印奇)2013年年底开始,先后在世界昀权威的⼈人脸检测(FDDB评测)、⼈人脸关键点定位(300-W评测),和⼈人脸识别(LFW评测)获得三个世界第⼀一。这意味着在⼈人脸技术三个昀核⼼心的技术模块,Face++都达到了了世界昀⾼高⽔水平。(以⼈人脸识别率0.02%的优势击败社交巨头Facebook摘得桂冠。)⼊入选“2015德勤勤⾼高科技、⾼高成⻓长中国50强”(该榜单是亚太地区最具权威、最客观、最具投资指引价值榜单)2016中国最佳创业服务商(亿欧⽹网主办)2015科博会优秀产品奖(中国国际科普产品展览会)2016年年中国移动⽀支付年年会年年度创新应⽤用奖(⺠民邮电出版社、中国中国通信学会普及教育⼯工作委员会主办)⼊入选“中国最具投资价值企业50强”(清科集团主办的第⼗十四届中国股权投资年年度论坛)⼊入选《2016年年中国独⻆角兽企业发展报告》及“独⻆角兽”企业榜单第17名(中国科技部⽕火炬中⼼心联合⻓长城企业战略略研究所发布)⽬目前旷视的技术团队已经先后获得国际⼈人⼯工智能技术评测冠军10余项,国际及国内信息学竞赛⾦金金牌70余项;视频内容识别典型分析·商业模式分析·旷视科技为⾃自⼰己总结了了⼈人⼯工智能公司的“三段论”:作为⼀一家⼈人⼯工智能公司,⾸首先要有⾃自⼰己的平台,同时选择⼀一个商业落地的⽅方向,昀终快速地实现数据循环——●第⼀一阶段:线上技术服务主要通过企业级技术License来获得收⼊入。(2014年年)●第⼆二阶段:开始研发SmartID(⾃自研发的个⼈人级产品),因为它最通⽤用,且能够打通线上和线下。Face++涉及了了1亿⼈人的刷脸,⽐比较有代表的客户有蚂蚁⾦金金服的⽀支付宝、Uber、中信银⾏行行、万科,万科是我们在线下化的体验,未来会实现⼀一个智能园区。(2016年年)●第三阶段:逐渐深⼊入到智能房产、智能安防以及更更多⼈人⼯工智能领域。Face++本身是⼀一个技术服务平台,所以它的定位是⾯面向开发者和企业级⽤用户。通过搭建这样的平台,积累了了⼈人脸核⼼心技术和⼤大量量的⼈人脸数据,为核⼼心技术引擎的提升提供了了源源不不断的数据基础。通过这样的技术优势,Face++会通过⼀一体化的⼈人脸识别产品在智能监控等领域做产品落地。视频内容识别典型分析2014年年成⽴立于北北京2014年年11⽉月获得A轮数千万美元2016年年12⽉月获得B轮1.2亿美元 2014年年6⽉月,团队成员在LFW准确率达99.15%,⾸首次⼈人脸识别准确率超越⼈人眼2014年年9⽉月,ImageNet2014⼤大规模物体识别竞赛,与微软、Google、百度、⽜牛津、伯克利利等37⽀支科研团队竞赛,取得世界第⼆二,仅次于Google2016年年9⽉月,ImageNet国际计算机视觉挑战赛(ILSVRC)的⼤大规模物体识别竞赛中,商汤科技和港中⽂文团队⼜又⼀一次蝉联视频物体检测冠军。⼀一举揽
本文标题:2017年上半年度视频内容识别行业浅析
链接地址:https://www.777doc.com/doc-1486175 .html