姓名:祝双 学号:16040520067
文章转载自 http://zhidx.com/p/98599.html 智东西(公众号:zhidxcom) 文 | 司北
【嵌牛导读】:新一代全景摄像头惊艳亮相,功能强大
【嵌牛鼻子】:VR,全景摄像
【嵌牛提问】:全景摄像成本问题有何解决方案?
【嵌牛正文】:[
11月3日,第16届中国国际公共安全博览会(简称“安博会”)在深圳举行,来自全球的1100多家厂商在此展示安防技术的各类最新成果。而在一众智能摄像头、人脸识别软件、视频结构化系统中,一台四目全景相机出现在了我们面前。
这台名为DuxCam M1的四目全景相机来自全度影像科技有限公司。为什么一家全景相机公司会出现在安防展会上?在VR与全景相机火爆一时的风潮逐渐消退时,这家年轻的创企究竟是靠什么在成立之初就成功融到了1千万人民币?它又是靠什么赢得了新华社、虎牙直播、甚至部分军工企业的青睐和认可?
(全度影像联合创始人兼CEO陈捷)
带着这些问题,智东西来到了全度影像长沙研发中心,与联合创始人兼CEO陈捷进行了一番深入长谈。在采访中我们发现,比起“全景相机公司”,全度影像的定位其实更符合“机器视觉公司”——除了售卖全景相机外,全度影像还为合作伙伴提供机器视觉软硬件解决方案,包括各种成像系统的搭建、图像智能处理模块、机器视觉算法等。由于技术团队积累了多年的自主ISP技术、计算摄影算法和FPGA开发经验,使得公司在普遍依赖SoC的大市场中拥有另辟蹊径的竞争力。
一、精英人才汇聚,首轮融资千万
全度影像成立于2016年8月,成立之初便获得了来自香港永成集团(原纳斯达克上市公司)1000万的种子轮融资。目前团队规模约为30人,几位核心创始人都有着深厚的技术研发背景,已在计算机视觉领域研究深耕10余年。联合创始人兼CEO陈捷不仅曾经就职于Xilinx、Pixelworks等企业,还在2013年加入国防科技大学任项目技术总监,研究计算摄影、机器视觉等技术。
全度影像公司研发中心设于长沙高新开发区,2016年被作为长沙高新区重大项目引进。据陈捷介绍,深居内陆暂时并没有对全度影像的人才扩展造成太大影响,长沙是为数不多的拥有三所985高校的城市之一,研发团队不仅吸引了来自国防科大、湖大、中南等高校的硕博人才,而且随着“逃离北上广”的风潮渐起,不断有来自华为、TCL、联发科等一线企业的湘籍人才回到长沙发展。此外,全度影像在深圳与香港也都设有分部。
在交谈过程中我们发现,公司上下最为引以为傲的便是研发团队多年来深厚的技术积累与自研能力,目前已申请了45项国家发明专利,预计到2018年年底将在机器视觉领域形成超过百项专利的专利池。
二、明星产品:准专业级全景相机DuxCam
目前全度影像的业务分为两块,一块是围绕DuxCam全景相机的销售与市场合作;另一块则是为合作伙伴提供基于FPGA的机器视觉解决方案,应用在安防、机器人、军工、警务等方面。
(DuxCam M1全景相机)
我们先从DuxCam M1全景相机开始说起。这款四目全景相机在京东上售价将近2万元,重量仅为750g,高度约为一瓶矿泉水的2/3左右,定位为准专业级全景相机,由于采用机内拼接技术,能够直接输出4K分辨率的360度影像,采用可拆卸电池,续航可达到3小时。
全景相机这一产品相信大家已经不算陌生了,那么全度影像的这台相机有什么特别之处呢?陈捷向智东西介绍道,DuxCam M1的特别之处主要在以下两点:
1、机内影像拼接、一键实时预览
同一场景中不同角度图像的缝合拼接一直是全景相机的技术难点之一。所谓四目相机,指的是相机内有四个独立工作的摄像头,不同镜头曝光和白平衡不一致,需要进行后期拼接处理。
普通的消费级全景相机可以实现机内缝合或是手机APP缝合,但是效果普遍一般,不同图像间的分割明显。而售价动辄十几万的专业全景相机需要将影像导出到PC上,配合使用专业的软件进行繁琐的拼接缝合工作。
(DuxCam M1的机内拼接效果)
而DuxCam M1可以实现机内自动缝合,也就是用户什么都不用做,只需要摁下开机,输出的图像就已经是一个缝合好了的全景视频。
此外,配合相应的APP后,这款相机的视频还可以做到一键实时预览。从智东西的现场体验中可以看到,DuxCam M1对于图像缝合难点——天花板的线条拼接的效果非常好,几乎看不出拼接痕迹,而且在iPad里直播画面的延迟也非常小。
2、静音、低功耗
与市面上定位类似的产品相比,DuxCam M1的另一特点就是低功耗。由于DuxCam M1是基于FPGA搭建,整机功耗只有12W,比市面上其他基于GPU搭建的相机功耗要低得多,据了解这类相机功耗普遍高达30多W。低功耗带来的是散热系统压力减小、机器运行时噪声更小、更加静音。
除了低功耗外,纯自研的FPGA技术还给予了全度影像更多的灵活性与可扩展性,这一点后文将会提到。
基于以上轻便、易用、低功耗的几大特点,这款DuxCam M1全景相机的主打应用方向落在了VR视频直播上:它让在意直播画质(能够提供4K影像)、却没有强大的图像处理技术的小型团体或个人拥有一键全景直播的能力——或者用陈捷的话来说,“培养消费者的懒人习惯”。
目前,全度影像已经和虎牙直播等直播平台达成合作,打开APP并连接上相机,输入相应的直播平台地址,就可以实现VR视频网络直播。除了直播平台外,商业活动直播、婚庆全景直播等也是该产品的切入方向。
目前DuxCam M1已经实现量产,今年8月正式发售。特别值得一提的是,首批生产出的相机卖给了新华社等专业客户,已经被用在了近期多个国家重要政治活动、重大会议活动的全景直播上。
三、基于FPGA打造机器视觉解决方案
上文提到的,比起“全景相机”公司,全度影像的定位其实更符合“机器视觉”公司——除了售卖全景相机外,全度影像还为合作伙伴提供基于FPGA的机器视觉解决方案,包括ISP、图像拼接、多摄像机同步等。
在智东西此前的报道中曾经介绍过,FPGA(Field Programmable Gate Array)全称“可编程门阵列”,是作为专用集成电路领域中的一种半定制电路而出现。
与GPU相比,FPGA灵活、可拓展性强、功耗低、而且成本相对低廉;但是由于传统FPGA开发需要使用硬件描述语言(Verilog或VHDL)而不是传统的计算机语言(比如C语言),程序员需要在FPGA公司提供的编译器基础上进行二次开发,造成了开发难度大、开发周期长等问题。
(Xilinx推出的UltraScale架构FPGA芯片)
而全度影像——尤其是全度影像的几位核心创始人,早在国防科技大学期间就有着深厚的FPGA技术积累,CEO陈捷更是曾在FPGA巨头Xilinx公司任职,目前全度的FPGA技术全部为自主研发。
据陈捷介绍,在公司成立之初,市面上并没有合适的ASIC方案可以实现低功耗的机内实时拼接,可选的方案只有GPU和FPGA。一方面,FPGA方案具备种种优势,另一方面,公司的核心创始团队恰好有着十几年的FPGA图像处理技术积累,二者一拍即合。
此外,全度影像还拥有自主专利的ISP算法,能够实现从传感器基础数据采集到图像缝合拼接的全链路自主研发。
这种不依赖外部解决方案的全自主研发,给全度影像带来的优势可不只是灵活、成像效果优秀、成本低这么简单,它开启了全度影像的第二条业务线——为合作伙伴提供基于FPGA的机器视觉解决方案。
目前,全度影像在这一业务的合作伙伴包括安防企业、军工企业、警务执法部门等,而FPGA方案的可扩展性在这些定制化解决方案中得到了充分的体现。
举个例子,一般视频缝合方案中,输入和输出的视频路数都是固定的(比如一个基于ASIC的方案,只能固定输入两路视频、输出一路全景视频,不能增减)但是全度影像的FPGA方案具备灵活的可拓展性,应用在某特种装备上的全景视频缝合项目中,基于全度影像的FPGA方案就能够同时输出多路视频,包括全景视频和根据用户指令的交互视频。
未来,全度影像还将进一步将这些技术的应用场景拓宽到机器人、无人化设备、车载设备、安防等领域。以安防为例,安博会之后,就有不少企业找上门来,希望与全度影像合作定制大场景中的全景安防监控方案。
四、图像定格——“子弹时间”
除了上述的全景相机DuxCam M1和定制化解决方案外,全度影像还会很快发布一款一体化“子弹时间”拍摄系统。全景相机是在一个点向外采集VR图像和视频,而子弹时间系统是从各个角度去采集中心的人和物。
这一技术目前已经被应用在了湖南卫视的不少线下宣传推广活动与线上娱乐节目的拍摄中,易拆装、便携式、低成本的准专业子弹时间产品也很快将推出。
结语:“全景+”市场等风来
随着VR与全景的狂热浪潮逐渐冷却,无论是消费者还是公司都能以一种更加理性的眼光去看待市场。在这样的背景下获得融资成长的创业企业,能够更务实、更稳健地进行发展。
对于全度影像而言,在机器视觉领域多年的技术积累、以及FPGA方案所带来的灵活性、可拓展性、低功耗性能等方面优势也使得它在目前同类产品中拥有一定的竞争力。不过,目前全景相机市场仍旧方兴未艾,“全景+”市场尚未完全打开,还需进一步发掘各类应用场景,并在不断试错中确立最终发展方向。而随着企业的进一步发展壮大,如何以长沙为大本营,辐射北上广深的人才、资源、以及市场客户,也是全度影像需要进一步努力的方向。