手机做为每个真实的人的最大的数据生产工具,不管大家如何觉得,每天的行为轨迹就是会生产大量的个人数据;仔细看自己手机的隐私协议和各种功能的设置项,大家就会发现开发者/厂商已经做了非常多的行为预测功能;你的家,公司,下一个出发地,你想要分享什么给谁,又或者下一秒你会打开什么APP;数据的收集和分析也远远不止是线上渠道了(所谓数字世界向物理世界的扩展以及物理世界在数字世界的重塑);
从去年换工作开始接触情景感知;端侧智能和服务找人项目从0到1成立、上线和迭代,但在用户场景的挖掘上总觉得乏力;对于未来生活场景,服务找人的概念终端厂商提,支付宝数字化平台转型又提,但技术究竟可以帮一般的用户解决什么切实的问题是需要切实思考的事情;其实也又回到了数据行业的老问题,作为当前技术应用的生产资料,数据采集回来了,怎么用,能带来什么价值?
最近看了几家业界端侧智能/传感器数据分析公司的产品,mark一下;整体看来端侧情景感知的应用场景更多的还是在通过细分场景提升用户特定场景下的体验;
01.ANAGOG
“重塑现实世界的个性化”
https://www.anagog.com/
以色列的一家专门做手机端侧用户行为分析的公司,以停车应用起家,现在转型定位是边缘AI的领导者,主要是通过端侧用户行为分析预测为B端企业提供解决方案;(用户的利益点可能有更精准的服务获取,但本质还是通过B端行业实现商业价值)
关键词:边缘AI解决方案、超个性化(比互联网提的个性化更个性化。。)、严格隐私(苹果都拿隐私功能出来卖钱了,但是隐私的真正落地还是要依靠体系标准和法规的限定,要不然反正我不信。。);
领英介绍2010年成立,目前处于C轮,1000w美元融资,保时捷专门的数字化子公司和整车代表企业戴姆勒、斯柯达都有入股/参与投资;业务也开始了新一轮扩展,如果顺利,借用传感器数据分析的技术能力获得全球n款手机型号的用户数据后,再借用用户画像,数据的商业价值将放大;(JedAI SDK已集成到全球约100个应用程序中,并已被全球范围内的2500万部智能手机下载)
anagog刚开始一直专注停车应用,通过使用手机采集的各种传感器信号,帮助车厂更了解客户的消费需求;传统的车的整个销售渠道链条里,经销商会比整车厂掌握更丰富的线下的客户数据;ANAGOG通过线下用户触点,可以支持整车厂对消费者的理解能力,比如用户的实时状态和实时位置,散步、接近车辆or停车偏好等,可以应用在诸如停车服务,车的运营管理以及一些其他新的商业模式设计上;
而现在的ANAGOG的首页已经写上了 彻底改变您了解您的用户的方式,除了出行,解决方案也已经扩展到了银行、零售、广告和电信行业;作为用户画像从业经历不满一年半的PM来看,这种更实时,更丰富的用户数据及预测,在获客/挽回成本不断提高,商家在用户粘性上思考更多的时代,是可以成为CRM的重要资源的;但目前除了出行,其他的解决方案没有看到具体的服务内容,更多是数据洞察分析;
总结了下ANAGOG官网对解决方案的介绍:
jedAI:ANAGOG端侧AI引擎产品
02.Audio Analytic
“绘制世界的声音地图”
https://www.audioanalytic.com/about/
苹果的IOS 14里更新了一个新的小功能,声音识别,可以识别用户的环境声;具体位置在辅助功能-声音识别,目前支持警报器、动物、住家、人物等四种类型14种声音类型的识别;
介绍是“iphone会持续听某些声音,并使用设备端智能技术在可能识别到声音时通知您”;测试了下,感觉端侧智能的功耗问题并没有完全解决(不知道是不是心理因素);可以设想,接下来这种周边环境声音识别应该不止用在辅助功能,很可能很快会和全家智能(家庭自动化)等结合;
同事X说可能供应商是Audio Analytic(但这家官网合作商里没看到在列),就也看了下(不可靠36线消息);也在做感知环境声的公司还有SoundSense、Sensory等;(下次细看Sensory)
B轮,1200w美元;
声音分为语音、音乐和音响(环境音);相比图片,声音的波形叠加、口语等问题很难像图像的分类识别一样去解决;数据标准集的建设也比图像晚,原始声音的获取问题是其中一个原因;
AA聚焦在音响的应用上,业务集中在音频事件和声学场景识别;同时也建设有自己的声音实验室以及团队专门进行原始声音的采集;主要客户面向的是消费电子厂商;应用场景举例:
智能家居中的安全场景(前门场景https://www.audioanalytic.com/sound-recognition-key-front-door-tech/),智能摄像头和门铃等设备使用声音识别功能来进一步增强内部和外部的安全性,并监控家庭成员的健康状况;
车载场景:情境感知能力可以检测驾驶员的注意力,并帮助驾驶员和自动驾驶汽车检测外部的潜在危险。
通过声学场景识别,进行tws耳机的智能降噪;“以机场登机口为例,您来得早,您自己一个人。起初声学环境很平静。但是随着其他乘客的慢慢抵达,音景变得更加混乱。消费者并没有改变他们的地理位置,他们甚至都没有从坐着的地方移动过,但是他们的智能手机或耳机仍然可以适应当时的情况。”
AA也对声场进行了四种分类;(https://www.audioanalytic.com/acoustic-scene-technology/);AA的产品:商业化音频数据标注平台Alexandria+训练平台AuditoryNET+嵌入式ai3
智能家居,智能车载,智能音箱,tws耳机等等等等还有待成本降低和市场下沉,特别是国内三四线用户对这些目前的感知基本可以忽略,有待用户习惯的培养。。。对于Audio Analytic的商业价值更看好是依托于声音采集的Alexandria平台,毕竟在音频领域,真实声音的采集和标注才是壁垒吧(瞎猜的