(1)未来
咱们想想未来。
未来的企业应用特征是:社会化商业、网络连接、数据智能
未来的信息化场景是:企业互联网-产业互联网-社会化商业
未来的信息化产品体系是:产业互联网云服务、中台与平台、企业级云ERP
未来的数字化场景是:智能零售、智能仓储物流运输、智能车间、智能办公、智能城市
未来的数字化产品体系是:智能硬件芯片、智能OS、IoT物联网接入平台、可视屏音箱助手
未来的中台与平台:
1、网络连接:互联网服务连接平台、物联网连接平台、SaaS服务连接平台、ERP集成平台
2、数据:数据中台、大数据技术平台
3、智能:人工智能技术平台、人工智能应用中台
未来的技术栈是:
用户交互层:传感器、人工智能视觉识别/语音交互
逻辑层:Open API Mesh、人工智能关联推荐算法
数据层:人工智能精准搜索/关系图谱、区块链
未来商业模式:
1、IT服务:云订阅服务、智能硬件
2、金融服务:大数据+AI驱动的金融信贷服务、大数据+AI驱动的金融科技服务(聚合支付服务、反欺诈服务、信用服务、实时风控服务)
3、业务服务:大数据+AI驱动的:社会化财税自动化服务、社会化用工调度服务、社会化营销数字化服务、社会化供应链资源调度服务
看,从客户需求,到产品,到技术,到商业模式,全不一样了。面对未来,不管是中国BAT互联网公司,还是中国企业软件公司,还是国外的企业软件巨头公司,还是实业企业的科技公司,大家全都同一个起跑线,全都懵逼探索,就看谁从研究、战略合作、资本融资与投资并购、组织与人才、激励多方组合,谁能做到:选准、做对、跑得快,谁就能赢得未来。
(2)筑底
人工智能专业发展了60年,一共折翼两次。一次是刚刚发展起来,想通用解决问题,太乐观,当然折翼。一次是90年代,吸收了第一次的经验教训不搞通用了,专门做细分专业领域的专业系统,但太依赖专业领域知识加工,还是没法做成商业。
如何不强依赖专业领域知识呢?嘿嘿嘿,这就是这一次的发力重点:深度学习。这会对上层视觉识别、语音交互、自然语言处理三大应用领域都有加持助推效能。
而在深度学习领域,Google收购的英国DeepMind公司在这块有两个重大突破:神经网络(质量)、TransFormer(性能)。所以,各种CNN(卷积神经网络)、MTCNN(多任务卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)、ResNet(深度残差网络)、LSTM(时间序列长短期记忆网络)、GAN(生成式对抗网络)。
模型改进:如大规模无监督模型GPT-2,并且结合了Attention机制,颇适合图像生成质量优化。
算法改进:如BERT算法,颇适合NLP训练质量优化。
当然,这些网络结构、算法、模型、机制都已经被开源成深度学习平台,这让高深的人工智能走入普通IT公司:
1、Google:Tensorflow/Koras
2、Facebook:Caffe/Pytorch
3、微软:CNTK/DMTK
4、AWS:MXNet
5、OpenAI:Open AI(目前尚无完全开源)
6、Apache:OpenNLP
7、百度:PaddlePaddle
8、Salesforce:TransmogrifAI
除了在算法模型平台层有开源外,在其他几个方面也凑在了一起:
1、算力芯片层:英伟达借助区块链比特币大风发展起来专用芯片GPU,也可用于人工智能。Google发布了TPU。
2、算力资源层:AWS、Azure云计算厂商都提供了人工智能训练所需的IaaS服务,正好适合人工智能训练这种波峰波谷的工作。
3、数据存储层:AWS、Azure云计算厂商都提供了云分布式对象存储服务、大数据存储平台、大数据计算平台
4、数据集层:4G、智能手机/高清摄像头、照片相册云盘这三样的普及,让图像数据积累快速膨胀。
所以说,这是学术界(算法模型)、工程界(开源)、云计算、智能手机移动互联网四者叠加的效果。所以,为啥这次学术界的人纷纷加入产业界,就是因为这个原因,没有数据没有算力没有应用场景,就没法改进算法模型。
(3)开源
开源是个好东西。
我这里就是列了一些通用的、大面的。至于更详细的,大家可以看:paperswithcode这个网站,浩如烟海的论文和代码,你想要的都在这里。
一、视觉
1、OpenCV(Intel)、DeepDream(Google)
2、人脸识别:InSightFace
3、物体检测:Detectron(Facebook)
二、语音
1、语音到文字:wav2Letter(Facebook)
2、语音识别:kaldi(约翰霍普金斯大)
3、文字到语音:VoiceLoop(Facebook)、Merlin(英国爱丁堡大学)
三、NLP
1、搜索:Apache的Nutch、Luence、ElasticSearch
2、关联推荐:PredictionIO(Salesforce)、关联推荐算法库LibRec(中国东北大学)
3、对话系统:如DeepPavlov(莫斯科物理学院)、ParlAI(Facebook)、Texar(卡耐基梅隆大学)
4、通用NLP:Pytext(Facebook)、OpenNLP(Apache)、Spacy、AllenNLP、NLTK(宾夕法尼亚大学)、CoreNLP(斯坦福大学)、HaNLP(中国哈工大)、FastNLP(中国复旦大学)
四、深度学习
1、深度学习:Tensorflow/Koras(Google)、Coffe/Pytorch(Facebook)、微软CNTK/DMTK、AWS的MXNet、百度的PaddlePaddle。Salesforce还针对Tensorflow出了一套简化封装的流水线TransmogrifAI
2、增强学习:Dopamine(Google)
五、机器学习/数据挖掘
1、算法库:Spark MLlib、Numpy、Pandas
(4)鸿沟
最早我们写应用,是UI、逻辑、数据一体化,如DBaseIII。
后来出现了大型关系数据库,我们才有了C/S结构,数据和应用分离。这是VB、PB、Delphi的辉煌时期。
后来又有了组件、容器中间件,所以我们才有了三层结构:UI层、业务逻辑层、数据层三者物理分离,而且三个层使用的技术也都不一样。尤其是出现了多端的时候,万金油程序员终于顶不住了,开始分离出专门的前端程序员(Web/移动App/小程序)。在数据层也是对象存储、SQL、NOSQL、数据仓库、大数据计算平台各种技术组合,就出现了数据层的专门程序员。反而业务逻辑层的技术变化并不大,编程语言也基本就是JAVA了。
但人工智能的出现,让业务逻辑层开始发生翻天覆地变化。如何让新技术从研究到研发逐环节培育转移?如何让新技术从原型到创新产品到核心产品逐层吸收应用?
对于前沿技术,最佳的研发组织分工应该是:
1、战略合作:云计算厂商合作、开源社区界合作、学术界合作。从云计算厂商来看,微软Azure很牛,开源社区Google很牛,学术界看了看香港很牛,港大、香港理工大、香港科技大、香港中文大学、香港城市大学都是榜上有名的。看来布局大湾区很有必要。
2、科学家研究实验室:战略合作、论文阅读理解、技术平台选择、原型算法原型模型原型应用快速突破验证
3、技术平台研发中心:人工智能技术平台正式研发、与科学家研究实验室合作开发技术算法模型、对人工智能应用平台暴露简化后的API
4、应用平台研发中心:开发人工智能应用平台、与应用雅畈中心合作开发应用算法模型、通过Open API平台对外暴露简化后的API
5、应用研发中心:微调节应用模型、调用Open API平台的一个API就直接应用了人工智能能力
6、大客户定制研发中心:微调节应用模型
最佳的研发流程应该是:
第一步:科学家研究实验室(特种部队尖刀连):搭建快而脏的原型,快速技术+应用验证应用价值场景、技术使用性和技术成熟度,然后把成果转移给创新产品研发中心
第二步:创新产品研发中心:创新产品研发中心接到成果,当做最佳实践案例进行产品分析,然后对新技术模块、新产品模块,按照产品管理流程与质量保证进行正式的微服务化设计(如可扩展、可定制、高性能、高可用、可实施、可运维)
第三步:核心产品研发中心:在创新产品商业推广一年后,核心产品研发中心对核心产品进行新技术的吸收与利用,升级核心产品