深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
说到深度学习,你可能很难理解。但举个例子估计你就能明白,家里的水管坏了,上淘宝买了一根,然后几乎每天都会收到淘宝推送的水管信息……相信有这样经历的人不在少数。其实这就属于深度学习所要解决问题的范畴,但从当前的情况来看,这一问题无疑还没很好的得到处理。
毫无疑问,深度学习正在潜移默化地改变着我们的生活方式,而背后支撑深度学习的GPU计算也正变得越来越普及。在日前召开的NVIDIA GTC 2016(2016 NVIDIA GPU技术大会)上,作为国内最大的自营电商平台,京东也分享了其在深度学习领域的研究、应用。
依托庞大的数据量,京东正围绕其主要的业务方向,包括电商、金融和云,进行相关的数据分析、深度学习,最终体现在应用中,涵盖商品推荐、JIMI机器人、精准广告、物流仓储等各个环节,京东集团首席技术顾问翁志在接受采访时介绍说。他表示,在深度学习方面,京东确实做了不少工作,也取得了一定的进展,不过他也坦言,要真正实现智能还有很长一段路要走。
比如就开篇提到的商品推荐问题,翁志就讲到,目前在这方面京东还是有很大提升空间的,而他们也在努力提升这方面的能力。同时他也指出,这其中的难度还是很大,比如即便京东在数据质量(包括数据类型、数据准确性等)方面是同行中算是出类拔萃的,但是由于平台每天都有大量新的数据产生,再加上这些新数据的准确性又没办法准确评估,非常容易导致最终的分析结果出现偏差。
从中可以看出这其中既有技术层面的问题,也有数据质量方面的不足,而且这不是京东一家面临的问题,几乎是全行业所要面对的。一方面需要继续增强计算能力(因为机器需要学习的内容太多、需要的计算量太大,所以只有并行计算这种方式才能满足,而GPU就是并行计算的典型代表,而这也是为什么NVIDIA大谈特谈深度学习的一个主要因素)。另一方面,企业则要在数据质量方面多下功夫。前者由像NVIDIA这样的技术平台主导,而后者则需要相关企业多把关,当然这其中也涉及到技术能力,毕竟靠人力审核的时代已经过去了。
所以说简单点,要提升人工智能的水平,关键之处还是在于计算能力、GPU技术水平的提升。而就在本次GTC上,NVIDIA也发布了全新的下一代GPU计算加速卡Tesla P100。在主题演讲中,黄仁勋用“奇迹MIRACLES)”来形容Tesla P100带来的改变,全新的Pascal架构、16nm制程、HBM2显存架构(提供高达720GB/s的超高带宽)、支持NVLink技术和全新的AI算法,支持高达21.2 Teraflops的峰值FP 16运算性能。
除此之外,针对深度学习领域,NVIDIA还重磅发布了全球第一款基于Tesla P100打造的面向深度学习的专用设备——DGX-1。相比传统的双路至强平台,DGX-1在性能上提升了近60倍,节点带宽提升了10倍以上,训练时间缩短75倍。根据NVIDIA针对13.3亿照片进行训练的测试结果显示,相比去年发布的Maxwell产品在性能提升上达到了12倍。
短短一年时间,提升了12倍,这样的结果几乎是不可想象的。翁志对此也表现出了很强的兴趣。他说,尽管短时间内他们还不会考虑采购DGX-1,但在某些特定需求上,比如大量数据的集中处理分析,DGX-1是非常有优势的。据翁志介绍,京东用于深度学习线下模型训练的GPU卡在1k~2k之间,应该说这是一个不小的量(此前在采访科大讯飞时,他们透露的数据是几百块),未来这一体量还可能继续增加,毕竟距离真正的智能还比较远。
毫无疑问,以深度学习为代表的高性能计算领域近年来确实受到了越来越多人的关注。不可否认,他们所做的事情正在使我们的生活变得更美好,但是同样的他们还在面临技术上存在的一些挑战。可以预见的是包括NVIDIA,以及围绕在其周边的产业伙伴正在针对性的做一些解决方案,以应用为主的一方则在考虑如何更好地优化、提升。随着双方的不断精进,未来像AlphaGo战胜李世石的事情会越来越多,那时我们或许考虑的将不再是语音识别、图片搜索、无人驾驶等改善生活方式的,而是人工智能到底是不是我们所想要的?
西安坤隆计算机科技有限公司图灵超算工作站GX620M是一款配置双Xeon可扩展处理器和最高6/9块GPU超算卡、海量存储于一体、基于办公静音环境、具有强大CPU+GPU混合计算模式的超级计算机系统。
和市面上常规工作站硬件架构相比,显著特点:
n 支持2颗最新Xeon Schalable(可扩展处理器),最大56核,支持AVX512指令集。
n 提供超级强大的计算能力,最大6/9个GPU卡。
n 配备基于PCIe总线的海量高速并行存储(最大容量180TB),延迟低,支持最大15个并行读,硬盘io性能 大幅提升,性能和管理远超传统的DAS/NAS存储系统。
n 完全处于办公环境(静音级)、不在被噪音所困扰。
n 不需要专门的机房,不占过多空间,维护成本极低。
n 不需要作业调度系统,管理难度大幅降低。
典型应用领域
为行业软件和计算规模,量身定制出高性能、高可靠计算硬件架构,再加上独有专业级硬件系统优化,和同等配置其他品牌机器相比,让软件计算速度再提升10%~10000%,一款完美、高效能的专业级图形工作站。
计算类
l 科学计算、数值模拟、数学规划 Matlab、Mathematica、Octave、Gurobi…
l 结构、流体、热分析、多物理场耦合 Ansys、Abaqus、Nastran、LS-Dyna、Fluent、STAR CCM+、COMSOL Multiphysics...
l 电磁场仿真 HFSS、CST Studio Suit、Feko、安捷伦…
l 电子系统设计与仿真(EDA) HSPICE、…
l 电力系统仿真 PSASP、Siemens PSS/E、ETAP、EMTP-RV、RSCAD、PSCAD
l 油藏模拟、地震资料解释 Eclips、Nexus、Paradigm GeoDepth
l 量子化学、分子动力模拟 Gaussian、Lammps、Amber、NAMD、Docks、
l 材料模拟 Material Studio
l 光学设计与仿真 CodeV、Zemax、Lightools、OptiWave
l 金融计算 KX、Wombat
l 人工智能、深度学习、机器学习 Tensorflow,Torch,Café,Nvidia DIGITS
l 大数据挖掘分析 Hadhoop
设计类
l 有限元分析前后处理 ICEM CFD、HyperMesh、ANSA、Femap
l 三维机械CAD/CAM Catia、 UG、Creo、Solidworks
l 三维建筑、基础设施可视化设计 Revit、ArchiCAD、Microstion、
l 三维测量、点云处理、逆向工程
l 电力设计AutoCAD Electrical、Microstation V8、PDMS、PKPM、Protel、Aveva E3D
图像类
l 数字摄影测量ErDAS、PCI Geomatica
l 倾斜摄影三维建模 Smart3D、Pix4D
l 地理信息系统ArcGIS,MAPinfo
l 医学成像 ViTAL、Mimics
l 工业CT实时图像重建VGStudio Max
l 气象资料处理 WRF、MM5
l 视频采集与结构化分析
虚拟显示、视景仿真、三维可视化类
l 虚拟现实、视景仿真VegaPrime、3DVIA、OpenGVS
l 三维建筑可视化 Lumion、SketchUp、Navisworks
l 大屏幕拼接合成
l 三维数据可视化(石油、医学、海洋…) Geoprobe、OpenInventor、VTK、Avizo
l 多路实时视景仿真
数字内容创作类
l 三维建模/动画设计 3DS Max、Maya、Photoshop、Sketchup、Lumion
l 视频剪辑Premiere Pro、Mdeia Composer、FCP 、Edius、Vegas
l 特效合成After Effects、Nuke X、Fustion Studio、Flame
l 渲染3DSmax、Maya
l 调色 DaVinci Resolve、Speed Grade、Lustre
私有云、虚拟、共享图形服务器
l 共享式图形设计服务器
l 共享式CPU计算服务器
l 共享式CPU+GPU超算服务器
共享式高io并行存储服务器