Oneflow深度学习框架训练加速:提供高频多次、有效的模型训练服务 | 百万人学AI评选

2020 无疑是特殊的一年,而 AI 在开年的这场”战疫“中表现出了惊人的力量。站在“新十年”的起点上,CSDN【百万人学AI】评选活动正式启动。本届评选活动在前两届的基础上再度升级,设立了「AI优秀案例奖Top 30」、「AI新锐公司奖Top 10」、「AI开源贡献奖Top 5」三大奖项。我们相信,榜样的力量将成为促进AI行业不断发展的重要基石,而CSDN将与这些榜样一起,助力AI时代的”新基建“。

活动官网:https://bss.csdn.net/m/topic/ai_selection/index

申报地址:http://csdnprogrammer.mikecrm.com/WpA03hJ

一、公司简介

北京一流科技有限公司是一家提供深度学习整体解决方案的科技创新公司。公司创立于2017年1月,拥有业界领先且完全自主知识产权的分布式深度学习框架OneFlow,并具备提供一站式人工智能综合解决方案的能力,已服务于金融、安防、政务、云计算、互联网、AI芯片等诸多行业客户。公司自成立以来,已经递交人工智能操作系统及云计算相关核心发明专利申请数十项,并连续完成由快手、九合创投等国内知名投资机构的数千万级风险投资。
深度学习框架素有人工智能操作系统之称,决定了人工智能算法和应用的技术高度。OneFlow深度学习框架是世界首个且唯一一个专为深度学习打造的异构分布式流式系统,独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,完美地解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战,技术水平世界领先。基于OneFlow深度学习框架及其衍生产品(包括一站式机器学习平台OneBrain、模型训练服务TaaS、AI软硬件一体化协同方案等),一流科技能够为客户快速搭建一站式、高性能、低成本深度学习平台乃至人工智能综合解决方案,让人工智能强大且简单。
创始人袁进辉博士,毕业于清华大学计算机系,师从清华大学人工智能研究院院长、中国人工智能学界泰斗张钹院士。研究方向为计算机视觉及机器学习,是清华大学优秀博士学位论文奖获得者、微软亚洲研究院院长特别奖获得者(top 1%),曾多次在IEEE、ACM、International Conference on World Wide Web等国外核心期刊和顶级会议上发表重要论文,主持及参与过多项国家自然科学基金项目。公司于2017年5月、2019年4月和2019年10月分别完成三轮共计数千万元的股权融资。公司主导产品为OneFlow。

 

二、案例详情

产品详情

1) OneFlow新一代深度学习框架。为客户提供端到端的完全自主知识产权深度学习框架,为用户提供包括模型训练、模型预测、模型部署、端侧推理等的全栈工具;市场和客户主要包括所有人工智能相关企业,尤其是大规模大数据大模型需求的头部互联网公司,以及党政军全自主可控AI产业链。
2)OneBrain一站式机器学习平台。涵盖数据集处理和管理、模型全生命周期管理、用户管理、可视化管理等全工具产业链;市场和客户主要包括大数据企业向人工智能企业升级迭代用户,尤其在金融、电网、电信、政务云等行业及政府、高校及科研院所等机构单位。
3)TaaS模型库及模型训练服务。帮助用户完成模型的构建、预测、训练、调优、部署等工作,使得用户脱离于对模型本身的依赖性;该服务的市场面向各大云PaaS厂商的下游客户,这些客户一般AI能力不强、开箱即用需求量大、有数据积累、愿意托付第三方完成模型训练工作。
4)软硬件一体化协同方案。通过协同人工智能芯片设计厂商将深度学习框架直接植入人工智能底层硬件以构建人工智能基础软硬件一体化的解决方案,主要面向人工智能芯片设计企业,尤其是国内自主研发的AI芯片企业,涵盖NPU、ASIC、GPU、FPGA等诸多架构和供应商。

 

技术研发投入

成立三年来,研发投入占公司总支出百分之90以上,研发员工数量占公司全部的百分之95以上。据统计,一流科技现有核心框架研发团队规模已经占据了国内顶级框架研发人员的1/3之多。一流科技是唯一把深度学习框架研发作为核心使命的公司,全体研发人员自公司成立到现在一直专注于在核心框架的技术创新,心无旁骛笃定前行。公司未来仍将以研发核心技术为公司第一战略目标,进一步增加研发支出。

 

三、典型应用场景

Bert-Large模型包含3.4亿参数,用16个TPUV3需要训练96个小时,训练成本约为10.6万。如果使用GPU集群则需要20天左右,训练成本高达31.7万。通过使用一流科技自研的OneFlow深度学习框架,利用GPU集群在100个小时之内就能有效的完成了全部训练工作,训练成本降低至6.6万。极大地提升了客户的训练效率,降低了运营成本、管理成本和研发成本。

案例:

  • 国产office为代表产品的某公司,期望利用Bert大模型的有效训练,针对性的提升自身NLP领域的科研能力和实战能力,并在此训练结果的基础上将训练成果预装到集团云PaaS服务商之上,通过云端客群的辐射能力服务更多的上层应用客户,帮客户增强NLP应用领域的准确率和实用性;
  • 另一头部互联网公司,其绝对垄断地位的输入法产品,有大量中文语料的NLP领域训练需求。在应用OneFlow框架之前,其他框架产品对于底层的GPU硬件利用率不高,使得训练收敛时间冗长,增加的训练成本和运营成本,并不能有效的形成训练-部署-应用这一正向闭环。通过OneFlow框架在该公司搜索事业部和语音事业部的大规模使用,大大的提升了公司内部GPU集群的硬件利用率,将以前由几个星期完成的训练工作缩短到几天内完成,该公司的算法工程师得以灵活的根据客户反馈和市场需求情况调整算法模型,进而通过OneFlow框架实现高频多次的有效模型训练。

你可能感兴趣的:(一流科技,OneFlow,paas,深度学习,人工智能)