工业缺陷检测是工业届非常重要且不可或缺的一项任务,由于工业场景异常缺陷多种多样,传统的机器视觉算法很难实现对缺陷特征完整的建模和迁移,算法复用相对困难,同时要求区分工况,从而造成大量的人力成本的浪费。这个时候,基于计算机视觉的人工智能技术就可以发挥相应的作用——替代或者辅助人员做产品的质检,实现无人化、高速、高精度异常检测的任务。
基于TCL在智能制造上缺陷检测的成功经验,TCL集团工业研究院工业视觉检测团队联合鹏城实验室和启智社区,共同推出并开源了行业内第一个工业视觉无监督异常检测框架——“READ(Reconstruction or Embedding based Anomaly Detection)”,以下简称为“READ”。
READ框架集合了丰富的无监督学习异常检测的前沿算法,算法精确度高、方便易用、部署快捷。同时,READ框架还支持PyTorch和华为MindSpore框架,可以适应不同需求的开发者。
2021年3月,READ项目通过启智社区技术委员会的评审,正式进入启智社区孵化管道;5月,READ项目代码上传至启智社区平台;7月,启智社区开始对READ项目提供算力支持,以便其模型开发训练。目前,READ框架的训练代码、模型已同步在OpenI 启智社区全部开源开放,下载量达1000+,点赞量近2000,欢迎大家访问源代码仓库:
PyTorch版本:OpenI/READ_pytorch: 基于TCL在智能制造上缺陷检测的成功经验,TCL集团工业研究院开源了第一个工业视觉无监督异常检测框架,具有算法丰富、开箱即用、精度保证等特点。 - READ_pytorch - OpenI
MindSpore版本:OpenI/READ_mindspore: 基于TCL在智能制造上缺陷检测的成功经验,TCL集团工业研究院开源了第一个工业视觉无监督异常检测框架,具有算法丰富、开箱即用、精度保证等特点。 - READ_mindspore - OpenI
TCL工业研究院团队对READ项目的介绍及未来期望
READ项目介绍
在智能制造领域中,由于缺少异常样本,有监督方法的缺陷检测使用场景非常受限。因此,如何利用无监督方法对海量图片数据进行缺陷检测,是s工业视觉团队在AI智能工业视觉领域探索的重要方向。此次,TCL工业研究院工业视觉检测团队联合鹏城实验室和启智社区,在基于工业视觉的无监督学习和人工智能平台化技术的研究中,涵盖了自监督学习,小样本学习和迁移学习,可解释人工智能技术,在TCL研究院ADC自动缺陷检测项目的成功实践上,研发了标准化平台化的框架。
Read项目,作为第一个工业视觉无监督异常检测框架,目前已经集成了许多前沿的优秀的无监督异常检测算法,主要应用于工业生产中,对各种产品进行品质监控以及筛选有缺陷的产品。
结合我们在TCL智能制造缺陷检测发现的短板,传统机器学习算法更倾向于直接从数据集中让机器去学习一些东西,并直接用参数的方式表示出来。在缺陷检测方面,虽然我们也同样用自动标签的方式去检测是否异常,但我们尝试使用无缺陷的图像进行模型的训练,用无监督算法模型研发出一整套READ框架,达到不需要耗费大量人力和财力就能够满足工业需求的效果。
缺陷检测的无监督方法,主要包含:基于图像空间重构的方法,和基于特征嵌入的特征空间学习的方法等。上述的两个类别的算法在我们的框架中都分别有代表性的算法实现。框架里包含无监督缺陷领域的8种实现方法,并且还在不断更新和扩充。
考虑到使用的开发便利性和框架架构的简洁性,我们使用一个统一的架构将全部的算法串接起来,并将代码模块化,同时使用简单通用的接口来调用使用者需求的算法模型,以便更易调用和阅读。
在精度层面,我们选取的算法是业绩最近领先的算法,实现的精度与原作的精度一致。
因此我们开发的READ框架具有的主要优势有三点:算法丰富、开箱即用、精度保证。READ同时支持PyTorch和MindSpore框架的算法训练,适应了不同开发者的多种部署需求,在追求快速落地的同时又满足部分开发者将模型迁移至国产框架上。
目前工业缺陷检测存在如下主要问题:
Read项目是工业视觉无监督异常检测框架,主要针对工业生产中的各种产品进行品质监控,筛选有缺陷的产品。换言之,READ项目是TCL 工业研究院着眼于现实工业界异常(缺陷)检测的痛点问题而提出的一个标准化平台化的解决方案。作为首个工业视觉无监督异常检测框架,READ框架不仅提高了缺陷检测的精度、降低了数据采集的难度和成本、还大大缩减了算法的开发周期。
我们提供高质量的算法实现,可以有效地缩短科研路径,加速算法的创新;同时基于我们的READ框架,可以大幅降低算法的落地难度,加速AI在工业视觉领域的项目落地与产品研发。我们希望READ项目可以带动工业视觉领域从较为封闭走向开源繁荣,推进产学研的深度融合。
我们欢迎更多开发者向我们提交更多更优秀的算法不断充实完善算法库,共同促进AI开源开放生态体系建设。我们期待构建一个这样的标准化平台化的框架促进人工智能在各个领域的开源开放协同创新,推动人工智能产业健康快速发展及其在社会经济各领域的广泛应用。
下一步我们会继续探索相关的算法,以实现更多效果和更好的工业视觉缺陷检测领域的算法,并复现开源到我们的READ上面去,两个版本的框架算法都会进行不断的更新完善,以便为广大的同行开发者服务。
同时,我们希望能与更多企业有更深一步的合作,互利共赢。对于启智社区,我们也很荣幸与这样的开源平台合作,让我们的框架开源并受到业界关注。也非常感谢鹏城实验室为我们提供的算力资源和设备支撑,让我们可以根据不同的底层框架设计不同的开发模式,使得算法效率更高,鲁棒性更强,望日后能共同推动双方的产品在业界里生根发芽。
再往后的一步,我们希望我们的算法在三个平台都能有更全面的发展,不仅能帮助工业界更多的企业,在教学平台这块,也能够和更多高校和教育机构深度合作,为其提供更多最新且优质的算法使更多学者了解这个领域,深入研究及从事工业视觉检测领域,更进一步推动产业落地;同时,为科研工作者提供完善的科研平台,让他们花更少的时间和精力,通过使用我们的框架,来孕育出更多在工业视觉缺陷检测领域具有突破性的创新。
我们的理想是“为推动全人类工业制造4.0智能化发展而贡献力量”。
TCL的设想也是所有项目企业的设想,而启智社区一直也在致力于通过为项目方与其他企业/机构搭建合作平台,提供计算资源、支撑对接技术以及生态资源共享,以促进三方的共赢发展。
TCL工业研究院在框架的选择上认为国产的框架相对业界主流的国外研发的框架更加稳妥。一方面,出于对READ项目的长远战略目光和公司利益点考虑,以及对国际形势不稳定的顾虑,希望基于自己民族企业开发的框架上面开源READ项目。而华为是可信任的民族品牌,作为制造业民族品牌的TCL也希望华为开发的昇思MindSpore的AI框架能够在国内外企业间遍布通用,使中国的产业能在未来推广至全世界。
另一方面,启智社区平台为TCL提供了与华为合作的契机。自READ项目在启智社区通过立项并进行成功开源后,启智社区联合TCL开展更加深入的合作,基于社区已有的软硬件设施及生态资源,为READ项目提供鹏城实验室的云脑计算资源、华为的昇腾设备和昇思MindSpore框架,以便对READ进行更进一步的开发工作。
最终TCL选择开发一套基于昇思MindSpore框架的开源项目,使华为、TCL和启智社区三方都能够从中获得更大的利益,共同保障我国在全球制造业智能化转型上的领先地位。
对我个人而言,很开心能参与到READ项目进行开发工作,在这期间,我学习和成长了很多。工业无监督领域本身是有趣并且非常有工业落地价值的课题,我们复现很多算法,这让我们学习了很多有趣的算法模型,也同步提升了我们的代码能力。团队在算法实现过程中,偶尔也会因为在遇到的算法上意见不一而起争议,每每此时,大家都会积极交流和深入讨论,最终得到完美的解决方案。
个人真心觉得与这个小团队一起奋斗是件很开心的事,能在大家身上学习到不少优点。在开发不同版本时,每当遇到开发相关问题,我也会寻求启智社区和MindSpore的工作人员帮助,也因此认识了很多技术大牛,从与他们的交流中获益匪浅。
从内部个人私有的代码,到现在能放在启智社区开发平台上公开展示代码,对我们来说既是机遇又是挑战。我们很荣幸有这样的机会,能在开源平台上公开展现我们的项目,让更多业内人士看到我们努力后的成果。同时,我们对自己在代码严谨性和规范性方面提出了更严格的要求,这也是在不断自我要求和自我成长的阶段。
启智社区还为我们提供了鹏城实验室的鹏城云脑2计算资源,这不仅大大减少了我们在硬件方面的投入成本,更是完美解决了我们在开发环境不完善和计算资源不充足等方面的瓶颈,让我们可以更专注于项目本身的开发工作。在刚开始使用MindSpore框架开发READ项目时,我们也曾遇到不少操作方面的困难,多亏启智社区的工作人员积极帮助我们对接MindSpore项目组,经过他们的答疑解惑,才使READ项目的开发周期得以极大缩短。
非常感谢有启智社区这样大型专业的平台,可以让我们的READ开源项目拥有和业内众多优秀开源项目一样集中开放地展示给广大开发同行们的机会。同时,启智社区还组织了非常多的线下活动,增加了我们与业内人士相互交流学习的机会,也让我们接收到更多专业人士的点评和建议。启智社区还制定了比赛和评奖制度,鼓励并推动我们不断地去开发项目。作为开源项目的热衷者,我们也非常荣幸能从开源代码的受益者变成现在的传播者,未来我们会提供更多优质代码到启智社区。