机器学习:钻石鉴定

我国是人造(培育)钻石大国。近年来涌现很多培育钻石,准确区分天然钻和培育钻,在珠宝行业成了迫切的需求。

最近为客户做了个算法来区分钻石的光谱。客户原先的方法是看波形,将专家总结的波形特征硬编码进算法中,效果不佳,算法缺乏通用性。

钻石区分本质上是个分类问题,可以有多个分类,如天然钻、尼莫石、培育之CVD、培育之HPHT(高温高压)等。分类问题很适合用机器学习的方法解决。

我训练出来的模型,效果很不错,准确率很高,而且很具通用性。已经上线使用。

以后有时间可以讨论更细节的内容,下面说下两个需要考虑的问题。

难点之一是特征太多,而且每台机器的频点可能不完全一致。因此,需要对数据进行预处理,进行降维,并归一化数据。

难点之二是珠宝业有硬性要求,天然可以误判为培育,但反之培育则不允许判断为天然。这个有点像著名的蘑菇判断,可食用蘑菇误判为毒蘑菇可以接受,大不了不吃它。但毒蘑菇绝不允许误判为可食用的。这个问题比较复杂,可能是杂质的缘故,有些培育钻石谱线接近于天然钻,一方面仪器的硬件一致性和谱线准确率要高,但更主要的需要调参,将天然钻石这个类别的拒绝率调高。

你可能感兴趣的:(实现,钻石鉴定,光谱分析,特征工程)