tfjs knn保存训练数据

如果你花了很长时间去训练一个东西,你一不小心关闭了。那么结果会怎么样?

----会崩溃。

今天看了knnclassfly的git的原码,发现根本没有保存训练数据的任何方法,这就很可怕了,因为如果在没有库的支持下,自己操作这些大维度和大量的数据感觉是非常可怕很有风险的。

如果,你需要保存自己的训练数据,然后在下一次打开的时候直接加载的话,你就必须自主的操作这些训练数据了。经过在网上的一顿折腾,不过很庆幸,借助下列的方法,实先训练数据重新加载:

getClassifierDataset(): {[classId: number]: Tensor2D}

setClassifierDataset(classDatasetMatrices: {[classId: number]: Tensor2D})

虽然在未来的版本中存储训练数据是必然会被添加的,如ML5JS。

不过在开始之前,我建议打印出你的训练数据,(注意shape)这在后面加载数据中很有参考意义。

写一个方法用于保存训练数据:

saveData(){

let dataset=this.knn.getClassifierDataset();

//获取knn所有Example的'训练数据',他们都是矩阵.

var datasetObj={};

Object.keys(dataset).forEach((key)=>{

//枚举出所有key,相当于for ... in..

  let data=dataset[key].dataSync();//同步获取tensor的值datasetObj[key]=Array.from(data);

});

let jsonStr=JSON.stringify(datasetObj);

//建议这个把他们转换成str类型去存储,因为他们数据一般有事有点分量的,这样也可以保证在数据传递的时候不会被改变类型,比如路由传值。

//当然对于这些数据操作一般都是写入到文件。

//....do something

  // localStorage.setItem("mydb",jsonStr);

}

加载数据:

load(){

let dataset=//你数据源获取方法

let tensorObj=JSON.parse(dataset);

Object.keys(tensorObj).forEach((key)=>{

//1024也不是随便给的  这里就要集合上面输入的key来看了。

console.log(tensorObj[key].length/1024);

tensorObj[key]=tf.tensor(tensorObj[key],[Math.floor(tensorObj[key].length/1024),1024]);

});

//载入

this.knn.setClassifierDataset(tensorObj);

}

好了,现在可以开开心心,快快乐了,高高兴兴,活蹦乱跳的玩耍了.......

(最近感觉做烂了许多东西.....)

你可能感兴趣的:(tfjs knn保存训练数据)