data collect


const collectTextline: DataCollectType = async (args: ArgsType): Promise => {
   const { uri, dataDir } = args;
   await fs.copy(uri, dataDir + '/my-own-dataset.csv');
   return null;
};
export default collectTextline;

插件的输入是 ArgsType,输出是 void,那么来看看 data process 插件:


const doubleSize: DataProcessType = async (sample: Sample, metadata: Metadata, args?: ArgsType): Promise => {
   // double the data
   sample.data = sample.data * 2;
};
export default doubleSize;

看,无论是输入的参数还是函数返回值,都不一样了。但读者也不需要害怕,Pipcook 中的插件类型都是固定的,并且每一种插件的写法和类型定义也都定义好了,具体可以阅读 Pipcook 的插件规范文档。

另外,正如在开篇所说的,Pipcook 通过 Boa 提供了无缝接入 Python 生态的能力,也正因为这种能力,才帮助 JavaScript 社区解决了机器学习生态成熟度和前沿技术使用的问题,那么究竟如何开始使用 Boa 呢?

首先,在 package.json 中的依赖中添加 @pipcook/boa 及对应版本,另外在 “conda.dependencies” 中添加依赖的 Python 包,然后就能在插件中使用了:


const boa = require('@pipcook/boa');
const tensorflow = boa.import('tensorflow');

你可能感兴趣的:(data collect)