DL4J中文文档/模型/迭代器

什么是迭代器?

数据集迭代器允许将数据轻松加载到神经网络中，并帮助组织批处理、转换和掩码。包含在Eclipse DL4J中的迭代器有助于用户提供的数据，或者自动加载公共的基准数据集如MNIST和IRIS。

用法

对于大多数用例，初始化迭代器和传递一个引用到MultiLayerNetwork或ComputationGraph 的fit()方法是开始训练任务所需的全部内容：

MultiLayerNetwork model = new MultiLayerNetwork(conf);
model.init();

// 传入一个 MNIST 数据集迭代器，自动获取数据 
DataSetIterator mnistTrain = new MnistDataSetIterator(batchSize, true, rngSeed);
net.fit(mnistTrain);

许多其他方法也接受迭代器来完成任务，例如评估：

// 直接传递给神经网络
DataSetIterator mnistTest = new MnistDataSetIterator(batchSize, false, rngSeed);
net.eval(mnistTest);

//使用一个评估类
Evaluation eval = new Evaluation(10); //创建一个带有10个可能分类的评估对象
while(mnistTest.hasNext()){
    DataSet next = mnistTest.next();
    INDArray output = model.output(next.getFeatureMatrix()); //得到网络预测
    eval.eval(next.getLabels(), output); //检查对真实分类的预测
}

可用的迭代器

CifarDataSetIterator （CIFAR10数据集迭代器）

[源码]

CifarDataSetIterator是CIFAR10数据集的迭代器，10个分类，32x32图像 3通道（RGB）还支持用于基于Sergey Zagoruyko示例https://github.com/szagoruyko/cifar.torch 对数据集进行归一化的特殊预处理器。

CifarDataSetIterator

public CifarDataSetIterator(int batchSize, int numExamples)

用创建器返回的batchSize与numExamples加载图片。

public DataSet next(int batchSize)

用创建器返回的batchSize、numExamples与version加载图片。

EmnistDataSetIterator （EMNIST 数据集迭代器）

[源码]

EMNIST 数据集迭代器

COMPLETE: 也称为 “ByClass” 分割。共计814,255 个示例(训练 + 测试)， 62 个分类
MERGE: 也称为“ByMerge”分割。共计814255个示例。47个不平衡分类。对于字母C、I、J、K、L、M、O、P、S、U、V、W、X、Y和Z，为每个字母（而不是2个）将小写字母和大写字母（难以区分）组合为一个类
BALANCED: 总计 131,600 示例。 47 个分类 (每个分类都有相同数量的例子)
LETTERS: 总计145,600 示例。 26 个平衡分类。
DIGITS: 总计 280,000 示例。 10 个平衡分类。

查看: https://www.nist.gov/itl/iad/image-group/emnist-dataset 和 https://arxiv.org/abs/1702.05373

EmnistDataSetIterator

public EmnistDataSetIterator(Set dataSet, int batch, boolean train) throws IOException

EMNIST 数据集有多个不同的子集。详见 {- link EmnistDataSetIterator}。

numExamplesTrain

public static int numExamplesTrain(Set dataSet)

基于指定的RNG种子创建具有随机混洗数据的EMNIST迭代器

参数 dataSet 用于返回的数据集
参数 batchSize批量大小
参数 train 如果为 true: 使用训练集。如果 false: 使用测试集
参数 seed Random number generator seed

numExamplesTest

public static int numExamplesTest(Set dataSet)

获取指定子集的测试示例数。

参数 dataSet 获取的子集
返回指定子集的示例数

numLabels

public static int numLabels(Set dataSet)

获取指定子集的标签数量

参数 dataSet 要获取的子集
返回指定子集的标签数

isBalanced

public static boolean isBalanced(Set dataSet)

在训练集中标签是否平衡（即：每个标签的实例数是否相等）？

返回true或false

UciSequenceDataSetIterator （UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库，这个数据库目前共有335个数据集，其数目还在不断增加，UCI数据集是一个常用的标准测试数据集。）

[源码]

UCI合成控制图时间序列数据集。该数据集可用于六类单变量时间序列的分类：正常，周期性，递增趋势，递减趋势，向上移位，向下移位

详情: https://archive.ics.uci.edu/ml/datasets/Synthetic+Control+Chart+Time+Series
数据: https://archive.ics.uci.edu/ml/machine-learning-databases/synthetic_control-mld/synthetic_control.data
图片: https://archive.ics.uci.edu/ml/machine-learning-databases/synthetic_control-mld/data.jpeg

UciSequenceDataSetIterator

public UciSequenceDataSetIterator(int batchSize)

用指定的小批量创建训练集的迭代器。RNG种子123随机化

参数 batchSize 小批量大小

LFWDataSetIterator （LFW数据集是为了研究非限制环境下的人脸识别问题而建立。这个集合包含超过13，000张人脸图像（全部来自于internet，而不是实验室环境））

[源码]

LFW 迭代器 - 来自非限制环境中的标注人脸
查看 http://vis-www.cs.umass.edu/lfw/
总计13233图片，5749 个分类。

LFWDataSetIterator

public LFWDataSetIterator(int batchSize, int numExamples, int[] imgDim, int numLabels, boolean useSubset,
                    PathLabelGenerator labelGenerator, boolean train, double splitTrainTest,
                    ImageTransform imageTransform, Random rng)

创建 LFW 数据特有迭代器

参数 batchSize 示例的批量大小
参数 numExamples 示例总数
参数 imgDim 高度、宽度和通道的数组
参数 numLabels 示例总数
参数 useSubset 使用LFW数据集的一个子集
参数 labelGenerator 路径标注生成器使用
参数 train 如果使用训练值则为true
参数 splitTrainTest 为将要测试的训练和保留分割数据的百分比
参数 imageTransform 如何转换图片
参数 rng 批量洗牌中的要锁定的随机数

MnistDataSetIterator （手写数字数据集迭代器）

[源码]

MNIST 数据集迭代器 - 60000 个训练样本，10000个测试样本, 10 个分类。数字有 28x28 像素与一个通道 (灰度)。
更多详情查看 http://yann.lecun.com/exdb/mnist/

IrisDataSetIterator (鸢尾花卉数据集迭代器)

[源码]

IrisDataSetIterator: 一个众所周知的Iris数据集的迭代器。4个特征，3个标签类
https://archive.ics.uci.edu/ml/datasets/Iris

IrisDataSetIterator

public IrisDataSetIterator()

public DataSet next()

IrisDataSetIterator 处理遍历Iris数据集。

see https://archive.ics.uci.edu/ml/datasets/Iris
参数 batch 批量大小
参数 numExamples 示例的总数

TinyImageNetDataSetIterator

[源码]

Tiny ImageNet是ImageNet数据库的子集。TinyImageNet是斯坦福大学CS321N的默认课程挑战。

Tiny ImageNet有200个分类，每个分类由500个训练图像组成。

图像是64×64像素，RGB。

查看: http://cs231n.stanford.edu/ 和 https://tiny-imagenet.herokuapp.com/

TinyImageNetDataSetIterator

public TinyImageNetDataSetIterator(int batchSize)

用随机迭代顺序（RNG种子固定到123）创建训练集的迭代器

参数 batchSize 迭代器小批次大小

SequenceRecordReaderDataSetIterator

[源码]

序列记录读取器数据集迭代器。

给定一个记录读取器（和可选的另一个用于标签的记录读取器）生成时间序列（序列）数据集。

支持一对多和多对一类型数据加载的填充（即，具有不同数量的输入vs）。

SequenceRecordReaderDataSetIterator

public SequenceRecordReaderDataSetIterator(SequenceRecordReader featuresReader, SequenceRecordReader labels,
                    int miniBatchSize, int numPossibleLabels)

构造函数，其中特征和标签来自不同的RecordReader（例如，不同的文件），标签用于分类。

参数 featuresReader 特征SequenceRecordReader
参数 labels 标签: 假设每个时间步的单个值，其中值是0到NoMaulabeleBels-1范围内的整数。
参数 miniBatchSize 每次调用next()的小批次大小
参数 numPossibleLabels 标签的分类数

hasNext

public boolean hasNext()

是否有下一条数据。

loadFromMetaData

public DataSet loadFromMetaData(RecordMetaData recordMetaData) throws IOException

使用所提供的RecordMetaData将单个序列示例加载到数据集。请注意，一次加载多个实例更为有效率。使用 {- link #loadFromMetaData(List)}

参数 recordMetaData 从中加载的记录元数据。应该由给定的记录读取器产生。
使用指定的示例返回DataSet
加载数据时如果发生错误则抛出IOException

loadFromMetaData

public DataSet loadFromMetaData(List list) throws IOException

使用所提供的RecordMetaData实例加载多个序列示例到数据集。

参数 list从中加载的RecordMetaData实例列表。应该是由提供给SequenceRecordReaderDataSetIterator 构造器的记录读取器产生。
用指定的示例返回DataSet
加载数据时如果发生错误则抛出IOException

RecordReaderMultiDataSetIterator （记录读取器多数据集迭代器）

[源码]

思想：从一个或多个序列/记录读取器产生多个输入和多个输出。输入和输出可以从RecordReader和SequenceRecordReaders列的子集获得（例如，一些输入和输出作为相同记录/序列中的不同列）；还可以混合不同类型的数据（例如，在同一个RecordReaderMultiDataSetIterator使用RecordReader和SequenceRecordReaders）。

输入和子集。

RecordReaderMultiDataSetIterator

public RecordReaderMultiDataSetIterator build()

当处理不同长度的时间序列数据时，我们应该如何对齐输入/标签时间序列？对于等长度：使用EQUAL_LENGTH进行序列分类：使用ALIGN_END

loadFromMetaData

public MultiDataSet loadFromMetaData(RecordMetaData recordMetaData) throws IOException

使用所提供的RecordMetaData将单个序列示例加载到数据集。请注意，一次加载多个实例更为有效率。使用 {- link #loadFromMetaData(List)}

参数 recordMetaData 从中加载的记录元数据。应该由给定的记录读取器产生。
使用指定的示例返回DataSet
加载数据时如果发生错误则抛出IOException

loadFromMetaData

public MultiDataSet loadFromMetaData(List list) throws IOException

使用所提供的RecordMetaData实例加载多个序列示例到数据集。

参数 list从中加载的RecordMetaData实例列表。应该是由提供给SequenceRecordReaderDataSetIterator 构造器的记录读取器产生。
用指定的示例返回DataSet
加载数据时如果发生错误则抛出IOException

RecordReaderDataSetIterator

[源码]

DataSet对象以及从各个记录生成小批量。

示例 1: 图像分类, 批量大小32, 10 个分类

rr.initialize(new FileSplit(new File("/path/to/directory")));

DataSetIterator iter = new RecordReaderDataSetIterator.Builder(rr, 32)
//Label index (first arg): Always value 1 when using ImageRecordReader. For CSV etc: use index of the column
//  that contains the label (should contain an integer value, 0 to nClasses-1 inclusive). Column indexes start
// at 0. Number of classes (second arg): 标签分类的数量(即10 个用于 MNIST - 10 个用于数字)
.classification(1, nClasses)
.preProcessor(new ImagePreProcessingScaler()) //用于把图片值从0-255归一化到0-1
.build()
}

示例 2: 来自CSV的多输出回归, 批量大小 128

rr.initialize(new FileSplit(new File("/path/to/myCsv.txt")));

DataSetIterator iter = new RecordReaderDataSetIterator.Builder(rr, 128)

//指定回归 标签/目标出现的列。注意所有其它列都被当作特征。列索引从0开始。
.regression(labelColFrom, labelColTo)
.build()
}

RecordReaderDataSetIterator

public RecordReaderDataSetIterator(RecordReader recordReader, int batchSize)

分类构造器:
(a) 标签索引被假定为最后一个可写/列，并且
(b) 从 RecordReader.getLabels()中推断类的数目
注意，如果RecordReader.getLabels()返回NULL，则不会产生输出标签。

参数 recordReader 作为数据源的记录读取器
参数 batchSize用于每次 .next() 调用的小批次大小

setCollectMetaData

public RecordReaderDataSetIterator(RecordReader recordReader, int batchSize, int labelIndex,int numPossibleLabels)

分类的主要构造器。这将将输入类索引（在位置labelIndex中，整数值0到numPossibleLabels-1包含）转换为适当的one-hot输出/标签表示。

参数 recordReader 记录读取器: 提供数据源
参数 batchSize 批量大小 (示例数量) 用于输出数据集对象
参数 labelIndex 标签 Writable (通常是一个 IntWritable)的索引，由recordReader.next()获得
参数 numPossibleLabels 分类的数量（可能的标签）

loadFromMetaData

public DataSet loadFromMetaData(RecordMetaData recordMetaData) throws IOException

使用提供的RealDataMeta将单个示例加载到DataSet。请注意，同时加载多个实例更为有效。使用 {- link #loadFromMetaData(List)}

参数 recordMetaData 用于加载的 RecordMetaData。应该由给定的记录读取器产生
返回指定示例的 DataSet
如果加载数据期间发生错误则抛出 IOException

loadFromMetaData

public DataSet loadFromMetaData(List list) throws IOException

使用提供的RealDataMeta实例将多个示例加载到数据集。

参数 list 是用于加载的RecordMetaData 实例列表。应该是由提供给ReadReadReadDeader的构造函数的记录读取器生成的
返回指定示例的 DataSet
如果加载数据期间发生错误则抛出 IOException

writableConverter

public Builder writableConverter(WritableConverter converter)

RecordReaderDataSetIterator 的构建类

maxNumBatches

public Builder maxNumBatches(int maxNumBatches)

可选参数，通常不使用。如果设置，则可以用来限制将返回的小批量的最大值（在重置之间）。如果没有设置，将总是返回尽可能多的小批量，因为有可用的数据。

参数 maxNumBatches 每个epoch / 重置的小批量的最大数值

regression

public Builder regression(int labelIndex)

将其用于单输出回归（即，1输出/回归目标）

参数 labelIndex 包含回归目标的列索引（索引从0开始）

regression

public Builder regression(int labelIndexFrom, int labelIndexTo)

将其用于多个输出回归（1个或更多的输出/回归目标）。请注意，所有回归目标必须是连续的（即，位置x到y，没有间隙）。

参数 labelIndexFrom 第一个回归目标的列索引（索引开始于0）
参数 labelIndexTo 最后一个回归目标的列索引（包括）

classification

public Builder classification(int labelIndex, int numClasses)

这个用于分类

参数 labelIndex 标签索引。列（从0开始索引）是一个整数的值，而且包括0 到 numClasses-1 的值
参数 numClasses 标签类别数量 (即数据集中的类别/类数)

preProcessor

public Builder preProcessor(DataSetPreProcessor preProcessor)

可选的参数。允许设置预处理器

参数 preProcessor 是要使用的预处理器

collectMetaData

public Builder collectMetaData(boolean collectMetaData)

当设置为true时：当前示例的元数据将出现在返回的数据集中。默认情况下禁用。

参数 collectMetaData 是否应该收集元数据

WorkspacesShieldDataSetIterator

[源码]

这个迭代器分离/迁移来自支持DataSetIterator的数据集，从而提供“安全”数据集。

这通常用于调试和测试目的，一般不应该由用户使用。

WorkspacesShieldDataSetIterator

public WorkspacesShieldDataSetIterator(@NonNull DataSetIterator iterator)

参数 iterator 用于分离值的底层迭代器

ExistingDataSetIterator

[源码]

ExistingDataSetIterator

public ExistingDataSetIterator(@NonNull Iterator iterator)

注意，在使用此构造函数时，不支持重置。

参数 iterator 用于包装的迭代器

public DataSet next(int num)

注意，在使用此构造函数时，不支持重置。

参数 iterator 用于包装的迭代器

参数 labels 字符串标签。可能为空。

CombinedMultiDataSetPreProcessor

[源码]

组合构建器中按指定的顺序应用的各种多数据集预处理器。

CombinedMultiDataSetPreProcessor

public Builder addPreProcessor(@NonNull MultiDataSetPreProcessor preProcessor)

参数 preProcessor 要添加到要应用的预处理器列表中的预处理器

DataSetFetcher

[源码]

用于将数据集加载到内存中的低级接口。

这是由DataSetIterator程序用来处理内存中加载数据的细节。

AsyncDataSetIterator

[源码]

用于DataSetIterator实现的异步预获取迭代器包装器。这将异步地从基础迭代器中预获取指定数量的小批量。

还可以选择（默认情况下对大多数构造函数启用）使用循环工作间，以避免创建具有堆外内存的INDArrays，这些内存需要由JVM垃圾收集器清理。

注意，适当的DL4J fit方法会自动使用这个迭代器，因此用户在拟合网络时不需要手动包装迭代器。

AsyncDataSetIterator

public AsyncDataSetIterator(DataSetIterator baseIterator)

创建一个默认队列大小为8的异步迭代器

参数 baseIterator 底层迭代器用于异步方式包装和获取

public DataSet next(int num)

创建一个默认队列大小为8的异步迭代器

参数 baseIterator 底层迭代器用于异步方式包装和获取

参数 queue 队列大小

inputColumns

public int inputColumns()

数据集的输入列

return

totalOutcomes

public int totalOutcomes()

数据集的标签数量

return

resetSupported

public boolean resetSupported()

这个DataSetIterator支持重置吗？许多DataSetIterator支持重置，但有些不支持。

如果支持重置方法，返回true；否则为false

asyncSupported

public boolean asyncSupported()

这个DataSetIterator是否支持异步预取多个DataSet对象？大多数DataSetIterator都可以，但是在某些情况下，将此迭代器包装到执行异步预取的迭代器中可能没有意义。例如，对于以下类型的迭代器使用异步预取是没有意义的：(a)已经将它们的全部内容存储在内存中的迭代器(b)重复使用特性/标签数组的迭代器(因为将来的next()调用将覆盖过去的内容)(c)已经实现某种级别的异步预取的迭代器（d）返回不同的数据的迭代器，取决于何时调用next()方法。

如果来自此迭代器的异步预取是可用的则返回true；如果异步预取不应用于此迭代器，则返回false

reset

public void reset()

将迭代器重置为开始。

shutdown

public void shutdown()

我们希望确保，后台线程将具有相同的线程->设备类似，作为主线程。

batch

public int batch()

批量大小

return

setPreProcessor

public void setPreProcessor(DataSetPreProcessor preProcessor)

设置预处理器

参数 preProcessor 要设置的预处理器

getPreProcessor

public DataSetPreProcessor getPreProcessor()

返回预处理器，如果定义

return

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

public DataSet next()

返回迭代中的下一个元素。

返回迭代中的下一个元素

remove

public void remove()

从基础集合中移除由迭代器返回的最后一个元素（可选操作）。在每次调用next后，这个方法只能被调用一次。在除了此方法之外的任何方法迭代过程中，如果底层集合被修改，则迭代器的行为将不被指定。

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已经被调用。
implSpec 默认的实现抛出一个UnsupportedOperationException实例然后不执行任何操作。

FileSplitDataSetIterator

[源码]

与文件列表一起工作的简单的迭代器。文件到DataSet转换将通过提供的FileCallback实现来处理。

FileSplitDataSetIterator

public FileSplitDataSetIterator(@NonNull List files, @NonNull FileCallback callback)

参数 files 用于迭代的文件列表
参数 callback 加载文件的回调

AsyncShieldMultiDataSetIterator

[源码]

此包装器使用现有的MultiDataSetIterator实现，并防止异步预取。

public MultiDataSet next(int num)

获取下“Num”个示例。类似于next方法，但返回指定数量的示例。

参数 num 获取示例数量

setPreProcessor

public void setPreProcessor(MultiDataSetPreProcessor preProcessor)

在每个MultiDataSet返回之前，将预处理器设置到每个MultiDataSet。

参数 preProcessor MultiDataSet的预处理器，可以为空。

resetSupported

public boolean resetSupported()

这个DataSetIterator支持重置吗？许多DataSetIterator支持重置，但有些不支持。

如果支持重置方法，返回true；否则为false

asyncSupported

public boolean asyncSupported()

这个DataSetIterator是否支持异步预取多个DataSet对象？

请注意：这个迭代器总是返回false

如果来自此迭代器的异步预取是支持的返回true；如果异步预取不应用于此迭代器，则返回false

reset

public void reset()

将迭代器重置为开始状态。

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

public MultiDataSet next()

在迭代中返回下一个元素

在迭代中返回下一个元素

remove

public void remove()

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已经被调用。
implSpec 默认的实现抛出一个UnsupportedOperationException实例然后不执行任何操作。

DataSetIteratorSplitter

[源码]

这个迭代器实际上将给定的MultiDataSetIterator分割成训练和测试部分。也就是说，你有100000个例子。你的批量大小是32。这意味着你有3125个总批次。分割比例为0.7，这将给你2187个训练批次，和938个测试批次。

请注意：你不能一行中使用测试迭代器两次。训练迭代器应该在测试迭代器使用之前被使用。

请注意：如果底层迭代器使用epoch间的随机化/洗牌，则不能使用此迭代器。

DataSetIteratorSplitter

public DataSetIteratorSplitter(@NonNull DataSetIterator baseIterator, long totalBatches, double ratio)

惟一的构造器

参数 baseIterator - 要被包装和分割的迭代器
参数 totalBatches - 基础迭代器中的总批次
参数 ratio -训练/测试分割比例

getTrainIterator

public DataSetIterator getTrainIterator()

此方法返回训练迭代器实例。

return

public DataSet next(int i)

此方法返回测试迭代器实例。

return

IteratorMultiDataSetIterator

[源码]

按要求获取指定批次大小。

通常用于Spark训练，但可用于其他地方。注意：这里不支持重置方法。

EarlyTerminationMultiDataSetIterator

[源码]

建立一个迭代器，一旦小批量.next()返回的数量等于指定的数目这个迭代器即会终止。

注意，对.next(num)的调用被计数为返回小批量的调用，而不管num的值如何。这实际上将数据限制为这个小批量的指定数量。

EarlyTerminationMultiDataSetIterator

public EarlyTerminationMultiDataSetIterator(MultiDataSetIterator underlyingIterator, int terminationPoint)

构造函数采用迭代器进行包装，然后对hasNext()调用后返回false时的小批量。

参数 underlyingIterator, 进行包装的迭代器
参数 terminationPoint, 在hasNext()被调用后会返回false时的小批量

DoublesDataSetIterator

[源码]

对的第一个值是特征向量，对的第二个值是标签。支持仅生成2D特征/标签

DoublesDataSetIterator

public DoublesDataSetIterator(@NonNull Iterable> iterable, int batchSize)

参数 iterable 来自源数据的迭代
参数 batchSize 生成数据集对象的批处理大小

MultipleEpochsIterator

[源码]

用于在数据集上进行多次传递的数据集迭代器

使用 MultiLayerNetwork/ComputationGraph.fit(DataSetIterator, int numEpochs) 代替

public DataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

inputColumns

public int inputColumns()

数据集的输入列

return

totalOutcomes

public int totalOutcomes()

数据集的标签数量

return

reset

public void reset()

将迭代器重置为开始。

batch

public int batch()

批量大小

return

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

remove

public void remove()

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已被调用。

INDArrayDataSetIterator

[source]

对的第一个值是特征向量，对的第二个值是标签。

INDArrayDataSetIterator

public INDArrayDataSetIterator(@NonNull Iterable> iterable, int batchSize)

参数 iterable 来自源数据的迭代
参数 batchSize 生成数据集对象的批处理大小

EarlyTerminationDataSetIterator

[源码]

建立一个迭代器，一旦小批量.next()返回的数量等于指定的数目这个迭代器即会终止。

注意，对.next(num)的调用被计数为返回小批量的调用，而不管num的值如何。这实际上将数据限制为这个小批量的指定数量。

EarlyTerminationDataSetIterator

public EarlyTerminationDataSetIterator(DataSetIterator underlyingIterator, int terminationPoint)

构造函数采用迭代器进行包装，然后对hasNext()调用后返回false时的小批量。

参数 underlyingIterator, 进行包装的迭代器
参数 terminationPoint, 在hasNext()被调用后会返回false时的小批量

ReconstructionDataSetIterator

[源码]

包装数据集迭代器，设置第一个（特征矩阵）为标签。

public DataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

inputColumns

public int inputColumns()

数据集的输入列

return

totalOutcomes

public int totalOutcomes()

数据集的标签数量

return

reset

public void reset()

重置迭代器到开始状态

batch

public int batch()

批量大小

return

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

public DataSet next()

返回迭代中的下一个元素

返回迭代中的下一个元素

remove

public void remove()

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已被调用。

JointMultiDataSetIterator

[源码]

这个数据集迭代器将多个DataSetIterators组合为1个MultiDataSetIterator。来自每个迭代器的值以每个示例为基础进行连接——即，来自每个数据集的值被组合为用于多输入神经网络的不同特征数组。标签只能来自底层DataSetIteartor之一（如果outcome是>=0）或来自所有迭代器（如果outcome是<0）

JointMultiDataSetIterator

public JointMultiDataSetIterator(DataSetIterator... iterators)

参数 iterators 包装过的基础迭代器

public MultiDataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

setPreProcessor

public void setPreProcessor(MultiDataSetPreProcessor preProcessor)

在每个MultiDataSet返回之前，将预处理器设置到每个MultiDataSet。

参数 preProcessor MultiDataSet的预处理器，可以为空。

getPreProcessor

public MultiDataSetPreProcessor getPreProcessor()

如果先前设置了MultiDataSetPreProcessor，则获取MultiDataSetPreProcessor。如果未设置预处理器，则返回NULL

返回 Preprocessor

resetSupported

public boolean resetSupported()

这个DataSetIterator支持重置吗？许多DataSetIterator支持重置，但有些不支持。

如果支持重置方法，返回true；否则为false

asyncSupported

public boolean asyncSupported()

这个MultiDataSetIterator是否支持异步预取多个MultiDataSet对象？大多数MultiDataSetIterators都可以，但是在某些情况下，将此迭代器包装到执行异步预取的迭代器中可能没有意义。例如，对于以下类型的迭代器使用异步预取是没有意义的：(a)已经将它们的全部内容存储在内存中的迭代器(b)重复使用特性/标签数组的迭代器(因为将来的next()调用将覆盖过去的内容)(c)已经实现某种级别的异步预取的迭代器（d）返回不同的数据的迭代器，取决于何时调用next()方法。

如果来自此迭代器的异步预取是可用的则返回true；如果异步预取不应用于此迭代器，则返回false

reset

public void reset()

将迭代器重置为开始。

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

public MultiDataSet next()

返回迭代中的下一个元素

返回迭代中的下一个元素

remove

public void remove()

请注意：此方法未实现。

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已经被调用。
implSpec 默认的实现抛出一个UnsupportedOperationException实例然后不执行任何操作。

SamplingDataSetIterator （采样数据集迭代器）

[源码]

用于从DataSet中采样的包装器。这将从给定的数据集随机采样。

SamplingDataSetIterator

public SamplingDataSetIterator(DataSet sampleFrom, int batchSize, int totalNumberSamples)

RandomMultiDataSetIterator

[源码]

RandomMultiDataSetIterator：根据某些分布生成随机值（或零值、整数、整数等）。

注意：这通常用于测试、调试和基准测试的目的。

RandomMultiDataSetIterator

public RandomMultiDataSetIterator(int numMiniBatches, @NonNull List> features, @NonNull List> labels)

参数 numMiniBatches 每一个epoch小批量的数量
参数 features 列表中的每一个三元组指定特征数组的形状、数组顺序和值类型。
参数 labels 列表中的每一个三元组指定标签数组的形状、数组顺序和值类型。

addFeatures

public Builder addFeatures(long[] shape, Values values)

参数 numMiniBatches 每一个epoch小批量的数量

addFeatures

public Builder addFeatures(long[] shape, char order, Values values)

添加一个新的特征数组到迭代器

参数 shape特征形状
参数 order 数组的顺序（c或f）
参数 values 填充数组的值

addLabels

public Builder addLabels(long[] shape, Values values)

添加一个新的标签数组到迭代器

参数 shape标签形状
参数 values 填充数组的值

addLabels

public Builder addLabels(long[] shape, char order, Values values)

添加一个新的标签数组到迭代器

参数 shape标签形状
参数 order 数组的顺序（c或f）
参数 values 填充数组的值

generate

public static INDArray generate(long[] shape, Values values)

生成具有指定形状的随机数组

参数 shape数组形状
参数 values 填充数组的值
返回指定形状+内容的随机数组

generate

public static INDArray generate(long[] shape, char order, Values values)

生成具有指定形状和顺序的随机数组

参数 shape数组形状
参数 order 数组的顺序（c或f）
参数 values 填充数组的值
返回指定形状+内容的随机数组

MultiDataSetWrapperIterator

[源码]

这个类是简单的包装器，它采用单输入MultiDataSet并将它们转换为DataSet。

请注意：只有当特征/标签/掩码数量为1时才有效。

MultiDataSetWrapperIterator

public MultiDataSetWrapperIterator(MultiDataSetIterator iterator)

参数 iterator 进行包装的迭代器

AsyncShieldDataSetIterator

[源码]

此包装器使用你现有的DataSetIterator实现并防止异步预取。这主要用于调试目的；通常情况下迭代器对异步预取是不安全的。

AsyncShieldDataSetIterator

public AsyncShieldDataSetIterator(@NonNull DataSetIterator iterator)

参数 iterator进行包装的迭代器，禁用异步预取

public DataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

inputColumns

public int inputColumns()

数据集的输入列

return

totalOutcomes

public int totalOutcomes()

数据集的标签数量

return

resetSupported

public boolean resetSupported()

这个DataSetIterator支持重置吗？许多DataSetIterator支持重置，但有些不支持。

如果支持重置方法，返回true；否则为false

asyncSupported

public boolean asyncSupported()

这个DataSetIterator是否支持异步预取多个DataSet对象？

请注意：这个迭代器总是返回false

如果来自此迭代器的异步预取是支持的返回true；如果异步预取不应用于此迭代器，则返回false

reset

public void reset()

将迭代器重置为开始状态。

batch

public int batch()

批量大小

return

setPreProcessor

public void setPreProcessor(DataSetPreProcessor preProcessor)

设置一个预处理器

参数 preProcessor 一个用于设置的预处理器

getPreProcessor

public DataSetPreProcessor getPreProcessor()

如果已定义，返回一个预处理器。

return

hasNext

public boolean hasNext()

获取数据集迭代记录读取器标签

public DataSet next()

返回迭代中下一个元素

返回迭代中下一个元素

remove

public void remove()

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已经被调用。
implSpec 默认的实现抛出一个UnsupportedOperationException实例然后不执行任何操作。

IteratorDataSetIterator

[源码]

要求获取指定批次大小。

通常用于Spark训练，但可用于其他地方。

注意：这里不支持重置方法。

FloatsDataSetIterator

[源码]

对的第一个值是特征向量，对的第二个值是标签。仅支持生成2D特征/标签

FloatsDataSetIterator

public FloatsDataSetIterator(@NonNull Iterable> iterable, int batchSize)

参数 iterable 来自源数据的迭代
参数 batchSize 生成数据集对象的批处理大小

CombinedPreProcessor

[源码]

这是一个特殊的预处理器，它允许组合多个预处理器，并按它们顺序应用到数据中。

CombinedPreProcessor

public CombinedPreProcessor build()

按顺序预处理数据集

参数 toPreProcess 预处理的数据集

RandomDataSetIterator

[源码]

RandomDataSetIterator：根据某些分布生成随机值（或零值、整数、整数等）。

注意：这通常用于测试、调试和基准测试的目的。

RandomDataSetIterator

public RandomDataSetIterator(int numMiniBatches, long[] featuresShape, long[] labelsShape, Values featureValues, Values labelValues)

参数 numMiniBatches 每个epoch的小批量大小
参数 featuresShape 特征形状
参数 labelsShape 标签形状
参数 featureValues 特征值类型
参数 labelValues 检签值类型

BaseDatasetIterator

[源码]

基线实现，包括对数据获取器和元数据的一些基本getters的控制。

DummyPreProcessor

[源码]

这是一个特殊的虚拟预处理器，它什么也不做。

preProcess

public void preProcess(DataSet toPreProcess)

预处理数据集

参数 toPreProcess 用于预处理的数据集

MultiDataSetIteratorSplitter

[源码]

这个迭代器实际上将给定的多数据报器分割成训练和测试部分。也就是说，你有100000个例子。你的批量是32。这意味着你有3125个总批次。分割比例0.7，这将给你2187个训练批次，和938个测试批次。

请注意：你不能在一行中使用测试迭代器两次。在测试迭代器使用之前使用训练迭代器。

请注意：如果底层迭代器在epoch之间使用随机化/洗牌，则不能使用此迭代器。

MultiDataSetIteratorSplitter

public MultiDataSetIteratorSplitter(@NonNull MultiDataSetIterator baseIterator, long totalBatches, double ratio)

参数 baseIterator - 要被包装和分割的迭代器

参数 totalBatches - 基础迭代器中的批次总数。此值将用于确定测试/训练批次的数量。
参数 ratio -此值将用作分割器。应介于0＞x＜1之间。也就是说，如果提供值0.7，那么总示例的70%将用于训练，总示例的30%将用于测试

getTrainIterator

public MultiDataSetIterator getTrainIterator()

此方法返回训练迭代器实例。

return

public MultiDataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

AsyncMultiDataSetIterator

[源码]

用于MultiDataSetIterator实现的异步预获取迭代器包装器。这将异步地从基础迭代器中预获取指定数量的小批量。

还可以选择（默认情况下对大多数构造函数启用）使用循环工作间，以避免创建具有堆外内存的INDArrays，这些内存需要由JVM垃圾收集器清理。

注意，适当的DL4J fit方法会自动使用这个迭代器，因此用户在拟合网络时不需要手动包装迭代器。

public MultiDataSet next(int num)

类似于标准的next方法，但允许返回一个可定制数量的示例。

参数 num 示例数量
返回下一条数据

setPreProcessor

public void setPreProcessor(MultiDataSetPreProcessor preProcessor)

在每个MultiDataSet返回之前，将预处理器设置到每个MultiDataSet。

参数 preProcessor MultiDataSet的预处理器，可以为空。

resetSupported

public boolean resetSupported()

这个DataSetIterator支持重置吗？许多DataSetIterator支持重置，但有些不支持。

如果支持重置方法，返回true；否则为false

asyncSupported

public boolean asyncSupported()

如果来自此迭代器的异步预取是可用的则返回true；如果异步预取不应用于此迭代器，则返回false

reset

public void reset()

将迭代器重置为开始。

shutdown

public void shutdown()

我们希望确保，后台线程将具有相同的线程->设备类似，作为主线程。

hasNext

public boolean hasNext()

如果迭代器具有更多元素，则返回true。（换句话说，如果下一个元素返回元素而不是抛出异常，则返回true）。

如果迭代器具有更多元素，则返回true

public MultiDataSet next()

在迭代中返回下一个元素

在迭代中返回下一个元素

remove

public void remove()

抛出 UnsupportedOperationException 如果remove操作不被这个迭代器支持
抛出 IllegalStateException 如果next方法如果没有被调用，或remove在最后一次调用next方法之后已经被调用。
implSpec 默认的实现抛出一个UnsupportedOperationException实例然后不执行任何操作。

MultiDataSetIteratorAdapter

[源码]

将DataSetIterator适配到MultiDataSetIterator

你可能感兴趣的:(AI)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
C语言代码练习（第十九天）小小框架 C语言 C语言重点练习 c语言
今日练习：52、有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中53、输出"魔方阵"。所谓魔方阵是指它的每一行，每一列和对角线之和均相等。54、找出一个二维数组中的鞍点，即该位置上的元素在该行上最大、在该列上最小。也可能没有鞍点。有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中运行代码intmain(){intarr[11]={1,3,9,12,15
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

DL4J中文文档/模型/迭代器

什么是迭代器?

用法

可用的迭代器

CifarDataSetIterator （CIFAR10数据集迭代器）

EmnistDataSetIterator （EMNIST 数据集迭代器）

UciSequenceDataSetIterator （UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库，这个数据库目前共有335个数据集，其数目还在不断增加，UCI数据集是一个常用的标准测试数据集。）

LFWDataSetIterator （LFW数据集是为了研究 非限制环境下的人脸识别问题而建立。这个集合包含超过13，000张人脸图像（全部来自于internet，而不是实验室环境））

MnistDataSetIterator （手写数字数据集迭代器）

IrisDataSetIterator (鸢尾花卉数据集迭代器)

TinyImageNetDataSetIterator

SequenceRecordReaderDataSetIterator

RecordReaderMultiDataSetIterator （记录读取器多数据集迭代器）

RecordReaderDataSetIterator

WorkspacesShieldDataSetIterator

ExistingDataSetIterator

CombinedMultiDataSetPreProcessor

DataSetFetcher

AsyncDataSetIterator

FileSplitDataSetIterator

AsyncShieldMultiDataSetIterator

DataSetIteratorSplitter

IteratorMultiDataSetIterator

EarlyTerminationMultiDataSetIterator

DoublesDataSetIterator

MultipleEpochsIterator

INDArrayDataSetIterator

EarlyTerminationDataSetIterator

ReconstructionDataSetIterator

JointMultiDataSetIterator

SamplingDataSetIterator （采样数据集迭代器）

RandomMultiDataSetIterator

MultiDataSetWrapperIterator

AsyncShieldDataSetIterator

IteratorDataSetIterator

FloatsDataSetIterator

CombinedPreProcessor

RandomDataSetIterator

BaseDatasetIterator

DummyPreProcessor

MultiDataSetIteratorSplitter

AsyncMultiDataSetIterator

MultiDataSetIteratorAdapter

你可能感兴趣的:(AI)

LFWDataSetIterator （LFW数据集是为了研究非限制环境下的人脸识别问题而建立。这个集合包含超过13，000张人脸图像（全部来自于internet，而不是实验室环境））