Lingjie Fan

构建数据集

2.1 什么是数据集
2.2 构建数据集的方式

2.2.1 从内存数据中构建数据集
2.2.2 从磁盘数据中构建数据集

TFRecord 数据结构
TFRecord 文件制作
TFRecord 文件读取

2.3 小结

一个深度学习 AI 项目是从收集和整理数据集开始的。正如我们开始写一本书或开始最准备做一件事情，总是从收集素材收集资料开始，完成一个 AI 项目也不例外。但一般的 TensorFlow 教程都是使用之前别人已经做好的数据集。使得即使读者完全重复了教程中的实例，在面对一个新的 AI 项目时仍然不知道如何去下手。本章主要介绍如何去构建一个深度学习 AI 项目的数据集，TensorFlow2.0 构建数据集主要用到的 tf.data 以及 tf.io 两个模块。TensorFlow2.0 中包含了很多的类和方法，下面构建数据集的方法可能不是唯一的但确实笔者亲自试验过可行的方法。正如世上的路有千千万万，不可能带着大家全都走一遍，但我可以带着大家先走通一条路。

2.1 什么是数据集

鉴于很多人不太理解什么是数据集，在介绍如何创建数据集前容笔者唠叨一下什么是数据集，只有清楚了什么数据集我们才知道如何去制作数据集。

通常人们认为我有了一堆数字、图片、视频或音频的数据后把它们放在一个文件夹里不就是一个数据集了吗？从百度上我们可以简单地查到数据集（Dataset）的定义，数据组成的集合，通常以表格的形式出现每一行表示一个成员(Member)每一列表示一个特征(Feature)。也就是说我们可以这么理解数据集，数据集是一个整理好的有一定结构的数据的集合（你可以想象成一个表格），它其中有很多成员，而每个成员又有很多特征。

除此之外，笔者还认为数据集所谓的整理好有一定结构是针对读取对象而言的。就拿一个图片数据集来举例：对于人来说，我们认为整理好的数据就是把收集到的图片放在一个文件夹里并按编号进行命名。或着对所有图片进行分类，如将植物的图片全放在一个文件夹里，再在把动物的图片放到另一个文件夹里。这样的一个数据集对于人来说是已经整理好的有一定结构的。但是将这样的数据放到 TensorFlow 面前直接让其读取原始数据，TensorFlow 必将苦不堪言。这就像把计算机整理好的认为有条理的二进制代码放到人面前，人也会认为这段代码是一堆没有条理结构的乱码一样。

从上面我们可以知道，数据集就是，根据读取的对象，将现在已有的数据组织成方便使用对象读取的、有结构的数据的集合。而对于一个 AI 项目来说，我们使用的模块是 Python 下的 TensorFlow 2.0 ，那么我们也应该将我们已经收集到的数据制作成方便 TensorFlow 2.0 进行读取的有条理的数据集合。以上便是构建数据集的基本思想。

2.2 构建数据集的方式

已经了解了什么是数据集以及构建数据集的基本思想之后，下面我们介绍几种常用的构建数据集的方法，以便满足各种 AI 项目数据集的构建。

2.2.1 从内存数据中构建数据集

首先我们来看一种最简单的情况，使用 TensorFlow 2.0 直接从内存中读取数据创建数据集。对于数据量很小的数据，我们可以先将数据从磁盘中预加载到内存中，使用 Python 的元组、列表或字典等方式进行存储。如下图所示，分别为 Python 使用三种方式组织数据。

# 元组
tuple_example = (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)

# 列表
list_example = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]

# 字典
dict_example = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5,
		'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 0}

但很不幸，以上的三种形式对于 TensorFlow 来说并不友好。因为上述的三种形式虽然是 Python 自带的数据结构形式，但是当进行线性代数运算或其他科学计算时，这三种形式的数据处理起来十分麻烦，需要人为根据运算的数学形式去定义很复杂的操作。

MATLAB 对于科学计算时不同数据类型需要人为定义复杂的操作的解决方法是将自身的数据格式全部统一为向量（Vector），而 Python 对于这一问题的解决方法是引入科学计算库 numpy 将数据格式转换为 numpy.array。而 TensorFlow 继承了 MATLAB 的解决方案，将自身所有数据格式统一为张量（Tensor）。同时 TensorFlow 继承了 numpy 的优点兼容 Python 中自带的列表或 numpy 中的 numpy.array 数据格式，可以在下一个阶段通过对数据集的预处理将其转化为张量（Tensor）。

从上面的数据集的定义中，我们了解到数据集一方面需要针对读取对象给出适合的数据格式，另一方面需要有一定的数据结构如成员（Member）以及成员的特征（Feature）。在了解了数据格式后，下面我们来说一说数据集的另一方面：数据的组织结构。从张量角度来讲（也可以把它理解为一个多维的列表），一般我们常常将第 0 维用于放置各个成员（Member）其他维度用于放置成员的特征（Feature）。图 2.2为机器学习中常常用到的鸢尾花（Iris）数据集的数据结构示例。

iris_data = [
		["特征一", "特征二", "特征三", "特征四"]， # 第一朵花
		["花萼长度", "花萼宽度", "花瓣长度", "花瓣宽度"], # 第二朵花
		...
		[5.1, 3.5, 1.4, 0.2] # 第 n 朵花
]

可以看到这个例子中多维列表的第 0 维存放了很多朵花。而列表的第一个维度存放了花的四个特征，分别为：花萼的长度、花萼的宽度、花瓣的长度、花瓣的宽度。像这样组织好的数据（数据格式为列表（list）/ numpy.array / 张量（Tensor）中的一种，且第 0 维存放各个成员（Member）其他维存放特征（Feature））就可以作为被 TensorFlow 读取和使用的数据集啦。

2.2.2 从磁盘数据中构建数据集

在上述的例子中，由于数据量很小我们可以直接将数据存到电脑内存中，但是当数据量很大时，我们便不方便将数据全部读取到内存中以列表的形式存放了。所幸TensorFlow为我们提供了一种高效地从磁盘读取数据的方法 TFRecord。与传统的图片或文本等文件相比，使用 TFRecord 格式的文件存储形式可以极大的提升我们读取数据的速度（此前文章有声称读取速度比以前快 10 倍）。下面我们分别介绍TFRecord 的数据结构、如何制作 TFRecord 文件以及如何从 TFRecord 文件中读取数据。

TFRecord 数据结构

对于 TFRecord 文件，其中的数据组织结构像俄罗斯套娃一样一层套着一层，一共有两种嵌套的方式下所示。

# TFRecord 文件嵌套结构1
Example{
	Features{
		key: Feature
		key: Feature
	}
}

# TFRecord 文件嵌套结构2
SequenceExample{
	FeatureLists{
		key: FeatureList{
				Feature
				Feature
			}
		key: FeatureList{
				Feature
				Feature
			}
	}
}

从图中我们可以看到两种嵌套方式分别为：Example-Features-Feature 以及SequenceExample-FeatureLists-FeatureList-Feature。其中 Feature 可以接受 3 种类型的数据，分别为字符串（ButesList），实数列表（FloatList）和整数列表（Int64List）； Features 为一个将键名（key）和值（Feature）相互对应的字典；FeatureList 为 Feature 的列表；FeatureLists 为一个将键名（key）和值（FeatureList）想回对应的字典，如图所示为 TFRecord 各个组成成分的真实格式（为了简单起见，这里其中只展示了部分格式，读完此节如果有兴趣继续了解全部格式可以去查阅相关资料）。

message Example{
	Feature features;
};

message Features{
	map<string,Feature> feature;
};

message Feature{
	one of kind{
		BytesList bytes_list;
		FloatList float_list;
		Int64List int64_list;
	}
};

message SequenceExample{
	FeatureList featurelists;
};

message FeatureLists{
	map<string,FeatureList> featurelist;
};

message FeatureList{
	Feature[] feature;
};

TFRecord 文件制作

上一小节中，我们了解到 TFRecord 文件本质上是一种嵌套的数据结构，其中嵌套的每一层存放什么数据并没有特定的要求。但是为了方便读者的理解和区分上面的两种嵌套形式的区别，我们对其中每一层存放什么样的数据进行了强制要求，同时这样的强制要求便于后面我们从TFRecord 文件中读取数据形成数据集。

为了统一写入规范，现在我们规定写入 TFRecord 文件的内容只能是二维的列表（只有第 0 维和第 1 维）。对于列表的维度小于二维的情况，我们可以将一个元素作为一个维度，将其变为二维列表。对于维度大于二维的情况，我们可以将高维的数据展平为二维，由于这样会丢失数据的形状特征，我们可以用另外的一个列表来储存数据的形状特征。其中第 0 维和之前在数据集中的定义一致用于存放各个成员（Member）而第 1 维用于存放成员的特征（Feature）。如果特征（Feature）的维度大于一维可以将其展平为一维的列表并建立新的列表存放其形状特征。也就是说对于一个新的 AI 项目时，我们如果想要将其写入 TFRecord，那么我们要做的第一步便是将数据整理成上面描述的这种二维列表的形式。

下面的代码展示了如何将两个二维列表写入 TFRecord 文件中。对于初学者来说可能很难理解，我们先展示代码之后再慢慢逐条解析。

import tensorflow as tf

datas = [[1., 1.], [1., 2.]]
labels = [[1, 2], [1, 3]]

writer = tf.io.TFRecordWriter("test.tfrecord")
for data, label in zip(datas,labels):
    data_feature =list(map(lambda data_input: tf.train.Feature(float_list=tf.train.FloatList(value=[data_input])),data))
    label_feature=list(map(lambda label_input: tf.train.Feature(float_list=tf.train.FloatList(value=[label_input])),label))
    data_feature_list = tf.train.FeatureList(feature=data_feature)
    label_feature_list = tf.train.FeatureList(feature=label_feature)
    feature_lists = tf.train.FeatureLists(feature_list={"data":data_feature_list,
                                                        "label":label_feature_list,})
    example = tf.train.SequenceExample(feature_lists=feature_lists)
    writer.write(example.SerializeToString())
writer.close()

下面我们来对上述代码进行逐条解析。对于 TFRecord 文件，TensorFlow 提供了类 tf.io.TFRecordWriter 来对文件进行写入。tf.io.TFRecordWriter 类中的方法如下所示。

class TFRecordWriter:
    # 定义将数据写入 TFRecord 文件类
    def __init__(path, option=None):
        # 打开 path 文件 并创建一个它的 TFRecordWriter
        pass

    def __enter__(self):
        # 进入一个 with 块 打开文件
        pass
    
    def __exit__(self):
        # 退出一个 with 块 关闭文件
        pass
    
    def flush(self):
        # 刷新文件
        pass
    
    def writer(self):
        # 将字符串写入文件
        pass

从其中我们可以看到我们可以通过 init 方法实例化这个类来打开一个文件，通过 writer 方法向其中写入一些信息，最后通过 close 方法来关闭已经打开的文件。同时由于这个类中还包含 enter 以及 exit 方法，所以我们也可以通过 with as 语句来打开一个文件向其中写入信息，如下面代码所示展现了两种TFRecordWriter的使用方法。

import tensorflow as tf

# TFRecordWriter 第一种使用方法
writer = tf.io.TFRecordWriter('test.tfrecord')
writer.write(record)
writer.close()

# TFRecordWriter 第二种使用方法
with tf.io.TFRecordWriter('test.tfrecord')
    writer.write(record)

在掌握了 tf.io.TFRecord 类的使用方法之后，我们现在唯一需要关系的便是如何构建向文件中写入的 record，即如何将二维数组整理成合理的形式写入 TFRecord 文件中。对于一个二维数据，我们按照第 0 维的元素，它的成员（Member），对其进行逐个读取。每次仅读取一个成员（Member）的特征（Feature）并整理成一条 record 按顺序写入 TFRecord 文件中。

下面按照此前讲解的 TFRecord 文件的嵌套格式组织 record。若按照第一种嵌套方式 Example-Features-Feature。在这个例子中， datas 和 labels 各有两个成员其中每个成员（Member）有两个特征（Feature）。每一次循环读取 datas 和 labels 各有一个成员（Member）即 data 和 label，这两个成员一共有四个特征。由此我们可以得到下面的 TensorFlow 代码，将特征（Feature）嵌套在许多特征（Features）的字典中，并将许多特征（Features）的字典嵌套在例子（Example）中。由于向 TFRecord 文件中只能写入字符串，最后通过 Example 中
的方法 SerializedToString() 将 Example 序列化后转化为字符串，即可作为 record写入 TFRecord 文件中。

import tensorflow as tf

datas = [[1., 1.], [1., 2.]]
labels = [[1, 2], [1, 3]]

writer = tf.io.TFRecordWriter('test.tfrecord')
for data, label in zip(datas, labels):
    data_feature1 = tf.train.Feature(float_list=tf.train.FloatList(value=[data[0]]))
    data_feature2 = tf.train.Feature(float_list=tf.train.FloatList(value=[data[1]]))
    label_feature1 = tf.train.Feature(float_list=tf.train.FloatList(value=[label[0]]))
    label_feature2 = tf.train.Feature(float_list=tf.train.FloatList(value=[label[1]]))
    features = tf.train.Features(feature={'data1': data_feature1,
                                          'data2': data_feature2,
                                          'label1': label_feature1,
                                          'label2': label_feature2,})
    example = tf.train.Example(features=features)
    writer.write(example.SerializeToString())
writer.close()

同样我们也可以按照第二种嵌套方式 SequenceExample-FeatureLists-FeatureListFeature 来组织 record，由此我们可以得到下面的 TensorFlow 代码，将 data 中的两个特征（Feature）嵌套在一个特征列表（FeatureList）中而把 label 中的两个特征（Feature）嵌套在另一个特征列表（FeatureList）中，并将特征列表（FeatureList）嵌套在许多特征列表（FeatureLists）的字典中，此后将许多特征列表（FeatureLists）嵌套在序列例子（SequenceExample）中，最后通过 SequenceExample 中的方法 SeralizedToString() 将 SequenceExample 序列化后转化为字符串，即可作为 record 写入 TFRecord 文件中。

writer = tf.io.TFRecordWriter("test.tfrecord")

for data, label in zip(inverse_datas,inverse_labels):
    data_feature =list(map(lambda data_input: tf.train.Feature(float_list=tf.train.FloatList(value=[data_input])),data))
    label_feature=list(map(lambda label_input: tf.train.Feature(float_list=tf.train.FloatList(value=[label_input])),label))
    data_feature_list = tf.train.FeatureList(feature=data_feature)
    label_feature_list = tf.train.FeatureList(feature=label_feature)
    feature_lists = tf.train.FeatureLists(feature_list={"data":data_feature_list,
                                                        "label":label_feature_list,})
    example = tf.train.SequenceExample(feature_lists=feature_lists)
    writer.write(example.SerializeToString())
writer.close()

由此我们便完成了将收集到的数据制作成 TFRecord 文件的过程，下面我们将学习如何从 TFRecord 文件中读取数据构建数据集。

TFRecord 文件读取

下面的工作便是从 TFRecord 文件中读取数据形成数据集了。从上面 TFRecord 文件的制作过程中，我们可以发现 TFRecord 文件是不同的结构嵌套在一起作为 record 写入文件中的。这样的结构在读取过程中需要根据其中的结构特点来对数据进行读取。我们下面以之前创建的 test.tfrecord 为例讲解如何从 TFRecord 文件中读取数据。废话不多说啦，按老规矩先给出全部的代码下所示，最后再逐条进行解析。

import tensorflow as tf

def single_example_parser(serialized_example):
    sequence_features = {
        "data": tf.io.FixedLenSequenceFeature([],dtype=tf.float32),
        "label": tf.io.FixedLenSequenceFeature([],dtype=tf.float32),
    }
    _, sequence_parsed = tf.io.parse_single_sequence_example(serialized=serialized_example,
                                                             sequence_features=sequence_features)
    data = sequence_parsed['data']
    label = sequence_parsed['label']
    return data,label


raw_dataset=tf.data.TFRecordDataset('test.tfrecord')
dataset=raw_dataset.map(lambda x: single_example_parser(x))

for data, label in dataset:
     print(data.numpy(), label.numpy())

下面我们来对上述代码进行逐条解析。TFRecord 文件的读取最为重要的事便是对解析函数的定义 single_example_parser，随后便可以使用 map 函数批量对 TFRecord 中的数据进行解析。然而 TensorFlow 的内置函数中并没有包含这个 single_example_parser 解析函数，因为每个项目开发人员向 TFRecord 中写入的数据格式各不相同，所以无法得到一个统一的解析函数。但 TensorFlow 给我们提供了 tf.parse_single_example 和 tf.parse_single_sequence_example 两个半成品函数，使得我们可以用来构造 single_exmaple_parser 用来分别解析 Example 以及 SequenceExample。

现在只要完成解析函数的定义就好了。解析函数的定义一共分为两步，第一步是对解析字典的定义，解析字典的作用是告诉 tf.parse_single_example 和 tf.parse_single一sequence_example 两个半成品解析函数将解析的 TFRecord 文件中数据结构是什么样的。从之前对 TFRecord 文件结构的讲解中我们可以看到，
TFRecord 文件的结构通常最外层是一个字典，内部是列表的嵌套。故解析字典的定义需要说明这个字典是什么样的，有哪些键（key），以及其中的值（key）是什么形状以及什么类型。第二步便是使用半成品解析函数来得到解析出来的一个字典，并根据字典中的内容从字典中提取信息进行返回，最终得到的解析函数如下面的代码所示。

def single_example_parser(serialized_example):
    sequence_features = {
        "data": tf.io.FixedLenSequenceFeature([],dtype=tf.float32),
        "label": tf.io.FixedLenSequenceFeature([],dtype=tf.float32),
    }
    _, sequence_parsed = tf.io.parse_single_sequence_example(serialized=serialized_example,
                                                             sequence_features=sequence_features)
    data = sequence_parsed['data']
    label = sequence_parsed['label']
    return data,label

在完成了解析函数的定义之后，后续的工作便很简单了。通过 tf.data.TFRecordDataset 读取 TFRecord 文件中的原始未解析的数据。使用 map 函数将此前定义的解析函
数作用到原始未解析数据上即可得到数据集。此时的数据集可以理解为一个一维列表，其中每个元素为原来的一个成员（Member），而每个成员（Member）由一个元组（data，label）组成，我们可以通过 for 循环将dataset中的成员（Member）逐个打印出来。

2.3 小结

在这一章中我们学习了构建数据集的两种方法，从内存中读取数据构建数据集以及从磁盘中构建数据集的方法。其中虽然从磁盘中构建数据集部分对读者写入 TFRecord 文件的要求较为严格，不如要先把数据整理成二维数组，但这样的目的是为了方便读者进行理解和运用。

除了这一章的两种方法外，还有一些其他的方法如从 csv 文件中读取数据，恕笔者不能一一展示。一开始笔者已经提及，笔者只能带读者走通其中的一条路。如果读者对其他制作数据集的方法感兴趣可以自行进行学习，目的在于抛转引玉。带领读者走进深度学习 TensorFlow 的领域，之后的花花世界需要读者自行探索啦。

Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
关于python版本与TensorFlow安装的版本问题 iiimharrygGc. python tensorflow 开发语言
实测在conda环境下，python3.12的版本无法安装TensorFlow2.14.0（截至2024.5.21）最新版本在python3.7版本下正常安装ps：上述安装均在anacondanavigator软件内安装
Vue + Django的人脸识别系统 DXSsssss python DRF tensorflow 人脸识别
最近在研究机器学习，刚好最近看了vue+Djangodrf的一些课程，学以致用，做了一个人脸识别系统。项目前端使用Vue框架，用到了elementui组件，写起来真是方便。比之前传统的dtl方便了太多。后端使用了drf，识别知识刚开始打算使用opencv+tensorflow,但是发现吧识别以后的结果返回到浏览器当中时使用opencv比较麻烦（主要是我太菜，想不到比较好的方法），因此最终使用了tf
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】小白也能懂的 TensorFlow 和 PyTorch GPU 配置教程 ShuQiHere tensorflow pytorch 人工智能
【ShuQiHere】在深度学习中，GPU的使用对于加速模型训练至关重要。然而，对于许多刚刚入门的小白来说，如何在TensorFlow和PyTorch中指定使用GPU进行训练可能会感到困惑。在本文中，我将详细介绍如何在这两个主流的深度学习框架中指定使用GPU进行训练，并确保每一个步骤都简单易懂，跟着我的步骤来，你也能轻松上手！1.安装所需库首先，确保你已经安装了TensorFlow或PyTorch
TensorFlow的基本概念以及使用场景张柏慈决策树
TensorFlow是一个机器学习平台，用于构建和训练机器学习模型。它使用图形表示计算任务，其中节点表示数学操作，边表示计算之间的数据流动。TensorFlow的主要特点包括：1.多平台支持：TensorFlow可以运行在多种硬件和操作系统上，包括CPU、GPU和移动设备。2.自动求导：TensorFlow可以自动计算模型参数的梯度，通过优化算法更新参数，以提高模型的准确性。3.分布式计算：Ten
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
轻松升级：Ollama + OpenWebUI 安装与配置【AIStarter】 ai_xiaogui AI作画 AI软件人工智能 AI写作 AIStarter
Ollama是一个开源项目，用于构建和训练大规模语言模型，而OpenWebUI则提供了一个方便的前端界面来管理和监控这些模型。本文将指导你如何更新这两个工具，并顺利完成配置。准备工作确保你的系统已安装Git和Python环境。安装必要的依赖库，如TensorFlow或PyTorch等。更新步骤克隆项目：使用Git命令行工具克隆最新的Ollama和OpenWebUI仓库到本地。更新代码：确保你正在使
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
ImportError: cannot import name ‘conv_utils‘ from ‘keras.utils‘ CheCacao keras 深度学习 python tensorflow tensorflow2 人工智能
将fromkeras.utilsimportconv_utils改为fromtensorflow.python.keras.utilsimportconv_utilsImportError:nomodulenamed'tensorflow.keras.engine将fromkeras.engine.topologyimportLayer改为fromtensorflow.python.keras.l
jupyter出错ImportError: cannot import name ‘np_utils‘ from ‘keras.utils‘ ，怎么解决？七月初七淮水竹亭～人工智能 python jupyter keras 深度学习
文章前言此篇文章主要是记录一下我遇到的问题以及我是如何解决的，希望下次遇到类似问题可以很快解决。此外，也希望能帮助到大家。遇到的问题出错：ImportError:cannotimportname'np_utils'from'keras.utils'，如图：如何解决首先我根据网上文章的一些提示，将fromkeras.utilsimportnp_utils换成了fromtensorflow.keras
tensorflow和python不兼容_tensorflow与numpy的版本兼容性问题的解决 weixin_39727934
在Python交互式窗口导入tensorflow出现了下面的错误：ox8免费资源网root@ubuntu:~#python3Python3.6.8(default,Oct72019,12:59:55)[GCC8.3.0]onlinuxType"help","copyright","credits"or"license"formoreinformation.>>>importtensorflowas
numpy python 兼容_tensorflow与numpy的版本兼容性问题 weixin_39761822 numpy python 兼容
在Python交互式窗口导入tensorflow出现了下面的错误：root@ubuntu:~#python3Python3.6.8(default,Oct72019,12:59:55)[GCC8.3.0]onlinuxType"help","copyright","credits"or"license"formoreinformation.>>>importtensorflowastf;/usr/
安装tensorflow2.5.0 发现 tensorflow 和 numba 两者对应Numpy版本冲突 GJK_ tensorflow numpy 人工智能
问题：python3.8安装tensorflow2.5.0发现tensorflow和numba两者对应Numpy版本冲突tensorflow-gpu2.5.0requiresnumpy~=1.19.2numba0.58.1requiresnumpy=1.22解决方法：将numba降低版本为0.53pipinstallnumba==0.53再将numpy版本改为1.19.2pipinstallnum
python3.7安装keras教程_python 3.7 安装 sklearn keras(tf.keras) weixin_39641103
#1sklearn一般方法网上有很多教程，不再赘述。注意顺序是numpy+mkl，然后scipy的环境，scipy，然后sklearn#2anocondaanaconda原始的环境已经自带了sklearn，这里说一下新建环境（比如创建了一个tensorflow的环境），activatetensorflow2.0，然后condainstallsklearn即可，会帮你把各种需要的库都安装。#kera
Python高层神经网络 API库之Keras使用详解 Rocky006 python keras 开发语言
概要随着深度学习在各个领域的广泛应用，许多开发者开始使用各种框架来构建和训练神经网络模型。Keras是一个高层神经网络API，使用Python编写，并能够运行在TensorFlow、CNTK和Theano之上。Keras旨在简化深度学习模型的构建过程，使得开发者能够更加专注于实验和研究。本文将详细介绍Keras库，包括其安装方法、主要特性、基本和高级功能，以及实际应用场景，帮助全面了解并掌握该库的
将本地已有的项目上传到新建的git仓库的方法 10676
将本地已有的一个非git项目上传到新建的git仓库的方法一共有两种。一、克隆+拷贝第一种方法比较简单，直接用把远程仓库拉到本地，然后再把自己本地的项目拷贝到仓库中去。然后push到远程仓库上去即可。此方法适用于本地项目不是一个git仓库的情况。1、首先克隆[email protected]:yuanmingchen/tensorflow_study.git2、然后复制自己项目的所有文件到
Python(PyTorch和TensorFlow)图像分割卷积网络导图(生物医学) 亚图跨际交叉知识 Python 生物医学脑肿瘤图像皮肤病变多模态医学图像多尺度特征生物医学腹部胰腺图像病灶边界气胸图像
要点语义分割图像三层分割椭圆图像脑肿瘤图像分割动物图像分割皮肤病变分割多模态医学图像多尺度特征生物医学肖像多类和医学分割通用图像分割模板腹部胰腺图像分割分类注意力网络病灶边界分割气胸图像分割Python生物医学图像卷积网络该网络由收缩路径和扩展路径组成，收缩路径是一种典型的卷积网络，由重复应用卷积组成，每个卷积后跟一个整流线性单元(ReLU)和一个最大池化操作。在收缩过程中，空间信息减少，而特征信
AttributeError: ‘tuple‘ object has no attribute ‘shape‘ 晓胡同学 keras 深度学习 tensorflow
AttributeError:‘tuple’objecthasnoattribute‘shape’在将keras代码改为tensorflow2代码的时候报了如下错误AttributeError:'tuple'objecthasnoattribute'shape'经过调查发现，损失函数写错了原来的是这样model.compile(loss=['binary_crossentropy'],optimi
Autoencoder chuange6363 人工智能 python
自编码器Autoencoder稀疏自编码器SparseAutoencoder降噪自编码器DenoisingAutoencoder堆叠自编码器StackedAutoencoder本博客是从梁斌博士的博客上面复制过来的，本人利用Tensorflow重新实现了博客中的代码深度学习有一个重要的概念叫autoencoder，这是个什么东西呢，本文通过一个例子来普及这个术语。简单来说autoencoder是一
OSError: libnccl.so.2: cannot open shared object file: No such file or directory 王小葱鸭 python
linux安装完torch或者tensorflow的gpu版本，安装没问题，但是import就有问题，报错OSError:libnccl.so.2:cannotopensharedobjectfile:Nosuchfileordirectory，是缺少nvidia的ncll，下面介绍解决方法：1安装ncll下载链接https://developer.nvidia.com/nccl/nccl-dow
深度学习框架人工智能操作系统训练&前向推理 PyTorch Tensorflow MindSpore caffe 张量加速引擎TBE 深度学习编译器多面体 polyhedral AI集群框架 EwenWanW 深度学习人工智能 pytorch 深度学习编译器
深度学习框架人工智能操作系统训练&前向推理深度学习框架发展到今天，目前在架构上大体已经基本上成熟并且逐渐趋同。无论是国外的Tensorflow、PyTorch，亦或是国内最近开源的MegEngine、MindSpore，目前基本上都是支持EagerMode和GraphMode两种模式。AI嵌入式框架OneFlow&清华计图Jittor&华为深度学习框架MindSpore&旷视深度学习框架MegEn
Tensorflow中Keras搭建神经网络六步法及参数详解 -- Tensorflow自学笔记12 青瓷看世界 tensorflow 笔记人工智能深度学习神经网络
一.tf.keras搭建神经网络六步法1.import相关模块如importtensorflowastf。2.指定输入网络的训练集和测试集如指定训练集的输入x_train和标签y_train，测试集的输入x_test和标签y_test。3.逐层搭建网络结构model=tf.keras.models.Sequential()。4.在model.compile()中配置训练方法选择训练时使用的优化器、
MacBook Air M1 使用 miniconda 安装python3.11.7 和 tensorflow2.16.1详细 - TensorFlow自学笔记1 青瓷看世界 tensorflow tensorflow 人工智能 mac python 深度学习
1m1mac安装xcode命令工具在Terminal终端执行以下代码：xcode-select--install2下载支持m1芯片arm64的miniconda在miniconda官网，找到下图中保护AppleM1的bash安装包，Miniconda—Anacondadocumentation3安装miniconda在Terminal执行下列代码：1）cd"miniconda下载目录"2）bash
机器学习框架巅峰对决：TensorFlow vs. PyTorch vs. Scikit-Learn实战分析 @sinner 技术选型机器学习 tensorflow pytorch scikit-learn
1.引言1.1机器学习框架的重要性在机器学习的黄金时代，框架的选择对于开发高效、可扩展的模型至关重要。合适的框架可以极大地提高开发效率，简化模型的构建和训练过程，并支持大规模的模型部署。因此，了解和选择最合适的机器学习框架对于研究人员和工程师来说是一个关键的步骤。1.2三大框架概览：TensorFlow、PyTorch、Scikit-Learn目前，最流行的机器学习框架主要有TensorFlow、
Tensorflow2.16中的Keras包含哪些层(layers)?层的功能及参数详细解释 -- TensorFlow自学笔记6 青瓷看世界 tensorflow tensorflow keras 人工智能
在Keras中，层（Layer）是构建神经网络的基本组件。Keras提供了多种类型的层，用于处理不同类型的输入数据和执行特定的数学操作。英文版可参考TensorFlow官方文档：Module:tf.keras.layers|TensorFlowv2.16.1一.层的分类‌1.基本网络层‌1.1.Dense层用于执行全连接操作；1.2.卷积层Conv1D、Conv2D、Conv3D层，用于执行一维、
Tensorflow2 如何扩展现有数据集(缩放、随机旋转、水平翻转、平移等)，从而提高模型的准确率 -- Tensorflow自学笔记14 青瓷看世界 tensorflow 人工智能 python
实际生活中的数据集，往往不是标准的数据，而是有倾斜角度、有旋转、有偏移的数据，为了提高数据集的真实性，提高模型预测的准确率，可以用ImageDataGenerator函数来扩展数据集importtensorflowastffromtensorflow.keras.preprocessing.imageimportImageDataGeneratorimage_gen_train=ImageData
机器学习100天-Day2503 Tensorboard 训练数据可视化（线性回归）我的昵称违规了
首页.jpg源代码来自莫烦python(https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/4-1-tensorboard1/)今日重点读懂教程中代码，手动重写一遍，在浏览器中获取到训练数据Tensorboard是一个神经网络可视化工具，通过使用本地服务器在浏览器上查看神经网络训练日志，生成相应的可是画图，帮助炼丹师
Python(TensorFlow)和Java及C++受激发射损耗导图亚图跨际 Python 交叉知识算法去噪预测算法聚焦荧光团伪影消除算法囊泡动力学自动化多尺度统计物距
要点神经网络监督去噪预测算法聚焦荧光团和检测模拟平台伪影消除算法性能优化方法自动化多尺度囊泡动力学成像生物研究多维分析统计物距粒子概率算法Python和MATLAB图像降噪算法消除噪声的一种方法是将原始图像与表示低通滤波器或平滑操作的掩模进行卷积。例如，高斯掩模包含由高斯函数确定的元素。这种卷积使每个像素的值与其相邻像素的值更加协调。一般来说，平滑滤波器将每个像素设置为其自身及其附近相邻像素的平均
中文车牌识别系统 `End-to-end-for-Chinese-Plate-Recognition` 教程皮静滢Annette
中文车牌识别系统End-to-end-for-Chinese-Plate-Recognition教程End-to-end-for-chinese-plate-recognition基于u-net，cv2以及cnn的中文车牌定位，矫正和端到端识别软件，其中unet和cv2用于车牌定位和矫正，cnn进行车牌识别，unet和cnn都是基于tensorflow的keras实现项目地址:https://gi
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

构建数据集