fengyuxie

深度学习实战篇之 ( 六) -- TensorFlow学习之路（三）

科普知识

Geffery Hinton被称为“深度学习之父”、“神经网络先驱”、“AI教父”，他的名字响彻整个AI领域，他的一举一动，都是热点导向。以深度神经网络为代表的深度学习模型，在19世纪70年代进入寒潮以来，再次焕发出活力、得到学术界和工业界广泛关注，与他的贡献密不可分。

前言

上期的文章中，我们学会了TensorFlow中全连接层的搭建和输入数据的喂入方法，这些都是构建深度学习项目的基础，本来打算再详细介绍下TensorFlow中卷积层的搭建，但是实际看来单纯的介绍卷积层并没有必要，我们可以在实战项目中再进行解读，有些东西只要能看懂，会怎么用即可，今天我们就来讲解实战项目的第一步--图像分类数据构建。

一、TensorFlow之图像分类数据构建

本次实战项目是TensoerFlow的第一个项目，对于第一的个项目，小编决定采用自己最熟悉的东西--图像分类，顾名思义，就是将不同类别的图像进行分类，每一个图像有自己独特的标签，就像每一个人都有自己的名字一样，当然，我们这里的图像分类数目一般不会太多。

初学者掌握2分类-10分类即可，代码都是相通的，只有分类数目不同，如果我们要做猫狗分类项目，那么即为二分类，输入一张猫或者狗的图像，训练好深度学习模型会自动输出该图片的分类所属，也就是具体的标签（是猫还是狗），如下文图所示。如果是做人脸识别，则每一个图像的标签为人的姓名，有多少个不同的人，就有多少个分类数目。

第一项目我们做二分类实战--猫狗识别，该项目的代码的过程主要包括五个部分，分别是：数据构建，模型搭建，模型训练，模型验证，模型测试。今天先分享数据构成部分。

1.1数据构建

对于深度学习的分类项目，一般第一步是数据构建部分，即对神经网络的输入数据进行构建，并不是随便的输入一张图像即可，先回顾一下我们在理论篇中讲解的神经网络模型的运行过程是读取数据本身和其标签，数据本身传入网络进行学习，网络的输出则和标签进行比较（进行损失函数计算），最后通过损失函数来对神经网络模型进行参数更新，反复迭代，直到神经网络模型输出的值与标签十分接近即可认为训练成功，进而结束训练。

那么神经网络的输入数据是怎样的呢？首先我们的数据是图像数据，图像数据有自己的维度信息，也就是长宽高（即三个维度），其次标签则是图像的类别（是猫还是狗），通常包含两个文件夹，一个是所有图像时猫的文件夹，另一个是所有图像是狗的文件夹，这两个文件夹的名字自然就是猫和狗了，一般来说，做深度学习项目，我们会区分训练集和验证集，甚至还有测试集，这三个集不包含同一个图像，也就是同一个图像只能单一的出现在一个集里面，这样做的好处是，如果在训练集中进行了训练，我们需要在验证集上验证我们的模型的好坏，但是验证集中不存在训练集中出现过的图像，因为训练过的图像肯定是认识的，神经网络就是要到达训练目标后实现预测类似目标而不是统一目标的效果，这样才能检测器性能。所以这三个集也就是三个不同的文件夹（一般用train,val,test进行文件夹命名），然后每一个文件夹下面就是包含了猫和狗图像的两个文件夹，如下图所示：

这里为了简便，我们只用到了训练集个测试集

训练集：

测试集：

图像展示：

在实际的输入过程中，图像的标签我们会设置成数字作为神经网络的输入（比如，cat对应0，dog对应1），之前的举例中，神经网络的模型是一个数据吗，对应这里是一张图像，这样的话训练太慢，因为深度学习的数据通常是成千上万，因此，深度学习训练的时候支持批数据训练，即可以一次性学习几十张图像，以此加快学习过程，事实证明也必须这样做，不然就太浪费资源了，同时训练的效果会更好。

1.2 代码实现（一）

由于深度学习平台支持批数据的读取方式，因此我们考虑的方法是将所有的图像的文件路径和标签一次性读取出来，而不是读取图像数据本身，然后采用队列的方式用TensorFlow读取一批数据后用于训练，这个时候就是读取一批数据的路径和标签，然后根据路径获取到真实的图像数据，随后传入到神经网络模型。因此，代码的第一部分为，读取所有的图像路径和对应的标签，由于我们标签名就是文件夹的名字，因此同一个文件夹下的图像的标签都是一样的，都是狗或者都是猫。实际代码如下：

def get_files(file_dir):
    # 声明两个列表，一个用于装图像的路径，一个用于装图像的标签
    image_list, label_list = [], []
    # 循环进入文件夹读取图像路径和标签
    for label in os.listdir(file_dir):
        # 这里进入到cat或者dog目录
        print("当前的label:{}".format(label))
        img_dir = file_dir + label
        print("img_dir:{}".format(img_dir))
        for img in os.listdir(img_dir):
            print("img:{}".format(img))
            #这里进入到cat文件夹获取到图像的路径
            img_path = img_dir + '/' + img
            print("img_path:{}".format(img_path))
            # 添加对应的图像路径和标签到事先准备好的列表中
            image_list.append(img_path)
            label_list.append(int(label_dict[label]))
    # 获取当前的训练集或者测试集中有多少图像
    print('There are %d data' %(len(image_list)))
    # 将图像路径与标签转换为numpy 数组类型，这里会形成两行，一行是所有图像的路径，一行是对应的标签
    temp = np.array([image_list, label_list])
    print("temp:{}".format(temp))
    # 进行转置，也就是反转变成两列，第一列是图像路径，第二列是标签，同一行的表示为：图像路径，图像标签
    temp = temp.transpose()
    print("temp2:{}".format(temp))
    #然后就是以行为单位打乱数据，便于后期训练，注意这里同一行的数据没有打乱，只是第n行可能变成了第一行 第二行类似
    np.random.shuffle(temp)


    # 取出打乱后的图像路径（所有）
    image_list = list(temp[:, 0])
    print("image_list:{}".format(image_list))
     # 取出打乱后的图像标签（所有）
    label_list = list(temp[:, 1])
    print("label_list:{}".format(label_list))
    # 将标签中的每一个数字转换为整数
    label_list = [int(i) for i in label_list]
    print("label_list:{}".format(label_list))
    # print(image_list)
    # print()
    # print(label_list)
    return image_list, label_list

为便于各位朋友查看每一行代码的执行结果，小编打印出来了，进入到第一个文件夹的结果：

第二个文件夹：

以上代码的最终返回结果是两个列表，一个包含了所有的图像路径，另一个包含了所有图像对应的标签（0或者1），代码的流程为：首先进入到train或者val文件夹，随后获取下面的具体的分类文件夹，紧接着进入某一个分类文件夹获取到所有的图像名，然后根据前面的一个个文件夹组成图像的实际存储路径，然后根据分类文件夹得到标签，进而将当前图像路径和其标签存储在两个列表，循环获取完每一个分类文件夹下的图像即可结束，最终的返回结果如下：

1.3 代码实现（二）

前面已经获取到了训练集或者验证集中所有的图像和标签，下一步就是利用TensorFlow获取一定数量的批数据（此时为图像的路径）将其转换为实际的图像数据，这个时候的数据是Tensor格式，对应的标签也是，批数据可以自己指定，通常为16的倍数：8,16,32,128等等，即一次性读取多少张图像用于训练，实现代码如下：

def get_batch(image, label, image_W, image_H, batch_size, capacity,is_training):
    # 将图像和标签转换为tensor格式
    image = tf.cast(image, tf.string)
    label = tf.cast(label, tf.int32)
    # make an input queue
    # 形成队列 用于循环读取
    input_queue = tf.train.slice_input_producer([image, label], shuffle=False)
    # 取出标签
    label = input_queue[1]
    # 根据图像路径读取为图像
    image_contents = tf.read_file(input_queue[0])
    # 图像解码，也就是长宽高的维度数据
    image = tf.image.decode_jpeg(image_contents, channels=3)
    # 统一图像尺寸
    image = tf.image.resize_images(image, (image_W, image_H))
    # 数据增强，如果是训练集通常做一点改变，增加图像复杂度，让网络学习得更多
    if is_training:
        #image = tf.image.resize_image_with_pad(image, target_height=image_W, target_width=image_H
        # 随机左右翻转
        image = tf.image.random_flip_left_right(image)
        # 随机上下翻转
        image = tf.image.random_flip_up_down(image)
        # 随机设置图片的亮度
        image = tf.image.random_brightness(image, max_delta=32/255.0)
        # 随机设置图片的对比度
        #image = tf.image.random_contrast(image, lower=0.5, upper=1.5)
        # 随机设置图片的色度
        image = tf.image.random_hue(image, max_delta=0.05)
        # 随机设置图片的饱和度
        #image = tf.image.random_saturation(image, lower=0.5, upper=1.5)
    # 标准化,使图片的均值为0，方差为1，图像归一化
    image = image/255
    # 生成为批数据
    image_batch, label_batch = tf.train.batch([image, label],
                                                batch_size= batch_size,
                                                num_threads= 64,
                                                capacity = capacity)
    # tf.summary.image("input_img", image_batch, max_outputs=5)
    # 改变维度形状为批数据的大小，如果是16的批数据，则标签也为16个，一一对应
    label_batch = tf.reshape(label_batch, [batch_size])
    # 图像数据转换为浮点类型
    image_batch = tf.cast(image_batch, tf.float32)
    # 返回一个批次图像的真是数据和标签。都为Tensor格式
    return image_batch, label_batch

以上批数据的结果需要集合队列来查看，并且在TensorFlow打开会话的方式下查看，代码如下：



if __name__ == '__main__':
    IMG_W = 150  # resize图像，太大的话训练时间久
    IMG_H = 150
    BATCH_SIZE = 128  
    CAPACITY = 256
    # 获取批次batch
    train_dir = '../data/train/'  # 训练样本的读入路径


    test_dir = '../data/test/'  # 测试样本的读入路径
    train, train_label = get_files(train_dir)
    # print(np.array(train).shape)
    val, val_label = get_files(test_dir)
    sess = tf.Session()


    # 批数据-训练数据及标签
    train_batch, train_label_batch = get_batch(train, train_label, IMG_W, IMG_H, BATCH_SIZE, CAPACITY,True)
    
    # 批数据-测试数据及标签
    val_batch, val_label_batch = get_batch(val, val_label, IMG_W, IMG_H, BATCH_SIZE, CAPACITY,False)
    # 队列监控
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)


    try:
        for step in np.arange(10000):


            if coord.should_stop():
                break


            tr_batch, tr_bat_label = sess.run([train_batch, train_label_batch])


            print("%%%%%%%%%%%%% train.type=={} train_label.shape:{} %%%%%%%%%%%%%".format(tr_batch.shape, tr_bat_label.shape))






    except tf.errors.OutOfRangeError:
        print('Done training -- epoch limit reached')


    finally:
        coord.request_stop()

代码运行结果：

以上即可看到，我们最终输入神经网络的数据是一个批次的数据，这里我的批次为128，即一次性读取128张图像进入到神经网络中，图像的长宽高为：150,150,3，三通道彩色图像，标签的维度为：批数据的维度，即读取了多少张图像就会同时读取多少个标签，标签和图像是一一对应的，不能出错。

结语

以上内容就是今天的重点分享了，逻辑可能比较好理解，但是代码还是稍微有点复杂，代码中有几个函数可能大家没学过，不过没关系只要知道这个函数是干嘛的即可，如有有不懂的欢迎大家随时后台提问，也可以加小编的微信，我们一起探讨，另外需要注意的是，这种队列读取数据集的方式目前已经在新的版本中逐渐弃用，后期我们会再次分享一种更加简单的数据读取方式，只要是放入文件夹路径即可，下期的文章我们将会构建一个简单的神经网络，用于训练，敬请期待。

今天的内容希望大家好好吸收哦，先读懂逻辑（即我们的数据与标签构成的形式），然后去仔细看代码，有不懂的可以一行行进行调试，小编也在上面调试给大家看了，当初小编学习的时候也是不太懂，自己一行行调试懂了才逐渐往后面学习的，其次，这份代码是通用型代码，后期只需要改一下分类数目即可。

周末愉快，我们下期再见！

编辑：玥怡居士|审核：小圈圈居士

▼

往期精彩回顾

▼

深度学习实战篇之 ( 五) -- TensorFlow学习之路（二）

深度学习实战篇之 ( 四) -- TensorFlow学习之路（一）

深度学习实战篇之 ( 三) -- 初识人脸检测

过去的一年，我们都做了啥：

【年终总结】2021，辞旧迎新再出发

【年终总结】辞旧迎新，2020，我们再出发

扫

码

关

注

捎上健康的底气,装

上满心的喜气

嗨，你还在看吗？

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

深度学习实战篇之 ( 六) -- TensorFlow学习之路（三）

你可能感兴趣的:(神经网络,python,tensorflow,人工智能,深度学习)