qq_46102205

tfrecord生成

文章目录

验证码预处理

导入数据包
一、生成四位验证码
二、生成对应的验证码
三、生成图像
四、完整实现

生成tfrecord文件

导入库
一、定义数据参数
二、检查tfrecord文件是不是存在
三、获取图像文件
四、数据转换
五、定义数据
六、转换成tfrecord格式
七、判断是否存在并划分数据
八、完整实现

说明

验证码预处理

在我们训练验证码识别的网络的时候我们需要进行验证码数据的生成和生成训练所需要的tfrecord文件，所以博主这次讲解的内容是进行验证码网络训练过程中的图像和数据生成的预操作，让你生成你训练所需要的数据。

导入数据包

这里我们导入一个特殊的库，这个库是用来生成我们验证码图像的，我们基础库里面是没有的，我们需要提前进行下载

我们打开cmd命令提示符，我们在里面输入：pip install captcha 下载这个库

# 验证码生成器
from captcha.image import ImageCaptcha
import numpy as np
from PIL import Image
import random
import sys
import os

一、生成四位验证码

我们这里使用的是十个数字**（0-9）**来生成我们需要的数据，我们使用一个函数来生成，遍历四个数，我们随机从我们的列表里面挑选四个数字，然后返回到我们的验证码列表中。

number = list()
for i in range(10):
    number.append(str(i))
# alphact = [a-z]
# alpharet = [A-Z]

# 生成四位验证码
def random_captcha_text(char_set=number, captcha_size=4):
    # 验证码列表
    captcha_text = []
    for i in range(captcha_size):
        # 随机选择
        c = random.choice(char_set)
        # 加入验证码列表
        captcha_text.append(c)
    return captcha_text

二、生成对应的验证码

在这里我们生成对应的验证码，使用我们的库函数ImageCaptcha来生成，写入我们用数字名字定义的文件中并进行保存。

def gen_captcha_text_and_image():
    image = ImageCaptcha()  # 生成验证码对象
    # 获得随机生成的验证码
    captcha_text = random_captcha_text()
    # 把验证码列表转为字符串
    captcha_text = ''.join(captcha_text)
    # 生成验证码
    captcha = image.generate(captcha_text)
    if not os.path.exists('captcha/images/'):
        os.makedirs('captcha/images/')
    file_name = 'captcha/images/' + captcha_text + '.jpg'
    image.write(captcha_text, file_name)  # 写进文件

三、生成图像

在这里我们生成我们10000张图像，调用我们原来生成的函数gen_captcha_text_and_image()，写入我们的文件在里面，在这里值得注意的是我们生成的图像不是10000张，因为你随机生成可能会发生重复的图像，所以他生成的肯定没有我们定义的数量那么多。

num = 10000
if __name__ == '__main__':
    for i in range(num):
        gen_captcha_text_and_image()
        sys.stdout.write('\r>> Creating image %d/%d' % (i+1, num))
        sys.stdout.flush()
    sys.stdout.write('\n')
    sys.stdout.flush()
    print('生成完成')

四、完整实现

# 验证码生成器
from captcha.image import ImageCaptcha   # pip install captcha
import numpy as np
from PIL import Image
import random
import sys
import os

#
number = list()
for i in range(10):
    number.append(str(i))
# alphact = [a-z]
# alpharet = [A-Z]

# 生成四位验证码
def random_captcha_text(char_set=number, captcha_size=4):
    # 验证码列表
    captcha_text = []
    for i in range(captcha_size):
        # 随机选择
        c = random.choice(char_set)
        # 加入验证码列表
        captcha_text.append(c)
    return captcha_text

# 生成字符对应的验证码
def gen_captcha_text_and_image():
    image = ImageCaptcha()  # 生成验证码对象
    # 获得随机生成的验证码
    captcha_text = random_captcha_text()
    # 把验证码列表转为字符串
    captcha_text = ''.join(captcha_text)
    # 生成验证码
    captcha = image.generate(captcha_text)
    if not os.path.exists('captcha/images/'):
        os.makedirs('captcha/images/')
    file_name = 'captcha/images/' + captcha_text + '.jpg'
    image.write(captcha_text, file_name)  # 写进文件

# 数量少于10000，因为重名，生成一万张，但是会出现重名 所以不是10000张。
num = 10000
if __name__ == '__main__':
    for i in range(num):
        gen_captcha_text_and_image()
        sys.stdout.write('\r>> Creating image %d/%d' % (i+1, num))
        sys.stdout.flush()
    sys.stdout.write('\n')
    sys.stdout.flush()
    print('生成完成')

生成tfrecord文件

我们在生成数据的时候我们需要将数据转化成tfrecord文件，那就下来我们讲解的就是这个操作。

导入库

import tensorflow as tf
import os
import random
import math
import sys
from PIL import Image
import numpy as np

一、定义数据参数

定义数据的存储位置和其他基本的参数

# 验证集数量
_NUM_TEST = 500

# 随机种子
_RANDOM_SEED = 0

# 数据集路径
DATASET_DIR = "./captcha/images/"

# tfrecord文件存放路径
TFRECORD_DIR = "./captcha/"

二、检查tfrecord文件是不是存在

查看我们的tfrecord文件是不是存在，不存在我么就需要进行生成。

def _dataset_exists(dataset_dir):
    for split_name in ['train', 'test']:
        output_filename = os.path.join(dataset_dir, split_name + '.tfrecords')
        if not tf.gfile.Exists(output_filename):
            return False
    return True

三、获取图像文件

通过传入我们验证码图像的路径，来生成我们的文件路径的列表方便后面的读取。

def _get_filenames_and_classes(dataset_dir):
    photo_filenames = []
    for filename in os.listdir(dataset_dir):
        # 获取文件路径
        path = os.path.join(dataset_dir, filename)
        photo_filenames.append(path)
    return photo_filenames

四、数据转换

用来准换image数据和image对应的验证码的数据

def int64_feature(values):
    if not isinstance(values, (tuple, list)):
        values = [values]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=values))

def bytes_feature(values):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[values]))

五、定义数据

定义image数据和对应的值，使用上面提到的数据转换函数，返回结果

def image_to_tfexample(image_data, label0, label1, label2, label3):
    # Abstract base class for protocol messages.
    return tf.train.Example(features=tf.train.Features(feature={
        'image': bytes_feature(image_data),
        'label0': int64_feature(label0),
        'label1': int64_feature(label1),
        'label2': int64_feature(label2),
        'label3': int64_feature(label3),
    }))

六、转换成tfrecord格式

首先我们定义tfrecord文件的路径和名字，在后面我们遍历我们生成的文件名字的列表，打开图像文件，转换他的类型，在这个后面我们需要对数据进行resize，因为验证码生成的需要的大小是这样我们需要进行更改size，灰度化处理，转换为bytes，获取图像路径下的图像对应的数字（就是文件的文件名),在生成protocol数据类型。

def _convert_dataset(split_name, filenames, dataset_dir):
    assert split_name in ['train', 'test']
    
    with tf.Session() as sess:
        # 定义tfrecord文件的路径+名字
        output_filename = os.path.join(TFRECORD_DIR, split_name + '.tfrecords')
        with tf.python_io.TFRecordWriter(output_filename) as tfrecord_writer:
            for i, filename in enumerate(filenames):
                try:
                    sys.stdout.write('\r>> Converting image %d/%d' % (i + 1, len(filenames)))
                    sys.stdout.flush()

                    # 读取图片
                    image_data = Image.open(filename)
                    # 根据模型的结构resize
                    image_data = image_data.resize((224, 224))
                    # 灰度化
                    image_data = np.array(image_data.convert('L'))
                    # 将图片转化为bytes
                    image_data = image_data.tobytes()

                    # 获取label
                    labels = filename.split('/')[-1][0:4]
                    num_labels = []
                    for j in range(4):
                        num_labels.append(int(labels[j]))

                    # 生成protocol数据类型
                    example = image_to_tfexample(image_data, num_labels[0], num_labels[1], num_labels[2], num_labels[3])
                    tfrecord_writer.write(example.SerializeToString())

                except IOError as e:
                    print('Could not read:', filename)
                    print('Error:', e)
                    print('Skip it\n')
    sys.stdout.write('\n')
    sys.stdout.flush()

七、判断是否存在并划分数据

先判断是不是文件已经有了，如果没有获取我们所有的图像，切分数据集和测试集合，我们惊醒数据的转换在生成tfrecord文件。

if _dataset_exists(TFRECORD_DIR):
    print('tfcecord文件已存在')
else:
    # 获得所有图片
    photo_filenames = _get_filenames_and_classes(DATASET_DIR)

    # 把数据切分为训练集和测试集,并打乱
    random.seed(_RANDOM_SEED)
    random.shuffle(photo_filenames)
    training_filenames = photo_filenames[_NUM_TEST:]
    testing_filenames = photo_filenames[:_NUM_TEST]

    # 数据转换
    _convert_dataset('train', training_filenames, DATASET_DIR)
    _convert_dataset('test', testing_filenames, DATASET_DIR)
    print('生成tfcecord文件')

八、完整实现

import tensorflow as tf
import os
import random
import math
import sys
from PIL import Image
import numpy as np

# In[2]:

# 验证集数量
_NUM_TEST = 500

# 随机种子
_RANDOM_SEED = 0

# 数据集路径
DATASET_DIR = "./captcha/images/"

# tfrecord文件存放路径
TFRECORD_DIR = "./captcha/"


# 判断tfrecord文件是否存在
def _dataset_exists(dataset_dir):
    for split_name in ['train', 'test']:
        output_filename = os.path.join(dataset_dir, split_name + '.tfrecords')
        if not tf.gfile.Exists(output_filename):
            return False
    return True


# 获取所有验证码图片
def _get_filenames_and_classes(dataset_dir):
    photo_filenames = []
    for filename in os.listdir(dataset_dir):
        # 获取文件路径
        path = os.path.join(dataset_dir, filename)
        photo_filenames.append(path)
    return photo_filenames


def int64_feature(values):
    if not isinstance(values, (tuple, list)):
        values = [values]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=values))

def bytes_feature(values):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[values]))


def image_to_tfexample(image_data, label0, label1, label2, label3):
    # Abstract base class for protocol messages.
    return tf.train.Example(features=tf.train.Features(feature={
        'image': bytes_feature(image_data),
        'label0': int64_feature(label0),
        'label1': int64_feature(label1),
        'label2': int64_feature(label2),
        'label3': int64_feature(label3),
    }))


# 把数据转为TFRecord格式
def _convert_dataset(split_name, filenames, dataset_dir):
    assert split_name in ['train', 'test']

    with tf.Session() as sess:
        # 定义tfrecord文件的路径+名字
        output_filename = os.path.join(TFRECORD_DIR, split_name + '.tfrecords')
        with tf.python_io.TFRecordWriter(output_filename) as tfrecord_writer:
            for i, filename in enumerate(filenames):
                try:
                    sys.stdout.write('\r>> Converting image %d/%d' % (i + 1, len(filenames)))
                    sys.stdout.flush()

                    # 读取图片
                    image_data = Image.open(filename)
                    # 根据模型的结构resize
                    image_data = image_data.resize((224, 224))
                    # 灰度化
                    image_data = np.array(image_data.convert('L'))
                    # 将图片转化为bytes
                    image_data = image_data.tobytes()

                    # 获取label
                    labels = filename.split('/')[-1][0:4]
                    num_labels = []
                    for j in range(4):
                        num_labels.append(int(labels[j]))

                    # 生成protocol数据类型
                    example = image_to_tfexample(image_data, num_labels[0], num_labels[1], num_labels[2], num_labels[3])
                    tfrecord_writer.write(example.SerializeToString())

                except IOError as e:
                    print('Could not read:', filename)
                    print('Error:', e)
                    print('Skip it\n')
    sys.stdout.write('\n')
    sys.stdout.flush()


# 判断tfrecord文件是否存在
if _dataset_exists(TFRECORD_DIR):
    print('tfcecord文件已存在')
else:
    # 获得所有图片
    photo_filenames = _get_filenames_and_classes(DATASET_DIR)

    # 把数据切分为训练集和测试集,并打乱
    random.seed(_RANDOM_SEED)
    random.shuffle(photo_filenames)
    training_filenames = photo_filenames[_NUM_TEST:]
    testing_filenames = photo_filenames[:_NUM_TEST]

    # 数据转换
    _convert_dataset('train', training_filenames, DATASET_DIR)
    _convert_dataset('test', testing_filenames, DATASET_DIR)
    print('生成tfcecord文件')

说明

本博客是自己学习说明，具体教程在：https://www.bilibili.com/video/BV1kW411W7pZ?p=31

【Python】文件处理的魔法之旅 _小白1024 python python 开发语言笔记
目录引言文件处理的重要性基本概念主体部分读取文件写入文件修改文件处理不同类型的文件文本文件CSV文件JSON文件示例代码代码解释案例研究结论参考文献引言你是否曾经面对一堆杂乱无章的文件，感到束手无策？是否曾梦想过拥有一种能力，能够轻松地读取、修改和存储数据？Python文件处理，或许就是你梦寐以求的魔法。文件处理的重要性文件处理对于以下方面至关重要：数据持久化：将数据保存到磁盘，供后续使用。配置管
windows系统下配置Mamba环境 ls077 windows
最近在学习AI知识，试图在安装最近爆火的mamba模型时遇到困难。参考网上各位达人，经过努力，终于在win11系统anaconda中成功编译安装了mamba包。我用的是visualstudio20191.在windows下构建Mamba使用环境：condacreate-nmambapython=3.10condaactivatemamba注：Mamba需要triton，然而triton没有wind
Windows中配置python3.11环境安装教程专注知识产权服务13937636601 计算机 windows python3.11
在Windows中配置Python3.11环境的过程相对简单，以下是详细的安装和配置步骤：1.下载Python3.11打开浏览器，访问Python官方网站：WelcometoPython.org在首页导航栏中找到“Downloads”菜单，点击“Windows”选项。在下载页面中，找到“Python3.11.x”版本（假设当前稳定版为3.11.x），点击“Download”按钮下载安装程序。2.安
使用matlab的热门问题七十二五值得关注 matlab 开发语言青少年编程算法经验分享
MATLAB广泛应用于科学计算、数据分析、信号处理、图像处理、机器学习等多个领域，因此热门问题也涵盖了这些方面。以下是一些可能被认为当前最热门的MATLAB问题：深度学习与神经网络：如何使用MATLAB的深度学习工具箱（DeepLearningToolbox）来构建和训练神经网络？如何利用MATLAB进行图像识别、语音识别或自然语言处理等深度学习应用？数据分析与可视化：如何使用MATLAB进行大数
如何在Python中处理不平衡数据葡萄_ac1c
Index1、到底什么是不平衡数据2、处理不平衡数据的理论方法3、Python里有什么包可以处理不平衡样本4、Python中具体如何处理失衡样本印象中很久之前有位朋友说要我写一篇如何处理不平衡数据的文章，整理相关的理论与实践知识（可惜本人太懒了，现在才开始写），于是乎有了今天的文章。失衡样本在我们真实世界中是十分常见的，那么我们在机器学习（ML）中使用这些失衡样本数据会出现什么问题呢？如何处理这些
如何辨别python2？转python3 | v1.2 大白python
如何辨别python2教学视频中，如何辨别python2？学习python，免不了收集一大堆的教学视频，如前篇说到，python3不再向下兼容2了，手上的视频如何辨别？官方给出的修文档中，可知最明显的改变是：print改为函数形式，代码需写成：print()在教学者没有提示的情况下，可以从print函数判断出是python2还是3.print函数虽然print语法是Python3中一个很小的改动，
pythoncharm安装配置_pycharm的安装与配置 weixin_39887183 pythoncharm安装配置
1.pycharm的下载step1：打开下载网址：http://www.jetbrains.com/pycharm/step2：点击下载按钮。step3：专业版是收费的，社区版是免费的，并且社区版新手使用足够，我们这里下载社区版。2.pycharm的安装pycharm的安装依然是傻瓜化安装，基本一路next,这里只强调一点安装时切记勾选64-bit那么一个选项3.pycharm的入门基础配置ste
深度学习目标检测入门COCO数据集日暮途远z 深度学习目标检测人工智能
常见数据集类型：COCO数据集：Pytorch加载COCO数据集：COCO数据集的读取COCO_dataset=torchvision.datasets.CocoDetection(root="./dataset/val2017",annFile="./instances_val2017/instances_val2017.json")root(strorpathlib.Path)–Rootdir
python 笔记 if语句的基本使用日暮途远z Python 自学复习专用 python 笔记
if+判断的条件（布尔类型）:条件成立时要做的事if语句后一定要加冒号age=16;if(age>=18):print(f"你已经年满18岁")print(f"即将步入大学生活")else:print(f"快去学习");练习代码：实现按键输入判断年龄是否免票//input获取键盘输入input获取到的所有内容都是字符串我们利用int强制把输入类型转化为整形age=int(input("请输入年龄:
【数据获取与读取】JSON & CSV yogurt=b 数据分析 json python
数据分析流程获取数据-读取数据-评估数据-清洗数据-整理数据-分析数据-可视化数据公开数据集飞桨（百度旗下深度学习平台）数据集：https:/aistudio.baidu.com/aistudio/datasetoverview天池（阿里云旗下开发者竞赛平台）:https:/tianchiaiyun.com/dataset/和鲸社区（数据科学开源社区）数据集：htps://www.heywhale
PySpark 静听山水 Spark spark
PySpark的本质确实是Python的一个接口层，它允许你使用Python语言来编写ApacheSpark应用程序。通过这个接口，你可以利用Spark强大的分布式计算能力，同时享受Python的易用性和灵活性。1、PySpark的工作原理PySpark的工作原理可以概括为以下几个步骤：编写Python代码：开发者使用Python语法来编写Spark应用程序。这些程序通常涉及创建RDDs（弹性分布
PyCharm配置Python环境编程小弟 python python pycharm ide
在PyCharm中配置Python环境是一个相对简单的过程。下面是一步一步的指导，帮助你设置PyCharm以使用特定的Python解释器：步骤1:打开PyCharm设置打开PyCharm。点击菜单栏中的File，然后选择Settings（Windows和Linux）或PyCharm->Preferences（Mac）。步骤2:选择项目解释器在设置窗口中，展开Project部分，选择你的项目名称，然
DL参考资源（二） antkillerfarm 深度学习
DL参考资源推荐系统https://zhuanlan.zhihu.com/p/26237106深度学习在推荐算法上的应用进展http://i.dataguru.cn/mportal.php?mod=view&aid=11463深度学习在推荐领域的应用https://mp.weixin.qq.com/s/hGvQvddD3i858XSK4z08Ug主要推荐系统算法总结及Youtube深度学习推荐算法
软件测试面试题（Python全栈自动化测试面试题）爱学习的执念软件测试面试软件测试面试 python 开发语言面试软件测试面试软件测试
1、你的测试职业发展是什么?测试经验越多，测试能力越高。所以我的职业发展是需要时间积累的，一步步向着高级测试工程师奔去。而且我也有初步的职业规划，前3年积累测试经验，按如何做好测试工程师的要点去要求自己，不断更新自己改正自己，做好测试任务。2、你认为测试人员需要具备哪些素质做测试应该要有一定的协调能力，因为测试人员经常要与开发接触处理一些问题，如果处理不好的话会引起一些冲突，这样的话工作上就会不好
各种编程语言的优缺点无聊的一个人啊 golang 开发语言后端 vue.js python
当谈论编程语言时，我们进入了一个充满激情和争议的领域。每种编程语言都有其独特的优点和局限性，适用于不同的场景。让我们简要评价一些主流编程语言，探讨它们的优缺点和应用领域。来来来,老铁们,男人女人都需要的技术活拿去不谢:远程调试,发布网站到公网演示,远程内网服务,游戏联机推荐链接Python优点：简单易学：Python的语法简单明了，易于理解和掌握。开源：免费使用，自由修改和分发源代码，促进了Pyt
Windows系统上更换pip源的详细指南 2402_85758349 windows pip
Python的包管理工具pip允许用户从Python包索引(PyPI)下载和安装第三方库。然而，默认的PyPI源有时可能因为网络问题或地理位置导致访问速度较慢。更换为更快的源可以显著提高下载和安装Python包的速度。本文将详细介绍如何在Windows系统上更换pip的源。1.理解pip源的重要性更换pip源是优化Python开发环境的重要步骤之一。一个快速且稳定的源可以提高包管理的效率，尤其是在
蒙特卡罗方法——布丰投针实验近似计算圆周率python代码实现潮汐退涨月冷风霜 python 开发语言蒙特卡罗
布丰实验数学原理python代码importrandomasrdimportnumpyasnpimportmathimportmatplotlib.pyplotaspltimportmatplotlibmatplotlib.rcParams['font.family']='SimHei'#或者'MicrosoftYaHei'matplotlib.rcParams['axes.unicode_min
python使用rocketmq发送消息_阿里云消息队列RocketMQ使用示例 weixin_39953481
本文代码示例参见：https://gitee.com/imlichao/RocketMQ-exampleApacheRocketMQ文档：http://rocketmq.apache.org/docs/quick-start/阿里云RocketMQ文档：https://help.aliyun.com/product/29530.html简介消息队列RocketMQ是阿里巴巴集团自主研发的专业消息中
python调用rocketmq的api_Python：Rocketmq消息队列使用 weixin_39914868
rocketmq可以与kafka等一起使用，用于实时消息处理。安装rocketmq：pipinstallrocketmq[-ihttps://pypi.tuna.tsinghua.edu.cn/simple]生产消息producer：fromrocketmq.clientimportProducer,Messageimportjsonproducer=Producer('PID-test')pro
python调用pyd文件_python的py文件生成pyd文件，pycharm直接调用pyd文件 weixin_39799561 python调用pyd文件
这段时间做接口自动化测试，用python直接调用接口，sign值是经过系列复杂算法加密后生成的字符串，保密级别高，不能直接以py文件供大家调用~~pyc文件呢，很容易就被反编译了，pyd文件和一般dll类似，不容易被反编译。生成pyd很容易，网上百度一堆堆，但是调用pyd文件会遇到好多错误。在此贴一下生成pyd到调用pyd文件的方法供参考：1.新建一个setup.py文件：#用cpython生成p
Python聊天服务器（一） weixin_34375251 python 网络数据结构与算法
对于镜像服务端来说，支持同时多个连接的能力是非常有用的，但是这也对服务端的实际功能没有多大的改变。每个客户端只跟服务端交互，甚至不跟其它客户端进行间接地交互。这是一个流行的模型，WEB服务器和MAIL服务器都使用这种模型。这里还有另外的一个类型的服务端：用于连接每个客户端。对很多程序来说，他们关注的并不是服务端，而是还有什么人连接到它。在线聊天室和游戏是这种类型的流行应用。在这一章，我们将设计和建
用python写1个简单的聊天服务器3-TCP服务器选择 watsy python ios开发
有了文章2的分析以后下面需要做的事情是选择1个TCP服务器。自己写1个TCP服务器考虑到快速实现，不现实。最终有3个框架twistedgeventtornadogoogle了一下资料以后。考虑geventtornado比较理想的目标是gevent，不过测试1天，作为tcp服务器时候。read函数并没有补丁为非阻塞方法。放弃剩下的就是tornadogoogle一下tornadotcp服务器资料，发现
COI实验室技能：图像到图像的深度学习开发框架（pytorch版）山颠海涯深度学习 pytorch 人工智能
Basicdeeplearningframeworkforimage-to-image这个开发框架旨在帮助科研人员快速地实现图像到图像之间的模型开发。github连接：https://github.com/SituLab/Basic-deep-learning-framework-for-image-to-image目录1模型开发1-1克隆项目到本地1-2深度学习开发2环境配置2-1安装conda
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python 创建一个简单的在线聊天系统 LIY若依服务器网络 linux
在这篇博客中，我们将创建一个简单的在线聊天系统，使用Python的socket库和多线程技术来实现服务器和客户端之间的通信。通过这个项目，你将学到如何使用socket创建网络连接，以及如何处理多个客户端的并发连接。1.准备工作在开始之前，请确保你的环境中已经安装了socket。如果尚未安装，请运行以下命令：pipinstallsocket2.服务器端代码服务器端代码负责监听客户端的连接请求，并在接
561. 数组拆分递归思想数学规律 python 力扣西柚与蓝莓力扣递归 python leetcode 算法
561.数组拆分已解答简单相关标签相关企业提示给定长度为2n的整数数组nums，你的任务是将这些数分成n对,例如(a1,b1),(a2,b2),...,(an,bn)，使得从1到n的min(ai,bi)总和最大。返回该最大总和。示例1：输入：nums=[1,4,3,2]输出：4解释：所有可能的分法（忽略元素顺序）为：1.(1,4),(2,3)->min(1,4)+min(2,3)=1+2=32.(
2287. 重排字符形成目标字符串 Python 力扣西柚与蓝莓力扣字符串算法 python
2287.重排字符形成目标字符串简单给你两个下标从0开始的字符串s和target。你可以从s取出一些字符并将其重排，得到若干新的字符串。从s中取出字符并重新排列，返回可以形成target的最大副本数。示例1：输入：s="ilovecodingonleetcode",target="code"输出：2解释：对于"code"的第1个副本，选取下标为4、5、6和7的字符。对于"code"的第2个副本，选
Python API操作RocketMQ 京城小筑 #Python编程 python
背景：开发背景:公司相关报表需求需要将订单业务数据同步至RocketMQ中，由于需要保证开发的一致性(多个部门协同开发)，所以采用读取Hive离线数据的方式通过PythonAPI写入RocketMQ中，便于其他开发同事调用~开发环境:本地调试系统MacPython3.7.5rocketmq0.4.4(Python模块)rocketmq-client-python2.0.0(Python模块)服务器
Python(PyTorch和TensorFlow)图像分割卷积网络导图(生物医学) 亚图跨际交叉知识 Python 生物医学脑肿瘤图像皮肤病变多模态医学图像多尺度特征生物医学腹部胰腺图像病灶边界气胸图像
要点语义分割图像三层分割椭圆图像脑肿瘤图像分割动物图像分割皮肤病变分割多模态医学图像多尺度特征生物医学肖像多类和医学分割通用图像分割模板腹部胰腺图像分割分类注意力网络病灶边界分割气胸图像分割Python生物医学图像卷积网络该网络由收缩路径和扩展路径组成，收缩路径是一种典型的卷积网络，由重复应用卷积组成，每个卷积后跟一个整流线性单元(ReLU)和一个最大池化操作。在收缩过程中，空间信息减少，而特征信
python操作rocket-mq AQH~ Python
1、参考源码看源码，可以修改消息字节长度限制（rocketmq/client.py）2、推送消息fromrocketmq.clientimportProducer,Messageproducer=Producer('PID-001')#随便producer.set_namesrv_addr('ip:port')#ip和端口producer.start()msg=Message('rocket_mq
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

tfrecord生成

文章目录

验证码预处理

导入数据包

一、 生成四位验证码

二、 生成对应的验证码

三、 生成图像

四、完整实现

生成tfrecord文件

导入库

一、 定义数据参数

二、检查tfrecord文件是不是存在

三、 获取图像文件

四、 数据转换