deephub

图像数据的特征工程

一提到特征工程，我们立即想到是表格数据。但是我们也可以得到图像数据的特征，提取图像中最重要的方面。这样做可以更容易地找到数据和目标变量之间的映射。

这样可以使用更少的数据和训练更小的模型。更小的模型可以减少预测所需的时间。这在部署到边缘设备时特别有用。另一个好处是，可以更确定模型使用什么来进行这些预测。

本文将介绍使用Python进行图像特征工程的一些方法:

Cropping
Grayscalling
Selecting RGB channels
Intensity thresholds
Edge detection
Colour filters (给定的颜色范围内提取像素)

我们将在自动驾驶汽车上进行演示。如下图所示，轨道的图像训练一个模型。然后该模型将被用来做出预测，指导汽车行驶。本文的最后我们将讨论图像数据特征工程的局限性。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qP1O8lyn-1670465181696)(http://images.overfit.cn/upload/20221208/89ca1201bed64d5aa4f48f39ebc54cce.png)]

特性工程与增强

在深入研究之前，有必要讨论一下图像增强。该方法的目标与特征工程相似。但是它以不同的方式实现。

什么是数据增强?

数据增强是指我们使用代码系统地或随机地改变数据。对于图像，这包括翻转、调整颜色和添加随机噪声等方法。这些方法允许我们人为地引入噪声并增加数据集的大小。

在生产中，模型需要在不同的条件下执行。这些条件是由照明、相机的角度、房间的颜色或背景中的物体等变量决定的。

数据增强的目标是创建一个对这些条件的变化具有鲁棒性的模型。它通过添加模拟现实世界条件的噪声来实现这一点。例如，改变图像的亮度类似于在一天的不同时间收集数据。

通过增加数据集的大小，增强还允许我们训练更复杂的架构。或者说它有助于模型参数收敛。

图像数据特征工程

特征工程的目标是与增强是相似的，也就是想要创建一个更健壮的模型。但是不同的是，它删除了任何对准确预测没有必要的噪音。也就是去掉了在不同条件下会发生变化的变量（这正好与增强相反）。

通过提取图像中最重要的部分简化了问题。这允许使用更简单的模型架构。我们可以使用更小的数据集来找到输入和目标之间的映射。

另外一个重要的区别是如何在生产中处理这些方法。你的模型不会对增强图像做出预测。但是使用特征工程，模型将需要在它训练的相同特征上做出预测。这意味着必须能够在生产环境中进行相同的特性工程。

使用Python进行图像特征工程

下面我们开始进入正题，让我们开始进行特性工程的操作。

我们有一些标准包(第2-3行)。Glob用于处理文件路径(第5行)。我们也有一些包用于处理图像(第7-8行)。

 import numpy as np
 import matplotlib.pyplot as plt
 
 import glob
 
 from PIL import Image
 import cv2

我们这里将使用用于为自动驾驶汽车提供方向路径的图像。你可以在Kaggle上找到这些例子。用下面的代码加载其中一个图像。首先加载所有图像的文件路径(第2-3行)。然后加载(第8行)并在第一个路径上显示图像(第9行)。可以在图1中看到这个图像。

 #Load image paths
 read_path = "../../data/direction/"
 img_paths = glob.glob(read_path + "*.jpg")
 
 fig = plt.figure(figsize=(10,10))
 
 #Display image
 img = Image.open(img_paths[0])
 plt.imshow(img)

Cropping

裁剪图像以去除不需要的外部区域，目的是只删除图像中不需要进行预测的部分。对于自动驾驶汽车可以从背景中移除像素。

加载一张图像(第2行)。然后将这张图像转换为一个数组(第5行)。这个数组的尺寸为224 x 224 x 3。图像的高度和宽度为224像素，每个像素都有一个R G B通道。为了裁剪图像，我们只选择y轴上位置25以上的像素(第8行)。结果如图2所示。

 #Load image
 img = Image.open(img_paths[609])
 
 #Covert to array
 img = np.array(img)
 
 #Simple crop
 crop_img = img[25:,]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XY5Y3jq4-1670465181697)(http://images.overfit.cn/upload/20221208/c59a2c4f5fda4d399cb44f5d2f771217.png)]

如果需要保持纵横比。可以通过将不需要的像素变为黑色(第3行代码)来实现类似的结果。

通过裁剪，我们删除了不必要的像素，这样可以避免模型对训练数据的过度拟合。例如，背景中的椅子可能出现在所有左转处。该模型有可能将这些与左转预测联系起来。

上面的图片，还可以进一步处理，比如可以在不删除任何轨道的情况下裁剪图像的左侧。但是在下图中我们要删除重要的轨道部分。

 crop_img = np.array(img)
 crop_img[:25,] = [0,0,0]
 crop_img[:,:40] = [0,0,0]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H6fI8V2j-1670465181698)(http://images.overfit.cn/upload/20221208/eec00b5478774a24b8e14c0ebc9335e3.png)]

为什么这样做呢？这又回到了特性工程需要在生产环境中进行的问题上。你不知道什么图像将在什么时间显示给模型。这意味着需要对所有图像应用相同的裁剪功能，需要确保它永远不会删除图像的重要部分，但这是不可能的，所以我们才需要模拟这样的情况。

Grayscale

 gray_img = cv2.cvtColor(img,cv2.COLOR_RGB2GRAY)

灰度化是通过捕捉图像中的颜色强度来实现的。它通过取RGB通道的加权平均值来实现这一点。我们使用这个公式:

Y = 0.299* r + 0.587* g + 0.114* b

如果我们使用所有的RGB通道，它将由150,528个值(2242243)组成。对于灰度图像，我们现在只有50,176个值(224*224)。更简单的输入意味着需要更少的数据和更简单的模型。

RGB channels

RGB通道中，一个通道可能更重要。我们可以不进行灰度化，而是直接只使用该通道。例如下面，我们选择R(第6行)、G(第7行)和B(第8行)通道。每个生成的数组的尺寸都是224 x 224。您可以在图6中看到相应的图像。

 #Load image
 img = Image.open(img_paths[700])
 img = np.array(img)
 
 #Get rgb channels
 r_img = img[:, :, 0]
 g_img = img[:, :, 1]
 b_img = img[:, :, 2]

这里还可以使用channel_filter函数。通道参数©的值为0、1或2，这取决于你想要哪个通道。但是有一点，不同的python包将以不同的顺序加载通道。这里我们使用的PIL是RGB。如果使用cv2.imread()加载图像，通道将按BGR顺序排序。

 def channel_filter(img,c=0):
     """Returns given channel from image pixels"""
     img = np.array(img)
     c_img = img[:, :, c]
 
     return c_img

使用灰度或者RGB的通道选择，就需要考虑是否要从图像中删除了重要信息。但是对于本文中的轨道示例，轨道是橙色的，所以没有问题，轨迹的颜色有助于将其与图像的其他部分区分开来。这也是在实际应用是需要考虑的。

Intensity threshold

使用灰度化，每个像素的值将在0到255之间。我们可以通过将输入转换为二进制值来进一步简化输入。如果灰度值高于一个阈值，像素值为1，否则为0。我们称之为强度阈值。

下面的函数用于应用该阈值。首先对图像进行灰度化(第5行)。如果像素高于阈值，那么它将被设置成1000(第8行)。如果像素值低于阈值将被设置为0(第9行)。最后还将再次缩放所有像素，使它们的值为0或1(第11行)。

自动驾驶汽车项目的一部分是为了避开障碍物。在图7中，可以看到如何应用强度阈值函数，我们可以将这个黑色的罐头障碍物从图像中分隔离出来。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jU5V1Va2-1670465181699)(http://images.overfit.cn/upload/20221208/f49d8b55e354434db107f5226754f8e3.png)]

这里的截断值可以看作是一个超参数。更大的截断意味着我们包含更少的背景噪声。但是缺点是我们捕获的范围更小。

Edge detection

如果想分离轨道，可以用更精细边缘检测方法。这是一种用于检测图像边缘的多级算法。

这里我们使用cv2.Canny()函数应用该算法。其中threshold1和threshold2为滞回过程参数。这是边缘检测算法的最后一个过程，用于确定哪些线是真正的边。

 #Apply canny edge detection
 edge_img = cv2.Canny(img,threshold1 = 50, threshold2 = 80)

就像强度阈值一样，我们留下了一个二进制映射-白色表示边，黑色表示其他。这条轨迹现在更容易与图像的其他部分区分开来。但是可以看到背景中的边缘也被检测到了。

Colour filter

如果我们用像素颜色来隔离轨迹，可能会有更好的结果。使用下面的pixel_filter函数来做到这一点。cv2.inRange()将图像转换为二进制映射(第10行)。这个函数检查像素是否在lower(第5行)和upper(第6行)列表给出的范围内。具体来说，每个RGB通道必须在各自的范围内(例如134-t≤R≤194+t)。

 def pixel_filter(img, t=0):
     
     """Filter pixels within range"""
     
     lower = [134-t,84-t,55-t]
     upper = [192+t,121+t,101+t]
 
     img = np.array(img)
     orange_thresh = 255 - cv2.inRange(img, np.array(lower), np.array(upper))
 
     return orange_thresh

简单来说，该函数确定像素颜色是否与轨道的橙色足够接近。可以在图9中看到结果。参数t引入了一些灵活性。使用更高的值可以捕获更多的轨道，但会保留更多的噪音。这是因为背景中的像素也会落在这个范围内。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nzaqbgKp-1670465181700)(http://images.overfit.cn/upload/20221208/3577577f40974e3aa9c896b0e1e61d98.png)]

我们从哪里得到下界和上界呢？也就是说我们怎么知道会落在[134,84,55]和[192,121,101]之间?如果你有兴趣，我们将在后面的文章中解释。

在图10中，可以看到正在运行的选择器。从多个图像中选择像素，并尝试在轨道上的不同位置选择它们。这样我们就能在不同的条件下得到完整的像素值。

我们一共选了60种颜色。可以在图11中看到所有这些。所有这些颜色的RGB通道存储在一个列表变量-“colours”中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tRjkfcMr-1670465181700)(http://images.overfit.cn/upload/20221208/83f60e9db7a2447fb901460b6207244a.png)]

最后，我们为每个RGB通道取最小值和最大值。这就给出了下界和上界。

 lower = [min(x[0] for x in colours),
               min(x[1] for x in colours),
               min(x[2] for x in colours)]
 
 upper = [max(x[0] for x in colours),
               max(x[1] for x in colours),
               max(x[2] for x in colours)]

特征工程的局限性

上面就是对于图像数据基本的特征工程，但是你可能觉得这些方法并不那么太好用。这是因为深度学习的一个主要好处是它可以识别复杂的模式，而不需要进行特征工程。你需要弄清楚图像的哪些方面是重要的，然后编写代码来提取这些方面，这在神经王罗出现以后变得不那么重要了。

另外对于一些方法，我们已经看到无法消除所有的噪声。例如，黑色背景中的噪声和对象像素具有相同的值。这些都是手动的特征不足之处。

但是手动提取特征在处理相对简单的计算机视觉问题时时非常有用的。例如这个无人驾驶的小车，我们的轨迹从未改变，物体的颜色总是一样的，这样可以加快运行速度核准确性。而对于更复杂的问题，我们需要更多的数据，或者使用深度学习的方法进行复杂的模式识别。

https://avoid.overfit.cn/post/bd8d9a344381437d92d8b2f714359332

作者：Conor O’Sullivan

Python爬虫实战：研究Bleach库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 Bleach
1.引言在大数据时代，网络内容采集已成为信息获取的重要手段。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网页爬虫开发的首选语言。然而，从互联网获取的内容往往包含恶意脚本、不安全标签等安全隐患，直接使用可能导致XSS(跨站脚本攻击)、数据泄露等风险。Bleach作为专业的HTML净化库，通过白名单机制提供了可靠的内容安全过滤方案。本文将结合实际案例，详
Python爬虫实战：研究untangle库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 untangle
1.引言在大数据时代，网络数据已成为重要的信息资源。XML和HTML作为互联网上最常用的数据表示格式，广泛应用于API接口、网站结构和数据交换等场景。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网络数据采集的首选语言。然而，从复杂的XML/HTML文档中提取结构化数据仍然面临诸多挑战，如文档结构多样性、动态内容渲染和数据格式转换等问题。Untangl
Python LDAP库在Windows 64位环境中的应用规则哥讲规则
本文还有配套的精品资源，点击获取简介：PythonLDAP库是一个开源模块，它让Python开发者能够与LDAP服务器进行交互，执行操作如连接、查询、修改目录信息等。该库针对Python3.6和3.7版本优化，并适用于Windows64位架构。解压缩后，可以通过pip安装至项目中，实现集中式身份验证和数据管理功能。1.LDAP技术与Python交互概述LDAP（轻量级目录访问协议）是一种应用广泛的
【PyTorch】2024保姆级安装教程-Python-（CPU+GPU详细完整版）金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 python pytorch 人工智能
【PyTorch】2024保姆级安装教程（CPU+GPU详细完整版）PyTorch是当前最受欢迎的深度学习框架之一。本文将详细讲解在Python环境中安装PyTorch，包括CPU和GPU版本的全方位指南。一、前置环境首先确保已安装Python环境，推荐使用Python3.8或以上版本。验证Python安装：python--versionpip--version推荐使用虚拟环境（如conda或ve
掌握Python与LDAP在域认证中的应用 seiji morisako
本文还有配套的精品资源，点击获取简介：信息技术领域中的域认证机制利用LDAP协议实现用户身份验证。Python脚本语言通过python-ldap库与LDAP服务器交互，执行用户认证。本文将详细介绍Python如何使用python-ldap库进行LDAP连接、搜索、绑定操作，以及如何处理Web开发中的Cookie。学习这些技能有助于构建安全的用户登录系统和提升Web应用的用户体验。1.LDAP协议基
AMR解析器:CAMR的使用您的通讯录好友人工智能 AMR CLEVE 自然语言处理
1.下载gitclonehttps://github.com/Juicechuan/AMRParsing.gitcondacreate-ncamrpython=2.7-ycondaactivatecamr./scripts/config.sh然后下载本章顶部的LDC2014T12模型并解压。tar-xvzfamr-anno-1.0.train.m.tar.gz这里需要下载一个预处理模型。https
C++11 lambda 顾小玙 c++开发语言
前言在Cpp11以前，为了把函数当作对象调用，可以使用C中的函数指针类型，也可以使用Cpp98的仿函数。但二者都不是很好用，函数指针return_type(*name)(parameters)的长相就令人望而却步，仿函数将一个函数重载为一个类的operator()的方式又沉重麻烦。C++11中做出了(抄Python的)更灵活、轻便的lambda表达式。lambda表达式lambda表达式是一个匿名
机器学习中的数学：数学建模常用知识点-1 数字化与智能化机器学习中的数学机器学习凸函数泰勒公式 Jensen 不等式
一、凸函数1、凸函数讲解设函数f(x)是定义在区间X上的函数，若对于区间上任意两点x1、x2和任意实数��∈(0,1)，总有如下表达式成立：则称为f(x)是X上的凸函数；反之，如果下式成立：则称为f(x)在X上的凹函数。如图所示：Python实现凸函数：importnumpyasnpimportmatplotlib.pyplotasplt#定义凸函数defconvex_function(x):re
2025年AI编程工具推荐小猴崽 AI编程 AI编程 ai编程
以下基于2025年权威技术报告、开发者社区评测及厂商白皮书，对当前主流AI编程工具进行客观综述与推荐。数据来源包括IDC《2025中国生态告》、信通院《AI辅助编程技术成熟度评》、StackOverflow开发者调查及头部企业实测案例。一、国际主流AI编程工具GitHubCopilotX核心能力：基于GPT-4模型升级，支持37种编程语言（Python/Java/JS等），可解析数万行代码库的全局
基于OpenCV图像分割与PyTorch的增强图像分类方案从零开始学习人工智能 opencv pytorch 分类
在图像分类任务中，背景噪声和复杂场景常常会对分类准确率产生负面影响。为了应对这一挑战，本文介绍了一种结合OpenCV图像分割与PyTorch深度学习框架的增强图像分类方案。通过先对图像进行分割提取感兴趣区域（RegionofInterest，ROI），再进行分类，可以有效减少背景干扰，突出关键特征，从而提高分类准确率。该方案在多种复杂场景下表现出色，尤其适用于图像背景复杂或包含多个对象的情况。一、
python里面的单引号，双引号以及三引号的介绍 scuter_yu python python 单引号双引号以及三引号
第一次在csdn上写博客，内心有点小激动。该怎么表达我此刻的心情呢？哎呀，让我来唱一首《小苹果》吧。“你是我的小呀小苹果……balabala”！好啦，疯言疯语过后还是赶快进入主题吧。我今天要讲得是python里面的单引号（‘’），双引号（“”）以及三引号（“““”””）的区别。相信刚接触的python的朋友都会遇到这样的一个困惑，就是对单引号（‘’），双引号（“”）以及三引号（“““”””）的使用
【python】pip 国内镜像源叶阿猪 python python pip 开发语言
使用pip下载安装python第三方库的时候，经常会很慢，甚至报错。如下：pip._vendor.urllib3.exceptions.ReadTimeoutError:HTTPSConnectionPool(host='f而使用Python的镜像源（也称为国内安装源或PyPI镜像源）可以提高Python包（如numpy、pandas等）的安装速度和稳定性。Python的镜像源是在国内设置的代理服
Deepoc大模型在半导体设计优化与自动化 Deepoch 自动化运维人工智能机器人单片机 ai 科技
大模型在半导体设计领域的应用已形成多维度技术渗透，其核心价值在于通过数据驱动的方式重构传统设计范式。以下从技术方向、实现路径及行业影响三个层面展开详细分析：参数化建模与动态调优基于物理的深度学习模型（如PINNs）将器件物理方程嵌入神经网络架构，实现工艺参数与电学性能的非线性映射建模。通过强化学习框架（如PPO算法）动态调整掺杂浓度、栅极长度等关键参数，在3nm节点下实现驱动电流提升18%的同时降
接口自动化测试（Python+pytest+PyMySQL+Jenkins）万能程序员-传康Kk python pytest jenkins
接口自动化测试一个完整的企业级接口自动化测试解决方案目录项目介绍技术架构功能特性项目结构环境要求安装部署使用方法测试用例说明预期结果报告系统配置说明数据库设计Jenkins集成常见问题项目亮点扩展指南联系方式项目介绍项目背景接口自动化测试作为现代软件开发流程的核心环节，已成为保障系统质量、提升交付效率的关键手段。本项目基于Python技术栈，构建了一套完整的接口自动化测试解决方案，旨在为开发团队提
如何获取Swift变量的内存内容?如何理解Swift的if let语句?如何理解Swift “case let xxx:“?Swift可以像Python一样在定义变量时省略var或者let?
目录如何获取Swift变量的内存内容?如何理解Swift的iflet语句?如何理解Swift"caseletxxx:"?如何理解Swift"case10...20=a"这种条件表达式?Swift可以像Python一样在定义变量时省略var或者let?Swift结构体或枚举mutating的本质为什么Swift枚举变量前面可以加符号"."?Swift权限控制如何获取Swift变量的内存内容?可使用M
分布式训练架构解析
一、分布式训练的问题根源与需求驱动在深度学习领域，模型与数据规模呈指数级增长趋势，传统单机训练模式已难以满足日益复杂的业务需求，分布式训练技术应运而生，其核心驱动力源于以下三大关键困境：1.1算力瓶颈与训练效率危机单GPU设备的计算能力存在物理上限。以NVIDIAA100为例，其单卡FP32算力约为19.5TFLOPS，面对GPT-4这样拥有1.8万亿参数的超大型模型，若采用单机单卡训练，仅完成一
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
Python pdfminer.six库【PDF解析库】全面使用指南老胖闲聊 Python库大全 python pdf 开发语言
想全面了解DeepSeek的看过来【包邮】DeepSeek全攻略人人需要的AI通识课零基础掌握DeepSeek的实用操作手册指南【限量作者亲笔签名版售完即止】玩转DeepSeek这本就够了【自营包邮】DeepSeek实战指南deepseek从入门到精通实用操作指南现代科技科普读物AI普及知识读物人工智能使用教程中小学读物京东超级618Python初学者的入门教程动手学深度学习PyTorch版李沐和
AI教学应用作业多元化和教师批改多样化蹦跑的蜗牛 AI 人工智能 ai
AI教学应用作业多元化和教师批改多样化目标是解决「作业形式多样化+教师批改压力大+教学反馈个性化不足」的问题一、需求大学生的作业和高中完全不一样，比如：作业类型多：可能是论文/实验报告（文字类）、Python代码（编程类）、电路仿真图（图片类）、小组调研视频（视频类）、甚至社会调查的问卷数据（表格类）。教师批改难：比如一篇5000字的论文，老师要检查逻辑、查重、给修改建议；一份代码作业要跑通测试、
《Python之禅》：优雅代码的哲学指南郝学胜-神的一滴 Python python 开发语言
Python不仅仅是一门编程语言，它更像是一种编程哲学的体现。而这份哲学的精髓，就藏在一句简单的代码中：importthis运行这段代码，你会看到一段充满诗意的“代码准则”——《Python之禅》（TheZenofPython）。它由Python之父GuidovanRossum的同事TimPeters编写，用19条简洁的格言，定义了Python语言的设计理念和开发者应遵循的编码哲学。《Python
理解不同层的表示（layer representations）科学禅道高维表示人工智能深度学习
在机器学习和深度学习领域，特别是在处理音频和自然语言处理（NLP）任务时，"层的表示"（layerrepresentations）通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的不同层次的信息。1.层的表示（layerrepresentations）为了更好地理解这一概念，我们可以从以下几个方面进行解释：1.深度神经网络结构深度神经网络（DNN）通常由多个层组成，每
esp32 支持 sd卡 micropython 文件系统_ESP32 / ESP8266 MicroPython教程：读取文件 weixin_39891317 esp32 支持 sd卡 micropython 文件系统
原标题：ESP32/ESP8266MicroPython教程：读取文件引言本篇ESP32/ESP8266MicroPython教程主要说明如何从MicroPython的文件系统中读取一个文件。本教程在esp32和esp8266上进行了测试。通常我会使用Putty与MicroPython命令行界面进行交互。但是为了演示，我在本篇教程中会使用ArduinoSerialMonitor与设备进行交互。因为
AttributeError: module ‘distutils‘ has no attribute ‘version‘ 一只小狐狸坐在沙丘上深度学习人工智能
问题描述run(unidexgrasp)tianyu@tianyu:~/UniDexGrasp/dexgrasp_generation$python./network/train.py--config-nameipdf_config--exp-dir./ipdf_trainError:Traceback(mostrecentcalllast):File"./network/train.py",li
软件测试进阶：Python 高级特性与数据库优化（第二阶段 Day6） study软测数据库 python sql
在掌握SQL复杂查询和Python数据库基础操作后，第六天将深入探索Python高级编程特性与数据库性能优化。通过掌握Python的模块与包管理、装饰器等高级语法，结合数据库索引优化、慢查询分析等技术，提升测试工具开发与数据处理效率。一、Python高级编程：模块、包与装饰器1.模块与包的使用模块导入：将代码拆分到不同.py文件中，通过import实现复用#自定义模块my_module.pydef
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
【5分钟力扣】1160.拼写单词（python3实现）金鞍少年金鞍少年的刷题之路字符串 leetcode 力扣1160题 python拼写单词
文章目录一、前言二、题目三、哈希表解法3.1哈希表基本概念3.2解题思路3.3代码实例四、字符串比较解法4.1解题思路4.2代码实例一、前言如果放弃太早，你永远都不知道自己会错过什么。每天五分钟，看懂一道简单、中等难度的算法题，尽可能将复杂的题讲清楚。疯狂学习python中，2020-07-20更新二、题目给你一份『词汇表』（字符串数组）words和一张『字母表』（字符串）chars。假如你可以用
Python包管理之Protry的基本使用菜鸟级后端 python linux 开发语言
一，Poetry是什么Poetry是Python生态中一款革命性的依赖管理与项目打包工具，它通过现代化的设计理念解决了传统工具（如pip+virtualenv）在项目管理中的诸多痛点，比pip的功能强大许多。核心功能如下：1，智能依赖管理Poetry采用pyproject.toml文件统一管理项目元数据、依赖声明及构建配置，通过poetryadd命令即可自动解析依赖树并安装精确版本，避免版本冲突（
Python变量的动态创建念致达 Python python
Python变量的动态创建动态地创建变量可以使用globals()和locals()来实现。这两个对象以字典的形式分别保存着系统的静态变量和局部变量。所以只要将要创建的变量加入这两个字典中的任一个，就实现了变量的动态创建。>>>ls=['name','无奇']>>>i=21>>>globals()[ls[0]+str(i)]=ls[1]>>>name21'无奇'动态变量的应用。最典型的就是pyth
C++实现一个基于多态的职工管理系统（附源码） loveCC_orange C/C++c++面试华为后端开发多态
之前为了找实习，学了Python，刷了五六十道算法题，然后就开始投简历面试了，结果就是各个大厂一轮游，要Python开发的岗位又少的可怜。但所幸华为的实习面试通过了~本来以为这样就可以等着拿offer了，结果泡池子失败，今年华为的RAN研究部offer数量缩水，由于没在前四之列，所以就被pass掉了。然后又重新开始海投简历找实习。在无数次碰壁之后，深感自己才疏学浅，学的东西还是太少了。于是继续刷题
Python编程：色温倔强老吕 C++与python交互编程 python 色温
色温（ColorTemperature）是一个用来描述光源颜色特征的物理量，通常用开尔文温度（K）表示。它并不是指灯泡或光源的实际温度，而是以绝对黑体辐射为参照的一种度量方式。当一个理想的黑体被加热到特定温度时，它会发出特定颜色的光，这个颜色与光源的颜色相匹配时，该黑体的温度即为该光源的色温。色温范围及其对应的光色：低于3000K：暖白色，给人以温暖、舒适的感觉，类似于烛光或者白炽灯。3000K至
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

图像数据的特征工程

特性工程与增强

使用Python进行图像特征工程

特征工程的局限性

你可能感兴趣的:(python,特征工程,特征提取,深度学习)