撸码猿

计算机视觉之旅-进阶-图像分割处理

1. 什么是图像分割

计算机视觉中的图像分割是将图像划分为多个部分的过程，每个部分具有相同或相似的视觉特征。它是图像理解和计算机视觉高级任务的基础，常用于物体识别、人脸识别、医学图像分析等领域。

2.阈值法

阈值法是计算机视觉中的一种简单图像分割方法。它选择一个阈值,大于该阈值的像素归为一类,小于阈值的像素归为另一类。

2.1. 阈值法执行步骤

1. 计算图像的直方图,找到图像的谷值或峰值作为阈值;或者根据需求手动设定一个阈值。

2. 遍历图像中的每个像素,如果像素值大于阈值,则归类为前景;否则归类为背景。

3. 根据分类结果,前景像素可视为一个区域,背景像素可视为另一个区域,实现图像的二值分割。

2.2. 示例

有一幅包含明暗两块区域的图像,明暗两区域像素值差异较大,要实现两区域的分割。

1. 计算图像直方图,由于两区域像素值差距较大,直方图中存在两个峰值,选择两个峰值之间的谷值作为阈值。

2. 以阈值为标准,大于阈值的像素点归类为明区域,小于阈值的像素点归类为暗区域。

3. 根据分类结果,得到两块分割区域,实现图像的分割。

2.2.1. 代码示例

import cv2
import numpy as np

# 读取图像
img = cv2.imread('image.jpg')

# 转换为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 计算图像直方图
hist = cv2.calcHist([gray], [0], None, [256], [0, 256])

# 找到直方图的两个峰值之间的谷值作为阈值
thresh = 50

# 设定阈值,大于阈值的为前景像素
binary = gray > thresh

# 根据二值图像绘制矩形框
contours, hierarchy = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
for cnt in contours:
x, y, w, h = cv2.boundingRect(cnt)
cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)

# 显示图像和直方图
cv2.imshow('Image', img)
cv2.imshow('Histogram', hist)
cv2.imshow('Binary', binary)
cv2.waitKey(0)

2.2.2. 代码示例解读

1. 读取图像并转为灰度图像。

2. 计算灰度图像的直方图。找到两个峰值之间的谷值作为阈值。

3. 使用阈值对灰度图像进行二值化,得到分割结果。

4. 在原彩色图像上绘制矩形框,显示分割结果。

5. 显示原图像、直方图与二值化结果。

该示例利用简单阈值法实现了图像的二值分割。但是可以看到,对于复杂情况如同时包含三个以上区域,或者像素变化比较连续的图像,阈值法的效果会比较差,无法完成精细的语义分割。

2.3. 阈值法优劣势

阈值法的优点是简单易行,计算量小。但是它有几个显著缺点。

1. 无法处理像素值变化复杂的情况,只适合二值分割。

2. 阈值的选择会对结果有较大影响,阈值选取不当会导致分割错误。

3. 无法利用图像的纹理、颜色等信息,其分割结果比较粗糙。

4. 对噪声比较敏感,噪声会对结果产生较大影响。

阈值法属于一种较为初级的图像分割方法。对于高级视觉任务,更倾向于使用基于边缘检测、区域生长以及深度学习的分割方法,这些方法可以针对图像的语义与内容进行更精细的分割与理解。

3. 边缘检测

检测图像中的边缘和轮廓,把边界内的区域分割出来。效果较好但边缘连接问题较多。

3.1. 边缘检测步骤

图像分割的边缘检测主要有灰度化、平滑化、计算梯度、非最大值抑制等步骤

3.1.1. 灰度化

将RGB图像转换为灰度图像,减少颜色信息对边缘检测的影响。

3.1.2. 平滑化

使用高斯平滑、中值滤波等方法平滑图像,去除噪音。平滑化可以使边缘更加连续清晰。

3.1.3. 计算梯度

使用Sobel、Canny等 operator 计算图像梯度,检测图像明显变化的地方。梯度的大小表示边缘强度,梯度的方向表示边缘方向。

3.1.4. 非最大值抑制

只保留局部最大的梯度值,抑制边缘方向垂直方向的梯度值。使得边缘变得更加清晰连续。

3.1.5. 双阈值检测

使用高低两个阈值检测真实边缘。高阈值检测出确定的边缘,低阈值检测出可能的边缘。

3.1.6. 连接边缘

使用8连通或4连通方法连接高阈值检测出的边缘段。连接断开的边缘,形成闭合的边缘链。

3.1.7. 可选的边缘线条化

使用一定的规则产生尽量连续的边缘线条。使分割结果看上去更加平滑清晰。

这是图像分割中经典的边缘检测流程,不同的算法在具体的步骤的实现上会有差异,但总体思路是相似的。边缘检测的好坏直接决定了图像分割的效果。

3.2. 示例

Canny算法是计算机视觉中最流行和最有效的边缘检测算法之一。这里给出一个基本的Canny边缘检测算法的代码示例，包括梯度计算、非最大值抑制和双阈值检测等。
import cv2
import numpy as np

def canny(image):
# 转换为灰度图像
gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
# 高斯平滑
blur = cv2.GaussianBlur(gray, (5, 5), 0)
# 计算梯度
xgrad = cv2.Sobel(blur, cv2.CV_16SC1, 1, 0)
ygrad = cv2.Sobel(blur, cv2.CV_16SC1, 0, 1)
# 计算边缘梯度和方向
edge_grad = np.hypot(xgrad, ygrad)
edge_dir = np.arctan2(ygrad, xgrad)
# 非最大值抑制
edge_grad = non_max_suppression(edge_grad, edge_dir)
# 双阈值检测和连接边缘
low_threshold = 80
high_threshold = 120
edge = cv2.Canny(edge_grad, low_threshold, high_threshold)
return edge

def non_max_suppression(edge_grad, edge_dir):
...

src = cv2.imread('xxx.jpg')
edge = canny(src)
cv2.imshow('edge', edge)
cv2.waitKey(0)

4.区域生长法

选择图像中的种子点,根据相邻像素的相似性不断吸收周围像素进行区域生长,直到生长停止。效果较好但种子点选择关键。

4.1. 基本思想

区域生长法是一种基于连通性的图像分割方法。其基本思想是:

1. 选择一些种子点作为生长起点,这些种子点通常选择图像中的一些特征点。

2. 根据种子点周围像素与种子点的相似度,决定将哪些周围像素归为同一个区域。相似度高的像素会被归入种子区域。

3. 新归入的像素也可以成为生长点,继续吸收周围相似的像素。这个过程会不断重复,直到没有更多的像素可以被吸收为止。

4. 最后,图像被分割成多个由生长点连接的区域。

4.2. 主要参数

区域生长法的主要参数有:

1. 种子点:选择影响分割结果的关键。通常选择图像特征点作为种子点。

2. 相似度测量:决定像素是否被归入种子区域的关键。常用的有颜色相似度、灰度相似度等。

3. 生长策略:决定从种子点开始如何向外部生长。常见的有4连通、8连通生长等。

4. 生长终止条件:什么条件下停止生长,影响最终分割结果的粒度。

4.3. 示例

这里是一段区域生长法的代码示例。

import cv2
import numpy as np

def region_growing(image, seed_point, threshold):
'''
image: 输入图像
seed_point: 种子点坐标(行,列)
threshold: 相似度阈值
'''
height, width = image.shape
# 获取图像高度和宽度

seed_x, seed_y = seed_point # 获得种子点坐标
seed_value = image[seed_x, seed_y] # 获取种子点灰度值

region = np.zeros_like(image) # 创建一个与图像大小相同的图像,初始化为0
region[seed_x, seed_y] = 1 # 将种子点所在位置的值置为1

neighbors = [] # 创建一个列表来存储生长点坐标
neighbors.append((seed_x, seed_y)) # 将种子点添加到生长点列表

while len(neighbors) > 0: # 生长点列表不为空,则一直生长
current_point = neighbors.pop(0) # 获取列表中第一个生长点
x, y = current_point # 获得生长点坐标

for offset_x, offset_y in [(-1, 0), (1, 0), (0, -1), (0, 1)]:
# 4连通生长,Offsets代表生长方向
new_x = x + offset_x # 计算新点坐标
new_y = y + offset_y

if 0 <= new_x < height and 0 <= new_y < width: # 判断新点是否在图像范围内
diff = abs(image[new_x, new_y] - seed_value) # 计算新点与种子点的灰度差
if region[new_x, new_y] == 0 and diff < threshold:
# 如果新点未被访问且与种子点灰度差在阈值范围内
region[new_x, new_y] = 1 # 将新点设置为已访问
neighbors.append((new_x, new_y)) # 添加新点到生长点列表

return region

这个示例函数实现了区域生长法的所有步骤。我们选择一个种子点和阈值,从种子点开始4连通生长,不断吸收与种子点相似的新点,当生长点列表为空时生长结束。返回一个只包含生长区域的二值图像。

该算法简单直观,但生长结果很依赖于种子点选择和阈值设置,容易造成过分割或漏分割。所以通常将其与其他更稳定的算法结合使用。

4.4. 应用

区域生长法的优点是直观简单,比较符合人眼对图像区域的感知。但是很难保证能分割出我们想要的整体区域,容易由于种子点选取和相似度测量等问题而导致过分割或未分割的现象。所以,区域生长法常与其它分割方法结合使用。

区域生长法在医学图像处理、遥感图像处理等领域有较广泛的应用。但作为一种基本的图像分割方法,其思想对很多其它更复杂的图像分割算法也有重要影响。

5.标注传播

通过少量像素的标注信息传播到未标注的像素,实现图像的自动分割。效果较好,但需要大量标注数据以训练模型。

5.1. 基本思想

标注传播是一种基于先验知识的图像分割方法。其基本思想是:

1. 首先,训练图像需要事先标注,也就是人工定义图像中每个像素属于的类别。这些标注作为模型的先验知识。

2. 然后,对于新输入的未标注图像,算法会先选择小部分像素的标注作为初始种子。这些种子像素可以随机选择,也可以基于一定特征选择。

3. 最后,算法从这些种子像素开始,根据图像中的局部特征和先验知识模型,预测其周围像素的类别,不断传播,直到图像全部被标注。

5.2. 构建模型常用方法

标注传播的关键在于构建一个好的先验知识模型。常用的方法有:

1. 最近邻分类:直接使用训练集中与当前像素最相似的像素的类别作为预测类别。

2. 贝叶斯分类:基于贝叶斯定理,计算各个类别在当前像素位置出现的概率,选择概率最大的类别。

3. 决策树:训练一个决策树,基于像素特征选择最可能的类别。

4. 随机森林:训练多个决策树,综合所有的树得到最终预测类别。

5. 神经网络:使用卷积神经网络等作为分类模型进行预测。

5.3. 示例

这里是一个简单的标注传播算法实现。
import cv2
import numpy as np
from sklearn.neighbors import KNeighborsClassifier

# 训练数据及标注
train_data = np.load('train_data.npy')
train_label = np.load('train_label.npy')

# KNN模型
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(train_data, train_label)

def propagation(image, seeds):
'''
image: 输入图像
seeds: 初始种子点及对应类别,如[(x1,y1,c1),(x2,y2,c2),...]
'''
height, width = image.shape # 获取图像大小

labeled = np.zeros((height, width)) # 初始化标注矩阵
# labeled[seeds[:,0], seeds[:,1]] = seeds[:,2] # 设置种子点类别

Q = []
for seed in seeds:
Q.append(seed)
labeled[seed[0], seed[1]] = seed[2] # 将种子点类别信息添加到标注矩阵

while Q: # 列表不为空则继续传播
current = Q.pop(0)
x, y, category = current # 获取当前点坐标及类别

# 使用KNN模型预测4邻域点的类别
for x_offset, y_offset in [(-1, 0), (1, 0), (0, -1), (0, 1)]:
x_neighbor, y_neighbor = x + x_offset, y + y_offset
if 0 <= x_neighbor < height and 0 <= y_neighbor < width:
neighbor = image[x_neighbor, y_neighbor]
pred = knn.predict([neighbor]) # 使用KNN预测类别

if labeled[x_neighbor, y_neighbor] == 0: # 邻域点未被标注
labeled[x_neighbor, y_neighbor] = pred # 标注赋值
Q.append((x_neighbor, y_neighbor, pred)) # 添加新点到传播列表

return labeled

src = cv2.imread('xxx.jpg') # 输入图像
seeds = [(50, 50, 1), (100, 100, 2)] # 选择两个种子点及类别
result = propagation(src, seeds) # 执行标注传播

cv2.imshow('result', result * 50)
cv2.waitKey(0)

这个示例完成了一个简单的标注传播实现。我们首先训练一个KNN模型作为分类器。然后选择两个种子点,设置对应的类别。从这两个种子点开始,使用KNN模型预测其4邻域点的类别,并不断传播,直到图像全部被标注。
可以看到,该方法的效果高度依赖于训练集的质量和种子点的选择。但当得到良好的模型和种子点时,其分割精度会非常高。

5.4. 应用

标注传播的优点是可以很好地利用图像先验知识,使分割结果具有更高的准确率。但是其结果也依赖于网络训练的数据集的质量。训练数据集标注不当会直接导致结果误差较大。

标注传播应用于医学图像分割、遥感图像分割以及一般场景图像的语义分割等任务,具有较高的实用价值。相比于其它无监督方法,标注传播可以达到较高的精度,这也是其优势所在。

6.深度学习

使用深度学习网络如FCN、U-Net等,通过大量训练数据实现图像的自动分割。效果最好,是目前图像分割的主流方法。

6.1. 应用

深度学习在图像分割领域有着越来越广泛的应用,主要有以下几个方向:

1. 全卷积网络(FCN):将分类网络的全连接层替换为卷积层,可以产生像素级的预测结果,用于图像语义分割。FCN融合了分类网络的高层语义信息和低层位置信息,使得分割结果既能准确标注语义类别,也能很好地符合目标物体的形状。

2. 编码器-解码器网络:使用编码器层逐层抽取图像的语义特征,解码器层逐层恢复图像空间信息,输出精细的像素级分割结果。典型网络有U-Net、SegNet等。这类网络可以学习更加抽象的语义概念,产生更加准确的分割。

3. 空洞卷积网络(Dilated ConvNets):使用空洞卷积层来获取更大感受野,捕捉更高层次的语义上下文,用于细粒度的图像分割。典型网络如DeepLab系列等。

4. Attention机制:引入注意力机制,可以自适应地聚焦于输入图像的重要部分,用于场景理解和精细分割。典型网络如DANet、Attention U-Net等。

5. Conditional Random Field (CRF):将深度学习网络的输出作为CRF模型的输入,利用CRF层进一步优化分割结果的连续性和平滑性。

以上方法都是在深度卷积神经网络的框架下,通过设计更加高效的网络结构、损失函数、后处理等手段来解决图像分割任务。这些方法已经在许多数据集上达到最高的分割性能,并广泛应用于医疗影像、自动驾驶等领域。

深度学习使得图像分割比以往任何时候都更加智能和高效。但其结果的可解释性较差,对数据集依赖性较大,这也是其需要继续努力的方向。总体来说,深度学习是图像分割未来发展的主流方向。

6.2 示例

这里以U-Net作为例子,给出深度学习图像分割的代码示例。
import torch
import torch.nn as nn
import torch.nn.functional as F

class UNet(nn.Module):
def __init__(self, n_channels, n_classes):
super(UNet, self).__init__()
self.inc = inconv(n_channels, 64)
self.down1 = down(64, 128)
self.down2 = down(128, 256)
self.down3 = down(256, 512)
self.down4 = down(512, 512)
self.up1 = up(1024, 256)
self.up2 = up(512, 128)
self.up3 = up(256, 64)
self.up4 = up(128, 64)
self.outc = outconv(64, n_classes)

def forward(self, x):
x1 = self.inc(x)
x2 = self.down1(x1)
x3 = self.down2(x2)
x4 = self.down3(x3)
x5 = self.down4(x4)
x = self.up1(x5, x4)
x = self.up2(x, x3)
x = self.up3(x, x2)
x = self.up4(x, x1)
x = self.outc(x)
return x

def inconv(in_channels, out_channels):
return nn.Sequential(
nn.Conv2d(in_channels, out_channels, 3, padding=1),
nn.BatchNorm2d(out_channels),
nn.ReLU(inplace=True)
)

def down(in_channels, out_channels):
return nn.Sequential(
nn.MaxPool2d(2),
nn.Conv2d(in_channels, out_channels, 3, padding=1),
nn.BatchNorm2d(out_channels),
nn.ReLU(inplace=True)
)

def up(in_channels, out_channels):
return nn.Sequential(
nn.Upsample(scale_factor=2),
nn.Conv2d(in_channels, out_channels, 3, padding=1),
nn.BatchNorm2d(out_channels),
nn.ReLU(inplace=True)
)

def outconv(in_channels, out_channels):
return nn.Conv2d(in_channels, out_channels, 1)

这个示例实现了UNet网络,一种典型的编码器-解码器网络结构。它通过多次下采样获得抽象语义特征,再通过上采样逐步恢复空间信息,输出精细的像素级分割结果。
该网络包含卷积层、批量归一化层、ReLU激活层、池化层、上采样层等模块。通过这种 Encoder-Decoder 的设计,可以有效利用高层和低层的特征,使得分割既准确又符合物体形状。
UNet已经在许多医学图像分割数据集上达到最优性能,是目前效果最好的通用图像分割网络之一。

7. 场景示例

我们有一幅包含狗和猫的图像,要实现二者的分割。

1. 阈值法

选择一个阈值,将阈值以上像素区分为猫,以下像素区分为狗。效果较差,无法准确分割。

2. 边缘检测

检测图像中的边缘,但是狗和猫边界不清晰,效果一般。

3. 区域生长法

选择狗和猫各一个种子点进行生长,但是生长过程中容易出现误连,效果受种子点影响较大。

4. 标注传播

给一小部分像素标注狗或猫的标签,通过传播分割整幅图像。需要大量训练数据,效果较好。

5. 深度学习

使用训练好的分割网络直接对图像进行分割,效果最优,可以准确分割狗和猫。

深度学习是图像分割最为主流和高效的方法。通过大数据训练深度网络,可以实现图像中的精细分割与语义理解。这是实现更高级视觉任务的基础。

在 Python 中执行 BASH 命令——在同一进程中潮易 python bash chrome
在Python中执行BASH命令——在同一进程中在Python中执行BASH命令，可以使用`os.system()`或`subprocess`模块。以下是两种方法的详细步骤：方法一：使用`os.system()````pythonimportos#执行一个bash命令，例如显示当前目录下的所有文件command="ls"output=os.system(command)print("Command
Python 爬虫实战：全球公司财报数据抓取与财务健康分析西攻城狮北 python 爬虫开发语言
一、引言在当今数字化时代，数据已成为企业决策、投资分析和市场研究的关键要素。公司财报数据作为企业经营状况的重要反映，对于投资者、分析师以及企业管理者来说具有极高的价值。通过获取和分析全球公司的财报数据，我们可以深入了解企业的财务健康状况，为投资决策提供有力支持。本文将详细介绍如何使用Python爬虫技术抓取全球公司财报数据，并进行财务健康分析。二、爬虫环境搭建在开始爬取数据之前，我们需要先搭建好P
Linux的权限巷子里的童年ya linux 运维服务器 centos
基本权限与归属读取：允许查看内容-readr写入：允许修改内容-writew可执行：允许运行和切换-excutex1、对于文本文件：r读取权限：cat、less、grep、head、tailw写入权限：vim、>、>>x可执行权限：Shell与Python\Go2、对于目录：r读取权限：ls命令查看目录内容w写入权限：能够创建、删除、修改等目录的内容x执行权限：能够cd切换到此目录下（进入此目录）
大模型微调方法之Delta-tuning 空白II 大语言模型论文解读微调方法介绍微调方法 delta-tuning 论文解读大语言模型
大模型微调方法之Delta-tuning大模型微调方法自从23年之后可谓是百花齐放，浙大有团队在8月将关于大模型微调方法的综述上传了ArXiv。论文将微调方法总结为等几个类别。本次讨论的1大模型业务分类当前的大模型行业可谓百花齐放，自然语言处理（naturallanguageprocessing,NLP）、计算机视觉（computervision,CV）、音频处理（audioprocessing,
Python 学习笔记1 - 认识Python Scora_liu Python 学习笔记 python
一、什么是Python1989年圣诞节期间，荷兰数学和计算机科学研究学会的GuidovanRossum（吉多.范罗苏姆）决心开发一个新的解释程序，作为ABC语言的替代品。这门ABC语言的替代语言被取名为Python,命名来自Guido爱看的的电视剧MontyPython'sFlyingCircus（蟒蛇马戏团）。二、什么是Python（⭐⭐）Python是一门解释型语言。计算机不能识别任何除了机器
从零开始学AI——1 人工智能
前言最近总算有想法回到学习上来，这次就拿AI开刀吧。本系列叫从零开始学AI不是骗人的，我对AI的了解几乎就是道听途说，所以起了这么一个标题，希望学完从0变1（？此外，我应该不会特别关注代码实现上的内容，因为我对python也是一窍不通。本笔记为学习周志华老师《机器学习》（西瓜书）的个人学习记录，内容基于个人理解进行整理和再阐述。由于理解可能存在偏差，欢迎指正。引用模块说明：在笔记中，我会使用引用模
Python 正则表达式超详细解析：从基础到精通 2201_75491841 python 正则表达式开发语言
Python正则表达式超详细解析：从基础到精通一、引言在Python编程的广阔领域中，文本处理占据着极为重要的地位。而正则表达式，作为Python处理文本的强大工具，能够帮助开发者高效地完成诸如查找、替换、提取特定模式字符串等复杂任务。无论是在数据清洗、网页爬虫，还是日志分析、自然语言处理等应用场景中，正则表达式都展现出了无可比拟的优势。本文将深入且全面地剖析Python正则表达式，从最基础的概念
Python如何实现粒子效果如烟雾、火焰、雨滴等. openwin_top python编程示例系列二 python 开发语言
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在Panda3D中实现粒子效果主要依赖于其内置的粒子系统。这个系统允许开发者创建各种动态的视觉效果，如烟雾、火焰、雨滴等。下面我将详细介绍如何在Panda3D中添加一个简单的粒子效果。步骤1:准备粒
Python中的机制：全局解释锁和回收机制林十一npc Python语言 python 开发语言
Python中的机制：全局解释锁和回收机制一、全局解释锁GIL1.基础原理全局解释锁：是CPython中引入的一种机制，确保同一时刻保持一个线程执行Python的字节码。锁的粒度：GIL是全局唯一的锁，线程在执行Pyhton代码前必须要获取GIL,执行完毕后进行释放。线程切换：CPython解释器通过固定间隔（如python字节码指令或遇到I/O操作），释放GIL,触发线程切换。底层实现GIL的实
大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署晴天彩虹雨 AI 大模型 ai 语言模型 gpt 人工智能
本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re
python实现简易任务管理器 Roc-xb python 服务器 linux
本章教程，主要利用python实现一个简单的任务管理器，可以快速结束任务进程。目录一、实例代码二、效果演示一、实例代码#!/usr/bin/python#-*-coding:UTF-8-*-"""@author:Roc-xb"""#encoding:utf-8importsubprocessdefexecute_cmd(command):subprocess.run('chcp65001',she
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
Python 爬虫实战：汽车电商平台价格波动监控与市场趋势洞察西攻城狮北 python 爬虫汽车实战案例
目录一、环境准备与依赖安装二、目标网站分析1.网站页面结构分析2.数据爬取策略三、代码实现1.数据抓取模块(1)爬取车型列表(2)爬取车型详情(3)主爬取函数2.数据存储模块3.数据分析模块四、完整工作流程(1)初始化爬虫(2)执行爬虫(3)数据存储(4)数据分析五、注意事项六、扩展功能在当今数字化时代，汽车电商平台为消费者提供了便捷的购车渠道。通过Python爬虫技术，我们可以监控汽车电商平台的
Python实现微博关键词爬虫才华是浅浅的耐心 python 新浪微博爬虫
1.背景介绍随着社交媒体的广泛应用，微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容，本文将介绍如何使用Python编写一个简单的爬虫脚本，从微博中抓取指定关键词的相关数据，并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例，展示从微博抓取该关键词相关数据的全过程。废话不多说，先上结果图。2.项目实现思路该爬虫通过向微博的搜索接口发送HTTP请求，获取与指定
使用 Python 实现批量发送电子邮件才华是浅浅的耐心 python 爬虫开发语言
引言：在日常工作中，我们可能会遇到需要批量发送邮件的场景，例如通知、营销邮件或测试邮件。如果手动发送，不仅效率低下，还容易出错。今天，我将分享一个使用Python实现的自动化邮件发送脚本，通过读取Excel文件中的发件人和收件人信息，轻松完成批量邮件发送任务。功能概述这个脚本的主要功能包括：从Excel文件中读取发件人信息（邮箱和授权码）和收件人信息（邮箱）。根据发件人邮箱的域名，自动匹配SMTP
python 之GUI设计：Entry组件时间之里 python-tkinter python python
说明：Entry（输入框）组件通常用于获取用户的输入文本。使用条件：Entry组件在GUI界面的设计中主要用于单行文本的键入（实际键入的内容可以比显示的空间更长，此种情况下结束鼠标和位移键能够产看自己输入的隐藏内容），通过几何外观图形属性设计可以改变实际的元素表现如果你希望接收多行文本的输入，可以使用Text组件（后面介绍）。常见用法：-普通输入框作为输入框最重要的属性是输入内容的获取：eg:pa
Python Tkinter库实战（用Entry和button控件做一个小型的浏览器） IT界小菜鸡笔记 python 开发语言
大家好，上一期我们大概了解了一下PythonTkinter库。这是一个方便快捷的GUI库；可以用短短几行代码生成出一个用户图形化接口的窗口。算是非常方便。既然前一期我们了解了tk库。那么我们今天就来做一个实战。今天这个实战项目源自于我一个奇奇怪怪的想法。当时打开浏览器的时候想着，既然我打开浏览器输入网址，搜索URL。既然别人可以，那我为什么不可以自己做一个呢？抱着这个想法，我就开始了这个实验。废话
珍藏！Java SpringBoot 精品源码合集约惠来袭，获取路径大公开秋野酱 java spring boot 开发语言
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
python调用DeepSeek的API garfield_sun06 大模型 python 语言模型
1获取API获得deepseek开放平台的APIhttps://platform.deepseek.com/api_keys点击创建APIkey2调用方法方法一：采用openai的调用方法pipinstallopenai需要openai的包调用的代码框架fromopenaiimportOpenAIimportosclient=OpenAI(api_key='自己的APIkey',base_url=
Python GUI 开发：全面指南一休哥助手 python python 开发语言
1.PythonGUI开发简介GUI是指图形用户界面，它使用户可以通过图形元素（如按钮、文本框、下拉菜单等）与应用程序进行交互。与命令行界面相比，GUI更加直观易用。Python提供了多种库和框架，使开发者能够轻松创建功能丰富的桌面应用程序。1.1为什么选择Python进行GUI开发？简洁易读：Python的语法简洁，代码易于理解，开发者可以专注于应用程序的逻辑而不是语法。跨平台：Python是跨
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
Python图形界面(GUI)Tkinter笔记（十四）：Entry与Button的碰撞（1）小叶肥辉 tkinter python gui tkinter
用功能按钮(Button)、单行文本输入框(Entry)、文本框内容读取(get)实现一个极简易的加法运算，及与其他控件的交互，提高体验，主要体现其人机交互的意义。因为Entry()文本输入框没有限制输入内容属性的参数，它是把所有的输入都视作它特有的一个类属性，所以用get()方法读取出来是一个字符串而这字符串可包括字母或其它符号。因此我们必须对其进行判断后再计算，若直接计算可能会出现不可预料的错
python ppt转pdf macos_如何在 macOS 上一键批量把 PPT 和 Word 文件转成 PDF weixin_39857792 python ppt转pdf macos
原标题：如何在macOS上一键批量把PPT和Word文件转成PDF相信不少人都有或曾经有过需要将多个PPT/Word文件转为PDF的需求，可能是一堆PPT课件为了方便批注，也可能是一些Word文档为了方便阅读。每次只能打开一个文档，选择「另存为」，选「PDF」，点「保存」，关掉，再打开下一个文档，文档数目一多，整个过程就会变得很令人沮丧。最近我研究了一下这个磨人的问题，制作了一个动作可以在不到2秒
python智能合约编程_技术指南 | Python智能合约开发？看这一篇就够了 weixin_39897127 python智能合约编程
01前言在之前的技术视点文章中，我们介绍了目前本体主网支持的智能合约体系以及相应的智能合约开发工具SmartX。很多小伙伴都想上手练一练。在本期的技术视点中，我们将正式开始讲述智能合约语法部分。本体的智能合约API分为7个模块，分别是Blockchain&BlockAPI、RuntimeAPI、StorageAPI、NativeAPI、UpgradeAPI、ExecutionEngineAPI以及
langchain chroma 与 chromadb笔记 phynikesi langchain 笔记 chromadb
chromadb可独立使用也可搭配langchain框架使用。环境：python3.9langchain=0.2.16chromadb=0.5.3chromadb使用示例importchromadbfromchromadb.configimportSettingsfromchromadb.utilsimportembedding_functions#加载embedding模型en_embeddin
python电脑怎么打开任务管理器_利用Python调用Windows API，实现任务管理器功能 weixin_39778400
任务管理器具体功能有：1、列出系统当前所有进程。2、列出隶属于该进程的所有线程。3、如果进程有窗口，可以显示和隐藏窗口。4、强行结束指定进程。通过Python调用WindowsAPI还是很实用的，能够结合Python的简洁和WindowsAPI的强大，写出各种各样的脚本。编码中的几个难点有：1、API的入参是结构体时，怎么解决？答：Python内手动建立结构体。详见：https://baijiah
OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
Python入门(函数) 高育良00003 python 开发语言
一.基础认识一种映射关系1.1什么是函数呢？概念函数是可以重复执行的语句块，可以重复调用作用用于封装语句块，提高代码的重用性1.2函数的定义语法：deffunction():#def为关键字，function为函数名#语句想要执行的操作returnre#re为返回值二.函数的调用函数名后+小括号()表示函数的执行2.1基本用法语法：函数名(实际调用的参数)2.2调用传参2.2.1位置传参最为常见，
python本地连接minio 伶星37 python 网络服务器
在你浏览器能成功访问到你的minio网页，并且成功登录之后。接下来如果你想用python连接数据库，并且想用python连接minio，就可以用这个blog。连接代码client=Minio("localhost:9000",#9000是默认端口号access_key="admin",#你的账户secret_key="password",#你的密码secure=False,#这点我会详细说明)为什
头歌实践教学平台 Python程序设计实训答案（三）学习的锅头哥实践教学平台实训答案 python
第七阶段文件实验一文本文件的读取第1关：学习-Python文件之文本文件的读取任务描述本关任务：使用open函数以只写的方式打开文件，打印文件的打开方式。相关知识为了完成本关任务，你需要掌握：文本文件；open函数及其参数；文件打开模式；文件对象常用属性；关闭文件close函数。#请在下面的Begin-End之间按照注释中给出的提示编写正确的代码##########Begin###########
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f