NCR1008

基于Python+Tkinter GUI 的模式识别水果分类小程序

采用Python语言编写，并结合Tkinter GUI工具制作交互式小程序开发，实现了简单的水果的边缘提取和分类。如图1-A，用户可以自定义选择路径并输出，同时可以在对话框中输入/输出结果，如图1-B。

A 界面展示

B 交互展示

图1 Tkinter GUI 展示

技术路线

本次课程实践一整体设计分为三个部分：

利用Python实现图像处理的基础功能
利用Python实现图像二值化并提取边缘
利用①中的波谱信息以及②中处理后的边缘特征对水果进行分类

图2 技术路线图

一、界面设计部分

利用python中的tkinter GUI 进行交互式设计

    def __init__(self, master, entry, entry1):
        self.master = master
        self.entry = entry
        self.entry1 = entry1
        # self.gray = gray
        entry = tk.Entry(self.master, state='readonly', text=path, width=100, bg="#E0FFFF", justify='center')
        entry.configure(fg='red', bg="#E0FFFF")
        entry.pack()
        self.b1 = tk.Button(self.master, text='加载图像', command=self.select_img, fg="red", bg="#E0FFFF")
        self.b1.pack()
        self.b2 = tk.Button(self.master, text='分波段显示', command=self.seperateband, fg="red", bg="#E0FFFF")
        self.b2.pack()
        self.b3 = tk.Button(self.master, text='多波段合成', command=self.multibands, fg="red", bg="#E0FFFF")
        self.b3.pack()
        self.b4 = tk.Button(self.master, text='直方图绘制', command=self.historgram, fg="red", bg="#E0FFFF")
        self.b4.pack()
        self.b5 = tk.Button(self.master, text='图像灰度化', command=self.Gray, fg="red", bg="#E0FFFF")
        self.b5.pack()
        self.b6 = tk.Button(self.master, text='阈值分割', command=self.binary, fg="red", bg="#E0FFFF")
        self.b6.pack()
        self.b7 = tk.Button(self.master, text='Sobel算子', command=self.Sobel, fg="red", bg="#E0FFFF")
        self.b7.pack()
        self.b8 = tk.Button(self.master, text='Canny边缘提取', command=self.boundary, fg="red", bg="#E0FFFF")
        self.b8.pack()
        self.b9 = tk.Button(self.master, text='边缘生长', command=self.grow, fg="red", bg="#E0FFFF")
        self.b9.pack()
        self.b10 = tk.Button(self.master, text='区域填充', command=self.fillgrow, fg="red", bg="#E0FFFF")
        self.b10.pack()
        entry1 = tk.Entry(self.master, state='readonly', text=num, width=100, bg="#E0FFFF", justify='center')
        entry1.configure(fg='red', bg="#E0FFFF")
        entry1.pack()

二、图像读取

算法步骤

Tkinter交互式选择图片
GDAL库读取影像
借助matplotlib显示
源代码

    def select_img(self):
        # 路径选择框
        path_ = tk.filedialog.askopenfilename()
        path.set(path_)
        print('path', path_)
        self.entry = path_
        datafile = gdal.Open(str(path_))
        win1 = tk.Toplevel(self.master)
        win1.title('图像加载')
        win1.geometry('600x400')
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        fig1 = plt.figure(figsize=(6, 4))
        canvas1 = FigureCanvasTkAgg(fig1, master=win1)
        canvas1.draw()
        canvas1.get_tk_widget().grid()
        band1 = datafile.GetRasterBand(1).ReadAsArray()
        band2 = datafile.GetRasterBand(2).ReadAsArray()
        band3 = datafile.GetRasterBand(3).ReadAsArray()
        img1 = np.dstack((band1, band2, band3))
        ax1 = fig1.add_subplot(111)
        ax1.set_title('真彩色', fontsize=10)
        ax1.imshow(img1)

三、直方图绘制

算法步骤

GDAL逐个读取波段
对于每个波段，将[0,255]划分为等间隔的小区间，并统计每个区间上样本出现的频数之和。
Matplotlib显示

源代码

    def historgram(self):
        win4 = tk.Toplevel(self.master)
        win4.title('直方图绘制')
        win4.geometry('800x600')
        src = gdal.Open(str(self.entry))
        r = src.GetRasterBand(1).ReadAsArray()
        g = src.GetRasterBand(2).ReadAsArray()
        b = src.GetRasterBand(3).ReadAsArray()
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        fig4 = plt.figure(figsize=(8, 6))
        canvas4 = FigureCanvasTkAgg(fig4, master=win4)
        canvas4.draw()
        canvas4.get_tk_widget().grid()
        # 真彩色
        img = np.dstack([r, g, b])
        ax1 = fig4.add_subplot(221)
        plt.imshow(img)
        plt.axis('off')
        ax1.set_title("(a)原始图像")

        # 绘制蓝色分量直方图
        ax2 = fig4.add_subplot(222)
        plt.hist(b.ravel(), bins=256, density=1, facecolor='b', edgecolor='b', alpha=0.75)
        # plt.xlabel("x")
        # plt.ylabel("y")
        ax2.set_title("(b)蓝色分量直方图")

        # 绘制绿色分量直方图
        ax3 = fig4.add_subplot(223)
        plt.hist(g.ravel(), bins=256, density=1, facecolor='g', edgecolor='g', alpha=0.75)
        # plt.xlabel("x")
        # plt.ylabel("y")
        ax3.set_title("(c)绿色分量直方图")

        # 绘制红色分量直方图
        ax4 = fig4.add_subplot(224)
        plt.hist(r.ravel(), bins=256, density=1, facecolor='r', edgecolor='r', alpha=0.75)
        # plt.xlabel("x")
        # plt.ylabel("y")
        ax4.set_title("(d)红色分量直方图")

四、图像灰度化

常见的图像灰度化有三种方式：

算法步骤

GDAL逐波段读取图像
选择r、g、b三波段（有些图像为32bit，及包括RGB+Alpha位）
将r、g、b三波段利用numpy组合
利用rgb2gray函数进行转换，对应转化比例如表三所示
Matplotlib显示

源代码

    def Gray(self):
        win5 = tk.Toplevel(self.master)
        win5.title('图像灰度化')
        win5.geometry('600x400')
        fig5 = plt.figure(figsize=(6, 4))
        canvas5 = FigureCanvasTkAgg(fig5, master=win5)
        canvas5.draw()
        canvas5.get_tk_widget().grid()
        datafile = gdal.Open(str(self.entry))
        band1 = datafile.GetRasterBand(1).ReadAsArray()
        band2 = datafile.GetRasterBand(2).ReadAsArray()
        band3 = datafile.GetRasterBand(3).ReadAsArray()
        img0 = np.dstack((band1, band2, band3))
        # 读入中文路径
        img = cv2.imdecode(np.fromfile(self.entry, dtype=np.uint8), cv2.IMREAD_COLOR)
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        ax1 = fig5.add_subplot(121)
        ax1.imshow(img0)
        ax1.set_title('original')
        # 灰度化
        ax2 = fig5.add_subplot(122)
        ax2.set_title('gray')
        gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
        # gray = rgb2gray(img)
        ax2.imshow(gray, cmap=plt.get_cmap('gray'))

    def rgb2gray(rgb):
        # 灰度化原理Y' = 0.299 R + 0.587 G + 0.114 B
        return np.dot(rgb[..., :3], [0.299, 0.587, 0.114])

五、边缘检测

常用的边缘检查的方法大致可以分为两类：①基于查找：通过寻找图像一阶导数中最大值和最小值来检测边界，例如Sobel算子、Roberts Cross算法等。②基于零穿越的：通过寻找图像二阶导数零穿越来寻找边界,例如Canny算子、Laplacian算子等。

5.1Sobel算子

算法介绍

Sobel算子思想：取 3 行 3 列的图像数据，将图像数据与对应位置的算子的值相乘再相加，得到x方向的Gx，和y方向的Gy，将得到的Gx和Gy，平方后相加，再取算术平方根，得到Gxy，近似值为和绝对值之和。将计算得到的阈值比较。若大于阈值，则表明该点为边界点，设置DN值为0，否则为255。

结果

源代码

    def Sobel(self):
        win7 = tk.Toplevel(self.master)
        win7.title('Sobel算子')
        win7.geometry('600x400')
        fig7 = plt.figure(figsize=(6, 4))
        canvas7 = FigureCanvasTkAgg(fig7, master=win7)
        canvas7.draw()
        canvas7.get_tk_widget().grid()
        img = cv2.imdecode(np.fromfile(self.entry, dtype=np.uint8), cv2.IMREAD_COLOR)
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        # 转灰度图像
        d = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
        sp = d.shape
        print(sp)
        height = sp[0]
        weight = sp[1]
        sx = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])
        sy = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])
        dSobel = np.zeros((height, weight))
        dSobelx = np.zeros((height, weight))
        dSobely = np.zeros((height, weight))
        Gx = np.zeros(d.shape)
        Gy = np.zeros(d.shape)
        for i in range(height - 2):
            for j in range(weight - 2):
                Gx[i + 1, j + 1] = abs(np.sum(d[i:i + 3, j:j + 3] * sx))
                Gy[i + 1, j + 1] = abs(np.sum(d[i:i + 3, j:j + 3] * sy))
                dSobel[i + 1, j + 1] = (Gx[i + 1, j + 1] * Gx[i + 1, j + 1] + Gy[i + 1, j + 1] * Gy[
                    i + 1, j + 1]) ** 0.5
                dSobelx[i + 1, j + 1] = np.sqrt(Gx[i + 1, j + 1])
                dSobely[i + 1, j + 1] = np.sqrt(Gy[i + 1, j + 1])
        a = np.uint8(dSobel)
        b = np.uint8(dSobelx)
        c = np.uint8(dSobel)
        img = img[:, :, ::-1]
        image1 = np.dstack([a, a, a])
        image2 = np.dstack([b, b, b])
        image3 = np.dstack([c, c, c])
        ax1 = fig7.add_subplot(111)
        ax1.imshow(image1)
        ax1.set_title('Sobel')

5.2 阈值分割

算法介绍

本问采用采取自适应局部滤波算法，主要包括两种情形：

均值：以计算区域像素点灰度值的平均值作为该区域所有像素的灰度值，起到平滑或滤波作用。
高斯加权和：将区域中点（x，y）周围的像素根据高斯函数加权计算他们离中心点的距离。

本文中采用高斯加权法进行局部阈值分割，并设置了5*5、7*7、11*11、13*13四种邻域范围，对比不同邻域下的分割效果。

算法步骤

图像灰度化
不同邻域下高斯加权法的局部阈值分割
Matplotlib显示

结果

源代码

    def binary(self):
        win6 = tk.Toplevel(self.master)
        win6.title('阈值分割')
        win6.geometry('800x600')
        fig6 = plt.figure(figsize=(8, 6))
        canvas6 = FigureCanvasTkAgg(fig6, master=win6)
        canvas6.draw()
        canvas6.get_tk_widget().grid()
        # 读入中文路径
        img = cv2.imdecode(np.fromfile(self.entry, dtype=np.uint8), cv2.IMREAD_COLOR)
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
        # 二值化
        binary1 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 5, 5)
        binary2 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 5)
        binary3 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 5)
        binary4 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 13, 5)
        ax3 = fig6.add_subplot(221)
        ax3.set_title('kernal 5*5')
        image1 = np.dstack([binary1, binary1, binary1])
        ax3.imshow(image1)
        ax4 = fig6.add_subplot(222)
        ax4.set_title('kernal 7*7')
        image2 = np.dstack([binary2, binary2, binary2])
        ax4.imshow(image2)
        ax5 = fig6.add_subplot(223)
        ax5.set_title('kernal 11*11')
        image3 = np.dstack([binary3, binary3, binary3])
        ax5.imshow(image3)
        ax6 = fig6.add_subplot(224)
        ax6.set_title('kernal 13*13')
        image4 = np.dstack([binary4, binary4, binary4])
        ax6.imshow(image4)
        # cv2.imwrite("image_binary.png", binary4)

5.3 Canny算子

Canny算子流程

高斯滤波去噪
计算梯度大小和梯度方向，其中梯度方向为 $\Theta$
对梯度幅值图像进行非极大抑制（边缘的方向与梯度方向垂直）
双阈值处理和连接性分析确定边界

处理步骤

图像灰度化
高斯滤波处理
计算图像各方位的梯度大小和方向
对垂直于梯度方向的边缘进行非极大值抑制
进行双阈值处理和连结性分析确定边界
Matplotlib显示

结果

源代码

    def boundary(self):
        win8 = tk.Toplevel(self.master)
        win8.title('Canny_boundary')
        win8.geometry('600x400')
        fig8 = plt.figure(figsize=(6, 4))
        canvas8 = FigureCanvasTkAgg(fig8, master=win8)
        canvas8.draw()
        canvas8.get_tk_widget().grid()
        img = cv2.imdecode(np.fromfile(self.entry, dtype=np.uint8), cv2.IMREAD_COLOR)
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        blurred = cv2.GaussianBlur(gray, (3, 3), 0)
        xgrad = cv2.Sobel(blurred, cv2.CV_16SC1, 1, 0)
        ygrad = cv2.Sobel(blurred, cv2.CV_16SC1, 0, 1)
        edge_output = cv2.Canny(xgrad, ygrad, 50, 150)
        edge_image = np.dstack([edge_output, edge_output, edge_output])
        ax1 = fig8.add_subplot(111)
        ax1.imshow(edge_image)
        ax1.set_title('Canny_boundary')

5.4区域生长

对于上述三种边缘提取的算法（Sobel算子、阈值分割、Canny算子）而言，可以分析得出：

Sobel算子阴影处理效果不好，分界线不清晰

优点：输出图像(数组)的元素通常具有更大的绝对数值。

缺点：由于边缘是位置的标志，对灰度的变化不敏感。

自适应局部阈值法中，实验表明邻域为11*11时效果好，但斑点噪声多，不利于后处理。
Canny算子处理完之后为无阴影的二值图像，但部分边缘缺失。

优点：Canny算子增加了非极大值抑制以及双阈值方法，因此排除了非边缘点的干扰，检测效果更好，且标识出的边缘要与实际图像中的实际边缘尽可能接近。

缺点：图像中的边缘只能标识一次，并且可能存在的图像噪声不应标识为边缘。

就算对于效果最好的Canny算子而言，仍然存在一定的边缘缺失。因此我们考虑利用中心对称特性将其补全。

核心思想

由于在实际拍照过程中考虑到到光照等因素的原因，检测出的边缘会存在边缘缺失的情况，而为了提取出完整的边缘，我们需要对缺失部分进行补全。

又考虑到水果总是关于其中心对称的，因此沃恩可以采取判断每一个已知边缘点关于中心对称的点灰度值是否为255即可。

算法流程

执行Canny边缘提取
对提取后的数组进行遍历，求取其长、宽以及相对位置中心
构建与边缘提取后数组大小相同的新数组，并利用中心对称性对缺失值进行补全
Matplotlib显示

结果

处理前：

处理后：

源代码

    def grow(self):
        # 生成新空间~
        win9 = tk.Toplevel(self.master)
        win9.title('边缘生长')
        win9.geometry('600x400')
        fig9 = plt.figure(figsize=(6, 4))
        canvas9 = FigureCanvasTkAgg(fig9, master=win9)
        canvas9.draw()
        canvas9.get_tk_widget().grid()
        # img[:,:,0]获取band1 shape：360，480
        img = cv2.imdecode(np.fromfile(self.entry, dtype=np.uint8), cv2.IMREAD_COLOR)
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        blurred = cv2.GaussianBlur(gray, (3, 3), 0)
        xgrad = cv2.Sobel(blurred, cv2.CV_16SC1, 1, 0)
        ygrad = cv2.Sobel(blurred, cv2.CV_16SC1, 0, 1)
        edge_output = cv2.Canny(xgrad, ygrad, 50, 150)
        # print(edge_output)
        width, height = edge_output.shape
        # print(width, height)  # 360 480
        list_x = []
        list_y = []
        value = []
        for i in range(width):
            for j in range(height):
                if (edge_output[i][j] != 0):
                    list_x.append(i)
                    list_y.append(j)
                    value.append(edge_output[i][j])
                    # print(i, j)
                    # print(edge_output[i][j])
        x_max = max(list_x)
        x_min = min(list_x)
        # print(x_max, x_min)
        x_mean = int((x_max + x_min) / 2)
        # print('x_mean', x_mean)
        y_max = max(list_y)
        y_min = min(list_y)
        img1 = cv2.rectangle(img, (y_min, x_min), (y_max, x_max), (0, 255, 0), 2)  # 红
        y_mean = int((y_max + y_min) / 2)
        visited = np.zeros(shape=(edge_output.shape), dtype=np.uint8)
        for i in range(len(list_x)):
            x = list_x[i]
            y = list_y[i]
            # visited[x][y] = 1
            if x < x_mean and y < y_mean:
                directs = [(1, 0), (1, 1), (0, 1)]
            if x >= x_mean and y < y_mean:
                directs = [(-1, 0), (0, 1), (-1, 1)]
            if x < x_mean and y >= y_mean:
                directs = [(1, 0), (1, -1), (0, -1)]
            if x >= x_mean and y >= y_mean:
                directs = [(-1, 0), (-1, -1), (0, -1)]
            for direct in directs:
                current_x = x + direct[0]
                current_y = y + direct[1]
                if current_x < x_min or current_y < y_min or current_x >= x_max or current_y >= y_max:
                    continue
                # if (not visited[current_x][current_y]) and (edge_output[current_x][current_y] == edge_output[x][y]):
                if (not visited[current_x][current_y]):
                    edge_output[current_x][current_y] = 255
                    visited[current_x][current_y] = 1
                    x = 2 * x_mean - current_x
                    y = 2 * y_mean - current_y
                    # if(not visited[x][y] and current_y>y_mean and current_x maxA:
                max1 = i
                maxA = w * h
        cv2.drawContours(img1, contours, max1, (0, 0, 255), 2)
        band1 = img1[:, :, 0]
        band2 = img1[:, :, 1]
        band3 = img1[:, :, 2]
        ax1 = fig9.add_subplot(111)
        image = np.dstack([band3, band2, band1])
        ax1.imshow(image)
        ax1.set_title('boundary')

六、分类

	边缘处理	区域生长	Result
Orange1			面积：597069 种类：橙子
Orange2			面积：362935 种类：橙子
Lemon			面积：130258 种类：柠檬

本模式识别任务为本人课程实践中所作，受于水平有限，很多地方存在漏洞，欢迎大家批评指正~

程序下载可见下网址

https://download.csdn.net/download/m0_51301348/86728190

大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
Python数据分析案例｜从模拟数据到可视化：零售门店客流量差异分析全流程
1.依赖库导入importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdfrommatplotlibimportfont_managerfromdatetimeimportdatetimematplotlib.pyplot：用于绘制图表。numpy：numpy：pandas：虽然代码中未font_manager：设置datetime：生成
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
Python中字符串的操作方法幻鸩605 python java 开发语言
字符串拼接使用+运算符将多个字符串连接起来。例如：s1="Hello"s2="World"result=s1+""+s2print(result)#输出：HelloWorld字符串重复使用*运算符重复字符串。例如：s="abc"result=s*3print(result)#输出：abcabcabc字符串长度使用len()函数获取字符串长度。例如：s="Python"length=len(s)pr
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
【图像处理基石】如何检测到画面中的ppt并对其进行增强？
1.入门版ppt检测增强工具我们介绍一个使用Python进行PPT检测并校正画面的实现方案。这个方案主要利用OpenCV进行图像处理，通过边缘检测和透视变换技术来识别并校正PPT画面。importcv2importnumpyasnpfromPILimportImageimportmatplotlib.pyplotaspltclassPPTDetector:def__init__(self):#初始
Python中什么时候需要返回值，什么时候不需要返回值？？？似乎很简单 Python学习日记 python 开发语言
在Python中，函数是否需要返回值取决于它的设计目的和功能需求。需要返回值的情况计算结果需要被后续代码使用当函数的主要目的是计算或生成数据，且调用方需要这些结果时：defadd(a,b):returna+b#结果需要被其他代码使用total=add(3,5)#需要返回值需要传递状态或信息如果函数执行后需要告诉调用方是否成功、返回状态码或错误信息：defvalidate_input(input):
Python中的高阶函数---便捷的语法书写！！！！，可以简化一些函数的书写！！！似乎很简单 Python学习日记 python 开发语言学习笔记
目录1.map()函数示例1：单可迭代对象（平方运算）示例2：多可迭代对象（元素相加）2.mapvs列表推导式什么是列表推导式（ListComprehension）？对比示例列表推导式的优势map的优势5.实际应用场景场景1：批量转换数据类型场景2：多列数据处理场景3：链式操作6.性能与注意事项总结3.sorted()函数1.语法：sorted(iterable,*,key=None,revers
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
Seaborn高阶玩法全解析：从复杂图表到多图布局的可视化实战指南
数据可视化就像给数据“画肖像”——初级阶段是勾勒轮廓，高级阶段则是赋予灵魂。在Python可视化生态中，Seaborn凭借“一行代码出美图”的优雅，成为数据分析的“画笔利器”。但你是否遇到过这样的场景：想同时展示数据分布与统计量，却被基础图表限制；想批量绘制分面图，手动拼接效率低下；想让图表更具设计感，却对颜色搭配和注解技巧一知半解？本文将带你解锁Seaborn的高阶玩法，从复杂图表绘制到多图布局
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
掌握变量命名与Python继承机制
掌握变量命名与Python继承机制背景简介在编程中，变量命名和继承是基础且重要的概念。良好的命名习惯可以提升代码的可读性，而继承则是一种代码复用的重要机制。本文将结合具体的书籍章节内容，深入解析变量命名规则和Python继承机制。变量命名规则变量命名是编程中最基础的部分，而正确的命名习惯能够帮助其他开发者（或未来的自己）更好地理解代码。根据书籍提供的内容，我们应当遵守以下规则：变量名只包含数字、下
从零开始：构建支持上下文窗口的AI原生应用实战指南 AI天才研究院 AI人工智能与大数据 AI-native ai
从零开始：构建支持上下文窗口的AI原生应用实战指南关键词：大语言模型（LLM）、上下文窗口、AI原生应用、token管理、对话状态保持、向量检索、记忆压缩摘要：本文从AI原生应用的核心需求出发，系统讲解支持上下文窗口的应用构建全流程。通过解析上下文窗口的技术本质、关键挑战及解决方案，结合Python代码实战和真实场景案例，帮助开发者掌握从需求分析到落地部署的完整方法。内容涵盖上下文窗口管理策略、t
颠覆人机交互！多模态 AI Agents 大模型如何用 5 大模式开启智能新时代？
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列七颠覆人机交互！多模态AIAgents大模型如何用5大模式开启智能新时代？一、从“单一感知”到“多模态融合”：A
python进程线程协程区别_Python：线程、进程与协程(1)——概念 weixin_39989159 python进程线程协程区别
最近的业余时间主要放在了学习Python线程、进程和协程里，第一次用python的多线程和多进程是在两个月前，当时只是简单的看了几篇博文然后就跟着用，没有仔细去研究，第一次用的感觉它们其实挺简单的，最近这段时间通过看书，看Python中文官方文档等等相关资料，发现并没有想想中的那么简单，很多知识点需要仔细去理解，Python线程、进程和协程应该是Python的高级用法。Python的高级用法有很多
实操 SpringBoot+MCP！清风孤客 spring boot 后端 java 人工智能
引言随着人工智能的飞速发展，大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。想象一下这样的场景：用户无需钻研复杂的API文档或者在繁琐的表单间来回切换，只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三，邮箱是[email protected]”。这种直观、流畅的交互方式不仅能显著降低新用户的学习曲线，更能大幅削减B端系统的培训成本和实施
如何学习智能体搭建
如何学习智能体搭建前言随着人工智能的发展，智能体（Agent）成为自动化、交互式应用和自主决策系统中的核心角色。本书将从零基础出发，系统讲解智能体的基本原理、常见框架、实战搭建与进阶技巧，帮助你快速上手并应用于实际项目。目录智能体基础认知智能体的核心组成主流智能体开发框架本地智能体与云端智能体选型智能体的任务自动化与插件集成智能体的知识检索与上下文管理智能体的多模态扩展智能体安全与可控性智能体实战
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
Python Selenium 使用指南
Selenium是一个用于自动化Web浏览器交互的强大工具，常用于网页测试、数据抓取和自动化任务。以下是Python中Selenium的详细使用说明。安装Selenium首先需要安装Selenium库和浏览器驱动：pipinstallselenium然后下载对应浏览器的驱动：Chrome:ChromeDriverFirefox:GeckoDriverEdge:EdgeDriver将驱动放在系统PA
【Python进阶】Python网络协议与套接字编程：构建客户端和服务器
1、网络通信基础与网络协议1.1网络通信模型概述网络通信是信息时代基石，它如同现实世界中的邮递系统，将数据从一处传递到另一处。其中，OSI七层模型与TCP/IP四层或五层模型是理解和构建网络通信的基础。1.1.1OSI七层模型与TCP/IP四层/五层模型OSI（开放系统互连）参考模型提出了七层结构，从物理层到应用层，每一层都有其特定的功能和职责，例如物理层关注的是信号如何在介质上传输，而应用层则处
Python 网络爬虫的基本流程及 robots 协议详解女码农的重启 python 网络爬虫 JAVA 开发语言
数据驱动的时代，网络爬虫作为高效获取互联网信息的工具，其规范化开发离不开对基本流程的掌握和对robots协议的遵守。本文将系统梳理Python网络爬虫的核心流程，并深入解读robots协议的重要性及实践规范。一、Python网络爬虫的基本流程Python网络爬虫的工作过程可分为四个核心阶段，每个阶段环环相扣，共同构成数据采集的完整链路。1.1发起网络请求这是爬虫与目标服务器交互的第一步，通过发送H
python中的pydantic是什么？ John Song Python python 前端开发语言 pydantic
Pydantic是Python中一个用于数据验证和设置管理的库，主要通过Python类型注解（TypeHints）来定义数据结构，并自动验证输入数据的合法性。它广泛应用于API开发（如FastAPI）、配置管理、数据序列化等场景。核心功能数据验证自动检查输入数据是否符合类型和约束条件（如字符串长度、数字范围等）。类型转换将原始数据（如JSON、字典）转换为Python类型（如datetime、En
[特殊字符] AlphaGo：“神之一手”背后的智能革命与人机博弈新纪元大千AI助手人工智能 Python #OTHER 人工智能算法数据挖掘机器学习 alphago google 围棋
从围棋棋盘到科学前沿的通用人工智能范式突破本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与历史意义AlphaGo是由谷歌DeepMind团队开发的围棋人工智能程序，其里程碑意义在于：首破人类围棋壁垒：2016年以4:1击败世界冠军李世石九段，成为首个在完整对局中战胜人类顶尖棋手的AI。
python视频工具包 ffmpeg 使用示例 pythonffmpeg
1.简介FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。2.ffmpeg的常用方法将某文件下所有ts文件按顺序合并，转换成MP4格式存储：importffmpegdeftest2():ts_folder='path/ts_files/ceshi/'output_mp4="pa
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
python汇率_用Python抓取汇率
抓取的是中行的数据:网址代码#-*-coding:utf-8-*-importreimporturllib.requesturl='http://www.boc.cn/sourcedb/whpj/index.html'#网址req=urllib.request.Request(url)response=urllib.request.urlopen(req)the_page=response.rea
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

基于Python+Tkinter GUI 的模式识别水果分类小程序

技术路线

一、界面设计部分

二、图像读取

算法步骤

源代码

三、直方图绘制

算法步骤

源代码

四、图像灰度化

算法步骤

源代码

五、边缘检测

5.1Sobel算子

算法介绍

结果

源代码

5.2 阈值分割

算法介绍

算法步骤

结果

源代码

5.3 Canny算子

处理步骤

结果

源代码

5.4区域生长

核心思想

算法流程

结果

处理前：

处理后：

源代码

六、分类

本模式识别任务为本人课程实践中所作，受于水平有限，很多地方存在漏洞，欢迎大家批评指正~

程序下载可见下网址

你可能感兴趣的:(python,开发语言,人工智能)