吃猫的鱼python

计算机视觉项目实战-背景建模与光流估计（目标识别与追踪）

欢迎来到本博客
本次博客内容将继续讲解关于OpenCV的相关知识
作者简介：⭐️⭐️⭐️目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉python网页爬虫、机器学习、计算机视觉（OpenCV）、群智能算法、深度学习等内容。以后可能会涉及到网络安全相关领域，毕竟这是每一个学习计算机的梦想嘛！
目前更新：目前已经更新了关于网络爬虫的相关知识、机器学习的相关知识、目前正在更新计算机视觉-OpenCV的相关内容。

本文摘要

计算机视觉项目-背景建模

文章目录

⭐️项目前言

⭐️背景建模-帧差法

⭐️背景建模-混合高斯模型

⭐️混合高斯模型背景建模实战

⭐️光流估计

Lucas-Kanade算法

⭐️光流估计实战演示

这里我准备用自己的一个投篮来做试一下这个小项目！后期会做出结果。本来是要做视频的结果没有办法，总显示数据不存在，大家简单的看一下就好。

⭐️项目前言

熟悉OpenCV的小伙伴们都知道一点就是视频是由一帧一帧的图像组合而成，那么当我们传进来一个摄像头录制的图像的时候（因为摄像头录制的较为稳定），我们是不是也可以做这样的一件事：检测到那些物体或者说那些人在运动，那些物体没有在运动。也就是我们所谓的哪些是前景，那些是背景。那么我们就来具体看看背景建模都有那些方法。

⭐️背景建模-帧差法

首先我们来讲一下什么是帧差法：由于场景中的目标在运动，目标的影像在不同图像帧中的位置不同。该类算法对时间上连续两帧或者三帧图像进行像素值差分运算，不同帧对应的像素值进行相减，判断灰度值的绝对值。当绝对值超过了一定的阈值之后，既可以判断成运动目标，从而实现运动的目标检测功能。

侦差法非常简单，但是会引入噪音，和一些空洞问题。很明显两帧图像背景的部分，不可能像素值一点不变，变一点计算机都是可以识别的，所以他一定会出现一些噪音点，比如上方的图像就是出现了人的周围也出现了很多的噪音点。还有一个就是空洞问题，那么什么是一个空洞问题呢，就是上方图像中整个人都是在运动的，但是由于两帧图像中人移动的很小，把自己身体部分一部分一直处于一个黑色的状态，导致人体内部都是黑色的。没有识别出来。

⭐️背景建模-混合高斯模型

流程总览：在进行前景检测前，先对背景进行训练，对图像的每一个背景都进行一个混合高斯模型进行模拟，每个背景的混合高斯的个数可以自适应。对于新来的像素值进行GMM匹配，如果该像素数值能够匹配其中一个高斯模型，那么就可以认为是背景，否则认为是前景，由于整个过程GMM都在不断更新学习的过程，所以对于动态背景该算法也具有一定的鲁棒性，最后通过一个有树枝摇摆的动态背景进行前景检测，会取得较好的结果。
首先我们先来看一下什么是高斯模型：

对于像素值中的一个点的展示是这样：

背景的实际分布应当是多个高斯分布混合在一起，每个高斯模型也可以带有权重。
这里我们来具体说一下为什么说是混合高斯模型，为什么要混合呢？因为当你拿到一帧图像的时候，不可能在这个图像当中就一个背景的，可能有天空，可能有绿地，可能有具体的事物。那么这些背景的对应的高斯模型都是不相同的，那么就需要混合高斯模型来做这一件事。天空这个背景对应第一个高斯模型，草地这个背景对应第三个高斯模型。都被匹配上了，那么我们就认为他是一个背景，如果都没有被高斯模型匹配上，那么我们就认为他是一个运动的。

这里面就描述了两个高斯模型。

混合高斯模型学习方法：

首先初始化每个高斯模型矩阵参数。
这里我们初始化每一个高斯模型矩阵。比如我们拿到了第一个像素点的数值是100，然后对应的均值差默认值是5。
取视频中T帧数据图像用来训练高斯混合模型。来了第一个像素之后用它来当做第一个高斯分布。
我们取得不是一帧图像，而是多帧，一般我们取值在200帧左右，第一帧的第一个像素点取完之后呢，然后我们取第二帧的第一个像素点，得到像素值是105，然后计算一下105-100=5<3*均值差=15。然后我们就把105归为这个高斯模型。
当后面来的像素值时，与前面已有的高斯的均值比较，如果该像素点的值与其模型均值差在3倍的方差内，则属于该分布，并对其进行参数更新。
如果下一次来的像素不满足当前高斯分布，用它来创建一个新的高斯分布。
当第三帧图像来的时候，像素值假如是180，那么180-105=75>3*5，那么我们这个时候就要创建一个分布。

一般来说，我们创建的分布设定在3-5个就OK！
对于混合高斯模型来说，他有一个学习更新的过程。所以他要比帧差法要强很多。
在测试阶段，对于新来的像素点的数值，混合高斯模型中的每一个均值比较，如果差值在二倍的方差之间的话就可以认为他是一个背景，否则认为是前景。将前景赋值为255，背景赋值为0。这样就形成了一副前景二值图。

⭐️混合高斯模型背景建模实战

首先我们来看了一下官方标准案例。他是做了一个摄像头下的人物走动的视频，然后使用混合高斯模型进行背景建模。我们来看一下代码。

这里导入第三方库。

import numpy as np
import cv2

然后将视频导入，建立一个卷积核，并且创建混合高斯模型用于背景建模。

cap = cv2.VideoCapture('test.avi')
#形态学操作需要使用
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3))
#创建混合高斯模型用于背景建模
fgbg = cv2.createBackgroundSubtractorMOG2()

cv2.getStructuringElement这个函数的第一个参数表示内核的形状。共有三种。

矩形：MORPH_RECT;
交叉形：MORPH_CROSS;
椭圆形：MORPH_ELLIPSE;

mog = cv2.createBackgroundSubtractorMOG2(history,varThreshold,false);这个函数来说。

history：用于训练背景的帧数，默认帧数为500帧，如果不动手设置learingRate,history就被用于计算当前的learningRate, 此时history越大，learningRate越小，背景更新越慢；
varThreshold:方差阈值，用于判断当前像素是前景还是背景。一般默认为16，如果光照变化明显，如阳光下的水面，建议设为25，值越大灵敏度越低。
detectShadows：是否检测影子，设为true为检测，false为不检测，检测影子会增加程序时间复杂度，一般设置为false；

然后mog->apply(src_YCrCb, foreGround, 0.005);

image 源图
fmask 前景（二值图像）
learningRate 学习速率，值为0-1,为0时背景不更新，为1时逐帧更新，默认为-1，即算法自动更新；

然后进入循环

while(True):
    ret, frame = cap.read()
    fgmask = fgbg.apply(frame)
    #形态学开运算去噪点
    fgmask = cv2.morphologyEx(fgmask, cv2.MORPH_OPEN, kernel)
    #寻找视频中的轮廓
    contours, hierarchy = cv2.findContours(fgmask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

首先我们先来ret, frame = cap.read()用于摄像头或视频文件中，捕获帧信息。返回的两个值分别是：

ret 是返回的捕获到的帧，如果没有帧被捕获到，则该值为空。
frame表示帧捕获是否成功，如果成功，retval为True，失败为False。

然后利用cv2.morphologyEx(fgmask, cv2.MORPH_OPEN, kernel开运算。
在进行膨胀操作的时候我们介绍到了这个：
1.图像被腐蚀后，去除了噪声，但是会压缩图像。
2.对腐蚀过的图像，进行膨胀处理，可以去除噪声，并保持原有形状。

*开运算(image)=膨胀(腐蚀(image))*

开运算就是先把图像进行腐蚀操作，然后进行膨胀操作的一个过程！

如果我们对于有噪声的图像单独的进行腐蚀操作，就会对图像进行压缩，如果我们想要恢复到原始图像就要进行相同程度上的膨胀，这个操作我们就成为开运算。

开运算操作函数介绍
opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)

img：原始图像
cv2.MORPH_OPEN：表示进行开运算，相同的我们所知道的还有闭运算。
kernel：卷积核，同样我们对开运算的卷积核要进行设定。
然后contours, hierarchy = cv2.findContours这里是寻找轮廓，这里注意的是新的版本返回的是两个数值，旧的版本是3个数值。

for c in contours:
        #计算各轮廓的周长
        perimeter = cv2.arcLength(c,True)
        if perimeter > 188:
            #找到一个直矩形（不会旋转）
            x,y,w,h = cv2.boundingRect(c)
            #画出这个矩形
            cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),2)

遍历每一个轮廓，然后计算轮廓的周长，进行筛选如果周长的数值大于188，那么我们把这个矩阵给画出来。

cv2.imshow('frame',frame)
    cv2.imshow('fgmask', fgmask)
    k = cv2.waitKey(150) & 0xff
    if k == 27:
        break
 
cap.release()
cv2.destroyAllWindows()

然后这里就结束了。我们来看一下视频。

这个是项目中的视频的结果。然后我们继续做一下开头投篮的一个背景建模视频。

这里和官方视频有很大的差距，分析了一下主要原因是由于我们手工录制的视频他一直在发抖，摄像头一直在抖动，稳定性不高导致的背景中的噪音点较多，但是我们去掉这个缺陷之后呢，可以看到运动中的篮球和人物展示的效果都是非常不错的。篮球在空中飞的过程中刻画的也是非常的清晰。

⭐️光流估计

光流是空间运动的物体在观测成像平面上的像素运动的“瞬时速度”，根据各个像素点的速度矢量特征，可以对图像进行动态分析，例如说目标追踪。

这里我们假设车在移动的过程中，第一帧和第二帧图像，他们像素点的移动过程是分速度的大小的，右图所示。这个过程中有很多个小概念需要知道：
1.亮度恒定：同一点随着时间的变化，我们认为他的亮度是不发生改变的。也就是说第一帧和第二帧我们忽略了亮度对于光流的影响。
2. 小运动：随着时间的变化不会引起位置的剧烈变化，只有在小运动的情况下才能用前后帧之间的单位位置变化的偏导数。
3. 空间一致：一个场景上临近的点投影到图像上也是临近点，且临近点速度一致。因为光流法基本方程约束只有一个，要求x，y方向的速度，有两个位置变量，所以需要联立n个方程求解。

Lucas-Kanade算法

根据上述的条件，我们可以进行一下约束方程的书写：

这里很简单，就是说前后帧的图像进行了位置的一个等式，我们认为他是一个小运动。且符合亮度恒定，然后进行了一阶泰勒公式展开。得到的结果进行左右约掉了一部分，然后我们可以得到：

继续推导：

这里面有两个未知数，u和v。那么我们至少要需要两个方程才能解决这个问题。所以我们构造方程使用了多个点进行构造，这就符合了我们第三个条件，就是空间一致。

这里面我们用了25个方程来构造这个函数，那么2个未知数，用了25个方程他有一个什么好处呢？就是说和我们在机器学习中的一元线性回归任务当中基于很多点选择一条完美的直线很类似，就是要把这个解弄得完美一点。
差不多这个意思。

然后我们最后通过最小二乘法进行了求解，但是这里有一个问题就是出现了一个逆矩阵，那么我们知道逆矩阵是要符合条件的，那么就需要λ1和λ2，当是角点的时候。才可逆。所以我们在检测的过程中拿到的点都要是角点才可以。

⭐️光流估计实战演示

cv2.calcOpticalFlowPyrLK():这个函数简单介绍一下
参数：

prevImage：前一帧图像
nextImage：当前帧图像
prevPts：待跟踪的特征点向量
winSize：搜索窗口的大小
maxLevel：最大的金字塔层数

nextPts 输出跟踪特征点向量
status 特征点是否找到，找到的状态为1，未找到的状态为0

读入库和视频

import numpy as np
import cv2
cap = cv2.VideoCapture('aaa.mp4')

首先我们要进行一下角点检测，先定义出来角点检测的函数。以及lucas kanade算法的参数。定义追踪颜色条，然后对每一帧图像做预处理操作。

feature_params = dict( maxCorners = 100,
                       qualityLevel = 0.3,
                       minDistance = 7)
# lucas kanade参数
lk_params = dict( winSize  = (10,10),
                  maxLevel = 2)
# 随机颜色条
color = np.random.randint(0,255,(100,3))
# 拿到第一帧图像
ret, old_frame = cap.read()
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)
p0 = cv2.goodFeaturesToTrack(old_gray, mask = None, **feature_params)
# 创建一个mask
mask = np.zeros_like(old_frame)

然后绘制主体，把相应的参数传入进去。

while(True):
    ret,frame = cap.read()
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    #p0 = cv2.goodFeaturesToTrack(old_gray, mask = None, **feature_params)

    # 需要传入前一帧和当前图像以及前一帧检测到的角点
    p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)

    # st=1表示
    good_new = p1[st==1]
    good_old = p0[st==1]

    # 绘制轨迹
    for i,(new,old) in enumerate(zip(good_new,good_old)):
        a,b = new.ravel()
        c,d = old.ravel()
        mask = cv2.line(mask, (int(a),int(b)),(int(c),int(d)), color[i].tolist(), 2)
        frame = cv2.circle(frame,(int(a),int(b)),5,color[i].tolist(),-1)
    img = cv2.add(frame,mask)

    cv2.imshow('frame',img)
    k = cv2.waitKey(150) & 0xff
    if k == 27:
        break

    # 更新
    old_gray = frame_gray.copy() 
    p0 = good_new.reshape(-1,1,2)

cv2.destroyAllWindows()
cap.release()

结果展示：

支持：如果觉得博主的文章还不错或者您用得到的话，可以免费的关注一下博主，如果三连收藏支持就更好啦！这就是给予我最大的支持！

从入门到精通，解锁AI新高度——DeepSeek学习手册周师姐学习
资料链接：https://pan.quark.cn/s/c927326f70c5你是否渴望掌握前沿AI技术，却在复杂的理论和实践中迷茫？现在，一本由清华大学出品的《DeepSeek：从入门到精通》学习手册横空出世，为你开启AI新世界的大门。作为人工智能领域的新兴力量，DeepSeek以其卓越的性能和创新的技术，正在重塑我们对AI的认知。这本手册，由清华大学顶尖科研团队精心编写，是DeepSeek技
【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核有啥问啥大模型行业调研科普算法语言模型
深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。为了应对这些挑战，DeepSeek推出了FlashMLA，这是一种专为NVIDIAHopperGPU架构优化的高效MLA(Multi-LayerAttention)解码内核。FlashMLA旨在加速LLM的解码过程，从而显著提高模型的响应速度
Exception:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 解决方案爱编程的喵喵 Python基础课程 python tokenizer PyPreTokenizer 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Exception:datadidn
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
【LangChain编程：从入门到实践】实现多模态代理 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】实现多模态代理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：LangChain编程，多模态代理，自然语言处理，多媒体数据融合，复杂任务解决能力1.背景介绍1.1大背景与问题的提出随着人工智能技术的飞速发展，尤其是大模型在自然语言处理领域的突破，如通义千问、通义万相、阿里云通义大模型等，我们正迎来一个全
222222222222222 智能与优化开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas是基于Nu
opencv 自适应阈值虚假程序设计 opencv 人工智能计算机视觉
需要安装扩展库opencv-contrib-pythonCV_class.pyimportcv2importnumpyasnp#importserialimportos,sysfromdatetimeimportdatetimeimport_threadimportthreadingimporttimeimportwin32ui#只有windows能用.#fromCV_classimport*de
OpenCV开源机器视觉软件视觉人机器视觉杂说 opencv 开源人工智能
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库，广泛应用于实时图像处理、视频分析、物体检测、人脸识别等领域。它由英特尔实验室于1999年发起，现已成为计算机视觉领域最流行的工具之一，支持多种编程语言（如C++、Python、Java）和操作系统（Windows、Linux、macOS、Android、iOS）。核心功能图像处理基
向量数据库实战介绍 Zhank10 数据库
本文将介绍三种常用的向量数据库：faiss,Milvus和Qdrant，并给出一个具体的使用例子。向量数据库（VectorDatabase）是一种专门用于存储、管理、查询、检索向量的数据库，主要应用于人工智能、机器学习、数据挖掘等领域。在向量数据库中，数据以向量的形式进行存储和处理，需要将原始的非向量型数据转化为向量表示（比如文本使用Embedding技术获得其表征向量）。这种数据库能够高效地进行
DeepSeek 持续火爆；微信蓝包首秀；世界级人工智能科学家许主洪加盟阿里巴巴...|网易数智日报网易数智网易数智日报人工智能大数据业界资讯 ai 云计算
DeepSeek持续火爆，多个云平台上线相关模型「抢食」算力需求AI公司DeepSeek旗下大模型DeepSeek-R1「爆火」后，多个云平台宣布上线DeepSeek旗下模型。2月5日，阅文集团宣布，旗下作家辅助创作应用“作家助手”已集成幻方量化旗下AI公司深度求索（DeepSeek）的DeepSeek-R1大模型。这是DeepSeek首次应用于网文领域，旨在为作家提供更智能的创作支持。2月4日，
A100高效架构深度解析智能计算研究中心其他
内容概要NVIDIAA100GPU作为面向人工智能与高性能计算的关键硬件载体，其架构创新标志着计算范式的重要演进。本文通过系统性拆解A100的核心技术模块，重点探讨其在计算密度、互联效率与资源利用率三个维度的突破性设计。在计算架构层面，第三代TensorCore通过引入细粒度结构化稀疏支持与新型数据格式，显著提升矩阵运算效率；多实例GPU（MIG）技术则通过物理级硬件隔离实现单卡多任务并行处理，为
跨框架模型演进与行业应用路径智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，模型框架的演进与行业应用的深度融合已成为推动产业智能化升级的核心驱动力。本文系统性梳理TensorFlow、PyTorch、MXNet等主流框架的技术发展脉络，重点分析其从通用计算架构向多模态、轻量化方向的转型路径。同时，针对模型优化技术领域，深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破，揭示其在降低计算资源消耗、提升推理效率方面的关键作用。在行业
人工智能算法安全优化实践路径智能计算研究中心其他
内容概要在人工智能技术深度融入产业实践的进程中，算法安全优化已成为保障系统可靠性与社会信任的核心命题。本文系统性梳理从数据预处理到模型落地的全流程安全实践路径，聚焦金融风控、医疗影像诊断、自动驾驶等关键场景，揭示算法开发中潜藏的伦理风险与技术挑战。通过整合自动化机器学习与联邦学习技术，构建跨数据孤岛的协作框架，同时引入可解释性算法增强模型透明度，确保决策逻辑可追溯、可验证。在模型优化维度，重点解析
人工智能的未来发展趋势及其对社会的深远影响智能计算研究中心其他
内容概要在当今科技飞速发展的时代，人工智能（AI）已成为推动社会变革的重要力量。本文将探讨人工智能未来的发展趋势，分析其在各个领域的应用前景，尤其是在技术革新、市场需求及伦理挑战等方面。通过对相关趋势的深入分析，我们可以更好地理解人工智能如何重塑劳动力市场、提升生活质量以及推动社会整体进步。探索人工智能的潜力，为未来的发展奠定基础。随着技术的不断进步，人工智能正在经历一场深刻的变革。从机器学习到深
BagelDB：AI的开源向量数据库 qahaj 人工智能数据库 python
BagelDB：AI的开源向量数据库BagelDB(OpenVectorDatabaseforAI)是一个类似于GitHub的AI数据协作平台。用户可以在这里创建、分享和管理向量数据集。BagelDB支持独立开发者的私有项目、企业内部的协作以及数据DAO的公共贡献。技术背景介绍随着人工智能和机器学习的快速发展，各种数据的重要性也在不断凸显。向量数据库作为存储向量化数据的重要工具，越来越受到开发者和
【openCV-89】人脸检测华东算法王华东算法王-opencv opencv 人工智能计算机视觉
人脸检测简介人脸检测是计算机视觉中的一个重要任务，旨在从图像或视频中识别并定位出人脸的位置。人脸检测不仅是人脸识别、表情分析、面部特征点检测等高级任务的前置步骤，而且在安防监控、智能家居、自动驾驶等多个领域都具有广泛应用。人脸检测的目标人脸检测的目标是从输入的图像或视频流中自动检测出所有人脸的区域，通常用矩形框（boundingbox）表示人脸的位置。人脸检测不仅要识别图像中的人脸，还要在各种条件
阿里云人工智能与机器学习 HaoHao_010 阿里云云服务器云计算服务器
阿里云的人工智能（AI）与机器学习（ML）服务为企业提供了全面的AI解决方案，帮助用户在多个行业实现数据智能化，提升决策效率，推动业务创新。阿里云通过先进的技术和丰富的工具，支持用户开发、部署和管理AI应用。以下是阿里云在人工智能和机器学习方面的主要产品与服务：1.云上机器学习平台—PaaS服务PAI(PlatformforAI)PAI是阿里云推出的人工智能平台，提供一系列机器学习与深度学习工具和
AI探索笔记：浅谈人工智能算法分类安意诚Matrix 机器学习笔记人工智能笔记
人工智能算法分类这是一张经典的图片，基本概况了人工智能算法的现状。这张图片通过三个同心圆展示了人工智能、机器学习和深度学习之间的包含关系，其中人工智能是最广泛的范畴，机器学习是其子集，专注于数据驱动的算法改进，而深度学习则是机器学习中利用多层神经网络进行学习的特定方法。但是随着时代的发展，这张图片表达得也不是太全面了。我更喜欢把人工智能算法做如下的分类：传统机器学习算法-线性回归、逻辑回归、支持向
【人工智能算法】人工智能算法都包括什么？请详细列出和解释资源存储库算法强化学习人工智能算法
目录人工智能算法都包括什么？请详细列出和解释1.机器学习算法（MachineLearningAlgorithms）监督学习算法（SupervisedLearning）无监督学习算法（UnsupervisedLearning）强化学习算法（ReinforcementLearning）2.进化算法（EvolutionaryAlgorithms）3.模拟退火（SimulatedAnnealing）4.粒
AI笔记——浅谈发展历程 Bqiuer AI AI笔记人工智能 ai
2023年，要说最让人震惊的热点，无疑就是AI技术的大爆发！从1950年的“图灵测试”标志着人工智能雏形的诞生，一些最顶尖的技术团队、技术学科进行研究，到如今几十年的时间。一、AI的历史进程人工智能（ArtificialIntelligence，AI）的历史进程可以追溯到上世纪50年代。1950年代-1960年代：起步阶段1950年，英国数学家艾伦·图灵提出了“图灵测试”，这是第一个旨在检验机器智
AI产品怎样才能打造出像人类一样聪明和有情商？ AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型 AI实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的飞速发展、算法能力的不断增强、数据集的积累、计算设备的普及，人工智能已经成为各个行业、各个领域的重要突破性技术。然而，面对这一技术带来的巨大变革，如何为用户提供更加人性化的服务，并让人工智能模型对用户输入做出智能回应，则成为了一个长期且艰难的挑战。今天，我们将讨论一些常见的人机交互相关的问题，如语言模型、对话系统、生成模型等，并从中可以窥视到人
最全中文对话数据集（不定期更新）数据猎手小k 人工智能大数据
随着人工智能技术的发展，自然语言处理（NLP）领域中的对话系统逐渐成为研究的热点。为了提升对话系统的性能，需要大量的高质量对话数据来训练和优化模型。然而，中文对话数据相对于英文来说较为稀缺，且质量参差不齐，这限制了中文对话系统的发展。因此，构建大规模、高质量的中文对话数据集成为了一个迫切的需求。一、研究意义1、推动中文NLP发展：大规模高质量的中文对话数据集能够为中文自然语言处理领域的研究提供基础
DCMNet一种用于目标检测的轻量级骨干结构模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法目标检测
模型背景在深度学习技术快速发展的背景下，目标检测领域取得了显著进展。早期的手工特征提取方法如Viola-Jones和HOG逐渐被卷积神经网络（CNN）取代，其中AlexNet在2012年的ILSVRC比赛中表现突出，推动了CNN在计算机视觉中的广泛应用。然而，这些早期模型在精度和效率方面仍存在不足，尤其是在处理复杂场景和小目标时表现不佳。这为DCMNet等新型轻量化目标检测模型的出现提供了契机，旨
Python人工智能学习路线，来自阿里巴巴佛系Python程序员的指南阿里P6+ 2024年程序员学习 python 人工智能学习
其实，这两方面都是存在的，但都很片面，这里不加赘述。客观地说，数字化、智能化是人类社会发展的趋势，而当下人工智能无疑是一大热门，那是蓝海还是火海？我们回到老道理——水的深度，只有你自己去试试水才知道。当你对上面情况有了初步的了解并想试试水，需要面对的问题是：AI入门容易吗？答案其实是否定的，难！AI领域需要钻研算法原理、大量复杂的公式及符号、无所适从的项目都是劝退一时热度初学者的原因。但对于一个初
DeepSeek全栈接入指南：从零到生产环境的深度实践量子纠缠BUG DeepSeek部署 AI DeepSeek 人工智能深度学习机器学习
第一章：DeepSeek技术体系全景解析1.1认知DeepSeek技术生态DeepSeek作为新一代人工智能技术平台，构建了覆盖算法开发、模型训练、服务部署的全链路技术栈。其核心能力体现在：1.1.1多模态智能引擎自然语言处理：支持文本生成（NLG）、语义理解（NLU）、情感分析等计算机视觉：提供图像分类、目标检测、OCR识别等CV能力语音交互：包含语音识别（ASR）、语音合成（TTS）及声纹识别
百度安全获得中国信通院深度伪造视频检测服务评估优秀级安全
近年来深度合成技术迅猛发展的背后，“真实”和“虚假”的界限愈发难以分辨，技术滥用和恶意应用已经引发了一系列风险。随着技术的快速发展，党和国家高度重视深度合成技术的治理工作，先后发布了《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》，旨在加强互联网信息服务深度合成管理，促进深度合成服务健康发展，防范相关安全风险。中国信息通信研究院持续跟进深度合成技术及其应用的发展态势，自201
AIoT安全与隐私自动化建设：实践与展望 ITPUB-微风安全自动化运维
随着物联网（IoT）的快速发展，AIoT（人工智能物联网）已成为新时代的技术趋势。然而，随着设备的增多和应用的广泛，AIoT的安全与隐私问题也日益凸显。本文将探讨AIoT安全与隐私自动化建设的实践与展望。一、背景AIoT设备数量的激增带来了诸多安全挑战，如僵尸网络、中间人攻击、隐私泄露等。这些威胁不仅影响设备的正常运行，还可能对用户隐私造成严重损害。因此，建立有效的AIoT安全与隐私保护机制迫在眉
消费者产品报告2025-在通用人工智能时代重新获得相关性报告300+份集萃解读|附PDF下载数据挖掘深度学习机器学习算法
原文链接：https://tecdat.cn/?p=40823在全球经济形势复杂多变、技术革新加速的当下，消费品行业正经历深刻变革。本报告汇总解读基于权威数据，深入剖析该行业在2024-2025年的发展态势，为企业提供市场洞察与策略建议，助力其在通用人工智能时代找准方向、重塑竞争优势。本报告汇总洞察基于文末470份消费者行业研究报告的数据，报告合集已分享在交流群，阅读原文进群和500+行业人士共同
【CodeBlocks】搭建OpenCV环境指南万众珩
【CodeBlocks】搭建OpenCV环境指南CodeBlocks搭建OpenCV环境项目地址:https://gitcode.com/Resource-Bundle-Collection/e1e1a本资源提供了详细的教程，帮助您在CodeBlocks集成开发环境中顺利搭建OpenCV环境。OpenCV是一个开源的计算机视觉和机器学习软件库，广泛应用于图像处理和视频分析领域。通过这篇指南，即便是
在Linux环境下安装和使用Pyenv：详细指南 I'mAlex Python三方库 #Python linux 运维服务器 python pyenv
Pyenv是一个用于管理多个Python版本的强大工具，特别适合在Linux环境下使用。本文将详细介绍如何在Linux系统上安装和使用Pyenv，以便更好地管理Python开发环境。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++/Ja
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s