软件工程师TonnyJack

计算机视觉项目：手势拖拽方块和手势控制音量

项目简介：

电子科技大学中山学院2019级计算机视觉的课程设计

语言：Python

开发工具：Pycharm、Python3.9

库：PyQt、OpenCv、mediapipe

功能：

手势拖拽方块：通过食指与中指的距离控制方块移动

手势控制音量：通过食指与大拇指的距离控制电脑音量

源码：

手势控制方块

"""

功能：手势虚拟拖拽

1、使用OpenCV读取摄像头视频流；

2、识别手掌关键点像素坐标；

3、根据食指和中指指尖的坐标，利用勾股定理计算距离，当距离较小且都落在矩形内，则触发拖拽（矩形变色）；

4、矩形跟着手指动；

5、两指放开，则矩形停止移动

"""

# 导入OpenCV

import cv2

# 导入mediapipe

import mediapipe as mp

# 导入其他依赖包

import time

import math


# 方块管理类

class SquareManager:

    def __init__(self, rect_width):

        # 方框长度

        self.rect_width = rect_width

        # 方块list

        self.square_count = 0

        self.rect_left_x_list = []

        self.rect_left_y_list = []

        self.alpha_list = []

        # 中指与矩形左上角点的距离

        self.L1 = 0

        self.L2 = 0

        # 激活移动模式

        self.drag_active = False

        # 激活的方块ID

        self.active_index = -1

    # 创建一个方块，但是没有显示

    def create(self, rect_left_x, rect_left_y, alpha=0.4):

        self.rect_left_x_list.append(rect_left_x)

        self.rect_left_y_list.append(rect_left_y)

        self.alpha_list.append(alpha)

        self.square_count += 1

    # 更新位置

    def display(self, class_obj):

        for i in range(0, self.square_count):

            x = self.rect_left_x_list[i]

            y = self.rect_left_y_list[i]

            alpha = self.alpha_list[i]

            overlay = class_obj.image.copy()

            if i == self.active_index:

                cv2.rectangle(overlay, (x, y), (x + self.rect_width, y + self.rect_width), (255, 0, 255), -1)

            else:

                cv2.rectangle(overlay, (x, y), (x + self.rect_width, y + self.rect_width), (255, 0, 0), -1)

            # Following line overlays transparent rectangle over the self.image

            class_obj.image = cv2.addWeighted(overlay, alpha, class_obj.image, 1 - alpha, 0)

    # 判断落在哪个方块上，返回方块的ID

    def checkOverlay(self, check_x, check_y):

        for i in range(0, self.square_count):

            x = self.rect_left_x_list[i]

            y = self.rect_left_y_list[i]

            if (x < check_x < (x + self.rect_width)) and (y < check_y < (y + self.rect_width)):
                # 保存被激活的方块ID

                self.active_index = i

                return i

        return -1

    # 计算与指尖的距离

    def setLen(self, check_x, check_y):

        # 计算距离

        self.L1 = check_x - self.rect_left_x_list[self.active_index]

        self.L2 = check_y - self.rect_left_y_list[self.active_index]

    # 更新方块

    def updateSquare(self, new_x, new_y):

        # print(self.rect_left_x_list[self.active_index])

        self.rect_left_x_list[self.active_index] = new_x - self.L1

        self.rect_left_y_list[self.active_index] = new_y - self.L2


# 识别控制类

class HandControlBlock:

    def __init__(self):

        # 初始化medialpipe

        self.mp_drawing = mp.solutions.drawing_utils

        self.mp_drawing_styles = mp.solutions.drawing_styles

        self.mp_hands = mp.solutions.hands

        # 中指与矩形左上角点的距离

        self.L1 = 0

        self.L2 = 0

        # image实例，以便另一个类调用

        self.image = None

    # 主函数

    def recognize(self):

        # 计算刷新率

        fpsTime = time.time()

        # OpenCV读取视频流

        cap = cv2.VideoCapture(0)

        # 视频分辨率

        resize_w = 1280

        resize_h = 960

        # 画面显示初始化参数

        rect_percent_text = 0

        # 初始化方块管理器

        squareManager = SquareManager(150)

        # 创建多个方块

        for i in range(0, 5):
            squareManager.create(200 * i + 20, 200, 0.6)

        with self.mp_hands.Hands(min_detection_confidence=0.7,

                                 min_tracking_confidence=0.5,

                                 max_num_hands=2) as hands:

            while cap.isOpened():

                # 初始化矩形

                success, self.image = cap.read()

                self.image = cv2.resize(self.image, (resize_w, resize_h))

                if not success:
                    print("空帧.")

                    continue

                # 提高性能

                self.image.flags.writeable = False

                # 转为RGB

                self.image = cv2.cvtColor(self.image, cv2.COLOR_BGR2RGB)

                # 镜像

                self.image = cv2.flip(self.image, 1)

                # mediapipe模型处理

                results = hands.process(self.image)

                self.image.flags.writeable = True

                self.image = cv2.cvtColor(self.image, cv2.COLOR_RGB2BGR)

                # 判断是否有手掌

                if results.multi_hand_landmarks:

                    # 遍历每个手掌

                    for hand_landmarks in results.multi_hand_landmarks:

                        # 在画面标注手指

                        self.mp_drawing.draw_landmarks(

                            self.image,

                            hand_landmarks,

                            self.mp_hands.HAND_CONNECTIONS,

                            self.mp_drawing_styles.get_default_hand_landmarks_style(),

                            self.mp_drawing_styles.get_default_hand_connections_style())

                        # 解析手指，存入各个手指坐标

                        landmark_list = []

                        # 用来存储手掌范围的矩形坐标

                        paw_x_list = []

                        paw_y_list = []

                        for landmark_id, finger_axis in enumerate(

                                hand_landmarks.landmark):
                            landmark_list.append([

                                landmark_id, finger_axis.x, finger_axis.y,

                                finger_axis.z

                            ])

                            paw_x_list.append(finger_axis.x)

                            paw_y_list.append(finger_axis.y)

                        if landmark_list:

                            # 比例缩放到像素

                            ratio_x_to_pixel = lambda x: math.ceil(x * resize_w)

                            ratio_y_to_pixel = lambda y: math.ceil(y * resize_h)

                            # 设计手掌左上角、右下角坐标

                            paw_left_top_x, paw_right_bottom_x = map(ratio_x_to_pixel,
                                                                     [min(paw_x_list), max(paw_x_list)])

                            paw_left_top_y, paw_right_bottom_y = map(ratio_y_to_pixel,
                                                                     [min(paw_y_list), max(paw_y_list)])

                            # 给手掌画框框

                            cv2.rectangle(self.image, (paw_left_top_x - 30, paw_left_top_y - 30),
                                          (paw_right_bottom_x + 30, paw_right_bottom_y + 30), (0, 255, 0), 2)

                            # 获取中指指尖坐标

                            middle_finger_tip = landmark_list[12]

                            middle_finger_tip_x = ratio_x_to_pixel(middle_finger_tip[1])

                            middle_finger_tip_y = ratio_y_to_pixel(middle_finger_tip[2])

                            # 获取食指指尖坐标

                            index_finger_tip = landmark_list[8]

                            index_finger_tip_x = ratio_x_to_pixel(index_finger_tip[1])

                            index_finger_tip_y = ratio_y_to_pixel(index_finger_tip[2])

                            # 中间点

                            between_finger_tip = (middle_finger_tip_x + index_finger_tip_x) // 2, (
                                    middle_finger_tip_y + index_finger_tip_y) // 2

                            # print(middle_finger_tip_x)

                            thumb_finger_point = (middle_finger_tip_x, middle_finger_tip_y)

                            index_finger_point = (index_finger_tip_x, index_finger_tip_y)

                            # 画指尖2点

                            circle_func = lambda point: cv2.circle(self.image, point, 10, (255, 0, 255), -1)

                            self.image = circle_func(thumb_finger_point)

                            self.image = circle_func(index_finger_point)

                            self.image = circle_func(between_finger_tip)

                            # 画2点连线

                            self.image = cv2.line(self.image, thumb_finger_point, index_finger_point, (255, 0, 255), 5)

                            # 勾股定理计算长度

                            line_len = math.hypot((index_finger_tip_x - middle_finger_tip_x),
                                                  (index_finger_tip_y - middle_finger_tip_y))

                            # 将指尖距离映射到文字

                            rect_percent_text = math.ceil(line_len)

                            # 激活模式，需要让矩形跟随移动

                            if squareManager.drag_active:

                                # 更新方块

                                squareManager.updateSquare(between_finger_tip[0], between_finger_tip[1])

                                if (line_len > 100):
                                    # 取消激活

                                    squareManager.drag_active = False

                                    squareManager.active_index = -1



                            elif (line_len < 100) and (squareManager.checkOverlay(between_finger_tip[0],
                                                                                  between_finger_tip[1]) != -1) and (
                                    squareManager.drag_active == False):

                                # 激活

                                squareManager.drag_active = True

                                # 计算距离

                                squareManager.setLen(between_finger_tip[0], between_finger_tip[1])

                # 显示方块，传入本实例，主要为了半透明的处理

                squareManager.display(self)

                # 显示距离

                cv2.putText(self.image, "Distance:" + str(rect_percent_text), (10, 120), cv2.FONT_HERSHEY_PLAIN, 3,
                            (255, 0, 0), 3)

                # 显示当前激活

                cv2.putText(self.image, "Active:" + (
                    "None" if squareManager.active_index == -1 else str(squareManager.active_index)), (10, 170),
                            cv2.FONT_HERSHEY_PLAIN, 3, (255, 0, 0), 3)

                # 显示刷新率FPS

                cTime = time.time()

                fps_text = 1 / (cTime - fpsTime)

                fpsTime = cTime

                cv2.putText(self.image, "FPS: " + str(int(fps_text)), (10, 70),

                            cv2.FONT_HERSHEY_PLAIN, 3, (255, 0, 0), 3)

                # 显示画面

                # self.image = cv2.resize(self.image, (resize_w//2, resize_h//2))

                cv2.imshow('virtual drag and drop', self.image)

                if cv2.waitKey(5) & 0xFF == 27:
                    break

            cap.release()


if __name__ == '__main__':
    control = HandControlBlock()
    control.recognize()

手势控制音量

"""


功能：手势操作电脑音量

1、使用OpenCV读取摄像头视频流；

2、识别手掌关键点像素坐标；

3、根据拇指和食指指尖的坐标，利用勾股定理计算距离；

4、将距离等比例转为音量大小，控制电脑音量

"""

# 导入OpenCV

import cv2

# 导入mediapipe

import mediapipe as mp

# 导入电脑音量控制模块

from ctypes import cast, POINTER

from comtypes import CLSCTX_ALL

from pycaw.pycaw import AudioUtilities, IAudioEndpointVolume

# 导入其他依赖包

import time

import math

import numpy as np


class HandControlVolume:

    def __init__(self):

        # 初始化medialpipe

        self.mp_drawing = mp.solutions.drawing_utils

        self.mp_drawing_styles = mp.solutions.drawing_styles

        self.mp_hands = mp.solutions.hands

        # 获取电脑音量范围

        devices = AudioUtilities.GetSpeakers()

        interface = devices.Activate(

            IAudioEndpointVolume._iid_, CLSCTX_ALL, None)

        self.volume = cast(interface, POINTER(IAudioEndpointVolume))

        self.volume.SetMute(0, None)

        self.volume_range = self.volume.GetVolumeRange()

    # 主函数

    def recognize(self):

        # 计算刷新率

        fpsTime = time.time()

        # OpenCV读取视频流

        cap = cv2.VideoCapture(0)

        # 视频分辨率

        resize_w = 1280

        resize_h = 960

        # 画面显示初始化参数

        rect_height = 0

        rect_percent_text = 0

        with self.mp_hands.Hands(min_detection_confidence=0.7,

                                 min_tracking_confidence=0.5,

                                 max_num_hands=2) as hands:

            while cap.isOpened():

                success, image = cap.read()

                image = cv2.resize(image, (resize_w, resize_h))

                if not success:
                    print("空帧.")

                    continue

                # 提高性能

                image.flags.writeable = False

                # 转为RGB

                image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

                # 镜像

                image = cv2.flip(image, 1)

                # mediapipe模型处理

                results = hands.process(image)

                image.flags.writeable = True

                image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

                # 判断是否有手掌

                if results.multi_hand_landmarks:

                    # 遍历每个手掌

                    for hand_landmarks in results.multi_hand_landmarks:

                        # 在画面标注手指

                        self.mp_drawing.draw_landmarks(

                            image,

                            hand_landmarks,

                            self.mp_hands.HAND_CONNECTIONS,

                            self.mp_drawing_styles.get_default_hand_landmarks_style(),

                            self.mp_drawing_styles.get_default_hand_connections_style())

                        # 解析手指，存入各个手指坐标

                        landmark_list = []

                        for landmark_id, finger_axis in enumerate(

                                hand_landmarks.landmark):
                            landmark_list.append([

                                landmark_id, finger_axis.x, finger_axis.y,

                                finger_axis.z

                            ])

                        if landmark_list:
                            # 获取大拇指指尖坐标

                            thumb_finger_tip = landmark_list[4]

                            thumb_finger_tip_x = math.ceil(thumb_finger_tip[1] * resize_w)

                            thumb_finger_tip_y = math.ceil(thumb_finger_tip[2] * resize_h)

                            # 获取食指指尖坐标

                            index_finger_tip = landmark_list[8]

                            index_finger_tip_x = math.ceil(index_finger_tip[1] * resize_w)

                            index_finger_tip_y = math.ceil(index_finger_tip[2] * resize_h)

                            # 中间点

                            finger_middle_point = (thumb_finger_tip_x + index_finger_tip_x) // 2, (

                                    thumb_finger_tip_y + index_finger_tip_y) // 2

                            # print(thumb_finger_tip_x)

                            thumb_finger_point = (thumb_finger_tip_x, thumb_finger_tip_y)

                            index_finger_point = (index_finger_tip_x, index_finger_tip_y)

                            # 画指尖2点

                            image = cv2.circle(image, thumb_finger_point, 10, (255, 0, 255), -1)

                            image = cv2.circle(image, index_finger_point, 10, (255, 0, 255), -1)

                            image = cv2.circle(image, finger_middle_point, 10, (255, 0, 255), -1)

                            # 画2点连线

                            image = cv2.line(image, thumb_finger_point, index_finger_point, (255, 0, 255), 5)

                            # 勾股定理计算长度

                            line_len = math.hypot((index_finger_tip_x - thumb_finger_tip_x),

                                                  (index_finger_tip_y - thumb_finger_tip_y))

                            # 获取电脑最大最小音量

                            min_volume = self.volume_range[0]

                            max_volume = self.volume_range[1]

                            # 将指尖长度映射到音量上

                            vol = np.interp(line_len, [50, 300], [min_volume, max_volume])

                            # 将指尖长度映射到矩形显示上

                            rect_height = np.interp(line_len, [50, 300], [0, 200])

                            rect_percent_text = np.interp(line_len, [50, 300], [0, 100])

                            # 设置电脑音量

                            self.volume.SetMasterVolumeLevel(vol, None)

                # 显示矩形

                cv2.putText(image, str(math.ceil(rect_percent_text)) + "%", (10, 350),

                            cv2.FONT_HERSHEY_PLAIN, 3, (255, 0, 0), 3)

                image = cv2.rectangle(image, (30, 100), (70, 300), (255, 0, 0), 3)

                image = cv2.rectangle(image, (30, math.ceil(300 - rect_height)), (70, 300), (255, 0, 0), -1)

                # 显示刷新率FPS

                cTime = time.time()

                fps_text = 1 / (cTime - fpsTime)

                fpsTime = cTime

                cv2.putText(image, "FPS: " + str(int(fps_text)), (10, 70),

                            cv2.FONT_HERSHEY_PLAIN, 3, (255, 0, 0), 3)

                # 显示画面

                cv2.imshow('MediaPipe Hands', image)

                if cv2.waitKey(5) & 0xFF == 27:
                    break

            cap.release()


if __name__ == '__main__':
    control = HandControlVolume()
    control.recognize()

Qt界面：

"""
计算机视觉课程设计
ComputerVisual curriculum design

开发时间：2021年12月8日 下午 19：14
Development time: 2021.12.8 pm 19:14

版权所有©：电子科技大学中山学院-陶凌杰
Property in copyright: University of Electronic Science and Technology of China_ZhongShan college-TonnyJack

仅供参考，禁止商用
For reference only, no commercial use
"""
# -*- coding: utf-8 -*-

# Form implementation generated from reading ui file 'CourseDesign.ui'
#
# Created by: PyQt5 UI code generator 5.15.6
#
# WARNING: Any manual changes made to this file will be lost when pyuic5 is
# run again.  Do not edit this file unless you know what you are doing.

import sys
from PyQt5 import QtCore, QtGui, QtWidgets
from PyQt5.QtCore import *
from PyQt5.QtWidgets import *
from PyQt5.QtGui import *

from PyQt5 import QtCore, QtGui, QtWidgets

import cv2

import ControlVolume
import MoveBlock


class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(662, 565)
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(250, 150, 171, 51))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(250, 270, 171, 51))
        self.pushButton_2.setObjectName("pushButton_2")
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(230, 40, 241, 61))
        self.label.setLayoutDirection(QtCore.Qt.LeftToRight)
        self.label.setObjectName("label")
        self.textBrowser = QtWidgets.QTextBrowser(Dialog)
        self.textBrowser.setGeometry(QtCore.QRect(90, 350, 501, 191))
        self.textBrowser.setObjectName("textBrowser")

        self.retranslateUi(Dialog)
        self.pushButton.clicked.connect(self.push_buttom1)
        self.pushButton_2.clicked.connect(self.push_buttom2)
        QtCore.QMetaObject.connectSlotsByName(Dialog)
        Dialog.show()

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "CvProgramFromZSC_TonnyJack"))
        self.pushButton.setText(_translate("Dialog", "拖拽方块"))
        self.pushButton_2.setText(_translate("Dialog", "音量控制"))
        self.label.setText(_translate("Dialog",
                                      "欢迎使用TonnyJack的程序"))
        self.textBrowser.setHtml(_translate("Dialog",
                                            "\n "
                                            "\n "
                                            "这是一个由Opencv和Python开发的计算机视觉程序\n "
                                            "
\n "
                                            "部分代码来自：抖音-恩培\n "
                                            "
\n "
                                            "代码已开源并发布在个人博客：\n "
                                            "
\n "
                                            "本程序仅供学习与参考，禁止商用！\n "
                                            "
\n "
                                            "版权所有©：电子科技大学中山学院-陶凌杰\n "
                                            "
"))

    def push_buttom1(self):
        self.control = MoveBlock.HandControlBlock()
        self.control.recognize()

    def push_buttom2(self):
        self.control = ControlVolume.HandControlVolume()
        self.control.recognize()


if __name__ == "__main__":
    app = QApplication(sys.argv)
    form = QWidget()
    ui = Ui_Dialog()
    ui.setupUi(form)
    form.show()
    sys.exit(app.exec_())

使用方法：

一：搜索Python，进入官网，下载Python3.9解释器

二：搜索Pycharm，进入官网，下载Pycharm community并安装

三：在Pycharm中配置python解释器，打开终端，输入以下三个命令

pip install OpenCV-python -i https://mirrors.aliyun.com/pypi/simple/

pip install mediapipe -i https://mirrors.aliyun.com/pypi/simple/

pip install PyQt5==5.10.1 -i https://mirrors.aliyun.com/pypi/simple/

四：将三个代码文件放在同一文件目录下，运行QT界面的代码

WPF两点之间绘制丝滑的贝塞尔曲线不知名君 WPF开发心得自定义控件 WPF技术 wpf
WPF两点之间绘制丝滑的贝塞尔曲线在做这种节点连线的控件时，需要绘制流畅的曲线。绘制贝塞尔曲线的代码如下：（geo数据给到Path的Data即可绘制）privatevoidRefresh(){PathGeometrygeo=newPathGeometry();PathFigurepathFigure=newPathFigure();pathFigure.StartPoint=StartPoint;
DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 spring 自然语言处理
引言在当今的人工智能领域，深度学习技术已经成为了推动技术进步的核心动力之一。DeepSeek作为一个先进的深度学习框架，旨在为开发者和研究人员提供一个高效、灵活且易于扩展的平台，以便于他们能够快速地实现和部署各种深度学习模型。本文将深入探讨DeepSeek框架的核心架构、基础应用以及如何通过代码实现一个简单的深度学习模型。DeepSeek框架概述DeepSeek框架的设计理念是简洁而强大。它提供了
Prism 框架基础介绍光之使者-聪 Prism框架 c#visual studio windows 系统架构
Prism框架基础介绍WPFPrism框架介绍WPFPrism是微软提供的一个开源框架，旨在帮助开发人员构建复杂的、模块化和可维护的WPF应用程序。Prism支持MVVM（Model-View-ViewModel）设计模式，模块化开发，以及依赖注入（DependencyInjection），并为WPF应用提供导航、事件管理和区域管理的功能。Prism最初是作为“CompositeApplicati
WPF学习笔记蒋劲豪 WPF wpf 学习笔记 C#
容器控件：GridstackPanelWrapPanelDockPanelUniformGridGrid：Grid.RowDefinitionsRowDefinitionGrid.ColumnDefinitionsColumnDefinition第一行的高度是第二行的2倍100auto占2列的空间stackPanel：一般用来修饰部分容器，一般是垂直居中的水平水平排列WrapPanel：默认是贴着
深度剖析DeepSeek本地部署：技术、实践与优化策略 Abossss AI 论文 python ai 人工智能
一、引言1.1研究背景与意义近年来，人工智能技术以迅猛之势蓬勃发展，成为推动各行业变革的核心力量。其中，大语言模型（LLMs）作为人工智能领域的关键技术，在自然语言处理、智能客服、内容创作等众多领域展现出了强大的应用潜力，引发了学术界和产业界的广泛关注。OpenAI的GPT系列模型凭借其出色的语言理解与生成能力，在全球范围内掀起了AI应用的热潮；Google的BERT模型则在自然语言理解任务中取得
AI驱动的可演化架构与前端开发效率 2401_89744464 人工智能架构前端
1.引言在当今快节奏的数字时代，软件系统需要具备强大的适应能力才能在瞬息万变的市场需求中保持竞争力。软件可演化架构的重要性日益凸显，它能够让软件系统在面对需求变更、技术升级以及市场波动时，能够快速、高效地进行调整和升级，避免因僵化的架构而导致的项目失败和资源浪费。然而，传统的软件架构往往面临着诸多挑战，例如维护成本高昂、迭代速度缓慢、难以适应新的技术和需求等。幸运的是，人工智能（AI）技术的快速发
DeepSeek R1 与 OpenAI O1：机器学习模型的巅峰对决学无止尽5 机器学习人工智能
我的个人主页我的专栏：人工智能领域、java-数据结构、Javase、C语言，希望能帮助到大家！！！点赞收藏❤一、引言在机器学习的广袤天地中，大型语言模型（LLM）无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力，正以前所未有的方式重塑着我们与信息交互的模式。DeepSeekR1和OpenAIO1作为其中的佼佼者，代表了当前技术的前沿水准，在架构设计、训练方法、性能表现以及应用场景等诸多层面
DeepSeek与ChatGPT的全面对比测试者家园人工智能 ChatGPT DeepSeek ChatGPT DeepSeek 人工智能质量效能
在人工智能（AI）领域，生成式预训练模型（GPT）已成为推动技术革新的核心力量。OpenAI的ChatGPT自发布以来，凭借其卓越的自然语言处理能力，迅速占据市场主导地位。然而，近期中国AI初创公司DeepSeek推出的R1模型，以其高效性和低成本，迅速引起全球关注。本文将深入探讨DeepSeek与ChatGPT的技术差异、性能表现以及各自的应用前景，旨在为读者提供全新的视角和启发。一、技术架构与
Python说课内容介绍 laocooon523857886 算法算法
一、明确课程目标1.课程目标的确定面向整个专业：Python课程作为计算机专业或相关专业中的一部分，需要对学生的编程能力、问题解决能力以及软件开发的基础技能进行培养。通过本课程，学生能够掌握Python编程的基本语法、面向对象编程、常见数据结构和算法。面向岗位：课程目标还需要结合市场需求和岗位要求。例如，数据分析、人工智能、Web开发等方向都需要具备Python编程能力。学生通过学习Python，
nlp技术 tqs_12345 人工智能自然语言处理
自然语言处理（NaturalLanguageProcessing,NLP）技术是一种计算机科学与人工智能的交叉领域，涉及机器对人类语言进行处理和理解的能力。以下是一些常见的NLP技术的示例：1.机器翻译：NLP技术可以帮助机器将一种语言翻译成另一种语言。例如，谷歌翻译使用NLP技术实现自动翻译，用户可以输入一段文本，然后谷歌翻译会自动将其翻译成其他语言。2.文本分类：NLP技术可以将文本分类到不同
景联文科技数据处理平台：支持高质量图像标注服务景联文科技人工智能科技计算机视觉
图像标注是计算机视觉领域中不可或缺的一环，它通过为图像添加标签来帮助机器学习算法理解图像内容。这一过程对于创建高质量的训练数据集至关重要，使得AI模型能够准确地识别和分类现实世界中的物体。常见的图像标注类型：边界框标注：这是最常用的标注方式之一，通常用于物体检测任务。通过绘制矩形框来确定图像中目标物体的位置，可以是二维或三维形式。分割标注：包括语义分割（同一类别的所有实例被视为整体）和实例分割（每
景联文科技：以全面数据处理服务推动AI创新与产业智能化转型景联文科技人工智能
数据标注公司在人工智能领域扮演着重要角色，通过提供高质量的数据标注服务，帮助企业和组织训练和优化机器学习模型。从需求分析到数据交付，每一个步骤都需要严格把控，确保数据的质量和安全性。景联文科技是一家专业的数据采集与标注公司，致力于为客户提供高质量的数据处理服务，助力企业在人工智能（AI）领域的创新与发展。数据标注的四项基本流程：数据采集、数据清洗、数据标注、数据质检。数据采集数据采集是数据处理的第
落实“双碳”行动，深兰科技推动分子能源技术在AI硬件产品领域的应用及产业化进程 AI周刊人工智能科技
10月21日，上海气候周分子能研究中心(筹)成立仪式在上海环境能源交易所举行。仪式上，深兰科技践行“双碳”目标，与上海东八能源技术有限公司签署分子能源AI应用产业化合作协议。根据协议，国际分子能量发电开拓者、上海气候周分子能研究中心(筹)总干事、首席科学家栾玉成博士团队创立的上海东八能源技术有限公司将与深兰科技共同推动具有全球创新颠覆式能源技术的分子能源发电项目成果，在人工智能硬件产品方面的产业化
Xsens惯性动捕技术优化人型机器人AI训练流程宋13810279720 动作捕捉机器人人工智能
人工智能与机器人技术的飞速发展让人型机器人逐渐从科幻概念转变为现实应用，成为未来智能生活的重要组成部分。为了实现人型机器人动作的精准与流畅，惯性动捕技术正逐步成为优化其AI训练流程的关键手段。惯性动捕技术是一种利用惯性传感器（如加速度计、陀螺仪等）捕捉人体运动数据的方法。相较于光学动捕技术，惯性动捕不受环境光线和空间限制，具有更高的便携性和灵活性。在人型机器人AI训练过程中，惯性动捕技术能够实时捕
读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读躺柒人工智能算法导读总结 AI
1.基本信息算法简史：从美索不达米亚到人工智能时代克里斯·布利克利著中信出版集团股份有限公司,2024年9月出版1.1.读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653÷186000≈27.77%1.2.读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱：超级平台、算法垄断与场景欺骗天才与算法：人脑与AI的数学思维算法图解1.3.笔记--章节对
从养殖场到科技前沿：YOLOv11+OpenCV精准计数鸡蛋与鸡星际编程喵 Python探索之旅 YOLO opencv 人工智能 python 目标检测计算机视觉
前言谁能想到，鸡蛋和鸡的计数居然能变成一项高科技活儿？想象一下，早上去市场，卖家把鸡蛋摔得稀巴烂，结果鸡蛋滚得到处都是——难道你就得一个个捡回来数？还得小心别弄错？可是，你又不是超人！别担心，科技来帮忙！今天的主角是YOLOv11和OpenCV，它们是计算机视觉领域的两位大佬，专门为你解决这一难题。无论是鸡蛋还是鸡，它们都能精准识别，数得清清楚楚。不信？那我们就一起去看看怎么用这对“黄金搭档”解决
简析 .NET Core 构成体系 weixin_30613727 操作系统 c#runtime
简析.NETCore构成体系出处：http://www.cnblogs.com/vipyoumay/p/5613373.htmlhttps://github.com/PrismLibrary/Prism是一个用于在WPF，Windows10UWP和XamarinForms中构建松散耦合，可维护和可测试的XAML应用程序的框架。https://docs.microsoft.com/en-us/pre
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
Python 自动排班表格（代码分享）趣享先生 Python案例分享专栏 python 开发语言
✅作者简介：2022年博客新星第八。热爱国学的Java后端开发者，修心和技术同步精进。个人主页：JavaFans的博客个人信条：不迁怒，不贰过。小知识，大智慧。当前专栏：Java案例分享专栏✨特色专栏：国学周更-心性养成之路本文内容：Python自动排班表格（代码分享）前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录前言问题描述解决步骤1
理论一、大模型—概念伯牙碎琴大模型自然语言处理 ai
一、总述大模型通常指的是参数规模庞大、训练难度较高的人工智能模型。随着深度学习技术的发展，研究人员和企业越来越倾向于构建更大的模型，以提高模型的性能和泛化能力。这些大模型往往需要大量的数据和计算资源来训练，并且在实际应用中通常表现出色。大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以
自动驾驶系列—颠覆未来驾驶：深入解析自动驾驶线控转向系统技术学步_技术自动驾驶自动驾驶人工智能机器学习线控系统
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
《一文吃透！NLTK与SpaCy，自然语言处理的神兵利器》人工智能深度学习
在人工智能的璀璨星空中，自然语言处理（NLP）无疑是最为耀眼的领域之一。它让机器能够理解、处理和生成人类语言，极大地推动了智能交互的发展。而在Python的NLP工具库中，NLTK和SpaCy就像两把锋利的宝剑，各自散发着独特的光芒。今天，就让我们深入探究这两款工具的使用技巧与优势，为你的NLP之旅增添强大助力。一、NLTK：自然语言处理的瑞士军刀NLTK（NaturalLanguageToolk
Flux架构：构建可预测的Web应用状态管理体系阿珊和她的猫架构前端
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章
”人货场”模型搞懂没？数据分析大部分场景都能用！接地气的陈老师人工智能数据分析大数据机器学习推荐系统
做数据分析的同学，很多都听过：人、货、场的分析模型。然而，这东西又是个只闻其名，不见真身的东西。到底该怎么结合实际分析？今天我们系统讲解下。问题场景：某生鲜电商，用户复购率较低，60%的用户在30天内无二次购买行为，运营领导非常着急，要求通过数据分析提升复购率，请问你作为数据分析师该怎么做？建立人工智能精准推荐算法（40%概率用协同过滤，60%用关联分析）把过往6个月月初复购率做成折线图，然后写下
Forrester发布2024年五大网络安全新威胁岛屿旅人网络安全 web安全网络安全网络安全
文章目录前言一、大选年的叙事（舆论）操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局，武器化大语言模型正成为首选攻击工具，安全团队在应对武器化人工智能攻击方面将面临日益严峻的挑战。Forrester近日发布《2024年网络安全威胁预测报告》指出，人工智能正重塑网络安全格局，
人工智能的本质解构：从二进制桎梏到造物主悖论 Somnolence.·.·.·. 人工智能人工智能 ai
一、数学牢笼中的困兽：人工智能的0-1本质人工智能的底层逻辑是数学暴力的具象化演绎。晶体管开关的物理震荡被抽象为布尔代数的0-1序列，冯·诺依曼架构将思维简化为存储器与运算器的机械对话。即使深度神经网络看似模拟人脑突触，其本质仍是矩阵乘法的迭代游戏——波士顿动力机器人的空翻动作不过是微分方程求解的物理引擎呈现，AlphaGo的围棋神话只是蒙特卡洛树搜索的概率统计。这种基于有限离散数学的架构，注定人
YOLOv11 火焰识别：智能时代的火灾预警新利器星际编程喵 Python探索之旅 YOLO python 目标检测机器学习人工智能开发语言
前言随着人工智能（AI）在各个领域如火如荼发展，图像识别技术也跟着飞速进步。从最初的传统算法到如今的深度学习模型，图像识别在准确性和效率上提升令人惊叹。而在这场技术革命中，YOLO（YouOnlyLookOnce）系列模型无疑扮演举足轻重的角色。今天，我们将目光聚焦在最新的版本——YOLOv11。别误会，YOLOv11可不是什么随便升级。它远不止数字上多了个“1”那么简单。YOLOv11集成许多先
OpenCV及基本用法 m0_74823683 opencv 人工智能计算机视觉
一.OpenCV介绍1.OpenCV的全称是OpenSourceComputerVisionLibrary，是一个开放源代码的计算机视觉库。OpenCV是最初由英特尔公司发起并开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用，现在美国WillowGarage为OpenCV提供主要的支持。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序，目前在工业界以及科研领域广泛采用。
从AI发展史看DeepSeek的崛起：技术革新与生态重构的范式突破 AI软件改变生活 AI资料人工智能 deepseek
Deepseek-R1最新可用网址整理推荐、Deepseek干货资料分享https://blog.csdn.net/ifree_code/article/details/145626999[>>>>>>>>>DeepSeek最新资料包汇总<<<<<<<<]DeepSeek最新资料包汇总https://www.kdocs.cn/l/cq8nbKQzguhC?R=L1MvNDE=人工智能（AI）的发展
【AI中的数学-人工智能的数学基石】AI的心脏：探索人工智能的算法与核心技术云博士的AI课堂 AI中的数学人工智能算法数学 AI数学大模型
第一章人工智能的数学基石第二节AI的心脏：探索人工智能的算法与核心技术人工智能（AI）的迅猛发展离不开其背后的复杂算法与核心技术。这些算法不仅决定了AI系统的性能和能力，也构成了AI应用的基础。从基础的机器学习算法到先进的深度学习模型，AI的算法生态系统丰富多样，涵盖了广泛的数学原理和计算方法。本节将深入探讨驱动AI进步的关键算法与技术，揭示其工作机制及在实际应用中的重要性。一、机器学习：智能的基
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

计算机视觉项目：手势拖拽方块和手势控制音量

项目简介：

电子科技大学中山学院2019级计算机视觉的课程设计

语言：Python

开发工具：Pycharm、Python3.9

库：PyQt、OpenCv、mediapipe

功能：

手势拖拽方块：通过食指与中指的距离控制方块移动

手势控制音量：通过食指与大拇指的距离控制电脑音量

源码：

手势控制方块

手势控制音量

Qt界面：

使用方法：

一：搜索Python，进入官网，下载Python3.9解释器

二：搜索Pycharm，进入官网，下载Pycharm community并安装

三：在Pycharm中配置python解释器，打开终端，输入以下三个命令

四：将三个代码文件放在同一文件目录下，运行QT界面的代码

你可能感兴趣的:(计算机视觉,人工智能,wpf)