阿卡司机

HTA0视觉抓取机器人源码解读

1 HTA0机器人简介

HTA0机器人英文名Horizontal Travel Robot Arm，是由fdx Labs实验室推出的开源机器人，机器人网站https://www.fdxlabs.com/products/horizontal-travel-robot-arm-hta0/，github地址https://github.com/pacogarcia3/hta0-horizontal-robot-arm。这是一个3自由度的机器人，配备有摄像头，可以实现视觉抓取。机器人长这个样子：

2 机器人底层部分软件

2.1 软件基本流程

HAT0底层软件在文件夹arduino_sketch文件夹下的arm_v3.ino文件中。主函数loop（）函数中接收上位机发下来的数据，数据格式：。然后通过coordinate_move（XYZ_next[0],XYZ_next[1],XYZ_next[2],XYZ_next[3]）让机械臂末端跑到对应的坐标位置。

void loop() {
  // put your main code here, to run repeatedly:
  bool loop=true;
  
  recvWithStartEndMarkers();
  showNewData();
  //delay(5000);
  
  //data format  = <23,56,89,1,1,3456,3> {17}
  //X: 7.00 Y: 8.00 Z: 9.00 bool_move: 1.00 bool_open: 0.00 delay_ms: 10.00 move_type: 1.00

  //the bool_move controls if the arm moves linearly to the position or performs a pick/grab motions (move x first/y second etc)
  
  //<0,0,-9,1,1,1>

  if (newData==true && loop==true) {
    coordinate_move(XYZ_next[0],XYZ_next[1],XYZ_next[2],XYZ_next[3]);//机械臂跑到目的坐标
    servo_Open(XYZ_next[4]);//机械手张开或关闭
    delay(XYZ_next[5]);//延时
    newData=false;
    Serial.println("done");
  }

}

2.2 机械手姿态解算

图1

图2

机械臂的坐标如图1所示。如图2，机械臂由2个转动关节组成，俩个臂长度都为L。末端的位置坐标(Ym,Zm)。则计算关节1角度θ 1有:

计算关节角θ 2：

函数void get_angles_from_yz(double y, double z)实现的就是计算俩个关节角的功能，并把结果存入angle_next[0]和angle_next[1]。

2.3 运动控制

实现运动控制的函数void coordinate_move(double xEnd, double yEnd, double zEnd, bool liftgrab_motion)，x轴的步进电机直接由IO控制，Y轴和Z轴的步进电机都有Arduino的Servo模块控制。

void  coordinate_move(double xEnd, double yEnd, double zEnd, bool liftgrab_motion) {

  double xStart = XYZ_current[0];
  double yStart = XYZ_current[1];
  double zStart = XYZ_current[2];

  //Serial.println("/ Coord Move Start /");

  //calibrate stepper steps into cms (for x axis)
  
  double x_to_steps = STEPS_PER_CM[0];

  //identify if there is movement in the y Axis
  double zDelta = zEnd - zStart;
  //identify if there is movement in the z Axis
  double xDelta = xEnd - xStart;

  double x_stepper_steps = x_to_steps * abs(xDelta);

  if (xDelta != 0) {
    if (xDelta > 0) {
      stepper_advance(0, x_stepper_steps, 0);
    } else {
      stepper_advance(0, x_stepper_steps, 1);
    }
  }

  //the liftbrab_motion bool is equivalent to the bool_move paramter
  // controls if the arm moves linearly to the position or performs a pick/grab motions (move Y first/z second etc)
  

  if (liftgrab_motion == true) {
    if (zDelta < 0) {
      //arm is going to move down, move Y first

      // move arms in Y direction
      get_angles_from_yz(yEnd, zStart);
      twoarm_step_coordinate(angle_next[0], angle_next[1]);

      // move arms in Z direction
      get_angles_from_yz(yEnd, zEnd);
      twoarm_step_coordinate(angle_next[0], angle_next[1]);

    } else {
      //arm is moving up, perform Y movement first.

      // move arms in Z direction
      get_angles_from_yz(yStart, zEnd);
      twoarm_step_coordinate(angle_next[0], angle_next[1]);

      // move arms in Y direction
      get_angles_from_yz(yEnd, zEnd);
      twoarm_step_coordinate(angle_next[0], angle_next[1]);
    }

  } else {
    get_angles_from_yz(yEnd, zEnd);
    twoarm_step_coordinate(angle_next[0], angle_next[1]);
  }


  //Serial.println("/ Coord Move End /");

  //Serial.println("  ");
  //Serial.print(" xStart=  "); Serial.print(xStart); Serial.print(" yStart=  "); Serial.println(yStart);
  //Serial.print("Angle Top Arm="); Serial.print(angle_TopArm); Serial.print(" Angle Middle Arm=  "); Serial.println(angle_MiddleArm);
  //Serial.print("Angle Top Arm_next="); Serial.print(angle_TopArm_next); Serial.print(" Angle Middle Arm_next=  "); Serial.println(angle_MiddleArm_next);
  //Serial.print(" xEnd=  "); Serial.print(xEnd);   Serial.print(" yEnd=  "); Serial.println(yEnd);

  XYZ_current[0] = xEnd;
  XYZ_current[1] = yEnd;
  XYZ_current[2] = zEnd;
  XYZ_current[3] = liftgrab_motion;
}

3 机器人上位机软件

机器人上位机软件是用pyhon写的，包括以下文件：

main.py    //启动主程序运行
main_loop.py //主逻辑运行函数
commands_arduino.py //与下位机通信命令
camera_realworldxyz.py //图像识别接口，世界坐标计算接口
initial_perspective_calibration.py //准备透视变换的相关矩阵，保存到文件中
initial_camera_calibration.py //摄像头标定，并生成摄像头标定矩阵等参数矩阵，保存到文件中
image_recognition_singlecam.py //图像识别相关功能函数

3.1 上位机主函数逻辑

主函数就在main.py里面，用ImageDetection()开启主循环。它调用main_loop.py中的capturefromPiCamera()函数，不停的读取摄像头捕捉到的照片。在该函数中首先识别背景，然后再不停的捕捉图片，当识别到有物体时，计算出物体坐标XYZ，再通过pickanddrop(XYZ,arm)函数将物体抓取起来扔到箱子里。pickanddrop()函数完成抓物体的函数是move_and_pickup(),完成扔物体的函数是transport_and_drop()。这俩个函数最终都是调用move_untildone()函数来实现电机运动控制。move_untildone是根据通信格式向下位机串口发送位置消息来控制机械臂运动。

def move_untildone(self, inputarr):
        #data format  = <23,56,89,1,1,3456,3> {17}
        #X: 7.00 Y: 8.00 Z: 9.00 bool_move: 1.00 bool_open: 0.00 delay_ms: 10.00 move_type: 1.00

        #bool_move controls if the arm moves linearly to the position or coordinates y/z to pickup
        
        inputs="<"+str(inputarr[0])+","+str(inputarr[1])+","+str(inputarr[2])+","+str(inputarr[3])+","+str(inputarr[4])+","+str(inputarr[5])+">"
        inputs=inputs.encode("utf-8")

        self.ser.write(inputs)
        while True:
            str1=self.decodestr(self.ser.readline())
            print(str1),
            if str1=="done":
                break

3.2 相机透镜模型

对于上图所示的相机成像系统，有相机透镜公式成立：

其中：u,v是相机坐标下的像素坐标

XYZ是世界坐标系下点的世界坐标

s是放大系数

矩阵A是相机标定矩阵，fx，fy是相机焦距，cx，cy是相机光心坐标

R是相机姿态矩阵，T是相机平移矩阵

如何求出以上矩阵参数，是initial_camera_calibration.py和initial_perspective_calibration.py文件的主要工作。

已知相机像素(u,v)，求相机世界坐标的公式为：

3.3 相机标定求取标定矩阵A

相机标定请参考：https://docs.opencv.org/3.3.0/dc/dbb/tutorial_py_calibration.html

相机标定的步骤是：1 准备一个棋盘格大小已知的象棋棋盘 2 对棋盘不同角度进行拍照，得到多张图片 3 提取图像中的棋盘角点(所谓角点是指俩个棋盘格相交的顶点，所以象棋盘每行有7个角点，每列有7个角点，共有49个角点），根据真是角点坐标数组和提取的角点像素矩阵，输入到opencv的cv2.calibrateCamera()函数中求出标定矩阵。4 使用cv2.getOptimalNewCameraMatrix()函数求优化的标定矩阵。

本工程是存储在calibration_images中。本工程准备的象棋棋盘每个格子是2.5cm。求标定矩阵的代码都在initial_camera_calibration.py中，求出标定矩阵和畸变矩阵，并存入文件中。

3.4 求取其它参数矩阵

求取相机姿态矩阵需要用到opencv函数

ret, rvec1, tvec1=cv2.solvePnP(worldPoints,imagePoints,newcam_mtx,dist)

参数1是点实际点在世界坐标系的坐标数组，参数2是点在相机平面的像素数组，参数3是相机的标定矩阵，参数4是相机的畸变矩阵。返回的rvec1是姿态矩阵对应的旋转向量，tvec1是平移矩阵。

准备世界坐标数组及其对应的像素数组

求得的标定矩阵为：

有光心像素坐标(cx,cy)=（628,342) ，因此可以在拍照的图中定位这个中心点：

从摄像机镜头到这个点拉条绳子，这条绳子将与直面垂直，测得身子长度即为该点的Z轴坐标Zc，测点到纸边的距离可以得到Xc和Yc。对于其它9个圆心点，用类似方法可以测出(Xi,Yi,di)，对应的Zi为:

通过图像识别可求出对应的图像坐标(Cxi,Cyi)，最后求出的坐标为：

total_points_used=10

X_center=10.9
Y_center=10.7
Z_center=43.4
worldPoints=np.array([[X_center,Y_center,Z_center],
                       [5.5,3.9,46.8],
                       [14.2,3.9,47.0],
                       [22.8,3.9,47.4],
                       [5.5,10.6,44.2],
                       [14.2,10.6,43.8],
                       [22.8,10.6,44.8],
                       [5.5,17.3,43],
                       [14.2,17.3,42.5],
                       [22.8,17.3,44.4]], dtype=np.float32)

#MANUALLY INPUT THE DETECTED IMAGE COORDINATES HERE

#[u,v] center + 9 Image points
imagePoints=np.array([[cx,cy],
                       [502,185],
                       [700,197],
                       [894,208],
                       [491,331],
                       [695,342],
                       [896,353],
                       [478,487],
                       [691,497],
                       [900,508]], dtype=np.float32)


#FOR REAL WORLD POINTS, CALCULATE Z from d*

for i in range(1,total_points_used):
    #start from 1, given for center Z=d*
    #to center of camera
    wX=worldPoints[i,0]-X_center
    wY=worldPoints[i,1]-Y_center
    wd=worldPoints[i,2]

    d1=np.sqrt(np.square(wX)+np.square(wY))
    wZ=np.sqrt(np.square(wd)-np.square(d1))
    worldPoints[i,2]=wZ

print(worldPoints)

姿态矩阵和平移矩阵求取

然后可以求出姿态矩阵和平移矩阵：

#load camera calibration
savedir="camera_data/"
cam_mtx=np.load(savedir+'cam_mtx.npy')
dist=np.load(savedir+'dist.npy')
newcam_mtx=np.load(savedir+'newcam_mtx.npy')
roi=np.load(savedir+'roi.npy')


ret, rvec1, tvec1=cv2.solvePnP(worldPoints,imagePoints,newcam_mtx,dist)
if writeValues==True: np.save(savedir+'rvec1.npy', rvec1)
if writeValues==True: np.save(savedir+'tvec1.npy', tvec1)

R_mtx, jac=cv2.Rodrigues(rvec1) #rvec1是1*3向量，用Rodrigues函数求3*3姿态矩阵
if writeValues==True: np.save(savedir+'R_mtx.npy', R_mtx)

Rt=np.column_stack((R_mtx,tvec1))  #Rt=R|t，3*4矩阵
if writeValues==True: np.save(savedir+'Rt.npy', Rt)

#P_mtx = A*Rt
P_mtx=newcam_mtx.dot(Rt)
if writeValues==True: np.save(savedir+'P_mtx.npy', P_mtx)

放大系数s的计算

s_arr=np.array([0], dtype=np.float32)
s_describe=np.array([0,0,0,0,0,0,0,0,0,0],dtype=np.float32)

for i in range(0,total_points_used):
    print("=======POINT # " + str(i) +" =========================")
    
    print("Forward: From World Points, Find Image Pixel")
    XYZ1=np.array([[worldPoints[i,0],worldPoints[i,1],worldPoints[i,2],1]], dtype=np.float32)
    XYZ1=XYZ1.T
    print("{{-- XYZ1")
    print(XYZ1)
    suv1=P_mtx.dot(XYZ1)
    print("//-- suv1")
    print(suv1)
    s=suv1[2,0]    
    uv1=suv1/s
    print(">==> uv1 - Image Points")
    print(uv1)
    print(">==> s - Scaling Factor")
    print(s)
    s_arr=np.array([s/total_points_used+s_arr[0]], dtype=np.float32)
    s_describe[i]=s
    if writeValues==True: np.save(savedir+'s_arr.npy', s_arr)

    print("Solve: From Image Pixels, find World Points")

    uv_1=np.array([[imagePoints[i,0],imagePoints[i,1],1]], dtype=np.float32)
    uv_1=uv_1.T
    print(">==> uv1")
    print(uv_1)
    suv_1=s*uv_1
    print("//-- suv1")
    print(suv_1)

    print("get camera coordinates, multiply by inverse Camera Matrix, subtract tvec1")
    xyz_c=inverse_newcam_mtx.dot(suv_1)
    xyz_c=xyz_c-tvec1
    print("      xyz_c")
    inverse_R_mtx = np.linalg.inv(R_mtx)
    XYZ=inverse_R_mtx.dot(xyz_c)
    print("{{-- XYZ")
    print(XYZ)

    if calculatefromCam==True:
        cXYZ=cameraXYZ.calculate_XYZ(imagePoints[i,0],imagePoints[i,1])
        print("camXYZ")
        print(cXYZ)

3.5 待抓取物体的识别

首先识别出物体轮廓：

def detectObjects(self, image, bg_img,externalContours=True):

        img=image.copy()           
        background_img=bg_img.copy()


        # Process Image Difference
        diff=self.calculateDifference_Otsu(img,background_img)

        # / Find the Contours
        # use RETR_EXTERNAL for only outer contours... use RETR_TREE for all the hierarchy
        if externalContours==True:
            contours_detected, hierarchy = cv2.findContours(diff, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
        else:
            contours_detected, hierarchy = cv2.findContours(diff, cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

        #calculate key variables
        height, width, channels = img.shape

        # /// identify the VALID Contours
        contours_validindex= self.identify_validcontours(contours_detected,height,width)
        obj_count=len(contours_validindex)
        self.printStatus("valid contours "+ str(obj_count))

        return obj_count, contours_detected, contours_validindex

然后根据轮廓计算出轮廓中心图像坐标：

def detectionOutput(self, image, obj_count, validcontours, diff_contours):

        img_output=image.copy()

        detected_points=[]

        if (len(validcontours)>0):
            for i in range(0,len(validcontours)):
                cnt=diff_contours[validcontours[i]]

                #get rectangle detected_points
                x,y,w,h=cv2.boundingRect(cnt)
                
                #get centroid
                M=cv2.moments(cnt)
                cx=int(M['m10']/M['m00'])
                cy=int(M['m01']/M['m00'])
                
                self.printStatus("point number "+str(i))
                self.printStatus(str(cx)+", "+str(y))
                self.printStatus("x: "+str(x)+" y: "+str(y)+" w: "+str(w)+" h: "+str(h))

                #draw retangle
                cv2.rectangle(img_output,(x,y),(x+w,y+h),(0,255,0),2)
                #draw center
                cv2.circle(img_output,(cx,cy),3,(0,255,0),2)

                if self.PRINT_IMG_LABELS ==True:
                    
                    #image,text,font,bottomleftconrner,fontscale,fontcolor,linetype
                    cv2.putText(img_output,"Point "+str(i),(x-w,y+h),cv2.FONT_HERSHEY_SIMPLEX,0.5,(255,0,0),1)
                    cv2.putText(img_output,"cx,cy: "+str(self.truncate(cx,2))+","+str(self.truncate(cy,2)),(x-w,y+h+9),cv2.FONT_HERSHEY_SIMPLEX,0.5,(255,0,0),1)

                points=[x,y,w,h,cx,cy]
                detected_points.append(points)

        if (obj_count>1 or len(validcontours)==0):               
            self.previewImage("Multiple Objects Detected",img_output)
            one_object=False
        else:
            self.previewImage("One Objects Detected",img_output)
            one_object=True


        return obj_count, detected_points, img_output

组合成物体识别函数：

def run_detection(self,img,bg,testRun=False):
           
        obj_count, contours_detected, contours_validindex=self.detectObjects(img,bg)

        obj_count, detected_points, img_output=self.detectionOutput(img,obj_count,contours_validindex,contours_detected)
       
        return obj_count, detected_points, img_output

3.6 根据图像坐标计算世界坐标

camera_realworldxyz.py中的calculate_XYZ(self,u,v)函数是按照3.2节中的求相机世界坐标公式来计算世界坐标：

def calculate_XYZ(self,u,v):
                                      
        #Solve: From Image Pixels, find World Points

        uv_1=np.array([[u,v,1]], dtype=np.float32)
        uv_1=uv_1.T
        suv_1=self.scalingfactor*uv_1
        xyz_c=self.inverse_newcam_mtx.dot(suv_1)
        xyz_c=xyz_c-self.tvec1
        XYZ=self.inverse_R_mtx.dot(xyz_c)

        return XYZ

然后再detect_xyz函数中根据识别到的轮廓坐标计算物体世界坐标：

def detect_xyz(self,image,calcXYZ=True,calcarea=False):

        image_src=image.copy()
        
        #if calcXYZ==True:
        #    img= self.undistort_image(image_src)
        #    bg = self.bg_undst
        #else:
        img=image_src
        bg=self.bg
                    
        XYZ=[]
        #self.previewImage("capture image",img_undst)
        #self.previewImage("bg image",self.bg_undst)
        obj_count, detected_points, img_output=self.imageRec.run_detection(img,self.bg)

        if (obj_count>0):

            for i in range(0,obj_count):
                x=detected_points[i][0]
                y=detected_points[i][1]
                w=detected_points[i][2]
                h=detected_points[i][3]
                cx=detected_points[i][4]
                cy=detected_points[i][5]

                cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
                
                #draw center
                cv2.circle(img,(cx,cy),3,(0,255,0),2)

                
                cv2.putText(img,"cx,cy: "+str(self.truncate(cx,2))+","+str(self.truncate(cy,2)),(x,y+h+28),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)
                if calcXYZ==True:
                    XYZ.append(self.calculate_XYZ(cx,cy))
                    cv2.putText(img,"X,Y: "+str(self.truncate(XYZ[i][0],2))+","+str(self.truncate(XYZ[i][1],2)),(x,y+h+14),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)
                if calcarea==True:
                    cv2.putText(img,"area: "+str(self.truncate(w*h,2)),(x,y-12),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)

        return img, XYZ

初学者指南：快速入门Halcon图像处理与对象识别 Singe.Chen 图像处理人工智能 halcon c#计算机视觉
引言Halcon是一款功能强大的机器视觉和图像处理软件库，被广泛应用于工业自动化、医疗影像处理、机器人视觉等领域。对于刚开始接触机器视觉和图像处理的开发者来说，Halcon提供了丰富的工具和功能，可以帮助快速上手并构建高效的图像处理应用。本文将介绍Halcon的基本概念、安装和使用方法，并探讨其核心功能如图像处理和对象识别，提供一些简单的C#代码示例，帮助初学者快速入门。Halcon的基本概念Ha
ROS2---基础操作 kyle~ ROS2 ROS2 C++
工作空间(workspace)workspace是一个存放项目开发相关文件的文件夹。例如我们要开发一个机器人，我们可以创建一个工作空间，然后存放这个机器人不同功能的包（感知（雷达，相机等），运动（底盘，云台，发射结构），控制（红外，蓝牙等））。ros2工作空间的创建mkdir-pws00_helloworld/src#创建工作空间以及子级目录src，工作空间名称可以自定义cdws00_hellow
003：无人机概述 94_31762031 014-无人机航测无人机测绘无人机物流无人机巡检无人机航拍无人机系统无人机驾驶员
摘要：本文介绍无人机的定义和分类、无人机系统定义、民用无人机驾驶员分类和应用领域。一、无人机的定义和分类1.无人机定义无人机是一种能够在无人驾驶的条件下完成复杂空中飞行任务和各种负载任务的飞行器，可以被视为“空中机器人”。它利用先进的遥控、遥测技术和自备的程序控制装置，能够按照预定的航线或任务指令进行飞行和操作。2.无人机分类（1）按飞行平台构型分类固定翼无人机：类似于传统飞机，拥有一对固定的
「机器人」“控制权”在扑翼飞行器中的重要性及其优化挑战 Robot_Starscream 「机器人学」「运动控制」机器人人工智能
前言对于扑翼飞行器而言，“控制权”不仅决定其飞行稳定性，也决定其在高动态任务（如快速机动、障碍规避）中的表现能力。以下内容从控制目标和控制权的定义出发，阐述了控制权的重要作用及优化难点，并探讨了潜在的解决方案。1.控制目标1.1飞行稳定性•通过调节机翼的运动（如振幅、频率、对称性等），在俯仰、滚转与偏航三轴上维持或恢复姿态稳定。1.2运动控制•借助机翼独立运动所产生的推力和力矩，不依赖额外舵面或尾
自制一个入门STM32 四足机器人具体开发顺序弥途足式机器人 stm32 机器人单片机
0前期准备1.知识储备学习STM32微控制器的基础知识，包括GPIO、定时器、串口通信等外设的使用，可通过官方文档、教程和视频课程进行学习。了解舵机控制原理，因为四足机器人通常使用舵机来实现关节运动。掌握基本的机械结构设计知识，以便设计机器人的腿部和身体结构。2.材料和工具准备硬件材料：STM32开发板（如STM32F103系列）、舵机（根据机器人腿部关节数量选择合适的舵机，一般每个腿部至少需要2
【SLAM】SLAM技术详解：同步定位与地图构建 steamedobun 计算机视觉 SLAM 深度学习人工智能目标检测机器学习
引言在机器人技术、自动驾驶、增强现实（AR）和无人机等前沿领域，SLAM（SimultaneousLocalizationandMapping）技术扮演着至关重要的角色。SLAM，即同时定位与地图构建，是一种通过传感器数据实时估计机器人或无人系统自身位置并构建环境地图的技术。本文将详细介绍SLAM技术的原理、应用场景、分类及其优缺点，并对SLAM技术的未来发展进行展望。SLAM技术概述定义与原理S
亚博microros小车-原生ubuntu支持系列：16 机器人状态估计 bohu83 机器人 ubuntu microros imu imu_tools localization
本来想测试下gmapping建图，但是底层依赖了yahboomcar_bringup做底层的数据处理，所以先把依赖的工程导入。程序启动后，会订阅imu和odom数据，过滤掉一部分的imu数据后，然后与odom数据进行融合，最后输出一个融合后的odom数据用于估计机器人的状态，该数据多用于建图和导航中。src/yahboomcar_bringup/launch/新建启动脚本yahboomcar_br
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
对话系统(Chatbots) 原理与代码实例讲解 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1对话系统的发展历程对话系统，又称聊天机器人(Chatbots)，是模拟人类对话的计算机程序。从早期的基于规则的系统到如今基于深度学习的智能体，对话系统经历了漫长的发展历程。第一阶段：基于规则的系统(1960s-1990s)早期的对话系统主要基于预先定义的规则和模板。例如，ELIZA(1966)是一个模拟心理治疗师的程序，通过模式匹配和关键词识别来生成回复。这些系统只能处理有限的对
大模型问答机器人的智能化程度 AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
大模型、问答机器人、智能化程度、自然语言处理、深度学习、Transformer模型、知识图谱、推理能力、对话系统1.背景介绍近年来，人工智能技术取得了飞速发展，特别是深度学习的兴起，为自然语言处理（NLP）领域带来了革命性的变革。其中，大模型问答机器人作为一种新型的智能交互系统，凭借其强大的语言理解和生成能力，在客服、教育、娱乐等领域展现出广阔的应用前景。问答机器人是指能够理解用户自然语言问题并给
Deepseek爆火背后的多Token技术预测明哲AI AIGC 人工智能大模型 RAG 多token预测 deepseek
近年来，大语言模型（LLMs）的发展如火如荼，它们在聊天机器人、文档生成、代码编写等领域大放异彩。然而，随着模型规模的增加，生成效率也成为了一大瓶颈。传统的自回归语言模型需要逐字生成（token-by-token），这种方式不仅耗时，还限制了模型在实时场景中的表现。那么，有没有一种方法可以加快生成速度，同时保持文本质量？答案是：多Token预测（Multi-TokenPrediction,MTP）
《深度剖析Q-learning中的Q值：解锁智能决策的密码》人工智能深度学习
在人工智能的飞速发展进程中，强化学习作为一个关键领域，为智能体与环境交互并学习最优行为策略提供了有效框架。其中，Q-learning算法凭借其独特的魅力，在机器人控制、自动驾驶、游戏AI等众多领域大放异彩。而Q-learning中的Q值，更是理解这一算法的核心关键，它如同智能体的“智慧密码”，指导着智能体在复杂环境中做出最优决策。Q值的直观定义：行为价值的“预言家”从直观层面理解，Q值代表着智能体
读取机器人移动轨迹并在RVIZ界面中显示(ROS1) 如阳光如你机器人 linux 学习
文章目录前言一、准备1.坐标系2.ros下的路径消息格式二、实现过程1.轨迹保存2.轨迹读取并显示前言机器人在巡检过程中需要沿着固定路线执行任务，因此可以先把机器人的移动轨迹录制并保存下来，之后读取轨迹，方便后续操作。一、准备1.坐标系巡检导航过程中，机器人需要确定好坐标系，以便进行定位与导航，在gazebo仿真下可以选择world坐标系，在实际使用中通常使用的是map坐标系，这里以map坐标系为
ROS中可视化车辆运动路径-采用RVIZ进行显示 m0_46699649 人工智能算法 c++自动驾驶
一：序言在进行机器人自动驾驶过程中数据分析必不可少，为了更方便我们进行处理和观看这个功能效果，进行可视化是必不可少的，车辆行驶路径往往是以路径点的信息进行保存，为了更直观看到显示的效果，可以将其在RVIZ上可视化出来。如果觉得学习了C++和ROS不知道怎么入手自动驾驶项目的可以参考这个项目，或者C++和ROS不是很熟练的我也推荐结合相关课程一块学习无人车采用纯跟踪算法跟随离线路径（ROS，C++实
华为OD机试 - 机器人搬砖 - 二分查找（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od 机器人 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述机器人搬砖，一共有N堆砖存放在N个不同的仓库中，第i堆中有bri
华为OD机试 - 机器人仓库搬砖 - 二分查找（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od 机器人 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述机器人搬砖，一共有N堆砖存放在N个不同的仓
【花雕学编程】Arduino FOC 之双足机器人的追踪目标移动控制驴友花雕机器人嵌入式硬件单片机 c++Arduino FOC 双足机器人的追踪目标移动控制
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
【花雕学编程】Arduino BLDC 之工业机器人关节伺服控制程序驴友花雕 Arduino BLDC 机器人嵌入式硬件单片机 c++Arduino BLDC 工业机器人关节伺服控制程序
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
【花雕学编程】Arduino BLDC 之仓储机器人抓取控制驴友花雕 Arduino BLDC 机器人嵌入式硬件单片机 c++Arduino BLDC 仓储机器人抓取控制
Arduino是一个开放源码的电子原型平台，它可以让你用简单的硬件和软件来创建各种互动的项目。Arduino的核心是一个微控制器板，它可以通过一系列的引脚来连接各种传感器、执行器、显示器等外部设备。Arduino的编程是基于C/C++语言的，你可以使用ArduinoIDE（集成开发环境）来编写、编译和上传代码到Arduino板上。Arduino还有一个丰富的库和社区，你可以利用它们来扩展Ardui
机器人介绍 max500600 机器人机器人
以下是关于机器人的介绍：定义机器人是一种能够自动执行任务的机器系统，它集成了机电、机构学、材料学及仿生学等多个学科技术，可以接受人类指挥，运行预先编排的程序，或根据人工智能技术制定的原则纲领行动，具备感知、决策、执行等基本特征，可辅助甚至替代人类完成各种任务。发展历程萌芽期：1954年第一台可编程的机器人在美国诞生，1959年世界上第一台工业机器人研制成功，随着机构理论和伺服理论的发展，机器人进入
MATLAB算法实战应用案例精讲-【优化算法】蘑菇繁殖优化算法(MRO)(附MATLAB代码实现) 林聪木 matlab 开发语言
目录前言算法原理算法思想算法步骤优缺点带模糊需求的开放式选址路径问题的混合离散蘑菇繁殖算法１ＯＬＲＰ⁃ＦＤ模型１.１可信度理论１.２问题描述１.３模型２求解ＯＬＲＰ⁃ＦＤ的混合离散蘑菇繁殖算法２.２初始化２.３改进蘑菇繁殖算法２.４随机模拟程序２.５ＨＤＭＲＯ算法流程基于改进蘑菇繁殖算法的机器人路径规划机器人路径规划方法研究现状路径规划方法传统路径规划方法智能路径规划方法机器人群体系统结构分布式结
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
ChatGPT到底是什么？会给我们生活来这些改变↓ 大模型. chatgpt 生活 microsoft 语言模型人工智能架构大模型
2022年底，“ChatGPT”这个词悄然进入公众视野。如果你没听说过，或是只把它当成一个聊天机器人，那就太小看它了。很多行业，比如新闻、律师、教育、客服咨询等等，已经把ChatGPT应用在了生产、服务中。那么，ChatGPT究竟是什么？本期内容，我们就来了解ChatGPT和它背后的技术。我们先从它的名字说起。Chat，直译为“闲聊”，可以说ChatGPT是用起来如同微信或QQ的一个聊天应用。只不
盘点50个AI大模型企业和典型产品大模型玩家人工智能语言模型 ai 自然语言处理深度学习大模型
OpenAI：-ChatGPT：是OpenAI推出的非常具有影响力的聊天机器人程序，能够进行自然流畅的对话、文本创作、问题解答等，不断迭代升级，引发了全球对大模型的广泛关注。-GPT-4O：OpenAI的新一代AI模型，在语言理解和生成能力上有进一步提升，能够感知用户的情绪，并针对问题以带有情绪的“嗓音”做出反馈。-Sora：文生视频大模型，可根据文本指令生成复杂且具有一定时长的视频，具有多个镜头
强化学习很多ac架构的算法比如ppo，为什么使用状态价值网络而不使用动作价值网络实现critic呢?｜状态价值网络的优势与挑战｜Actor-Critic｜状态价值｜强化学习 concisedistinct 人工智能算法人工智能架构
目录1.强化学习的基础1.1策略与价值函数2.Actor-Critic架构概述2.1Critic的作用3.为什么选择状态价值网络？3.1训练稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展，其在诸如游戏、机器人控制和金融预测等领域的应用越
推荐开源项目：Chat-Template - 快速构建聊天机器人原型的利器侯深业Dorian
推荐开源项目：Chat-Template-快速构建聊天机器人原型的利器chat-templateChat-TemplateisaReactcomponentthatenablesquickprototypingofbotconversations.项目地址:https://gitcode.com/gh_mirrors/ch/chat-template1、项目介绍Chat-Template是一款基于
使用飞书群机器人监控服务器GPU使用率 sunrise_ccx 服务器飞书
目标：如果服务器GPU空置，可以及时推送消息到飞书群。其他类似的监控目标也可以修改代码实现。步骤：(1)首先在群聊设置加入机器人，复制webhook_url(2)在服务器后台运行如下代码。注意替换webhook_url"""nohuppythonmonitor_gpu.pymy_server>monitor_gpu.log2>&1&"""importsysimportsubprocessimpor
LeetCode：62.不同路径 xiaoshiguang3 代码随想录-跟着Carl学算法 leetcode 算法 java 动态规划
跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！代码随想录LeetCode：62.不同路径一个机器人位于一个mxn网格的左上角（起始点在下图中标记为“Start”）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径？示例1：输入：m=3,n=7输出：28示例2：输入：m=3,n=
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class