红叶骑士之初

基于YOLOv3+Kalman-Filter实现Multi-target tracking

https://blog.csdn.net/Gavinmiaoc/article/details/88639814

本文以kears-yolov3做detector，以Kalman-Filter算法做tracker，进行多人物目标追踪，其应用常见于客流量统计，行人追踪检测，可延伸至Fall Detection,Loitering Detection徘徊检测等项目。

应用举例：

这个可以看做多目标跟踪任务，图中追踪到三个行人，记录在视频左上方数字3.其他被检测到的物体不参与数字统计。

其实是一种比较简单的多目标追踪方式：detector+tracker，两者其实是相对独立的。另外可以支持应用算法扩展，比如添加跌倒，徘徊，轨迹计算等算法。

这里的流程就是，图片经过detector，得到人体坐标框，然后计算中心点位置centers（x0,y0），将该centers（x0,y0）输入给追踪器，追踪器去学习（Update）并给出预测。其中每一帧的图，tracker都会给出多条轨迹，每条轨迹都可能由若干个点组成：

来看一下常规的update里面发生了什么？（简单贴一下）

# 第一段
cost = np.zeros(shape=(N, M)) # Cost matrix
for i in range(len(self.tracks)):
for j in range(len(detections)):
try:
diff = self.tracks[i].prediction - detections[j]
distance = np.sqrt(diff[0][0]*diff[0][0] +
diff[1][0]*diff[1][0])
cost[i][j] = distance
except:
pass

# 第二段
row_ind, col_ind = linear_sum_assignment(cost)
新的一帧物体中心点centers给入之后，tracker与给出预测值prediction ，同时预测值与实际detections的距离去迭代匈牙利算法匹配（linear_sum_assignment）。

当然这套算法好处是在，可以任意组合比较好的detector/tracker算法，项目Smorodov/Multitarget-tracker中就是Opencv中的 face detector + Kalman filter multitarget tracker。笔者引用的是项目：srianant/kalman_filter_multi_object_tracking中的KF算法。

项目准备：
1.环境配置：tensorflow-gpu 1.2.1 + python 3.5 +

2.YOLOV3：（Real-time Multi-person tracker using YOLO v3 and deep_sort with tensorflow）

Download YOLOv3 or tiny_yolov3 weights from YOLO website.Then convert the Darknet YOLO model to a Keras model.

python3 convert.py yolov3.cfg yolov3.weights model_data/yolo.h5
那么在model_data文件夹下得到yolo.h5，这正是我们需要的keras model.详见源码3

笔者也提供一下转化之后的h5文件。

链接：https://pan.baidu.com/s/1ppQH_FEbYSHob2T7NQOVmg 提取码：e345

步骤为：

根据yolov3跑出结果yolo_test.detect_image
计算人物框的中心点calc_center
更新tracker，trackerDetection
再来看看tracker里面的属性：

self.track_id = trackIdCount # identification of each track object
self.KF = KalmanFilter() # KF instance to track this object
self.prediction = np.asarray(prediction) # predicted centroids (x,y)
self.skipped_frames = 0 # number of frames skipped undetected
self.trace = [] # trace path
track_id每个追踪物体的标识；prediction预测下一个点；trace轨迹点。

>>> tracker.tracks[0].trace
>>>[array([[116.],
[491.]]), array([[135.],
[570.]]), array([[142.],
[597.]])]

>>>tracker.tracks[0].track_id
>>>100

>>>tracker.tracks[0].prediction
>>>array([[116.],
[491.]])
详见源码1. 效果如开篇上图。

核心代码：

# -*- coding: utf-8 -*-
# 可用于客流量统计，行人检测跟踪
#from tracker import Tracker
import copy
import colorsys
import os,sys,argparse,random,time

project = 'keras-yolov3-KF-objectTracking' # 工作项目根目录
sys.path.append(os.getcwd().split(project)[0] + project)

from timeit import default_timer as timer
import cv2
import numpy as np
from keras import backend as K
from keras.models import load_model
from keras.layers import Input
from PIL import Image, ImageFont, ImageDraw

from yolo3.model import yolo_eval, yolo_body, tiny_yolo_body
from yolo3.utils import letterbox_image
from keras.utils import multi_gpu_model
from yolo_matt import YOLO, detect_video

from tqdm import tqdm
from scipy import misc

from objecttracker.KalmanFilterTracker import Tracker # 加载卡尔曼滤波函数

def calc_center(out_boxes,out_classes,out_scores,score_limit = 0.5):
outboxes_filter = []
for x,y,z in zip(out_boxes,out_classes,out_scores):
if z > score_limit:
if y == 0: # 0:person ,coco_classes.txt
outboxes_filter.append(x)

centers= []
number = len(outboxes_filter)
for box in outboxes_filter:
top, left, bottom, right = box
center=np.array([[(left+right)//2],[(top+bottom)//2]])
centers.append(center)
return centers,number

def get_colors_for_classes(num_classes):
"""Return list of random colors for number of classes given."""
# Use previously generated colors if num_classes is the same.
if (hasattr(get_colors_for_classes, "colors") and
len(get_colors_for_classes.colors) == num_classes):
return get_colors_for_classes.colors

hsv_tuples = [(x / num_classes, 1., 1.) for x in range(num_classes)]
colors = list(map(lambda x: colorsys.hsv_to_rgb(*x), hsv_tuples))
colors = list(
map(lambda x: (int(x[0] * 255), int(x[1] * 255), int(x[2] * 255)),
colors))
#colors = [(255,99,71) if c==(255,0,0) else c for c in colors ] # 单独修正颜色，可去除
random.seed(10101) # Fixed seed for consistent colors across runs.
random.shuffle(colors) # Shuffle colors to decorrelate adjacent classes.
random.seed(None) # Reset seed to default.
get_colors_for_classes.colors = colors # Save colors for future calls.
return colors

def trackerDetection(tracker,image,centers,number,max_point_distance = 30,max_colors = 20,track_id_size = 0.8):
'''
- max_point_distance为两个点之间的欧式距离不能超过30
- 有多条轨迹,tracker.tracks;
- 每条轨迹有多个点,tracker.tracks[i].trace
- max_colors,最大颜色数量
- track_id_size,每个
'''
#track_colors = [(255, 0, 0), (0, 255, 0), (0, 0, 255), (255, 255, 0),
# (0, 255, 255), (255, 0, 255), (255, 127, 255),
# (127, 0, 255), (127, 0, 127)]
track_colors = get_colors_for_classes(max_colors)

result = np.asarray(image)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(result, str(number), (20, 40), font, 1, (0, 0, 255), 5) # 左上角，人数计数

if (len(centers) > 0):
# Track object using Kalman Filter
tracker.Update(centers)
# For identified object tracks draw tracking line
# Use various colors to indicate different track_id
for i in range(len(tracker.tracks)):
# 多个轨迹
if (len(tracker.tracks[i].trace) > 1):
x0,y0 = tracker.tracks[i].trace[-1][0][0],tracker.tracks[i].trace[-1][1][0]
cv2.putText(result,str(tracker.tracks[i].track_id),(int(x0),int(y0)),font,track_id_size,(255, 255, 255),4)
# (image,text,(x,y),font,size,color,粗细)
for j in range(len(tracker.tracks[i].trace) - 1):
#每条轨迹的每个点
# Draw trace line
x1 = tracker.tracks[i].trace[j][0][0]
y1 = tracker.tracks[i].trace[j][1][0]
x2 = tracker.tracks[i].trace[j + 1][0][0]
y2 = tracker.tracks[i].trace[j + 1][1][0]
clr = tracker.tracks[i].track_id % 9
distance = ((x2 - x1)** 2 + (y2 - y1)**2)**0.5
if distance < max_point_distance:
cv2.line(result, (int(x1), int(y1)), (int(x2), int(y2)),
track_colors[clr], 4)
return tracker,result

def main(yolo_test):
# Definition of the parameters

path = "video_demo/tracking.avi"
tracker = Tracker(100, 8, 15, 100)

writeVideo_flag = True

cap = cv2.VideoCapture(path) # path
n = 0
if writeVideo_flag:
# Define the codec and create VideoWriter object
w = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
h = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter('output.avi', fourcc, 15, (w, h))

fps = 0.0
while True:
ret, frame = cap.read() # frame shape 640*480*3
if ret != True:
break
t1 = time.time()

image = Image.fromarray(frame)
r_image, out_boxes, out_scores, out_classes = yolo_test.detect_image(image)
print("box_num:",len(out_boxes))

#print(out_classes)

centers, number = calc_center(out_boxes, out_classes, out_scores, score_limit=0.6)
tracker, result = trackerDetection(tracker, r_image, centers, number, max_point_distance=20)

cv2.imshow('', result)

if writeVideo_flag:
# save a frame
out.write(result)

fps = (fps + (1. / (time.time() - t1))) / 2
print("fps= %f" % (fps))

# Press Q to stop!
if cv2.waitKey(1) & 0xFF == ord('q'):
break

print('Down!')
cap.release()
if writeVideo_flag:
out.release()
cv2.destroyAllWindows()

if __name__ == '__main__':
# 加载keras yolov3 voc预训练模型
yolo_test_args = {
"model_path": 'model_data/yolo.h5',
"anchors_path": 'model_data/yolo_anchors.txt',
"classes_path": 'model_data/coco_classes.txt',
"score" : 0.3,
"iou" : 0.45,
"model_image_size" : (416, 416),
"gpu_num" : 1,
}


yolo_test = YOLO(**yolo_test_args)
main(yolo_test)

'''
解析方式一：从视频保存成的图像文件中进行解析
先把视频-> 拆分成图像文件夹，在文件夹中逐帧解析


tracker = Tracker(100, 8, 15, 100)
for n in tqdm(range(100)):
image = Image.open('video_demo/video2jpg1/%s.jpg'%n)
r_image,out_boxes, out_scores, out_classes = yolo_test.detect_image(image)
centers,number = calc_center(out_boxes,out_classes,out_scores,score_limit = 0.5)
tracker,result = trackerDetection(tracker,r_image,centers,number)
misc.imsave('video_demo/jpg2video/%s.jpg'%n, result)
'''

'''
解析方式二：视频流直接解析
直接读取视频流，并保存在某一个文件夹之中

# 视频 -> 图像
path = "video_demo/tracking.avi"
tracker = Tracker(100, 8, 15, 100)

cap = cv2.VideoCapture(path)
n = 0
while(True):
ret, frame = cap.read()
if frame is None:
break
image = Image.fromarray(frame )
r_image,out_boxes, out_scores, out_classes = yolo_test.detect_image(image)
centers,number = calc_center(out_boxes,out_classes,out_scores,score_limit = 0.6)
tracker,result = trackerDetection(tracker,r_image,centers,number,max_point_distance = 20)
#misc.imsave('unilever/grom_pic/%s.jpg'%n, result)
cv2.imwrite('video_demo/tracking/%s.jpg'%n,result, [int(cv2.IMWRITE_JPEG_QUALITY), 100] )
n += 1
print('Down!')
'''

'''
辅助函数
图像文件夹直接变为视频并保存

# 图像 -> 视频
def get_file_names(search_path):
for (dirpath, _, filenames) in os.walk(search_path):
for filename in filenames:
yield filename#os.path.join(dirpath, filename)


def save_to_video(output_path,output_video_file,frame_rate):
list_files = sorted([int(i.split('_')[-1].split('.')[0]) for i in get_file_names(output_path)])
# 拿一张图片确认宽高
img0 = cv2.imread(os.path.join(output_path,'%s.jpg'%list_files[0]))
#print(img0)
height , width , layers = img0.shape
# 视频保存初始化 VideoWriter
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
videowriter = cv2.VideoWriter(output_video_file,fourcc, frame_rate, (width,height))
# 核心，保存的东西
for f in list_files:
f = '%s.jpg'%f
#print("saving..." + f)
img = cv2.imread(os.path.join(output_path, f))
videowriter.write(img)
videowriter.release()
cv2.destroyAllWindows()
print('Success save %s!'%output_video_file)
pass

# 图片变视频
output_dir='video_demo/tracking/'
output_path= os.path.join(output_dir, '') # 输入图片存放位置
output_video_file = 'video_demo/tracking_100_8_6_100_optimization_fps20.mp4' # 输入视频保存位置以及视频名称
save_to_video(output_path,output_video_file,20)
'''

接下来看看Fall-detection效果：

核心代码：

# -*- coding: utf-8 -*-
# 基于yolov3的行人跌倒检测 by gavin

import colorsys
import os, sys, random, time

import cv2
import numpy as np

from PIL import Image, ImageFont, ImageDraw

from yolo_matt import YOLO, detect_video

from objecttracker.KalmanFilterTracker import Tracker # 加载卡尔曼滤波函数

def calc_center(out_boxes, out_classes, out_scores, score_limit=0.5):
outboxes_filter = []
for x, y, z in zip(out_boxes, out_classes, out_scores):
if z > score_limit:
if y == 0:
outboxes_filter.append(x)

centers = []
number = len(outboxes_filter)
for box in outboxes_filter:
top, left, bottom, right = box
center = np.array([[(left + right) // 2], [(top + bottom) // 2]])
centers.append(center)
return centers, number

def get_colors_for_classes(num_classes):
"""Return list of random colors for number of classes given."""
# Use previously generated colors if num_classes is the same.
if (hasattr(get_colors_for_classes, "colors") and
len(get_colors_for_classes.colors) == num_classes):
return get_colors_for_classes.colors

hsv_tuples = [(x / num_classes, 1., 1.) for x in range(num_classes)]
colors = list(map(lambda x: colorsys.hsv_to_rgb(*x), hsv_tuples))
colors = list(
map(lambda x: (int(x[0] * 255), int(x[1] * 255), int(x[2] * 255)),
colors))
# colors = [(255,99,71) if c==(255,0,0) else c for c in colors ] # 单独修正颜色，可去除
random.seed(10101) # Fixed seed for consistent colors across runs.
random.shuffle(colors) # Shuffle colors to decorrelate adjacent classes.
random.seed(None) # Reset seed to default.
get_colors_for_classes.colors = colors # Save colors for future calls.
return colors

def trackerDetection(tracker, image, centers, number, max_point_distance=30, max_colors=20, track_id_size=0.8):
'''
- max_point_distance为两个点之间的欧式距离不能超过30
- 有多条轨迹,tracker.tracks;
- 每条轨迹有多个点,tracker.tracks[i].trace
- max_colors,最大颜色数量
- track_id_size,每个
'''
# track_colors = [(255, 0, 0), (0, 255, 0), (0, 0, 255), (255, 255, 0),
# (0, 255, 255), (255, 0, 255), (255, 127, 255),
# (127, 0, 255), (127, 0, 127)]
track_colors = get_colors_for_classes(max_colors)

result = np.asarray(image)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(result, str(number), (20, 40), font, 1, (0, 0, 255), 5) # 左上角，人数计数

if (len(centers) > 0):
# Track object using Kalman Filter
tracker.Update(centers)
# For identified object tracks draw tracking line
# Use various colors to indicate different track_id
for i in range(len(tracker.tracks)):
# 多个轨迹
if (len(tracker.tracks[i].trace) > 1):
x0, y0 = tracker.tracks[i].trace[-1][0][0], tracker.tracks[i].trace[-1][1][0]
cv2.putText(result, str(tracker.tracks[i].track_id), (int(x0), int(y0)), font, track_id_size,
(255, 255, 255), 4)
# (image,text,(x,y),font,size,color,粗细)
for j in range(len(tracker.tracks[i].trace) - 1):
# 每条轨迹的每个点
# Draw trace line
x1 = tracker.tracks[i].trace[j][0][0]
y1 = tracker.tracks[i].trace[j][1][0]
x2 = tracker.tracks[i].trace[j + 1][0][0]
y2 = tracker.tracks[i].trace[j + 1][1][0]
clr = tracker.tracks[i].track_id % 9
distance = ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
if distance < max_point_distance:
cv2.line(result, (int(x1), int(y1)), (int(x2), int(y2)),
track_colors[clr], 4)
return tracker, result

def isFall(w, h):
if float(w) / h >= 0.9:# 1.1
return True
else:
return False

def main(yolo_test):
# Definition of the parameters

path = 'video_demo/cs4.mp4' # "video_demo/tracking.avi", 'video_demo/cs4.mp4' 'video_demo/faint7.avi'
tracker = Tracker(100, 8, 15, 100)

writeVideo_flag = True

# begin:open the input video file
input_movie = cv2.VideoCapture(path) # 'cs4.mp4' faint7.avi

length = int(input_movie.get(cv2.CAP_PROP_FRAME_COUNT))
# Create an output movie file (make sure resolution/frame rate matches input video!)
# get fps the size
fps = input_movie.get(cv2.CAP_PROP_FPS)
size = (int(input_movie.get(cv2.CAP_PROP_FRAME_WIDTH)),
int(input_movie.get(cv2.CAP_PROP_FRAME_HEIGHT)))

# define the type of the output movie
output_movie = cv2.VideoWriter('out_fall_detect.avi', cv2.VideoWriter_fourcc(*'MJPG'), fps, size)

res = []
frame_number = 0
while True:
# Grab a single frame of video
ret, frame = input_movie.read()
frame_number += 1

# Quit when the input video file ends
if not ret:
break
'''
# detect per 2 frame
if frame_number%2==0:
continue
'''
# append all the coordinate of the detected person to res
image = Image.fromarray(frame)
start = time.time()
# yolov3 detector
r_image, out_boxes, out_scores, out_classes = yolo_test.detect_image(image)
print("box_num:", len(out_boxes))

centers, number = calc_center(out_boxes, out_classes, out_scores, score_limit=0.6)
# number :人数统计
tracker, result = trackerDetection(tracker, r_image, centers, number, max_point_distance=20)

# cv2.imshow('', result)

# 以下添加跌倒检测算法
res = []

for i, c in list(enumerate(out_classes)): #eg:output: [0 0 0 0 0 2 2 7]
predicted_class = yolo_test.class_names[c] # 0：person,2:car,...
box = out_boxes[i]
score = out_scores[i]

top, left, bottom, right = box
x, y = (left + right) // 2,(top + bottom) // 2
w = abs(right - left)
h = abs(bottom - top)
res.append((predicted_class, score, (x, y, w, h)))

res = sorted(res, key=lambda x: -x[1])

print('the whole running time is: ' + str(time.time() - start))
resAll = []
for item in res:
if item[0] == 'person' or item[0] == 'dog' or item[0] == 'cat' or item[0] == 'horse': # item[0] == 'dog'
resAll.append(item)
# if multiple exist, and there also contains person, preserve person only!
print('--------------')
#print(resAll)

# get the max rectangle
result = []
maxArea = 0
if len(resAll) > 1:
for item in resAll:
if item[2][2] * item[2][3] > maxArea:
maxArea = item[2][2] * item[2][3]
result = item
elif len(resAll) == 1:
result = resAll[0]
# draw the result
if (len(result) > 0):
# label the result
left = int(result[2][0] - result[2][2] / 2)
top = int(result[2][1] - result[2][3] / 2)
right = int(result[2][0] + result[2][2] / 2)
bottom = int(result[2][1] + result[2][3] / 2)

# whether fall?
if isFall(result[2][2], result[2][3]):
cv2.rectangle(frame, (left, top), (right, bottom), (0, 0, 255), 2)

# Draw a label with a name below the face
cv2.rectangle(frame, (left, bottom - 25), (right, bottom), (0, 0, 255))
font = cv2.FONT_HERSHEY_DUPLEX
cv2.putText(frame, 'Warning!!!', (left + 6, top - 6), font, 2, (255, 0, 0), 3)
else:
cv2.rectangle(frame, (left, top), (right, bottom), (255, 0, 0), 2)

# label the result
for item in resAll: # res:所有检测到的结果；resPerson：仅仅记录人
# Draw a box around the face
name = item[0]

left = int(item[2][0] - item[2][2] / 2)
top = int(item[2][1] - item[2][3] / 2)
right = int(item[2][0] + item[2][2] / 2)
bottom = int(item[2][1] + item[2][3] / 2)
cv2.rectangle(frame, (left, top), (right, bottom), (0, 0, 255), 2)
# Draw a label with a name below the face
cv2.rectangle(frame, (left, bottom - 25), (right, bottom), (0, 0, 255))
font = cv2.FONT_HERSHEY_DUPLEX
if name == 'person':
cv2.putText(frame, name, (left + 6, bottom - 6), font, 0.5, (255, 255, 255), 1)

# Display the result
cv2.imshow('Fall detection', frame)
# Write the resulting image to the output video file
print("Writing frame {} / {}".format(frame_number, length))
if writeVideo_flag:
# save a frame
output_movie.write(frame)

# Hit 'q' on the keyboard to quit!
if cv2.waitKey(1) & 0xFF == ord('q'):
break

# All done!
print('All done!')
input_movie.release()
if writeVideo_flag:
output_movie.release()
cv2.destroyAllWindows()

if __name__ == '__main__':
# 加载keras yolov3 voc预训练模型
yolo_test_args = {
"model_path": 'model_data/yolo.h5',
"anchors_path": 'model_data/yolo_anchors.txt',
"classes_path": 'model_data/coco_classes.txt',
"score": 0.3,
"iou": 0.45,
"model_image_size": (416, 416),
"gpu_num": 1,
}

yolo_test = YOLO(**yolo_test_args)
main(yolo_test)

源码参考1：https://github.com/mattzheng/keras-yolov3-KF-objectTracking

源码参考2：https://github.com/qiaoguan/Fall-detection

源码参考3：https://github.com/Qidian213/deep_sort_yolov3

python可應用在金融分析的那一個方面，如何部署在linux server上面。蠟筆小新工程師金融
Python在金融分析中應用廣泛，以下是幾個主要方面：###1.**數據處理與分析**-使用**Pandas**和**NumPy**等庫來處理和分析大規模數據集，進行清理、轉換和統計運算。-舉例：處理歷史市場數據，分析價格趨勢、交易量等。###2.**機器學習與預測**-使用**scikit-learn**、**TensorFlow**或**PyTorch**建立模型進行股票價格預測、信用風險評估
tensorflow keras 报错：No gradients provided for any variable 原因与解决办法研志必有功 tensorflow报错 tensorflow 深度学习机器学习神经网络自然语言处理
错误分析Nogradientsprovidedforanyvariable这个意思是没有梯度给已知的所有函数，为什么会出现这个错误呢，因为在深度学习中，梯度的更新是由于反向传播算法的实现的，如果损失函数没有与已知的任何（除输入）层关联，那么，损失函数就无法求出关于各个函数的梯度，导致错误解决办法例如损失函数defcontrastive_loss_layer(left_inputs,right_in
TensorFlow的基本框架和理解-初学者通过这一篇文章就够了无人不智能，机器不学习 TensorFlow TensorFlow 基本框架 python
tensorflow的理解Tensorflow是一种机器学习框架，如果我们有大量的数据，我们可以利用他协助医生检查糖尿病性视网膜病变来预防患者失明等应用新版本中一个有趣的功能是eagerexecution，允许用户在不创建图形的情况下运行tensorflow代码，一种动态图机制它是一个命令式、由运行定义的接口，一旦从Python被调用，其操作立即被执行。这使得入门TensorFlow变的更简单，也
Python 在 AI 领域的应用：从零构建你的第一个 AI 模型嵌入式Jerry Python python 人工智能开发语言嵌入式硬件 windows ubuntu
引言人工智能（AI）已经成为现代科技的核心，而Python是AI领域最受欢迎的编程语言之一。其强大的库和框架，如TensorFlow、PyTorch、scikit-learn，使AI开发变得更加简单高效。本文将带你深入理解Python在AI中的应用，并通过机器学习（MachineLearning）和深度学习（DeepLearning）的实际示例，讲解如何构建一个AI模型。1.Python为什么适合
介绍 TensorFlow 的基本概念和使用场景。大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
TensorFlow是一个由谷歌开发的开源机器学习框架，广泛应用于深度学习领域。它提供了一个灵活的平台，可以用于构建各种机器学习模型，包括神经网络。TensorFlow的基本概念和使用场景如下：张量（Tensor）：TensorFlow中的基本数据结构就是张量，可以简单理解为多维数组。张量可以是标量（0维张量）、向量（1维张量）、矩阵（2维张量）等。在TensorFlow中，所有数据都以张量的形式
蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
深圳传音控股AI算法岗内推飞300 人工智能 python java 业界资讯
1扎实的数学基础，熟练掌握机器学习相关的数学知识。2熟悉常用的机器学习算法，掌握常用的深度学习模型与编程实践。3熟悉Pytorch或TensorFlow等深度学习框架，有一定项目经验。4良好的沟通协调能力，执着的专业精神。5参与部门AI创新项目，包括自动化测试平台、BPM流程管理等项目开发登录链接：transsion.zhiye.com/campus/jobs填写我的推荐码：EVHPB3投递，简历
Python图片识别脚本：从零开始实现图像识别！ Python_trys python 开发语言编程 Python入门 Python基础 Python识别 Python学习
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。1.环境准备在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：pipinsta
python库下载——清华源爱吃鱼的猫℡ python
pipinstalltensorflow-ihttps://pypi.tuna.tsinghua.edu.cn/simple/这段代码是用来通过pip安装TensorFlow库的命令，其中包含了以下内容：pipinstalltensorflow:这部分命令告诉pip工具去安装名为TensorFlow的Python库。-ihttps://pypi.tuna.tsinghua.edu.cn/simpl
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
深度学习进阶：TensorFlow实战指南 ELSON麦香包
本文还有配套的精品资源，点击获取简介：《TensorFlow实战Google深度学习框架》详细指导读者学习TensorFlow，涵盖基础概念、数据流图、API使用、张量和变量操作，深度学习基础如CNN和RNN，以及自定义层和优化算法。书中还提供使用TensorFlow构建和训练深度学习模型的实例，包括AlexNet、VGG、ResNet以及LSTM和GRU，并通过图像分类和文本情感分析等实战案例，
TensorFlow.js - 使用 CNN(卷积神经网络) 识别手写数字宁静_致远_ 前端开发 javascript tensorflow cnn
目录index.htmldata.jsscript.js备注参考文献index.htmlTensorFlow.jsTutorialdata.js/***@license*Copyright2018GoogleLLC.AllRightsReserved.*LicensedundertheApacheLicense,Version2.0(the"License");*youmaynotusethisf
Python深度学习之路：TensorFlow与PyTorch对比步入烟尘 Python超入门指南全册 python 深度学习 tensorflow
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
深度学习实战：TensorFlow 开源项目指南劳治亮
深度学习实战：TensorFlow开源项目指南Deep-Learning-TensorFlow项目地址:https://gitcode.com/gh_mirrors/dee/Deep-Learning-TensorFlow项目介绍本项目基于GitHub仓库https://github.com/blackecho/Deep-Learning-TensorFlow.git，旨在提供一个全面的学习与开发
卷积神经网络应用-训练手写体数字数据集并展示识别精度 yeahamen 深度学习 python 机器学习卷积神经网络手写体数字识别
#卷积神经网络(CNN)训练手写体数据集importnumpyasnpimportmatplotlib.pyplotaspltimporttensorflow.kerasaskaimportdatetime#python3.X版本显示图片还需导入此库importpylabnp.random.seed(0)#定义加载数据集函数defload_data_npz(path):#np.load文件可以加载
深度学习实战：用TensorFlow构建高效CNN的完整指南芯作者 DD：日记深度学习
一、为什么每个开发者都要掌握CNN？在自动驾驶汽车识别路标的0.1秒里，在医疗AI诊断肺部CT片的精准分析中，甚至在手机相册自动分类宠物的日常场景里，卷积神经网络（CNN）正悄然改变着我们的世界。本文将以工业级实践标准，带您从零构建一个在CIFAR-10数据集上达到90%+准确率的CNN模型，深入解析TensorFlow2.x的最新特性，并揭秘模型优化的七大核心策略。[外链图片转存失败,源站可能有
TensorFlow\Keras实战100例——BP\CNN神经网络~MINST手写数字识别 AI街潜水的八角 tensorflow 人工智能 python
一.原理说明BP神经网络是一种多层的前馈神经网络，其主要的特点是：信号是前向传播的，而误差是反向传播的。具体来说，对于如下的只含一个隐层的神经网络模型：BP神经网络的过程主要分为两个阶段，第一阶段是信号的前向传播，从输入层经过隐含层，最后到达输出层；第二阶段是误差的反向传播，从输出层到隐含层，最后到输入层，依次调节隐含层到输出层的权重和偏置，输入层到隐含层的权重和偏置。卷积神经网络（Convolu
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
深度学习day1 孤城laugh 深度学习人工智能笔记学习机器学习
深度学习day11.深度学习与机器学习的区别1.1特征提取方面1.2数据量与计算性能要求1.3算法代表2.深度学习框架之TensorFlow2.1TensorFlow基础2.2TensorFlow基础知识1.**张量（Tensor）**：多维数组、多维列表2.**变量（Variable）**：用于表示程序处理的共享持久状态3.**图与函数**4.**可视化学习（TensorBoard）**：用来展
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！ ai大模型应用开发人工智能 pdf 机器学习面试 AI
在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进行学习。一、前置阶段数学：线性代数、高等数学自然语言处理：Word2Vec、Seq2SeqPython：Pyotch、Tensorflow二、基
tensorflow Serving架构详解和代码示例 lloyd_chou 算法 ml 机器翻译智慧城市边缘计算人工智能
本文介绍tensorflowServing的原理和代码实现,并提供简要的代码阅读指导.如何serve一个模型具体的步骤可以参考官方文档.主要包括两个部分：1.导出模型1.启动服务需要说明的是导出模型部分.如果要把我们训练的模型拿来提供服务,除了模型本身外,还需要一些额外的信息,比如模型的名称,输入、输出对应的tensor信息,方法名,这些东西可以让TFS进行请求数据的格式检查以及目标模型查找.这就
TensorFlow框架介绍 Leo_WHU tensorflow 人工智能 python
一、TF数据流图1.TensorFlow结构分析一个构件图阶段流程图：定义数据（张量tensor）和操作（operation）一个执行图阶段调用各方资源，讲讲定义好的数据和操作运行起来2.数据流图TensorFlowTesnsor-张量-数据Flow-流动3.图与tensorboard3.1什么是图结构图结构：数据+操作3.2图相关操作3.2.1默认图查看默认图的方法1）调用方法用tf.get_d
基于tensorflow使用VGG16实现猫狗识别 Jakari tensorflow python
importtensorflowastfimportnumpyasnpfromtensorflow.kerasimportlayers,models,optimizersfromtensorflow.keras.preprocessing.imageimportImageDataGenerator#定义VGG16模型classVGG16(tf.keras.Model):def__init__(se
llama-factory ||启智平台失眠的树亚服务器 llama
1.在启智平台上找到没有安装tensorflow的镜像作为基础镜像把llama-factory的github仓库进行下载，得到zip压缩包，上传到启智平台中，如下：2.执行命令如下进入文件夹cdLLaMA-Factory-main更新pippython-mpipinstall--upgradepip安装依赖：pipinstall-e'.[torch,metrics]'-ihttps://pypi.
聚类分析tensorflow实例_新手必看的机器学习算法集锦（聚类篇）道酝欣赏
继上一篇《机器学习算法之分类》中大致梳理了一遍在机器学习中常用的分类算法，类似的，这一姊妹篇中将会梳理一遍机器学习中的聚类算法，最后也会拓展一些其他无监督学习的方法供了解学习。1.机器学习机器学习是近20多年兴起的一门多领域交叉学科，它涉及到概率论、统计学、计算机科学以及软件工程等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类能从数据中自动分析获得规律
2024 最新计算机视觉学习路线（入门篇）_计算机视觉课程主线 m0_60721823 计算机视觉学习人工智能
Python是机器学习项目中最流行的编程语言之一，因为与Java和C++等其他编程语言相比，它简单易读。Python附带了许多可以加快开发速度的库，其中一些重要的库是OpenCV、TensorFlow、PyTorch等，它们专门用于图像处理相关任务。本文旨在向初学者介绍这一领域，为他们提供有关涉及图像的机器学习应用程序背后概念的基本知识，并从高层次的角度深入了解这些库如何在底层协同工作，以便他们在
ModuleNotFoundError: No module named ‘tensorflow‘ 赛博曹操 BUG题解 pip pycharm 数据分析数据挖掘 python
ModuleNotFoundError:Nomodulenamed‘tensorflow‘欢迎联系博主——这里是赛博曹操https://bbs.csdn.net/topics/619568415Anaconda安装TensorFlow之后，通过Jupyter运行，出现错误ImportError:Nomodulenamed‘tensorflow’.解决办法就一句：pipinstalltensorfl
深度学习框架之主流学习框架 uu1224 深度学习学习人工智能机器学习神经网络
深度学习框架是一类专门设计用来简化和加速神经网络模型开发过程的软件工具。它们提供了构建、训练和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点：TensorFlow：由Google开发，是一个广泛使用的开源深度学习框架。它以强大的图计算模型和分布式计算能力著称，并且通过高级API如Keras，为用户提供了易于上手的开发体验。PyTorch：由Facebook开发，以其动态计算图
ValueError: Tensor conversion requested dtype int64 for Tensor with dtype float64: ‘Tensor(“loss/a 初识-CV 机器学习 keras KL散度相对熵 int TensorFlow keras
用keras以TensorFlow作为后端重写相对熵函数，报错。。。defKL(y_true,y_pred):weights=K.sum(K.cast(K.argmax(y_true,axis=1)*K.log(K.argmax(y_true,axis=1)/K.argmax(y_pred,axis=1)),dtype='float32'))returnweights*losses.categor
从零到一：利用DeepSeek构建高精度图像分类模型实战解析一碗黄焖鸡三碗米饭人工智能前沿与实践分类数据挖掘人工智能
引言：为什么选择DeepSeek进行图像分类？在计算机视觉领域，图像分类作为基础任务，其技术演进经历了从传统特征工程到深度学习的革命性转变。DeepSeek作为国产自研的深度学习框架，凭借其高效计算优化和灵活架构设计，在ImageNet等基准测试中展现出与PyTorch、TensorFlow等主流框架相媲美的性能。本文将手把手带您实现从零搭建工业级图像分类模型的全过程。一、DeepSeek技术架构
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

基于YOLOv3+Kalman-Filter实现Multi-target tracking

你可能感兴趣的:(Tensorflow)