weixin_39997695

图像篡改检测 python_GitHub - Allenem/graduation-design: 本科毕业设计：针对Deepfake假脸视频面部细节特征的提取算法...

针对Deepfake假脸视频面部细节特征的提取算法

一、仓库说明

│ LICENSE # 许可说明

│ README.md # 简介

│

├─References # 参考文献

├─FeatureExtractionLearning # 学习特征提取代码文件夹

├─DatabasePreprocessing # 数据库预处理：图片提取人脸，视频分帧存图提取人脸

├─DatabaseFeatureExtraction # 提取 Celeba PGGAN DFD 数据集人脸特征代码文件夹

├─SVM # 学习SVM分类器，分类器实现人脸判别代码文件夹

├─screenshots # 一些截图

└─Paper # 我的论文

二、工作计划

1.数据库分配

学生

真脸

GAN假脸数据库

Deepfake数据库

JYT

FFHQ(0-35000)

styleGAN2

TIMIT

Celeba(train)

styleGAN

DFDC

FFHQ(35001-70000)

starGAN

faceforensic

Celeba(validation,test)

PGGAN

DeepfakeDetection

2.特征分配

学生

特征

JYT

1、局部二值模式LBP 2、方向梯度直方图HOG 3、SRM残差图像

1、共生矩阵 2、光流场 3、LPQ特征

1、直方图/共生矩阵 2、拉普拉斯变换均方差 3、小波变换频率直方图

1、颜色直方图 2、Surf 3、错误级别分析(Error level analysis，ELA)

3.工作计划

起止时间

工作内容

备注

2020.01-2020.02

调研和资料分析

2020.01-2020.02

数据库预处理

视频分帧、人脸提取及定位

2020.02-2020.03

提取人脸特征、检测GAN真假脸图像差异

隐写分析特征或者图像篡改特征

2020.03-2020.04

Deepfake换脸视频检测算法实现

SVM分类器等不同分类器

2020.04-2020.05

完成毕业论文

三、调研和资料分析

1.参考文献

……

2.我自己的中文翻译

3.Python学习和人脸检测学习

OpenCV，dlib，face_recognition 实现人脸检测，标志检测等实验小测试： https://github.com/Allenem/PyTest

四、学习特征提取

1、颜色直方图

1.1 matplotlib画图像变色问题

在使用opencv配合jupyter notebook调试，其中常常使用matplotlib来显示图像

import cv2

import numpy as np

import matplotlib.pyplot as plt

image = cv2.imread("image.jpg")

# 后面的方法都从此处开始更改

plt.subplot(),plt.imshow(image),plt.title('Input')

plt.show()

但是在实际使用过程中，我们会发现plt.imshow()后出现的图形变成了负片，这是因为cv2.imshow()与plt.imshow()的通道顺序不同产生的，前者BGR，后者RGB。

解决方法一：

b, g, r = cv2.split(image)

image_new = cv2.merge([r, g, b])

plt.subplot(),plt.imshow(image_new),plt.title('Input')

plt.show()

解决方法二：

image_new = np.flip(original_img,axis = 2)

plt.subplot(),plt.imshow(image_new),plt.title('Input')

plt.show()

解决方法三：

image_new = image[:,:,::-1]

plt.subplot(),plt.imshow(image_new),plt.title('Input')

plt.show()

当然cv2自己显示没有问题，它的颜色顺序是BGR

import cv2

import numpy as np

image = cv2.imread("image.jpg")

cv2.imshow("Img", image)

cv2.waitKey(0)

cv2.destroyAllWindows()

1.2 histogram.py 和 histogram3lines.py 效果图

2、Surf

2.1 SURF简介

SURF(Speeded Up Robust Features) 加速鲁棒特征。正如其名，它是加速版本的 SIFT(Scale-invariant feature transform) 尺度不变特征转换。

它善于处理具有模糊和旋转的图像，但是不善于处理视角变化和光照变化。在SIFT中使用高斯微分 DoG(Difference of Gaussian) 对高斯拉普拉斯算子 LoG(Laplacian of Gaussian) 进行近似，而在SURF中使用盒子滤波器 Box Filter 对 LoG 进行近似，这样就可以使用积分图像了(计算图像中某个窗口内所有像素和时，计算量的大小与窗口大小无关)。总之，SURF最大的特点在于采用了 Haar特征以及积分图像的概念，大大加快了程序的运行效率。

2.2 SURF小实验和效果图

① 创建一个SURF对象

cv2.xfeatures2d.SURF_create(, hessianThreshold, nOctaves, nOctaveLayers, extended, upright)

hessianThreshold：默认100，关键点检测的阈值，越高监测的点越少

nOctaves：默认4，金字塔组数

nOctaveLayers：默认3，每组金子塔的层数

extended：默认False，扩展描述符标志，True表示使用扩展的128个元素描述符，False表示使用64个元素描述符。

upright：默认False，垂直向上或旋转的特征标志，True表示不计算特征的方向，False-计算方向。

之后也可以通过类似getHessianThreshold()，setHessianThreshold()等函数来获取或修改上述参数值，例如

surf.setHessianThreshold(True) 表示将HessianThreshold参数修改为True。

② 绘制特征点

cv2.drawKeypoint(image, keypoints, outImage, color, flags)

或：

outImage = cv2.drawKeypoint(image, keypoints, None, color, flags)

image：输入图像

keypoints：上面获取的特征点

outImage：输出图像

color：颜色，默认为随机颜色，顺序为BGR

flags：绘制点的模式，有以下四种模式

cv2.DRAW_MATCHES_FLAGS_DEFAULT：

默认值，只绘制特征点的坐标点,显示在图像上就是一个个小圆点,每个小圆点的圆心坐标都是特征点的坐标。

cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS：

绘制特征点的时候绘制的是带有方向的圆,这种方法同时显示图像的坐标,size，和方向,是最能显示特征的一种绘制方式。

cv2.DRAW_MATCHES_FLAGS_DRAW_OVER_OUTIMG：

只绘制特征点的坐标点,显示在图像上就是一个个小圆点,每个小圆点的圆心坐标都是特征点的坐标。

cv2.DRAW_MATCHES_FLAGS_NOT_DRAW_SINGLE_POINT：

单点的特征点不被绘制

③ 调试

由于如下报错：

surf = cv2.xfeatures2d.SURF_create(30000)

cv2.error: OpenCV(4.2.0) C:\projects\opencv-python\opencv_contrib\modules\xfeatures2d\src\surf.cpp:1029: error: (-213:The function/feature is not implemented) This algorithm is patented and is excluded in this configuration; Set OPENCV_ENABLE_NONFREE CMake option and rebuild the library in function 'cv::xfeatures2d::SURF::create'

所以采取如下措施：

pip uninstall opencv-python

pip uninstall opencv-contrib-python

pip install opencv-python==3.4.2.16 -i "https://pypi.doubanio.com/simple/"

pip install opencv-contrib-python==3.4.2.16 -i "https://pypi.doubanio.com/simple/"

④ 代码文件

⑤ 效果图

3、错误级别分析(Error level analysis，ELA)

① 理论说明

ELA 全称：Error Level Analysis ，汉译为“错误级别分析”或者叫“误差分析”。通过检测特定压缩比率重新绘制图片后造成的误差分布，可用于识别JPEG图片的压缩。

Principe：Error Level Analysis (ELA) permits identifying areas within an image that are at different compression levels. With JPEG images, the entire picture should be at roughly the same level. If a section of the image is at a significantly different error level, then it likely indicates a digital modification.

原理：错误级别分析可以识别出一幅图片不同压缩率的地方。JPEG图像全图应该大约是相同的压缩率。如果图片的某一部分有非常突出的错误压缩率，则它可能被数字化更改过。

② 编程

为了引入 magic 文件类型识别，安装 python-magic-bin 库。

pip install -i http://mirrors.aliyun.com/pypi/simple/ python-magic-bin

代码文件：

带注释的代码

import os,sys

import magic

from PIL import Image, ImageChops, ImageEnhance

def ela(filename, output_path):

print("****ELA is starting****")

if magic.from_file(filename, mime=True) == "image/jpeg":

# set tmp_image's quality_level to be resaved

quality_level = 80

# get fileRealName,.postfix

(filerealname, extension) = os.path.splitext(os.path.basename(filename))

# set tmp_image & ela_image path

tmp_path = os.path.join(output_path,filerealname+"_tmp.jpg")

ela_path = os.path.join(output_path,filerealname+"_ela.jpg")

# resave image

image = Image.open(filename)

image.save(tmp_path, 'JPEG', quality=quality_level)

tmp_image = Image.open(tmp_path)

# return abs of difference

ela_image = ImageChops.difference(image, tmp_image)

# return (min,max) two-truples with RGB 3 elements, eg. ((0,255),(0,255),(0,255))

extrema = ela_image.getextrema()

# get the max of RGB max

max_diff = max([ex[1] for ex in extrema])

# set scale to enhance

scale = 255/max_diff

# 'Brightness' indicates we will brignten img

# 'enhance' indicates the scale of brightness

# An enhancement factor of 0.0 gives a black image. A factor of 1.0 gives the original image.

ela_image = ImageEnhance.Brightness(ela_image).enhance(scale)

ela_image.save(ela_path)

os.remove(tmp_path) # if remove this code, image will be resaved as tem_image and won't be removed.

print("****ELA has been completed****")

else:

print("ELA works only with JPEG")

if __name__ == "__main__":

filename = "./img/webOriginalImg.jpg"

output_path = "./img"

ela(filename, output_path)

③ 原图&效果图

第一组

原图

ELA高亮图

第二组

原图

网上的ELA高亮图

我自己做的ELA高亮图

第三组

图1

图2

差别

五、数据库预处理

1.提取人脸

采用 OpenCV 和 face_recognition 做对比，用15张图片做实验

代码一带注释最简版

# use OpenCV to detect face from images & save them

import cv2

import os

import time

resize_x = 256

resize_y = 256

cantFindFaceImgs = []

# Detect face rects

def detect(img, cascade, list):

rects = cascade.detectMultiScale(img, scaleFactor = 1.3, minNeighbors = 4,

flags = cv2.CASCADE_SCALE_IMAGE)

if len(rects) == 0:

print("I haven't found a face in %s"%(list))

cantFindFaceImgs.append(list)

return []

rects[:, 2:] += rects[:, :2]

return rects

if __name__ == '__main__':

start_time =time.clock()

# OpenCV Classifier

cascade = cv2.CascadeClassifier("E:\Program Files\Python\Python36\Lib\site-packages\opencv-master\data\haarcascades\haarcascade_frontalface_default.xml")

original_path = 'D:/Celeba/devel'

new_path = 'D:/Celeba_face/devel'

# os.listdir show all the filename(including extension)

imglist = os.listdir(original_path)

for list in imglist:

img = cv2.imread(original_path+'/'+list)

rects = detect(img, cascade, list)

if len(rects) == 0:

print(list)

for x1, y1, x2, y2 in rects:

face = img[y1:y2, x1:x2]

resized_face = cv2.resize(face,(resize_x, resize_y))

# Save new img, named as original name in new directory, then we can find which are not be detected

cv2.imwrite(new_path+'/CV_'+list, resized_face)

end_time = time.clock()

print("I haven't found a face in these images: %s"%(cantFindFaceImgs))

print('Running time using OpenCV is: %s Seconds'%(end_time-start_time))

代码二带注释最简版

# use face-recognition to detect face from images & save them

from PIL import Image

import face_recognition

import os

import time

resize_x = 256

resize_y = 256

cantFindFaceImgs = []

# Detect face rects

def detect(img, new_path, list):

image = face_recognition.load_image_file(img)

face_locations = face_recognition.face_locations(image)

if len(face_locations) == 0:

print("I haven't found a face in %s"%(list))

cantFindFaceImgs.append(list)

return []

for i,face_location in enumerate(face_locations):

# Get the location of each face in this image

top, right, bottom, left = face_location

face_image = image[top:bottom, left:right]

pil_image = Image.fromarray(face_image)

resized_face = pil_image.resize((resize_x, resize_y))

(filename, extension) = os.path.splitext(list)

resized_face.save(new_path+'/FR_'+filename+'_'+str(i)+extension)

if __name__ == '__main__':

start_time =time.clock()

original_path = 'D:/Celeba/devel'

new_path = 'D:/Celeba_face/devel'

# os.listdir show all the filename(including extension)

imglist = os.listdir(original_path)

for list in imglist:

img = original_path+'/'+list

detect(img, new_path, list)

end_time = time.clock()

print("I haven't found a face in these images: %s"%(cantFindFaceImgs))

print('Running time using Face-recognition is: %s Seconds'%(end_time-start_time))

输出如下：

> python findfaceCV.py

Running time using OpenCV is: 6.6083549 Seconds

> python findfaceFR.py

Running time using Face-recognition is: 9.850284 Seconds

识别截图如下：

由此可见： OpenCV 识别率低一点，时间快，脸小，矩形框范围大点儿；Face-recognition 识别率高一点，时间慢一点，脸大，矩形框范围小点儿。综上，我采用第二种方法 Face-recognition 识别。

识别数据库 Celeba devel ， Celeba test ， PGGAN ， DFD

输出如下：

# Celeba devel

I have save these images' name that I haven't found a face from in this txt: D:/Celeba_face/devel/nofound.txt

I have save face images in this path: D:/Celeba_face/devel

Not recognition rate: 0.0382536587773637

Running time using Face-recognition is: 5:09:40.564417

# Celeba test

I have save these images' name that I haven't found a face from in this txt: D:/Celeba_face/test/nofound.txt

I have save face images in this path: D:/Celeba_face/test

Not recognition rate: 0.0397808597798727

Running time using Face-recognition is: 1:35:20.080798

# PGGAN 人脸较清晰，没有进行人脸识别预处理，但是为了ELA，进行了resize和png转jpg处理

# DFD 先进行视频分帧保存图片处理，再进人脸识别步骤

2.视频分帧保存图片处理

代码

import os

import cv2

import time

import datetime

def framing():

input_path = 'D:/test'

output_path = 'D:/test_face'

txt_path = output_path+'/log.txt'

with open(txt_path, "a", encoding="utf-8") as fi:

fi.write('\n AllVideosFullName \t Index \t Frame \t Picture\n')

videos = os.listdir(input_path)

videos.sort(key = lambda x: x[:-4])

if len(videos) != 0:

video_num = 0

for each_video in videos:

print('Video {} is running ...'.format(video_num))

each_video_input = input_path+'/'+str(each_video)

each_video_output_path = output_path+'/'+str(each_video[:-4])

if not os.path.exists(each_video_output_path):

os.mkdir(each_video_output_path)

capture = cv2.VideoCapture(each_video_input)

if capture.isOpened():

real = True

else:

real = False

frame_step = 10

frame_num = 0

picture_num = 0

while real:

real, frame = capture.read()

if(frame_num % frame_step == 0):

cv2.imwrite(each_video_output_path+'/Frame'+str(frame_num)+'_Pic'+str(picture_num)+'.jpg',frame)

picture_num += 1

frame_num += 1

cv2.waitKey(1)

video_num += 1

with open(txt_path, "a", encoding="utf-8") as fi:

fi.write('{} \t {} \t {} \t {}\n'.format(each_video[:-4], video_num, frame_num, picture_num ))

capture.release()

print('Running log has been saved here: '+txt_path)

else:

print('Empty Directory')

if __name__ == '__main__':

start_time = time.clock()

framing()

end_time = time.clock()

delta_time = datetime.timedelta(seconds = (end_time-start_time))

print('Running time is: %s '%(delta_time))

测试成果：

截图

Terminal

Video 0 is running ...

Video 1 is running ...

Video 2 is running ...

Running log has been saved here: D:/test_face/log.txt

Running time is: 0:00:20.817361

log.txt

AllVideosFullName Index Frame Picture

01__exit_phone_room 1 306 31

01__hugging_happy 2 788 79

01__kitchen_pan 3 561 57

3.提取DFD视频分帧后的图片中的人脸

运行代码后，识别的人脸按原先的文件夹存放在新路径下的同名文件夹，每个文件夹都有 log.txt 记录未识别出人脸的文件以及本文件夹人脸未识别率。在新路径下有总的统计数据 log.txt ，包含：有损图片总数，未识别图片总数，未受损图片总数，总的未识别率。

分帧结果

# OUTPUT1(frame images from DFD/original_c23)

# Running log has been saved here: G:/DFD_img/original_c23/log.txt

# Running time is: 1:05:49.907241

# OUTPUT2(frame images from DFD/attack_c23)

# Running log has been saved here: G:/DFD_img/attack_c23/log.txt

# Running time is: 6:29:04.835291

找脸结果

# OUTPUT1(find face from DFD_img/original_c23)

# # of folders: 363

# Running time using Face-recognition is: 13:46:29.115011

# OUTPUT2(find face from DFD_img/attack_c23)

# # of folders: 3068

# Running time using Face-recognition is: 4 days, 4:05:53.688934

原视频人脸识别率：95.4%

生成视频人脸识别率：97.7%

4.PGGAN resize PNG->JPG

输出如下

# of file in G:/PGGAN/devel is : 6000

# of file in G:/PGGAN/test is : 3000

# of file in G:/PGGAN/train is : 21000

# of file in G:/PGGAN/img_pggan/zip000000 is : 1000

# of file in G:/PGGAN/img_pggan/zip001000 is : 1000

# of file in G:/PGGAN/img_pggan/zip002000 is : 1000

# of file in G:/PGGAN/img_pggan/zip003000 is : 1000

# of file in G:/PGGAN/img_pggan/zip004000 is : 1000

# of file in G:/PGGAN/img_pggan/zip007000 is : 1000

# of file in G:/PGGAN/img_pggan/zip008000 is : 1000

# of file in G:/PGGAN/img_pggan/zip012000 is : 1000

# of file in G:/PGGAN/img_pggan/zip013000 is : 1000

# of file in G:/PGGAN/img_pggan/zip014000 is : 1000

# of file in G:/PGGAN/img_pggan/zip016000 is : 1000

# of file in G:/PGGAN/img_pggan/zip017000 is : 1000

# of file in G:/PGGAN/img_pggan/zip018000 is : 1000

# of file in G:/PGGAN/img_pggan/zip019000 is : 1000

# of file in G:/PGGAN/img_pggan/zip025000 is : 1000

# of file in G:/PGGAN/img_pggan/zip026000 is : 1000

# of file in G:/PGGAN/img_pggan/zip028000 is : 1000

# of file in G:/PGGAN/img_pggan/zip087000 is : 1000

# of file in G:/PGGAN/img_pggan/zip088000 is : 1000

# of file in G:/PGGAN/img_pggan/zip089000 is : 1000

# of file in G:/PGGAN/img_pggan/zip090000 is : 1000

# of file in G:/PGGAN/img_pggan/zip091000 is : 1000

# of file in G:/PGGAN/img_pggan/zip092000 is : 1000

# of file in G:/PGGAN/img_pggan/zip093000 is : 1000

# of file in G:/PGGAN/img_pggan/zip094000 is : 1000

# of file in G:/PGGAN/img_pggan/zip095000 is : 1000

# of file in G:/PGGAN/img_pggan/zip096000 is : 1000

# of file in G:/PGGAN/img_pggan/zip097000 is : 1000

# of file in G:/PGGAN/img_pggan/zip098000 is : 1000

# of file in G:/PGGAN/img_pggan/zip099000 is : 1000

Running time is: 0:48:38.366194

日志如下

G:/PGGAN/devel fileslen: 6000 pngcount: 6000 notpng: 0 damaged: 0

G:/PGGAN/test fileslen: 3000 pngcount: 3000 notpng: 0 damaged: 0

G:/PGGAN/train fileslen: 21000 pngcount: 21000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip000000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip001000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip002000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip003000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip004000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip007000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip008000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip012000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip013000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip014000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip016000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip017000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip018000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip019000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip025000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip026000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip028000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip087000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip088000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip089000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip090000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip091000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip092000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip093000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip094000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip095000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip096000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip097000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip098000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

G:/PGGAN/img_pggan/zip099000 fileslen: 1000 pngcount: 1000 notpng: 0 damaged: 0

六、Celeba&PGGAN&DFD数据集特征提取

！！！注意：这里的特征提取代码只是将特征提取，然后绘制到图片上保存。后面我们将训练SVM分类器，所以需要用到特征数据，这样才比较方便。因此，后文将首先讲述特征数据的提取并保存至Excel文件，然后训练、测试SVM分类器。

matplotlib中cla() clf() close()用途

import matplotlib.pyplot as plt

plt.cla() # Clear axis即清除当前图形中的当前活动轴。其他轴不受影响。

plt.clf() # Clear figure清除所有轴，但是窗口打开，这样它可以被重复使用。

plt.close() # Close a figure window

下图只是一部分 Celeba 和 PGGAN 数据集的对比图

左上：原图，第一排PGGAN假脸，第二排Celeba真脸

右上：三原色直方图，假脸三原色峰值基本重合，真脸三原色峰值错开

左下：SURF特征点，假脸同样的阈值特征点多，真脸少

右下：ELA，假脸ELA图片发亮处较多，真脸基本一色调一致

今天把三个数据集处理(提取人脸，png转jpg)后的所有图片的3种特征都提取了一下。 ✌️

Celeba、PGGAN 特征较好，DFD 效果一般。

输出如下：

# Celeba

startTime: 2020-02-25 18:08:30.578360

endTime: 2020-02-25 22:50:47.230785

Running time: 4:42:16.652425

# PGGAN

startTime: 2020-02-25 18:09:01.274854

endTime: 2020-02-25 22:58:56.398361

Running time: 4:49:55.123507

# DFD

startTime: 2020-02-25 18:09:41.216839

endTime: 2020-02-26 12:08:03.989166

Running time: 17:58:22.772327

七、SVM分类器分类

1.练手代码

截图

2.SVM原理简介

❌ 未经许可，禁止套用！！！

3.特征数据提取

文件结构：

ExtractFeatureData # 特征数据提取代码文件夹

│ extract_feature_data.py # 特征数据提取主程序

│ OUTPUT.txt # 部分运行日志

│ test.py # 特征数据提取主程序之前的测试代码

│

└─CommonFunction # 公用函数，分别提取特征并存入excel的一个sheet

extract_color_data.py

extract_SURF_data.py

extract_ELA_data.py

三个特征分别由三个py文件提取并保存到Excel中。一组图片的同一特征存在同一个Excel文件中，每张图片占一个sheet。

① color特征：分bgr3列，每列有256*256=65536行；

② SURF特征：先提取SURF特征，核心代码如下，然后统一每张图选取半径最大的15个点作为特征点，不足则补零；

img = cv2.imread(inputpath)

surf = cv2.xfeatures2d.SURF_create(4000)

kps, features = surf.detectAndCompute(img, None)

kps_data = []

for kp in kps:

kps_data.append([kp.pt[0], kp.pt[1], kp.angle, kp.size])

③ ELA特征：首先将图片灰度化，然后提取ELA特征，每张图256行256列共65536像素。

4.SVM_SGDClassifier的训练和测试

文件结构：

SVM-SGD # SGD(Stochastic Gradient Descent)

│ svm_SGD.py # 随机梯度下降分类器主程序(含训练、测试代码)

│

└─GetData # 从excel中提取数据返回一维列表，3者基本一样

get_color.py

get_SURF.py # 3者中最先写的，注释详细

get_ELA.py

get_XXX 函数每次提取一个Excel的所有sheet的数据，返回list，每个sheet都展平为1维，占list一个元素位。

svm_SGD.py 调用三个函数获取数据，然后通过以下函数训练数据得到SVM模型、用SVM模型预测数据类别。核心代码如下：

clf = SGDClassifier()

clf.partial_fit(X, Y, classes=np.array([0, 1]))

joblib.dump(clf, savepath + '/' + 'clf.pkl')

clf2 = joblib.load(savepath+'/'+'clf.pkl')

Z = clf2.predict(X)

accuracy = clf2.score(X, Y)

OUPUT:

Running Time of 训练color特征SVM分类器 : 0:02:31.862390

测试数据实际真假：[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

测试数据预测真假：[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 0]

color_clf 预测准确率：0.6164383561643836

Running Time of 测试color特征SVM分类器 : 0:02:21.229064

Running Time of 训练SURF特征SVM分类器 : 0:00:00.309207

测试数据预测真假：[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 0 0 0 1 1 1 1 0 1 0 0 1 1 0 1 1 1 1 1 0 1 1 1 1 0 0 0 0 0 0 0 1 0 0 0]

SURF_clf 预测准确率：0.6438356164383562

Running Time of 测试SURF特征SVM分类器 : 0:00:00.271234

Running Time of 训练ELA特征SVM分类器 : 0:00:36.909247

测试数据预测真假：[1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 1 1 1 1 0 1 0 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0]

ELA_clf 预测准确率：0.6575342465753424

Running Time of 测试ELA特征SVM分类器 : 0:00:33.487409

最终分类器准确率大约为 63% 上下。估计很大原因是由于训练数据较少，所以准确率较低，未来工作将是大量数据训练和测试。

代码 svm_SGD_per100img.py 在训练测试大量文件时准确率不高且三者一样，感觉是代码哪里有问题，暂时还没察觉到问题所在，希望有人能看出端倪t提出建议，欢迎 New issue ！！！

八、完成论文

《开题报告》《毕业论文》详见：./Paper 文件夹

论文将在毕设答辩之后上传

你可能感兴趣的:(图像篡改检测,python)

Matlab 数字图像第二章矩阵及其运算肌肉猛1大序子 matlab 矩阵开发语言图像处理
目录2.1矩阵的创建2.1.1直接输入：2.1.2载入外部数据文件2.1.3利用内置函数创建2.2矩阵的寻访2.2.1下标元素访问2.2.2访问单元素2.3矩阵的拼接2.3.1矩阵拼接符[]2.3.2函数2.4矩阵的运算2.4.1加减2.4.2乘除2.4.3乘方2.4.4按位运算2.4.5行列式与秩2.4.6逆与迹2.4.7矩阵的范数（?)2.4.8特征值和特征向量PS纯纯用来记笔记，要是有错随时
Python设计模式：适配模式 niuguangshuo python基础 python 设计模式开发语言
1.适配模式（AdapterPattern）详解适配模式（AdapterPattern）是一种结构型设计模式，它允许将一个类的接口转换成客户端所期望的另一种接口。适配模式使得原本由于接口不兼容而无法一起工作的类可以协同工作。换句话说，适配模式充当了一个桥梁，允许不同接口的类之间进行交互。在软件开发中，常常会遇到需要使用现有类的情况，但这些类的接口与我们需要的接口不匹配。适配模式提供了一种解决方案，
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
YOLOv5改进策略|YOLOv5 ⾃主检查和跟踪相关的任务|基于视觉的⽆⼈⽔⾯舰艇⾃主导航极端海洋条件斌擎人工智能官方账号 YOLO 人工智能 YOLOv5 目标检测计算机视觉深度学习自主导航
目录介绍解决方案目标检测的视觉结论视觉感知是无人水面舰艇(USV)自主导航的重要组成部分，特别是与自主检查和跟踪相关的任务。这些任务涉及基于视觉的导航技术来识别导航目标。海洋环境中极端天气条件下的能⻅度降低使得基于视觉的方法难以正常工作。为了克服这些问题，本文提出了一种基于视觉的自主导航框架，用于在极端海洋条件下跟踪目标物体。所提出的框架由一个集成感知管道组成，该管道使用生成对抗网络(GAN)来消
数字图像处理（三：图像如果当作矩阵，那加减乘除处理了矩阵，那图像咋变）：从LED冬奥会、奥运会及春晚等等大屏，到手机小屏，快来挖一挖里面都有什么
数字图像处理（三）一、（准备工作：咋玩，用什么玩具）图像以矩阵形式存储，那矩阵一变、图像立刻跟着变？1.Python+JupyterNotebook/Lab+库(NumPy,OpenCV,Matplotlib,scikit-image)2.MATLAB+ImageProcessingToolbox3.JavaScript+HTML5Canvas+浏览器4.专业的图像处理软件(带脚本/插件功能)二、
使用Python进行文件属性修改 python自动化工具 python办公自动化 python 服务器 java
哈喽，大家好，我是木头左！在计算机中，文件属性是指与文件相关的元数据，如创建时间、修改时间、访问时间等。这些属性对于管理和组织文件非常重要。Python提供了一些内置的函数和方法，可以方便地修改文件的属性。本文将介绍如何使用Python进行文件属性的修改。1.获取文件属性需要使用os模块中的stat()函数来获取文件的属性。该函数返回一个包含文件属性的命名元组。以下是一个简单的示例：importo
人工智能视频分析系统人员离岗报警设计方案 liuhu21 人工智能云计算运维
一、方案概述近几年安防监控技术不断的进步，特别是在人工智能推出之后。安防监控系统结合人工智能算法做到了许多以前无法做到的事情。就比如我们今天要说的离岗检测报警监控系统。以前我们只能通过人工值守监控室的方式，通过人的判断去观看现场人员在岗情况。如今有了离岗检测监控系统，系统可以自动监测现场人员是否在岗、离岗时间以及离岗人数等等。这样，大大减少了监控室值班人员的工作量，同时相较人工监管提升了工作效率。
Python 代理模式：控制对象访问的智能中介
在Python编程中，代理模式（ProxyPattern）是一种非常有用的设计模式，它在许多场景下能够为我们提供更加灵活和可控的对象访问方式。代理模式就像是一个中间人，它站在客户端和真实对象之间，代替真实对象处理请求，并且可以在这个过程中添加额外的逻辑，如权限验证、懒加载等。本文将深入探讨Python中的代理模式，详细阐述其概念、关键要点、实现方式、应用场景以及与其他相关模式的比较。一、代理模式的
深度解析股票量化标准，从数据筛选到模型构建全面解读股票程序化交易接口量化交易股票API接口 Python股票量化交易股票量化标准数据筛选模型构建量化分析股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>股票量化标准的定义股票量化标准是一套运用数学和统计学方法，对股票投资进行系统性分析与决策的准则。它将各种影响股票价格的因素，如财务数据、市场交易数据等进行量化处理。通过这些量化后的指标，投资者能更精准地评估股票的价值与潜力，减少主观判
睡岗离岗检测算法 Python 燧机科技SuiJi 人工智能 python 算法深度学习神经网络
睡岗离岗检测算法的核心在于实时监控和智能分析，睡岗离岗检测算法通过安装在关键区域的监控摄像头，系统能够捕捉到员工的活动画面。当系统检测到人体位置长时间未发生变化时，将启动睡姿分类器。该分类器能够识别多种睡姿，如趴在桌子上睡、坐在凳子上后仰睡等。一旦识别为睡姿，系统将立即触发告警机制。这可以通过向管理人员发送警报信号，或通过语音提醒员工的方式实现。睡岗离岗检测算法在多种场景下均有广泛应用。该算法能够
微算法科技技术创新，将量子图像LSQb算法与量子加密技术相结合，构建更加安全的量子信息隐藏和传输系统
随着信息技术的发展，数据的安全性变得尤为重要。在传统计算模式下，即便采用复杂的加密算法，也难以完全抵御日益增长的网络攻击威胁。量子计算技术的出现为信息安全带来了新的解决方案。然而，量子图像处理领域仍面临复杂度高、效率低的问题。微算法科技通过将量子图像LSQb算法与量子加密技术相结合，提出了一种全新的信息隐藏和传输方案，旨在构建更加安全高效的数据保护机制。LSQb算法，即量子图像的最小有效量子比特算
Python桌面版数独（二版）-增加4X4、6X6 香蕉可乐荷包蛋 #数独 python java 前端
增加选择4x4、6x6模式，以下是三种模式的不同解析：4x4模式：数独大小：4x4每个宫格大小：2x2数字范围：1-46x6模式：数独大小：6x6每个宫格大小：2x3数字范围：1-69x9模式：数独大小：9x9每个宫格大小：3x3数字范围：1-9主要优化点：4.添加了模式选择下拉框，可以选择4x4、6x6、9x9模式5.根据选择的模式动态创建不同大小的棋盘6.生成不同大小的数独题目7.验证输入的合
变型桥——桥接模式详解（Python实现）
引言在上一篇文章中，我们详细介绍了适配器模式（AdapterPattern），并展示了如何通过适配器将不兼容的接口转换为兼容的接口，使得原本无法协同工作的类能够在一起工作。这次，我们将探讨另一种结构性设计模式——桥接模式（BridgePattern），或者我们可以亲切地称它为“变型桥”。桥接模式将抽象部分与它的实现部分分离，使它们都可以独立地变化，通过引入一个桥接接口，桥接模式可以让抽象和实现独立
曲靖8家亲子鉴定机构一览(附2024最新亲子鉴定收费标准) 基因亲子
据相关科学研究表明，对于目前的科技水平而言，亲子鉴定是很容易的，出错率也是非常的低，只要是具有DNA检测能力的医疗机构均可以做隐私亲子鉴定，根据不完全统计得出的实验结果，出错的几率约为0.0001%。1.曲靖DNA基因鉴定中心：150-1301-2478，需要提前预约)曲靖亲子鉴定在线咨询：150-1301-2478(微信同号，需要提前预约)曲靖亲子鉴定地址：150-1301-2478曲靖市麒麟区
3步实现安防高精度检测：陌讯算法夜间监控落地实战 2501_92474745 目标跟踪人工智能计算机视觉算法目标检测视觉检测
开篇痛点：安防监控系统在实时目标检测中常面临严峻挑战。实测数据显示，传统算法在低光、遮挡或动态场景下，泛化能力不足，导致平均误报率高达15%（数据来源：安防行业报告）。尤其在夜间或拥挤环境下，系统卡顿、漏检频发，不仅降低响应效率，还增加安全隐患。例如，某城市交通监控中心反馈，其开源模型在高密度人流中出现每秒帧率（FPS）骤降至20帧以下，引发报警延迟问题。这些问题根源在于算法鲁棒性和实时性不足，亟
离岗误报率 20%？陌讯时序算法实测降 90% 2501_92474711 算法计算机视觉目标跟踪机器学习人工智能边缘计算
开篇：工业安防中的"隐形漏洞"在制造业车间、变电站等关键场景，离岗检测是保障生产安全的核心环节。传统监控系统依赖人工巡检，存在85%的漏检率；而普通视觉算法在光照变化、人员遮挡场景下，误报率常高达20%以上[实测数据显示]。某汽车零部件厂曾因离岗检测失效导致设备空转2小时，直接损失超12万元。这种"看得见的监控，防不住的风险"困境，凸显了传统视觉方案在复杂工业场景中的局限性。技术解析：从单帧检测到
Python适配器模式详解：让不兼容的接口协同工作 detayun Python python 适配器模式开发语言
一、模式定义与核心思想适配器模式（AdapterPattern）是一种结构型设计模式，它通过创建一个中间层（适配器），将不兼容的接口转换为客户端期望的接口。就像现实中的电源适配器，让不同国家的插头都能在同一个插座上工作。二、模式结构解析#目标接口：客户端期望的接口classTarget:defrequest(self):"""标准请求方法"""raiseNotImplementedError#被适
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
python3.9安装tensorflow-gpu 2.6.0和torch-gpu版本各依赖包的版本对应关系
首先使用的cuDNN（8.1）、CUDA（11.2）、tensorflow-gpu（2.6.0）、python（3.9）之间对应版本Window环境下安装pytorch下载地址tensorflow官网CUDA下载官网cuDNN下载官网注意：cuDNN需要注册absl-py0.15.0astunparse1.6.3cachetools5.3.2certifi2023.7.22charset-norm
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
gitlab修改DNS解析配置文件中东大鹅 gitlab linux git
在Linux（CentOS7.9）云服务器上解压gitlab时提示需要Python的环境[root@rainyun-v1vct1josrc]#rpm-ivhgitlab-ce-10.8.4-ce.0.el7.x86_64.rpmwarning:gitlab-ce-10.8.4-ce.0.el7.x86_64.rpm:HeaderV4RSA/SHA1Signature,keyIDf27eab47:N
嘉兴正规的亲子鉴定中心在哪(附2024年最新亲子鉴定办理流程) 成之嘉_基因检测
2024年嘉兴最新亲子鉴定收费标准：个人隐私亲子鉴定收费标准：￥2000-￥2400，常见用途：怀疑孩子的父亲身份，想私下偷偷检测；无创胎儿亲子鉴定收费标准：￥4500-￥5000，常见用途：孩子未出世，怀疑胎儿的父亲身份，想思想偷偷检测；司法亲子鉴定收费标准：￥2400-￥3600，常见用途：上户口、移民；成之嘉亲子鉴定优势1、全程匿名2、快速出结果3、检测更精准口号：每一次检测都是一份责任联系
疫情之下的你我他小橙梓
进入十月末期后再次被限制了出行，这次限制范围是不能出市，员工出差也被限制到了最严格的审批条件，所有人按照一周两次的行程码检测执行。望眼身边人执行此条例的并不多，学校由于自身特殊原因对于在校人员更加叮嘱不准外出，很多会议也采用了线上的模式。当把目光聚焦到今天（16日）总计全国范围新增感染11例，分别是7例在大连、2例在黑河、云南和北京各1例，这个数字距离半个月前接近3位数多地区感染已有了好转。新型冠
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1024 一元三次方程求解热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：
Python FastAPI 与传统 Web 框架的性能对比 Python编程之道 python fastapi 前端 ai
PythonFastAPI与传统Web框架的性能对比关键词：FastAPI、性能对比、Web框架、异步编程、Python、Django、Flask摘要：本文深入探讨了FastAPI与传统PythonWeb框架（如Django和Flask）在性能方面的差异。我们将从架构设计、请求处理模型、并发能力等多个维度进行对比分析，并通过基准测试数据展示实际性能差异。文章还将提供代码示例和性能优化建议，帮助开发
监控漏检频发？陌讯YOLOv7实时优化方案召回率提升25% 2501_92489016 目标跟踪人工智能计算机视觉算法目标检测视觉检测智慧城市
一、开篇痛点在安防监控领域，传统目标检测模型面临三重困境：实时性差：1080P视频流处理普遍低于20FPS（VGG16仅15FPS）漏检率高：密集场景下小目标召回率常低于60%（COCO-val实测数据）部署成本高：ResNet-101需8GB显存，难以边缘化部署某智慧园区项目显示：夜间误报率高达34%，运维成本激增300%二、技术解析：陌讯SlimYOLO架构创新针对上述痛点，陌讯视觉算法提出三
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
Python Scrapy爬取办公用品网站数据的策略 Python编程之道 python scrapy 开发语言 ai
1.引入与连接想象一下，你是一家办公用品公司的市场调研人员，需要了解竞争对手的产品价格、种类等信息。如果手动去各个办公用品网站收集这些数据，那将是一项极其繁琐且耗时的工作。而Python的Scrapy框架就像是一个不知疲倦的超级助手，能帮你快速、高效地从众多网站抓取所需数据。你可能已经对Python有了一定的了解，知道它是一门功能强大且应用广泛的编程语言。Scrapy则是Python中专门用于网络
使用Python Scrapy打造个性化爬虫
使用PythonScrapy打造个性化爬虫——知识金字塔构建1.引入与连接：从“手动复制”到“自动化采集”的跨越你是否遇到过这样的场景？想整理1000条知乎优质回答做数据分析，却要逐条复制；想追踪某电商平台的商品价格波动，却要每天手动刷新页面……这些重复劳动，正是“个性化爬虫”的用武之地！与已有知识的连接：你可能用过requests+BeautifulSoup写过简单爬虫，但面对大规模数据、复杂反
新手向:基于 Python 的简易视频剪辑工具
在数字媒体时代，视频创作已成为大众表达的重要形式，从个人vlog制作到企业宣传视频，视频内容的需求呈现爆发式增长。传统专业软件如AdobePremierePro虽功能强大，提供完整的非线性编辑系统，但存在学习曲线陡峭（新手通常需要数周系统学习）、资源占用高（最低配置要求8GB内存）、授权费用昂贵（订阅价约20美元/月）等痛点。相比之下，Python凭借其丰富的多媒体库生态系统（如OpenCV、Mo
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =