qigeyonghuming_1

python-sift-kmeans-svm图片分类

文章目录

- 1理论
- 2代码
- - 2.1debug记录
  - 2.2代码
- 3 数据集
- 4结果
- 写在最后

1理论

理论部分见博客：SIFT+词袋+SVM的深入理解，感谢博主herr_kun，这个真是写的太好了，通俗易懂，尤其是那张自动笔画的图，真好https://blog.csdn.net/herr_kun/article/details/80220389

2代码

使用的代码来源于https://blog.csdn.net/Yan456jie/article/details/52313317
感谢博主Yan456jie
在跑代码的时候，发现该代码有一些函数在新版本的python上跑不通，有一些错误，所以调了一下

2.1debug记录

主要遇到的错误是
1前期报了一堆错，我查博客做了一堆，结果发现主要是改了文件读写的代码，结果读不到文件了，这个只能具体问题具体分析了，就不记录了。
2 路径中最好不要有中文！哪怕已经可以读取中文路径下的东西了，可是我在调用im = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)时依然报错，而且是报说opencv 崩溃了。。。果真是玄学。
3 由于版本更新，sift特征的函数改变了，下列关键语句不能用了

#关键点检测对象
    fea_det = cv2.FeatureDetector_create("SIFT")
    #特征提取对象
    des_ext = cv2.DescriptorExtractor_create("SIFT")

解决方法
参考该博客，使用新的函数提取sift，感谢博主
StevenGerrad，https://blog.csdn.net/qq_40690815/article/details/104946216
4由于版本更新，cross_validation不能使用了
解决方法：参考该博客，感谢博主ronaldo2018
https://blog.csdn.net/sinat_17697111/article/details/84835873
代码中的cross_validation都改成model_selection

2.2代码

代码如下

#coding=utf-8
#-*- coding: utf-8 -*-
import argparse as ap
import cv2
import imutils
import numpy as np
import os
from sklearn.externals import joblib
from scipy.cluster.vq import *
from sklearn import preprocessing
import math
import sys
import numpy
from sklearn import metrics
from sklearn.feature_extraction.text import HashingVectorizer
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.multiclass import OneVsRestClassifier
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import MultiLabelBinarizer, StandardScaler
from sklearn.svm import SVC
from sklearn.svm import LinearSVC
import codecs
from sklearn.feature_selection import SelectPercentile, f_classif
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
# from sklearn import cross_validation #报错
#ImportError: cannot import name 'cross_validation' from 'sklearn' (C:\Users\wyh\Anaconda3\lib\site-packages\sklearn\__init__.py)
# cross_validation路径换了，现在放在model_selection,改成下面这句
from sklearn import model_selection
from sklearn.utils import shuffle
import sys



if sys.getdefaultencoding()!='utf-8':
    reload(sys)
    sys.setdefaultencoding('utf-8')

'''
使用词袋模型对图像进行分类：
1、数据格式，文件夹名即类别，每个文件夹下是一类图像
2、提取sift特征，将所有图像的sift特征放在一起，进行聚类，聚出n个视觉词
3、计算每幅图像有哪些视觉词，统计出词频矩阵
4、根据矩阵计算idf，进而得到tfidf矩阵，并对其进行L2归一化（向量中每个元素除以向量的L2范数->x/平方和开根号）
5、使用一般分类模型对其进行分类，计算P,R,F
'''
def load_data(path):
    '''
    每个文件夹下是一种图片
    :param path:种类文件夹路径
    :return: 图片路径列表和标签列表
    '''
    categories = os.listdir(path)
    img_pathes = []
    labels = []
    for mypath, dirs, files in os.walk(path):
            for file in files:
                mypath1=mypath+'/'
                mytmp = os.path.join(mypath1, file)
                img_pathes.append(mytmp)  # 不能用expend 要用append

                # print(img_pathes)
                if len(files)>0:
                    # print('hello')
                    labels.extend([mytmp.split('/')[-2]] )
                    # labels.extend([mytmp.split('/')[-2]] * len(files))
                    # print('labels:', labels)
    # print('img_pathes:',img_pathes)
    # print('labels:',labels)

    #print len(labels),labels
    return img_pathes,labels


# def load_data(path):
#     '''
#     每个文件夹下是一种图片
#     :param path:种类文件夹路径
#     :return: 图片路径列表和标签列表
#     '''
#     categories = os.listdir(path)
#     img_pathes = []
#     labels = []
#     for  mypath,dirs, files in os.walk(path):#root(根目录) dir（文件夹是list） file(文件是list)
#             for file in files:
#                 mypath1=mypath+"/" #要加/，不然会变成前面都是/，后面的file是\
#                 mytmp=os.path.join(mypath1, file)
#
#                 img_pathes.append(mytmp)  #不能用expend 要用append
#                 print(img_pathes)
#
#                 if len(files) > 0:
#                      labels.append([img_pathes.split('/')[-2]] * len(files)) #类名就是子文件夹的名字，有多少个文件就有多少个这一类的标签，所以乘上files的数量
#                 # print([path.split('/')[-2]])
#                 # print len(img_pathes),img_pathes
#                 # print len(labels),labels
#     print('load_data 里的label: ',labels)
#     return img_pathes, labels


def cal_bow(image_paths, numWords):
    '''
    使用bag of word方法提取图像特征
    :param image_paths:
    :return:
    '''
    # # numWords = 100
    #这几行会报错cv.cv没有这个属性FeatureDetector_create
    # # 关键点检测对象
    # fea_det = cv2.FeatureDetector_create("SIFT")
    # # 特征提取对象
    # des_ext = cv2.DescriptorExtractor_create("SIFT")

    # 参考博客 https://stackoverflow.com/questions/35588570/cv2-featuredetector-createsift-causes-segmentation-fault
    # ima = cv2.imread('image.jpg')
    # gray = cv2.cvtColor(ima, cv2.COLOR_BGR2GRAY)
    # detector = cv2.SIFT()
    # kpts, des = detector.detectAndCompute(gray, None)

     # AttributeError: module 'cv2.cv2' has no attribute 'FeatureDetector_create'

    # List where all the descriptors are stored
    des_list = []
    kps_list= []

    for i, image_path in enumerate(image_paths):
        im = cv2.imread(image_path) #路径有中文这一句不报错
        # print("所读取的图片是：%s\n" %image_path)
        # im = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) #路径不能有中文，否则这一句会报错

        # print (kpts[0].pt[0])
        # print("Extract SIFT of %s image, %d of %d images" %(image_paths[i],i,len(image_paths)))

        # kpts = fea_det.detect(im)
        # 可能存在没有检测出特征点的情况
        # 参考博客 https://blog.csdn.net/qq_40690815/article/details/104946216
        # 参考博客 https://www.it1352.com/2128021.html
        detector = cv2.xfeatures2d.SIFT_create()
        kpts, des = detector.detectAndCompute(im, None)  # des是描述子 kpts是关键点，每张图关键点不一样多，每个关键点是128维
        # print('kpts :', len(kpts))

        # des有k行m列，每行代表一个特征，m是固定的特征维数
        # kpts, des = des_ext.compute(im, kpts)

        kps_list.append(kpts)
        des_list.append((image_path, des))

    # Stack all the descriptors vertically in a numpy array
    # image_path为图片路径，descriptor为对应图片的特征
    # 将所有特征纵向堆叠起来,每行当做一个特征词
    descriptors = des_list[0][1]
    for image_path, descriptor in des_list[1:]:
        # vstack对矩阵进行拼接，将所有的特征word拼接到一起
        # print descriptor.shape, descriptors.shape
        # if descriptor != None:
        descriptors = np.vstack((descriptors, descriptor))

    # 对特征词使用k-menas算法进行聚类
    print("Start k-means: %d words, %d key points" % (numWords, descriptors.shape[0]))
    # "Start k-means: %d words, %d key points" % (numWords, descriptors.shape[0])
    # 最后输出的结果其实是两维的,第一维是聚类中心,第二维是损失distortion
    voc, variance = kmeans(descriptors, numWords, iter=1)

    # 初始化一个bag of word矩阵，每行表示一副图像，每列表示一个视觉词，下面统计每副图像中视觉词的个数
    im_features = np.zeros((len(image_paths), numWords), "float32")
    for i in range(len(image_paths)):
        # 计算每副图片的所有特征向量和voc中每个特征word的距离，返回为匹配上的word
        descriptor = des_list[i][1]
        # if descriptor != None:
        # 根据聚类中心将所有数据进行分类des_list[i][1]为数据, voc则是kmeans产生的聚类中心.
        # vq输出有两个:一是各个数据属于哪一类的label,二是distortion
        words, distance = vq(des_list[i][1], voc)
        for w in words:
            im_features[i][w] += 1

    # Perform Tf-Idf vectorization
    nbr_occurences = np.sum((im_features > 0) * 1, axis=0)
    idf = np.array(np.log((1.0 * len(image_paths) + 1) / (1.0 * nbr_occurences + 1)), 'float32')

    # L2归一化
    im_features = im_features * idf
    im_features = preprocessing.normalize(im_features, norm='l2')
    print('cal_bow 结束了')
    return im_features


def train_clf2(train_data, train_tags):
    # print('训练标签： ',train_tags)


    clf = SVC(kernel = 'linear',C=1000)#default with 'rbf'
    print(clf)
    # clf = LinearSVC(C=1100.0)  # default with 'rbf'
    # clf = LinearSVC(C=1000.0)  # default with 'rbf'
    # new_train_data=MultiLabelBinarizer().fit_transform(train_data)#要改格式再传参
    # new_train_tags=MultiLabelBinarizer().fit_transform(train_tags)#要改格式再传参
    # print('类别： ', new_train_tags)
    # clf.fit(new_train_data, new_train_tags)
    clf.fit(train_data, train_tags)



    # clf = OneVsRestClassifier(estimator=SVC(random_state=0))

    # clf.fit(train_data, train_tags).predict(train_data)
    # clf.fit(train_data, train_tags)
    #报错ValueError: You appear to be using a legacy multi-label data representation.  因为scikit-learn版本不一样,所以多标签的写法不同

    return clf


def evaluate(actual, pred):
    m_precision = metrics.precision_score(actual, pred, average="macro")
    m_recall = metrics.recall_score(actual, pred, average="macro")
    print('m_precision: ',m_precision,'\n')
    # print
    # 'precision:{0:.3f}'.format(m_precision)
    print('m_recall: ', m_recall, '\n')
    # print
    # 'recall:{0:0.3f}'.format(m_recall)
    print('f1-score: ',metrics.f1_score(actual, pred, average="macro"),'\n')
    # print
    # 'f1-score:{0:.8f}'.format(metrics.f1_score(actual, pred, average="macro"))


'''
'''
# 提取图片特征并保存 图像大小为20*20
# path = 'D:/data/Caltech_101/101_part/'
path = 'G:/wenxian/28cba52f/101_part/'
# path='G:/Caltech101/101_ObjectCategories/101_ObjectCategories/'#Caltech101数据集
# path='G:/wenxian/28cba52f/Caltech101/101_ObjectCategories/101_ObjectCategories'#Caltech101数据集除掉背景那一类共101类
img_pathes, labels = load_data(path)
im_features = cal_bow(img_pathes, numWords=500)
joblib.dump((im_features, labels), "bof.pkl", compress=3)

# 训练并测试
im_features, labels = joblib.load("bof.pkl")
# print('特征的长度：',len(im_features))
# print('标签的长度：',len(labels))
X_train, X_test, y_train, y_test = \
    model_selection.train_test_split(im_features, labels, test_size=0.3, random_state=0)
    # cross_validation.train_test_split(im_features, labels, test_size=0.3, random_state=0) #报错 NameError: name 'cross_validation' is not defined

clf = train_clf2(X_train, y_train)

# new_X_test=MultiLabelBinarizer().fit_transform(X_test)#要改格式再传参

pred = clf.predict(X_test)
# print(pred)

# print('测试集：',y_test,'\n')
evaluate(y_test, pred)

3 数据集

数据集也是来自原博客，地址为https://download.csdn.net/detail/yan456jie/9614133就是该数据集取前4个类的一个小型的数据集。

然后我好奇查了一下这个Caltech101数据集，喜闻乐见地是官网地址又下不了了。。。我又想起了oulu大学那个进不去的官网。。。忧伤，Caltech101官网链接如下http://www.vision.caltech.edu/Image_Datasets/Caltech101/
于是我在网上找了这个链接，Calttech101: https://hyper.ai/datasets/5258，下载方式如下，在页面中点击数据集下载，下载的是一个torent文件，到时候用迅雷下载就行

Caltech256也一并附上：https://hyper.ai/datasets/5261
因为担心链接挂了，此处百度网盘链接
Caltech101:链接：https://pan.baidu.com/s/1I90Tgm1kYj79wzDHUcFU1w
提取码：pbvz

Caltech256：https://pan.baidu.com/s/1-xwSETF1UfdkBhPVg0vqWA
提取码：of7k

发现一个别的东西，101数据集里面有个叫show_annotation的函数，不能直接执行，调用语句如下所示，嗯，所以说把这个分类数据集还做了标注是吗

show_annotation('G:\迅雷下载\Caltech-101\data\Caltech 101\Caltech 101\101_ObjectCategories\101_ObjectCategories\wrench\image_0039.jpg','G:\迅雷下载\Caltech-101\data\Caltech 101\Caltech 101\Annotations\Annotations\wrench\annotation_0039.mat')

显示结果

4结果

效果不佳，而且这个是不可重复的，数据集划分和svc分类器都没有设置随机数种子，但奇怪的是即使设置了随机数，结果还是不能重复，所以只能说马马虎虎调通了这个代码吧，还是有很多地方不了解。

写在最后

感谢以上所有博主，另外求oulu大学的Outex纹理数据集,官网进不去了。。。嗯，然而我并没有钱。。。
另外，如何使结果可重复呢？是不是还有哪里的random_state是我不知道的

使用Python将PDF文件转换为MOBI格式 choiiie 菜狗的怪问题合集 pdf python 经验分享
使用Python将PDF文件转换为MOBI格式引言在这篇文章中，我们将学习如何使用Python创建一个图形用户界面（GUI）应用程序，将PDF文件转换为MOBI格式。我们将使用tkinter作为GUI库，PyMuPDF或PyPDF2来处理PDF文件，以及Calibre的ebook-convert命令行工具来完成文件格式的转换。GitHub项目地址这个项目已经托管在GitHub上准备工作在开始之前，
JsonPath用法详解吴少凡 python 开发语言自动化 pycharm
JSONPath是一种信息抽取类库，是从JSON文档中抽取指定信息的工具，提供多种语言实现版本，包括Javascript、Python、PHP和Java。1、JSONPath安装:pipinstalljsonpath#如果安装太慢可以使用清华源来加速安装pipinstalljsonpath-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、JSONPath语法J
python批量转化pdf图片为jpg图片不懂python不懂R python python pdf
1.把pdf图片批量转为jpg；需要注意的是，需要先安装poppler这个软件，具体安装教程放在下面代码中了2.代码#poppler安装教程参考：https://blog.csdn.net/wy01415/article/details/110257130#windows上poppler下载链接：https://github.com/oschwartz10612/poppler-windowsfr
python程序中调用openai接口 MEMORYLORRY gpt openai gpt 人工智能机器学习 python transformer
调用openai接口1.openai例子（国内访问）2.解决思路3.搭建nginx3.1创建OpenSSL创建证书3.2nginx配置3.3验证效果4.python调用5.SSL:certificate_verify_failed错误1.openai例子（国内访问）fromopenaiimportOpenAIAPI_KEY='sk-api-key'client=OpenAI(api_key=API
python config使用 Soochow_NJU_Smile python config
config.cfg[test]filename=C:\\Users\\86188\\Desktop\\study\\configstudy\\fire.png[detect]number=1main.pyimportcv2importconfigparsercfg=configparser.ConfigParser()cfg.read('config.cfg')source=cfg.get('t
2024年最全办公室文员必备python神器，将PDF文件表格转换成excel表格！(1)，把面试官逗笑了 TOP级别安卓开发程序员 python pdf excel
如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其必先利其器。学习Py
第 9 课 Python 异常处理嵌入式老牛 Python入门 python 开发语言
1.异常与错误程序错误是指语法错误（指令输入不正确）和逻辑错误（程序执行结果不正确），而程序异常是一个意外事件，该事件会在程序执行过程中发生，影响了程序的正常执行，比如：打开的文件不存在、被除数为0、操作的数据类型不对、存储错误，互联网请求错误等等。一般情况下，在Python无法正常处理程序时就会发生一个异常。异常是Python对象，表示一个错误。当Python脚本发生异常时我们需要捕获处理它，否
华为OD机试E卷 -boss的收入（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++c语言华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一个XX产品行销总公司，只有一个boss，其有若干一级分销，一级分销又有若干二级分销，每个分销只有唯一的上级分销。规定，每个月，下级分销需要将自己的总收入（自己的+下级上交的）每满100元上交15元给自己的上级。现给出一组分销的关系，和每个分销的收入，请找出boss并计算出这个boss的收入。比如：收入100元，上交1
如何用Python将pdf文件转化为高清图片张登杰踩 pdf
最近在整理文档，需要将文档进行OCR识别，然后结构化。直接解析pdf文档，行不通，因为文档里面是图片。于是采取先转图片，然后OCR，然后结构化。下面是pdf文档转图片的方法。importfitz#PyMuPDFdefpdf_to_images(pdf_path,images_folder):#打开PDF文件document=fitz.open(pdf_path)forpage_numinrange
华为OD机试E卷 --选修课--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述现有两门选修课，每门选修课都有一部分学生选修，每个学生都有选修课的成绩，需要你找出同时选修了两门选修课的学生，先按照班级进行划分，班级编号小的先输出，每个班级按照两门选修课成绩和的降序排序，成绩相同时按照学生的学号升序排序。输入描述第一行为第一门选修课学生的成绩，第二行为第二门选修课学生的
Python调用open ai接口蓝天星空编程人工智能 python
要使用Python调用OpenAI的接口，您需要完成以下几个步骤：1.**注册并获取API密钥**2.**安装OpenAI的Python库**3.**编写Python代码以调用API**以下是详细的步骤说明：---###1.注册并获取API密钥首先，您需要在[OpenAI官方网站](https://beta.openai.com/signup/)注册一个账户。注册完成后，您需要创建一个API密钥：
Linux搭建wordpress 长江空自流 vps linux wordpress 安装
Linux搭建wordpress一、环境vps：Centos6x86minimal512ram小内存xshell5：ssh远程连接主机首先搭建lamp环境（linuxapachemysqlphp或python等）二、apache1安装yuminstallhttpd2启动apacheservicehttpdstart直接在浏览器中输入IP地址，应该就可以访问到Apache的欢迎页面了三、mysql1
python中strip()和split()的使用方法（学习笔记）木子_李轩笔记
1.strip()：用于移除字符串头、尾指定的字符(默认空格)，不能删除中间部分的字符。#未使用strip()path=r"C:\Users\67539\Desktop\22\11.txt"f=open(path,"r")forlineinf:#按行读取print(line)f.close()#结果cat22airplane23dog58mug86#########################
Flask基础和URL映射終不似少年遊* python进阶学习 flask python 后端开发框架
目录1.Flask介绍2.Flask第一个应用程序3.Flask运行方式4.Flask中DEBUG模式5.Flask环境参数的加载6.Flask路径参数的使用7.Flask路径参数类型8.Flask路径参数类型转换底层9.Flask自定义路由转换器自定义步骤：10.自定义转换to_python函数11.Postman的使用功能：使用示例：12.查询参数的使用13.请求体参数的使用14.上传文件的使
python strip() 函数和 split() 函数的详解 xinyuerr java python python java 数据库
本文主要介绍了pythonstrip()函数和split()函数的详解及实例的相关资料,需要的朋友可以参考下pythonstrip()函数和split()函数的详解及实例一直以来都分不清楚strip和split的功能，实际上strip是删除的意思；而split则是分割的意思。因此也表示了这两个功能是完全不一样的，strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。下
CH4 - Python开发技术—流程控制之分支结构（头歌） MSY～学习日记分享 python python 开发语言
目录第1关：英制单位英寸与公制单位厘米互换第2关：百分制成绩转换为等级制成绩第3关：约瑟夫环问题第1关：英制单位英寸与公制单位厘米互换"""英制单位英寸和公制单位厘米互换"""defcmin(value,unit):''':paramvalue:长度，:paramunit:单位'''#请在此处添加代码##*************begin************#ifunit=='cm'orun
Python中strip()函数和split()函数用法：半吊子烟酒僧函数
pythonstrip()函数和split()函数：strip是删除的意思；split则是分割的意思。strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。1Pythonstrip()函数介绍:声明：s为字符串，x为要删除的字符序列s.strip(x)删除s字符串中开头、结尾处为x的序列字符s.lstrip(x)删除s字符串中开头处为x的序列字符s.rstrip(x)
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
Error in py_run_file_impl(file, local, convert) : ModuleNotFoundError: No module named ‘igraph‘ hyena_7 Python R 服务器配置 python r语言开发语言
在HPC平台上跑我的R语言代码，结果一直报错说：Errorinpy_run_file_impl(file,local,convert):ModuleNotFoundError:Nomodulenamed'igraph'我就知道是我R语言里面导入python包那里出现了问题，对应的python环境没有这个包，我进入了R环境，使用命令如下：library(reticulate)py_module_av
python strip() 详解薇远镖局 Python python 开发语言
strip()是Python字符串方法之一，用于移除字符串开头和结尾的空白字符（包括空格、制表符、换行符等）或指定字符。它不会影响字符串中间的空白字符。语法str.strip([chars])参数chars（可选）：一个字符串，表示要移除的字符集合。如果未指定，默认移除空白字符。返回值返回一个新的字符串，表示移除了开头和结尾指定字符后的结果。示例1、移除空白字符：s="Hello,World!"p
Python--字符串小丁丁_ddxdd 技术层-python
描述Pythonstrip()方法用于移除字符串头尾指定的字符（默认为空格）。语法strip()方法语法：str.strip([chars]);参数chars--移除字符串头尾指定的字符。返回值返回移除字符串头尾指定的字符生成的新字符串。实例以下实例展示了strip()函数的使用方法：#!/usr/bin/pythonstr="0000000thisisstringexample....wow!!
使用uWSGI将Flask应用部署到生产环境 liuhongyue flask python 后端
使用uWSGI将Flask应用部署到生产环境：1、安装uWSGIcondainstall-cconda-forgeuwsgi（pipinstalluwsgi会报错）2、配置uWSGI在python程序的同一文件夹下创建uwsgi.ini文件，文件内容如下表。需要按照实际情况修改文件名称地址，log文件保存路径，启动的进程数和线程数等3、启动服务，执行命令：uwsgi--iniuwsgi.ini4、
centos7中报错ModuleNotFoundError: No module named ‘_ctypes‘解决方法丢失想象 centos python
分析:python3中有个内置模块叫ctypes，它是python3的外部函数库模块，提供了兼容C语言的数据类型，并通过它调用Linux系统下的共享库(Sharedlibrary)，此模块需要使用centos7系统中外部函数库(Foreignfunctionlibrary)的开发链接库(头文件和链接库)。由于在centos7系统中没有安装外部函数库(libffi)的开发链接库软件包，所以在安装pi
Python酷库之旅-第三方库Pandas(008) 神奇夜光杯 python pandas 人工智能开发语言 excel 标准库及第三方库学习和成长
目录一、用法精讲16、pandas.DataFrame.to_json函数16-1、语法16-2、参数16-3、功能16-4、返回值16-5、说明16-6、用法16-6-1、数据准备16-6-2、代码示例16-6-3、结果输出17、pandas.read_html函数17-1、语法17-2、参数17-3、功能17-4、返回值17-5、说明17-6、用法17-6-1、数据准备17-6-2、代码示例1
Python 中的 strip() 和 split() 方法详解 Ryann6 python 开发语言
目录一、strip()方法1.什么是strip()？2.基本语法3.基本用法示例1）去除空白字符2）移除指定字符4.lstrip()和rstrip()5.注意事项二、split()方法1.什么是split()？2.基本语法3.基本用法示例1）按空格分割字符串2）指定分隔符3）限制分割次数4.rsplit()方法5.splitlines()方法三、strip()与split()的结合使用1）移除空格
安装auto_gptq解决办法 Ven% 简单说深度学习 Ubuntu 深度学习基础动手人工智能深度学习机器学习 python
这个错误表明在安装auto_gptq包时，生成QiGen内核时失败了。具体来说，setup.py脚本尝试运行一个Python脚本来生成内核，但该脚本不存在或无法访问。以下是一些可能的解决方案：1.确保依赖项已安装首先，确保你已经安装了所有必要的依赖项。你可以尝试以下命令来安装auto_gptq的依赖项：pipinstalltorchtransformers2.使用预编译的二进制文件如果你不需要从源
6. 马科维茨资产组合模型+政策意图AI金融智能体(DeepSeek-V3)增强方案（理论+Python实战） AI量金术师金融资产组合模型进化论人工智能金融 python 机器学习算法大数据数学建模
目录0.承前1.幻方量化&DeepSeek1.1Whatis幻方量化1.2WhatisDeepSeek2.重写AI金融智能体函数3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对上一篇文章，链接:5.马科维茨资产组合模型+政策意图AI金融智能体(Qwen-Max)增强方案（理论+Python实战）的AI金融智能体更改为幻方量化DeepSeek-V3的尝试。唯一区别之处在于
python使用matplotlib可视化多个分组并排的柱状图（bar plot side by side） Data+Science+Insight 数据科学从0到1 python 机器学习数据挖掘人工智能深度学习
python使用matplotlib可视化多个分组并排的柱状图（barplotsidebyside）目录python使用matplotlib可视化多个分组并排的柱状图（barplotsidebyside）#导入包和库#python使用matplotlib可视化多个分组并排的柱状图（barplotsidebyside）#导入包和库importpandasaspdimportnumpyasnp#不显示
python使用TestLink-API-Python-client库对testLink操作——excel导入 fairytaildhk python python testLink excel
依赖库：TestLink-API-Python-client，xlrd通过pip安装:python3-mpipinstallTestLink-API-Python-client(笔者本地有多个版本python，只有一个版本直接python就可以)url:替换自己的testLink地址http://xx.xx.xx.xx:xxxx/testlink/lib/api/xmlrpc/v1/xmlrpc.
python方差分析误差棒_一文讲透，带你学会用Python绘制带误差棒的柱状图和条形图... 加勒比考斯 python方差分析误差棒
Python数据可视化，作为数据常用的必备技能，是目前大数据和数据分析的一个热门，而matplotlib库作为Python中最为常用和经典的二维绘图库，受到了很多人的青睐，最近已经和大家共同探讨了多种类型的图表的绘制，其中关于误差棒图，咱们已经在上次一起讨论过了，今天咱们继续深入研究误差棒图相关的知识。那今天咱们聊点什么呢？咱们一起探讨一下如何在Python中绘制带误差棒的柱状图和条形图吧！首先，
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23