查永春

基于Inception-v3的CNN迁移学习框架训练实例

CNN卷积神经网络迁移学习实例

对特定肿瘤影像数据进行等级分类预测

摘要：本文介绍基于Inception-v3的迁移学习方法应用，并用该方法对一批特定的数据进行训练。

本博客地址：http://www.yooongchun.com/2019/07/26/ji-yu-inception-v3-de-cnn-qian-yi-xue-xi-kuang-jia-xun-lian-shi-li/
本文代码下载地址：https://github.com/yooongchun/Inception_based_CNN_model/tree/master/Model

1.数据介绍

1.1数据下载

数据来源于TCIA网站上的胶质瘤数据：http://www.cancerimagingarchive.net/

1.2 数据介绍

该数据集一共122个样本。数据包含两个部分，其一是医学CT扫描影像数据，以nrrd格式提供，其二是医生诊断的临床数据，以csv格式提供；其中医学CT扫描影像数据又包含两个部分，分别是原始的病人CT扫描数据和医生勾画的病灶数据；一个完整的样本构成为：病人CT扫描数据+医生标记病灶数据+临床病理等级标签；综合以上描述，给出数据集的结构示意如下：

2.数据预处理

数据预处理旨在为之后的特征提取提供标准化数据。其步骤包括：样本筛选、切片抽取、切片筛选、切片分类及切片统一大小。

2.1样本筛选

第一个步骤是样本筛选。样本筛选是结合临床诊断数据进行的，通过观察临床诊断数据，发现其中只有80个样本是存在病理等级数据的，并且，存在病理等级数据的这些样本只包含于三个病理等级中（分别为II、III和IV），每个样本唯一对应一个病理等级，这样第一步的样本筛选可定义为：

按照样本id的病理等级数据提取数据

其示意图如下：

经过以上筛选，获得的结果是每个病理等级下相应病理等级的病人数据，三个病理等级数据一共80个样本，其中等级II包含病人样本34个，等级III包含病人样本24个，等级IV包含病人样本22个，如表一所示。

病理等级	样本数量
II	34
III	24
IV	22

这些样本将作为切片提取的基础。

2.2切片提取

首先，需要介绍一下这里切片的定义：上述2.1过程筛选出来的样本每个样本都是以nrrd格式保存的文件，并且每个样本包含两个nrrd文件，分别为CT扫描数据和医生勾画的病灶数据，每个样本会包含很多张图像数据（我们的样本中约为50到200的数量），每张图像数据就是一个CT扫描层，我们称之为切片。对单个样本构成的形象示意如下图：

现在我们来讨论数据的切片提取。这里使用Python提供的nrrd模块作为基础，该模块可提供nrrd文件的读写功能，使用该模块读取一个样本文件，注意到一个样本的构成如下：

这样经过CT Data和Label Data的配准操作就把切片数据提取出来了。提取出来的切片数据仍然按照病理等级分为II、III、IV三个类别，其中，病理等级II包含切片2583张，病理等级III包含切片1613张，病例等级IV包含切片1514张，如表二所示。

病理等级	切片数量
II	2583
III	1613
IV	1514

2.3 切片筛选

对于一个样本而言，切片包含了病灶区和非病灶区两种，而对最终的按照病理等级进行分类的目的而言，只有样本中包含病灶的切片才是有意义的，因而切片筛选的第一步即是进行病灶切片和非病灶切片的筛选，这个步骤需结合切片提取过程中的Options信息，在sample.seg.nrrd文件的options中存在病灶区域的切片起始终止序号，因而结合该信息进行筛选，筛选后病理等级II还有704张切片，病理等级III还有385张切片，病理等级IV还有419张切片，如表三所示。

病理等级	病灶切片数
II	704
III	385
IV	419

完成上述的筛选后，观察发现存在切片病灶区域非常小的情况，这样的病灶切片跟无病灶切片在分类意义上无明显区别，故而需要剔除，剔除以病灶区的面积为指标，对每个样本，对病灶切片按照病灶区面积大小进行从大到小排序，然后保留面积较大的病灶切片而剔除面积较小的病灶切片，需要指出的一点是每个样本中病灶面积大小是不一样的，因而不能以排序后按照排序排名来剔除切片，一个通俗易懂的例子是对病灶切片排序后A样本的第50张切片病灶区面积为500个像素大小，而B样本的第50张切片病灶区域面积只有10像素大小，一个更加合理的剔除规则是按照切片面积，然而还需要考虑到的一个因素是：应该保留每个样本的适量切片，这样才能保证样本数据被充分利用，这样完整的筛选规则被定义为：

对每个样本按照病灶切片病灶区域面积大小进行排序
对样本i以面积阈值Ti进行筛选，面积大于Ti的保留，小于Ti的剔除。Ti是一个实验值，不同样本取值不同，但需满足这样两个准则：
- 大于Ti阈值的切片病灶区域明显可见
- 样本Ti在被阈值Ti筛选后不能剔除所有病灶切片

经过以上筛选，获得最后的样本病灶切片数量为：病理等级II一共600张切片，病理等级III一共338张切片，病理等级IV一共270张切片，如表四所示。

病理等级	病灶切片数
II	600
III	338
IV	270

2.4 切片大小统一

以上步骤完成了切片的筛选，接下来需要进行的就是分类训练了，在分类训练前，还需要一个准备步骤就是切片的大小统一化，由于不同样本的病灶区大小是不一样的，因而前面的步骤获得的切片大小也是不一致的，在分类中，为了使每张切片进行卷积运算，需要输入统一格式统一大小统一通道数的数据，考虑到后面的模型使用Inception-v3模型进行迁移学习，而该模型接受的输入为3通道（RGB）299*299大小的数据，因而统一把所有病灶切片缩放为299*299*3，考虑到病灶切片数据为CT扫描的影像数据，数据范围为0到1024，且其病灶区的数据密度大和变化快，因而采用三次样条插值法进行图像缩放。

综合以上筛选过程，给出每次筛选的样本/切片数量示意表格如表五。

筛选类型	II类样本数	III类样本数	IV类样本数	样本总计	II类切片数	III类切片数	IV类切片数	切片总计
样本筛选	34	24	22	80	2583	1613	1514	5710
病灶切片筛选	34	24	22	80	704	385	419	1508
切片面积筛选	34	24	22	80	600	338	270	1208

3.构建分类器

3.1 选择依据

上述步骤获得了规范统一的数据切片及其病理等级，接下来就是按照病理等级对数据样本进行分类，参考前人的研究，多是用Pyradiomics 库来提取特征，接下来使用分类器来进行分类训练，分类器的选择上如svm分类、random forest分类等，分类器给出的结果虽然有差异，但基本都相近，且分类的正确率很多都未到90%及以上，如此来看，提升分类正确率的瓶颈已不在分类器的选择上，而在于特征提取上。

为了说明分类正确率的瓶颈在特征提取上，需要先对Pyradiomics 特征提取进行基本说明。Pyradiomics是一个Python 的特征提取开发包，其官网地址：https://pyradiomics.readthedocs.io/en/latest/，其可提取的特征包含以下五个类别：

```
   First Order Statistics features
```
```
   Shape-based features
```

   Gray Level Cooccurence Matrix (GLCM)

   Gray Level Run Length Matrix (GLRLM)

```
   Gray Level Size Zone Matrix (GLSZM)
```

这些特征都是基于样本数据经过计算得来的，存在明显的物理意义，比如一阶特征、形状特征等，而使用这些特征进行分类训练最终结果不如人意也说明这样一个问题：对于带有明显物理意义的特征对刻画病理等级能力有限 ，这样一种新的思路自然是寻求不同的方式来提取新的特征，并且这种新的特征应该包含但不限于带有物理意义的特征；考虑到目前卷积神经网络在图像处理领域表现出来的优势及其对特征刻画的优秀表现，我们的目光就聚焦到了卷积神经网络上。

选择卷积神经网络也面临着难题，首先任何一种卷积神经网络都需要大量的样本输入，而大量样本输入则对应着非常高的计算资源需求，而结合本文的数据集才有80个样本这样的事实，选择一种少量数据集下表现优秀的卷积神经网络就成了关键点。

目前业界针对小数据集进行卷积神经网络训练提出的主流方式是迁移学习（transfer learning）。该方法的思想是使用大数据集进行模型训练，然后使用训练好的参数对小样本进行参数微调，这样使得最终训练出来的模型具有小数据集和高精度的双重优势，由此可见本文数据集上理想的解决方案即是：迁移学习+参数微调。

迁移学习目前网络上提供的模型较多，综合考虑模型参数量、模型表现、模型可得性、模型训练计算资源需求量、模型易用性等因素，本文选择了Google开源的Inception-v3模型作为迁移学习的框架，该框架在ImageNet数据集上进行训练，该数据集有着1000个类别超过100万张的图片数据，该模型在ImageNet数据集上获得了优秀的表现。

3.2 模型构建

选择了Inception-v3模型后，本文的做法是将该模型瓶颈层的输出作为提取的特征，然后把这些特征经过一个全连接层进行分类，Inception-v3模型示意图如下：

在上图中最右边示意的Bottleneck feature 位置即是特征输出的位置，也就是说该模型的最后三层被丢弃，然后瓶颈层的结果作为本文新模型的特征提取结果，该结果是2048长度的特征向量。

获得该特征向量之后，需要将其输入一个全连接层进行分类，全连接层的模型示意图如下：

将以上两个模型连接到一起就构成了完整的模型，模型的输入是不同病理等级的切片图，而输出就是对切片的病理等级判断。

4.模型训练

训练过程不仅耗费计算资源，并且需要花费较多时间，为了合理利用计算资源、节约时间成本及有效提高模型训练效果，因而需要合理设计模型结构，主要包括这样几点：

缓存模型计算结果，加快计算过程
图像以一定数量批量输入，加快计算且充分利用计算资源
设置合理的训练参数以提高模型训练结果及减少训练次数

以下具体来讨论如何实现这些步骤及最终结果

4.1模型参数

模型参数主要包括以下几个：验证集合测试集百分比、学习率、一次输入图片数量及训练次数。

验证集测试集百分比：验证集用于在训练过程中实时测试模型的训练效果，而测试集则用于在最后测试模型的正确率。本文中每个类别的图像数量在300到500数量级，考虑到验证集和测试集需要能测试模型的效果，因而数据量不可太少，同时为了有效利用数据进行训练，则也不能划分太多数据出去，故而综合衡量之后选择以数据的10%作为验证集和测试集。
训练次数：训练次数即对模型进行多少次的训练，训练次数太少分类效果差，但是训练次数太多则会导致浪费时间，在本文中，先使用一个较小的数据量进行试训练，经过观察发现10000次的训练次数基本能让模型达到训练稳定，故而综合考虑后选择10000次作为训练次数。
学习率：学习率是在训练过程中对权重进行调整的一个比例因子，太大的学习率会导致模型波动不能收敛，甚至无法收敛，而太小的学习率则让模型收敛过慢，浪费训练时间和计算资源，在本文中，先使用一个较大的学习率（0.1）进行测试，然后不断减小，最终选用了一种指数下降的学习率，其衰减公式为：

$LR=BLR*e^{-\frac{i*ln(0.1/MLR)}{STEPS}}$

上式中，LR（Learning Rate）代表学习率；BLR（Base Learning Rate）代表基础学习率，本文取0.1；MLR（Minimum Learning Rate）代表最小学习率，即学习率衰减的最低限度，本文取0.001；STEPS即是训练的次数，本文统一取为10000次，i是当前训练次数，从0开始到9999。上述学习率在训练过程中的变化如下：

#####4.2 训练过程

初始参数设定好之后开始训练，每次训练需要微调参数以得到更好的训练结果，经过多次尝试，最终设定参数为：

学习率：指数衰减学习率，初始0.1，衰减极限0.001；
训练次数：10000
每次输入的数据量：100
测试集占比：10%
验证集占比：10%

4.3 结果分析

为了验证模型的鲁棒性，在上述最优参数下进行了10组测试，每组测试中随机打乱验证集与测试集，其测试结果如下：

上述图中，最粗的一条线代表最终测试集结果最好的一次训练，其正确率为：99.59%

10次训练的最终测试集正确率见表六。

训练次第	学习率	训练步长	测试集正确率
第1次	0.1–0.001	10000	0.9520000219345093
第2次	0.1–0.001	10000	0.9327731132507324
第3次	0.1–0.001	10000	0.9612069129943848
第4次	0.1–0.001	10000	0.9551020264625549
第5次	0.1–0.001	10000	0.9414414167404175
第6次	0.1–0.001	10000	0.9737991094589233
第7次	0.1–0.001	10000	0.9762845635414124
第8次	0.1–0.001	10000	0.9427480697631836
第9次	0.1–0.001	10000	0.9795918464660645
第10次	0.1–0.001	10000	0.9958506226539612

将以上正确率通过图形画出，可直观看出其变化情况，如下图所示：

从图中可看到：10次训练中，最终的验证集正确率都高于93%，最高的一次为第10次，正确率为99.6%，平均正确率为96.0%，波动的样本方差为0.00039842787655466335，可见，模型的稳定性非常高，在打乱验证集与测试集的情况下训练的效果都比较好。

5.总结

经过以上4个部分的谈论，本文的整个研究过程已经完整展示，最后，将简要给出本文的整体过程和模型的优劣势，并在此基础上提出模型的改进方向。

5.1 流程总结与优势分析

总体来看，本文研究包含了这样三个主要步骤：

数据预处理
模型构建
模型训练

数据预处理主要解决的问题是样本与临床数据的匹配，使得每个样本符合这样的构成：CT扫描数据+临床标记病灶区域+病理等级。首先进行的样本筛选解决了CT扫描数据和病理等级的匹配，接下来的切片提取和切片筛选解决了临床标记病灶区域获取问题，最后的切片大小统一则是为了模型训练提供标准规范化输入。

模型构建主要解决的问题是构建一个高效的模型来实现数据特征提取和等级分类；本文首先阐述了现有基于Pyradiomics 提取特征的研究方法的弊端，Pyradiomics提取特征具有明显物理意义的特点使得其对深层特征刻画能力不足，因而结合卷积神经网络的优秀的图像特征刻画能力提出了使用卷积神经网络提取特征的思想，然后考虑到数据集的数量不足和计算资源有限的事实，结合迁移学习思想最终构建一个基于迁移学习的CNN网络。

最后经过不断地参数调优最终训练出了一个分类正确率在95%左右的模型，并且通过实验证明了模型具有很强的鲁棒性。

5.2模型改进

本文的模型虽然具有较高的分类正确率，但是仍存在不足之处。首先，在进行数据预处理时，对切片进行筛选时，由于必须兼顾病理等级样本完整性和切片病灶，这样选择的病灶切片始终是具有不同标准的，对最后的结果自然也有影响，一个可行的改进方案是忽略样本差异，仅以切片病灶面积为差异指标，这样获得的切片会具有更好的可分类特征。其次，在最后的分类中，考虑到现有计算资源有限及时间有限，仅使用了一个全连接层进行分类，虽说这个分类器能够获得较高的分类正确率，但是如果可以使用不同的分类器来进行训练，那么可以验证什么分类器最合适，同时也能完善模型的完整性。最后，在进行模型在最优参数下的鲁棒性验证时仅使用了10次训练的结果作为对比分析，如果时间允许，完全可以再进行更多的训练来优化该过程。

5.3 结论

综合以上分析，本文通过分析现有研究流程，找出了其性能瓶颈，然后结合卷积神经网络，提出新的特征提取方法，在已有研究流程的基础上，完善了研究方法，同时，也将本文的数据集分类正确率提高到最高99.6%的水平；其次，本文构建的模型是具有普适性的，可以稍加改进就应用于不同的数据集进行特征提取及分类。再次，本文在构建模型的过程中综合考虑了计算资源和时间成本，构建的卷积神经网络模型在普通的个人笔记本上即可进行训练，因而时间成本和计算资源成本都是非常便宜的，而这对于深度学习模型来说是至关重要的；综合以上几点来看，本文的研究具有现实可应用性，具有可推广性，因而具有较高的实用价值！

人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
CentOS7下安装python3.8 讓丄帝愛伱 Linux 编程语言
查看系统版本#查看系统版本cat/etc/centos-release>CentOSLinuxrelease7.2.1511(Core)uname-a>Linuxlocalhost.localdomain3.10.0-327.el7.x86_64#1SMPThuNov1922:10:57UTC2015x86_64x86_64x86_64GNU/Linux#查看python版本python-V>Py
Ubuntu18.04切换python3.8版本波波维琦 python linux ubuntu
安装python3.8sudoaptinstallpython3.8赋予python优先级sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python3.82切换python默认版本sudoupdate-alternatives--configpython选择python3.8的编号，回车赋予python3优先级sudou
交叉编译python3.8 岁月金刀 python linux 开发语言
参考链接：交叉编译移植Python到arm架构下的Linux系统-白菜没我白-博客园Python3交叉编译步骤（二）-三方库的交叉编译-秀才哥哥-博客园一、先安装Ubantu虚拟机上的python：1，下载python3.8安装包2，安装依次执行如下步骤：./configureprefix=/usr/local/python3//prefix是指定安装目录，你可以自己新建目录安装到那里makema
python做飞机大战让敌机打子弹_python（pygame）滑稽大战(类似飞机大战) 教程青云若水
初始准备工作本项目使用的python3版本(如果你用python2，我不知会怎么样)Ide推荐大家选择pycharm(不同ide应该没影响)需要安装第三方库pygame，pygame安装方法(windows电脑，mac系统本人实测与pygame不兼容，强行运行本项目卡成ppt)电脑打开cmd命令窗口，输入pip3installpygame补充说明:由于众所周知的原因，安装过程中下载可能十分缓慢，甚
python异步--asyncio HWQlet python python异步编程
在python2.x和python3.x早期版本的时候，协程的主流实现方法是gevent，这个我之前讲过asyncio在python3.4后内置在python中了，在后面还有async/await，更后面有aiohttp，flask实现就有参照aiohttpasync和await分别又来替换早期协程的asyncio.coroutine和yieldfrom。从此以后，协程就是python中一个新的语
Centos7软件包管理(rpm、yum) Bulut0907 Linux centos 软件包管理 rpm yum yum源修改
目录1.rpm2.yum2.1修改yum源1.rpmRPM(RedHatPackageManager)，redhat系列操作系统里面的打包安装工具查询命令：查询安装的所有rpm软件包：rpm-qa查询指定rpm软件包，并显示详细信息：rpm-qipython3卸载命令：卸载软件包，不管是否有其它软件包依赖该软件包：rpm-e--nodeps软件包名称安装命令：安装rpm包，并显示详细信息和进度条(
python3+ffmpeg下载B站视频，附代码才华横溢吴道简爬虫 python windows
最近要去外面玩，旅途漫长，于是乎，就写了个代码，从B站上下载纪录片看，代码附后，请自取，如果觉得有用，麻烦点个赞，鼓励一下。感谢~~一、下载安装ffmpegFfmpeg是一款自由软件，用于视频和音频文件的处理，在本例中，我使用它进行视频文件和音频文件的合并。合并代码写在python脚本中，你只需下载好ffmpeg即可，而且因为合并代码中使用ffmpeg的绝对路径，所以也不用设置环境配置。Ffmpe
如何使用 Python 和 FFmpeg 下载 B站视频木觞清 7天熟练Python python ffmpeg 音视频
在这篇文章中，我们将讨论如何使用Python脚本结合FFmpeg下载并合并B站视频的流，生成一个完整的视频文件。具体来说，我们将通过B站的API获取视频的音频和视频流，然后使用FFmpeg下载并将它们合并成一个.mp4文件。前提条件Python：你需要安装Python，推荐使用Python3.6或更高版本。FFmpeg：确保你已经安装并配置好了FFmpeg。如果尚未安装，可以参考FFmpeg官方网
【ai】mocap：conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision 等风来不如迎风去 AI入门与实战人工智能 ubuntu conda
MotionCapubuntu18.04不知道为啥会依赖于ffmpeg、xorg渲染？安装pytorch就是会带上cudacudnn啥的pytorch【ai】tx2nx：安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的，还涉及到rapidjson所以python的环境隔离很重要。核心库-cudatoolkit=11.3-pytor
从 0 开始使用 cursor 开发一个移动端跨平台应用程序沐怡旸 react native
1.安装必要的工具和环境在开始之前，确保你的开发环境已经安装了以下工具：a.安装Node.js和npmReactNative依赖Node.js和npm（NodePackageManager）。你可以从Node.js官网下载并安装最新版本。b.安装PythonReactNative的Android开发需要Python。确保你已经安装了Python2.7或Python3.x。c.安装Java环境Rea
python函数支持哪些参数类型_Python函数的几种参数类型 weixin_39965283
以下代码均以Python3为基础理解。初识Python函数大部分常见的语言如C、Java、PHP、C#、JavaScript等属于C系语言，Python不属于他们中的一员（ruby亦然）。在这些语言中，Python也属于比较新奇的一派，就函数来说，它没有大括号，用def关键字定义一个函数，定义后用:然后换行tab指定函数函数的范围，当然也不存在什么分号。作为一个函数，那个它肯定是有参数的，Pyth
视频转音频, 音频转文字言之。 python 音视频
Ubuntu24环境准备#系统级依赖sudoaptupdate&&sudoaptinstall-yffmpegpython3-venvgitbuild-essentialpython3-dev#Python虚拟环境python3-mvenv~/ai_summarysource~/ai_summary/bin/activate核心工具链工具用途安装命令Whisper语音识别pipinstallope
用 Python 实现每秒百万级请求 weixin_33719619 python 网络后端
本文讲的是用Python实现每秒百万级请求，用Python可以每秒发出百万个请求吗？这个问题终于有了肯定的回答。许多公司抛弃Python拥抱其他语言就为了提高性能节约服务器成本。但是没必要啊。Python也可以胜任。Python社区近来针对性能做了很多优化。CPython3.6新的字典实现方式提升了解释器的总体性能。得益于更快的调用约定和字典查询缓存，CPython3.7会更快。对于计算密集型工作
Pycharm python解释器 unsupported python 3.1 解决大表哥在曾母暗沙 Python PyCharm python pycharm ide 解释器模式
Pycharm环境unsupportedpython3.1解决1.问题重现2.原因分析3.解决方法1.问题重现之前使用Pycharm2024.1.1的时候，环境配置的Python3.11.9，现在改成使用Pycharm2020.2.2，结果Python解释器显示“unsupportedpython3.1”，如下图：2.原因分析因为Pycharm2020.2.2支持的Python最高版本就是Pyth
python pip报错：Preparing metadata (pyproject.toml) ... error 我有一个魔盒其他 python pip 开发语言
环境：win11（Python3.9.13）原因：想安装低版本python，结果安装成了32位的，但是依赖包基本都是64位的。解决办法：重装64位python（可能还需要VisualStudio内安装“使用C++的桌面开发”）异常报错：Collectingmatplotlib~=3.0(fromgradio)Usingcachedhttps://pypi.tuna.tsinghua.edu.cn/
python安装scipy库出错_解决scipy安装（pip install scipy）失败,以及其他问题 weixin_39663933
解决scipy安装(pipinstallscipy)失败,以及其他问题解决：1.在scipy官方库中并没有适合Windows的python3.6相关版本，故需要在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy下载适合的版本，下载如：scipy‑0.19.1‑cp36‑cp36m‑win32.whl2.Windows中scipy安装成功后，还会存
win7下python3.6通过pip安装scipy报错的解决办法青松一夏 python
一、问题描述通过pip方式安装了numpy和sklearn，但是sklearn需要依赖于scipy，但当通过pip方式安装scipy时，报错：numpy.distutils.system_info.NotFoundError:nolapack/blasresourcesfound按照网上的教程，并没有找到真正的解决办法，后来我是通过如下方式解决的。二、我的解决方案（1）首先卸载numpypipun
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
centos7输入python -m bitsandbytes报错CUDA Setup failed despite GPU being available. Please run the follo 小太阳，乐向上 python 开发语言
在centos7.9系统中安装gpu驱动及cuda，跑大模型会报错，提示让输入python-mbitsandbytes依然报错：CUDASETUP:Loadingbinary/usr/local/python3/lib/python3.9/site-packages/bitsandbytes/libbitsandbytes_cuda117.so.../lib64/libstdc++.so.6:ve
python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb） flood_d mongodb python selenium pyquery 爬虫
1.环境须知做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。2.直接上代码spider.pyimportrefromconfigimport*importpymongofromseleniumimportwebdriverfromselenium.common.exceptionsimportT
【python】图形用户界面和游戏开发 usp1994 python ui ide
图形用户界面和游戏开发文章目录图形用户界面和游戏开发基于tkinter模块的GUI使用Pygame进行游戏开发制作游戏窗口在窗口中绘图加载图像实现动画效果碰撞检测事件处理基于tkinter模块的GUIGUI是图形用户界面的缩写，图形化的用户界面对使用过计算机的人来说应该都不陌生，在此也无需进行赘述。Python默认的GUI开发模块是tkinter（在Python3以前的版本中名为Tkinter），
python 游戏开发cocos2d库安装与使用范哥来了 python cocos2d 开发语言
Cocos2d-x是一个广泛使用的开源游戏开发框架，支持多种编程语言，包括Python。对于Python开发者来说，通常使用的是Cocos2d-py或者更现代的Cocos2d-x的Python绑定版本。这里我将指导你如何安装和开始使用Cocos2d-py。安装步骤安装Python：确保你的系统上已经安装了Python3.x版本。你可以从Python官方网站下载最新版的Python。安装pip：pi
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
Win7 64 位 Vcode Python安装与环境配置 qq_40094167 机器学习 python 数据挖掘
一、对于win764位的Python版本，官网目前是Python3.8.10。千万不要装错哈哈二、Vcode版本，可以直接在官网或者360软件管家安装，都比较方便。但安装之前请先安装Python，然后安装Vcode。三、Vcode插件配置，本人插件配置多数是根据之前liunx系统配置的，里面许多关键字颜色和大小个人比较喜欢。@1codeRunner即代码运行@2RainbowBrackets彩虹花
Python从0到100（三十四）：Python中的urllib模块使用指南是Dream呀 python 开发语言
1.urllib模块概述在Python中，除了广泛使用的requests模块之外，urllib模块也是处理HTTP请求的重要工具。urllib模块在Python2中分为urllib和urllib2两个模块，而在Python3中，它们被合并为一个urllib模块。本文将重点介绍Python3中的urllib模块及其使用方法。2.urllib模块的基本方法介绍2.1urllib.request.url
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
使用 DeepSeek-R1 为 RAG 运行本地 Gradio 应用程序呱牛 do IT 人工智能 deepseek
让我们使用Gradio构建一个简单的演示应用程序，以使用DeepSeek-R1查询和分析文档。第1步：先决条件在深入研究实现之前，我们确保已安装以下工具和库：Python3.8+Python3.8+版Langchain：用于构建由大型语言模型（）LLMs提供支持的应用程序的框架，支持轻松检索、推理和工具集成Chromadb：一个高性能的向量数据库，专为高效的相似性搜索和嵌入存储而设计。Gradio
统计机器学习 (Statistical Machine Learning) 原理与代码实例讲解 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
统计机器学习(StatisticalMachineLearning)原理与代码实例讲解1.背景介绍统计机器学习是现代人工智能和数据科学的核心领域之一。它结合了统计学和计算机科学的理论与方法，通过数据驱动的方式来构建预测模型和决策系统。统计机器学习不仅在学术研究中占据重要地位，还在工业界有广泛应用，如推荐系统、图像识别、自然语言处理等。2.核心概念与联系2.1统计学与机器学习的关系统计学关注数据的收
Python搭建静态web服务器 7 号 Python python
Python内置的web静态服务器Python内置的`http.server`模块可以快速启动一个简单的HTTP服务器。在Python3中，打开命令行或终端，在你想要作为静态服务器根目录的文件夹下，运行以下命令：python-mhttp.server8000这将会在当前目录启动一个HTTP服务器，监听端口8000，端口可以随意指定。你可以在浏览器中访问`http://localhost:8000`
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam