hzbooks

干货收藏！一文看懂8个常用Python库从安装到应用

导读：Python本身的数据分析功能并不强，需要安装一些第三方扩展库来增强其相应的功能。本文将对NumPy、SciPy、Matplotlib、pandas、StatsModels、scikit-learn、Keras、Gensim等库的安装和使用进行简单的介绍。

作者：张良均谭立云刘名军江建明

来源：大数据DT（ID：hzdashuju）

如果读者安装的是Anaconda发行版，那么它已经自带了以下库：NumPy、SciPy、Matplotlib、pandas、scikit-learn。

本文主要是对这些库进行简单的介绍，读者也可以到官网阅读更加详细的使用教程。

NumPy：提供数组支持以及相应的高效的处理函数
SciPy：提供矩阵支持以及矩阵相关的数值计算模块
Matplotlib：强大的数据可视化工具、作图库
pandas：强大、灵活的数据分析和探索工具
StatsModels：统计建模和计量经济学，包括描述统计、统计模型估计和推断
scikit-learn：支持回归、分类、聚类等强大的机器学习库
Keras：深度学习库，用于建立神经网络以及深度学习模型
Gensim：用来做文本主题模型的库，文本挖掘可能会用到

01 NumPy

Python并没有提供数组功能。虽然列表可以完成基本的数组功能，但它不是真正的数组，而且在数据量较大时，使用列表的速度就会很慢。为此，NumPy提供了真正的数组功能以及对数据进行快速处理的函数。

NumPy还是很多更高级的扩展库的依赖库，我们后面介绍的SciPy、Matplotlib、pandas等库都依赖于它。值得强调的是，NumPy内置函数处理数据的速度是C语言级别的，因此在编写程序的时候，应当尽量使用其内置函数，避免效率瓶颈的（尤其是涉及循环的问题）出现。

在Windows操作系统中，NumPy的安装跟普通第三方库的安装一样，可以通过pip命令进行，命令如下：

pip install numpy

也可以自行下载源代码，然后使用如下命令安装：

python setup.py install

在Linux操作系统下，上述方法也是可行的。此外，很多Linux发行版的软件源中都有Python常见的库，因此还可以通过Linux系统自带的软件管理器安装，如在Ubuntu下可以用如下命令安装：

sudo apt-get install python-numpy

安装完成后，可以使用NumPy对数据进行操作，如代码清单2-27所示。

代码清单2-27 使用NumPy操作数组

# -*- coding: utf-8 -*
import numpy as np                     # 一般以np作为NumPy库的别名
a = np.array([2, 0, 1, 5])             # 创建数组
print(a)                               # 输出数组
print(a[:3])                           # 引用前三个数字（切片）
print(a.min())                         # 输出a的最小值
a.sort()                               # 将a的元素从小到大排序，此操作直接修改a，因此这时候a为[0, 1, 2, 5]
b= np.array([[1, 2, 3], [4, 5, 6]])    # 创建二维数组
print(b*b)                             # 输出数组的平方阵，即[[1, 4, 9], [16, 25, 36]]

NumPy是Python中相当成熟和常用的库，因此关于它的教程有很多，最值得一看的是其官网的帮助文档，其次还有很多中英文教程，读者遇到相应的问题时，可以查阅相关资料。

参考链接：

http://www.numpy.org

http://reverland.org/python/2012/08/22/numpy

02 SciPy

如果说NumPy让Python有了MATLAB的味道，那么SciPy就让Python真正成为半个MATLAB了。NumPy提供了多维数组功能，但它只是一般的数组，并不是矩阵，比如当两个数组相乘时，只是对应元素相乘，而不是矩阵乘法。SciPy提供了真正的矩阵以及大量基于矩阵运算的对象与函数。

SciPy包含的功能有最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算，显然，这些功能都是挖掘与建模必需的。

SciPy依赖于NumPy，因此安装之前得先安装好NumPy。安装SciPy的方式与安装NumPy的方法大同小异，需要提及的是，在Ubuntu下也可以用类似的命令安装SciPy，安装命令如下：

sudo apt-get install python-scipy

安装好SciPy后，使用SciPy求解非线性方程组和数值积分，如代码清单2-28所示。

代码清单2-28 使用SciPy求解非线性方程组和数值积分

# -*- coding: utf-8 -*
# 求解非线性方程组2x1-x2^2=1,x1^2-x2=2
from scipy.optimize import fsolve       # 导入求解方程组的函数
def f(x):                               # 定义要求解的方程组
    x1 = x[0]
    x2 = x[1]
    return [2*x1 - x2**2 - 1, x1**2 - x2 -2]

result = fsolve(f, [1,1])               # 输入初值[1, 1]并求解
print(result)                           # 输出结果，为array([ 1.91963957,  1.68501606])

# 数值积分
from scipy import integrate             # 导入积分函数
def g(x):                               # 定义被积函数
    return (1-x**2)**0.5

pi_2, err = integrate.quad(g, -1, 1)    # 积分结果和误差
print(pi_2 * 2)                         # 由微积分知识知道积分结果为圆周率pi的一半

参考链接：

http://www.scipy.org

http://reverland.org/python/2012/08/24/scipy

03 Matplotlib

不论是数据挖掘还是数学建模，都要面对数据可视化的问题。对于Python来说，Matplotlib是最著名的绘图库，主要用于二维绘图，当然也可以进行简单的三维绘图。它不仅提供了一整套和MATLAB相似但更为丰富的命令，让我们可以非常快捷地用Python可视化数据，而且允许输出达到出版质量的多种图像格式。

Matplotlib的安装并没有什么特别之处，可以通过“pip install matplotlib”命令安装或者自行下载源代码安装，在Ubuntu下也可以用类似的命令安装，命令如下：

sudo apt-get install python-matplotlib

需要注意的是，Matplotlib的上级依赖库相对较多，手动安装的时候，需要逐一把这些依赖库都安装好。安装完成后就可以牛刀小试了。下面是一个简单的作图例子，如代码清单2-29所示，它基本包含了Matplotlib作图的关键要素，作图效果如图2-5所示。

代码清单2-29 Matplotlib作图示例

# -*- coding: utf-8 -*-
import numpy as np
import matplotlib.pyplot as plt                    # 导入Matplotlib

x = np.linspace(0, 10, 1000)                       # 作图的变量自变量
y = np.sin(x) + 1                                  # 因变量y
z = np.cos(x**2) + 1                               # 因变量z

plt.figure(figsize = (8, 4))                       # 设置图像大小
plt.plot(x,y,label = '$\sin x+1$', color = 'red', linewidth = 2)
                                                   # 作图，设置标签、线条颜色、线条大小
plt.plot(x, z, 'b--', label = '$\cos x^2+1$')      # 作图，设置标签、线条类型
plt.xlabel('Time(s) ')                             # x轴名称
plt.ylabel('Volt')                                 # y轴名称
plt.title('A Simple Example')                      # 标题
plt.ylim(0, 2.2)                                   # 显示的y轴范围
plt.legend()                                       # 显示图例
plt.show()                                         # 显示作图结果

▲图2-5 Matplotlib的作图效果展示

如果读者使用的是中文标签，就会发现中文标签无法正常显示，这是因为Matplotlib的默认字体是英文字体，解决方法是在作图之前手动指定默认字体为中文字体，如黑体（Sim-Hei），命令如下：

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签

其次，保存作图图像时，负号有可能不能显示，对此可以通过以下代码解决：

plt.rcParams['axes.unicode_minus'] = False    # 解决保存图像是负号'-'显示为方块的问题

这里有一个小建议：有时间多去Matplotlib提供的“画廊”欣赏用它做出的漂亮图片，也许你就会慢慢爱上Matplotlib作图了。

画廊网址：

http://matplotlib.org/gallery.html

参考链接：

http://matplotlib.org

http://reverland.org/python/2012/09/07/matplotlib-tutorial

04 pandas

pandas是Python下最强大的数据分析和探索工具。它包含高级的数据结构和精巧的工具，使得用户在Python中处理数据非常快速和简单。

pandas建造在NumPy之上，它使得以NumPy为中心的应用使用起来更容易。pandas的名称来自于面板数据（Panel Data）和Python数据分析（Data Analysis），它最初作为金融数据分析工具被开发，由AQR Capital Management于2008年4月开发问世，并于2009年底开源出来。

pandas的功能非常强大，支持类似SQL的数据增、删、查、改，并且带有丰富的数据处理函数；支持时间序列分析功能；支持灵活处理缺失数据；等等。事实上，单纯地用pandas这个工具就足以写一本书，读者可以阅读pandas的主要作者之一Wes Mc-Kinney写的《利用Python进行数据分析》来学习更详细的内容。

1. 安装

pandas的安装相对来说比较容易一些，只要安装好NumPy之后，就可以直接安装了，通过pip install pandas命令或下载源码后通过python setup.py install命令安装均可。

由于我们频繁用到读取和写入Excel，但默认的pandas还不能读写Excel文件，需要安装xlrd（读）度和xlwt（写）库才能支持Excel的读写。为Python添加读取/写入Excel功能的命令如下：

pip install xlrd          # 为Python添加读取Excel的功能
pip install xlwt          # 为Python添加写入Excel的功能

2. 使用

在后面的章节中，我们会逐步展示pandas的强大功能，而在本节，我们先以简单的例子一睹为快。

首先，pandas基本的数据结构是Series和DataFrame。Series顾名思义就是序列，类似一维数组；DataFrame则相当于一张二维的表格，类似二维数组，它的每一列都是一个Series。

为了定位Series中的元素，pandas提供了Index这一对象，每个Series都会带有一个对应的Index，用来标记不同的元素，Index的内容不一定是数字，也可以是字母、中文等，它类似于SQL中的主键。

类似的，DataFrame相当于多个带有同样Index的Series的组合（本质是Series的容器），每个Series都带有一个唯一的表头，用来标识不同的Series。pandas中常用操作的示例如代码清单2-30所示。

代码清单2-30 pandas中的常用操作

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd                              # 通常用pd作为pandas的别名。

s = pd.Series([1,2,3], index=['a', 'b', 'c'])    # 创建一个序列s
                                                 # 创建一个表
d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])
d2 = pd.DataFrame(s)                             # 也可以用已有的序列来创建数据框

d.head()                                         # 预览前5行数据
d.describe()                                     # 数据基本统计量

# 读取文件，注意文件的存储路径不能带有中文，否则读取可能出错。
pd.read_excel('data.xls')                    # 读取Excel文件，创建DataFrame。
pd.read_csv('data.csv', encoding='utf-8')    # 读取文本格式的数据，一般用encoding指定编码。

由于pandas是本书的主力工具，在后面将会频繁使用它，因此这里不再详细介绍，后文会更加详尽地讲解pandas的使用方法。

参考链接：

http://pandas.pydata.org/pandas-docs/stable/

05 StatsModels

pandas着重于数据的读取、处理和探索，而StatsModels则更加注重数据的统计建模分析，它使得Python有了R语言的味道。StatsModels支持与pandas进行数据交互，因此，它与pandas结合成为Python下强大的数据挖掘组合。

安装StatsModels相当简单，既可以通过pip命令安装，又可以通过源码安装。对于Windows用户来说，官网上甚至已经有编译好的exe文件可供下载。如果手动安装的话，需要自行解决好依赖问题，StatsModels依赖于pandas（当然也依赖于pandas所依赖的库），同时还依赖于Pasty（一个描述统计的库）。

使用StatsModels进行ADF平稳性检验，如代码清单2-31所示。

代码清单2-31 使用StatsModels进行ADF平稳性检验

# -*- coding: utf-8 -*-
from statsmodels.tsa.stattools import adfuller as ADF    # 导入ADF检验
import numpy as np

ADF(np.random.rand(100))                                 # 返回的结果有ADF值、p值等

参考链接：

http://statsmodels.sourceforge.net/stable/index.html

06 scikit-learn

从该库的名字可以看出，这是一个与机器学习相关的库。不错，scikit-learn是Python下强大的机器学习工具包，它提供了完善的机器学习工具箱，包括数据预处理、分类、回归、聚类、预测、模型分析等。

scikit-learn依赖于NumPy、SciPy和Matplotlib，因此，只需要提前安装好这几个库，然后安装scikit-learn基本上就没有什么问题了，安装方法跟前几个库的安装一样，可以通过pip install scikit-learn命令安装，也可以下载源码自行安装。

使用scikit-learn创建机器学习的模型很简单，示例如代码清单2-32所示。

代码清单2-32 使用scikit-learn创建机器学习模型

# -*- coding: utf-8 -*-
from sklearn.linear_model import LinearRegression     # 导入线性回归模型
model = LinearRegression()                            # 建立线性回归模型
print(model)

1. 所有模型提供的接口有

对于训练模型来说是model.fit()，对于监督模型来说是fit(X, y)，对于非监督模型是fit(X)。

2. 监督模型提供如下接口

model.predict(X_new)：预测新样本。
model.predict_proba(X_new)：预测概率，仅对某些模型有用（比如LR）。
model.score()：得分越高，fit越好。

3. 非监督模型提供如下接口

model.transform()：从数据中学到新的“基空间”。
model.fit_transform()：从数据中学到新的基并将这个数据按照这组“基”进行转换。

Scikit-learn本身提供了一些实例数据供我们上手学习，比较常见的有安德森鸢尾花卉数据集、手写图像数据集等。

安德森鸢尾花卉数据集有150个鸢尾花的尺寸观测值，如萼片长度和宽度，花瓣长度和宽度；还有它们的亚属：山鸢尾（iris setosa）、变色鸢尾（iris versicolor）和维吉尼亚鸢尾（iris virginica）。导入iris数据集并使用该数据训练SVM模型，如代码清单2-33所示。

代码清单2-33 导入iris数据集并训练SVM模型

# -*- coding: utf-8 -*-
from sklearn import datasets                # 导入数据集

iris = datasets.load_iris()                 # 加载数据集
print(iris.data.shape)                      # 查看数据集大小

from sklearn import svm                     # 导入SVM模型

clf = svm.LinearSVC()                       # 建立线性SVM分类器
clf.fit(iris.data, iris.target)             # 用数据训练模型
clf.predict([[ 5.0,  3.6,  1.3,  0.25]])    # 训练好模型之后，输入新的数据进行预测
clf.coef_                                   # 查看训练好模型的参数

参考链接：

http://scikit-learn.org/stable/

07 Keras

scikit-learn已经足够强大了，然而它并没有包含这一强大的模型—人工神经网络。人工神经网络是功能相当强大但是原理又相当简单的模型，在语言处理、图像识别等领域都有重要的作用。近年来逐渐流行的“深度学习”算法，实质上也是一种神经网络，可见在Python中实现神经网络是非常必要的。

本书用Keras库来搭建神经网络。事实上，Keras并非简单的神经网络库，而是一个基于Theano的强大的深度学习库，利用它不仅可以搭建普通的神经网络，还可以搭建各种深度学习模型，如自编码器、循环神经网络、递归神经网络、卷积神经网络等。由于它是基于Theano的，因此速度也相当快。

Theano也是Python的一个库，它是由深度学习专家Yoshua Bengio带领的实验室开发出来的，用来定义、优化和高效地解决多维数组数据对应数学表达式的模拟估计问题。它具有高效实现符号分解、高度优化的速度和稳定性等特点，最重要的是它还实现了GPU加速，使得密集型数据的处理速度是CPU的数十倍。

用Theano就可以搭建起高效的神经网络模型，然而对于普通读者来说门槛还是相当高的。Keras正是为此而生，它大大简化了搭建各种神经网络模型的步骤，允许普通用户轻松地搭建并求解具有几百个输入节点的深层神经网络，而且定制的自由度非常大，读者甚至因此惊呼：搭建神经网络可以如此简单！

1. 安装

安装Keras之前首先需要安装NumPy、SciPy和Theano。安装Theano之前首先需要准备一个C++编译器，这在Linux系统下是自带的。因此，在Linux系统下安装Theano和Keras都非常简单，只需要下载源代码，然后用python setup.py install安装就行了，具体可以参考官方文档。

可是在Windows系统下就没有那么简单了，因为它没有现成的编译环境，一般而言是先安装MinGW（Windows系统下的GCC和G++），然后再安装Theano（提前装好NumPy等依赖库），最后安装Keras，如果要实现GPU加速，还需要安装和配置CUDA。

值得一提的是，在Windows系统下的Keras速度会大打折扣，因此，想要在神经网络、深度学习做深入研究的读者，请在Linux系统下搭建相应的环境。

参考链接：

http://deeplearning.net/software/theano/install.html#install

2. 使用

用Keras搭建神经网络模型的过程相当简单，也相当直观，就像搭积木一般，通过短短几十行代码，就可以搭建起一个非常强大的神经网络模型，甚至是深度学习模型。简单搭建一个MLP（多层感知器），如代码清单2-34所示。

代码清单2-34 搭建一个MLP（多层感知器）

# -*- coding: utf-8 -*-
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.optimizers import SGD

model = Sequential()                # 模型初始化
model.add(Dense(20, 64))            # 添加输入层（20节点）、第一隐藏层（64节点）的连接
model.add(Activation('tanh'))       # 第一隐藏层用tanh作为激活函数
model.add(Dropout(0.5))             # 使用Dropout防止过拟合
model.add(Dense(64, 64))            # 添加第一隐藏层（64节点）、第二隐藏层（64节点）的连接
model.add(Activation('tanh'))       # 第二隐藏层用tanh作为激活函数
model.add(Dropout(0.5))             # 使用Dropout防止过拟合
model.add(Dense(64, 1))             # 添加第二隐藏层（64节点）、输出层（1节点）的连接
model.add(Activation('sigmoid'))    # 输出层用sigmoid作为激活函数

sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)    # 定义求解算法
model.compile(loss='mean_squared_error', optimizer=sgd)       # 编译生成模型，损失函数为平均误差平方和

model.fit(X_train, y_train, nb_epoch=20, batch_size=16)       # 训练模型
score = model.evaluate(X_test, y_test, batch_size=16)         # 测试模型

要注意的是，Keras的预测函数跟scikit-learn有所差别，Keras用model.predict()方法给出概率，用model.predict_classes()给出分类结果。

参考链接：

https://keras.io/

08 Gensim

在Gensim官网中，它对自己的简介只有一句话：topic modelling for humans！

Gensim用来处理语言方面的任务，如文本相似度计算、LDA、Word2Vec等，这些领域的任务往往需要比较多的背景知识。

在这一节中，我们只是提醒读者有这么一个库的存在，而且这个库很强大，如果读者想深入了解这个库，可以去阅读官方帮助文档或参考链接。

值得一提的是，Gensim把Google在2013年开源的著名的词向量构造工具Word2Vec编译好了，作为它的子库，因此需要用到Word2Vec的读者也可以直接使用Gensim，而无须自行编译了。

Gensim的作者对Word2Vec的代码进行了优化，所以它在Gensim下的表现比原生的Word2Vec还要快。（为了实现加速，需要准备C++编译器环境，因此，建议使用Gensim的Word2Vec的读者在Linux系统环境下运行。）

下面是一个Gensim使用Word2Vec的简单例子，如代码清单2-35所示。

代码清单2-35 Gensim使用Word2Vec的简单示例

# -*- coding: utf-8 -*-
import gensim, logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level= logging.INFO)
# logging是用来输出训练日志

# 分好词的句子，每个句子以词列表的形式输入
sentences = [['first', 'sentence'], ['second', 'sentence']]

# 用以上句子训练词向量模型
model = gensim.models.Word2Vec(sentences, min_count=1)

print(model['sentence'])    # 输出单词sentence的词向量。

参考链接：

http://radimrehurek.com/gensim/

关于作者：张良均，资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验，擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析，对机器学习等AI技术驱动的数据分析也有深入研究。

本文摘编自《Python数据分析与挖掘实战》（第2版），经出版方授权发布。

延伸阅读《Python数据分析与挖掘实战》

点击上图了解及购买

转载请联系微信：DoctorData

推荐语：畅销书全新升级，第1版销售超过10万册，被国内100余所高等院校采用为教材，同时被广大数据科学工作者奉为经典，是该领域公认的事实标准。作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验，不仅掌握行业的最新技术和实践方法，而且洞悉学生和老师的需求与痛点。

本书作者、资深大数据挖掘与分析专家、模式识别专家、AI技术专家张良均将做客华章直播间，为大家讲述数据分析与挖掘实战，跟着张良均老师学大数据准没错~

直播内容：

分享基于开源工具快速开发企业级大数据挖掘应用的实战经验
分析未来五年企业对大数据应用型人才需求状况，以及如何快速入门大数据挖掘领域
推荐适合初学者的基于Python引擎、用于数据分析与挖掘建模的开源平台

第一时间给你直播最全资讯

扫码预约直播

往期精彩回顾

书讯 | 4月书讯 | 一大波好书来袭，最美华章四月天

赠书 | 【第1期】MySQL为什么叫MySQL
干货 | 用户画像的核心技术盘点

收藏 | 有图有真相——图神经网络到底是什么？

你可能感兴趣的:(干货收藏！一文看懂8个常用Python库从安装到应用)

FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
pgAdmin4在mac m1上面简单使用（Docker）亚林瓜子 macos docker 容器 pg pgAdmin4 postgredql GUI
问题想要在本地简单了解一下pgAdmin4一些简单功能。故需要在本机先安装看一看。安装步骤拉取docker镜像dockerpulldpage/pgadmin4直接简单运行pgAdmin4dockerrun--namepgAdmin4-p5050:80\-e"[email protected]"\-e"PGADMIN_DEFAULT_PASSWORD=Supe
python实现word文档合并 v2.0 task138 python自动化 python 自动化运维开发
目录前言要求运行效果脚本下载链接前言之前发表了一个小工具，python用于合并word文档以完成特定的工作任务，现在领导给出了新需求，适当的调整了一下word文档的合并情况。同时，各位同事反馈说，环境部署太难了，脚本的使用成本比较高，难度大，所以我这次把脚本打包成一个EXE可执行文件，直接双击即可使用。要求由于脚本的具体逻辑发生了变化，因此，exe文件的同级目录下，一定要存在一个txt文件，否则无
PSINS工具箱函数介绍——ggnss（ggpsvars+gbdvars+gglovars） MATLAB卡尔曼 PSINS函数 matlab PSINS
文章目录关于工具箱工具箱概述学习路径指南GNSS参数初始化函数`ggnss`函数功能参数体系结构典型应用场景系统参数初始化操作指南执行流程运行结果解析函数源码深度解析代码架构扩展开发建议关于工具箱kfinit是kf的参数初始化函数，用于初始化滤波参数本文所述的代码需要基于PSINS工具箱，工具箱的讲解：PSINS初学指导：https://blog.csdn.net/callmeup/article
[附源码]计算机毕业设计基于SpringBoot的小说阅读系统计算机毕设程序设计 spring boot java 后端
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
ZT2 小美的因子查询 bingw0114 算法数据结构
描述小美对偶数因子很感兴趣，她将进行T次询问，每次都会给出一个正整数x，请你告诉她x是否存在至少一个偶数因子。也就是说x是否存在某个因子[注1]是偶数。注1：y是x的因子，当且仅当xmody=0。输入描述：每个测试文件均包含多组测试数据。第一行输入一个整数T(1≤T≤10^5)代表数据组数，每组测试数据描述如下：在一行
瑞芯微平台RK3568系统开发（9）移远EC20 4G模块驱动调试龙猫不是猫！瑞芯微平台开发嵌入式硬件瑞芯微 RK
1.在RK3568开发板上调试4G(EC20)驱动1.1查看RK3568关于4G模块的原理图，获取需要配置的信息1.2需要配置的信息如下14G模块电源使能引脚GPIO4_C324G模块W_DISABLE1引脚GPIO4_B534G模块复位引脚GPIO4_B41.3DTS配置如下{rk_modem:rk-modem{compatible="4g-modem-platdata";pinctrl-nam
Spring IoC容器的两大功能 Mr_Zerone SpringFramework spring java 后端
1.控制反转（1）没有控制反转的情况下常规思路下，也就是在没有控制反转的情况下，程序员需要通过编写应用程序来创建（new关键字）和使用对象。（2）存在控制反转的情况下控制反转主要是针对对象的创建和调用控制而言的。应用程序需要使用一个对象时，不再是由程序员写的应用程序通过new关键字来直接创建该对象，而是由SpringIoC容器来创建和管理，即创建和管理对象的控制权由应用程序转移到IoC容器。我们的
认识Spring IoC容器和组件 Mr_Zerone SpringFramework spring java 后端
1.传统Web项目开发流程传统Web项目在实现业务流程时，往往需要将Controller/Service/Dao，这三层先分别创建一个全局属性,上图中用BookController/BookService/BookDao来具体说明。当浏览器发送过来请求时，我们先调用全局属性中的BookCotroller对象bookController，在bookController中引用全局属性中的BookSer
远程桌面的端口号是多少? 阿7_QuQ 网络 windows 服务器
远程桌面（RemoteDesktop）是一种用于远程访问和控制计算机的技术，它允许用户通过网络连接到远程计算机并以图形化界面进行操作。远程桌面使用的端口号通常是3389。在Windows操作系统中，远程桌面协议（RemoteDesktopProtocol，简称RDP）默认使用3389端口。当您启用远程桌面功能并允许其他计算机通过网络连接时，远程桌面会监听3389端口，等待远程连接的请求。需要注意的
【k8s应用管理】kubernetes HPA+rancher Karoku066 kubernetes rancher 容器运维云原生
文章目录KubernetesHPA部署指南概述部署metrics-server部署HPARancher管理Kubernetes集群指南实验环境安装及配置RancherKubernetesHPA部署指南概述KubernetesHPA（HorizontalPodAutoscaling）可以根据Pod的CPU利用率自动调整Deployment、ReplicationController或ReplicaS
SMBJ20A 二极管的作用揭秘 GR6692 二极管数据库管理员 eclipse python
30KPA84A单向TVS瞬态抑制二极管二极管产品已经跟我们的生活有着密不可分的联系了，TVS瞬态抑制二极管，是一种高效能保护二极管，产品体积小、功率大、响应快等诸多优点，产品应用广泛。TVS瞬态抑制二极管30KPA84A，是一种二极管形式的高效能被动保护器件贴片TVS瞬态抑制二极管详情简介TVS瞬态抑制二极管30KPA84A极性(单双向)：单向VRWM(V)电压84V最大箝位电压@IPP：139
GenAI 平台，3 分钟即可构建基于 Claude、DeepSeek 的 AI Agent DO_Community 人工智能
DigitalOcean云服务在前不久发布了GenAI平台——一个让任何团队都能在几分钟内构建和部署AI代理的平台。DigitalOcean的GenAI平台持续扩展，让人工智能驱动的开发变得更加易用、灵活且强大。近日，Digitalocean宣布将Anthropic的Claude模型和DeepSeekR1引入Digitalocean的生态系统，为你提供更多构建和部署AI应用的选择。通过Anthro
安装配置MAVEN ByteVoyager maven java
安装配置MAVEN1.获取安装包下载apache-maven-3.8.1-bin.zip，下载地址：https://archive.apache.org/dist/maven/maven-3/3.8.1/binaries/apache-maven-3.8.1-bin.zip。2.解压maven压缩包3.配置maven环境变量新建环境变量MAVEN_HOME:右击【此电脑】->【属性】->【高级系统
想品客老师的第十三天：宏任务、微任务--js任务调度流程 Au_ust js javascript 前端开发语言
同步->微任务->宏任务->同步......定时器的任务是宏任务，无论等待时间短还是长，都先进行同步任务，进行同步任务的时候定时器正常计时，等到同步任务结束，宏任务被放到宏任务队列里，就可以直接执行定时器内的任务如果有两个定时器，在等完同步任务结束后，这两个定时器谁定的时间短，也就是计时的快，就先把谁放进宏任务队列里微任务的执行举个例子就是：例如这段代码会怎么输出setTimeout(()=>{
工控安全双评合规：等保测评与商用密码共铸新篇章网安导师小李安全网络 web安全等保评测安全能力建设网络安全
01.双评合规概述2017年《中华人民共和国网络安全法》开始正式施行，网络安全等级测评工作也在全国范围内按照相关法律法规和技术标准要求全面落实实施。2020年1月《中华人民共和国密码法》开始正式施行，商用密码应用安全性评估也在有序推广和逐步推进。网络安全等级测评和密码应用安全性评估已经成为我国网络运营者必须依法开展的两项合规测评活动。《密码法》第二十七条明确提出，商用密码应用安全性评估应当与关键信
线性回归理论狂踹瘸子那条好脚 python
###线性回归与Softmax回归####线性回归线性回归是一种用于估计连续值的回归方法。它的应用场景非常广泛，比如在房地产市场中，参观一个房子后，我们可以通过线性回归模型来估计房子的价格，从而决定出价。线性回归的核心思想是通过训练数据来学习参数，使得模型的预测值与真实值之间的差异最小化。在神经网络中，线性回归可以看作是一个单层神经网络。通过损失函数来衡量预测值与真实值之间的差异，常用的损失函数包
网络安全等级保护制度详解，一文掌握核心要点！_等级保护相关政策和法律法规～小羊没烦恼～ web安全安全网络服务器数据库
一、等级保护制度发展情况等级保护制度的法律依据Ø《计算机信息系统安全保护条例》（1994年GeneralOfficeoftheStateCouncil第147号令）公安部主管全国计算机信息系统安全保护工作。计算机信息系统实行安全等级保护，安全等级的划分标准和安全等级保护的具体办法，由公安部会同有关部门制定。Ø《中华人民共和国警察法》（1995，2012）人民警察履行“监督管理计算机信息系统的安全保
2025年三个月自学手册网络安全（黑客技术）网安kk web安全安全网络网络安全人工智能
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航
入门网络安全工程师要学习哪些内容【2025年寒假最新学习计划】白帽黑客2659 学习 web安全安全网络安全密码学
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对网络安全工程师还是不了解，不知道网络安全工程师需要学什么?知了堂小编总结出以下要点。网络安全工程师是一个概称，学习的东西很多，具体学什么看自己以后的职业定位。如果你以后想成为安全产品工程师，学的内容侧重点就和渗透测试工程师不一样，如果你想成为安全开发
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 安全 web安全网络网络安全 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
在项目中调用本地Deepseek（接入本地Deepseek） mr_cmx AI ai 前端 DeepSeek AI
前言之前发表的文章已经讲了如何本地部署Deepseek模型，并且如何给Deepseek模型投喂数据、搭建本地知识库，但大部分人不知道怎么应用，让自己的项目接入AI模型。文末有彩蛋哦！！！要接入本地部署的deepseek，我就要利用到我们之前部署时安装的ollama服务，并调用其API本地API接口1、生成文本（GenerateText）url:POST/api/generate功能：向模型发送提示
一键安装KES-RWC读写分离集群 banjin kingbase 人大金仓
一、KES-RWC读写分离集群介绍金仓数据库读写分离集群软件在金仓数据守护集群软件的基础上增加了对应用透明的读写负载均衡能力。该类集群中所有备库均可对外提供查询能力，从而减轻了主库的读负载压力，可实现更高的事务吞吐率；该软件支持在多个备库间进行读负载均衡。其成员可能包括主节点（primarynode）、备节点（standbynode）、辅助节点（witnessnode）、备份节点（reponode
【后端】k8s 骑鱼过海的猫123 kubernetes 容器云原生
1.命令1.1获取service服务获取集群内所有命名空间的service服务sudokubectlgetservice--all-namespaces获取集群内指定命名空间的service服务sudokubectlgetservice-n命名空间当权限限制到一个命名空间时,只能使用下面这个sudokubectl-n命名空间getservice获取集群内当前命名空间的service服务sudoku
DeepSeek与ChatGPT：会取代搜索引擎和人工客服的人工智能革命云边有个稻草人热门文章 chatgpt 搜索引擎人工智能 DeepSeek
云边有个稻草人-CSDN博客在众多创新技术中，DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力，能够改变我们与计算机交互的方式，帮助我们高效地获取信息，增强智能服务。本文将深入探讨这两项技术如何结合使用，为用户提供更精准、更流畅的对话和搜索体验。目录一、介绍1.1什么是DeepSeek？1.2什么是ChatGPT？1.3DeepSeek与ChatGPT的结合：
redis的主从复制配置 zhaikaiyun redis
通过持久化功能，redis保证了即使在服务器重启的情况下也不会丢失或少量丢失数据，但是由于数据存储在一台服务器上，如果这台服务器出现故障，比如磁盘坏了，也会导致数据丢失。为了避免这个单点故障，可以使用主从复制的方式，将主更新的数据，自动更新同步到其他服务器上。主从节点配置[root@k8smasterconfig]#moreredis6380.confinclude/data/redis/redi
flutter pigeon gomobile 插件中使用go工具类 yujunlong3919 flutter golang swift kotlin
文章目录为什么flutter要用go写工具类1.下载pigeon插件模版2.编写go代码3.生成greeting.aar，Greeting.xcframework4.ios5.android6.dart中使用为什么flutter要用go写工具类在Flutter应用中，有些场景涉及到大量的计算，比如复杂的加密算法、数据压缩/解压缩或者图形处理中的数学计算等1.下载pigeon插件模版base_plu
设计数据密集型应用之数据系统基础知识 xt01234
第一章可靠性针对系统的容错设计，提高系统错误的抛出率，而不是忽略它(除了安全这种不可恢复类型的)，尽量避免failure硬件错误硬件自身容许设计软件系统的灵活性与弹性。即容许整台机器异常，而不影响系统软件错误影响范围大，连锁反应，排查难。bug，依赖服务错误等避免：考虑全面，全面测试，处理隔离，监控人类错误最小化犯错机会的方式设计系统，全面测试，允许从错误中恢复，监控Scaliability(可扩
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息