如何原谅奋力过但无声

【4 - 降维算法PCA和SVD - 原理部分】菜菜sklearn机器学习

课程地址：《菜菜的机器学习sklearn课堂》_哔哩哔哩_bilibili

第一期：sklearn入门 & 决策树在sklearn中的实现
第二期：随机森林在sklearn中的实现
第三期：sklearn中的数据预处理和特征工程
第四期：sklearn中的降维算法PCA和SVD
第五期：sklearn中的逻辑回归
第六期：sklearn中的聚类算法K-Means
第七期：sklearn中的支持向量机SVM（上）
第八期：sklearn中的支持向量机SVM（下）
第九期：sklearn中的线性回归大家族
第十期：sklearn中的朴素贝叶斯
第十一期：sklearn与XGBoost
第十二期：sklearn中的神经网络

概述

（一）维度

数组 vs 特征矩阵

（二）sklearn中的降维算法（模块decomposition）

PCA与SVD

（一）概述

1. 降维的实现

2. PCA & SVD

3. PCA和特征选择的异同

（二）PCA

1. 重要参数 n_components（降维后需要的维度/保留的特征数量）

2. 鸢尾花数据集（高维数据）的可视化

（三）PCA中的SVD

1. 为什么PCA的类里会包含控制SVD分解器的参数？

2. 重要参数 svd_solver 与 random_state

3. 重要属性 components_

4. 重要接口inverse_transform

前三周：

随机森林：通过随机抽取特征来建树，以避免高维计算
sklearn中导入特征矩阵必须至少二维
特征工程：特征选择的目的是通过降维来降低算法的计算成本

本周：

PCA：主成分分析
SVD：奇异值分解

概述

（一）维度

对于数组和Series来说，维度就是shape返回的结果，shape中返回了几个数字就是几维

一维（不分行列）：此时shape返回唯一的维度上的数据个数
二维（有行列之分，表）：shape返回几行几列，一张表最多二维
三维：当一个数组中存在2张3行4列的表时，shape返回(2,3,4)
四维：当数组中存在2组2张3行4列的表时，shape返回(2,2,3,4)
更高维：shape返回(更高维,行,列)

数组 vs 特征矩阵

高维矩阵 = 数组，数组中的每一张表，都可以是一个特征矩阵
特征矩阵特指二维，只有行和列，其中行是样本，列是特征。针对每一张表，维度指的是特征的数量

对图像来说，维度就是图像中特征向量的数量（特征向量可以理解为坐标轴）

一个特征向量定义一条直线，是一维
两个相互垂直的特征向量定义一个平面，即一个直角坐标系，是二维
三个相互垂直的特征向量定义一个空间，即一个立体直角坐标系，是三维
三个以上的特征向量相互垂直，定义人眼无法看见也无法想象的高维空间

降维算法中的降维，指的是降低特征矩阵中特征的数量

让算法运算更快、效果更好
数据可视化：三维及以下的特征矩阵是可以被可视化的，便于理解数据分布

（二）sklearn中的降维算法（模块decomposition）

decomposition：本质是一个矩阵分解模块

可以用在降维、深度学习、聚类分析、数据预处理、低纬度特征学习、推荐系统、大数据分析等领域
奇异值分解SVD和主成分分析PCA都属于矩阵分解算法中的入门算法，都是通过分解特征矩阵来降维

PCA与SVD

在高维数据中，必然有一些特征是不带有有效信息的（比如噪音），或有一些特征带有的信息和其他一些特征是重复的（比如一些特征可能会线性相关）

衡量特征上所带的信息量，让降维过程中能够既减少特征的数量，又保留大部分有效信息

（一）概述

如果一个特征的方差很大，则说明这个特征上带有大量信息

PCA使用的信息量衡量指标 —— 样本方差/可解释性方差（方差越大，特征所带的信息量越多）

方差计算公式中为什么除数是n-1？

为了得到样本方差的无偏估计

1. 降维的实现

例子：

图1：一组数据有两个特征x1、x2（分别作为两个特征向量），这组数据每个特征的均值都为2，方差都为1，数据的方差总和为2

目标：只用一个特征向量来描述这组数据，即将二维数据降为一维数据，并尽可能保留信息量（信息量用样本方差衡量），即让数据总方差接近2

图2：x2*上的数值都变成了0，故x2*不带有任何有效信息了（x2*的均值和方差都为0）；而x1*特征上的数据均值是 $2\sqrt{2}$ ，方差为2
图3：根据信息含量的排序，取信息含量最大的一个特征

通过旋转原有特征向量组成的坐标轴来找到新特征向量和新坐标平面，将三个样本点的信息压缩到了一条直线上，实现了二维变一维，并尽量保留原始数据的信息

在步骤3中，找出n个新特征向量，让数据能够被压缩到少数特征上并且总信息量不损失太多的技术——矩阵分解

2. PCA & SVD

PCA和SVD是两种不同的降维算法，但都遵循上面的五步来实现降维，只是两种算法中矩阵分解的方法（步骤3）不同，且信息量的衡量指标不同

无论是PCA还是SVD都需要遍历所有的特征和样本来计算信息量指标，并且在矩阵分解过程中会产生比原来的特征矩阵更大的矩阵，还需要产生协方差矩阵去计算更多的信息，故降维算法的计算量很大，运行比较缓慢

（1）PCA：

使用方差作为信息量的衡量指标
特征值分解来找出空间V

（2）SVD：

使用奇异值来衡量特征上的信息量
奇异值分解来找出空间V

3. PCA和特征选择的异同

（1）同：都是特征工程的一部分

特征工程有三种方式：特征提取、特征创造、特征选择

（2）异：以PCA为代表的降维算法是特征创造的一种

特征选择：从已存在的特征中选取携带信息最多的，选完之后的特征依然具有可解释性，依然知道这个特征在原数据的哪个位置，代表着原数据上的什么含义
PCA：将已存在的特征进行压缩，降维后的特征不是原本特征矩阵中的任何一个特征，而且通过某些方式组合起来的新特征。在新的特征矩阵生成之前，无法知晓PCA都建立了怎样的新特征向量，新特征向量生成之后也不具有可读性（无法判断新特征矩阵的特征是从原数据中的什么特征组合而来，新特征虽然带有原始数据的信息，却已经不是原数据上代表的含义了）

PCA一般不适用于探索特征和标签之间关系的模型，如线性回归，因为无法解释的新特征和标签之间的关系不具有意义。故在线性回归模型中，使用特征选择

（二）PCA

sklearn.decomposition.PCA — scikit-learn 1.2.0 documentation

1. 重要参数 n_components（降维后需要的维度/保留的特征数量）

降维流程中第二步里需要确认的k一般输入 [0, min(X.shape)] 中的整数，是一个超参数，值会影响模型表现

若留下的特征太多，就达不到降维的效果；
若留下的特征太少，新特征向量可能无法容纳原始数据集中的大部分信息

如果希望可视化一组数据来观察数据分布，往往将数据降到三维以下，很多时候是二维（即n_components = 2）

如何选择最好的n_components —— 累计可解释方差贡献率曲线

累计可解释方差贡献率曲线：一条以降维后保留的特征个数为横坐标，降维后新特征矩阵捕捉到的可解释方差贡献率为纵坐标的曲线

当参数n_components中不填写任何值，则默认返回 min(X.shape) 个特征

一般来说，样本量都会大于特征数目，所以什么都不填就相当于：转换了新特征空间，但没有减少特征的个数

可以使用这种输入方式来画累计可解释方差贡献率曲线，以此选择最好的 n_components 整数取值（选曲线转折点的那个特征数量）

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris   # 鸢尾花数据集
from sklearn.decomposition import PCA
import pandas as pd
import numpy as np

iris = load_iris()
y = iris.target
X = iris.data

pca_line = PCA().fit(X)  # 不填参数，默认为特征个数
pca_line.explained_variance_ratio_   # array([0.92461872, 0.05306648, 0.01710261, 0.00521218])  
# .sum()为1
np.cumsum(pca_line.explained_variance_ratio_ )    # array([0.92461872, 0.97768521, 0.99478782, 1.        ])
# np.cumsum()累加

# plt.plot(横坐标取值, 纵坐标)
plt.plot([1,2,3,4],np.cumsum(pca_line.explained_variance_ratio_))  
plt.xticks([1,2,3,4])   #这是为了限制坐标轴显示为整数
plt.xlabel("number of components after dimension reduction")
plt.ylabel("cumulative explained variance ratio")
plt.show()

【4 - 降维算法PCA和SVD - 原理部分】菜菜sklearn机器学习_第5张图片

对于鸢尾花数据集来说，2和3都可以是我们理想的 n_components 的取值

（1）最大似然估计自选超参数

让PCA用最大似然估计（maximum likelihood estimation）自选超参数，将 "mle" 作为 n_components 的参数输入即可调用，但计算量较大

pca_mle = PCA(n_components="mle")  
pca_mle = pca_mle.fit(X)
X_mle = pca_mle.transform(X)
 
X_mle  #3列的数组
#可以发现，mle为我们自动选择了3个特征

pca_mle.explained_variance_ratio_.sum()   #0.9947878161267246
#得到了比设定2个特征时更高的信息含量，对于鸢尾花这个很小的数据集来说，3个特征对应这么高的信息含量，并不需要去纠结于只保留2个特征，毕竟三个特征也可以可视化

（2）按信息量占比选超参数

输入 [0,1] 之间的浮点数，并让参数 svd_solver = "full" ，表示希望降维后的总解释性方差占比＞ n_components 指定的百分比，即希望保留百分之多少的信息量

svd_solver 是奇异值分解器

# 希望保留97%的信息量
pca_f = PCA(n_components=0.97,svd_solver="full")  # svd_solver="full"不能省略
pca_f = pca_f.fit(X)
X_f = pca_f.transform(X)
X_f   # PCA会自动选出能够让保留的信息量超过97%的特征数量

pca_f.explained_variance_ratio_   #array([0.92461872, 0.05306648])

2. 鸢尾花数据集（高维数据）的可视化

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris   # 鸢尾花数据集
from sklearn.decomposition import PCA

iris = load_iris()
y = iris.target
X = iris.data   # 四个特征

# 作为数组，X是几维？   二维数组(150,4)，150个样本数量，4个特征
X.shape  #(150, 4)

# 作为数据表或特征矩阵，X是几维？   四维特征矩阵（4列特征）
import pandas as pd
pd.DataFrame(X).head()

# 数组的维度和矩阵的维度不同

# 建模，调用PCA
pca = PCA(n_components=2)           #实例化，降到二维
pca = pca.fit(X)                    #拟合模型，输入特征矩阵
X_dr = pca.transform(X)             #获取新矩阵
 
X_dr

#也可以fit_transform一步到位
#X_dr = PCA(2).fit_transform(X)

#要将三种鸢尾花的数据分布显示在二维平面坐标系中，对应的两个坐标（两个特征向量）应该是三种鸢尾花降维后的x1和x2，怎样才能取出三种鸢尾花下不同的x1和x2呢？
 
X_dr[y == 0, 0] #这里是布尔索引（返回为True的行），取出标签为0的鸢尾花对应的第一个特征的数据

#要展示三种分类的分布，需要对三种鸢尾花分别绘图
#可以写成三行代码，也可以写成for循环
"""
plt.figure()  
plt.scatter(X_dr[y==0, 0], X_dr[y==0, 1], c="red", label=iris.target_names[0])
plt.scatter(X_dr[y==1, 0], X_dr[y==1, 1], c="black", label=iris.target_names[1])
plt.scatter(X_dr[y==2, 0], X_dr[y==2, 1], c="orange", label=iris.target_names[2])
plt.legend()
plt.title('PCA of IRIS dataset')
plt.show()
"""
 
colors = ['red', 'black', 'orange']
iris.target_names   # array(['setosa', 'versicolor', 'virginica'], dtype='

  明显这是一个分簇的分布，且每个簇之间的分布相对比较明显 
  探索降维后的数据： 
  #属性explained_variance_，查看降维后每个新特征向量上所带的信息量大小（可解释性方差的大小）
pca.explained_variance_   #查看方差是否从大到小排列，第一个最大，依次减小   array([4.22824171, 0.24267075])

#属性explained_variance_ratio，查看降维后每个新特征向量所占的信息量占原始数据总信息量的百分比，又叫做可解释方差贡献率
pca.explained_variance_ratio_   #array([0.92461872, 0.05306648])
#大部分信息都被有效地集中在了第一个特征上

# .sum()查看降维后的特征向量所带的所有信息在原始总信息量上的占比
pca.explained_variance_ratio_.sum()   #0.9776852063187949 
  （三）PCA中的SVD 
  1. 为什么PCA的类里会包含控制SVD分解器的参数？ 
  Answer：把SVD当做PCA的一种求解方法，即在矩阵分解时不使用PCA本身的特征值分解，而是用SVD的奇异值分解来减少计算量 
  PCA和SVD涉及了大量的矩阵计算，但SVD可以跳过数学神秘的宇宙，不计算协方差矩阵，直接找出一个新特征向量组成的n维空间，而这个n维空间就是奇异值分解后的右矩阵
  k就是 n_components，是降维后希望得到的维度 
  若X为(m,n)特征矩阵， 就是(n,n)，取其前k行（切片），即将V转换为(k,n)，原特征矩阵X与  相乘，即可得到降维后的特征矩阵（m×k） 
  奇异值分解可以不计算协方差矩阵等结构复杂、计算冗长的矩阵，就直接求出新特征空间和降维后的特征矩阵，故SVD在矩阵分解中的过程比PCA简单快速。但SVD的信息量衡量指标（奇异值）比PCA的（方差）复杂 
  因此，sklearn将降维流程拆成了两部分，实现了用SVD的性质减少计算量，却让信息量的评估指标是方差： 
   
   一部分是计算新的特征空间V，由奇异值分解SVD完成 
   另一部分是映射数据和求解新特征矩阵，由主成分分析PCA完成 
  
  通过SVD和PCA的合作，sklearn实现了一种计算更快更简单，但效果却很好的“合作降维” 
   
  PCA(2).fit(X).components_  # 2指 n_components=2
# array([[ 0.36138659, -0.08452251,  0.85667061,  0.3582892 ],
#        [ 0.65658877,  0.73016143, -0.17337266, -0.07548102]])

# X.shape()是(m,n) = (150,4)
PCA(2).fit(X).components_.shape  #(2, 4)  V(k,n)即切片后/降维后的新特征空间 
  2. 重要参数 svd_solver 与 random_state  
  参数 svd_solver 是在降维过程中用来控制矩阵分解的一些细节的参数，有四种模式： 
   
   "auto"：默认。数据量小时为full（精确完整的SVD将被计算，截断将会在矩阵被分解完成后有选择地发生），数据量大时为randomized 
   "full"：生成精确完整的SVD，适合数据量比较适中、计算时间充足的情况 
   "arpack"：分解时就将特征数量降到n_components中输入的数值k，可以加快运算速度，适合特征矩阵很大时，但一般用于特征矩阵为稀疏矩阵（每一列都是由0和1组成的，且大部分为0）的情况，此过程包含一定的随机性 
   "randomized"：随机SVD，比"full"模式下计算快很多，且还能够保证模型运行效果，适合特征矩阵巨大、计算量庞大的情况 
   
   
   通常选用"auto"，算不出来的话换"randomized" 
   
  参数 random_state 在参数 svd_solver 的值为 "arpack" 或 "randomized" 时生效，可以控制这两种SVD模式中的随机模式 
  3. 重要属性 components_ 
  V(k,n) 是新特征空间，是要将原始数据进行映射的那些新特征向量组成的矩阵，用它来计算新特征矩阵，用属性components_调用查看 
  在矩阵分解时，PCA是有目标的：在原有特征的基础上，找出能够让信息尽量聚集的新特征向量。在sklearn使用的PCA和SVD联合的降维方法中，新特征向量组成的新特征空间就是 V(k,n) 
  若原特征矩阵是图像，V(k,n) 这个空间矩阵也可以被可视化的话，就可以通过两张图比较，看新特征空间究竟从原始数据里提取了什么重要信息 
  例：人脸识别数据集中属性components_的运用 
   
   数据集 fetch_lfw_people 介绍：  
   sklearn.datasets.fetch_lfw_people — scikit-learn 1.2.0 documentation 
   机器学习笔记（十五）：人脸识别_云布道师的博客-CSDN博客 
    
   这个数据集很大，有200+M，直接用fetch命令下载却失败了，手动下载数据 
   链接：https://pan.baidu.com/s/11ebeCTH7E24XAgYVL7y_-A 
   提取码：3gut 
    
   然后在使用 fetch_lfw_people() 时增加 data_home 参数，指定存放数据集的目录，sklearn会去指定的目录下解压 lfw-funneled 压缩包 
   
  （1）实例化数据集，探索数据  
  from sklearn.datasets import fetch_lfw_people   #4个人的1000多张人脸图片组成的一组人脸数据
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
import numpy as np

# 实例化数据集，探索数据
faces = fetch_lfw_people(data_home = 'D:\Anaconda\Lib\site-packages\sklearn\datasets\data\lfw-funneled',min_faces_per_person=60)  #实例化   min_faces_per_person=60：每个人取出60张脸图
faces   #一个字典形式的数据 
   
   
  faces.data.shape  #（820,2914）   行是样本，列是样本相关的所有特征：2914 = 62 * 47

faces.images.shape  #（820,62,47）  820是矩阵中图像的个数，62是每个图像的特征矩阵的行，47是每个图像的特征矩阵的列
# 若是三维，先写第三维，再是行列，即(第三维,行,列)

# faces.data是特征矩阵，但faces.images才是用来画图的矩阵
X = faces.data 
  （2）将原特征矩阵进行可视化（将像素转化为图像）  
  #数据本身是图像，和数据本身只是数字，使用的可视化方法不同
 
#创建画布和子图对象
'''
plt.figure()无法画多个并列的图，除非给figure的尺寸
plt.subplots()专门用来画子图和建立子图画布的
'''
fig, axes = plt.subplots(4,5  # 4行5列个图，即20张子图
                        ,figsize=(8,4)  # figsize指的是图的尺寸和比例
                        ,subplot_kw = {"xticks":[],"yticks":[]}  #不要显示坐标轴
                        ) 
   
  '''
axes.shape是(4,5)，是二维结构，可以有两种循环方式：
一种是使用索引，循环一次同时生成一列上的四个图，循环五次即可；
另一种是把数据拉成一维，循环一次只生成一个图，需要循环20次

在这里，究竟使用哪一种循环方式，是要看我们要画的图的信息储存在一个怎样的结构里
我们使用 子图对象.imshow 来将图像填充到空白画布上
而imshow要求的数据格式必须是一个(m,n)格式的矩阵，即每个数据都是一张单独的图
因此我们需要遍历的是faces.images，其结构是(1277, 62, 47)
要从一个数据集中取出20个图，明显是一次性的循环切片[i,:,:]来的便利（i指第i张图，后面两个数是每张图的特征矩阵的行和列）
因此我们要把axes的结构拉成一维来循环
'''
axes[0][0].imshow(faces.images[0,:,:])   # 第一张图片

axes.flat  #降低一个维度，从二维到一维。是一个惰性对象

[*axes.flat] # 2维
# 惰性对象用[*对象]就可以看到内容

len([*axes.flat]) # 20 
   
  enumerate(axes.flat)  # 惰性对象

[*enumerate(axes.flat)]  # 给之前的20个对象分别加了索引，组成元组(索引，对象)，放在列表里 
   
  #填充图像
for i, ax in enumerate(axes.flat):  # i是索引（用来控制循环20次），ax是画图对象
    ax.imshow(faces.images[i,:,:] 
              ,cmap="gray" #选择色彩的模式
            )
 
# cmap参数取值选择各种颜色：https://matplotlib.org/tutorials/colors/colormaps.html 
   
  （3）建模降维，提取新特征空间矩阵  
  #原本有 62*47=2914维，我们现在来降到150维
pca = PCA(150).fit(X)  #这里X = faces.data，不是faces.images,因为sklearn只接受2维数组降，不接受高维数组降

x_dr = pca.transform(X)  # 降维后的数组
x_dr.shape  #(820,150)

V = pca.components_  #V(k,n)用来映射的新特征向量空间，决定了新特征有什么含义、叫什么名字、是什么方向
# V * 原有特征矩阵X = 降维后的矩阵
V.shape  # V（k，n）   (150, 2914) 
  （4）将新特征空间矩阵可视化 
  V[0].shape  #(2914,)
V[0].reshape(62,47).shape  #(62, 47)

fig, axes = plt.subplots(4,5,figsize=(8,4),subplot_kw = {"xticks":[],"yticks":[]})
 
for i, ax in enumerate(axes.flat):
    ax.imshow(V[i,:].reshape(62,47),cmap="gray")
  可以看出在映射数据之前选了哪些特征 
  比起降维前的数据，新特征空间可视化后的人脸非常模糊，这是因为原始数据还没有被映射到特征空间中。但是可以看出，整体比较亮的图片获取的信息比较多，整体比较暗的图片却只能看见黑漆漆一块；在比较亮的图片中，眼睛、鼻子、嘴巴都相对清晰，脸的轮廓、头发等比较模糊。这说明，新特征空间里的特征向量大部分是 “五官” 和 “亮度” 相关的向量，所以新特征向量上的信息肯定大部分是由原数据中和 “五官”、“亮度” 相关的特征中提取出来的 
  通过可视化新特征空间V解释了一部分降维后的特征：画出来的图表示这些特征是和 “五官”、“亮度” 相关的，说明PCA能够将原始数据集中重要的数据进行聚集 
   
   人脸识别的核心是瞳孔/虹膜识别 
   
  4. 重要接口inverse_transform 
  特征工程中学习了接口 inverse_transform，可以将归一化、标准化、做过哑变量的特征矩阵都还原回原始数据中的特征矩阵 
   
   原特征矩阵X(m,n) * 新特征空间矩阵V(k,n) 的转置 = 新特征矩阵X_dr(m,k)    
   是否可让新特征矩阵X_dr还原为X？ 
   Answer：inverse_transform没有将降维逆转，只是将数据重新映射到了原数据所在的特征空间中（降维不是完全可逆的） 
   
  例：用人脸识别看PCA降维后的信息保存量 
   
  （1）导入数据并探索 
  from sklearn.datasets import fetch_lfw_people
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
import numpy as np

faces = fetch_lfw_people(data_home = 'D:\Anaconda\Lib\site-packages\sklearn\datasets\data\lfw-funneled', min_faces_per_person=60)
faces.images.shape   # (820, 62, 47)
faces.data.shape   # (820, 2914)
X = faces.data 
  （2）建模降维，获取降维后的特征矩阵X_dr 
  pca = PCA(150)  #实例化
X_dr = pca.fit_transform(X)  #拟合+提取结果
X_dr.shape   # (820, 150) 
  （3）将降维后矩阵用 inverse_tansform 返回原空间  
  X_inverse = pca.inverse_transform(X_dr)
# 期待X_inverse和原数据有相同的结果，若相同则说明inverse_transform实现了降维过程的逆转    
X_inverse.shape   #(820, 2914) 
  （4）将特征矩阵 X 和 X_inverse 可视化 
  fig, ax = plt.subplots(2,10,figsize=(10,2.5)
                      ,subplot_kw={"xticks":[],"yticks":[]}
                     )
 
#需要对子图对象进行遍历的循环，来将图像填入子图中
#那在这里，我们使用怎样的循环？
#现在我们的ax中是2行10列，第一行是原数据，第二行是inverse_transform后返回的数据
#所以我们需要同时循环两份数据，即一次循环画一列上的两张图，而不是把ax拉平
 
for i in range(10):
    ax[0,i].imshow(faces.images[i,:,:],cmap="binary_r")   # 第一行
    ax[1,i].imshow(X_inverse[i].reshape(62,47),cmap="binary_r")   # 第二行
# .imshow()只接受二维数组，且二维必须要是图像数据上的行特征和列特征
  这两组数据可视化后，由降维后再通过inverse_transform转换回原维度的数据画出的图像（第二行）和原数据画的图像（第一行）大致相似，但原数据的图像明显更清晰 
  inverse_transform并没有实现数据的完全逆转，这是因为，在降维的时候部分信息已经被舍弃了，X_dr中往往不会包含原数据100%的信息，所以在逆转时即便维度升高，原数据中已经被舍弃的信息也不可能再回来了 
  inverse_transform的功能，是基于X_dr中的数据进行升维，将数据重新映射到原数据所在的特征空间中，而非恢复所有原有数据。但同时，降维后的数据确实保留了原数据的大部分信息，所以图像看起来才会和原数据高度相似，只是稍稍模糊 —— 提取和储存的信息可以很少，但还是可以有很高的匹配精度（火车站等地方人脸识别机器识别速度很快的原因）

【Python进阶】assert 使用 | assert触发条件，使用实践示例 Qodicat Python学习 python 开发语言
文章目录1基本介绍2其他实践示例2.1检查函数参数2.2检查输入数据是否合规2.3检查操作是否合规1基本介绍assert是Python中的一个关键字，用于在代码中进行断言检查。它的作用是在条件为False的情况下触发AssertionError异常，用于帮助开发者在程序中捕获和处理错误。assert的语法如下：assertexpression,message其中expression是要进行断言检查
SQLAlchemy ORM在Python Web开发中的核心作用探究不一样的信息安全网络杂烩 sql
摘要在PythonWeb开发领域，SQLAlchemyORM扮演着至关重要的角色。作为一种对象关系映射工具，它能够将Python类与数据库表相映射，实现数据行与Python对象之间的转换。开发者可以使用面向对象的方法操作数据库，无需直接编写SQL语句，从而大幅提升开发效率并降低出错概率。SQLAlchemyORM提供了一套强大而灵活的数据库操作方法，助力开发者快速构建和维护复杂的数据模型。关键词S
如何激活python的虚拟环境怪咖学生 python 开发语言
要激活Python的虚拟环境，首先需要确保你已经创建了一个虚拟环境。假设你已经在项目目录中创建了一个虚拟环境，名为venv。以下是激活虚拟环境的步骤：在Windows上：打开命令提示符（CommandPrompt）。导航到包含虚拟环境的目录。输入以下命令激活虚拟环境：.\venv\Scripts\activate在macOS或Linux上：打开终端（Terminal）。导航到包含虚拟环境的目录。输
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
Python从0到100（二十二）：用Python读写CSV文件是Dream呀 python 数据库开发语言
一、CSV文件概述CSV，即逗号分隔值（CommaSeparatedValues），是一种以纯文本形式存储表格数据的通用格式。它因其简洁和易于使用而广泛应用于数据交换，如在数据库、电子表格等应用程序中导入和导出数据。CSV文件的纯文本特性使其与操作系统和编程语言无关，大多数编程语言都提供了处理CSV文件的功能，使其在数据处理和科学领域中极为流行。CSV文件的主要特点包括：纯文本格式：使用特定字符集
Python语法学习 weixin_44256848 Python python
Python标识符Python中的标识符是区分大小写的。以下划线开头的标识符是有特殊意义的。以单下划线开头_foo的代表不能直接访问的类属性，需通过类提供的接口进行访问，不能用fromxxximport*而导入。以双下划线开头的__foo代表类的私有成员，以双下划线开头和结尾的__foo__代表Python里特殊方法专用的标识，如__init__()代表类的构造函数。Python可以同一行显示多条
破解编程语言“鄙视链”：深度剖析其成因与背后的逻辑 TravisBytes 其他网络协议网络协程 coroutine c++
在编程世界里，各种编程语言的使用者之间似乎存在着一条无形的“鄙视链”。从古老神秘的C到灵动便捷的Python，从严谨规范的Java到天马行空的Ruby，不同语言的拥趸们总是在暗自较量。这条所谓的“鄙视链”究竟源自何处？它是基于语言特性的理性分级，还是仅仅是程序员们的主观臆断？本文将深入探讨“鄙视链”的成因，揭示其背后的逻辑与动因，帮助读者全面理解这一现象。目录1.历史与传统的影响2.语言特性的差异
python venv 打包发布_venv --- 创建虚拟环境 — Python 3.9.1rc1 文档 weixin_39732491 python venv 打包发布
创建虚拟环境¶通过执行venv指令来创建一个虚拟环境:python3-mvenv/path/to/new/virtual/environment运行此命令将创建目标目录(父目录若不存在也将创建)，并放置一个pyvenv.cfg文件在其中，文件中有一个home键，它的值指向运行此命令的Python安装(目标目录的常用名称是.venv)。它还会创建一个bin子目录(在Windows上是Scripts)
编程语言发展史之：编程语言的未来趋势 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介概述计算编程语言发展的主要里程碑2.编程语言的历史2.1编程语言的出现2.2第一代编程语言——FORTRAN2.3第二代编程语言——COBOL2.4第三代编程语言——PASCAL2.5第四代编程语言——C++、Java、C#、Python、Ruby等2.6模块化编程语言2.7跨平台语言2.8编程语言的分类3.编程语言的发展阶段及其性质编程语言的发展阶段及
在 Python 应用程序中设置和使用 Python Venv Q shen Python 教程 python 开发语言
安装：已经安装在MacOS和Windows平台上，但需要安装在某些Linux发行版上，这里是不同包管理器的安装指南：sudoaptinstallpython3-env#usingaptsudodnfinstallpython3-env#usingdnfsudopacman-Spython3-env#usingpacman创建虚拟环境：python-mvenv<en
C、C++、Java到Python，编程入门学习什么语言好? 明天会比今天更好 C/C++编程入门编程语言程序员
最近，TIOBE更新了7月的编程语言榜单，常年霸榜的C、Java和Python依然蝉联前三位。万万没想到的是，R语言居然冲到了第八位，创下了史上最佳记录。而且后续随着业内对数据统计和挖掘需求的上涨，R语言热度颇有些势不可挡的架势。然而作为程序员吃饭的工具，编程语言之间也形成了某种鄙视链，各大论坛里弥漫着剑拔弩张的气氛，众口难调。也难怪有很多初学者会有疑惑，为什么会有这么多编程语言，我到底应该学什么
火山方舟 Python SDK豆包模型环境配置错误集锦（Mac电脑） yitahutu79 大模型运行错误集锦 python macos 开发语言
下载豆包频频出错pipinstall'volcengine-python-sdk[ark]'通过官方给的下载方式总是提示pipinstall'volcengine-python-sdk[ark]'ERROR:Cannotexecute`setup.py`sincesetuptoolsisnotavailableinthebuildenvironment.所以选择下载源码gitclonehttps:
volcengine 库装不上 #25 LiuPig刘皮哥 python
https://github.com/volcengine/volc-sdk-python/issues/25在Dockerpython3.10-slim中volcengine安装时报错,其依赖pycryptodome显示gcc相关错误调研发现pycryptodome3.19.0不会报错,volcengine依赖的pycryptodome3.9.9会报错修改方案是手动为volcengine安装依赖
Python常用函数总结(77个)超全面超详细_python函数大全及详解小怡在干什么 python 开发语言
文章主要介绍了python77种常用的基础函数,方便后期使用。学习python的朋友可以收藏文末领取Python全套最新学习资源Python常用函数总结print()函数：打印字符串raw_input()函数：从用户键盘捕获字符len()函数：计算字符长度format(12.3654，‘6.2f’/‘0.3%’)函数：实现格式化输出type()函数：查询对象的类型int()函数、float()函数
python venv 使用介绍大脑经常闹风暴@小猿 python python venv
文章目录注意⭐：速览：详解：1.创建虚拟环境2.切换（激活）虚拟环境3.安装包4.导出依赖5.切换回全局环境（退出虚拟环境）6.删除虚拟环境注意⭐：①：venv仅适用于python3.3及以上版本；②：venv本身不能直接安装其他版本的Python。它只能使用已安装的Python版本来创建虚拟环境。因此，如果你需要使用不同的Python版本（例如Python3.8或Python3.9），建议结合a
python 调用ffmpeg获取影片信息_python直接调用ffmpeg weixin_39779528 python 调用ffmpeg获取影片信息
ffmpeg是一个强大的开源命令行多媒体处理工具。关于ffmpeg的安装问题，可以看之前发的《ffmpeg的安装和简单使用》。ffmpeg如此强大，那么能不能用python调用并实现它的所有功能呢，答案自然是肯定的。要实现在python中调用ffmpeg，需要了解一下subprocess模块。简单来说，subprocess模块就相当于一个包壳的命令行，原则上可以在命令行中实现的事情都可以使用sub
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
9. 马科维茨资产组合模型+FF5+GARCH风险模型优化方案（理论+Python实战） AI量金术师金融资产组合模型进化论 python 开发语言金融人工智能机器学习算法
目录0.承前1.核心风险函数代码讲解1.1数据准备和初始化1.2单资产GARCH建模1.3模型拟合和波动率预测1.4异常处理机制1.5相关系数矩阵计算1.6构建波动率矩阵1.7计算协方差矩阵1.8确保矩阵对称性1.9确保矩阵半正定性1.10格式转换和返回1.11calculate_covariance_matrix函数汇总2.代码汇总3.反思3.1不足之处3.2提升思路4.启后0.承前本篇博文是对
【PDF合并】利用 Python 合并 PDF 文件 Encarta1993 tools pdf
依赖安装pipinstallPyPDF2在Python中，可以使用PyPDF2模块来合并多个PDF文件。fromPyPDF2importPdfFileMerger#创建一个PdfFileMerger对象merger=PdfFileMerger()#添加要合并的PDF文件pdf_files=['file1.pdf','file2.pdf','file3.pdf']forpdf_fileinpdf_f
python保存和调用模型 sphinxrascal168 大幅度
2.创建文件目录，保存模型importosfromsklearn.externalsimportjoblib#创建文件目录dirs='testModel'ifnotos.path.exists(dirs):os.makedirs(dirs)#保存模型joblib.dump(LR,dirs+'/LR.pkl')3.读取模型#读取模型LR=joblib.load(dirs+'/LR.pkl')test
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
Python 调用常见大模型 API 全解析 ♢.＊ python 开发语言语言模型 nlp
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！调用通义千问接口获取APIKe
Ubuntu 手动安装 Open WebUI 完整指南老大白菜 python ubuntu linux 运维
Ubuntu手动安装OpenWebUI完整指南前提条件在安装OpenWebUI之前，请确保您的系统满足以下要求：Ubuntu22.04LTS或更高版本Python3.10+Node.js18+Git至少4GB内存足够的磁盘空间（推荐20GB以上）安装步骤1.更新系统包sudoaptupdatesudoaptupgrade-y2.安装必要的依赖#安装Python和Node.jssudoaptinst
Python中try-except-else-finally语句用于处理异常上趣工作室 python python 开发语言
在Python中，try-except-else-finally语句用于处理异常和无论是否发生异常都需要执行的代码块。下面是每个部分的用法：try：在try块中编写可能引发异常的代码。如果没有异常发生，程序将继续执行try块后面的代码；如果发生异常，程序将跳到适当的except块。except：在except块中处理特定类型的异常。可以指定一个或多个异常类型，以及相应的处理代码。如果发生指定类型的
Apache Flink流处理框架 weixin_44594317 apache flink 大数据
ApacheFlink是一个分布式流处理框架和数据处理引擎，专注于以低延迟和高吞吐量处理无界和有界的数据流。它可以同时处理流式数据和批处理数据，并且提供强大的容错机制和状态管理功能。Flink常用于实时分析、复杂事件处理（CEP）、机器学习和批量数据处理等场景。1.Flink的核心概念在理解Flink的工作原理之前，先要了解它的一些核心概念：流处理(StreamProcessing)：处理数据流中
.net如何调用python 轮胎技术Tyretek python 开发语言 pycharm ide
.NET可以通过调用Python的执行文件或者Python库来调用Python代码。一种常用的方法是在.NET中使用Process类调用Python的执行文件。这样做的好处是你可以将Python代码打包成独立的文件，不需要在.NET中引用任何Python相关的库。下面是一个示例，假设你有一个Python文件"test.py"，内容如下：defgreet(name):print("Hello,"+n
vb调用python函数_vb.net / C# 调用 python weixin_39522170 vb调用python函数
1.IronPython简介IronPython是一种在.NET及Mono上的Python实现，由微软的JimHugunin所发起，是一个开源的项目，基于微软的DLR引擎；托管于微软的开源网站CodePlex(www.codeplex.com)。2.安装IronPython安装下载下来的安装包(要先装VS)。3.创建项目添加引用：浏览到IronPython的安装目录中，添加对IronPython.
Python 爬虫实战：从喜马拉雅爬取有声书播放量，挖掘热门音频内容西攻城狮北 python 爬虫音视频实战案例
目录引言一、项目背景与需求分析1.1喜马拉雅平台的特点1.2数据爬取目标二、技术选型与工具准备2.1技术选型2.2工具准备三、爬取有声书播放量数据3.1获取音频列表3.2获取音频详情四、数据存储五、数据处理与分析5.1数据清洗5.2数据分析六、可视化展示七、总结与展望引言喜马拉雅作为国内知名的音频分享平台，拥有海量的有声书、广播剧、音乐等内容。通过爬取喜马拉雅上的有声书播放量数据，我们可以分析哪些
Ubuntu交叉编译 arm板子上的TVM 陈有爱 TVM ubuntu 人工智能
目录X86Ubuntu的TVM安装LLVM下载tvm配置config.cmake编译源码python安装测试是否安装成功可以在安装一些库，用于RPCTracker和auto-tuning交叉编译801arm的TVM交叉编译链下载配置config.cmake编译源码编译的时候可能会遇到错误ONNX模型转换为TVM模型创建pre.py，将onnx模型编译成tvm.so文件测试TVM模型修改demo程序
【Python入门基础】——第1篇：从入门到精通：Python简介与环境搭建详解猿享天开 python从入门到精通 python 开发语言
第1篇：Python简介与环境搭建目录什么是Python？Python的历史与特点安装Python解释器配置开发环境选择合适的集成开发环境（IDE）使用文本编辑器运行第一个Python程序常见问题及解决方法总结什么是Python？Python是一种高级、通用、解释型的编程语言，由GuidovanRossum于1991年首次发布。Python以其简洁易读的语法、广泛的应用领域和强大的社区支持，成为全
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

【4 - 降维算法PCA和SVD - 原理部分】菜菜sklearn机器学习

概述

（一）维度

数组 vs 特征矩阵

（二）sklearn中的降维算法（模块decomposition）

PCA与SVD

（一）概述

1. 降维的实现

2. PCA & SVD

3. PCA和特征选择的异同

（二）PCA

1. 重要参数 n_components（降维后需要的维度/保留的特征数量）

2. 鸢尾花数据集（高维数据）的可视化

（三）PCA中的SVD

1. 为什么PCA的类里会包含控制SVD分解器的参数？

2. 重要参数 svd_solver 与 random_state

3. 重要属性 components_

4. 重要接口inverse_transform

你可能感兴趣的:(机器学习,sklearn,python)