LiongLoure

[深度学习]note for Machine Learning: An Algorithmic Perspective, Second Edition（Ch01-Ch03）【部分勘误+代码待补充】

Machine Learning: An Algorithmic Perspective, Second Edition——Part 1

1 绪论
- 1.1 如果数据有质量，地球将成为黑洞
- 1.2 学习
- - 1.2.1 机器学习
- 1.3 机器学习的类别
- 1.4 监督学习
- - 1.4.1 回归
  - 1.4.2 分类
- 1.5 机器学习过程
- 1.6 关于编程的注意事项
2 预备知识
- 2.1 专业术语
- - 2.1.1 权重空间
  - 2.1.2 维度灾难
- 2.2 知你所知：测试机器学习算法
- - 2.2.1 过拟合
  - 2.2.2 训练集、测试集和验证集
  - 2.2.3 混淆矩阵
  - 2.2.4 精度指标（已勘误）
  - 2.2.5 受试者工作特征曲线
  - 2.2.6 不平衡数据集
  - 2.2.7 度量精度
- 2.3 数据与概率的转换
- - 2.3.1 最小化风险
  - 2.3.2 朴素贝叶斯分类
- 2.4 基本统计概念
- - 2.4.1 平均值
  - 2.4.2 方差与协方差
  - 2.4.3 高斯分布
- 2.5 权衡偏差与方差
3 神经元、神经网络和线性判别
- 3.1 大脑和神经元
- - 3.1.1 Hebb法则（1949年）
  - 3.1.2 McCulloch和Pitts神经元（1943年）
  - 3.1.3 McCulloch和Pitts神经元模型的局限性
- 3.2 神经网络
- 3.3 感知器
- - 3.3.1 学习速率
  - 3.3.2 输入偏置
  - 3.3.3 感知器学习算法
  - 3.3.4 感知器学习示例
  - 3.3.5 具体实现
- 3.4 线性可分性
- - 3.4.1 感知器收敛定理（已勘误）
  - 3.4.2 XOR函数
  - 3.4.3 有用的领悟
  - 3.4.4 另一个示例：皮马印第安人数据集
  - 3.4.5 数据预处理
- 3.5 线性回归
- - 3.5.1 示例

1 绪论

预测（prediction）
监督学习（supervised learning）——已知对应与一些样本的正确结果，所以可以把这写已知正确结果的样本提供给学习器；

1.1 如果数据有质量，地球将成为黑洞

符号（glyph）

1.2 学习

——从数据中学习、从经验中学习；
动物学习：记忆（remembering）、适应（adapting）、泛化（generalizing）
智能：推理（reasoning）、逻辑演绎（logical deduction）——基础：学习和适应
人工智能（Artificial Intelligence）——符号处理（symbolic processing）：计算机操作的是能反映环境的符号；
机器学习——亚符号（subsymbolic）：不包含符号或是符号的操作；

1.2.1 机器学习

使计算机改进（modify）或适应（adapt）他们的行为，从而使这些行为变得更加准确，这里的准确性是通过测量这些行为在多大程度上反映了正确的行为而得到的。

神经网络（neural network）——统计性的学习器；
数据挖掘（data-mining）——高效的算法；

计算复杂度（computational complexity）——算法（algorithm）：训练的复杂度，训练好的算法的复杂度

1.3 机器学习的类别

学习——通过训练从而在某项工作上做得更好（不精确）——计算机如何知道它表现得更好，亦或是更差，以及它如何知道怎样才能有所提高？

提供给算法部分正确的答案，自动地发现问题的所有正确答案（泛化）；或者告知算法某一个答案是否正确，但不告知如何去寻找正确的答案（搜索search）；

分类：
监督学习（supervised learning）：提供一个包含正确回答（目标target）的样本组成的训练集（training set），并且以这个训练集为基础，算法进行泛化，直到对所有可能的输入都给出正确的回答、这也称为从范例（exemplar）中学习；
无监督学习（unsupervised learning）：没有提供正确的回答，取而代之的是算法试图鉴别出输入之间的相似之处，从而使有着共同点的输入被归类为（categorized）同一类。非监督学习的统计学方法称为密度估计（density estimation）；
强化学习（reinforcement learning）：强化学习介于监督学习和非监督学习之间。当答案不正确时，算法会被告知，但如何去改正则不得而知。它需要去探索，实验不同的可能情况，直到得到正确的答案。强化学习有时被称为伴随评论家（critic）的学习，因为它只对答案评分，而不提出改进的建议。
进化学习（evolutiionary learning）：可以将生物学的进化看成一个学习的过程，即生物有机体改变自身，以提高在所处环境下的存活率和拥有后代的概率。我们将研究如何在计算机中对这一过程建模。在此使用适应度（fitness）的概念，相当于是对当前解答方案好坏程度的评分。

1.4 监督学习

训练数据：输入数据 +目标数据；
机器学习的优越之处在于泛化：算法对于未曾碰到过的输入也应该给出合理的输出；——算法能够处理噪声（noise）——数据中小的不精确性；

1.4.1 回归

标量（scalar）
预测——回归（regression）问题：拟合出描绘一条曲线的数学函数，使得曲线尽可能贴近所有的数据点——函数估计（function approximation）＆插值（interpolation）

分类（classification）——把样本归为不同的类别；
所要解决的实际问题，绝大多数情况下都能被归结为分类或者是回归问题

1.4.2 分类

分类问题——离散的——每一个样本明确属于某一类，并且类别的集合覆盖了整个可能输出的空间；
模糊（fuzzy）分类器——样本可能部分地属于两个类别；
异常检测（novelty detection）——不属于任一类别；

编码（encoding）——元素对应于相应特征的测量值（输入向量的特征）——过多的输入导致维度灾难（curse of dimensionality）

决策边界——划分不同的类别（线性or非线性）

1.5 机器学习过程

数据收集和准备：干净的（clean）——没有重大错误或者缺少数据等问题；
特征选择：对收集过程中可能出现的噪声和其他数据损坏具有鲁棒性（robust）；
算法选择：
参数和模型选择：
训练：
评估：度量指标

1.6 关于编程的注意事项

由于很多算法是随机的，结果无论如何都不可能重复。可以通过设置随机数种子来暂时避免这个问题，使随机数生成器每次都遵循相同的模式生成随机数；——伪随机数（pseudo-random number）

import numpy as np
np.random.seed(4)
np.random.rand(10)

np.random.rand(10)

np.random.seed(4)
np.random.rand(10)

2 预备知识

介绍机器学习的一些重要概念，了解机器学习中数据处理和统计的一些基本思想。

2.1 专业术语

输入：是算法执行的数据，通常为一个向量（向量的大小——维度dimensionality——向量中元素的个数）；
$x=[{{x}_{1}},{{x}_{2}},...,{{x}_{i}},...,{{x}_{m}}]$
权重：是节点i与j之间的加权连接，排列成矩阵W；
输出：取决于算法的输入和网格的当前权重集；
$y(x,W)=[{{y}_{1}},{{y}_{2}},...,{{y}_{j}},...,{{y}_{n}}]$
目标：是监督学习所需的额外数据，提供了算法正在学习的“正确”答案；
$t=[{{t}_{1}},{{t}_{2}},...,{{t}_{j}},...,{{t}_{n}}]$
激活函数：与对神经网络， $g(\centerdot )$ 是一种数学函数，描述神经元的激发作为加权输入的响应（如阈值函数）；
误差：E是根据输出y与目标t计算网格不准缺性的函数；

2.1.1 权重空间

神经网络的参数是将神经元连接到输入的一组权重的值——将神经元的权重视为一组坐标，即权重空间（weight space）；

可用于讨论神经元和输入的紧密程度（不适用偏置节点——否则有一个额外的纬度），每个神经元的位置为其权重多对应的位置，将神经元和输入定位在同一空间中，两个空间具有同样的纬度——通过改变权重从而改变权重空间中神经元的位置——通过欧氏距离来测量输入和神经元之间的距离——神经元是否激活。
输入向量可以使我们获得所有的信息，让算法解决所需要的东西——巨大成本。

2.1.2 维度灾难

随着维度的增加，单位超球面（unit hypersphere）的体积不随之增加 ${{v}_{n}}=(2\pi /n){{v}_{n-2}}$ ——维度的数量趋于无穷大，超球面的体积趋于零—— $n>2\pi$ 时，体积开始缩小；

2.2 知你所知：测试机器学习算法

学习的目的是为了更好地预测输出，无论类标记还是连续回归值。
了解算法学习成功程度——将预测与一致目标进行比较——监督学习（查看算法在训练集上产生的错误）。

将算法推广到训练集中没有看到的示例——测试集——（输入，输出）对——将预测输出与目标进行比较，但不修改它们的权重或其他参数：决定算法学习的程度——但减少了可用于训练的数据量；

2.2.1 过拟合

算法在学习时的泛化情况——过度训练：学习了数据中的噪声和不准确性（可变度的数量过大）；
希望算法在过拟合之前停止学习过程——需要知道其在每个时间步长的泛化程度（训练数据无法检测过拟合，测试数据要最终保留）——验证集（validation set）——用于验证学习。
类似于统计学中的交叉验证（cross validation），属于模型选择（model selection）的一部分：为模型选择正确的参数，以便尽可能地泛化。

2.2.2 训练集、测试集和验证集

训练集：实际训练算法；
验证集：跟踪其学习效果；
测试集：最终产生结果；

对于监督学习必须附加目标值（甚至对于无监督学习，验证集合测试集也需要目标，以便于有比较的对象），而获得准确的标记并不容易（同样也是了解数据的目的）——半监督学习：满足对过多数据量的标记数据需求；
合理的数据量的选择——通常为：50:25:25、60:20:20

数据划分：

通过随机重新排列数据，或通过将每个数据随机分配给其中一个集来处理；
若数据短缺——留出法（leave-some-out）、多折交叉验证（muti-fold cross-validation）：将数据集随机分为K个子集，一个子集用作验证集，而算法则在所有其他子集上进行训练，然后选出不同子集并且在该子集上训练新模型，对所有不同子集重复相同过程——最终测试并使用产生最低验证误差的模型；
极端情况下：留一法（leave-one-out）交叉验证——算法仅在一些数据上进行验证，对剩余所有数据进行训练；

2.2.3 混淆矩阵

适用于分类的方法——混淆矩阵（confusion matrix）：(i,j)处的矩阵元素——多少输入模式放入类i中，而算法归类为类j中；主对角线元素——正确答案；

精度：主对角线上的元素之和除以矩阵中所有元素的总和——不是唯一标准。

2.2.4 精度指标（已勘误）

类的可能输出：真正类（true positive）——正确放入类1；假正例（false positive）——错误放入类1；反例放入类0（包括真/假）；

上图中，主对角线上的元素是正确的，其余元素是错误的（基于二分类）。

精度：真正例与真反例的数量除以示例总数（“#”代表“数量”）——没有得到所有信息（四个数字变为一个数字）
$Accuracy=\frac{\#TP+\#TN}{\#TP+\#TN+\#FP+\#FN}$

其他两对互补的度量：
敏感率（sensitivity）：也称为真正例率（true positive rate），是正确的正例数量与被分类为正例的数量的比率；
特异率（specificity）：对于反例而言；
$sensitivity=\frac{\#TP}{\#TP+\#FP}$ ; $specificity=\frac{\#TN}{\#TN+\#FN}$

查准率（precision）：正确的正例数量与实际正例的数量之比；
查全率（recall）：正确的正例数量与被归类为正例的数量之比（与敏感率相同）；
$precision=\frac{\#TP}{\#TP+\#FN}$ ; $recall=\frac{\#TP}{\#TP+\#FP}$

F1度量：
$F1=2\frac{precision\times recall}{precision+recall}=\frac{\#TP}{\#TP+(\#FP+\#FN)/2}$

2.2.5 受试者工作特征曲线

度量——评估特定的分类器、比较具有不同学习参数的相同分类器或完全不同的分类器。

受试者工作特性（Receiver Operator Characteristic）曲线（ROC曲线）——完美的分类器（0,1）；反分类器（anti-classifier）获得错误结果（1,0）——分类器结果越靠近左上角，性能越好；——y=x：浪费时间，等同于掷硬币；

计算离“对角线-随机猜测线”最远的点——比较分类器或同一分类器的参数设置选择——计算曲线下面积（Area Under the Curve，AUC）

交叉验证——获得曲线而不是ROC曲线上的点；n折交叉验证=n个分类器+n个不同的测试集（含有“真值”标记——用于生成不同交叉验证训练结果的排序列表，指定ROC曲线是哪个与该分类器结果相对应的n个数据点的曲线）；通过为每个分类器生成 ROC曲线，可以比较他们的结果。

2.2.6 不平衡数据集

上述的精度隐含假设数据集中存在相同数量的正、负示例（平衡数据集）；对于不平衡数据集，平衡精度计算为敏感率和特异率之和除2——更精确的度量：Matthew相关系数（Matthew’s Correlation Coefficient）——分母中任何括号为0，则整个分母设置为1：

如果有两个以上的类，并且区分不同类型的误差是有用的，那么计算会更加复杂。

2.2.7 度量精度

精度（precision）——将机器学习算法视为度量系统：如果输入一组类似的输入，那么希望得到类似的输出。这种算法可变性的度量也称为精度——可重复性——将精度视为概率分布的方差——在平均值上下浮动的多少。

算法的精确不等同于准确——真实度（trueness），可以被定义为正确输出和预测之间的平均距离

2.3 数据与概率的转换

先验概率： $P({{C}_{i}})$ ——（类似于不平衡数据集）；
给定特征值（度量值）x下的Ci的条件概率（conditional probability）： ——如果x的值是X，则该类是Ci的可能性（不能直接得出）；

为了得到条件概率，首先需要量化特征值x——在离散的值{X}中——计算 $P({{C}_{i}},{{X}_{j}})$ ——联合概率（joint probability）：用过查看Xj，计算其中Ci类的样例数量，并除以样例的总数（任何类的）；

$P(X\text{ }\!\!|\!\!\text{ }{{C}_{i}})$ ：样例是Ci类的情况下，度量值是Xj出现的次数（可直接得出）；

从训练数据中得到的结果：联合概率 $P({{C}_{i}},{{X}_{j}})$ 、条件概率 $P(X\text{ }\!\!|\!\!\text{ }{{C}_{i}})$ ——贝叶斯法则（Bayes’ rule）：联合概率与条件概率的关系——将后验概率 $P({{C}_{i}}|{{X}_{j}})$ 与先验概率 $P({{C}_{i}})$ 和类条件概率 $P(X\text{ }\!\!|\!\!\text{ }{{C}_{i}})$ 联系起来（分母用于形式化所有事物，概率总和为1）。
$P({{C}_{i}}|{{X}_{j}})=\frac{P({{X}_{j}}|{{C}_{i}})P({{C}_{i}})}{P({{X}_{j}})}$
对于任何对象Xk必须属于某个类Ci—— $P({{X}_{k}})=\sum{P({{X}_{k}}|{{C}_{i}})P({{C}_{i}})}$ ；
$P({{C}_{i}}|x)>P({{C}_{j}}|x)$ $\forall i\ne j$
通过计算更容易计算的实物来获得后验概率——通过后验概率选择Ci类（最大后验maximum a posterior，MAP）：
MAP——给出训练数据中最可能的类——贝叶斯最优分类（Bayes’ Optimal Classification）：将所有类的最终结果考虑在内——最大限度地减少了错误分类的可能性，而不是最大化后后验概率；

2.3.1 最小化风险

基于最小化误分类——考虑误分类中涉及的风险——损失矩阵：指定类Ci的示例被分为类Cj所涉及的风险——通过将每个案例乘以相关的损失数来使分类器最小化风险；

2.3.2 朴素贝叶斯分类

解决维度灾难： $P({{X}_{j}}\text{ }\!\!|\!\!\text{ }{{C}_{i}})=P(X_{_{j}}^{1}\text{,}X_{_{j}}^{2},...,X_{_{j}}^{n}\text{ }\!\!|\!\!\text{ }{{C}_{i}})$ ——不同特征的值不会相互影响（朴素性）——特征相互独立： $\prod{P(X_{_{j}}^{k}\text{=}{{a}_{k}}\text{ }\!\!|\!\!\text{ }{{C}_{i}})}=P(X_{_{j}}^{1}\text{=}{{a}_{1}}\text{,}X_{_{j}}^{2}={{a}_{2}},...,X_{_{j}}^{n}\text{=}{{a}_{n}}\text{ }\!\!|\!\!\text{ }{{C}_{i}})$ ；

最大值的类Ci： $P({{C}_{i}})\prod{P(X_{_{j}}^{k}\text{=}{{a}_{k}}\text{ }\!\!|\!\!\text{ }{{C}_{i}})}$ ——对全概率评估的简化；

在简化为真的情况下，使得特征在条件上彼此独立，朴素贝叶斯分类器恰好产生MAP分类——缺点：在大量概率相乘的情况下数字会变得非常小；

2.4 基本统计概念

2.4.1 平均值

均值：数据的平均值（average）；
中位数（median）——随机算法（randomised algorithm）：用于计算中位数；
众数（mode）；

2.4.2 方差与协方差

期望（expectation）： 将每种可能性的收益与该可能性发生的概率相乘，然后累加；
方差：度量数据的分布，观察变量相对于平均值的变化：计算集合中每个元素与集合的期望值（平均值，μ）之间的平方距离总和来计算：

其中，方差的平方根 $\sigma$ 称为标准差（standard deviation）；

协方差（covariance）： 度量两个变量的依赖程度（统计学意义上），查看一组数据中所有变量对之间的相关性：

其中，v是几何{yi}的均值；
如果两个变量独立则协方差为0；如果同时增加/减少，则协方差为正；如果一个增加的同时另一个减少，则协方差为负；

协方差矩阵（covariance matrix）： 说明了数据在每个数据维度的变化情况

其中：xi是描述第i个变量元素的列向量，μi为他们的均值；
协方差矩阵为对称方阵，主对角元为方差；
高维形式：

其中变量X的均值为E(X)；

马氏距离（Mahalanobis distance）：

其中：x为数据的列向量，μ为均值的列向量，为协方差矩阵的逆（NumPy—> np.cov(x), np.linalg.inv(x)）
若协方差矩阵设置为单位阵，则马氏距离退化为欧式距离；

概率分布： 在可能的特征值范围内发生某事物的概率；

2.4.3 高斯分布

高斯（Gaussian）分布或正态分布（normal distribution），一维方程：

其中：μ为均值， $\sigma$ 为标准差

中心极限定理——许多小的随机数加起来为高斯，高维方程：

其中：Σ为协方差矩阵

2.5 权衡偏差与方差

算法具有的自由度越大，拟合的模型就越复杂——更复杂的模型：过拟合——不一定能产生更好的结果——偏差-方差困境（bias-variance dilemma）

模型的问题：
①不准确：与数据不匹配；——偏差
②不精确，结果具有很多不确定性；——统计方差；
更复杂的模型倾向与改善偏差，同时导致方差的增大；而减少方差使模型更具体则将增加偏差；——海森堡不确定性原理（Heisenberg Uncertainty Principle）：无法兼得；

例如：多项式可以精确通过数据点；直线拟合没有方差但偏差很大——通常不适合拟合数据；样条曲线可以任意精度拟合训练数据，但方程会增大；

平方和误差函数（sum-of-squares error function）：计算目标和预测输出之间的误差——计算两者之间差异的平方和

逼近函数 $y=f(x)+\varepsilon$ ，其中： $\varepsilon$ 为噪声，均值为0，方差为 ${{\sigma }^{2}}$ 的高斯分布；机器学习算法拟合数据 $h(x)={{w}^{T}}x+b$ ，其中w为权重向量，目标为最小化平方和误差： $\sum\limits_{i}{{{({{y}_{i}}-h({{x}_{i}}))}^{2}}}$ ；

利用上式，在独立数据上，计算新的数据点的平方和误差的期望（其中 $E[x]=\bar{x}$ 为均值）

噪声：无法控制，是不可约的误差（irreducible error），是测试数据的方差；
方差：所使用特定训练集x的变化程度；
偏差：h(x)的平均误差；

低偏差——当前的平均输出；高方差——答案在各处浮动；
权衡偏差与方差

3 神经元、神经网络和线性判别

3.1 大脑和神经元

大脑的处理单元：神经元（neuron）——具有鲁棒性；
通过大脑流质里面的化学递质来升高或降低神经元内部的电位。如果这一跨膜电位（membrane pontential）达到某个阈值，神经元就会放电（spike）或激活（fire），并且一个固定强度和持续时间的脉冲会向下传递到轴突（axon）。轴突分散形成树枝状，与许多其他神经元连接，其中的每一个连接都是在一个突触（synapse）中。在激活之后，神经元在下一次激活之前需要一段时间来恢复能量（不应期refractory period）。
每个神经元可看成是一个独立的处理器——决定是否激活。
强AI（strong AI）：对于大脑来说所有的内容都能在计算机中进行模拟，从而在计算机中实现动物或是人类的智能。

进行学习——可塑性（plasticity）：改变神经元间突触连接的强度（strength），或是建立新的连接。

3.1.1 Hebb法则（1949年）

突触连接强度的变化与两个相连神经元激活的相关性成比例；如果两个神经元始终同时激活，那么它们之间连接的强度会变大；反之，如果两个神经元从来不同时激活，那么它们之间的连接会小时——如果两个神经元都会对某件事做出反应，那么它们应该相连——经典条件反射（classical conditioning，巴普洛夫）

长时程增强效应（long-term potentiation）、神经可塑性（neural plasticity）：当神经元同时激活，它们之间会形成突触连接并且能变得更强，从而形成神经元集合；

3.1.2 McCulloch和Pitts神经元（1943年）

①一组输入加权wi：相当于突触；
②一个加法器：把输入信号相加（与收集电荷的细胞膜等价）；
③一个激活函数：（最初是一个阈值函数——0代表没有激活，1代表激活）决定细胞对于当前的输入是否激活（放电）；

所有其他神经元的激活状态都通过一个突触传递到神经元，并且这些突触都是有强度的——权重（weight），突触的强度会影响信号的强弱：

对于一个真实的神经元而言，他的跨膜电位是否大于某个阈值（θ）来决定。

输入xi与权重wi相乘，而神经元对其进行求和，如果该总和大于阈值θ，则神经元会输出，否则不输出

McCulloch和Pitts神经元使用的是二元阈值函数，可以把上述神经元工作原理的第二部分，即决定是否激活，称为激活函数（activation function）：

实际上使用的激活函数会略作变化——选择正确的权重。

3.1.3 McCulloch和Pitts神经元模型的局限性

①输入不一定是线性相加的，可能存在非线性的相加形式；
②现实中的神经元不会给出单一的输出相应，而是给出一个电位序列（spike train），即一个脉冲序列——对信息进行编码——神经元以一种连续的方式给出分等级的输出——激活的阈值随时间改变；
③神经元不会根据电脑的时钟脉冲去顺序地更新，而是随机地（异步asynchronously）更新（存在异步的神经网络模型）——实际应用采用时钟脉冲更新的算法；
④权重wi可正可负，这等价于兴奋性（excitatory）的连接与抑制性（inhibitory）的连接——使神经元更可能激活和更不可能激活——突触连接不存在一种到另一种的转换；
⑤现实的神经元在反馈环节中存在一个连接到其自身的突触——在神经网络中通常不会出现；

McCulloch和Pitts神经元模型可以记忆图像，学会表示函数和分类数据——模拟了神经元最重要的功能——决定是否激活，而忽略了令人讨厌的生物学问题；

模型只有在学习时才能用它来理解发生了什么，或者使用模型来解决某种问题时才有用——试图理解的学习将是机器学习（machine learning）而不是动物学习。

3.2 神经网络

单一的神经元无法学习——把一系列的神经元放置在一起——神经网络（neural network）
监督学习——每一个数据点都有一个正确的输出值与之对应；学习——泛化（generalisation）：假设数据中存在某一种模式，通过给神经网络一些已知的样例，我们希望它能够发现这种模式，并且正确地预测其他样例——模式识别（pattern recognition）

神经元：输入、权重、阈值——只能改变权重与阈值——如何改变神经元的权重和阈值模使网络能够更频繁地得到正确的结果？

感知器（perceptron，1985）——第一个神经网络

3.3 感知器

神经元组成的集合：包含一组输入和一些把输入和神经元连接在一起的权重——输入节点（左侧浅灰色）：输入值的个数等于输入向量的维度+神经元（右侧黑色）；

神经元彼此之间是完全独立的，每一个神经元的权重也是彼此独立的；
一般地，有m个输入和n个神经元。权重 ${{w}_{ij}}$ （i为1至m为输入的数量，j为1至n为神经元的数量）——困难：不清楚权重本来的大小

误差函数（error function）： ${{y}_{k}}-{{t}_{k}}$ ；其中，tk为神经元的目标，表示它应该得到的结果；yk为神经元的输出，表示它已经得到的结果——调整权重： $\Delta {{w}_{ik}}=-({{y}_{k}}-{{t}_{k}})\times {{x}_{i}}$ ——将其与旧权重相加得到新的权重

阈值的改变——防止特殊输入0的存在；
学习规则——每个权重改变多少——学习速率（learning rate） $\eta$ ——决定了网络学习的快慢——权重更新的最终规则： ${{w}_{ij}}\leftarrow {{w}_{ij}}-\eta ({{y}_{j}}-{{t}_{j}}){{x}_{i}}$
预定义最大的循环次数为T。

3.3.1 学习速率

参数 $\eta$ 控制权重调整的幅度：若为1，则每当出现一个错误的结果，权重将会进行大幅度的调整，导致网络不稳定（unstable），使权重的改变永远都不能停止；如果设置的过小，需要更多次地提供输入，网络花费更多时间去学习，但结果更稳定，对数据中的噪声和不精确的成分有更好的抵抗力；

通常： $0.1<\eta <0.4$

3.3.2 输入偏置

解决0输入问题——改变阈值函数，需要为一个额外的参数编写代码——给神经元增加一个额外的输入权重，并且使得对应与该权重的输入为一定值（可以为正或负，本书为-1）。在更新算法中也包含这个权重，已有的算法则不需要别的改进。

这个额外输入被称为偏置（bias）节点，通常以0为下标，与第j个神经元相连的权重就记为 ${{w}_{0j}}$ 。

3.3.3 感知器学习算法

该算法分为两个部分：训练（training）阶段和再现（recall）阶段；

初始化：设置所有的权重 ${{w}_{ij}}$ 为小的随机数（可正可负）；
训练：对T次循环——对每一个输入向量：
·利用激活函数g计算每一个神经元j的激活状态：

·利用下式更新每一个权重：
再现：利用下式计算每一个神经元j的激活状态：

复杂度：再现阶段循环了所有的神经元，并且对于每一个神经元，都要在所有输入上循环，因此它的复杂度为O(mn)；悬链部分做了同样的工作，但是循环了T次，因此复杂度为O(Tmn)。

3.3.4 感知器学习示例

以OR（或运算）为例：两个输入节点+输入偏置+输出节点；

设w0=-0.05，w1=-0.02，w2=0.02——考虑0:(0,0)，再现输出为1，实际为0（其中 =0.25），进行训练：

提供1:(0,1)，再现输出为0，实际为1，再次训练：

1:(1,0)，1:(1,1)再现满足要求——需要再次检查所有的输入，直到权重趋于稳定，不在发生变化，才意味着算法已经结束。

关注能起作用的值，而不关心真正的值，只要网络能够泛化到其他的输入。

3.3.5 具体实现

四个数组：输入、权重、输出、目标——输入向量（input vector）

for data in range(nData): # loop over the input vectors 
	for n in range(N): # loop over the neurons 
	# Compute sum of weights times inputs for each neuron 
	# Set the activation to 0 to start 
	activation[data][n] = 0 
	# Loop over the input nodes (+1 for the bias node) 
	for m in range(M+1): 
    	activation[data][n] += weight[m][n] * inputs[data][m] 

# Now decide whether the neuron fifires or not 
if activation[data][n] > 0: 
	activation[data][n] = 1 
else 
	activation[data][n] = 0

减少代码量——矩阵：m+1行（输入节点的个数加上偏置节点的个数1）、n列（神经元的个数）——np.array；
矩阵相乘——内维（inner dimension）相等——np.dot()

>>> import numpy as np 
>>> a = np.array([[3,4,5],[2,3,4]]) 
>>> b = np.array([[1,3],[2,4],[3,5]]) 
>>> np.dot(a,b) 
array([[26, 50], 
       [20, 38]])

输入向量：N×m，N为输入向量的个数、m为每个向量的维度；权重数组的大小为m×n。两者相乘得到N×n的矩阵——计算激活状态——where(condition, x, y)（condition为逻辑上的调价，x和y为具体的数值），返回一个矩阵，对于矩阵中的每一个元素，当condition为真时，值为x，反之为y。

>>> np.where(a>3,1,0)
array([[0, 1, 1],
       [0, 0, 1]])

则再现阶段的代码：

#Compute activations 
activations = np.dot(inputs,self.weights) 

# Threshold the activations 
return np.where(activations>0,1,0)

训练算法的第一部分与再现阶段的计算是一样的——两者使用同一个函数（命名为pcndwd——前向（forward）传播来得到输出的过程）；
权重矩阵：m×n，目标激活矩阵：N×m，输入矩阵：N×m——计算：np.dot(inputs, targets_activations)——将输入矩阵进行转置——np.transpose()：

>>> np.transpose(a) 
array([[3, 2], 
      [4, 3], 
	  [5, 4]])

权重为（eta代表学习速率η）：

self.weights -= eta*np.dot(np.transpose(inputs),self.activations-targets)

若上述矩阵的维度是正确的（np.shape()得到数组每一维度的长度），则需在输入向量中为偏置节点额外添加-1（np.concatenate()，可以定义一个一维数组，使里面的元素都为-1，然后添加到输入数组上），然后决定每一个权重的初始值；

inputs = np.concatenate((inputs,-np.ones((self.nData,1))),axis=1)

最后需要对每个权重赋初值（可以全为0，但一般设为小的随机数——np.rand——其中nIn与nout分别对应m与n）：

weights = np.random.rand(nIn+1,nOut)*0.1-0.05

完整程序在pcn.py中（待调试），提供的为批量（batch）版本：所有的输入批量写入算法，计算误差并更新权重，而下面的算法采用顺序（sequential）版本——以OR为例：

>>> import numpy as np 
>>> inputs = np.array([[0,0],[0,1],[1,0],[1,1]]) 
>>> targets = np.array([[0],[1],[1],[1]]) 
>>> import pcn_logic_eg 
>>> 
>>> p = pcn_logic_eg.pcn(inputs,targets) 
>>> p.pcntrain(inputs,targets,0.25,6) 
Iteration: 
0 
[[-0.03755646] 
[ 0.01484562] 
[ 0.21173977]] 
Final outputs are: 
[[0] 
[0] 
[0] 
[0]] 
Iteration: 
1 
[[ 0.46244354] 
[ 0.51484562] 
[-0.53826023]] 
Final outputs are: 
[[1] 
[1] 
[1] 
[1]] 
Iteration: 
2 
[[ 0.46244354] 
[ 0.51484562] 
[-0.28826023]]
Final outputs are: 
[[1] 
[1] 
[1] 
[1]] 
Iteration: 
3 
[[ 0.46244354] 
[ 0.51484562] 
[-0.03826023]] 
Final outputs are: 
[[1] 
[1] 
[1] 
[1]] 
Iteration: 4 
[[ 0.46244354] 
[ 0.51484562] 
[ 0.21173977]] 
Final outputs are: 
[[0] 
[1] 
[1] 
[1]] 
Iteration: 
5 
[[ 0.46244354] 
[ 0.51484562] 
[ 0.21173977]] 
Final outputs are: 
[[0] 
[1] 
[1] 
[1]]

下图给出了决策边界（decision boundary）：

目前对于数据集的学习达到了神经网络在1969年的水平，随后Minsky与Papert出版了《感知器》一书，通过讨论感知器的学习能力刺激神经网络的研究，并展示网络能够学习和不能学习的内容，不幸的是，这本书有效的遏制了神经网络大约20年的研究进展——需要了解感知器不同的学习方式。

3.4 线性可分性

感知器所做的：（二维空间是一条直线、三维空间是一个平面plane、更高维度的空间中是一个超平面hyperplane）一端的神经元都激活，而另一端的神经元都不激活——界限称为决策边界或判别函数（discriminant function）：x·wT≥0，其中w是权重矩阵W的某一行，它是连接输入与某个特定神经元的权重；

内积——Numpy中np.inner()函数实现

在感知器中，所谓的边界就是找到一个输入向量x1，满足x1·wT=0。假设找到另一个输入向量x2，满足x2·wT=0，则：

即两个向量间的夹角为直角——当给定一些数据对应目标输出时，感知器寻找一条直线来区分，如果直线存在，则该情况称为线性可分（linearly separable）的情况，如何不是线性可分，则构造一个函数；
当存在多于一个输出神经元时——得到多条直线：

3.4.1 感知器收敛定理（已勘误）

给定一个线性可分的数据集，感知器将在有限次数迭代后收敛于某种分类（Rosenblatt，1962），迭代次数以1/γ2为界，其中γ是分离超平面与最接近的数据点之间的距离。

证明：
假设每个输入向量的长度||x||≤1，且受到某些常数的显示（并非严格必要），已知存在权重向量w*（|| w*||=1）可以分隔数据，假设其为线性可分——寻找与w尽量平行或接近的向量w，使得每次权重更新时w·w增加且没有增加太多——检查w*·w的值和w的长度；
假设在算法的第t次迭代中，网络中出现y·w(t−1)·x < 0——权重更新：w= w(t−1) + y·x（此时假设η=1）——w*·w：

则每次权重更新，内积至少增加γ，则t次权重更新后：w*·w(t)≥tγ，根据柯西不等式（Cauchy-Schwartz inequality）可取得|| w(t)||下限：w*·w(t)≤||w*||·||w(t)||，即||w(t)|| ≥tγ，第t步迭代时有：

其中：y2=1，||x||2≤1，y·w(t−1)·x < 0，即t步迭代后，||w(t)|| 2≤t。
合并不等式可得：(t)1/2≥||w(t)|| ≥tγ，可得：t≤1/γ2

得证。

根据上述证明可知：若权重是线性可分的，则算法必将收敛，且迭代次数是分离超平面和最近的数据点之间的距离的函数（γ）——称之为间隔（margin）。
感知器会在获得所有训练数据后立即停止学习，因此无法保证只要有线性分界就要会找到最大间隔

注：该小节证明笔者有误、译者误上加误，且为简化证明，完整定理（novikoff定理）证明可看：
链接: novikoff定理证明.

3.4.2 XOR函数

XOR函数不是线性可分的——无法用一条直线将其分开——将网络变得更复杂：增加更多的神经元，同时使其连接变得更复杂——网络的训练变得更加困难。

3.4.3 有用的领悟

XOR函数在三维空间中重新表述，那么完全可以找到一个能够把两个类别分开的平面（直线的二维等价物）——只要把数据映射（project）到正确的维度的空间中，那么总是可以用一个线性函数来把两个类别区分开——核分类器（kernel classifier）：支持向量机（Support Vector Machine，SVM）的基础。

在我们使用计算机解决困难的运算问题之前，统计学在很长一段时间内被用来解决分类和回归的问题，并且直线的方法在统计学里活跃了很多年。它给出了一种理解学习过程的不同（且有用）的方法，并且通过使用统计学和计算机科学的方法，能够对整个领域有很好的理解——线性回归（linear regression）

3.4.4 另一个示例：皮马印第安人数据集

（待整理）

3.4.5 数据预处理

将目标缩放到0-1之间——有助于防止权重变得太大，缩放输入可以起到同样的效果；缩放输入数据最常用的方法是独立处理每个数据维度，使每个维度具有零均值和单位方差（不允许异常值占主导地位），或者只是进行缩放以使最大值为1且最小值为-1——数据归一化（normalisation）、标准化（standardisation）

Numpy可以通过np.mean()和np.var()进行归一化：

归一化需要在数据集分类之前，否则训练集与测试集两个集合的均值和方差很可能不一样——可以在不了解数据的情况下进行归一化，但需要进行预处理。
特征选择（feature selection）——去掉某一个特征能够使结果有所改进，就彻底去掉它，然后再尝试能否去掉其他特征——测试输出与每一个特征的相关性（correlation）（过于简单）——考虑维度简约（dimensionality reduction）：用更少的维度来表示数据，同时不会损失相关信息。

3.5 线性回归

回归问题：用一条线去拟合数据；分类问题：找一条线把数据分开——通常会把分类问题转化为回归问题：① 引入指示变量（indicator variable）：表示每一个数据点所属的类别——用数据去预测（predict）指示变量；② 重复的回归：每一次对其中一个类别，指示值1代表样本属于该类别，0代表属于其他类别。

感知器与更多基于统计学的方法之间的区别在于：提出问题的方法不同。

界定一条直线（平面或超平面），使之能够更好地拟合（fit）数据——尽量最小化一个测量所有点到直线距离的和的误差函数——忽略平方根，仅最小化误差的平方和——最小二乘优化（least-squares optimisaton）：选择参数，使之能够最小化在所有点上预测值与实际值的差的平方和：

矩阵的形式为：

其中，t为目标值，X是输入值的矩阵（包含偏置输入）——计算其最小值： ${{\beta }^{T}}{{X}^{T}}t={{t}^{T}}X\beta$ 对β求导—— ${{X}^{T}}(t-X\beta )=0$ ，解得： $\beta ={{({{X}^{T}}X)}^{-1}}{{X}^{T}}t$ ，即给定输入向量z其预测值为zβ。

3.5.1 示例

（待补充）

你可能感兴趣的:(深度学习,python,机器学习,深度学习,python,机器学习)

numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
Python前端开发 PITSU 正则表达式 html css3 mysql
Python前端开发1.前端三剑客（HTML，CSS和JavaScript）1.1HTML1.1.1HTML简介HyperTextMark-upLanguage,指的是超文本标记语言；html是开发网页的语言；html中的标签大多数都是成对出现的,格式:1.1.2HTML结构第一行是文档声明部分HTML：分为页头，页身和页脚。标签大部分是成对出现1.1.3第一行文档声明部分HTML在vscode中
AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
python中strip()，lstrip()，rstrip()函数的讲解使用方法高质量海王哦 python python
在Python中，strip()、lstrip()和rstrip()是用于处理字符串的三个常用方法，它们的作用都是去除字符串两端的空白字符或指定字符，但它们的去除位置有所不同。下面是它们的详细讲解：1.strip()方法strip()方法用于去除字符串两端的空白字符（默认情况下，包括空格、换行符、制表符等），或者去除指定的字符序列。语法：string.strip([chars])chars：可选参
疯狂python讲义学习日志06——异常处理静笃归心方得平和心气 Python学习日志异常处理 python学习 python笔记 python速成
疯狂python讲义学习日志06——异常处理引言1异常处理机制1.1使用try...except处理异常1.2异常类的继承体系1.3多异常捕获1.4访问异常信息1.5else块1.6使用finally回收资源2使用raise处理异常2.1引发异常2.2自定义异常类2.3except和raise同时使用3.python的异常传播轨迹4.异常处理规则4.1不要过度使用异常4.2不要忽略异常引言异常机制
Python 生成数据(使用Pygal模拟掷骰子) 钢铁男儿 Python 从入门到精通 python 开发语言
数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关，而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表，也可以是数以吉字节的数据。使用Pygal模拟掷骰子在本节中，我们将使用Python可视化包Pygal来生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表，这很有用，因为它们将自动缩放，以适合观看者的屏幕。如果你打算以在线方式使用
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Python中 rstrip()、 lstrip（）、 strip() 的用法和区别一只小小的土拨鼠深度学习面试前端 java python 深度学习
目录：题目一：Python中rstrip()、lstrip（）、strip()的用法和区别题目二：python中append（）、expend（）函数的用法和区别题目三：Python中zip()、zip(*zipped)、*zip()函数的用法和区别题目一：Python中rstrip()、lstrip（）、strip()的用法和区别考点这三个函数都是去除头尾字符、空白符的函数strip：用来去除头
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
python strip/rstrip/lstrip详细讲解（涵盖许多例子、作用以及复杂行为处理） zilan23 Python python
pythonstrip/rstrip/lstrip详细讲解：在Python中，strip、lstrip、rstrip是用于字符串处理的常用方法，主要功能是去除字符串首尾的指定字符。它们的区别如下：1.strip([chars])作用：删除字符串开头和结尾处所有属于chars的字符，直到遇到不属于chars的字符为止。默认行为：若未提供chars参数，默认去除空白符（空格、换行\n、制表符\t等）。
Python逆向爬取Tik Tok，MsToken,X-Bogus以及signature 才华是浅浅的耐心 python javascript 前端
自5月起，抖音正式开放Web接口，并不断升级风控机制。从最初的_signature参数，到增加滑块验证，再到如今的JSVM混淆处理，以及mstoken和x-bougs等参数的引入。分析发现，部分国内接口仅需提供Cookie即可访问，无需额外验签，而获取Cookie的方式多种多样，其中利用OpenCV识别滑块验证码是一种简单可行的方法。相比之下，TikTok的接口无需Cookie，但对签名的校验更加
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
Linux篇1-初识Linux 逃跑的机械工 Linux linux
1.Linux能干什么Linux能够进行各种语言的开发工作，基本主要以后端语言为主C++，JAVA,python;Linux能进行各种指令操作，从而完成各种的文件相关的管理工作2.Linux基本指令2.1ls指令在Linux中，以.开头的文件，叫做隐藏文件；ls-a显示隐藏文件隐藏文件：Linux配置文件，可以隐藏起来，防止误操作，起到保护作用；ls-l列出文件的详细信息-d将目录象文件一样显示，
Python获取tiktok视频数据信息 api 爬虫程序媛了了 python 开发语言
Tiktok通过ID爬取视频信息api采集页面如图：https://www.tiktok.com/@basketwithball2.0/video/7273119444522650912?q=irving&t=1706683319923请求APIhttp://api.xxxx.com/tt/video/info?video_id=7273119444522650912&token=test请求参数
【初学者】用Python语言来解释指针的用例与应用场景 lisw05 python python 开发语言
李升伟整理Python本身并不直接支持指针的概念，因为Python是一种高级语言，内存管理由解释器自动处理。不过，Python提供了一些机制（如引用、可变对象等）来实现类似指针的功能。以下是Python中“指针”的用例和应用场景。1.引用机制（类似指针）在Python中，变量是对对象的引用，而不是直接存储对象的值。这种引用机制类似于指针的概念。示例：a=10#a是对整数对象10的引用b=a#b也引
python、JavaScript 、JAVA等实例代码演示教你如何免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档详解参数说明蝶澈乐乐 python javascript java 股票数据接口 api 开发语言
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归 OverlordDuke 聚类算法数据可视化爬虫线性回归算法
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归利用数据实现全面分析数据分析与可视化功能创新的聚类分析功能结语在如今房地产市场日益复杂的背景下，对于投资者、购房者和市场分析师来说，了解市场动态并做出明智的决策至关重要。基于此，我们开发了一款基于Python的城市二手房分析与可视化系统，为用户提供了强大的工具，帮助他们深入了解当地房地产市场。利用数据实现全面分析我们的系统利用爬取的58同
centos7输入python -m bitsandbytes报错CUDA Setup failed despite GPU being available. Please run the follo 小太阳，乐向上 python 开发语言
在centos7.9系统中安装gpu驱动及cuda，跑大模型会报错，提示让输入python-mbitsandbytes依然报错：CUDASETUP:Loadingbinary/usr/local/python3/lib/python3.9/site-packages/bitsandbytes/libbitsandbytes_cuda117.so.../lib64/libstdc++.so.6:ve
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
python-56-基于Vue和Flask进行前后端分离的项目开发示例实战皮皮冰燃 python3 python vue.js flask
文章目录1创建Vue前端项目1.1运行demo1.2实现需求2flask部署上述dist(前后端未分离)2.1代码app.py2.2运行访问3nginx部署(前后端分离)3.1nginx前端服务3.3.1windows安装nginx3.3.2修改nginx.conf配置文件3.3.3启动nginx3.3.3停止nginx3.2启动后端服务3.2.1app.py(去除前端渲染)3.2.2启动flas
爬虫基础--request库详解 amo的代码园_毕设 Java基础爬虫 java spring boot vue.js python 开发语言
爬虫基础–request库详解1.requests模块介绍request库中文文档：https://docs.python-requests.org/zh_CN/latest/user/quickstart.htmlrequests是一个非常流行的PythonHTTP第三方库，它允许你发送各种HTTP请求，处理cookies、会话、连接池、重定向、多种认证方式等，使得处理HTTP请求变得非常便捷，
基于百度翻译的python爬虫示例魂万劫 python 爬虫开发语言百度翻译
(今年java工作真难找啊，有广州java高级岗位招人的好心人麻烦推一下，拜谢。。）花了一周时间，从零基础开始学习了python，学有所获之后，就总想爬些什么，不然感觉不得劲，所以花了一天时间整出了个百度翻译的爬虫示例，主要卡点花在了找token、sign以及调试请求上。代码有点乱，毕竟是demo，但是功能是实现了的。importrequestsimportjs2pyimportrefromurl
关于bitsandbytes安装报错跃跃欲试88 语言模型人工智能 transformer
RunTimeError:CUDASetupfaileddespiteGPUbeingavailable.InspecttheCUDASETUPoutputsabovetofixyourenvironment!ubuntu@VM-0-8-ubuntu:~$python-mbitsandbytesFalse===================================BUGREPORT===
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb） flood_d mongodb python selenium pyquery 爬虫
1.环境须知做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。2.直接上代码spider.pyimportrefromconfigimport*importpymongofromseleniumimportwebdriverfromselenium.common.exceptionsimportT
一篇文章教会你用Python爬取淘宝评论数据【淘宝商品评论数据接口参数】 Tinalee-电商API接口呀主流电商数据采集API接口淘宝天猫商品API接口淘宝商品评论API接口 python 开发语言人工智能大数据爬虫 java
【一、项目简介】本文主要目标是采集淘宝的评价，找出客户所需要的功能。统计客户评价上面夸哪个功能多，比如防水，容量大，好看等等。【二·淘宝/天猫获得淘宝商品评论API返回值】item_review-获得淘宝商品评论taobao.item_review公共参数名称类型必须描述keyString是调用key（必须以GET方式拼接在URL中）secretString是调用密钥api_nameString是
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt