不争气大王

机器学习浅尝一下

在b站上学习吴恩达老师的机器学习有感，插个眼大致做个初步笔记并不断补充，看别人的笔记不如自己做笔记印象来得深刻，建议大家都去听一遍。
哔哩哔哩传送门：https://www.bilibili.com/video/BV164411b7dx?p=1

学习目录

- 一、First Day
- - 1. 监督学习
  - - 1.1 分类算法
    - 1.2 回归算法
  - 2. 无监督学习
  - - 2.1 聚类算法
    - 2.2 鸡尾酒会算法
  - 3. 模型描述
  - 4. 线性回归：一元线性回归（单变量线性回归）
  - 5. 梯度下降算法
  - 6. 将梯度下降法应用到最小化平方差代价函数（Batch梯度下降算法）
- 二、Second Day
- - 1. 多功能/多变量 Multiple features（variable）
  - 2. 多元梯度下降法
  - 3. 多元梯度下降法——特征缩放法
  - - 3.1 特征值
    - 3.2 均值归一化
  - 4. 多元梯度下降法——学习率
  - - 4.1 确保梯度下降正常工作
    - 4.2 如何选择学习率
  - 5. 特征和多项式回归
  - - 5.1 可供选择的特征
    - 5.2 如何得到不同的学习算法
  - 6. 正规方程
  - - 6.1 等价使得J(θ)最小化的θ值
    - 6.2 何时使用梯度下降法、正规方程法
    - 6.3 不可逆性解决方法
  - 7. 向量化的方法
  - 8. Logistic回归算法
  - - 8.1 为何开发Logistic分类算法
    - 8.2 假设陈述
    - 8.3 决策界限
    - 8.4 代价函数
    - 8.5 简化代价函数与梯度下降
    - 8.6 高级优化
    - 8.7 多元分类：一对多分类算法
  - 9. 过拟合问题
  - - 9.1 利用工具来识别过拟合和欠拟合情况
    - 9.2 正则化
- 三、Third Day 被称为神经网络的机器学习算法
- - 1. 神经网络表示假设或模型
  - 2. 将神经网络的计算向量化
  - 3. 神经网络中单个神经元如何被用来计算
  - 4. 利用神经网络得到非线性决策边界
  - 5. 利用神经网络解决多类别分类问题
  - 6. 代价函数
  - 7. 反向传播算法
  - 8. 梯度检验
  - 9. 随机初始化
  - 10. 神经网络实现过程
  - - 10.1 选择架构
    - 10.2 训练神经网络需要实现步骤
- 四、Forth Day 机器学习诊断法
- - 1. 评价算法学习得到的假设
  - 2. 训练集train、验证集val、测试集test
  - - 2.1 如何选择一个模型
    - 2.2 如何合理评估一个假设
  - 3. 诊断偏差与方差
  - - 3.1 正则化如何影响偏差和方差
  - 4. 学习曲线
  - 5. 执行的优先级（垃圾邮件分类器）
  - - 5.1 构造邮件的特征向量x和分类标签y
    - 5.2 思考用更复杂的特征变量\算法提高学习效果
  - 五、Fifth Day
  - 1.误差分析
  - 2. 不对称性的误差评估
  - 3.精准度和召回率的权衡
  - 4. 机器学习数据
  - 5. 优化目标
  - 6. 支持向量机（大间距分类器）
  - 7. 核函数
  - 8. 使用SVM
  - 9. 无监督学习

机器学习：使计算机具有自主学习能力，从经验E中进行学习，在提高性能度量P中完成任务T。

常用的的机器学习算法
监督学习：教计算机做某事
无监督学习：让计算机自己学习
半监督学习：（学习样本中部分记录有结果标记）

机器学习三大基本模型
分类模型、回归模型（RM）、聚类模型

支持向量机算法：允许计算机处理无穷多的特征
一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器。

一、First Day

1. 监督学习

给算法一个数据集，其中包含了正确答案y

1.1 分类算法

通过对训练集的学习将属性映射到目标上，预测离散值0、1或两个以上的离散输出。

分类算法常用的评估指标：
精确率：预测结果与实际结果的比例
召回率：预测结果中某类结果的正确覆盖率
F1-Score：统计量，综合评估分类模型的指标，取值0~1之间，越大模型可用度越高

分类算法：KNN算法、决策树
分类模型：logistic回归模型（可包含多个非线性项）

1.2 回归算法

设法预测一个连续值的输出，让一条直线拟合数据，可用二次函数或二阶多项式

回归算法：KNN算法
回归模型：线性模型(Linear Model)、多项式模型(Polynomial Model)
（训练集特征次数越高，拟合所涵盖的范围越广，预测也越准确，但过于复杂的模型可能产生过拟合问题）

损失函数loss：评价模型所产生的预测结果的一个函数，根据损失函数的反馈值调整参数

2. 无监督学习

从无标记的训练数据中推断结论

2.1 聚类算法

自动按照的到的类型将个体分成不同的簇，例如谷歌新闻的标签分簇行为，聚类分析所使用的方法不同，往往会得出不同的结论。

聚类算法：K-Means

2.2 鸡尾酒会算法

帮忙找出数据的类型结构，分离被混合到一起的音频源

3. 模型描述

m：表示训练样本的数量
x：表示输入变量/特征
y：表示预测输出的目标变量
(x,y)：一个训练样本
(x^(i) ,y^(i))：特定第i个训练样本
h：假设函数，一个引导从x得到y的函数

4. 线性回归：一元线性回归（单变量线性回归）

假设函数h(x)=a+bx如何决定参数a、b，将最有可能的直线与我们的数据相拟合？
即要解决关于a、b的最小化问题，减少假设的输出值与真实值之间的差平方。

定义一个代价函数（平均误差函数、平方误差代价函数）
=样本数的一半 * (输出值与真实值之间的差平方之和）
要找到使代价函数为最小值的参数是多少

5. 梯度下降算法

初始化参数，使代价函数不断变小，直至找到最小值或局部最优值

学习速率代表着改变参数引起变化的步伐，太小的话梯度下降过慢，太大的话可能越过最优点无法收敛甚至发散。

假如初始化等于局部最优点，导数项会等于0，梯度下降法不会改变什么。

当我们接近局部最优点时，梯度下降法会自动采取更小的幅度。

6. 将梯度下降法应用到最小化平方差代价函数（Batch梯度下降算法）

二、Second Day

1. 多功能/多变量 Multiple features（variable）

x1	x2	x3	x4	y
1	2	3	4	5
1	2	1	4	7
1	2	2	7	4

特征量 n = 4
样本数量 m = 3
第i个训练样本的输入特征值 x^(1) = [1 2 3 4]^T ：四维的特征向量（一列而不是一行）
第i个训练样本的输出值 y^(1) = [5]
h(x) = a^(T) · x = a0x0+a1x1+…+anxn

2. 多元梯度下降法

①如何设定假设的参数？
②使用多元梯度下降法处理多元线性回归

代价函数

梯度下降（不断更新参数）

3. 多元梯度下降法——特征缩放法

并不需要太精准，只是为了让梯度下降，收敛所需的迭代少一点，运行的快一点

3.1 特征值

不同特征的取值在相近的范围内，能使梯度下降法能快收敛

一般将特征值的取值约束到-1到+1的范围内，或者附近范围足够接近

3.2 均值归一化

x属于（0,2000）
x1 = (size - 范围均值）/（范围差值）

4. 多元梯度下降法——学习率

适用于回归模型，只要学习率足够小，每次迭代之后的代价函数J(θ)都会下降。

4.1 确保梯度下降正常工作

梯度下降法->找到θ值，并希望能够最小化代价函数J(θ)

①通过迭代次数-代价函数值图像，得到J(θ)逐步下降的趋势，判断梯度下降法是否已经收敛

②自动收敛测试（通过另外一种算法）

4.2 如何选择学习率

迭代次数-J(θ)图像	常见原因	学习率修正
逐步上升	α值过大，梯度调整越过最小值	降低α值
下降过慢	α值过小，收敛过慢	提高α值

从1、0.1、0.001、（0.0005）、0.0001逐步以十分之一递减，找到较好的学习率

5. 特征和多项式回归

5.1 可供选择的特征

①原有特征
②利用原有特征创造新的特征

5.2 如何得到不同的学习算法

使用其他算法原因：二次模型能很好拟合，但是二次函数最终会下降。

多项式回归模型：可以使用多元线性回归的方法，对算法进行简单修改来实现（梯度下降法要注意好特征的缩放）

6. 正规方程

区别于迭代方法的直接解法，对于某些线性回归方程，提供更好的方法一次性求解参数θ的最优值（不需要特征缩放），但是不适合更复杂的学习算法。

6.1 等价使得J(θ)最小化的θ值

加一列x0进行矩阵设计，X = m*（n+1）维矩阵、y = m维向量
m是训练样本的数量、n是特征变量数


得到使得代价函数最小化的θ

6.2 何时使用梯度下降法、正规方程法

方法选择	优点	缺点	适合特征数
梯度下降法	特征变量大量也可以运行好	需要测试学习速率α、多次迭代	n=10000
正规方程法	不需要选择α值，易实现	特征变量多计算θ会慢	n=1000

6.3 不可逆性解决方法

在octave中使用pinv即使矩阵不可逆也能算出来违逆函数，但inv就不一定。
①查看数据中是否有些多余的特征并删掉；互为线性的特征删除其中一个；没有多余但是过多，在影响不大下删除一些特征；或考虑正规化方法。

7. 向量化的方法

利用octave高度优化的数值线性代数算法来计算θ和x两个向量的内积，利用向量化的方法得到一个更为高效的线性回归算法。

8. Logistic回归算法

预测值y为离散值的情况

二分类/二元分类问题：0（负类）、 1（正类）
多分类：0、1、2、3

8.1 为何开发Logistic分类算法

1、把线性回归方程应用到数据集
2、用直线对数据进行拟合
3、设置一个阈值，大于阈值即等于1、小于则等于0

把线性回归应用于分类问题通常不是一个好的选择，易受干扰，输出值可能会大于1或小于0；改用Logistic回归算法可以让输出的预测值一直介于0和1之间。

8.2 假设陈述

Logistic回归不是回归算法，而是分类算法

目标：希望分类器的输出值在0和1之间

Logistic回归中假设函数的表示方法：利用Sigmoid function（Logistic function）对方程做出改变，让g(z)在0和1之间，使得h(θ)也落在0和1之间。

假设将特征值x输入模型中，输出的h(θ)为y=1的概率。

8.3 决策界限

如果h(θ)=g(z) ≥ 0.5，即z ≥ 0，输出y=1
如果h(θ)=g(z)＜0.5，即z＜0，输出y=0
z为设置的公式（低阶/高阶多项式）-> 更复杂的决策边界

红线即为决策边界（假设函数的一个属性，决定于参数的设置）

8.4 代价函数

学习拟合logistic回归模型的参数θ -> 用来拟合参数的优化目标称为代价函数

寻找一个为凸函数的代价函数，并且用于梯度下降法找到全局最优

8.5 简化代价函数与梯度下降

利用梯度下降法拟合出logistic回归的参数

8.6 高级优化

优化代价函数的不同方法
后三种算法
优点：不需要手动选择学习率α，收敛速度远快于梯度下降
缺点：复杂，直接调用相关的库即可

8.7 多元分类：一对多分类算法

使用逻辑回归解决多类别分类问题 y=1、2、3…离散值

有三个类的数据集：转化为三个独立的二元分类问题

①将第1、2类分为一类 =》识别y=3的概率
②训练第一个标准的逻辑回归分类器，得到判定边界
③将第1、3类分为一类 =》识别y=2的概率
④训练第二个标准的逻辑回归分类器，得到判定边界
⑤将第2、3类分为一类 =》识别y=1的概率
⑥训练第三个标准的逻辑回归分类器，得到判定边界

9. 过拟合问题

过拟合导致表现欠佳 <- 正则化技术改善

过度拟合：通过了所有的点，但曲线扭曲无法预测新样本，在变量过多的时候会出现。
泛化能力：一个假设模型应用到新样本（没有出现在数据集）的能力

9.1 利用工具来识别过拟合和欠拟合情况

绘制假设模型曲线

拟合程度	原因	解决方法
过度拟合	特征量过多、训练数据非常少	①尽量减少选取变量的数量（模型选择算法）②保留所有特征但减少量级或参数大小（正则化）
欠拟合	特征量过少、模型复杂度过低	①增加新特征 ②添加多项式特征 ③减少正则化参数 ④使用非线性模型

9.2 正则化

优化目标：最小化均方误差代价函数，加入惩罚项让高阶项的参数尽可能小，得到更简单的函数，近似于二次函数（参数越小，线段越平滑）

如果特征值过多，不知道该缩小哪些项，就在末尾加入正则化项，缩小每一个参数，但正则化参数λ不能设置太大，会导致对每一项的惩罚力度太大都趋向于0。

可将正规方程和梯度下降两种算法推广到正则化线性回归进行。

三、Third Day 被称为神经网络的机器学习算法

样本中含有大量特征值，logistic回归并不适用，神经网络能很好地解决不同的机器学习问题。

1. 神经网络表示假设或模型

可以在前面加上x0=1 称为偏置单元或偏置神经元
通常会说这是一个带有sigmoid或者logistic激活函数的人工神经元

激活函数：通常指代非线性函数g(z)
模型权重weights：模型参数θ

神经网络其实就是一组神经元连接在一起的集合

第一层（输入层）：输入特征值x1 x2 x3
第二层（隐藏层）：中间有三个神经元a1 a2 a3（可以不止一个隐藏层）
第三层（输出层）：第三个节点，这一层的神经元输出假设的最终计算结果

神经网络究竟在做什么？

激活项：由一个具体神经元计算并输出的值

三个隐藏单元和输出层：通过激活函数计算相应的激活值

2. 将神经网络的计算向量化

前向传播：通过上一层的i,j,k等结点以及对应的连接权值进行加权和运算，最终结果再加上一个偏置项，再通过一个非线性函数（即激活函数），如Relu、sigmoid等函数，得到的结果就是本层结点的输出。

神经网络与逻辑回归相似，但区别在于神经网络不是使用原有特征值x来训练逻辑回归，而是使用隐藏层得到的a作为新特征值。

神经网络的架构：神经网络中神经元的连接方式

非线性假设函数
第一层：将输入层的激活项通过前向传播到后面的隐藏层，直到输出层
第二层：隐藏层，将输入层的原始特征项作为输入，计算出更为复杂的特征
第三层：隐藏层，将第二层训练出的特征项作为输入，计算出更为复杂的特征
第四层：逻辑回归器最后一层输出层

3. 神经网络中单个神经元如何被用来计算

4. 利用神经网络得到非线性决策边界

5. 利用神经网络解决多类别分类问题

数字识别：0-9的多类别分类问题

要在神经网络中实现多类别分类，采用的方法本质上是一对多方法的扩展

四个逻辑回归分类器，每一个都将识别图片中的物体是否为四种类别中的一种

6. 代价函数

在给定训练集时，为神经网络拟合参数

7. 反向传播算法

让代价函数最小化的算法，比线性回归算法和逻辑回归算法要复杂

前向传播算法

反向传播算法

计算代价函数的倒数

8. 梯度检验

实现反向传播或者类似梯度下降算法时，保证前向传播或反向传播的正确

9. 随机初始化

①权重全部设置为0（不可取）
②权重随机初始化为接近0的范围，再进行反向传播和梯度检验、梯度下降或者其他高级优化算法来最小化代价函数J

10. 神经网络实现过程

10.1 选择架构

在训练一个神经网络时，先选择一个神经网络架构
1、定义输入单元的数量（特征集x的维度）
2、输出层的单元数目（多类别分类中所要区分的类别个数）
3、隐藏层单元个数和隐藏层层数（默认单个，或者多层拥有相同单元个数）

10.2 训练神经网络需要实现步骤

1、构建一个神经网络架构，随机初始化权重
2、执行前向传播算法
3、计算出代价函数J(θ)
4、执行反向传播算法求出偏导数项
5、使用梯度检查比较计算得到的偏导数项，确保两种方法得到基本接近的两个值
6、使用一个最优化算法（梯度下降算法、LBFGS算法、共轭梯度法等）

四、Forth Day 机器学习诊断法

1. 评价算法学习得到的假设

在模型中选择好参数来使训练误差最小化，训练误差越小不一定越好，可能会过拟合，这时泛化能力就不见的好了。

将数据随机分为训练集train、测试集test（7:3）

线性回归问题、逻辑回归问题：
1、训练数据：对训练集进行学习得到参数θ（最小化训练误差J(θ)）
2、将参数θ用来计算测试误差J_test（假设函数的平方误差）

2. 训练集train、验证集val、测试集test

存在过拟合原因：训练集误差不能用来判断该假设对新样本的拟合好坏

2.1 如何选择一个模型

加上参数d、取每个n次函数和相应的参数θ，得出测试误差J_test进行比较，但仍不能得到很好地泛化能力

2.2 如何合理评估一个假设

将数据集分为训练集train、交叉验证集val、测试集test（6：2：2）

定义训练误差、验证误差、测试误差

用验证集来选择模型，而不是原来的测试集

1、选取第一个模型，然后最小化代价函数，得到对应的参数向量θ
2、对后续模型重复步骤
3、用交叉验证集来检验效果
4、选择最小的验证集误差，得出最合适的参数d，即这个多项式次数

3. 诊断偏差与方差

欠拟合、过拟合 -> 偏差或方差较大

随着方程复杂度增加，训练集误差和交叉验证集误差不同

欠拟合：train-error和val-error都很大，多项式次数过小，是高偏差问题；
过拟合：train-error和val-error具有较大高度差，多项式次数过大，是高方差问题；

3.1 正则化如何影响偏差和方差

加入正则化项让参数θ尽量小，可以有效防止过拟合

正则参数过大，容易欠拟合（产生高偏差）；过小容易，过拟合（产生高方差）

如何选择正则化参数λ？
1、考虑不使用正则化，选取一系列想要尝试的λ值0、0.01、0.02…
2、在每个模型中最小化代价函数J(θ)，得到对应的参数向量θ，用交叉验证集进行评价
3、选取交叉验证集误差最小的模型
4、用交叉验证集拟合参数后，用测试集进行评价

4. 学习曲线

检验运行是否一切正常、改进算法

用正则化去修正更便捷一点

5. 执行的优先级（垃圾邮件分类器）

如何通过监督学习构造一个分类器来区分垃圾邮件和非垃圾邮件？

5.1 构造邮件的特征向量x和分类标签y

要想使用监督学习，思考如何构造邮件的特征向量x和分类标签y，有了x和y才能构造分类器，例如使用逻辑回归等方法

选择邮件的特征向量的方法：提出一个可能含100个单词的列表进行区分（实际上选取出现频率最多的n个单词作为特征向量）

5.2 思考用更复杂的特征变量\算法提高学习效果

五、Fifth Day

1.误差分析

除了绘制学习曲线外，误差分析也可以帮助我们系统地作出选择，通过数值来评估算法的效果，在交叉验证集上做误差分析，而不是测试集。

当需要对目标进行机器学习时，最好先粗暴的做出一个简单的模型来实现初始算法，尽管他的效果可能不太好，但是通过后续误差分析等不断做出优化，可以更好的实现目标。

2. 不对称性的误差评估

如何使用一个合适的误差度量值？

偏斜类：在样本数据中y=0和y=1的比值趋于极端情况，某一类数据很少

对于偏斜类使用分类精确度，并不能很好地衡量算法，可能会出现预测y=0但是提高了评估数值的情况。需要一个不同的误差度量值/评估度量值，其中一种叫做查准率和召回率。

需要加入查准率和召回率对模型进行好坏评价！
查准率precision：对于预测出y=1的数据中，有多大比例的x是真正y=1的。真阳性/（真阳性+假阳性）查准率越高越好
召回率recall：对于真正y=1的数据中，有多大比例的x能被预测出来y=1。真阳性/（真阳性+假阴性）召回率越高越好

3.精准度和召回率的权衡

高查准率模型（低召回率）：对于预测癌症患者，将决策界限从0.5提高到0.7能够更加准确的预测患癌，该模型的precision会提高，但是会有较低的recall。
高召回率模型（低查准率）：对于预测癌症患者，将决策界限从0.5降低到0.3避免遗漏癌症患者，该模型的recalln会提高，但是会有较低的precision。

有没有办法自动选取临界值，或者在多个算法中如何比较查准率和召回率？

1、计算查准率和召回率的平均值（不太可行）
2、计算F值（有多种）

4. 机器学习数据

随着训练数据的增加，在基于特征值含有较为完善的内容下，算法的性能可能会越来越好。

5. 优化目标

如何优化目标 -> 优化相应的公式方程（代价函数等）

支持向量机监督学习算法：支持向量机SVM，与logistic回归和神经网络相比，在学习复杂的非线性方程时，能够提供一种更为清晰的和更加强大的方式。

支持向量机并不会输出概率，而是通过优化代价函数得到一个参数θ，通过假设函数直接进行预测。

6. 支持向量机（大间距分类器）

SVM具有更稳健的决策边界，能更好地分开正样本和负样本，拥有更大的距离（间距），和训练样本的最小距离要大一点（支持向量机的间距），这使得支持向量机具有鲁棒性，因为它在分离数据时会尽量用大的间距去分离。

鲁棒性：指系统在受到扰动或者不确定的情况下，仍然可以维持某些性能的特性。

7. 核函数

改造支持向量机算法来构造复杂的非线性分类器

弹幕大佬：核函数把损失函数中的θ和x内积中的x改为f(x)，加了一层神经元，是一种优化SVM的方法。

8. 使用SVM

调用软件库去实现liblinear、libsvm

9. 无监督学习

插个眼下次再学

数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
「日拱一码」035 机器学习——调参过程可视化胖达不服输「日拱一码」机器学习人工智能调参过程可视化神经网络 python 模型可解释性
目录超参数搜索的3D曲面可视化交互式3D可视化神经网络学习率的3D可视化SVM超参数的3D决策边界可视化超参数优化的3D动画超参数搜索的3D曲面可视化##超参数搜索的3D曲面可视化importnumpyasnpimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromsklearn.datasetsimportmake_
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
高斯混合模型（GMM）中的协方差矩阵类型与聚类形状关系详解码字的字节机器学习机器学习人工智能高斯混合模型 GMM
高斯混合模型（GMM）简介高斯混合模型（GaussianMixtureModel,GMM）是概率统计与机器学习交叉领域的重要模型，其核心思想是通过多个高斯分布的线性组合来描述复杂数据分布。与单一高斯分布不同，GMM能够捕捉数据中的多模态特性，这使得它在处理真实世界非均匀分布数据时展现出独特优势。从数学形式上看，一个包含K个分量的GMM可表示为：其中(\pi_k)是第k个高斯分量的混合系数（满足(\
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl