九磅十五便士°

机器学习之分类算法

1.德国信息卡欺诈数据分类

import numpy as np
import pandas as pd

_author_ = '张起凡'
from sklearn.model_selection import train_test_split
from sklearn.linear_model._logistic import LogisticRegression
from sklearn.metrics import accuracy_score

# 二分类
# 逻辑回归，使用sigmoid函数
# 德国信用卡欺诈数据集分类
data = pd.read_csv("./数据集/credit-a.csv", header=None)
# print(data.head())
x = data[data.columns[:-1]]
y = data[15].replace(-1, 0)
print(y)
x_train, x_test, y_train, y_test = train_test_split(x, y)  # 划分训练集和测试集
model = LogisticRegression(max_iter=10000)  # 建立模型
model.fit(x_train, y_train)  # 使用训练集训练模型
y_pre = model.predict(x_test)
print(y_pre)
# 此时可以直接得到分类预测的结果，但如果想得到sigmoid函数的概率值
y_gailv = model.predict_proba(x_test)
print(y_gailv)
# 最后计算准确率,可以逐一利用循环对比统计准确率，也可以使用sklearn中现成函数
accuracy_sum = accuracy_score(y_pre, y_test)
print(accuracy_sum)
# 如果想提高分类的准确率，需要对数据进行预处理

图中分别为预测的结果以及根据函数变换后得出的概率，第一组前面大，预测为0，第二组后面大，预测为1，以此类推。

预测的准确率如下图：

2.决策树算法原理

# 决策树算法原理
'''
1.最经典的机器学习模型之一
2.预测结果容易理解，易于解释
3.可处理类别型和连续型数据
'''
'''
先对哪个特征进行分类？
信息的量化，基尼不纯度
哪个特征能带来最多的信息变化幅度，就优先选择哪个
如果特征为连续的，先进行离散化处理
'''
'''
什么时候停止
1.可以到所有特征都划分完毕的时候停止
2.可以设置一个阈值，此时获得的信息增益非常小，达到时停止
'''
'''
决策树解决过拟合方法：
1.前剪枝：设定一个阈值，信息熵减小的数量小于这个值，停止创建分支
2.后剪枝：决策树创建完成后，对节点检查其信息熵的增益
3.控制决策树的最大深度
'''

3.泰坦尼克号数据集预处理

# 泰坦尼克数据集预处理
data = pd.read_csv('./数据集/train.csv')
print(data.columns)
data = data[['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']]
data['Age']=data['Age'].fillna(data['Age'].mean()) # 将缺省的年龄值设为平均值
print(data['Age'])
data.fillna(0,inplace=True) # 空白填充法，填充为0，对缺失值进行处理
data['Sex']=[1 if x=='male' else 0 for x in data.Sex] # 使用列表推导式,男性为1，女性为0
data['p1']=np.array(data['Pclass']==1).astype(np.int32)
data['p2']=np.array(data['Pclass']==2).astype(np.int32)
data['p3']=np.array(data['Pclass']==3).astype(np.int32)
# 在数据集中有1，2,3三个登记，为了防止计算机引入默认的线性关系，所以分离出来，比如3是1的三倍
del data['Pclass']# 删除原有列
print(data.Embarked.unique()) # 唯一显示登船港口
data['e1']=np.array(data['Embarked']=='S').astype(np.int32)
data['e2']=np.array(data['Embarked']=='C').astype(np.int32)
data['e3']=np.array(data['Embarked']=='Q').astype(np.int32)
del data['Embarked']
data_train=data[['Sex','Age', 'SibSp', 'Parch', 'Fare','p1','p2','p3','e1','e2','e3']]
print(data_train)
data_target=data['Survived'].values.reshape(len(data),1) # 变为一列
# print(data_target)
print(np.shape(data_train))
print(np.shape(data_target))

数据处理的结果为：

4.决策树模型的建立以及参数的选择

（1）对训练集和测试集进行二八划分

x_train,x_test,y_train,y_test=train_test_split(data_train,data_target,test_size=0.2) # 训练集占百分之八十
print(x_train.shape,x_test.shape)

（2）建立模型进行训练，并查看在训练集和测试集上的准确率：

model=DecisionTreeClassifier()
model.fit(x_train,y_train)
print(model.score(x_test,y_test))
print(model.score(x_train,y_train))

可以看到在训练集上的准确率远远超过在测试集上的准确率，此时出现了过拟合现象，接下来要解决过拟合问题。

（3）通过调整树的深度找到准确率最高的参数，解决过拟合问题

def m_score(depth):
    model=DecisionTreeClassifier(max_depth=depth)
    model.fit(x_train,y_train)
    train_score=model.score(x_train,y_train)
    test_score=model.score(x_test,y_test)
    return  train_score,test_score
depths=range(2,15)
scores=[m_score(depth) for depth in depths]
# scores=np.array(scores)
for m in scores:
    print(m)
train_s=[s[0] for s in scores]
test_s=[s[1] for s in scores]
plt.plot(train_s)
plt.plot(test_s)
plt.show()

树的深度取值设置为从2到15，前面为在训练集上的准确率，后面为在测试集上的准确率，通过这些数据作图，可以找出测试集准确率最高的点

（4）通过设置阈值解决过拟合问题

在下一次分支时如果对于特征的整合程度不超过阈值则不进行分割。

def m_score2(value):
    model=DecisionTreeClassifier(min_impurity_decrease=value)
    model.fit(x_train,y_train)
    train_score=model.score(x_train,y_train)
    test_score=model.score(x_test,y_test)
    return  train_score,test_score
values = np.linspace(0,0.5,50)
scores2=[m_score2(value) for value in values]
train_s2=[s[0] for s in scores2]
test_s2=[s[1] for s in scores2]
best_indes=np.argmax(test_s2) # 取出最大值的索引
best_score=test_s2[best_indes]
best_value=values[best_indes]
print(best_score,best_value)
plt.plot(train_s2,c='red')
plt.plot(test_s2,c='blue')
plt.show()

由于数据集的切分每次都是随机的，所以每次的运行结果都不一样，之后可以采用交叉验证的方式。

（5）完整代码

# 决策树模型的建立以及参数的选择
x_train,x_test,y_train,y_test=train_test_split(data_train,data_target,test_size=0.2) # 训练集占百分之八十
print(x_train.shape,x_test.shape)
model=DecisionTreeClassifier()
model.fit(x_train,y_train)
print(model.score(x_test,y_test))
print(model.score(x_train,y_train))
def m_score(depth):
    model=DecisionTreeClassifier(max_depth=depth)
    model.fit(x_train,y_train)
    train_score=model.score(x_train,y_train)
    test_score=model.score(x_test,y_test)
    return  train_score,test_score
depths=range(2,15)
scores=[m_score(depth) for depth in depths]
# scores=np.array(scores)
for m in scores:
    print(m)
train_s=[s[0] for s in scores]
test_s=[s[1] for s in scores]
plt.plot(train_s)
plt.plot(test_s)
plt.show()
def m_score2(value):
    model=DecisionTreeClassifier(min_impurity_decrease=value)
    model.fit(x_train,y_train)
    train_score=model.score(x_train,y_train)
    test_score=model.score(x_test,y_test)
    return  train_score,test_score
values = np.linspace(0,0.5,50)
scores2=[m_score2(value) for value in values]
train_s2=[s[0] for s in scores2]
test_s2=[s[1] for s in scores2]
best_indes=np.argmax(test_s2) # 取出最大值的索引
best_score=test_s2[best_indes]
best_value=values[best_indes]
print(best_score,best_value)
plt.plot(train_s2,c='red')
plt.plot(test_s2,c='blue')
plt.show()

5.交叉验证及多参数选择

# 交叉验证及多参数选择
# 解决随机划分的差异
from sklearn.model_selection import GridSearchCV
values= np.linspace(0,0.5,50)
depths=range(2,15)
param_grid={'max_depth':depths,'min_impurity_split':values}# 以字典形式存储参数
model=GridSearchCV(DecisionTreeClassifier(),param_grid,cv=5)
# cv=5,将数据划分成5份，每次用其中一份作为test，其他4份作为train，循环进行5次交叉验证
model.fit(data_train,data_target) # 对模型进行训练，只填入数据，会自动划分
print('最佳参数为：',model.best_params_) # 获取最佳参数
print('最佳得分为：',model.best_score_) # 获取test数据集上的最佳得分

6.随机森林算法的原理

随机森林算法应用广泛，性能强悍。

7.随机森林算法的代码实现：

（1）初始化分类器并测试训练准确率

print('————————————————以下为随机森林算法的代码实现——————————————————')
# 继续使用泰坦尼克数据集
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100, n_jobs=4)  # 初始化随机森林分类器
model.fit(x_train, y_train.ravel())  # .ravel:必须为一列的状态
print(model.score(x_test, y_test))  # 测试集上的正确率

（2）随机森林算法可以查看每个特征的比重

print(model.feature_importances_)  # 显示各个特征的重要性，与训练数据的特征对应相关
for futh, imp in zip(['Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'p1', 'p2', 'p3', 'e1', 'e2', 'e3'],
                     model.feature_importances_):
    print(futh, ':', imp)

（3）对一行的数据进行预测

x_test1=np.array(x_test)
print(model.predict(x_test1[0].reshape(1,-1)))  # 对一行的数据进行预测
# print(model.predict(x_test[0].reshape(1,-1)))  # 对一行的数据进行预测

（4）查看一百棵决策树的信息

print(model.estimators_)  # 查看一百棵决策树的信息

（5）进行交叉验证

# 进行交叉验证阶段
from sklearn.model_selection import GridSearchCV

n_estimators = range(80, 130)
param_grid = {'n_estimators': n_estimators}
model = GridSearchCV(RandomForestClassifier(), param_grid=param_grid, cv=5)
model.fit(data_train, data_target.ravel())
print(model.best_params_)  # 最佳参数选择
print(model.best_score_)  # 最高准确率

（6）完整代码

# 随机森林算法的代码实现
'''
sklearns内置的随机森林函数中的超参数
1.n_estimators:进行投票前或采取平均值前建立树的数量
2.max_features：随机森林中单棵树可拥有的特征最大数量
3.min_sample_leaf:决定叶子的数量
4.n_jobs:允许使用处理器的数量，-1没有限制
'''
print('————————————————以下为随机森林算法的代码实现——————————————————')
# 继续使用泰坦尼克数据集
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100, n_jobs=4)  # 初始化随机森林分类器
model.fit(x_train, y_train.ravel())  # .ravel:必须为一列的状态
print(model.score(x_test, y_test))  # 测试集上的正确率
print(model.feature_importances_)  # 显示各个特征的重要性，与训练数据的特征对应相关
for futh, imp in zip(['Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'p1', 'p2', 'p3', 'e1', 'e2', 'e3'],
                     model.feature_importances_):
    print(futh, ':', imp)
x_test1=np.array(x_test)
print(model.predict(x_test1[0].reshape(1,-1)))  # 对一行的数据进行预测
# print(model.predict(x_test[0].reshape(1,-1)))  # 对一行的数据进行预测
print(model.estimators_)  # 查看一百棵决策树的信息
# 进行交叉验证阶段
from sklearn.model_selection import GridSearchCV

n_estimators = range(80, 130)
param_grid = {'n_estimators': n_estimators}
model = GridSearchCV(RandomForestClassifier(), param_grid=param_grid, cv=5)
model.fit(data_train, data_target.ravel())
print(model.best_params_)  # 最佳参数选择
print(model.best_score_)  # 最高准确率

8.支持向量机算法原理：

9.SVM模型解决德国信用卡数据分类问题

# 在sklearn中实现SVM算法
print('———————————————————————以下为SVM模型解决德国信用卡数据分类问题——————————————————————')
# 支持向量机分类
data = pd.read_csv('./数据集/credit-a.csv', header=None)
print(data.head())
x = data[data.columns[:-1]]
y = data[15].replace(-1, 0)
x_train, x_test, y_train, y_test = train_test_split(x, y)
from sklearn import preprocessing

scaler = preprocessing.StandardScaler().fit(x_train)  # 通过x_train构建一个标准化模型，训练一个scaler
x_train = scaler.transform(x_train)  # 统一标准化
x_test = scaler.transform(x_test)  # 统一标准化,
from sklearn.svm import SVC

model = SVC(kernel="poly", degree=3, C=5)
model.fit(x_train, y_train)
print('多项式核函数准确率为：', model.score(x_test, y_test))
model2 = SVC(kernel="rbf", gamma=0.5, C=5)
model2.fit(x_train, y_train)
print('高斯核函数准确率为：', model2.score(x_test, y_test))

10.完整代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt

_author_ = '张起凡'
from sklearn.model_selection import train_test_split
from sklearn.linear_model._logistic import LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.tree import DecisionTreeClassifier

# 二分类
# 逻辑回归，使用sigmoid函数
# 德国信用卡欺诈数据集分类
data = pd.read_csv("./数据集/credit-a.csv", header=None)
# print(data.head())
x = data[data.columns[:-1]]
y = data[15].replace(-1, 0)
print(y)
x_train, x_test, y_train, y_test = train_test_split(x, y)  # 划分训练集和测试集
model = LogisticRegression(max_iter=10000)  # 建立模型
model.fit(x_train, y_train)  # 使用训练集训练模型
y_pre = model.predict(x_test)
print(y_pre)
# 此时可以直接得到分类预测的结果，但如果想得到sigmoid函数的概率值
y_gailv = model.predict_proba(x_test)
print(y_gailv)
# 最后计算准确率,可以逐一利用循环对比统计准确率，也可以使用sklearn中现成函数
accuracy_sum = accuracy_score(y_pre, y_test)
print(accuracy_sum)
# 如果想提高分类的准确率，需要对数据进行预处理

# 决策树算法原理
'''
1.最经典的机器学习模型之一
2.预测结果容易理解，易于解释
3.可处理类别型和连续型数据
'''
'''
先对哪个特征进行分类？
信息的量化，基尼不纯度
哪个特征能带来最多的信息变化幅度，就优先选择哪个
如果特征为连续的，先进行离散化处理
'''
'''
什么时候停止
1.可以到所有特征都划分完毕的时候停止
2.可以设置一个阈值，此时获得的信息增益非常小，达到时停止
'''
'''
决策树解决过拟合方法：
1.前剪枝：设定一个阈值，信息熵减小的数量小于这个值，停止创建分支
2.后剪枝：决策树创建完成后，对节点检查其信息熵的增益
3.控制决策树的最大深度
'''
# 泰坦尼克数据集预处理
data = pd.read_csv('./数据集/train.csv')
print(data.columns)
data = data[['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']]
data['Age'] = data['Age'].fillna(data['Age'].mean())  # 将缺省的年龄值设为平均值
print(data['Age'])
data.fillna(0, inplace=True)  # 空白填充法，填充为0，对缺失值进行处理
data['Sex'] = [1 if x == 'male' else 0 for x in data.Sex]  # 使用列表推导式,男性为1，女性为0
data['p1'] = np.array(data['Pclass'] == 1).astype(np.int32)
data['p2'] = np.array(data['Pclass'] == 2).astype(np.int32)
data['p3'] = np.array(data['Pclass'] == 3).astype(np.int32)
# 在数据集中有1，2,3三个登记，为了防止计算机引入默认的线性关系，所以分离出来，比如3是1的三倍
del data['Pclass']  # 删除原有列
print(data.Embarked.unique())  # 唯一显示登船港口
data['e1'] = np.array(data['Embarked'] == 'S').astype(np.int32)
data['e2'] = np.array(data['Embarked'] == 'C').astype(np.int32)
data['e3'] = np.array(data['Embarked'] == 'Q').astype(np.int32)
del data['Embarked']
data_train = data[['Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'p1', 'p2', 'p3', 'e1', 'e2', 'e3']]
print(data_train)
data_target = data['Survived'].values.reshape(len(data), 1)  # 变为一列
# print(data_target)
print(np.shape(data_train))
print(np.shape(data_target))
# 决策树模型的建立以及参数的选择
x_train, x_test, y_train, y_test = train_test_split(data_train, data_target, test_size=0.2)  # 训练集占百分之八十
print(x_train.shape, x_test.shape)
model = DecisionTreeClassifier()
model.fit(x_train, y_train)
print(model.score(x_test, y_test))
print(model.score(x_train, y_train))


def m_score(depth):
    model = DecisionTreeClassifier(max_depth=depth)
    model.fit(x_train, y_train)
    train_score = model.score(x_train, y_train)
    test_score = model.score(x_test, y_test)
    return train_score, test_score


depths = range(2, 15)
scores = [m_score(depth) for depth in depths]
# scores=np.array(scores)
for m in scores:
    print(m)
train_s = [s[0] for s in scores]
test_s = [s[1] for s in scores]
plt.plot(train_s)
plt.plot(test_s)
plt.show()


def m_score2(value):
    model = DecisionTreeClassifier(min_impurity_decrease=value)
    model.fit(x_train, y_train)
    train_score = model.score(x_train, y_train)
    test_score = model.score(x_test, y_test)
    return train_score, test_score


values = np.linspace(0, 0.5, 50)
scores2 = [m_score2(value) for value in values]
train_s2 = [s[0] for s in scores2]
test_s2 = [s[1] for s in scores2]
best_indes = np.argmax(test_s2)  # 取出最大值的索引
best_score = test_s2[best_indes]
best_value = values[best_indes]
print(best_score, best_value)
plt.plot(train_s2, c='red')
plt.plot(test_s2, c='blue')
plt.show()

# 交叉验证及多参数选择
# 解决随机划分的差异
from sklearn.model_selection import GridSearchCV

values = np.linspace(0, 0.5, 50)
depths = range(2, 15)
param_grid = {'max_depth': depths, 'min_impurity_split': values}  # 以字典形式存储参数
model = GridSearchCV(DecisionTreeClassifier(), param_grid, cv=5)
# cv=5,将数据划分成5份，每次用其中一份作为test，其他4份作为train，循环进行5次交叉验证
model.fit(data_train, data_target)  # 对模型进行训练，只填入数据，会自动划分
print('最佳参数为：', model.best_params_)  # 获取最佳参数
print('最佳得分为：', model.best_score_)  # 获取test数据集上的最佳得分

# 随机森林算法原理
# 随机森林算法的代码实现
'''
sklearns内置的随机森林函数中的超参数
1.n_estimators:进行投票前或采取平均值前建立树的数量
2.max_features：随机森林中单棵树可拥有的特征最大数量
3.min_sample_leaf:决定叶子的数量
4.n_jobs:允许使用处理器的数量，-1没有限制
'''
print('————————————————以下为随机森林算法的代码实现——————————————————')
# 继续使用泰坦尼克数据集
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100, n_jobs=4)  # 初始化随机森林分类器
model.fit(x_train, y_train.ravel())  # .ravel:必须为一列的状态
print(model.score(x_test, y_test))  # 测试集上的正确率
print(model.feature_importances_)  # 显示各个特征的重要性，与训练数据的特征对应相关
for futh, imp in zip(['Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'p1', 'p2', 'p3', 'e1', 'e2', 'e3'],
                     model.feature_importances_):
    print(futh, ':', imp)
x_test1 = np.array(x_test)
print(model.predict(x_test1[0].reshape(1, -1)))  # 对一行的数据进行预测
# print(model.predict(x_test[0].reshape(1,-1)))  # 对一行的数据进行预测
print(model.estimators_)  # 查看一百棵决策树的信息
# 进行交叉验证阶段
from sklearn.model_selection import GridSearchCV

n_estimators = range(80, 130)
param_grid = {'n_estimators': n_estimators}
model = GridSearchCV(RandomForestClassifier(), param_grid=param_grid, cv=5)
model.fit(data_train, data_target.ravel())
print(model.best_params_)  # 最佳参数选择
print(model.best_score_)  # 最高准确率

# 在sklearn中实现SVM算法
print('———————————————————————以下为SVM模型解决德国信用卡数据分类问题——————————————————————')
# 支持向量机分类
data = pd.read_csv('./数据集/credit-a.csv', header=None)
print(data.head())
x = data[data.columns[:-1]]
y = data[15].replace(-1, 0)
x_train, x_test, y_train, y_test = train_test_split(x, y)
from sklearn import preprocessing

scaler = preprocessing.StandardScaler().fit(x_train)  # 通过x_train构建一个标准化模型，训练一个scaler
x_train = scaler.transform(x_train)  # 统一标准化
x_test = scaler.transform(x_test)  # 统一标准化,
from sklearn.svm import SVC

model = SVC(kernel="poly", degree=3, C=5)
model.fit(x_train, y_train)
print('多项式核函数准确率为：', model.score(x_test, y_test))
model2 = SVC(kernel="rbf", gamma=0.5, C=5)
model2.fit(x_train, y_train)
print('高斯核函数准确率为：', model2.score(x_test, y_test))

景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
客服机器人怎么才能精准的回答用户问题？玩人工智能的辣条哥 AI面试机器人客服机器人
环境：客服机器人问题描述：客服机器人怎么才能精准的回答用户问题？解决方案：客服机器人要精准回答用户问题，需综合技术、数据和用户体验等多方面因素。以下是关键策略和步骤：1.精准理解用户意图自然语言处理（NLP）技术分词与实体识别：提取关键词（如“订单号”“退货”）和实体（如时间、地点）。意图分类：通过机器学习模型（如BERT、Transformer）将问题归类（如“售后”“支付”）。上下文理解记录对
python垃圾分类游戏_垃圾分类就要来了？教你使用Python轻松完成垃圾分类 weixin_39627390 python垃圾分类游戏
从7月1日起，上海市正式实施《上海市生活垃圾管理条例》。条例规定，个人混合投放垃圾今后可最高罚200元，单位混装混运，最高可罚至5万元，而且违规还将会列入征信，堪称“史上最严垃圾分类措施”。相信最近一段时间大家已经被上海的小伙伴们因为垃圾分类的困扰而刷屏了，就在大家还在一片“与我无瓜”中暗自庆幸时，现实给了我们一击：该来的总要来，谁都逃不过去。其实，在我国垃圾分类的举措要从2000年开始，但效果并
嵌入式系统的核心组成部分处理器、存储器、传感器和执行器 getapi 单片机嵌入式硬件信号处理
处理器、存储器、传感器和执行器是嵌入式系统的核心组成部分。它们共同协作，完成从数据采集到处理再到执行的完整流程。以下是对这些组件的详细解析：1.处理器（Processor）定义处理器是嵌入式系统的大脑，负责执行指令、处理数据和控制其他组件。主要功能执行程序代码。控制外设（如存储器、传感器、执行器）。处理数据输入和输出。分类微控制器（MCU）集成了处理器核心、存储器和外设的单芯片解决方案。适合低成本
如何避免Bug跟踪系统混乱管理前沿运维人工智能大数据
流程规范化、工具集成化、沟通透明化。其中流程规范化通过明确每个环节的责任分工、标准化Bug报告和处理流程，有效减少混乱和重复劳动，确保Bug跟踪系统高效运转。企业通过数据分析发现，采用标准化流程后Bug处理效率可提升30%以上，这为软件质量控制提供了坚实保障。一、BUG跟踪系统的基本概念与重要性Bug跟踪系统是一种用于记录、管理和解决软件缺陷的工具和流程。它通过集中存储Bug报告、分类处理问题，并
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
Linux find 命令完全指南可问可问春风 Linux从新手到入门 linux chrome 运维
find是Linux系统最强大的文件搜索工具，支持嵌套遍历、条件筛选、执行动作。以下通过场景分类解析核心用法，涵盖高效搜索、文件管理及高级技巧：一、基础搜索模式1.按文件名搜索（精确/模糊匹配）find/path-name"*.log"#精确匹配.log后缀（区分大小写）find/home-iname"*.TXT"#模糊匹配.txt后缀（忽略大小写）find.-name"data_[0-9].cs
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
2025年三个月自学手册网络安全（黑客技术）网安kk web安全安全网络网络安全 python
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
kotlin中的list set map整理 LCY133 kotlin list 开发语言
在Kotlin中，List、Set和Map是三种核心集合类型，它们分别适用于不同的场景，具有独特的特性和操作方式。以下是它们的详细对比与使用指南：1.List（列表）核心特性•有序：元素按插入顺序存储。•可重复：允许存在相同值的元素。•索引访问：通过下标（get(index)或[index]）快速访问元素。分类•不可变列表：List，创建后不可修改。valimmutableList=listOf(
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
第三十一篇数据仓库（DW）与商业智能（BI）架构设计与实践指南随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、DW/BI架构核心理论与选型策略1.1主流架构模式对比（1）Kimball维度建模架构（2）Inmon企业工厂架构（3）混合架构二、架构设计方法论与实施步骤2.1维度建模实战指南（1）模型选择决策树（2）ETL开发规范2.2实时BI技术栈选型三、全链路实施与优化策略3.1五阶段实施框架3.2数据治理体系构建四、行业场景深度实践4.1电商用户行为分析4.2金融风控实时预警五、关键问题解析Q1
【UI设计】一些好用的免费图标素材网站 IT古董前端设计 ui 素材
阿里巴巴矢量图标库https://www.iconfont.cn/国内最大的矢量图标库之一，拥有800万+图标资源。特色功能包括团队协作、多端适配、定制化编辑等，适合企业级项目、电商设计、中文产品开发等场景。IconParkhttps://iconpark.oceanengine.com/home字节跳动旗下的免费矢量图、图标库平台。提供超过2400+基础图标，29种图标分类，支持4种主题和在线换
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
解决stm32引脚如果选择输入模式雁过留声花欲落单片机嵌入式硬件
1.输入模式分类STM32的GPIO输入模式主要分为以下四种：浮空输入（FloatingInput/InputFloating）上拉输入（InputPull-Up）下拉输入（InputPull-Down）模拟输入（AnalogInput）2.各模式详解(1)浮空输入（FloatingInput）电路结构：引脚内部不连接上拉或下拉电阻，完全由外部电路决定电平状态。等效电路：引脚直接连接施密特触发器（
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
CBNet--一种新的目标检测的复合骨干网体系结构 weixin_45963617 深度学习系列
一、Introduction一般来说，在一个典型的基于CNN的目标检测器中，使用主干网络来提取检测对象的基本特征，该网络通常是为图像分类任务而设计的，并在ImageNet上预训练。毫无疑问，更强大的主干网可以带来更好的检测性能。尽管最先进的基于深度的大骨干网络的探测器取得了很好的结果，但仍有很大改进空间。此外，通过设计一个新的更强大的主干网络并在ImageNet上预训练来获取好的检测性能是十分昂贵
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
一文读懂什么是服务器小熊猫Q 服务器科普服务器运维
服务器基础介绍介绍服务器相关基础知识，如服务器分类、组成、机箱内部构造等，个人公众号：SRE杂谈，欢迎关注1、什么是服务器？服务器品牌有惠普、戴尔、浪潮、华为、华三、曙光等，各厂商服务器型号存在差异，惠普DL380G10、戴尔PowerEdgeR750、浪潮NF5280M5、华为2288HV5、曙光R6230HA一般用SN序列号和资产编号来对服务器进行标识，其中SN为唯一标识2、服务器演进2.1、
CSP-J备考冲刺必刷题（C++） | AcWing 1253 家谱热爱编程的通信人 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】Acwing：1253.家谱-AcWing题库
“三分钟”带你看懂批次管理!（一） wms系统
一、批次管理的定义与重要性1.批次管理的定义：批次管理是一种针对产品或物料的管理方法，它将同一生产周期或相同条件下生产、具有一致质量特征、生产信息和使用属性的产品组作为一个批次，进行分类、标识、追踪和管理。2.批次管理的重要性：提高可追溯性：精准追踪物料和产品的来源、去向及生命周期，在质量问题或召回需求出现时，能快速锁定问题批次，降低损失。增强质量控制：监控不同批次产品的质量指标，及时发现和分析质
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导阿正的梦工坊 Machine Learning Deep Learning 分类人工智能深度学习机器学习
下面是MSE不适合分类任务的解释，包含梯度推导。以及交叉熵的梯度推导。前文请移步笔者的另一篇博客：大模型训练为什么选择交叉熵损失（Cross-EntropyLoss）：均方误差（MSE）和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE（均方误差）的梯度特性，结合公式推导和分析，解释为什么在预测值接近0或1时梯度趋于0，以及这背后的含义。我会尽量保持清晰且严谨，适合高理论水平的
【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估贫苦游商学习服务器网络计算机体系结构 ISA 指令集量化评估
【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估概论计算机体系结构简介计算机的分类并行体系结构指令集体系结构（ISA）分类存储器寻址寻址模式操作数大小指令ISA的编码程序的优化计算机体系结构量化评估存储器体系结构概论计算机体系结构与计算机组成原理之间的联系非常紧密，其研究范畴基本一致，计算机体系结构与计算机组成原理两者是相辅相成的。但是，计算机体系结构
【从零开始学习JAVA】异常体系介绍 Cools0613 从0开始学Java 学习
前言：本文我们将为大家介绍一下异常的整个体系，而我们学习异常，不是为了敲代码的时候不出异常，而是为了能够熟练的处理异常，如何解决代码中的异常。异常的两大分类：我们就以这张图作为线索来详细介绍一下Java中的异常：1.Exceptions（异常）在Java中，Exception（异常）是一种表示非致命错误或异常情况的类或接口。Exception通常是由应用程序引发的，可以被程序员捕获、处理或抛出。E
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

机器学习之分类算法

你可能感兴趣的:(机器学习,分类,决策树,随机森林,支持向量机)