weixin_45562632

机器学习——python机器学习第2版笔记

python机器学习第二版笔记

1 赋予计算机从数据中学习的能力
- 1.1 构建把数据转换成知识的智能
- 1.2 三种不同类型的机器学习
- 1.3 基本术语与符号
- 1.4 构建机器学习系统的路线图
- 1.5 用python进行机学习
2 训练简单的机器学习分类算法
- 2.1 人工神经元——机器学习早期历史一瞥
- 2.2 在python中实现感知器学习
- 2.3 自适应神经元和学习收敛
3 scikit-learn机器学习分类器一览
- 3.1 选择分类算法
- 3.2 了解scikit-learn软件库的第一步——训练感知器
- 3.3 基于逻辑回归的分类概率建模
- 3.4 支持向量机的最大余量分类
- 3.5 用核支持向量机求解非线性问题
- 3.6 决策树学习
- 3.4 K-近邻——一种懒惰的学习算法
- 3.8 小结
4 构建良好的训练集——预处理
- 4.1 处理缺失数据
- 4.2 处理分类数据
- 4.3 分裂数据集为独立的训练集和测试集
- 4.4 把特征保持在同一尺度上
- 4.5 选择有意义的特征
- 4.6 用随机森林评估特征的重要性
5. 通过降维压缩数据
- 5.1 用主成分分析实现无监督降维
- 5.2 基于线性判别分析的有监督数据压缩
- 5.3 非线性映射的核主成分分析
6. 模型评估和超参数调优的最佳实践
- 6.1 用管道方法简化工作流
- 6.2 使用k折交叉验证评估模型的性能
- 6.3 用学习和验证曲线调试算法
- 6.4 通过网格搜索为机器学习模型调优
- 6.5 比较不同的性能评估指标
- 6.6 处理类的不平衡问题
7.综合不同模型的组合学习
- 7.1 集成学习
- 7.2 采用多数票机制的集成分类器
- 7.3 套袋——基于导引样本构建分类器集成
- 7.4 通过自适应增强来利用弱学习者
8.应用机器学习于情感分析
- 8.1 为文本处理预备好IMDb电影评论数据
- 8.2 词袋模型介绍
- 8.3 训练文档分类的逻辑回归模型
- 8.4 处理更大的数据集——在线算法和核心学习
- 8.5 具有潜在狄氏分配的主题建模
9.将机器学习模型嵌入网络应用
- 9.1序列化拟合scikit-learn评估器
- 9.2搭建SQLite数据库存储数据
- 9.3用Flask开发网络应用
- 9.4将电影评论分类器转换为网络应用
- 9.5在面向公众的服务器上部署网络应用
10.用回归分析预测连续目标变量
- 10.1 线性回归简介
- 10.2 探索住房数据集
- 10.3普通最小二乘线性回归模型的实现
- 10.4利用RANSAC拟合稳健的回归模型
- 10.5评估线性回归模型的性能
- 10.6用正则化方法进行回归
- 10.7将线性回归模型转换为曲线——多项式回归
- 10.8用随机森林处理非线性关系
- 10.9小结
11.用聚类分析处理无标签数据
- 11.1 用k-均值进行相似性分组
- 11.2 把集群组织成有层次的树
- 11.3 通过DBSCAN定位高密度区域
12从零开始实现多层人工神经
13用TensorFlow并行训练神经网络
14深入探讨TensorFlow的工作原理
15深度卷积神经网络图像识别
14用递归神经网络为序列数据建模

本文简要介绍了python机器学习第二版前11章的笔记，因为12-16章，主要介绍的是TensorFlow，（我们不使用者这个包）以及深度学习的内容。下一站开始深度学习。

1 赋予计算机从数据中学习的能力

1.1 构建把数据转换成知识的智能

1.2 三种不同类型的机器学习

本节将讨论有监督、无监督和强化三种不同类型的机器学习，分析它们之间的根本差别，并用概念性的例子开发一个可以解决实际问题的应用：

用有监督学习预测未来
用强化学习解决交互问题
用无监督学习发现隐藏结构

1.3 基本术语与符号

1.4 构建机器学习系统的路线图

1.5 用python进行机学习

安装包：NumPy 、SciPy 、scikit-learn 、Matplotlib 、pandas
安装anaconda

2 训练简单的机器学习分类算法

2.1 人工神经元——机器学习早期历史一瞥

人工神经元的正式定义
感知器学习规则
感知器的一般概念图：

2.2 在python中实现感知器学习

面向对象的感知器API
在鸢尾花数据集上训练感知器模型

2.3 自适应神经元和学习收敛

1.梯度下降为最小代价函数
2.用Python实现Adaline

3.通过调整特征大小改善梯度下降
标准化：
$x_j=(x_j-u_j)/deta_j$
4.大规模机器学习与随机梯度下降

3 scikit-learn机器学习分类器一览

本章主要介绍：
·介绍强大且常用的分类算法，如逻辑回归、支持向量机和决策树。
·scikit-learn机器学习库通过对用户友好的Python API提供各种机器学习
算法，本章将介绍实例并对其进行解释。
·讨论线性和非线性决策边界分类器的优劣。

3.1 选择分类算法

3.2 了解scikit-learn软件库的第一步——训练感知器

3.3 基于逻辑回归的分类概率建模

1.逻辑回归的直觉与条件概率
2.学习逻辑代价函数的权重
3.把转换的Adaline用于逻辑回归算法
4.用scikit-learn训练逻辑回归模型
5.通过正则化解决过拟合问题
L2正则化（有时也称为L2收缩或权重衰减）

3.4 支持向量机的最大余量分类

1.最大边际的直觉
2.用松弛变量处理非线性可分
3.其他的scikit-learn实现

3.5 用核支持向量机求解非线性问题

核方法的逻辑是针对线性不可分数据，建立非线性组合，通过映射函数把原始特征投影到一个高维空间，特征在该空间变得线性可分。
1.处理线性不可分数据的核方法
2.利用核技巧，发现高维空间的分离超平面

3.6 决策树学习

1.最大限度地获取信息——获得最大收益
2.构建决策树
3.通过随机森林组合多个决策树

3.4 K-近邻——一种懒惰的学习算法

3.8 小结

本章学习了许多不同的解决线性和非线性问题的机器学习算法。如果关心可解释性，决策树特别有吸引力。逻辑回归不仅是一种有用的在线随机梯度下降模型，而且还可以预测特定事件的概率。虽然支持向量机有强大的线性模型，也可以通过核技巧扩展到非线性问题，但必须调整许多参数才能做好预测。相比之下，像随机森林这样的组合方法不需要调整太多参数，而且不易过拟合，像决策树一样容易，这使得其成为许多实际问题领域具有吸引
力的模型。KNN分类器通过懒惰学习提供了另一种分类方法，允许在没有任何模型训练的情况下进行预测，但预测所涉及的计算成本昂贵。

4 构建良好的训练集——预处理

本章将讨论必要的数据预处理技术，以帮助建立良好的机器学习模型。本章将主要涵盖下述几个方面：
·去除和填补数据集的缺失数值
·将分类数据转换为适合机器学习算法的格式
·为构造模型选择相关的特征

4.1 处理缺失数据

1.识别数据中的缺失数值
2.删除缺失的数据
3.填补缺失的数据
4.了解scikit-learn评估器API

4.2 处理分类数据

1.名词特征和序数特征
2.映射序数特征
3.分类标签编码
4.为名词特征做热编码

4.3 分裂数据集为独立的训练集和测试集

4.4 把特征保持在同一尺度上

归一化和标准化两种常见方法可以将不同的特征统一到同一比例。这些术语不严格而且经常在不同领域使用，具体含义要根据场景来判断。归一化通常指的是把特征的比例调整到[0，1]区间，这是最小最大比例调整的一种特殊情况。
使用标准化，可以把特征列的中心设在均值为0且标准偏差为1的位置，这样特征列呈正态分布，可以使学习权重更容易。

4.5 选择有意义的特征

过拟合的原因是，与给定的训练数据相比，我们的模型太过复杂。减少泛化误差的常见解决方案如下：
·收集更多的训练数据
·通过正则化引入对复杂性的惩罚
·选择参数较少的简单模型
·减少数据的维数
1.L1和L2正则化
2.为序数特征选择算法
另外一种降低模型复杂度以及避免过拟合的方法是通过特征选择降维，这对未正则化的模型特别有用。主要有两类降维技术：特征选择和特征提取。
经典的序数特征选择算法是逆顺序选择（SBS），其目的是应对分类器性能最小的衰减来降低初始特征子空间的维数，从而提高计算效率。

4.6 用随机森林评估特征的重要性

前面的章节学习了如何通过逻辑回归用L1正则化来消除不相关的特征，用SBS算法进行特征选择，并将其应用到KNN算法。另一个用来从数据集中选择相关特征的有用方法是随机森林。

5. 通过降维压缩数据

本章学习了用于特征提取降维的三种不同的基本技术：标准PCA、LDA和核PCA。PCA将数据投影到低维子空间，忽略分类标签，沿着正交特征轴最大化方差。与PCA相反，LDA是一种有监督的降维技术，这意味着它考虑了训练集中的分类信息，试图在线性特征空间中最大化类的可分性。
最后，了解了非线性特征提取器核PCA。用核技巧和临时投射到更高维度特征空间的方法，最终能够把非线性特征组成的数据集压缩到低维子空间，这些类在这里线性可分。

5.1 用主成分分析实现无监督降维

特征选择和特征提取的区别在于，特征选择算法（如序数逆选择）保持原始特征，特征提取将数据转换或投影到新的特征空间。在降维的背景下，可以把特征提取理解为数据压缩方法，其目的是维护大部分的相关信息。PCA是一种无监督学习方法
1.主成分分析的主要步骤
2.逐步提取主成分
1）标准化数据集。
2）构建协方差矩阵。
3）获取协方差矩阵特征值和特征向量。
4）以降序对特征值排序，从而对特征向量排序。
3.总方差和解释方差
4.特征变换
5.scikit-learn的主成分分析

5.2 基于线性判别分析的有监督数据压缩

PCA试图找到数据集中最大方差的正交成分轴，而LDA的目标是寻找和优化具有可分性的特征子空间。
1.主成分分析与线性判别分析
2.线性判别分析的内部逻辑
3.计算散布矩阵
4.在新的特征子空间选择线性判别式
5.将样本投影到新的特征空间
6.用scikit-learn实现的LDA

5.3 非线性映射的核主成分分析

1.核函数和核技巧
2.用Python实现核主成分分析
3.投影新的数据点
4.scikit-learn的核主成分分析

6. 模型评估和超参数调优的最佳实践

6.1 用管道方法简化工作流

这一部分将介绍一个非常方便的工具，scikit-learn的Pipeline类。可以拟合任意多个转换步骤的模型，并以此对新数据进行预测。

6.2 使用k折交叉验证评估模型的性能

抵抗交叉验证和k折交叉验证，它有助于获得
对模型泛化性能的可靠评估，即模型对未见过的数据的表现。
抵抗验证方法把初始数据集分裂成独立的训练集和测试集，前者用于训练模型，后者用来评估模型的泛化性能。抵抗方法的缺点是性能评估可能会对如何把训练集分裂成训练子集和验证子集非常敏感，评估结果会随不同数据样本而变化。
k折交叉验证将训练集随机分裂成k个无更换子集，其中k–1个子集用于模型训练，一个子集用于性能评估。重复该过程k次，得到k个模型和k次性能估计。

6.3 用学习和验证曲线调试算法

1.用学习曲线诊断偏差和方差问题
2.用验证曲线解决过拟合和欠拟合问题
验证曲线是通过解决过拟合和欠拟合问题来提高模型性能的有力工具。虽然验证曲线与学习曲线相关，但是我们并不根据训练和测试准确度与样本规模之间的函数关系来绘图，而是通过调整模型参数来调优，例如逻辑回归中的逆正则化参数C。

6.4 通过网格搜索为机器学习模型调优

1.通过网格搜索为超参数调优
网格搜索方法的逻辑非常简单，属于暴力穷尽搜索类型，预先定义好不同的超参数值，然后让计算机针对每种组合分别评估模型的性能，从而获得最佳组合参数值。
2.以嵌套式交叉验证来选择算法

6.5 比较不同的性能评估指标

前面的章节用模型准确度来评估模型，这是有效且可量化的模型性能指标。然而，还有几个其他的性能指标也可以度量模型的相关性，如精度、召回率和F1分数。
1.含混矩阵
真阳性（TP）、真阴性（TN）、假阳性（FP）和假阴性（FN）计数值所构成的方阵

2.优化分类模型的准确度和召回率
3.绘制受试者操作特性图
4.多元分类评分指标

6.6 处理类的不平衡问题

类的不平衡是个常见问题，即当数据集的一个或多个类的样本被过度代表。
处理类不平衡问题的其他常用策略包括对少数类上采样，对多数类下采样以及生成人造训练样本。
另一种处理类不平衡问题的技术是人工生成训练样本。
使用最广泛的人工生成训练样本的算法可能是人工生成少数类的过采样技术（SMOTE）

7.综合不同模型的组合学习

7.1 集成学习

集成方法的目标是组合不同的分类器，形成比单个分类器具有更好泛化性能的元分类器。

7.2 采用多数票机制的集成分类器

1.实现基于多数票的简单分类器
2.用多数票原则进行预测
3.评估和优化集成分类器

7.3 套袋——基于导引样本构建分类器集成

实践中更复杂的分类任务和高维度数据集容易导致单个决策树模型过拟合，这正是套袋算法能真正发挥作用的地方。
最后注意到套袋算法可以有效地减少模型方差。然而，套袋在减少模型偏差方面却无效，也就是说，模型过于简单以至于无法很好地捕捉数据中的趋势。
这就是为什么我们想要在低偏差集成分类器上实现套袋，例如修剪决策树。

7.4 通过自适应增强来利用弱学习者

原始的增强过程被总结为以下四个关键步骤：
1.用从训练集D无替换抽取的训练样本随机子集d 1 来训练弱学习者C 1
2.从训练集无替换抽取第二个随机训练子集d 2 并把之前的分类错误样本中的50%加入该子集来训练弱学习者C 2
3.从训练集D找出那些与C 1 和C 2 不一致的样本形成训练样本d 3 来训练第3个弱学习者C 3
4.通过多数票机制集成弱学习者C 1 ，C 2 和C 3

8.应用机器学习于情感分析

本章将主要涵盖下述几个方面：
·清洗和准备文本数据
·根据文本数据建立特征向量
·训练机器学习模型来区分正面或者负面评论
·用基于外存的学习方法来处理大型文本数据集
·根据文档推断主题进行分类

8.1 为文本处理预备好IMDb电影评论数据

1.获取电影评论数据集
2.把电影评论数据预处理成更方便格式的数据

8.2 词袋模型介绍

1.把词转换成特征向量
2.通过词频逆反文档频率评估单词相关性
tf-idf
3.清洗文本数据
4.把文档处理为令牌

8.3 训练文档分类的逻辑回归模型

8.4 处理更大的数据集——在线算法和核心学习

8.5 具有潜在狄氏分配的主题建模

本节将介绍一种常用的被称为潜在狄氏分配（LDA）的主题建模技术。然而，请注意，虽然潜在狄氏分配通常缩写为LDA，但不要与线性判别分析混淆，那是一种有监督的降维技术，第5章曾经介绍过。
1.使用LDA分解文本文档
LDA是一种生成概率模型，试图找出经常出现在不同文档中的单词。假设每个文档都是由不同单词组成的混合体，那么经常出现的单词就代表着主
题。
2.LDA与scikit-learn

9.将机器学习模型嵌入网络应用

9.1序列化拟合scikit-learn评估器

9.2搭建SQLite数据库存储数据

9.3用Flask开发网络应用

9.4将电影评论分类器转换为网络应用

9.5在面向公众的服务器上部署网络应用

10.用回归分析预测连续目标变量

10.1 线性回归简介

1.简单线性回归
2.多元线性回归

10.2 探索住房数据集

1.加载住房数据集
2.可视化数据集的重要特点
探索性数据分析（EDA）是在进行机器学习模型训练之前值得推荐的重要一步。
散点图矩阵
3.用关联矩阵查看关系
关联矩阵是包含皮尔森积矩相关系数（通常简称为皮尔森的r）的正方形矩阵，用来度量特征对之间的线性依赖关系。

10.3普通最小二乘线性回归模型的实现

10.4利用RANSAC拟合稳健的回归模型

除了淘汰离群值之外，还有一种更为稳健的回归方法，即采用随机抽样一致性（RANSAC）的算法，根据数据子集（所谓的内点）拟合回归模型。

10.5评估线性回归模型的性能

残差图是判断回归模型常用的图形工具。这有助于检测非线性和异常值，并检查这些错误是否呈随机分布。
另一个有用的模型性能定量度量是所谓的均方误差（MSE），它仅仅是为了拟合线性回归模型，而将SSE成本均值最小化的结果。
有时候报告决定系数（R 2 ）可能更有用，可以把这理解为MSE的标准版，目的是为更好地解释模型的性能。

10.6用正则化方法进行回归

正则线性回归最常用的方法包括所谓的岭回归、最小绝对收缩与选择算子（LASSO）以及弹性网
络。岭回归是一个L2惩罚模型。

10.7将线性回归模型转换为曲线——多项式回归

10.8用随机森林处理非线性关系

1.决策树回归
2.随机森林回归

10.9小结

本章开篇学习了如何构建简单的线性回归模型，以分析单个解释变量和连续响应变量之间的关系。然后讨论了一种有用的解释数据分析技术，以查
看数据中的模式和异常，这是在预测建模任务中迈出的重要的第一步。
我们采用基于梯度的优化方法实现线性回归建立了第一个模型。然后看到了如何把scikit-learn线性模型用于回归，实现用于处理离群情况的稳健回
归方法（RANSAC）。为了评估回归模型的预测性能，我们计算了平均误差平方和以及相关的R 2 度量。此外，还讨论了判断回归模型问题的图解方法：残差图。
之后我们讨论了如何把正则化方法应用于回归模型以降低模型复杂度，同时避免过拟合。然后介绍了为非线性关系建模的几种方法，包括多项式特征变换和随机森林回归。

11.用聚类分析处理无标签数据

11.1 用k-均值进行相似性分组

1.scikit-learn的k-均值聚类
2.k-均值++——更聪明地设置初始聚类中心的方
法
3.硬聚类与软聚类
硬聚类描述了一类算法，把数据集中的每个样本分配到一个集群，例如在前面小节中讨论过的k-均值算法。与此相反，软聚类算法（有时也称为模糊聚类）将一个样本分配给一个或多个集群。
4.用肘法求解最佳聚类数
肘法的逻辑是识别当失真增速最快时的k值，如果为不同k值绘制失真图，情况就会变得更清楚。
5.通过轮廓图量化聚类质量

11.2 把集群组织成有层次的树

1.以自下而上的方式聚类
2.在距离矩阵上进行层次聚类
3.热度图附加树状图
4.scikit-learn凝聚聚类方法

11.3 通过DBSCAN定位高密度区域

基于密度的有噪声的空间聚类应（DBSCAN），不像k-均值方法那样假设集群呈球形，或是把数据集分成不同的需要人工设定分界点的层级。顾名思义，基于密度的聚类把标签分配给样本点密集的区域。DBSCAN的密度定义为在指定半径ε范围内的点数。

12从零开始实现多层人工神经

13用TensorFlow并行训练神经网络

14深入探讨TensorFlow的工作原理

15深度卷积神经网络图像识别

14用递归神经网络为序列数据建模

Python Pandas 数据 GroupBy 分组操作详解：分组、聚合与遍历敲代码不忘补水一起学 Python pandas python numpy matplotlib 开发语言数据分析大数据
PythonPandas数据GroupBy分组操作详解：分组、聚合与遍历本文详细介绍了Pandas中数据分组（GroupBy）的常用操作，包括按单列和多列分组、分组后的数据访问与聚合计算。通过实例讲解了如何使用groupby()方法对数据进行分组，并展示了如何使用first()、last()等方法获取分组后的特定数据。此外，还介绍了如何使用agg()方法进行多种聚合计算，如求和、均值和标准差，及如
第20篇：Python 开发进阶：使用Django进行Web开发详解猿享天开 python从入门到精通 python django 开发语言
第20篇：使用Django进行Web开发内容简介在上一篇文章中，我们深入探讨了Flask框架的高级功能，并通过构建一个博客系统展示了其实际应用。本篇文章将转向Django，另一个功能强大且广泛使用的PythonWeb框架。我们将介绍Django的核心概念，包括项目与应用结构、模型与数据库迁移、管理后台、模板与静态文件管理，以及如何将Django应用部署到生产环境。通过详细的代码示例和实战项目，您将
【python】list（列表）的遍历 ClearStari99 Python python 开发语言
目录数据容器入门数据容器：list（列表）list（列表）的遍历数据容器：tuple（元组）数据容器：str（字符串）数据容器的切片数据容器：set（集合）数据容器：dict（字典、映射）数据容器的通用操作综合案例学习目标掌握使用while循环，遍历列表的元素掌握使用for循环，遍历列表的元素列表的遍历-while循环既然数据容器可以存储多个元素，那么，就会有需求从容器内依次取出元素进行操作。将容
Protocol buffers--python简介以及安装与使用冰雪满天 Python Protocol
简介：以下引用自官方首页文档：ProtocolbuffersareGoogle'slanguage-neutral,platform-neutral,extensiblemechanismforserializingstructureddata–thinkXML,butsmaller,faster,andsimpler.Youdefinehowyouwantyourdatatobestructur
Python Connect OracleDB ddttoop Python3 WorkTools
Python连接Oracle数据库原文链接：https://blog.csdn.net/xinyuzxx/article/details/81703625cx_Oraclecx_Oracle模块是Python连接Oracle数据库的模块，在Python中，如果要连接Oracle，必须先安装cx_Oracle模块。cx_Oracle的下载地址：https://pypi.python.org/pypi
python打包opencv为exe可执行程序 AIOT魔法师 YOLOv5和YOLOv11 opencv python 计算机视觉
网上很多教程但是呢，每次运行起来打包出来的exe，都会报错，多数是提示找不到cv2的库，或者说让安装opencv，例如下面这种：解决方案如下：1、使用opencv-python的版本为：pipinstall-ihttps://pypi.douban.com/simple/opencv-python==4.3.0</
Python 18.3 async/await weixin_34221332 python
async/await用asyncio提供的@asyncio.coroutine可以把一个generator标记为coroutine类型，然后在coroutine内部用yieldfrom调用另一个coroutine实现异步操作。为了简化并更好地标识异步IO，从Python3.5开始引入了新的语法async和await，可以让coroutine的代码更简洁易读。请注意，async和await是针对c
AGI的决策系统：从短期反应到长期规划 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：AGI的决策系统：从短期反应到长期规划关键词：AGI，决策系统，短期反应，长期规划，算法模型，系统集成摘要：本文旨在深入探讨人工智能（AGI）决策系统的设计和实现，重点从短期反应到长期规划的转变。首先，我们将回顾AGI的发展历程和决策系统的基本概念，接着详细解析短期反应系统和长期规划系统的原理与实现。随后，本文将探讨如何将两种系统有效集成，并讨论数据收集与处理、机器学习模型在决策中的应用
详解Python Google Protocol Buffer 职场亮哥
本篇主要介绍如何在Python语言中使用GoogleProtocolBuffer（后续都简写为PB），包括以下几个部分：为什么要使用PB？安装GooglePB自定义.proto文件编译.proto文件解析目标py文件序列化和反序列化更复杂的Message动态编译为什么要使用PB？PB（ProtocolBuffer）是Google开发的用于结构化数据交换格式，作为腾讯云日志服务标准写入格式。因此用于
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
【AI技术】Edge-TTS 国内使用方法一者仁心 AI AI编程 TTS
介绍：TTS软件效果里，微软推出的免费使用的Edge-TTS平台是效果比较好的，但是目前该平台开始对国内阻止使用了。这里给大家和我一样使用该python库的小伙伴一个临时的解决方法。提示：建议大家还是要么迁移到国内的收费平台或者是一些免费的开源框架（paddlespeech、gpt-sovits）解决方案：这个TTS服务在Edge浏览器中其实也有嵌入，并且国内一样可以使用，经过和官方的访问地址对比
2023第十四届蓝桥杯Python大学生A组真题？（真题+附链接）大C爱编程蓝桥杯职场和发展
第十四届蓝桥杯大赛软件赛省赛Python大学A组试题A:特殊日期本题总分：5分【问题描述】记一个日期为yy年mm月dd日，统计从2000年1月1日到2000000年1月1日，有多少个日期满足年份yy是月份mm的倍数，同时也是dd的倍数。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。试题B:分糖果本题总分：5
Llama3本地部署的解决方案 herosunly llama3 llama 本地部署 API 解决方案
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Llama3本地部署的解决方案，希望对学习大语言模型的同学们有所帮助。文
PyOxidizer：现代Python应用打包与分发工具胡霆圣
PyOxidizer：现代Python应用打包与分发工具PyOxidizerAmodernPythonapplicationpackaginganddistributiontool项目地址:https://gitcode.com/gh_mirrors/py/PyOxidizerPyOxidizer是一个用于生成内嵌Python解释器的二进制文件的实用工具，主要使用Rust编程语言开发，同时也包含一
探索Llama Recipes：Meta Llama模型的实用示例库郁英忆
探索LlamaRecipes：MetaLlama模型的实用示例库去发现同类优质开源项目:https://gitcode.com/在机器学习和自然语言处理的世界中，MetaLlama模型是一颗璀璨的新星，以其强大的对话理解和生成能力而受到广泛关注。现在，有了llama-recipes这个开源项目，开发者可以轻松上手并充分利用这些模型。本文将引导您了解这个项目，它的技术优势，适用场景以及鲜明特点。项目
ML.NET速览 aixing8475 人工智能操作系统 runtime
什么是ML.NET？ML.NET是由微软创建，为.NET开发者准备的开源机器学习框架。它是跨平台的，可以在macOS，Linux及Windows上运行。机器学习管道ML.NET通过管道(pipeline)方式组合机器学习过程。整个管道分为以下四个部分：LoadData加载数据TransformData转换数据ChooseAlgorithm选择算法TrainModel训练模型示例建立一个控制台项目。
将Python程序打包为Windows可执行文件格式 CherylNatsu Python 技术文档 python windows extension microsoft parsing exe
花一天时间随便找了几篇文章入门Python，并且写了几个Python小程序想和朋友分享一下顺便推荐这个很棒的编程语言，但是遗憾的是朋友的电脑没有安装Python，而且还是用Windows系统，所以最好的办法是把Python程序转换为Windows上的可执行文件。首先要下载“适当版本“的Python：http://www.python.org/getit/还需要一个叫py2exe的程序：http:/
Streamlit，一个超强的 Python 应用开发库！一行玩python python 开发语言
大家好，我是“一行”。今天，我们要来聊一个非常酷的Python库——Streamlit。如果你有过构建Web应用的经验，或者你对快速搭建交互式应用感兴趣，那么Streamlit会是一个非常棒的工具。它可以让你用极少的代码，快速创建出功能强大且美观的Web应用。无论你是数据分析师、机器学习工程师，还是Python初学者，Streamlit都能帮你轻松实现数据可视化、模型展示等功能。今天我们就从基础开
python 开发app 三希 python 开发语言
在Python中开发应用程序（通常指的是移动应用）有多种方法。以下是两种常见的技术栈：KivyKivy是一个开源Python库，用于快速开发跨平台的触控应用。它支持Android、iOS、Windows、MacOS和Linux。以下是使用Kivy开发的基本步骤：1.安装Kivy:在命令行中使用pip安装Kivy：pipinstallkivy2.创建你的应用:创建一个简单的Python文件，比如ma
在Python中实现一个简单的社交媒体应用清水白石008 Python题库 python python 媒体开发语言
在Python中实现一个简单的社交媒体应用社交媒体应用是现代互联网的重要组成部分，允许用户分享信息、交流和互动。在这篇博文中，我们将使用Python构建一个简单的社交媒体应用，涵盖用户注册、发布动态、评论和查看动态等基本功能。我们将使用Flask框架作为后端，SQLite作为数据库，前端使用HTML和Bootstrap进行简单的界面设计。一、项目准备1.环境设置首先，确保你已经安装了Python和
Python的那些事第二篇：编程界的“交通规则”基本语法与编程的“食材”和“容器”数据类型与变量暮雨哀尘 Python的那些事 python vscode visual studio pycharm 开发语言 windows
摘要Python以其简洁易懂的语法和强大的功能，成为了编程界的“小白福音”。本文将带你从Python的基本语法入手，深入探讨标识符命名规则、缩进的重要性、注释的使用，以及数据类型与变量的定义和操作。通过幽默的语言和丰富的实例代码，我们将一步步揭开Python的神秘面纱，让你在轻松愉快的氛围中掌握这门强大的编程语言。1.Python基本语法1.1标识符命名规则在Python的世界里，标识符就像是给变
【使用PyQt创建美观和功能丰富界面】 Dreams°123 pyqt microsoft python
使用PyQt创建美观和功能丰富界面-适用于APP一、基本概念与环境搭建二、布局管理三、部件使用与定制四、信号与槽机制深入应用五、样式表（stylesheet）和主题应用一、基本概念与环境搭建安装PyQt使用以下命令安装PyQt：pipinstallPyQt5（如果使用Python3）。理解信号与槽机制信号（Signal）：是对象发出的事件通知，例如按钮的点击、文本框内容的改变等。槽（Slot）：是
python+selenium获取cookie session_Python3+Selenium获取session和token供Requests使用教程 weixin_39997695 session
#!/usr/bin/python3#coding:utf-8importtimefromseleniumimportwebdriverfromselenium.webdriver.support.waitimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdri
python聊天软件_python开发简单的聊天工具 weixin_39644139 python聊天软件
python太强大了，以至于它什么都可以做，哈哈，开个玩笑。但是今天要讲的真的是一个非常神奇的应用。使用python写一个聊天工具其实大家平时用的QQ类似的聊天工具，也是使用socket进行聊天，只是它还包含了更加复杂的功能。基本原理是一样的。python实现聊天功能，主要用到了socket模块。下面直接上实例吧server端importsockets=socket.socket()#建立sock
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨) 汀、人工智能 LLM工业级落地实践人工智能 AI Agent RAG 知识问答智能问答
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(AdvancedRAG✨)1.RAG简介词汇解释说明embedding嵌入（embedding）是指将高维数据映射为低维表示的过程。在机器学习和自然语言处理中，嵌入通常用于将离散的符号或对象表示为连续的向量空间中的点。在自然语言处理中，词嵌入（wordembedding）是一种常见的技术，它将单词映射到实数向量，以便
Centos安装python3详细教程 Circle square 自学 python centos linux
文章目录Centos安装python3详细教程1、先查看系统python的位置在哪儿2、下载python3的包之前，要先安装相关的依赖包，用于下载编译python3：3、默认的centos7是没有安装pip，先添加epel扩展源4、安装pip5、用pip装wget6、用wget下载python3的源码包，或者自己先下载好，上传到服务器再安装，如果网络快可以直接安装7、编译python3源码包，解压
nvdia triton server运行pt文件滑稽的柴犬神经网络机器学习 python
tritonserver默认都是tensorrt推理。但也会出现有操作不支持，导致无法转模型为engine的情况。可以选择直接运行pytorch的pt文件，以下为操作步骤。1.pytorch后端环境编译步骤原理是使用pytorchC++API运行pt文件模型。安装依赖项apt-getinstallpatchelfrapidjson-devpython3-dev构建NGC的PyTorch容器。例如，
【小黑送书—第十八期】＞＞让工作自动化起来！无所不能的Python(文末送书） 2401_84302628 程序员自动化 python 运维
随着我国企业数字化和信息化的深入，企业对办公自动化的效率和灵活性要求越来越高。Python作为一种开源的软件应用开发方式，通过提供强大丰富的库文件包，极大地简化了应用开发过程，降低了技术门槛。Python开发有哪些优势、挑战以及实践方法呢？一、Python是办公自动化的重要工具在我们的日常工作中，有不少工作是重复的，例如不少办公文档的处理工作等，这些重复工作如果用Python来实现办公自动化，效率
2024年网络安全最全让工作自动化起来！无所不能的Python(1) 2401_84281638 程序员自动化 python 运维
1.3.2多攒代码71.3.3学会并且精通代码调试81.3.4伤其五指不如断其一指8第2章Python的工作环境102.1Python工作环境的构成102.1.1Python的核心软件102.1.2Anaconda112.1.3IDE工具122.2安装过程中的常见问题122.3Python中的两种解释器132.4包的安装202.4.1在线安装202.4.2离线安装212.5Pycharm中的解释器
【Python进阶】5步掌握Pandas数据结构，你真的学会了吗？墨瑾轩 Python入门~精通 python pandas 数据结构
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5步掌握Pandas数据结构，你真的学会了吗？引言❓亲爱的小伙伴们，你们有没有遇到过这样的情况：在处理结构化数据时，总是觉得Python内置的列表和字典不够灵活？别担心，今天我们就来一场“Pandas数据结构大挑战”，手把手教你如何使用Pandas的两大核心数
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found