yub4by

《Python3天快速入门机器学习》day3:回归算法+聚类算法

四、回归算法
   4.1线性回归
       4.1.1线性回归的原理
           回归问题-目标值是连续型数据
           1、线性回归的应用场景
               1）房价预测
               2）销售额度预测
               3）贷款额度预测
           2、什么是线性回归
               特征值和目标值之间的关系是一种函数关系
               1）定义
                   线性回归是利用回归方程（函数）对一个或多个自变量（特征值）和
                   因变量（目标值）之间关系进行建模的一种分析方式
               2）特点
                   只有一个自变量的情况称为单变量回归，
                   多于一个自变量情况的称为多元回归。
               3）公式
                   特征值：x
                   目标值：y=h(w)=w1x1 + w2x2 + w3x3 + …… + wnxn + b= wTx + b
                                   其中w是回归系数（权重值），b是偏置，w b统称为模型参数；上式满足线性关系，称为线型模型
                                   PS:矩阵乘法 wT=[w1,w2,...,wn,b] x=[x1,x2,...,xn,1]T
                   *求一组合适的w1 w2 ... wn b使上式成立
                   线型模型例子：
                       期末成绩=0.7×考试成绩+0.3×平时成绩
                       房子价格 = 0.02×中心区域的距离 + 0.04×城市一氧化氮浓度 + (-0.12×自住房平均房价) + 0.254×城镇犯罪率
               4）广义线性模型
                   线性模型有两种情况：
                       自变量x是一次的，例如上述公式
                       参数w是一次的，例如y = w1x1 + w2x1^2 + w3x1^3 + w4x2^3 + …… + b
                   非线性关系？==>曲线也属于线性模型
                   注意区别线性关系&线性模型的关系：
                       线性关系一定是线性模型
线性模型不一定是线性关系
                   PS：单特征与目标值呈线线关系，二特征与目标值呈平面关系
       4.1.2线性回归的损失与优化原理（理解记忆）
           1、目标：求模型参数（w b）并且使模型参数能够使得预测准确
           2、例子
               1）
                   真实关系：真实房子价格 = 0.02×中心区域的距离 + 0.04×城市一氧化氮浓度 + (-0.12×自住房平均房价) + 0.254×城镇犯罪率
   随意假定：预测房子价格 = 0.25×中心区域的距离 + 0.14×城市一氧化氮浓度 + 0.42×自住房平均房价 + 0.34×城镇犯罪率
               2）我们希望缩小预测房子价格和真实房子价格的差距（通过不断改进参数）
                   损失函数/cost/成本函数/目标函数（衡量上述差距）-- 最小二乘法
           3、优化算法-缩小损失
               如何求模型中的w，是的损失最小？（目的是找到最小损失对应的w值）
               1）方法一：正规方程（公式详解见视频）
                   比喻“天才”--直接公式求解W
                   理解：X为特征值矩阵，y为目标值矩阵。直接求到最好的结果
                   缺点：当特征过多过复杂时，求解速度太慢并且得不到结果
                   拓展：
1)假设a>0,试求y的最小值
y = ax^2 + bx + c
y' = 2ax + b = 0
x = - b / 2a
PS:正规方程W类似上述过程，只不过x和y都为矩阵，涉及到矩阵求导，都是直接求解到最小值
2)矩阵求逆
a * b = 1 ==> b = 1 / a = a ^ -1
A * B = E ==> B = 1 / A = A ^ -1
[[1, 0, 0],
[0, 1, 0],
[0, 0, 1]]
               2）方法二：梯度下降（常用）（公式详解见视频）
                   比喻“勤奋”--不断试错和改进
       4.1.3API
           1、sklearn.linear_model.LinearRegression(fit_intercept=True)
                   1）LinearRegression类通过正规方程优化
                   2）参数：
                       fit_intercept：是否计算偏置，默认True
                   3）属性：
                       LinearRegression.coef_：回归系数
                       LinearRegression.intercept_：偏置
           2、sklearn.linear_model.SGDRegressor(loss="squared_loss", fit_intercept=True, learning_rate ='invscaling', eta0=0.01)
                   1）SGDRegressor类实现了随机梯度下降学习，它支持不同的loss函数和正则化惩罚项来拟合线性回归模型
                   2）参数：
                       loss:损失类型
                           默认=”squared_loss”，即普通最小二乘法
                       max_iter：迭代次数
                       fit_intercept：是否计算偏置
                       learning_rate : 学习率eta，string, 可选
                           学习率填充：
                               'invscaling': eta = eta0 / pow(t, power_t)
                                       power_t=0.25（0.25次方）:存在父类当中
                               'optimal': eta = 1.0 / (alpha * (t + t0)) [default]
                               'constant': eta = eta0 = 0.01
                                       对于一个常数值的学习率来说，可以使用learning_rate=’constant’ ，并使用eta0来指定学习率
                   3）属性：
                       SGDRegressor.coef_：回归系数
                       SGDRegressor.intercept_：偏置
       4.1.4案例：波士顿房价预测
           1）获取数据集
           2）划分数据集
           3）特征工程：
           无量纲化 - 标准化
           4）预估器流程
           fit() --> 模型coef_ intercept_
           5）模型评估（见4.1.5）
       4.1.5回归性能评估
           1、均方误差MSE评价机制（公式详解见视频）
               sklearn.metrics.mean_squared_error(y_true, y_pred)
                   1）均方误差回归损失
                   2）参数：
                       y_true:真实值
                       y_pred:预测值
                   3）返回值：return浮点数结果，越小越好
           2、正规方程和梯度下降两种回归模型对比
                   1）梯度下降
                       需要选择学习率；需要迭代求解；特征数量较大时可以使用
                   2）正规方程
                       不要要选择学习率；一次运算得出；需要计算方程，时间复杂度较高O(n^3)
           3、算法选择依据：
                   1）小规模数据：
                       正规方程(不能解决拟合问题)
                       岭回归
                   2）大规模数据：
                       梯度下降
       4.1.6扩展-梯度下降的优化方法
           原始的梯度下降（gradient descent，GD）需计算所有样本的值才能得出梯度，计算量大，以下为改进：
           1、FGD
               全梯度下降算法(Full gradient descent）
               在进行计算的时候,计算所有样本的误差平均值,作为我的目标函数
           2、SGD
               随机梯度下降算法（Stochastic gradient descent）
               每次迭代时只选择一个样本进行考核
           3、SAG
               随机平均梯度下降算法（Stochastic average gradient descent）
               会给每个样本都维持一个平均值,后期计算的时候,参考这个平均值
   4.2欠拟合与过拟合
       4.2.1什么是欠拟合与过拟合
           1、欠拟合
               一个假设在训练数据上不能获得更好的拟合，并且在测试数据集上也不能很好地拟合数据，此时认为这个假设出现了欠拟合的现象。(模型过于简单)
           2、过拟合
               一个假设在训练数据上能够获得比其他假设更好的拟合，但是在测试数据集上却不能很好地拟合数据，此时认为这个假设出现了过拟合的现象。(模型过于复杂)
       4.2.2原因及解决办法
           1、欠拟合原因以及解决办法
               原因：学习到数据的特征过少
               解决办法：增加数据的特征数量
                   1）添加其他特征项
                   2）添加多项式特征
           2、过拟合原因以及解决办法
               原因：原始特征过多，存在一些嘈杂特征，模型过于复杂是因为模型尝试去兼顾各个测试数据点
               解决办法：
                   1）重新清洗数据
                   2）增大数据的训练量
                   3）正则化（见下述）
                   4）减少特征维度
           3、正则化-通过限制高次项的系数进行防止过拟合
               1）什么是正则化
                   在解决回归过拟合中，我们选择正则化。但是对于其他机器学习算法如分类算法来说也会出现这样的问题，除了一些算法本身作用之外（决策树、神经网络），我们更多的也是去自己做特征选择，包括之前说的删除、合并一些特征。
                   在学习的时候，数据提供的特征有些影响模型复杂度或者这个特征的数据点异常较多，所以算法在学习的时候尽量减少这个特征的影响（甚至删除某个特征的影响），这就是正则化。
                   注：调整时候，算法并不知道某个特征影响，而是去调整参数得出优化的结果。
               2）正则化类别
                   L2正则化-把高次项前面的系数变成特别小的值（常用）
                       作用：可以使得其中一些W的都很小，都接近于0，削弱某个特征的影响
                       优点：越小的参数说明模型越简单，越简单的模型则越不容易产生过拟合现象
                       又称Ridge（岭）回归（见4.3）
                   L1正则化-直接把高次项前面的系数变为0
                       作用：可以使得其中一些W的值直接为0，删除这个特征的影响
                       又称LASSO回归
                   PS：损失函数 + λ惩罚项（公式详解见视频）
   4.3线性回归的改进-岭回归
           1、岭回归实质为具有L2正则化的线性回归，达到解决过拟合的效果
           2、API
               1）具有L2正则化的线性回归
               sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True,solver="auto", normalize=False)
                   参数：
                       alpha:正则化力度=惩罚项系数，也叫 λ
                           λ取值：0~1 1~10
                       solver:会根据数据自动选择优化方法
                           sag（随机平均梯度下降算法）:如果数据集、特征都比较大，选择该随机梯度下降优化
                       normalize:数据是否进行标准化
                           normalize=False:可以在fit之前调用preprocessing.StandardScaler标准化数据
                   属性：
                       Ridge.coef_:回归权重
                       Ridge.intercept_:回归偏置
                   PS:Ridge方法相当于SGDRegressor(penalty='l2', loss="squared_loss"),只不过SGDRegressor（4.1.3-2）实现了一个普通的随机梯度下降学习，推荐使用Ridge(实现了SAG)
               2）具有L2正则化的线性回归&可以进行交叉验证
                   sklearn.linear_model.RidgeCV(_BaseRidgeCV, RegressorMixin)
           3、观察正则化程度的变化，对结果的影响？
               1）正则化力度越大，权重系数会越小
               2）正则化力度越小，权重系数会越大
           4、案例：波士顿房价预测
   4.4分类算法-逻辑回归与二分类
       逻辑回归是机器学习中的一种分类模型，但其与回归有一定的联系。
       4.4.1逻辑回归的应用场景
           广告点击率-是否会被点击
是否为垃圾邮件
是否患病
是否为金融诈骗
是否为虚假账号
   从上面例子不难发现都属于两个类别（正例/反例）间的判断，逻辑回归正是解决二分类问题的利器。
       4.4.2逻辑回归的原理
           1、逻辑回归的输入=线型回归的输出，即g(x)中的x=线性回归的h(w)
           2、激活函数：sigmoid函数=g(x)=1/(1 + e^(-x))
               1）线型回归的结果输入到sigmoid函数中
               2）sigmoid函数输出结果：
                   [0, 1]区间的一个概率值（默认设0.5为阈值，即大于0.5认为其属于此类别，小于0.5则不属于）
               3)假设函数/线性模型:
   1/(1 + e^(-(w1x1 + w2x2 + w3x3 + …… + wnxn + b)))
4）损失函数：
   线性回归-真实值&预测值都是数
           [(y_predict - y_true)的平方和]/总数
       逻辑回归-真实值&预测值都是"是否属于某个类别"
       对数似然损失（cost(h(x),y)公式详解见视频）
5）优化损失
梯度下降
       4.4.3API
           sklearn.linear_model.LogisticRegression(solver='liblinear', penalty=‘l2’, C = 1.0)
               1、solver可选参数:{'liblinear', 'sag', 'saga','newton-cg', 'lbfgs'}，
                   1）默认: 'liblinear'；内部使用坐标轴下降法来迭代优化损失函数；用于优化问题的算法。
                   2）对于小数据集来说，“liblinear”是个不错的选择，而“sag”和'saga'对于大型数据集会更快。
                   3）对于多类问题，只有'newton-cg'， 'sag'， 'saga'和'lbfgs'可以处理多项损失;“liblinear”仅限于“one-versus-rest”分类。
                   4）sag:根据数据集自动选择，随机平均梯度下降。
               2、penalty：正则化的种类
               3、C：正则化力度
               4、默认将类别数量少的当做正例
               PS:LogisticRegression方法相当于SGDClassifier(loss="log", penalty=" "),SGDClassifier实现了一个普通的随机梯度下降学习,
               也支持平均随机梯度下降法（ASGD），可通过设置average=True。而使用LogisticRegression(实现了SAG)
       4.4.4案例：癌症分类预测-良\恶性乳腺癌肿瘤预测
           1、默认：恶性（类别数量少） - 正例
   2、流程分析：
   1）获取数据
   读取的时候加上names
   2）数据处理
   处理缺失值
   确定特征值、目标值
                           数据集划分
   3）特征工程-标准化
   4）机器学习-逻辑回归预估器
   5）模型评估
   3、真的患癌症的，能够被检查出来的概率 - 召回率（4.4.5）
       4.4.5分类的评估方法
           1、精确率和召回率
               1）混淆矩阵
                   在分类任务下，预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合，构成混淆矩阵(适用于多分类)
                               |               |       预测结果
                   ------|-------|-------------------
                               |               |   正例       假例
                   ------|-------|-------------------
                   真实   | 正例   |   真正例TP   伪反例FN
                   结果   |-------|-------------------
                               | 假例   |   伪正例FP   真反例TN
                   TP = True Possitive
FN = False Negative
               2）精确率(Precision)与召回率(Recall)
                   准确率=(TP+TN)/(TP+TN+FN+FP)（对不对）
                   精确率=TP/(TP+FP)（查的准不准）;预测结果为正例样本中真实为正例的比例(预测结果中有多少是真正预测正确的)
                   召回率=TP/(TP+FN) （查的全不全）;真实为正例的样本中预测结果为正例的比例（查得全，对正样本的区分能力）（真是结果的正例有多少被预测对了）
               3）其他评估标准之F1-score（反映了模型的稳健型）
                   F1=2TP/(2TP+FN+FP)=2*Precision*Recall/(Precision+Recall)
               4）分类评估报告API
                   sklearn.metrics.classification_report(y_true, y_pred, labels=[], target_names=None )
                       y_true：真实目标值
                       y_pred：估计器预测目标值
                       labels：指定类别对应的数字
                       target_names：目标类别名称
                       return：每个类别精确率与召回率
       2、ROC曲线与AUC指标
           1）TPR与FPR
               TPR = TP / (TP + FN)       （TPR实质为召回率）
                   所有真实类别为1的样本中，预测类别为1的比例
               FPR = FP / (FP + TN)
                   所有真实类别为0的样本中，预测类别为1的比例
           2）ROC曲线
               ROC曲线的横轴就是FPRate，纵轴就是TPRate，当二者相等时，表示的意义则是：对于不论真实类别是1还是0的样本，分类器预测为1的概率是相等的，此时AUC为0.5
           3）AUC指标
               AUC的概率意义是随机取一对正负样本，正样本得分大于负样本得分的概率
               AUC的范围在[0, 1]之间，并且越接近1越好，越接近0.5属于乱猜
               AUC=1，完美分类器，采用这个预测模型时，不管设定什么阈值都能得出完美预测。绝大多数预测的场合，不存在完美分类器
               0.5                最终AUC在[0.5,1]之间，并越接近1最好
           4）AUC计算API
               sklearn.metrics.roc_auc_score(y_true, y_score)
                   计算ROC曲线面积，即AUC值
                   y_true：每个样本的真实类别，必须为0(反例),1(正例)标记
                   y_score：预测得分，可以是正类的估计概率、置信值或者分类器方法的返回值
           5）AUC只能用来评价二分类，AUC非常适合评价样本不平衡中的分类器性能
   4.5模型保存与加载
       当训练或者计算好一个模型后，那么如果别人需要我们提供结果预测，
       就需要保存模型（主要是保存算法的参数）
       4.5.1sklearn模型的保存和加载API
           from sklearn.externals import joblib
               保存：joblib.dump(estimator, 'test.pkl')
               加载：estimator = joblib.load('test.pkl')
               注意：
                   1.保存文件，后缀名是**.pkl
                   2.加载模型是需要通过一个变量进行承接
       4.5.2线性回归的模型保存加载案例
           day3.py-linear3()

五、聚类算法
   5.1无监督学习之K-means算法
       5.1.1什么是无监督学习
           没有目标值 - 无监督学习
       5.1.2无监督学习包含的算法
           聚类
   K-means(K均值聚类)
降维
   PCA
       5.1.3K-means原理
           步骤：
               1）随机设置K个特征空间内的点作为初始的聚类中心
               2）对于其他每个点计算到K个中心的距离，位置的点选择最近的一个聚类中心作为标记类别
               3）接着对标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）
               4）若计算出来的新中心点与原中心点一样，则结束；否则重新进行第二步
       5.1.4K-meansAPI
           sklearn.cluster.KMeans(n_clusters=8,init="k-means++")
               参数:
                   n_clusters:开始的聚类中心数量整型，缺省值=8，生成的聚类数，即产生的质心（centroids）数
                   init：初始化方法，默认="k-means++"
               属性：
                   labels_：默认标记的类型，可以和真实值比较（不是值比较）
               方法:
                   estimator.fit(x)
                   estimator.predict(x)
                   estimator.fit_predict(x)
               计算聚类中心并预测每个样本属于哪个类别,相当于先调用fit(x),然后再调用predict(x)
       5.1.5案例：K-means对Instacart Market用户聚类
           k = 3
流程分析：
   继PCA降维之后的数据
       1）预估器流程
       2）看结果
       3）模型评估（5.1.6）
       5.1.6K-means性能评估指标
           1、误差平方和(SSE \The sum of squares due to error)
           2、“肘”方法 (Elbow method) — K值确定
           3、轮廓系数法（Silhouette Coefficient）
               1）"高内聚，低耦合"--内部距离最小化，外部距离最大化
               2）S=(b-a)/max(b,a)
                   i为某已聚类数据中的样本
                   b为i到其他族群的所有样本的距离的最小值（外部距离）
                   a为i到本身族群的所有样本的距离的平均值（内部距离）
               3）轮廓系数法结合了聚类的凝聚度（Cohesion）和分离度（Separation），用于评估聚类的效果。
                   轮廓系数的值是介于 [-1,1]，越趋近于1代表凝聚度和分离度都相对较优。
                   如果b>>a:S趋近于1，效果越好；
如果b< 求出所有样本的轮廓系数后再求平均值就得到了平均轮廓系数。
                   平均轮廓系数的取值范围为[-1,1]，系数越大，聚类效果越好。
   4）API
       sklearn.metrics.sihouette_score(X,labels)
           计算所有样本的平均轮廓系数
           参数：
               X：特征值
               labels：被聚类标记的目标值
           4、CH系数（Calinski-Harabasz Index）
       5.1.7K-means总结
           1、特点：采用迭代式算法，直观易懂并且非常实用
           2、缺点：容易收敛到局部最优解（多次聚类）
           3、应用场景：没有目标值（一般在分类之前做）

python爬虫系列课程4：一个例子学会使用xpath语法 wp_tao Python副业接单实战项目 python 爬虫开发语言
python爬虫系列课程4：一个例子学会使用xpath语法本文通过一个例子，学会xpath的各种语法，可以作为xpath的查询手册使用，代码如下：fromlxmlimportetreetext='''firstitemseconditemthirditemfourthitem<liclass="item-0
使用Selenium和bs4进行Web数据爬取和自动化(爬取掘金首页文章列表) 程序员霄霄软件测试 selenium 前端自动化软件测试功能测试自动化测试程序人生
前言：Web数据爬取和自动化已成为许多互联网应用程序的重要组成部分。本文将介绍如何使用Python中的两个强大库，即Selenium和BeautifulSoup，来实现自动化操作、网页数据提取以及网页内容分析。并以爬取掘金首页文章列表标题和url为例子进行讲解.安装和使用Selenium本文是在python环境下使用selenium，使用浏览器是火狐，系统是win10系统。python环境的配置这
强化学习——基本概念 AI大模型探索者人工智能 ai 深度学习机器学习语言模型
何为强化学习机器学习的一大分支强化学习（ReinforcementLearning）是机器学习的一种，它通过与环境不断地交互，借助环境的反馈来调整自己的行为，使得累计回报最大。强化学习要解决的是决策问题——求取当前状态下最优行为或行为概率。强化学习包括智能体和环境两大对象，智能体是算法本身，环境是与智能体交互的外部。智能体（IntelligentAgent），在人工智能领域，智能体指一个可以观察周
python爬虫之自动化爬取网页陌小 python selenium python chrome
以下为公开源码fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionsimporttimefrombs4importBeautifulSoupurl='https://movie.douban.com/'chrome_optins=Options()chrome_optins.add_argument
自然语言处理NLP入门 -- 第一节基础概念山海青风 #自然语言处理自然语言处理人工智能 python
本部分主要介绍NLP的基础概念，并通过实际案例演示NLP的核心任务，同时引导你搭建NLP开发环境，确保你能顺利开始后续学习。1.什么是自然语言处理（NLP）1.1NLP的定义自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个子领域，专注于让计算机理解、解释和生成人类语言。NLP结合了计算机科学、语言学和机器学习，以便计算机能自动处理文本和语音数据。简
Visual Studio Code配置Python开发环境 ai74583 python 开发工具 json
1.安装Python插件在VScode界面按Crtl+Shift+P或者F1输入extinstall直接安装Python，也就是点击它，然后等待，安装好后会提示你重启2.配置运行Python程序同样的打开命令面板（Crtl+Shift+P或F1），然后输入Tasks:ConfigureTaskRunner（中文输入：任务，然后选择任务：配置任务运行程序），选择Other此时VScode会自动生成.
机器学习与深度学习资料 JasonDing1354 【Machine Learning】
《BriefHistoryofMachineLearning》介绍:这是一篇介绍机器学习历史的文章，介绍很全面，从感知机、神经网络、决策树、SVM、Adaboost到随机森林、DeepLearning.《DeepLearninginNeuralNetworks:AnOverview》介绍:这是瑞士人工智能实验室JurgenSchmidhuber写的最新版本《神经网络与深度学习综述》本综述的特点是以
Python | 学习type()方法动态创建类胜天半月子 Python基础及应用 python 学习开发语言
getattr方法的使用场景是在访问不存在的属性时，会触发该方法中的处理逻辑。尤其是在动态属性获取中结合type()动态创建类有着良好的使用关系。type()方法常用来判断属性的类别，而动态创建类不常使用，通过如下的几个实例来学习使用：defsay_hello(self):print("Hello,I'maninstanceofadynamicallycreatedclass!")#使用type函
【大模型】大模型分类 IT古董人工智能人工智能大模型
大模型（LargeModels）通常指参数量巨大、计算能力强大的机器学习模型，尤其在自然语言处理（NLP）、计算机视觉（CV）等领域表现突出。以下是大模型的常见分类方式：1.按应用领域分类自然语言处理（NLP）模型如GPT-3、BERT、T5等，主要用于文本生成、翻译、问答等任务。计算机视觉（CV）模型如ResNet、EfficientNet、VisionTransformer(ViT)等，用于图
Python实用技巧：轻松上手自动化数据爬取与存储傻啦嘿哟 python 自动化开发语言
目录一、准备阶段：确定目标与安装工具1.确定目标网站2.安装Python及必要库二、编写爬虫程序：发送请求与解析网页1.发送HTTP请求2.解析网页内容三、处理反爬虫机制：应对挑战与策略1.设置请求头2.使用代理IP四、数据存储与处理：保存与分析数据1.存储为文本文件2.存储为数据库3.存储为Excel文件五、实战案例：爬取电商平台商品价格1.分析目标网站2.编写爬虫程序3.运行爬虫程序六、优化与
使用 Vosk 实现语音识别分发吧语音识别 xcode 人工智能
在近两年里，如果说想要在本地部署离线语音识别模型，那么Whisper和FunASR肯定是首选项。所以为什么要使用Vosk呢？优势Vosk是一个离线开源语音识别工具包，它的优点在于：轻量：Vosk提供轻量级的模型（小于50MB大小），可以用于低功耗平台（例如Android、树莓派之类）多编程语言、多平台支持：Python、Java、Node.js、C#、C++、Rust、Go等多语种支持：支持二十多
10个简单、有趣且适合初学者的Python编程实例！！ shuaige_shiwoa python+AI python 开发语言
好的！以下是10个简单、有趣且适合初学者的Python编程实例，每个例子都附带简要说明和代码（可直接运行）：猜数字游戏用户猜一个随机生成的数字，程序会提示“太大”或“太小”。importrandomnumber=random.randint(1,100)whileTrue:guess=int(input("猜一个1-100之间的数字:"))ifguess==number:print(“猜中了！”)
哪个python解释器好？ lmseo5hy python培训 python解释器
Python是一门解释器语言，代码想运行，必须通过解释器执行，Python存在多种解释器，分别基于不同语言开发，每个解释器有不同的特点，但都能正常运行Python代码，以下是常用的五种Python解释器：CPython当从Python官方网站下载并安装好Python2.7后，就直接获得了一个官方版本的解释器：Cpython，这个解释器是用C语言开发的，所以叫CPython，在命名行下运行pytho
python编译安装vosk语音识别包 hzjxinyue python
不知道为什么，谁把vosk从pip源上删了。没办法只能自己编译安装了。下载源代码gitclonehttps://github.com/alphacep/vosk-api.git进入python文件夹cdvosk-api/python编译安装python3setup.pyinstall
Eclipse极速安装指南：3分钟掌握Java开发环境三流搬砖艺术家 java java eclipse ide
目录为什么要选Eclipse？️准备工具清单步骤一：下载安装包⚙️步骤二：安装与配置步骤三：界面优化步骤四：创建第一个项目必装效率插件推荐❗常见问题排雷效率对比表为什么要选Eclipse？✅跨平台神器：Windows/Mac/Linux全支持✅免费开源：IBM开发，全球开发者共同维护✅插件生态强大：支持Java/Python/C++等20+语言✅智能代码提示：媲美IDEA的代码补全能力️准备工具清
PythonLearn yadanuof yy的学习之路 python
简单数据类型数据类型转换int(x)float(x)str(x)chr(x)ord(x)hex(x)oct(x)bin(x)eval函数Python中的内置函数,用于去掉字符串最外侧的引号,并按照逻辑运算age=eval(input('请输入年龄:'))#将input读入的字符串类型转成了int类型,相当于int(age)print(age,type(age))#18hello='北京欢迎你'pr
Anaconda的详细配置过程（附图）椰卤工程师机器学习 anaconda tensorflow
Anaconda是Python的一个科学计算发行库，内置了上千个Python经常会用到的库，包括Scikit-learn、Numpy、Scipy、Pandas等。1.Anaconda下载下载地址：https://www.anaconda.com/download/官网下载速度很慢，慎用！建议通过国内镜像网站下载。Anaconda是跨平台的，有Windows、macOS、Linux版本，博主这里以W
JVM中对象的创建重生之我在成电转码 java 八股 jvm 算法
在Java中，JVM（JavaVirtualMachine）负责对象的创建和管理。对象的创建过程涉及多个步骤，从类加载、内存分配，到对象的初始化和构造方法的调用。了解JVM如何创建对象有助于更好地掌握Java的内存管理和性能优化。JVM中对象创建的过程当我们使用new关键字创建一个对象时，JVM会执行一系列操作。这些操作大致可以分为以下几个步骤：类加载（ClassLoading）内存分配（Memo
.net机器学习框架：ML.NET模型生成器 NotOnlyCoding AI编程
ML.NETModelBuilder是一个直观的图形化VisualStudio扩展，用于构建、训练和部署自定义机器学习模型。它利用自动化机器学习（AutoML）来探索不同的机器学习算法和设置，帮助您找到最适合您场景的那个。使用ModelBuilder不需要机器学习专业知识。您只需要一些数据和一个需要解决的问题。ModelBuilder会生成代码，以便将模型添加到您的.NET应用程序中。1.创建一个
基于yolov8的糖尿病视网膜病变严重程度检测系统python源码+pytorch模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO
【算法介绍】基于YOLOv8的糖尿病视网膜病变严重程度检测系统基于YOLOv8的糖尿病视网膜病变严重程度检测系统是一款利用深度学习技术，专为糖尿病视网膜病变早期诊断设计的智能辅助工具。该系统采用YOLOv8目标检测模型，结合经过标注和处理的医学影像数据集，能够高效且准确地检测并分类糖尿病视网膜病变的不同严重程度。YOLOv8模型以其高速和高精度的特点，在处理眼底图像时展现了强大的能力。通过优化模型
【python】pathlib库的使用，详细资源存储库笔记算法 python 开发语言
目录1.基本使用：创建Path对象2.路径的各种操作获取当前工作目录获取当前脚本所在的路径3.路径的属性4.路径的拼接5.遍历目录筛选特定类型的文件递归遍历目录6.文件操作检查文件是否存在删除文件读取文件内容写入文件7.高级操作检查路径是否是符号链接获取文件的绝对路径8.文件和目录的比较9.文件系统的其他操作总结：pathlib是Python3.4及以后版本引入的一个现代化的文件路径操作库，旨在提
wordpress使用CorePress主题设置项总结 linlinlove2 wordpress二次开发 wordpress主题开发
宝塔面板设置软件商店中安装的软件有：（宝塔网站加速3.1）（Nginx1.18.0）（MySql5.6.50）（PHP-5.6）（phpMyAdmin4.4）（Python项目管理器1.9）（又拍云存储4.5）（Linux工具箱1.4）（宝塔SSH终端1.0）（Nginx免费防火墙5.3）网站：首次添加站点选择自动创建数据库网站–>SSL：申请免费Let’sEncrypt证书，并开启强制https
CMU 10423 Generative AI：lec10（few-shot、提示工程、上下文学习） ⊙月 AI 人工智能学习 AIGC
文章目录1概述2摘录2.1zero-shot和few-shot一、Zero-shotLearning（零样本学习）特点：工作原理：优点：缺点：二、Few-shotLearning（少样本学习）特点：工作原理：优点：缺点：三、Zero-shot与Few-shotLearning的对比四、应用案例2.2Prompting（提示）一、Prompting（提示）的定义二、Prompting的原理三、Pro
0004-Ultralytics YOLOv10 熟悉的黑曼巴目标检测 YOLO 人工智能深度学习
YOLOv10由清华大学的研究人员基于UltralyticsPython包构建，引入了一种实时对象检测的新方法，解决了之前YOLO版本中发现的后处理和模型架构缺陷。通过消除非最大抑制（NMS）和优化各种模型组件，YOLOv10以显著降低的计算开销实现了最先进的性能。广泛的实验表明，它在多个模型尺度上具有卓越的准确性和延迟权衡。实时对象检测旨在以低延迟准确预测图像中的对象类别和位置。YOLO系列因其
Python web基础知识，后端服务器开发，观点还停留在Java上吗！道-闇影 python java web开发
极简生活，极简编程，简到极致，就是完美！在写CSDN的Python技能树体验五(web应用开发:Djiago、Tornado、Flask)—终于可以写点能看的了！之前，wc，提前剧透了！先对web开发做一个简要的说明，话不多说，往下看！web应用开发的含义web应用开发分为：前端网页开发，后端服务器开发，还有前后端的一个通信技术！各个部分需要哪些基础前端开发基础：HTML,CSS，JavaScti
Python pathlib中Path用法 bj_zhb python python 深度学习开发语言
Pythonpathlib中Path用法文章目录Pythonpathlib中Path用法Path类是Python中pathlib模块的主要组成部分之一，它提供了一种面向对象的方式来处理文件系统路径。Path对象可以表示文件路径或目录路径，并且可以执行各种与路径相关的操作，例如连接路径、检查路径是否存在、创建路径等。下面是Path类的一些常用方法和功能：创建Path对象：可以使用Path类来创建文件
【Python】path：简化文件路径处理的 Python 库 @Unity打怪升级 Python python 开发语言开源软件开源人工智能 pip ipython
path是一个Python库，提供了对文件系统路径的简洁抽象，使文件和目录操作更加直观和Pythonic。该库建立在pathlib的基础上，扩展了文件路径处理的功能，使得开发者能够更高效地进行文件操作，如文件读写、目录遍历、路径拼接等。path库旨在简化文件系统的操作，使代码更加易读、简洁。本文将介绍path库的功能和用法，并展示如何使用该库来简化文件和目录的操作。➰缘起path的主要特点1.简洁
python汽车数据分析可视化系统 Django框架爬虫+Vue框架 Echarts可视化大屏懂车帝（源码） ✅ Q_2564007092 python 汽车数据分析
python汽车数据分析可视化系统Django框架爬虫+Vue框架Echarts可视化大屏（源码）✅1、项目介绍技术栈：Python语言Django框架vue框架mysql数据库requests爬虫Echarts可视化HTML该系统的技术栈包括：Python语言：用于数据分析与处理、爬虫、后端开发等。Django框架：一款使用Python语言开发的Web应用程序框架，用于快速搭建后端服务。Vue框
Python数据分析 NumPy矩阵与通用函数及统计分析 ② 第二节修仙宝哥 python 数据分析 numpy
NumPy矩阵与通用函数及统计分析案例NumPy矩阵与通用函数及统计分析一、掌握NumPy矩阵与通用函数代码2-30：矩阵的创建代码2-31：数组的创建与组合代码2-32：矩阵的运算代码2-33：矩阵的转置、逆矩阵和二维数组视图代码2-34：数组的基本运算代码2-35：数组的比较运算代码2-36：数组的逻辑运算代码2-37：数组的广播相加（一维数组加到二维数组）代码2-38：数组的广播相加（一维数
pip._vendor.packaging.version.InvalidVersion: Invalid version: ‘-PKG-VERSION‘ Yue谷 qt python 开发语言
ImportError:NocompliantGUIlibrarycouldbeimported.EitherPyQt5,PyQt4,PySide2,PySide,orwxPython脚本正在尝试使用图形用户界面（GUI）库，但找不到已安装的任何GUI库pipinstallPyQt5报错pip._vendor.packaging.version.InvalidVersion:Invalidvers
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

《Python3天快速入门机器学习》day3:回归算法+聚类算法

你可能感兴趣的:(Python,Machine,learning,机器学习)