朱笨笨

机器学习入门五（随机森林模型数据分类及回归）

目录

前言

一、随机森林模型简介

二、随机森林模型数据分类。

2.1简单阐述一下训练和测试数据

2.2创建模型并训练

2.3获取每个特征的重要性并可视化

2.4分析决策树的数量对模型精确程度的影响

2.5网格搜索确定最佳参数

三、随机森林模型回归

3.1波士顿房价数据集简介

3.2数据回归

3.3特征重要性可视化

3.4网格搜索确定最佳参数

总结

前言

本文主要介绍随机森林模型，以及随机森林模型在分类任务和回归任务中的应用，这次采用的数据集分别为泰坦尼克号数据集和boston（波士顿房价sklearn可下载）数据集，前者用于分类任务，后者用于回归任务。

一、随机森林模型简介

三个臭皮匠，顶个诸葛亮。假设我们存在一个学霸A，学渣B、C、D，让他们分别去考语文、数学、英语三门学科，学霸A每门都能考95分，而学渣B、C、D分别只擅长其中的一门，且他们都能将他们擅长的一门考到100分。那么让学渣B、C、D去考擅长的一门，然后汇总他们的成绩，最后的成绩自然就会比学霸A高。而随机森林模型其实就类似与B、C、D相加汇总成的一个比较好的模型。其根本原理还是通过所有单一的决策树投票决定，每个小模型都有出众的地方，然后汇总。

随机森林是一种基于决策树的集成学习算法，它将多个决策树进行组合，采用多数投票的方式取得最终的预测结果。随机森林在决策树存在过拟合问题时能够有效地避免过拟合，同时还具有较高的准确率和鲁棒性。随机森林是一种全自动、非参数化的机器学习算法，可以用于分类和回归等多种任务，广泛应用于数据挖掘、信用评估、医学诊断、商品推荐等领域。

不过随机森林模型也存在一定的缺点，那就是只能针对一般数据，不具备真正处理困难样本的能力。简单来说就是起点高，天花板低。

二、随机森林模型数据分类。

2.1简单阐述一下训练和测试数据

分类模型我们已经采用作者在机器学习入门四（决策树）中已经将缺失值，和无用数据处理过的泰坦尼克号数据集。

2.2创建模型并训练

直接从sklearn导入模型直接训练，其中我们要注意的就是OOB score（袋外分数），这是一个对测试集错的一个无偏估计，表示对随机森林模型未来性能的一个合理估计。分数越高模型月越理想，因为随机森林中的每颗树采用样本时是随机的，并不是采用所有样本。所以OOB是在模型构建后计算的，这个值跟所有的模型有关。

#随机森林
from sklearn.ensemble import RandomForestClassifier#导入随机森林模型
from sklearn.metrics import accuracy_score#导入评估模型的精度
print(x_train)
rfc1 = RandomForestClassifier(n_estimators=100,max_depth=5,oob_score=True,class_weight="balanced",random_state=1)#实例化随机森林模型
rfc1.fit(x_train,y_train)#训练模型
##输出训练集和验证集的预测精度
rfc1_lab = rfc1.predict(x_train)#训练集的预测值
rfc1_pre = rfc1.predict(x_test)#测试集的预测值
print("随机森林的OOB score是",rfc1.oob_score_)#输出袋外分数,袋外分数是用袋外数据来评估模型的准确性，分数越高说明模型越好
print("训练集上的精度：",accuracy_score(y_train,rfc1_lab))
print("测试集上的精度:",accuracy_score(y_test,rfc1_pre))

准确度来看，训练集为0.85，测试集为0.78。总的来说相对于前面介绍的监制钱的决策树模型，随机森林算法出现过拟合的情况比较小。

2.3获取每个特征的重要性并可视化

我们需要看下每个模型因素的重要性得分，这有利于我们认清在预测遇难者是否存活时，哪个因素起到的作用比较大

#条形图可视化每一个变量的重要性
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.style.use('ggplot')

importances = pd.DataFrame({'feature':x_train.columns,'importance':rfc1.feature_importances_})
importances = importances.sort_values('importance',ascending=False)
importances.plot(kind='barh',figsize=(12,8),color='orange',x='feature',y='importance',legend=False)
plt.xlabel('重要性')
plt.ylabel('')
plt.title('随机森林模型分类器各因素重要性得分')
plt.grid()
plt.show()

由此可见，性别和费用起到大作用。这与最后逃生的原则有关系，妇女和孩童优先。富商也存在优先级。

2.4分析决策树的数量对模型精确程度的影响

首先先初步的进行观察，不妨令决策树从1-100的数量增加，横坐标为个数，纵坐标为oob分数

oobsocre = []
for i in range(1,101):
    rfc = RandomForestClassifier(n_estimators=i,n_jobs=-1,oob_score=True,random_state=90)
    rfc.fit(x_train,y_train)
    oobsocre.append(rfc.oob_score_)
plt.plot(range(1,101),oobsocre)
plt.show()

整体来说大概在15之后处于一个比较高的值。但是感觉不够，因此我们要画出测试集的精度

oobsocre = []
test_score = []
numbers = np.arange(50,301,5)
for i in numbers:
    rfc = RandomForestClassifier(n_estimators=i,n_jobs=-1,oob_score=True,random_state=90)
    rfc.fit(x_train,y_train)
    oobsocre.append(rfc.oob_score_)
    test_score.append(rfc.score(x_test,y_test))
#可视化
plt.figure(figsize=(20,5))
plt.plot(numbers,oobsocre,"r-o",label="oob score")
plt.plot(numbers,test_score,"r--s",label="测试集精度",color="blue")
plt.grid()#添加网格
plt.legend()#添加图例
plt.xlabel("n_estimators/决策树的数量")
plt.ylabel("精度")
plt.title("随机森林的分类器树的数量与模型精度的关系")
plt.show()

我们可以发现随着书的数量增加，oob score的波定性较强，随着树的增加，测试集精度在一定范围内很稳定，呈现一条与x轴平行的直线。

2.5网格搜索确定最佳参数

为了得到预测效果较好的随机森林模型，我们使用参数网格搜索的方法进行模型训练，参数为决策树的数量，决策树的最大深度，评估标准等等，作者因为考虑到参数越多，我们交叉验证网格搜索的时间就越长，所以作者控制了参数的个数和范围。但模型最后还是跑了接近10多分钟菜出图，有一点要注意，这里gs训练的时候采用了所有的数据集。

##网格搜索寻找合适模型
rfg = RandomForestClassifier(random_state=90,oob_score=True)
n_estimators = [100,200,500,800]#决策树的数量
max_depth = [5,8,15,25,30]#最大深度
class_weight = ["balanced","balanced_subsample"]#balanced_subsample是平衡的子样本
criteria = ["gini","entropy"]#评价标准
parameters = {"n_estimators":n_estimators,"max_depth":max_depth,"class_weight":class_weight,"criterion":criteria}
GS = GridSearchCV(rfg,parameters,cv=5)#网格搜索,cv是交叉验证的折数此时为5
GS.fit(x_train,y_train)
print(GS.best_params_)#返回最优参数
print(GS.best_score_)#返回最优分数

最优的训练分数为0.816左右，然后我们可视化出图像便于大家观察

result = pd.DataFrame(GS.cv_results_)#返回所有模型的评估结果
result = result.sort_values(by="mean_test_score",ascending=False)#按照平均值排序

#可视化
plt.figure(figsize=(20,5))
plt.plot(range(result.shape[0]),result["mean_test_score"])
plt.xticks(range(result.shape[0]),result["params"],rotation=90)#rotation=90将参数旋转90度
plt.grid()
plt.show()

结果有些长，不过整体来看没什么问题。

接着我们在看前十个优秀的模型

result = pd.DataFrame(GS.cv_results_)#返回所有模型的评估结果
result = result.sort_values(by="mean_test_score",ascending=False)#按照平均值排序
result.head(10)#返回前十个最优模型的评估结果

这样子我们就可以直观的看到每个模型的每个数值，便于我们合理选择。

三、随机森林模型回归

3.1波士顿房价数据集简介

波士顿房价数据集是统计的20世纪70年代中期波士顿郊区房价的中位数，统计了当时教区部分的犯罪率、房产税等共计13个指标，统计出房价，试图能找到那些指标与房价的关系。本例子明显的是属于回归模型的案例。在数据集中包含506组数据，其中404是训练样本，剩下的102组数据作为验证样本。

3.2数据回归

这个模型大概跑了5分钟左右，然后根据

#随机森林模型数据回归

from sklearn.datasets import load_boston
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestRegressor
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

boston = load_boston()
x = boston.data
y = boston.target
x.shape
y.shape
#实例化模型
rfr = RandomForestRegressor(n_estimators=100,random_state=1)
#交叉验证
cross_val_score(rfr,x,y,cv=10,scoring="neg_mean_squared_error")#scoring="neg_mean_squared_error"是评价指标，均方误差
cross_val_score(rfr,x,y,cv=10,scoring="r2")#scoring="r2"是评价指标，R2
#可视化
score = []
for i in range(1,101):
    rfr = RandomForestRegressor(n_estimators=i,n_jobs=-1,random_state=1)
    score.append(cross_val_score(rfr,x,y,cv=10,scoring="r2").mean())
plt.plot(range(1,101),score)

效果一般，一般来说越接近1效果越好，可以这次模型对于波士顿房价来说还不够。

3.3特征重要性可视化

#重要性预测
rfr = RandomForestRegressor(n_estimators=100,random_state=1)
rfr.fit(x,y)
rfr.feature_importances_
importances = pd.DataFrame({"feature":boston.feature_names,"importance":rfr.feature_importances_})
importances = importances.sort_values("importance",ascending=False)
importances.plot(kind="barh",figsize=(12,8),color="green",x="feature",y="importance",legend=False)
plt.xlabel("重要性")
plt.ylabel("")
plt.title("随机森林模型各因素重要性得分")
plt.grid()
plt.show()

RM表示每栋房子的房间，可见这个条件对房价的影响很大。其实简单来说跟现在一样，多少面积算的。

3.4网格搜索确定最佳参数

#网格搜索
rfr = RandomForestRegressor(random_state=1)#实例化模型
n_estimators = [100,200,500,800]#决策树的数量
max_depth = [5,8,15,25,30]#最大深度
criteria = ["mse","mae"]#mse是均方误差，mae是平均绝对误差
parameters = {"n_estimators":n_estimators,"max_depth":max_depth,"criterion":criteria}#参数
GS = GridSearchCV(rfr,parameters,cv=5)#网格搜索
GS.fit(x,y)#训练模型
print(GS.best_params_)#返回最优参数
print(GS.best_score_)#返回最优分数
result = pd.DataFrame(GS.cv_results_)#返回所有模型的评估结果
result = result.sort_values(by="mean_test_score",ascending=False)#按照平均值排序
result.head(10)#返回前十个最优模型的评估结果

#可视化
plt.figure(figsize=(20,5))#设置画布大小
plt.plot(range(result.shape[0]),result["mean_test_score"])#画图
plt.xticks(range(result.shape[0]),result["params"],rotation=90)#rotation=90将参数旋转90度
plt.grid()#添加网格
plt.show()#显示图像

其实训练效果并不好，从得分0.65就可以看出来了，但经过网格搜索发现最好的参数是{'criterion': 'mse', 'max_depth': 25, 'n_estimators': 800}。作者手头暂时没有找到比较适合随机森林回归的数据集。但方法就是这样，该方法适用于每个数据集，所以大家可以用不同的算法去玩分类和回归，总会找到一个比较合适的模型的。

总结

总的来说就是写了一篇关于随机森林模型用法的文章，其实就是我们用计算机通过数学模型玩数据，选择合理的模型得出正确的结论。还是要说，模型理解好，参数调好。今天分享的就差不多这样了，希望大家支持一下哦！

linux-用户和组 2501_92004703 linux 服务器运维
linux-用户和组前言一、用户管理1.用户账户类型2.主要命令2.1useradd2.2usedel2.3usermod2.4su3.查看用户登录信息3.1w3.2who3.3last3.4lastlog3.5lastb4.用户配置文件4.1/etc/passwd4.2/etc/shadow4.3/etc/login.defs5.手工新建用户二、组管理1.组分类2.组配置文件总结前言用户和组是进
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
【实战派×学院派】32｜上线后一堆优化需求，到底是 Bug 还是改进？郭菁菁 (BA/PM)实战派常踩的坑学院派如何补上 bug 业务分析需求分析 BA
学院派：用Bug/Enhancement分类机制+优化反馈池+二次迭代评审机制，避免优化失控、节奏紊乱你是不是也遇到过这样的场景：“这个报表逻辑不太合理，麻烦调整下。”“那个按钮位置不合适，顺便挪一挪吧。”“这个功能可以加个提醒吗？体验会好一点。”项目刚上线没多久，各路优化意见像潮水一样涌来。最让人头疼的是：到底这些算Bug（缺陷）还是Enhancement（优化改进）？该优先处理哪个？哪些该打回
如何让AI真正理解你的意图（自适应Prompt实战指南） nine是个工程师大语言模型人工智能 prompt
目前的LLM模型，在理解用户意图方面，正在使用自适应Prompt技术，来提升模型的理解能力。目前使用deepseek推理模型能明显看到自适应的一个过程。前言：为什么你的AI总是"答非所问"？相信很多人都遇到过这样的情况：你问：“帮我写一个Python爬虫”AI答：给你一堆理论知识和完整教程（你只想要简单代码）你问：“推荐一部电影”AI答：推荐了《教父》（你想看轻松喜剧）你问：“解释一下机器学习”A
C#.NET log4net 详解 c#.net
简介log4net是.NET平台上非常成熟的日志组件，源自Java世界的log4j。它功能丰富、性能高、配置灵活，是企业应用中常见的日志框架之一。核心特点支持多种输出目标（Appender）：文件、数据库、控制台、远程服务等支持多种格式化（Layout）支持按级别（Level）记录日志支持日志分类（Logger分组、命名空间隔离）配置灵活，可通过XML文件配置，也可通过代码配置支持异步日志、按文件
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
传统乐器的音域革新：多管设计与超孔结构的探索 109702008 杂谈人工智能
——从陶笛到葫芦丝的扩展艺术一、多管陶笛：音域突破的经典方案1.结构分类与音域特性多管陶笛通过增加独立音管扩展音域，分为双管、三管、四管三种主流类型：双管陶笛（1主管+1附管）：音域≥2个八度，吹奏高音需切换附管，适合进阶曲目。三管陶笛（1主管+2附管）：音域近3个八度（如AC三管覆盖G4-E7），可驾驭古典与流行乐。四管陶笛（1主管+3附管）：音域近4个八度（BC四管达C3-C7），属顶级专业配
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD 哪吒搬砖工逆袭Java架构师华为od 算法华为OD机试 2025B卷 java
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、正则表达式第6天、深度优先搜索dfs第7天、深度优先搜索dfs六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605
2025B卷 - 华为OD机试七日集训第4期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od 算法 python 华为OD机试 2025B卷
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第4期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、贪心算法第5天、二分查找第6天、字符串处理第7天、字符串处理六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、ClaudeSon
2025B卷 - 华为OD机试七日集训第2期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第2期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、数组第3天、双指针第4天、贪心算法第5天、字符串处理第6天、深度优先搜索DFS第7天、动态规划六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、ClaudeSo
浏览器渲染引擎和JS引擎分类
渲染引擎：Firefox：Gecko引擎Safari：WebKit引擎Chrome：Blink引擎IE:Trident引擎Edge:EdgeHTML引擎JS引擎：SpiderMonkey(Firefox)，火狐Nitro/JavaScriptCore(Safari)，苹果IOS浏览器V8(Chrome,Chromium)，Node.js也是V8Chakra(MicrosoftInternetExp
如何使用Python控制笔记本电脑屏幕亮度？很酷的站长编程笔记电脑 python 开发语言
Python已成为世界上最受欢迎的编程语言之一，这要归功于它的简单性、多功能性和广泛的应用程序。凭借其广泛的库和框架，Python可用于从Web开发到机器学习以及介于两者之间的任何内容。在Python中，最流行的数据分析和操作库之一是Pandas，它提供了处理表格数据的强大工具。在本教程中，我们将使用Python和屏幕亮度控制库来探索如何控制笔记本电脑屏幕亮度。我们将向您展示如何使用Python通
10、量子神经网络：从理论到实践安检量子神经网络 PennyLane Qiskit
量子神经网络：从理论到实践1.量子神经网络简介量子神经网络（QuantumNeuralNetworks,QNNs）是量子计算与经典机器学习相
linux设置ipsan_linux 配置IPSAN存储王向庄 linux设置ipsan
一SAN存储1.1SAN存储介绍存储区域网络(StorageAreaNetwork，简称SAN)采用网状通道(FibreChannel，简称FC，区别与FiberChannel光纤通道)技术，通过FC交换机连接存储阵列和服务器主机，建立专用于数据存储的区域网络。1.2SAN存储分类常见的分类是FC-SAN和IP-SAN两种。FC-SAN通过光纤通道协议转发scsi协议；IP-SAN通过TCP协议转
AI产品经理技术篇：从传统AI到生成式AI，解密大模型的核心概念让我看看好学吗人工智能产品经理学习深度学习自然语言处理
在人工智能技术飞速发展的今天，AI产品经理不仅需要理解业务逻辑，还需深入技术底层，把握从传统AI到生成式AI的演进脉络。传统AI以分类、预测和规则驱动为核心，而生成式AI则颠覆了这一范式，通过大模型实现内容创作、对话生成等创造性任务。这种转变背后，是参数规模、模型架构和训练方式的根本性革新。作为AI产品经理，理解大模型的核心概念至关重要。从“参数”的意义到“Token”的向量化，从Transfor
深度学习之迁移学习路溪非溪人工智能迁移学习机器学习
认识迁移学习迁移学习（TransferLearning）是机器学习中的一种重要技术，其核心思想是将在一个任务上学习到的知识（模型参数、特征表示等），迁移应用到另一个相关但不同的任务中，从而提升新任务的学习效率和性能，尤其是在新任务数据有限的情况下。一、迁移学习的核心动机传统机器学习通常要求为每个新任务收集大量标注数据并从头训练模型，但现实中面临以下挑战：数据稀缺：例如医疗影像分析（罕见疾病样本少）
【机器学习】解密计算机视觉：CNN、目标检测与图像识别核心技术（第25天）吴师兄大模型 0基础实现机器学习入门到精通机器学习计算机视觉 cnn 人工智能目标检测图像识别 pytorch
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
C语言基础-数据类型知柠 c语言
定义数据类型其实就是固定大小内存的别名，并且描述了一个变量存放什么类型的数据。简单来说，就是组织和操作数据。数据：计算机要处理的数据（数字、字符串、文字、符号、图片、音视频等）数据类型不仅帮助我们组织和操作数据，还决定了程序如何有效的利用内存。了解数据类型的内存需求是理解计算机管理和操作数据的关键。小贴士：程序运行需要在内存中数据类型分类和计算方法数据类型分类基本类型（C语言内置）数值类型整型（整
python transformers库笔记（BertForTokenClassification类）夏末蝉未鸣01 自然语言处理 python transformer 自然语言处理
BertForTokenClassification类BertForTokenclassification类是HuggingFacetransformers库中专门为基于BERT的序列标注任务（如命名实体识别NER、词性标注POS）设计的模型类。它在BERT的基础上添加了一个线性分类层，用于对每个token进行分类。1、特点任务类型：专为Token-level分类设计，即对输入序列中的每一个tok
支持向量机（SVM）在病理切片图像分类（癌细胞检测，Camelyon16/17、TCGA）中的应用与实现猿享天开支持向量机分类算法机器学习人工智能
支持向量机（SVM）在病理切片图像分类（癌细胞检测，Camelyon16/17、TCGA）中的应用与实现病理切片图像分类是医学影像分析的重要领域，特别是在癌细胞检测中，SVM因其对高维数据和小样本场景的优异性能，成为一种经典且有效的分类方法。本文将深入探讨SVM在Camelyon16/17和TCGA数据集上的应用，全面覆盖概念与原理、应用场景、及挑战与应对策略，欢迎感兴趣的阅读。[文中示例代码仅供
math向上取整函数_Axure函数使用手册 weixin_39654058 math向上取整函数 pb截取字符串函数使用函数求余弦函数的近似值实验5-9 使用函数输出水仙花数
本文是介绍了Axure函数，以及它的相关的基本用法，建议大家收藏查看~一、函数使用方法Axure函数使用的基本语法是：用”[[]]”双方括号(即英文双中括号)包含，变量值和函数用英文句号(即点”.”)连接。例如：[[LVAR.Width]]表示变量LVAR的宽度[[This.Width]]当前元件的宽度二、函数分类根据Axure函数的应用范围，可划分为以下10类：元件函数、页面函数、窗口函数、鼠标
力扣-75.颜色分类 এ᭄画画的北北 java二刷力扣hot100 leetcode 算法
题目链接75.颜色分类classSolution{publicvoidsortColors(int[]nums){intp0=0;intp2=nums.length-1;intp=0;//注意循环结束的条件while(p<=p2){if(nums[p]==2){swap(nums,p,p2);p2--;}elseif(nums[p]==1){p++;}else{swap(nums,p,p0);p+
我的项目管理之路-项目群（集）管理 ocean1010 项目管理
1.引言上一篇《我的项目管理之路-PMO》分享了PMO的相关经历和经验，本篇文章将对项目群管理的一些经历进行回顾和总结。首先，我们来看一下都有哪些类型的项目群。2.项目群类型**按目标导向分类，**这种分类强调项目群的战略目标一致性，是实践中应用最广泛的分类方式。类型核心目标特点典型案例面向战略型实现组织长期战略（如数字化转型）项目间可能无直接业务关联，但共同服务于战略目标；资源动态调配企业IT架
英伟达终为 CUDA 添加原生 Python 支持，他有什么目的？朱卫军 AI python 开发语言
CUDA原来只支持C/C++/Fortran，在2025的CES上宣布支持原生Python其实是不得已而为之，一方面现在Python的AI开发者数量过于庞大，达到数千万级别，而CUDA仅几百万，CUDA想扩大自己的用户圈子，只能拉Python入伙。另一方面，Python生态的计算库实在太强大，比如numpy，几乎垄断了数组计算，还有像scipy、keras等，已经成为机器学习的主流工具，CUDA必
Bongo-Cat-Crew:用Python打造动态音乐猫元楼
本文还有配套的精品资源，点击获取简介：在这个项目中，我们创建了一个将音乐、游戏和编程结合的创新体验，允许玩家通过动态猫声分类与节奏游戏OSU!互动。Python的使用使得音乐节奏识别、猫声分类逻辑和游戏接口交互成为可能。项目的核心包含了音乐节奏分析、游戏模式识别和猫声动画实现等技术要点，旨在为玩家提供独特的交互乐趣。1.Python在项目中的应用和角色1.1Python在IT行业中的普及Pytho
基于小样本的高光谱图像分类任务：CMFSL方法及Python实现 pk_xz123456 仿真模型算法深度学习分类 python 人工智能深度学习机器学习
基于小样本的高光谱图像分类任务：CMFSL方法及Python实现1.引言高光谱图像分类是遥感图像处理领域的重要研究方向，它在农业监测、环境评估、军事侦察等领域有着广泛的应用。与传统RGB图像不同，高光谱图像包含数百个连续的光谱波段，能够提供丰富的光谱信息。然而，高光谱图像分类面临着维度灾难、样本获取困难等挑战，特别是在小样本条件下，传统分类方法往往表现不佳。针对这一问题，本文介绍一种基于小样本的高
Python爬虫实战：爬取网易云音乐热评的完整教程 Python爬虫项目 python 爬虫开发语言能源 selenium
1.背景介绍：为什么爬网易云音乐热评？网易云音乐是中国最受欢迎的音乐平台之一，其用户活跃度极高。评论区往往蕴含丰富的情感表达和用户反馈，是音乐数据分析、情感分析、推荐算法等领域的宝贵数据源。爬取热评可以用于：歌曲口碑分析用户情绪挖掘热门歌曲趋势追踪机器学习训练数据准备但网易云音乐对评论接口进行了加密，直接请求很难成功。本文将帮你攻克这一难点。2.网易云音乐热评接口分析我们首先用浏览器开发者工具（C
前端常见 HTTP 状态码鸡吃丸子前端 http 网络协议
作为前端开发者，与后端API交互时，HTTP状态码是判断请求成败的关键信号。理解常见状态码的含义、责任归属及应对策略，能极大提升调试效率和团队协作。以下是关键状态码的详细解析：首先说一下如何查看状态码：如上图项目运行之后，打开浏览器开发者工具（F12），查看Network面板查看状态码一、常见状态码分类状态码含义主要责任方常见触发场景200OK后端请求成功，返回预期数据304NotModified
你真的懂文件吗？从磁盘、设备到文本与二进制的深度解析
资料合集下载链接：https://pan.quark.cn/s/472bbdfcd014在日常的电脑使用中，我们每天都在和“文件”打交道：Word文档、MP3音乐、照片、应用程序……我们创建、保存、打开、删除它们。但你是否曾停下来想过，这些我们习以为常的文件，在计算机的底层究竟是什么样的存在？今天，让我们跟随课堂的脚步，一起深入探索文件的本质，从宏观的分类到微观的存储，彻底搞懂计算机世界的基石——
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户