muxuehan0

基于python的kaggle练习(一)-共享单车数据分析

前沿

提供两年的每小时租金数据。训练集是每个月的前19天，而测试集是每月的20号到月底。必须仅使用租借期之前的可用信息来预测测试集涵盖的每个小时内租用的自行车总数。

一、载入数据

1.1收集数据

一般而言，数据由甲方提供。若甲方不提供数据，则需要根据相关问题从网络爬取，或者以问卷调查形式收集。本次共享单车数据分析项目数据源于Kaggle(https://www.kaggle.com/c/bike-sharing-demand/data)。

1.2 载入数据

// 载入工具包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split,GridSearchCV
from sklearn.metrics import r2_score
%matplotlib inline
// 载入数据
train=pd.read_csv('/python/bike-sharingdemand/train.csv')
test=pd.read_csv('/python/bike-sharing-demand/test.csv')
//查看数据前5行
train.head()
//查看数据基本信息
train.info()
test.info()

训练数据共有12列，10886样本，并且数据无缺失；测试数据共有9列，6493样本。测试数据相对于训练数据，缺少casual（未注册用户租车数量）、registered（注册用户租车数量）、count（总租车数量）三列，这需要通过最终的模型预测得出。

特征说明

datetime：时间。年月日小时格式
season：季节。1：春天；2：夏天；3：秋天；4：冬天
holiday：是否节假日。0：否；1：是
workingday：是否工作日。0：否；1：是
weather：天气。1：晴天；2：阴天；3：小鱼或小雪；4：恶劣天气
temp：实际温度
atemp：体感温度
humidity：湿度
windspeed：风速
casual：未注册用户租车数量
registered：注册用户租车数量
count：总租车数量

二、数据预处理

2.1数据缺失值处理

//查看数据基本信息
train.info()
test.info()

数据没有缺失值，因此不需要进行缺失值的处理

2.2 数据异常值处理

//数据描述
train.describe()

可以发现最终需要预测的租赁量（count）的标准差很大。通过画图看下分布：

plt.rcParams['font.family'] = ['Arial Unicode MS']    #mac和windows有区别，本次使用的是mac
plt.rcParams['axes.unicode_minus']=False    #可以显示负数
plt.figure(figsize=(10,10))
plt.hist(train['count'],bins=20)
plt.title('租赁量分布趋势')
plt.xlabel('租赁量（count）')

整体的分布倾斜比较严重，需要处理一下，以便于最后不会过拟合。
处理方法：将3个标准差以外的数据排除，然后对count做log变换，并查看变换后的分布。

#排除3个标准差以外的数据
train=train[np.abs(train['count']-train['count'].mean())<=3*train['count'].std()]
fig=plt.figure()
plt.subplot(1,1,1)
sns.distplot(train['count'])
plt.title('移除异常点后的租赁量分布')
plt.xlabel('租赁量（count）')

#对数变换
y=train['count'].values
y_log=np.log(y)
sns.distplot(y_log)
plt.title('log变换后的count分布')
plt.savefig('log.png')

我们可以看到：对数变换后的数据，图形的倾斜没有那么严重，差异也变小了。

2.3数据清洗

由于日期时间特征由年、月、日和具体小时组成，还可以根据日期计算其星期，因此我们可以将日期时间拆分成年、月、日、时和星期5个特征。

# 为了方便整体处理，现将测试集和训练集合并
combined=train.append(test)
combined['year']=combined.datetime.apply(lambdax:x.split()[0].split('-')[0]).astype('int')
combined['month']=combined.datetime.apply(lambda x:x.split()[0].split('-')[1]).astype('int')
combined['date']=combined.datetime.apply(lambda x:x.split()[0])
combined['hour']=combined.datetime.apply(lambda x:x.split()[1].split(':')[0]).astype('int')
combined['weekday']=combined.date.apply( lambda x : datetime.strptime(x,'%Y-%m-%d').isoweekday())

3、相关性分析和特征值选取

3.1可视化分析

从时间特征分析

#每个特征对租借量的影响
 fig,axes=plt.subplots(2,2)
fig.set_size_inches(12,10)
#(1) 时间维度——年份
sns.boxplot(train['year'],train['count'],ax=axes[0,0])
#(2) 时间维度——月份
sns.pointplot(train['month'],train['count'],ax=axes[0,1])
#(3) 时间维度——季节
sns.boxplot(train['season'],train['count'],ax=axes[1,0])
#(4) 时间维度——时间（小时）
sns.pointplot(train['hour'],train['count'],ax=axes[1,1])
axes[0,0].set(xlabel='year',title='年份对租赁的影响')
axes[0,1].set(xlabel='month',title='月份对租赁的影响')
axes[1,0].set(xlabel='season',title='季节对租赁的影响')
axes[1,1].set(xlabel='hour',title='时间对租赁的影响')

"年份对租赁量的影响"图：2012年的租赁量比2011年的高，说明随着时间的推移，共享单车逐渐被更多的人接受，使用人数也越来越多。
“月份对租赁量的影响图”：月份对租赁量的影响显著，从1月份开始使用人数逐渐增多，到6月份达到顶峰，随后到10月份急剧下降，这明显和季节有关。
“季节对租赁量的影响图”：夏季和秋季骑车人数较多，并在秋季（天气适宜时）达到顶峰。但由于季节和月份的影响基本重合，且月份更加详细，因此建立模型时选取月份特征，去掉季节特征。
“时间对租赁量的影响图”：通过图形发现，每天有2个高峰期，分别是早上8点左右和下午17点左右，正好是工作日的上下班高峰。因此可以联想到节假日和星期对租赁量的影响。

fig, axes = plt.subplots(2,1,figsize=(16, 10))
sns.pointplot(train['hour'],train['count'],hue=train['workingday'],ax=plt.subplot(2,1,1))
sns.pointplot(train['hour'],train['count'],hue=train['holiday'],ax=plt.subplot(2,1,2))

可以看出，工作日早晚上班高峰期租借量高，其余时间租借量低；节假日中午及午后租借量较高。符合人们的的出行用车规律。

从天气特征分析

# 天气的影响
sns.boxplot(train['weather'],train['count'])

#温度、湿度、风速的影响
sns.pairplot(train[['temp', 'atemp', 'humidity', 'windspeed', 'count']])

作出多个连续变量之间的相关图时，可以比较任意两个变量之间的相关关系。图中temp和atemp的形状大体相似，因此可以在后续建模中用temp，删除掉atemp。

3.2计算相关系数

#1、计算相关系数，并快速查看
corr_df = train.corr()
influence_order = corr_df['count'].sort_values(ascending=False)
influence_order_abs = abs(corr_df['count']).sort_values(ascending=False)
print(influence_order)
print(influence_order_abs)

从相关系数可以看出，天气（包括温度、湿度）对租借数存在明显影响，其中temp和atemp的意义及其与count的相关系数十分接近，因此可以只取atemp作为温度特征。此外，year、month、season等时间因素对count也存在明显影响，而holiday和weekday与count的相关系数极小。

3.3画相关系数的热力图

为了更加直观地展现所有特征之间的影响，作相关系数热力图：

corr_df1=abs(corr_df)
fig=plt.gcf()
fig.set_size_inches(30,12)
sns.heatmap(data=corr_df1,square=True,annot=True,cbar=True)

热力图中颜色越浅，相关性越高，有一些是负相关取了绝对值。

3.4 选择特征

通过各项分析后我们在这里将时段（hour）、温度（temp）、湿度（humidity）、年份（year）、月份（month）、季节（season）、天气等级（weather）、风速（windspeed）、星期几（weekday）、是否工作日（workingday）、是否假日（holiday），作为特征值。

四、构建模型

4.1、测试集和训练集

由于年份（year）、月份（month）、季节（season）、天气等级（weather）多类别型数据，我们使用one-hot转化成多个二分型类别。

month_one_hot = pd.get_dummies(combined['month'], prefix='month')
year_one_hot = pd.get_dummies(combined['year'], prefix='year')
season_one_hot = pd.get_dummies(combined['season'], prefix='season')
weather_one_hot = pd.get_dummies(combined['weather'], prefix='weather')
combined_one_hot = pd.concat([combined,month_one_hot,year_one_hot,season_one_hot,weather_one_hot],axis=1)

分开训练集和测试集

train_df = combined_one_hot.loc[combined['count'].isnull() == False]
test_df = combined_one_hot.loc[combined['count'].isnull() == True]
datetime_col = test_df['datetime']
ylables = train_df['count']
# 对数变换
y_log= np.log(ylables)

删除不需要的特征值

drop_columns = ['casual','count','datetime','registered','date','atemp','month','year','season','weather']
train_df = train_df.drop(drop_columns,axis=1)
test_df = test_df.drop(drop_columns,axis=1)

4.2 交叉验证法确定最优参数

因为交叉验证的过程会有点久，因此涉及的参数比较简单。

# 训练集转换为训练数据和验证数据
x_train,x_test,y_train,y_test=train_test_split(train_df,y_log,test_size=0.2)
print(x_train.shape)
print(x_test.shape)
# 随机森林的超参数：决策树的数量、每个树的深度、
rf = RandomForestClassifier()
# 网格搜素与交叉验证
param = {"n_estimators":[100,200],"max_depth":[5,8,10]}
gc = GridSearchCV(rf,param_grid=param,cv=5)
gc.fit(x_train,y_train.astype('int'))
print("查看选择的参数模型：",gc.best_params_)

将最优参数应用到模型中

rf_true = RandomForestClassifier(n_estimators=200,max_depth=10,random_state=10,min_samples_split=10)
rf_true.fit(x_train,y_train.astype('int'))
predict_final = rf_true.predict(x_test)
print("测试集上的准确率:",rf_true.score(x_test,y_test.astype('int')))
print("测试集上的召回率:",r2_score(y_test,predict_final))

测试集上的准确率: 0.6219739292364991
测试集上的召回率: 0.6982082945228215

模型准确率比较低，应该继续调整参数进行验证，选择最优参数。。。。。。

产生预测结果

datas = np.exp(rf_true.predict(test_df))
final=pd.DataFrame({'datetime':datetime_col,'count':datas})
final.to_csv('./result-final.csv')

你可能感兴趣的:(基于python的kaggle练习(一)-共享单车数据分析)

Redis存储Cookie实现爬虫保持登录 requests | selenium
前言前面已经介绍了requests和selenium这两种方式的基础知识和模拟登录,但是我们需要每次都进行登录,这明显是很麻烦并且不合理的,所以这次我分享一下怎么可以让我们的程序进行一次登录之后,和普通浏览器一样下次不进行登录直接进行对网站数据的爬取下面的我分享的内容需要前置知识,如果同志有知识不理解,可以查看我以前写的文章Python爬虫request三方库实战-CSDN博客Python爬虫XP
在Linux环境下从0私有化部署Dify
在Linux环境下从0搭建Dify准备工作系统环境私有化部署下载Dify代码ZIP包启动Dify启动Docker容器访问Dify本地环境服务器环境准备工作因工作需要私有化部署公司内部的知识库，研究了一下准备采用Dify+RAG的方式实现，以下是具体步骤。系统环境服务器配置：官方建议2核4G以上；Liunx版本：RockyLinuxrelease9.4；Docker版本：28.1.1；Dify版本：
从0到1打造创始人IP：创客匠人如何用内容构建商业护城河创客匠人老蒋创始人IP 创客匠人 IP变现大数据知识付费
创始人IP为何成为企业破局的关键引擎？在知识付费赛道竞争白热化的当下，创客匠人创始人老蒋以“IP新商业架构师”的身份，将个人IP与企业品牌深度绑定，走出了一条差异化路径。当传统企业还在纠结流量成本时，老蒋通过输出“成事心法”“商业认知”等干货内容，在公众号、短视频等平台积累精准用户，其“正确的事做长期”理念，正是创客匠人9年深耕行业的缩影。这种将创始人个人影响力转化为企业信任背书的模式，让创客匠人
QML与C++交互之创建自定义对象
在qml中，我们一般都是希望使用qml做界面展示，而数据处理转由c++处理；在此篇博客，将介绍如何在c++中给qml定义全局对象；在c++中如何定义对象给qml使用。1给qml定义全局对象正常我们定义了一个qml项目后，main函数是这样的：#include#include#includeintmain(intargc,char*argv[]){QCoreApplication::setAttri
MEMS定向短节相较于磁通门传感器的优势在哪里？ ericco123 MEMS 陀螺仪惯性技术制造科技
磁通门传感器得益于其的高精度和稳定性，在地质勘探、电流传感等静态磁场测量场合下被广泛应用。然而，磁通门传感器虽对静态磁场敏感，但在强交变磁场环境中极易受到干扰，从而影响数值精准度。此外，功耗高、响应慢等一系列问题也限制了应用场景。ER-Gyro-19完美解决了这些缺点带来的局限，具备与磁通门传感器兼容的电气接口与机械结构，实现原位替换，在一些磁通门传感器无法应用的场合，尤其是石油天然气测井领域也能
5V转4.2V 300mA可调输出LDO芯片AH5233详解 h13728697869 嵌入式硬件
1.芯片概述AH5233是一款超低压差（LDO）稳压芯片，具有宽输入电压范围（1.5V-5.5V）和可调输出电压（0.8V-5.0V），适用于便携式设备、IoT模块等低功耗场景。关键特性：✅输出电压可调：0.8V~5.0V（适用于锂电池供电4.2V）✅最大输出电流：400mA（300mA稳定工作）✅极低压差：100mV@100mA（提高电源效率）✅高精度：±1%（稳定可靠）✅超低静态电流：10μA
下载第三方库后手动配置到conda虚拟环境中
第一步，在网页或者github等平台下载开发者开发的第三方库，该库的文件格式可能是".whl"，“.tar.gz”，“.zip”等等；找到`anaconda/pkgs`文件夹地址，将上述第三方库移动到`pkgs`文件夹下；如果是.whl文件直接运行condaactivateyour_envpipinstall***.whl如果是压缩包，先解压缩，使用指令如`tar-xzvf`解压缩`.tar.gz
市场准入负面清单(2015-2018）
1980市场准入负面清单(2015-2018）数据简介就市场竞争环境而言，市场准入负面清单制度为代表的市场准入管制放松将通过明确被限制或禁止领域，同时对未限制的领域实行平等待遇，推动市场竞争的公平性。这种公平性有助于打破部分行业的垄断格局，使得市场竞争环境更加公正透明，降低企业市场势力，促进企业市场竞争动态均衡。市场准入负面清单制度作为一种政府管理经济活动的制度安排，符合有限政府干预理论的核心思想
行业锦标赛激励数据集（2008-2023）数据皮皮侠AI 人工智能大数据物联网矩阵动态规划
1771行业锦标赛激励数据集（2008-2023）数据简介坚持创新驱动发展，要强化企业创新主体地位，发挥企业家在技术创新中的重要作用。作为企业组织内部最具有影响力的角色，高级管理人员拥有企业经营管理的自由裁量权，对企业战略决策及由此产生的经营绩效具有举足轻重的影响。合理的薪酬契约安排是促进员工努力工作并提高企业绩效的重要手段。效率视角下的锦标赛理论主要关注企业内部薪酬差距的激励效应，但随着信息技术
Requestium - 将Requests和Selenium合并在一起的自动化测试工具测试界晓晓软件测试测试工具 selenium 自动化软件测试功能测试自动化测试程序人生
Requests是Python的第三方库，主要用于发送http请求，常用于接口自动化测试等。Selenium是一个用于Web应用程序的自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。本篇介绍一款将Requests和Selenium结合在一起的自动化测试工具-Requestium简介Requestium是一个Python库，它将Requests、Selenium和P
传统微商困境与开源链动2+1模式、AI智能名片及S2B2C商城小程序的转型破局说私域开源人工智能小程序
摘要：本文聚焦传统微商代理分级模式面临的库存积压、出货困难等“滚雪球”危机，深入剖析其根源。在此基础上，引入开源链动2+1模式、AI智能名片以及S2B2C商城小程序，探讨这些新兴元素如何助力品牌微商实现转型，突破传统困境，实现可持续发展。通过分析各元素的特点与优势，阐述它们在优化供应链、提升营销效率、增强客户关系管理等方面的协同作用，为微商行业的创新发展提供理论支持与实践参考。关键词：传统微商；开
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
深度解析：venv和conda如何解决依赖冲突难题咕咕日志 conda python
文章目录前言一、虚拟环境的核心价值1.1依赖冲突的典型场景1.2隔离机制实现原理二、venv与conda的架构对比2.1工具定位差异2.2性能基准测试（以创建环境+安装numpy为例）三、venv的配置与最佳实践3.1基础工作流3.2多版本Python管理四、conda的进阶应用4.1环境创建与通道配置4.2混合使用conda与pip的风险控制4.3跨平台环境导出五、工具选型决策树5.1场景化推荐
MyChrome.exe与Selenium联动避坑指南：User Data目录冲突解决方案龙潜月七 selenium 测试工具
在自动化测试与网络数据采集场景中，MyChrome.exe与Selenium的联动能发挥强大作用，但二者的UserData目录配置若处理不当，易引发冲突。下面我将重点围绕该问题，详细阐述联动的注意事项。MyChrome.exe与Selenium联动避坑指南：UserData目录冲突解决方案在自动化测试与网络数据采集的领域中，MyChrome.exe与Selenium的组合常常是开发者的得力助手。M
OneCode技术架构深度解析：自主UI体系、注解驱动与全栈开发的协同优势低代码老李 OneCode产品介绍 OneCode实战软件行业架构 ui
引言：低代码平台的技术基石在AIGC与数字化转型的双重驱动下，企业级低代码平台已从简单的界面搭建工具演进为全栈业务开发环境。OneCode作为国内领先的低代码开发平台，其核心竞争力源于三大技术支柱：自主可控的UI体系、注解驱动的开发模式和端到端的全栈支持能力。这三大支柱形成有机整体，使OneCode在开发效率、系统集成和业务适应性方面建立起显著优势。本文将深入剖析这些技术特性的实现原理与应用价值，
OneCode UI 核心组件体系分析：继承关系与功能详解
前言在低代码开发平台蓬勃发展的今天，UI组件体系作为连接可视化设计与代码实现的核心纽带，其架构设计直接决定了平台的灵活性、扩展性与开发效率。OneCode作为专注于企业级应用构建的低代码平台，摒弃了传统第三方UI库的集成模式，自主研发了一套完整的UI组件体系。这一体系不仅实现了组件的高度可定制化，更通过创新的继承机制与状态管理，构建了层次清晰、功能完备的组件生态。本文以OneCodeUI组件体系为
OneCode 通用组件开发配置指南低代码老李软件行业领域设计 DDD 数据可视化低代码
一、布局组件1.1xui.UI.Layout核心属性：columns:布局列数配置dock:停靠方向（left/right/top/bottom）width:宽度设置（支持百分比和像素值）height:高度设置（支持百分比和像素值）iniProp.sub:子布局组配置场景说明：用于构建应用程序的整体布局框架，支持多列划分和元素停靠，是页面结构的基础组件。代码示例：{id:'xui.UI.Layou
从源码到思想：OneCode框架模块化设计如何解决前端大型应用痛点低代码老李软件行业领域设计低代码前端框架架构
在前端大型应用开发中，“模块拆分混乱、依赖关系复杂、资源加载失控”是三大痛点。OneCode框架通过Module.js（模块基类）和ModuleFactory.js（模块工厂）构建了一套完整的模块化管理机制，不仅实现了模块的“生老病死”全生命周期管控，更解决了跨模块通信、依赖加载等核心问题。本文从“为什么这么设计”的角度，拆解其底层逻辑与实战价值。一、先理解：前端模块化的核心矛盾无论用什么框架，模
OneCode图表配置速查手册低代码老李软件行业领域设计低代码信息可视化数据分析数据挖掘
前言在数据可视化日益成为业务决策核心驱动力的今天，高效、灵活的图表配置系统已成为开发人员不可或缺的工具。OneCode图表组件凭借其丰富的图表类型与精细化的配置能力，为开发者提供了构建专业数据可视化界面的完整解决方案。然而，随着图表类型的不断扩展与配置项的日益丰富，如何快速定位并正确使用特定配置属性已成为提升开发效率的关键挑战。本配置字典博文旨在为开发者提供一份全面、系统的OneCode图表配置参
OneCode采用虚拟DOM结构实现服务端渲染的技术实践
一、技术背景与挑战随着企业级应用复杂度的提升，传统服务端渲染(SSR)面临页面交互性不足的问题，而纯前端SPA架构则存在首屏加载慢和SEO不友好的缺陷。OneCode框架创新性地将虚拟DOM技术引入服务端渲染流程，构建了一套兼顾性能与开发效率的企业级前端解决方案。二、虚拟DOM结构设计2.1组件树层次结构OneCode的虚拟DOM基于组件化思想构建，每个组件通过Component类实现，包含以下核
Vue 开发问题：Missing required prop: “value“ 我命由我12345 vue.js javascript 前端前端框架 ecmascript 开发语言 js
在Vue项目中，出现如下警告信息[Vuewarn]:Missingrequiredprop:"value"[Vue警告]：缺少必需属性："value"问题原因这个警告表明在组件中存在一个必需的属性value没有被提供，即父组件没有传递该属性给子组件处理策略确保在使用组件时，父组件正确传递了属性给子组件
前端开发问题：SyntaxError: “undefined“ is not valid JSON 我命由我12345 前端 -问题清单 json 前端 javascript vue.js 开发语言 ecmascript js
在JavaScript开发，遇到如下问题SyntaxError:"undefined"isnotvalidJSON#翻译SyntaxError："undefined"不是有效的JSON问题原因当使用JSON.parse()时，传入了一个undefined或字符串"undefined"，而它不是有效的JSON字符串问题复现传入一个undefinedconstjsonStr=undefined;con
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
基于Flask+Jinja2的快捷教务系统(后端链接到新版正方教务系统) cnn-jxx flask python 后端
快捷教务系统（EasyEducationalAdministrationManagementSystem,EasyEAMS）项目简介EasyEAMS是一个基于Flask+Jinja2的现代化教务系统Web应用。学生可通过网页端登录，在线查询个人信息、成绩、课表、学业生涯、通知、选课等。系统界面美观，交互友好，适合高校学生自助使用和二次开发。本项目的api.py文件内容参考并引用了Github上op
sentinel 微服务流量治理工具，使用初步 RR1335 微服务 Gateway #Spring sentinel 微服务架构
官网入口introduction|Sentinel这是阿里巴巴的服务，中文支持很好maven配置入口https://mvnrepository.com/artifact/com.alibaba.csp/sentinel-corecom.alibaba.cspsentinel-core1.8.6sentinel控制台需要引入的依赖com.alibaba.cspsentinel-transport-s
嵌入式Linux内核镜像生成过程飘逸轻舞 linux arm开发运维嵌入式
嵌入式Linux内核镜像生成过程嵌入式Linux系统的核心组件是内核，它是操作系统的核心部分，负责管理硬件资源、提供系统调用接口以及驱动设备等功能。在嵌入式系统中，将内核编译成镜像文件是部署系统的关键步骤之一。本文将介绍嵌入式Linux的内核镜像生成过程，并提供相应的源代码示例。获取Linux内核源代码首先，我们需要获取Linux内核的源代码。可以从Linux官方网站（www.kernel.org
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
Vue.js前端开发实战-----常用UI组件
1.进入命令行界面，执行yarncreatevite命令，输入项目名称，选择Vue框架，选择JavaScript，完成vue项目创建。2.在完成创建之后在其目录下通过yarn安装ElementPius，具体命令如下：[email protected].在VSCode中创建一个新的vue文件，文件名称命名分别为MyInfo.vue，RoommateDetail.vue
OneCode 图表组件核心优势解析
一、全方位的可视化能力OneCode图表组件提供了15+种专业图表类型，覆盖从基础到高级的数据可视化需求：基础图表：柱状图、折线图、饼图、面积图等高级图表：金字塔图、雷达图、仪表盘、LED图表等实时图表：实时折线图、实时柱状图、实时堆叠图等特殊图表：圆柱图、温度计图、角度仪表、水平线性仪表等这种丰富的图表类型支持，使得OneCode能够满足不同行业、不同场景下的数据可视化需求，从简单的数据展示到复
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他