生鱼同学

【数据分析实战】基于python对酒店预订需求进行分析

文章目录

引言
数据加载以及基本观察
- 缺失值观察及处理
- - 缺失值观察以及可视化
  - 缺失值处理
用户数据探索
- 什么时间预定酒店将会更经济实惠？
- 哪个月份的酒店预订是最繁忙的？
商家数据探索
- 按市场细分的不同预定情况是怎样的？
- 什么样的人更容易取消预订？
- - 数据编码
  - 特征筛选
  - 构建模型并预测
  - 根据特征重要性得出结论
总结

引言

‍♂️作者简介：生鱼同学，大数据科学与技术专业硕士在读‍，曾获得华为杯数学建模国家二等奖，MathorCup 数学建模竞赛国家二等奖，亚太数学建模国家二等奖。

✍️研究方向：复杂网络科学

兴趣方向：利用python进行数据分析与机器学习，数学建模竞赛经验交流，网络爬虫等。

在有预定酒店的需求时，你是否考虑过以下的问题：

你是否曾想过每年什么时候是预订酒店房间的最佳时间？
为了获得最佳的每日价格，最佳的逗留时间？
如果你想预测一家酒店是否有可能收到过多的特殊要求呢？

在本文中我们就对Kaggle平台上的酒店需求数据集进行分析，这个数据集包含了一家城市酒店和一家度假酒店的预订信息，并包括诸如预订时间、逗留时间、成人、儿童和/或婴儿的数量，以及可用的停车位数量等信息。话不多说，我们开始吧。

本项目中的数据来源于Kaggle开放数据Hotel booking demand链接如下：
Hotel booking demand
需要的小伙伴可以自行下载获取。

数据加载以及基本观察

在进行数据加载之前，我们首先对数据的各个列进行解释，具体情况如下表所示：

列名	表达含义
hotel	酒店（H1=度假酒店或H2=城市酒店）
is_canceled	表示预订是否被取消（1）或不被取消（0）的值。
lead_time	从预订进入PMS的日期到抵达日期之间的天数。
arrival_date_year	到达日期的年份
arrival_date_month	到达日期的月份
arrival_date_week_number	抵达日期的年份的周数
arrival_date_day_of_month	抵达日期当天
stays_in_weekend_nights	客人入住或预订入住酒店的周末晚数（周六或周日）。
stays_in_week_nights	客人入住或预订入住酒店的周夜数（周一至周五）。
adults	成人的数目
children	小孩的数目
babies	婴儿的数目
meal	预订的膳食类型。类别以标准接待餐包的形式呈现：未定义/SC–无餐包；BB–床和早餐；HB–半餐（早餐和另外一餐–通常是晚餐）；FB–全餐（早餐、午餐和晚餐）。
country	国家。类别以ISO 3155-3:2013的格式表示
market_segment	市场细分的指定。在类别中，"TA "指 “旅行社”，"TO "指 “旅游经营者”。
distribution_channel	预订分销渠道。术语 "TA "指 “旅行社”，"TO "指 “旅游经营者”
is_repeated_guest	表示该预订名称是否来自重复的客人（1）或不（0）的值。
previous_cancellations	在当前预订之前被客户取消的先前预订的数量
previous_bookings_not_canceled	在本次预订之前，客户没有取消的先前预订的数量
reserved_room_type	保留的房间类型的代码。出于匿名的原因，用代码代替名称。
assigned_room_type	为预订分配的房间类型的代码。有时，由于酒店运营的原因（如超额预订）或客户要求，分配的房间类型与预订的房间类型不同。出于匿名的原因，用代码代替指定。
booking_changes	从预订被输入PMS到入住或取消的那一刻起，对预订进行更改/修正的次数
deposit_type	指明客户是否支付了押金以保证预订。这个变量可以有三个类别：无押金–没有押金；不退款–押金的价值相当于总住宿费用；可退款–押金的价值低于总住宿费用。
agent	进行预订的旅行社的ID
company	进行预订或负责支付预订的公司/实体的ID。出于匿名的原因，将出示身份证而不是指定的身份。
days_in_waiting_list	预订在确认给客户之前在等待名单中的天数
customer_type	预订的类型，假设是四类之一：合同–当预订有一个分配或其他类型的合同与之相关时；团体–当预订与一个团体相关时；暂住–当预订不是团体或合同的一部分，并且没有与其他暂住预订相关时；暂住方–当预订是暂住的，但至少与其他暂住预订相关时
adr	日均房价的定义是用所有住宿交易的总和除以总的住宿夜数。
required_car_parking_spaces	预客户需要的车位数量
total_of_special_requests	客户提出的特殊要求的数量（如双床或高楼层）。
reservation_status	预订的最后状态，假设是三类中的一类：取消–预订被客户取消；退房–客户已入住但已离开；未入住–客户未入住但已通知酒店原因
reservation_status_date	最后一次设置状态的日期。这个变量可以和ReservationStatus一起使用，以了解预订何时被取消或客户何时退房。

可以看到，数据所给出的特征还是比较多的。接下来我们就基于上述数据来解决一些商业角度可能关心的问题，本文解决的问题如下：

首先是从用户的角度来看关心的问题：

什么时间预定酒店将会更经济实惠？
哪个月份的酒店预订是最繁忙的？

其次是商家更容易关心的问题：

客人来自哪里？
按市场细分的不同预定情况是怎样的？
对酒店提出特殊要求的人有什么共同点？
什么样的人更容易取消预订？

首先我们调用**info()**函数来对数据进行初步的观察。代码和结果如下：

我们可以看到，公司这列有明显的缺失情况。与此同时，在这里我们也能了解到不同的数据类型。

缺失值观察及处理

缺失值观察以及可视化

首先提取所有缺失的列以及它们缺失的个数情况，代码如下：

data_missing = data.isnull().sum()
data_missing = data_missing[data_missing > 0]
data_missing

结果如下：

接下来，我们对数据的缺失值进行一些简单的柱状图可视化。代码如下：

data_missing.plot.bar()

缺失值处理

我们首先来看一下缺失值的实际意义代表情况，如下：

列名	表达含义
children	小孩的个数
country	国家。类别以ISO 3155-3:2013的格式表示
agent	进行预订的旅行社的ID
company	进行预订或负责支付预订的公司/实体的ID。出于匿名的原因，将出示身份证而不是指定的身份。

基于上述特征的实际意义，我们对其进行如下的处理：

children ：缺失数据相对较少，我们选择删除携带孩子缺失的数据行。
country：因为后续我们可能会用到该数据，所以设置为‘Unknown’。
agent：预定的ID在本次数据分析中，不太重要，删除该特征。
company：公司的数据在本次数据中，不太重要，而且确实程度过大，直接删除。

用户数据探索

在进行了用户数据的基础探索后，接下来就开始对其进行一些分析工作。

什么时间预定酒店将会更经济实惠？

作为游客或者用户，我们较为关注的通常是酒店是否经济实惠。在下面的工作中，我们首先提取没有取消的那些订单作为我们分析的数据，然后对其进行一些处理最后进行可视化，代码如下：

import seaborn as sns
# 提取没有取消订单的数据
data_no_canceled = data[data['is_canceled']==0]
# 算出人均价格
data_no_canceled['adr_deal'] = data_no_canceled['adr']/ (data_no_canceled['adults'] + data_no_canceled['children'])
# 对结果进行可视化
ax = sns.lineplot(data=data_no_canceled, x = 'arrival_date_month',y='adr_deal',hue='hotel')
# 设置图片尺寸
ax.figure.set_size_inches(12,6)

结果如下：

在图中我们可以发现，在七月Resort Hotel价格最高，而在其他时间City Hote的价格会稍高一些。另外，在十一月以及十二月两种酒店的价格是全年最低的，也就是最经济实惠的。

另外，我还探究了不同房型的价格分布情况，代码如下：

# 提取数据并进行排序
roomtype = data_no_canceled[["hotel", "reserved_room_type", "adr_deal"]].sort_values("reserved_room_type")
# 绘制箱线图
ax_box = sns.boxplot(data = roomtype, x = 'reserved_room_type',y='adr_deal',hue='hotel')
ax_box.figure.set_size_inches(12,6)

结果如下：

可以看到，在图中City Hotel的E房型价格偏高，而Resort Hotel的F房型价格偏高。

哪个月份的酒店预订是最繁忙的？

基于上述的分析，我们进一步探索哪个月份的酒店预订是最繁忙的，代码如下：

# 提取用户们到达的日期，并对其进行排序可视化
data_no_canceled['arrival_date_month'].value_counts().sort_values(ascending=False).plot.bar()

结果如下：

在图中可以看到，5，7，8月是最繁忙的时间，而秋冬季节的酒店人数相对来说较少。

商家数据探索

作为商家，较为关心的问题即用户的组成，以便更好的提供服务。另外，做为商家了解不同用户的订购渠道对于进一步的进行市场营销将会有积极的作用。

按市场细分的不同预定情况是怎样的？

我们首先基于数据来探索预订酒店的不同国家的人数占比，并进行可视化，代码如下：

import plotly.express as px
# 计算不同国家的百分比
country_data = pd.DataFrame(data['country'].value_counts())
country_data.columns = ['guest_num']
country_data['guest_persent'] = round(country_data['guest_num'] / country_data['guest_num'].sum() * 100,2)

# 对小于一定比例的国家归类
country_data.loc['OTHER','guest_num'] = country_data[country_data['guest_persent'] < 2]['guest_num'].sum()
country_data.loc['OTHER','guest_persent'] = round(country_data.loc['OTHER','guest_num'] / country_data['guest_num'].sum(),2)
# 可视化
country_data.drop(country_data[country_data['guest_persent'] < 0.5].index, inplace=True)
fig = px.pie(country_data,values = 'guest_persent',names = country_data.index)
fig.update_traces(textposition="inside", textinfo="value+percent+label")

结果如下：

进一步的，我们对不同预订酒店的渠道进行了统计，代码如下：

data_no_canceled['market_segment'].value_counts().plot.bar()

结果如下：

从图中可以看到，预订的主力军都是旅行社居多。另外，在线预定远比线下预订的数目要多很多。针对商家，可以对线上的广告推荐等进一步的进行策划营销。

什么样的人更容易取消预订？

最后，我们希望了解什么样的人更容易取消预订。商家可以针对这部分用户进行服务优化，并进一步的改善酒店的经营模式。在这里，我们准备基于数据进行机器学习模型的构建。

数据编码

在这一步中，我们将对字符型的数据做编码处理，从而更好的适应不同模型，代码如下：

from sklearn import preprocessing
data_to_ml = data.copy()
# 因为我们预测的目标是是否取消了预订，所以删除这两列
data_to_ml.drop(['reservation_status','reservation_status_date'], axis=1, inplace=True)
# 对大部分特征进行编码处理
for col in ['hotel','arrival_date_month','meal','country','market_segment','distribution_channel','customer_type','deposit_type']:
    encoder = preprocessing.LabelEncoder()
    encoder.fit(data_to_ml[col])
    data_to_ml[f'{col}_labeled']  = encoder.transform(data_to_ml[col])
    data_to_ml.drop([col], axis=1, inplace=True)

在这里，我们有一个特殊的操作，即我们根据现有的特征提取了一个新的特征，即酒店预留的房间以及用户预定的是否是相同的。因为如果作为用户发现预定的房间和实际房间不同很可能会取消预订。具体代码如下：

import numpy as np
data_to_ml['is_reserved_assigned_equal'] = np.where(data_to_ml['reserved_room_type']==data_to_ml['assigned_room_type'],1,0)
data_to_ml.drop(['reserved_room_type','assigned_room_type'], axis=1, inplace=True)

特征筛选

在这一步中，我们对所有处理后的数据进行了皮尔逊相关分析并做了可视化，代码如下所示：

import matplotlib.pylab as plt
correlation = data_to_ml.corr('pearson')

f, ax = plt.subplots(figsize = (9, 9))
plt.title('Correlation of Numeric Features with',y=1,size=16)
sns.heatmap(correlation,square = True,  vmax=0.8)

结果如下：

可以看到，我们所挑选的特征自相关性不算太高可以接受。与此同时，其针对我们所选定的目标is_canceled来说相关性也是可以接受的，所以我们暂时不对其进行处理。

构建模型并预测

在这一部分中，我们构建了主流的模型并使用10折交叉认证对其进行验证，代码如下：


from sklearn import svm
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn import model_selection

x_all = data_to_ml.drop('is_canceled',axis=1)
y_all = data_to_ml['is_canceled']

# 为了避免训练时间过长，这里我选择了部分数据集
x_train = x_all.loc[:19999,:]
y_train = y_all[:20000]

model_svm = svm.SVC()
model_knn = KNeighborsClassifier()
model_rf = RandomForestClassifier()

model_dict = {
    'SVM':model_svm,
    'KNeighborsClassifier':model_knn,
    'RandomForestClassifier':model_rf
}
# 训练模型
for model in model_dict:
    model_dict[model].fit(x_train, y_train)
    scores = model_selection.cross_val_score(model_dict[model], X=x_train, y=y_train, verbose=1, cv = 10, scoring='f1')
    print(model, scores.mean())

>>>SVM 0.6480724503120129
>>>KNeighborsClassifier 0.6577070795293697
>>>RandomForestClassifier 0.7363861778481174

可以看到，随机森林的效果是可以接受的，接下来我们对其特征重要性进行可视化。

根据特征重要性得出结论

调用随机森林中自带的特征重要性函数，并对其进行了可视化，代码如下：

# 构建Series让特征重要性和特征名称一一对应
feature_importances_series = pd.Series(list(model_rf.feature_importances_), index = x_all.columns, )
# 对其进行排序
feature_importances_series =feature_importances_series.sort_values(ascending=False)
# 进行可视化
sns.barplot(x = feature_importances_series.values, y = feature_importances_series.index, orient='h')

结果如下：

如图所示，用户取消预订和逗留时长、用户国籍、到达年份都有很强的相关性。另外，我们提取的特征也是非常重要的，即用户预定的房间和实际的房间不同时，用户将会更容易取消预订。

总结

在本文中，我们基于python对酒店预订需求进行分析，并从多种角度对其展开了探索性的工作。这对于养成数据分析习惯有很大的帮助，在实际工作或者学习中还需要不断练习。

感兴趣的朋友们可以自己按照上述步骤进行操作，或在评论区与我讨论。

需要源码的朋友可以私信我进行索取，我们下次再见。

手把手教你使用 Python 制作贪吃蛇游戏｜Python游戏程序员CC_ Python教程 python 学python pygame python 开发语言
贪吃蛇游戏是有史以来最受欢迎的街机游戏之一。在这个游戏中，玩家的主要目标是在不撞墙或不撞墙的情况下抓住最大数量的水果。在学习Python或Pygame时，可以将创建蛇游戏视为一项挑战。这是每个新手程序员都应该接受的最好的初学者友好项目之一。学习构建视频游戏是一种有趣而有趣的学习。我们将使用Pygame来创建这个蛇游戏。Pygame是一个开源库，专为制作视频游戏而设计。它具有内置的图形和声音库。它也
Python Sqlite数据库与配置文件的加载、编辑和保存 2201_75335496 数据库 sqlite python json pyqt
一、Sqlite数据库SQLite，是一款轻型的数据库，是遵守ACID的关系型数据库管理系统，它包含在一个相对小的C库中。它是D.RichardHipp建立的公有领域项目。它的设计目标是嵌入式的，而且已经在很多嵌入式产品中使用了它，它占用资源非常的低，在嵌入式设备中，可能只需要几百K的内存就够了。它能够支持Windows/Linux/Unix等等主流的操作系统，同时能够跟很多程序语言相结合，比如T
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
【Python篇】深入机器学习核心：XGBoost 从入门到实战半截诗 Python python 机器学习深度学习分类回归数据分析 XGBoost
文章目录XGBoost完整学习指南：从零开始掌握梯度提升1.前言2.什么是XGBoost？2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优7.1常用超参数7.2网格搜索8.XGBoost特征重要性分析9.高级功能扩展9.1模型解释与可解释性9.2
python调用ollama库详解 2201_75335496 python 经验分享神经网络人工智能自然语言处理语言模型
0准备1）准备Ollama软件（注意：两个不是同一个东西）详见上次的文章Ollama通过gguf文件加载AI模型（补充：关于Ollama加载AI模型的补充）2）准备ollama库如果您还未安装ollama库，请使用pip安装：pipinstallollama#1ollama库的基本使用importollama#普通输出（请先按照准备工作中的要求安装模型）back=ollama.chat(model
pyinstaller 打包生成.exe 可执行文件报错 “IndexError: tuple index out of range” 静妍 Python Python pyqt gui Pyinstaller .exe
想把pyqt写的GUI程序打包成.exe文件，以便在Windows下运行，不想因为使用Python3.6，出现兼容问题：IndexError:tupleindexoutofrangePyinstaller官网目前的版本是3.2.1只支持到Python2.7，Python3.3~Python3.5需自己在官网源码里
如何利用Python下载酷狗音乐傻啦嘿哟关于python那些事儿 python 开发语言
目录一、酷狗音乐下载的挑战与解决方案二、Python下载酷狗音乐的步骤选择合适的第三方库安装you-get库下载酷狗音乐三、注意事项与常见问题版权问题链接失效下载速度四、案例与代码示例五、总结与展望随着互联网的迅猛发展，音乐已经成为人们日常生活中不可或缺的一部分。酷狗音乐作为中国领先的在线音乐平台，拥有庞大的音乐库和众多用户。然而，有时我们可能希望将酷狗音乐下载到本地，以便在没有网络或希望离线欣赏
python概述_理解Python数据类：Dataclass 的特征概述（上） weixin_39875842 python概述
原标题UnderstandingPythonDataclasses—Part1，作者为ShikharChauhan。这是一个包含两部分的博文：这一篇是Dataclass的特征概述下一篇是Dataclassfields的概述引言Dataclasses是一些适合于存储数据对象(dataobject)的Python类。你可能会问，什么是数据对象?下面是一个并不详尽的用于定义数据对象的特征列表：他们存储并
Python_算术运算符 Ww_Sid python python 算术运算符
两个数字相加sumNumber=1+2print(sumNumber)>>>3两个字符串相加sumString="Nicework"print(sumString)>>>Nicework两个数字相减subNumber=2-1print(subNumber)>>>1两个数字相乘或者multiplicationNumber=2*3print(multiplicationNumber)>>>6字符串重复
代码精进：工作中学到的12个代码风格程序员
在工作中，我们编写代码时尽可能地使其易于阅读。这意味着以下几点：变量名有意义且更长（而不是a,b和c）函数名有意义且更长许多注释和文档解释代码到处都是类型提示字符串似乎更长、更啰嗦等等以下是我在过去几年的工作中学到的一些生产级别的Python代码风格。1)使用括号的元组解包这是一些正常的元组解包：a,b=(1,2)在生产级别的代码中，我们通常不使用像a或b这样的变量名——相反，我们的变量名会变得更
python错误：No module named 'sklearn.cross_validation' 小炸鸡钟熊 python
调用fromsklearn.cross_validationimporttrain_test_split时，发现错误：Nomodulenamed'sklearn.cross_validation’更改为sklearn.model_selection即可fromsklearn.model_selectionimporttrain_test_split
leetcode 485 python weixin_36908057 leetcode
Givenabinaryarray,findthemaximumnumberofconsecutive1sinthisarray.Example1:Input:[1,1,0,1,1,1]Output:3Explanation:Thefirsttwodigitsorthelastthreedigitsareconsecutive1s.Themaximumnumberofconsecutive1sis
python连接485网关设备 dilqu python 网络开发语言
Python相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python连接485网关设备1.流程图gantttitlePython连接485网关设备流程图section了解485网关设备:1dsection安装Python库:1dsection编写Pyt
Python学习day14 BBS功能和聊天室 weixin_30725467 json 数据库前端 ViewUI
Createdon2017年5月15日@author:louts第1课作业讲解及装饰器使用28minutesdefcheck(func):defrec(request,*args,**kargs):returnfunc(request,*args,**kargs)returnrec@checkdefindex(request,):printrequest第2课自定义装饰器扩展使用18minutes
华为OD机试C卷-- 跳格子3（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二
如何使用Visual Studio Code调试PHP CLI应用和Web应用
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
理解 Python 的 Dataclasses Cater Chen python
理解Python的Dataclasseshttps://zhuanlan.zhihu.com/p/59657729
Python中dataclass库 SteveKenny #Python第三方库 python 开发语言哈希算法
文章目录dataclass语法一、简介二、装饰器参数三、数据属性1、参数2、使用示例3、注意事项四、其他1、常用函数2、继承3、总结dataclass语法一、简介官方文档的地址为：https://docs.python.org/3.9/library/dataclasses.htmldataclass的定义位于PEP-557，根据定义一个dataclass是指“一个带有默认值的可变的namedtu
提升数据科学工作流效率的10个Jupyter Notebook高级特性
JupyterNotebooks已成为数据科学家、机器学习工程师和Python开发人员的核心开发工具。其核心优势在于提供了一个集成式环境，支持代码执行、文本编辑和数据可视化的无缝整合。尽管大多数用户熟悉其基本功能，但许多能显著提升工作效率的高级特性往往被忽视。本文将介绍一些高级功能，帮助您在数据科学项目中充分发挥JupyterNotebooks的潜力。1、Magic命令：高效的命令行接口Jupyt
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
python安装包提示Requirement already satisfied 可爱的的编辑人员配置 python numpy 开发语言
python安装cnocr提示Requirementalreadysatisfied错误信息如下：Requirementalreadysatisfied:pyreadline3inc:\python310\lib\site-packages(fromhumanfriendly>=9.1->coloredlogs->onnxruntime->cnocr)(3.4.1)Installingcollec
Python3 打包成.exe（附IndexError: tuple index out of range错误解决） zdxdxd python python
1.首先下载PyInstaller官网地址入口已经安装了pip，直接在命令行输入：pipinstallpyinstaller2.进行打包进入需要被打包目录，输入：pyinstaller-Fyourprogram.py//-F打包成一个.exe文件另外，可以在官方的说明里看到pyinstaller目前并不支持python3.6，如下图：所以，在打包python3.6的程序时，会出现“:IndexEr
Python爬虫爬取1万首音乐代码 EasySoft易软 python
importrequestsbase_url=“http://music.163.com/song/media/outer/url?id=”start_id=200000end_id=210000formusic_idinrange(start_id,end_id+1):song_url=base_url+str(music_id)response=requests.get(song_url,st
NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
利用python向modbus RTU设备（RS485串口通信）发送16进制指令无名小白12138 python 开发语言
importserialimporttime#配置串口通信参数serial_port='COM1'baudrate=9600#创建串口连接ser=serial.Serial(port=serial_port,baudrate=baudrate)#检查串口是否已打开ifser.is_open:try:hex_data=bytes.fromhex('01100010000102000564C3')se
Python的简介-课前甜点 cheese-liang Python实用小技巧 python 开发语言
Python的简介-课前甜点1.`Python`需求的任务2.Python代码的实现3.代码修改的位置4.运行结果5.注意事项6.其他文章链接快来试试吧Python的简介点击这里也可以查看1.Python需求的任务如果您的工作主要是用电脑完成的，总有一天您会想能不能自动执行一些任务。比如，对大量文本文件执行查找、替换操作；利用复杂的规则重命名、重排序一堆照片文件；也可能您想编写一个小型数据库、或开
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本