m0_69203864

基于python的心脏病个人指数数据集数据处理——结课论文

前言:此论文是小赵的python数据分析与应用的结课作业，未上传论文涉及的所有数据集，本论文所涉及的数据预处理，数据分析和可视化仅以这些数据集为准，所有处理方法，结果以及结论仅个人观点。

心脏病个人指数数据集数据处理

摘要：

本论文包含了对心脏病个人指数数据集的概述，数据预处理，数据可视化以及数据分析还有相关代码，整体论文实现以下内容：数据预处理，包括异常数据处理，缺省数据处理，重复值处理，数据标准化；数据可视化，包括受访人员性别比例可视化，种族分布可视化，睡眠时长可视化，心理健康和身体健康情况可视化；数据分析，包括年龄与心脏病的关系，抽烟，喝酒与心脏病的关系，BMI值与心脏病的关系，也包括了这些功能实现的操作步骤以及处理过程和详细代码。本论文所涉及的数据预处理，数据分析仅以此数据集为准，所有处理方法，结果以及结论仅个人观点。

1. 数据集概述.

2. 数据预处理.

2.1 缺省数据处理.

2.2 重复值处理.

2.3 异常数据处理.

2.4 数据标准化.

3. 数据可视化.

3.1 受访人员性别分布可视化.

3.2 种族比例可视化.

3.3 睡眠时长可视化.

3.4 心理健康和身体健康情况可视化.

4. 数据分析.

4.1 年龄与心脏病的关系.

4.2 抽烟，重度饮酒与心脏病的关系.

4.3 BMI值与心脏病患者的关系.

5. 代码.

数据预处理

数据可视化

数据分析

心脏病个人指数数据集数据处理

1. 数据集概述

该数据集来自美国疾病控制与预防中心，是行为风险因素监测系统(BRFSS)的主要组成部分，该系统每年进行电话调查，收集美国居民健康状况的数据。正如美国疾病控制与预防中心所描述的那样:“BRFSS成立于1984年，在15个州建立，现在在所有50个州以及哥伦比亚特区和3个美国领地收集数据。BRFSS每年完成40多万名成年人的访谈，使其成为世界上最大的连续进行的健康调查系统。

最近的数据集(截至2022年2月15日)包含了2020年的数据。它由401,958行和279列组成。大部分栏目都是针对受访者的健康状况的问题，如“你走路或爬楼梯有严重困难吗?”或“你一生中吸过至少100支烟吗?”。

背景描述

据美国疾病控制与预防中心的数据，心脏病是美国大多数种族(非裔美国人、美国印第安人、阿拉斯加原住民和白人)的主要死因之一。大约一半的美国人(47%)至少有三种导致心脏病的主要风险因素中的一种:高血压、高胆固醇和吸烟。其他关键指标包括糖尿病状况、肥胖(BMI高)、缺乏体育活动或饮酒过多。发现和预防对心脏病有最大影响的因素在医疗保健中非常重要。反过来，计算技术的发展使得机器学习方法的应用能够从数据中检测出“模式”，从而预测病人的病情。

数据说明

该数据集包含18个变量(9个布尔值，5个字符串和4个小数点)。在机器学习项目中，“HeartDisease ”可以用作探究变量，但请注意，类是严重失衡的。

	数据名称	数据说明
1	HeartDisease	-曾报告患有冠心病(CHD)或心肌梗死(MI)的受访者
2	BMI	-身体质量指数(BMI)
3	Smoking	-你一生中至少抽过100支烟吗?
4	AlcoholDrinking	-重度饮酒者(成年男性每周饮酒超过14杯，成年女性每周饮酒超过7杯
5	Stroke	-中风
6	PhysicalHealth	-现在想想你的身体健康，包括身体疾病和受伤，在过去的30天里，有多少天你的身体健康不好?(0-30天)
7	MentalHealth	-心理健康，在过去的30天里有多少天你的心理健康不好?(0-30天)
8	DiffWalking	-你走路或爬楼梯有严重困难吗?
9	Sex	-性别
10	AgeCategory	-年龄范畴
11	Race	-种族/民族
12	Diabetic	-是否有糖尿病?
13	PhysicalActivity	-过去30天里从事体育活动或锻炼的成年人
14	GenHealth	-你是否认为你的健康状况？
15	SleepTime	-平均来说，你在24小时内的睡眠时间是多少小时?
16	Asthma	-是否得有哮喘?
17	KidneyDisease	-不包括肾结石、膀胱感染或尿失禁，你是否曾被告知有肾病?
18	SkinCancer	-是否得过皮肤癌?

表1-1 数据集数据说明

原始数据集部分数据如下:

图 1‑1 数据集部分数据截图

2. 数据预处理

2.1 缺省数据处理

首先我们先将数据集导入，接下来查看一下heart数据集的基本信息，来观察数据集包含的数据类型，再用isnull（）函数来查看数据集是否有缺省值，处理过程和效果如下图2-1-1和2-1-2所示

图 2-1-1 查看数据集基本信息

图 2-1-2 判断数据集是否有缺省值

从结果可以看出：

（1）一共319795条信息，这是个大数据集

（2）一共18个特征，其中4个浮点型数据，14个引用型数据

（3）所有数据均完整，无缺失

因此不需要对heart数据集进行缺省数据处理。

2.2 重复值处理

先用duplicated()方法进行逻辑判断，确定是否有重复值，处理过程如所示

图 2-2-1 判断数据集是否有重复值

再用duplicates（subset,keep,inplace)方法对某几列下面的重复行删除

subset:以哪几列作为基准列，判断是否重复，如果不写则默认所有列都要重复才算

keep: 保留哪一个，fist-保留首次出现的，last-保留最后出现的，False-重复的一个都不保留，默认为first

那么在这里我对重复的数据进行的操作是将数据集中所有列数据都重复的行进行删除，将重复值删除后的数据集保存为data1.csv文件，处理过程如所示

图 2-2-1 判断数据集是否有重复值

2.3 异常数据处理

检测数据异常值的方法有很多种，如3σ原则，箱线图分析等等，我这里选择的是使用箱线图来检测数据集的异常值，局限性是只能检测到列为数值型的数据，本次异常数据处理是基于data1.csv数据集上进行的，将处理后的数据集保存到data2.csv文件，操作过程和效果分别如下图2-3-1和图2-3-2所示。

图 2-3-1 异常数据处理过程

图 2-3-2 异常数据处理箱线图

2.4 数据标准化

数据标准化是基于data2.csv数据集上进行的，这里由于数据集有213956条数据，同样局限于数值型数据，我采用的是离差法标准化。

由于数据庞大，那么我们截取BMI，PhysicalHealth，MentalHealth，SleepTime四列数值型数据的前5行，操作过程如下图2-4-1所示

图 2-4-1 数据集数值型数据前五行

接下来，对数据集中的数值型数据进行离差标准化处理：打印出离差标准化处理前的前五行数据，和离差标准化处理后的前五行数据，并将标准化后的数据集保存至data.csv文件，操作过程和效果如下图2-4-2所示。

图 2-4-2 数据标准化处理过程与效果

3. 数据可视化

3.1 受访人员性别分布可视化

统计出受访人员的各个性别的人数，并使用直方图方式绘制出可视化图形，如图3-1所示。，具体操作步骤如下图3-1-1和3-1-2所示。

图 3-1-1 受访人员性别分布可视化处理过程

图 3-1-2 受访人员性别分布可视化效果

3.2 种族比例可视化

计算出受访人员的种族分布，然后统计出各个种族的人数，并使用饼图方式绘制出可视化图形，如图3-2所示，处理过程与效果如下图3-2-1和3-2-2所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

图 3-2-1 种族比例可视化处理过程

图 3‑2-2种族比例饼图

3.3睡眠时间分布可视化

统计出受访人员各个睡眠时长分布，并使用直方图方式绘制出可视化图形，如图3-3所示，处理过程和效果如图3-3-1和3-3-2所示。

图 3‑3-1睡眠时间分布处理过程

图 3‑3-2睡眠时间分布直方图

3.4心理健康程度和身体健康程度分布可视化

统计出受访人员心理健康程度和身体健康程度分布，并使用折线图方式绘制出可视化图形，如图3-4所示，操作步骤如下：

图 3-4-1 心理健康程度和身体健康程度分布可视化处理过程

图 3‑4-2心理健康程度和身体健康程度分布折线图

4. 数据分析

4.1 年龄与心脏病的关系

统计出不同年龄段的人员数量分布，并对不同年龄段的心脏病患者进行统计，使用散点图的方式绘制出可视化图形，如图 4‑1所示，处理过程与效果如图4-1-1和4-1-2所示。

通过分析散点图4-1-2可得，从整体上说，随着年龄越大，心脏病患者的人数也越多，所以可以得出随着年龄的增长，患心脏病的概率也会增大。

图 4-1-1年龄与心脏病关系分析过程

图 4‑1-2年龄与心脏病的关系散点图

4.2 抽烟，重度饮酒与心脏病的关系

4.2.1抽烟与心脏病的关系

统计一个数据集中是否抽烟与是否是心脏病患者排列组合四种情况（抽烟且患有心脏病，不抽烟且患有心脏病，抽烟且不患有心脏病，不抽烟且患有心脏病）的人数，通过比例来分析抽烟与心脏病的联系，处理过程如下，结果如图4-2-1所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

#首先，导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#接下来，可以使用pandas的groupby函数对数据进行分组统计：

count = data.groupby(['Smoking', ' HeartDisease']).size().reset_index(name='人数')

#最后，使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count['Smoking'] + ' ' + count[' HeartDisease '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

图 4-2-1抽烟与心脏病的关系饼图

通过分析图4-2-1可得，是否抽烟与心脏病患者的关系并不大，不能说明是否抽烟与心脏病患者存在什么明显的关系。

统计数据集中心脏病患者中抽烟人数的占比，再使用饼图的方式绘制出可视化图形表示他们的关系，如图4-2-4所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

图 4-2-2心脏病患者中抽烟人数的占比饼图

通过分析图4-2-2可得，心脏病患者中有55.3%的人抽烟，可以说明抽烟会提高患有心脏病的概率。

4.2.2重度饮酒与心脏病的关系

统计数据集中重度饮酒与是否是心脏病患者排列组合四种情况（重度饮酒且患有心脏病，不重度饮酒且患有心脏病，重度饮酒且不患有心脏病，不重度饮酒且不患有心脏病）的人数，通过比例来分析抽烟与心脏病的联系，如图4-2-3所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

#首先，导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#接下来，可以使用pandas的groupby函数对数据进行分组统计：

count=data.groupby(['AlcoholDrinking','HeartDisease']).size().reset_index(name='人数')

#最后，使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count['AlcoholDrinking'] + ' ' + count[' HeartDisease '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

图 4‑2-3喝酒与心脏病的关系饼图

通过分析图4-2-3可得，是否抽烟与心脏病患者的关系并不大，不能说明是否抽烟与心脏病患者存在什么明显的关系。

统计数据集中心脏病患者中重度喝酒人数的占比，再使用饼图的方式绘制出可视化图形表示他们的关系，如图4-2-4所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

图 4-2-4喝酒与心脏病患者的关系饼图

通过分析图4-2-4可得，心脏病患者中仅有4.0%的人重度饮酒，可以说明重度饮酒不会提高患有心脏病的概率。

4.2.3抽烟，重度饮酒与心脏病的关系

统计数据集中是否抽烟与是否是冠心病患者和是否是饮酒的排列组合六种情况（抽烟重度饮酒患心脏病，抽烟不喝酒患心脏病，抽烟不重度饮酒不患冠心病，不抽烟但重度饮酒患心脏病，不抽烟但重度饮酒酒不患冠心病，不抽烟不重度饮酒不患冠心病）的人数，并使用饼图进行可视化，处理过程如下，结果如下图4-2-5所示，每个扇形表示一种情况，扇形的大小表示对应的人数比例。

#导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#使用pandas的groupby函数对数据进行分组统计，得到六种情况的人数：

count = data.groupby(['Smoking', 'HeartDisease', ' AlcoholDrinking ']).size().reset_index(name='人数')

#使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count[' Smoking '] + ' ' + count[' HeartDisease '] + ' ' + count[' AlcoholDrinking '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

图 4-2-5抽烟，喝酒与心脏病患者的关系饼图

通过分析图4-2-5可得，仅抽烟，仅喝酒或既喝酒又抽烟与心脏病患者的关系并不大，不能说明他们存在什么明显的关系。

4.3 BMI值与心脏病患者的关系

统计数据集中心脏病患者不同BMI值的的数量，并以直方图的方式可视化数据，处理过程如下，结果如图4-3-1 所示。

通过分析图4-3-1 ，心脏病患者的人数随BMI值正态分布，BMI值越靠近中间，心脏病患者的人数越多，从中间向两边呈递减趋势。

import pandas as pd

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']

data = pd.read_csv('data2.csv')

count = data[data['HeartDisease'] == 'Yes']['BMI'].value_counts().sort_index()

plt.hist(data[data['HeartDisease'] == 'Yes']['BMI'], bins=10, edgecolor='black')

plt.xlabel('BMI值')

plt.ylabel('人数')

plt.title('心脏病患者的BMI值分布')

plt.show()

图 4-3-1 BMI值与心脏病患者的关系直方图

5. 代码

数据预处理

缺省数据处理:

#导入所需库

import numpy as np

import pandas as pd

#画图

import matplotlib.pyplot as plt

# 导入数据集"heart_2020_cleaned.csv"

heart = pd.read_csv('heart_2020_cleaned.csv')

# 查看一下数据

heart.head()

# 查看一下heart数据集的基本信息

heart.info()

#查看缺省数据并总计

heart.isnull().sum()

重复数据处理：

#先用duplicated()方法进行逻辑判断，确定是否有重复值

data=pd.read_csv("heart_2020_cleaned.csv",encoding='gbk')

#打印出重复值的数量

print(data.duplicated().value_counts())

#再用duplicates（subset,keep,inplace)方法对某几列下面的重复行删除

#subset:以哪几列作为基准列，判断是否重复，如果不写则默认所有列都要重复才算

#keep: 保留哪一个，fist-保留首次出现的，last-保留最后出现的，False-重复的一个都不保留，默认为first

#那么在这里我对重复的数据进行的操作是将数据集中所有列数据都重复的行进行删除。

data1=data.drop_duplicates(subset=None,keep='first',inplace=False)

print(data1.duplicated().value_counts())

#并将删除重复值后的数据保存到data1.csv文件

data1.to_csv('data1.csv')

异常值处理：

data1=pd.read_csv('data1.csv')

#需要检测异常值的列为这四列

col_list=['BMI','PhysicalHealth','MentalHealth','SleepTime']

def remove_outliers(data1,col_list):#定义一个函数来检测和删除异常值

    outliers_count=0#记录异常值数量

    for col in col_list:

        q1=data1[col].quantile(0.25)

        q3=data1[col].quantile(0.75)

        iqr=q3-q1#计算四分位距

        lower_bound=q1-1.5*iqr#计算下限

        upper_bound=q3+1.5*iqr#计算上限

        outliers=data1[(data1[col]upper_bound)].index#找出异常值所在的行

        outliers_count+=len(outliers) #记录异常值数量

        data1=data1.drop(outliers)#删除包含异常值的行

    print('一共有%d个异常值'%outliers_count)#打印异常值的数量

    return data1

data1[col_list].boxplot()#使用matplotlib库绘制箱线图来可视化数据

plt.show()



data2=remove_outliers(data1,col_list)

data2.to_csv('data2.csv')#将删除异常值后的数据集保存为data2.csv文件

数据标准化：

#打印前几行数值型数据

print(data2.loc[:10,['BMI','PhysicalHealth','MentalHealth','SleepTime']])

#导入数据集

data= pd.read_csv('data2.csv',index_col=0,encoding='gbk')

def MinMaxScale(data):

    data=(data-data.min())/(data.max()-data.min())

    return data

dataA=MinMaxScale(data['BMI'])

dataB=MinMaxScale(data['PhysicalHealth'])

dataC=MinMaxScale(data['MentalHealth'])

dataD=MinMaxScale(data['SleepTime'])

data1=pd.concat([dataA,dataB,dataC,dataD],axis=1)

print('前的数据为：\n',data[['BMI','PhysicalHealth','MentalHealth','SleepTime']].head())

print('后的数据为：\n',data1.head())

data1.to_csv('data3.csv')#将数据标准化后的四列数据保存为data3.csv文件

数据可视化

受访性别比例：

import pandas as pd

from pylab import mpl 

mpl.rcParams['font.sans-serif'] = ['SimHei']

# 读取数据集

data = pd.read_csv("data2.csv")

# 统计男女人数

gender_counts = data["Sex"].value_counts()

male_count = gender_counts["Male"]

female_count = gender_counts["Female"]

# 打印结果

print("男性人数：", male_count)

print("女性人数：", female_count)

import matplotlib.pyplot as plt

# 生成横坐标和纵坐标数据

x = ['Male', 'Female']

y = [male_count, female_count]

# 绘制直方图

plt.bar(x, y)

# 设置横坐标和纵坐标标签

plt.xlabel('性别')

plt.ylabel('人数')

# 设置图标题

plt.title('受访人员性别分布')

# 显示图形

plt.show()

种族分布可视化：

import pandas as pd

import matplotlib.pyplot as plt

# 读取数据集

data = pd.read_csv('data.csv')

# 统计每种种族的人数

count = data['Race'].value_counts()

# 绘制饼图

plt.pie(count, labels=count.index.tolist(), autopct='%1.1f%%')

plt.title('Distribution of Races')

plt.show()

睡眠时间分布可视化:

import pandas as pd

import matplotlib.pyplot as plt

# 读入数据集

data = pd.read_csv('data2.csv')

# 获取睡眠时间列的值，并计算每个唯一值的数量

sleep_time_values = data['SleepTime'].value_counts()

# 绘制直方图

plt.bar(sleep_time_values.index, sleep_time_values.values)

plt.xlabel('Sleep Time')

plt.ylabel('Count')

plt.title('Histogram of Sleep Time')

plt.show()

数据分析

年龄与心脏病患者的关系：

import pandas as pd

import matplotlib.pyplot as plt

# 读取数据集并选取年龄范围和冠心病患者两列

data = pd.read_csv('data2.csv')

age_range = data['AgeCategory']

has_heart_disease = data['HeartDisease']

# 统计年龄范围中不同值的数量，并保存到一个字典中

age_dict = {}

for age in age_range:

    if age in age_dict:

        age_dict[age] += 1

    else:

        age_dict[age] = 1

# 计算每个年龄段的冠心病患者数量，并保存到两个列表中

age_list = []

count_list = []

has_disease_list = []

for age, count in age_dict.items():

    age_list.append(age)

    count_list.append(count)

    age_data = data[data['AgeCategory'] == age]['HeartDisease']

    has_disease_count = age_data[age_data == 'yes'].count()

    has_disease_list.append(has_disease_count)

# 绘制散点图

plt.scatter(age_list, count_list, label='总人数')

plt.scatter(age_list, has_disease_list, label='冠心病患者数')

plt.xlabel('年龄段')

plt.ylabel('数量')

plt.legend()

plt.show()

抽烟，重度饮酒与心脏病的关系

抽烟与心脏病的关系：

#首先，导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#接下来，可以使用pandas的groupby函数对数据进行分组统计：

count = data.groupby(['Smoking', ' HeartDisease']).size().reset_index(name='人数')

#最后，使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count['Smoking'] + ' ' + count[' HeartDisease '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

重度饮酒与心脏病的关系：

#首先，导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#接下来，可以使用pandas的groupby函数对数据进行分组统计：

count=data.groupby(['AlcoholDrinking','HeartDisease']).size().reset_index(name='人数')

#最后，使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count['AlcoholDrinking'] + ' ' + count[' HeartDisease '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

抽烟，重度饮酒与心脏病的关系：

#导入所需的库：

import pandas as pd

import matplotlib.pyplot as plt

#使用pandas读取数据集：

data = pd.read_csv('data2.csv')

#使用pandas的groupby函数对数据进行分组统计，得到六种情况的人数：

count = data.groupby(['Smoking', 'HeartDisease', ' AlcoholDrinking ']).size().reset_index(name='人数')

#使用matplotlib库绘制饼图：

plt.pie(count['人数'], labels=count[' Smoking '] + ' ' + count[' HeartDisease '] + ' ' + count[' AlcoholDrinking '], autopct='%1.1f%%')

plt.axis('equal')

plt.show()

BMI值与心脏病患者的关系：

import pandas as pd

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']

data = pd.read_csv('data2.csv')

count = data[data['HeartDisease'] == 'Yes']['BMI'].value_counts().sort_index()

plt.hist(data[data['HeartDisease'] == 'Yes']['BMI'], bins=10, edgecolor='black')

plt.xlabel('BMI值')

plt.ylabel('人数')

plt.title('心脏病患者的BMI值分布')

plt.show()

你可能感兴趣的:(python,数据分析,数据可视化)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，