小文大数据

2019泰迪杯数据分析技能赛B题-学生校园消费行为分析

任务1.1

1、数据导入

import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
import random
plt.rcParams['font.family'] = 'SimHei'      # 正常显示中文
plt.rcParams['axes.unicode_minus'] = False


data1 = pd.read_csv('data1.csv',sep=',',encoding='gbk')
data1.columns =['序号','校园卡号','性别','专业名称','门禁卡号']

data2 = pd.read_csv('data2.csv',sep=',',encoding='gbk')
data2.columns=['流水号','校园卡号','学号','消费时间','消费金额','充值金额','余额',
               '消费次数','消费类型','消费项目编码','消费项目序号','消费操作编码','操作编码','消费地点']

data3 = pd.read_csv(r'data3.csv',sep=',',encoding='gbk')
data3.columns =['序号','门禁卡号','出入日期','出入地点','进出成功编号','通过权限']

data1:

data2:

data3:

2、缺失值分析：

data2数据的消费项目序号、消费项目编码缺失超过九成，已无实际分析意义，将其去除：

# 删除缺失值过多的列
data2 = data2.drop(['消费项目序号','消费操作编码'],axis = 1)

3、异常值分析：

data1箱线图分析:

def boxplot(data):
    fig = plt.figure(figsize = (20,20))
    for i,col in enumerate(data.columns):
        plt.subplot(4,3,i+1)
        data[[col]].boxplot()
    plt.show()
    
boxplot(data1[['校园卡号','门禁卡号']])

探索校园卡号异常数据：

由以上我们可知异常的两个校园卡号很可能是原本为18开头而变成了16，将其修改即可。

data1['校园卡号'].replace({164340:184340,164341:184341},inplace=True)

针对门禁卡号异常数据：

data2箱线图分析:

def get_colors(color_style):
    cnames = sns.xkcd_rgb
    if color_style =='light':
        colors = list(filter(lambda x:x[:5]=='light',cnames.keys()))
    elif color_style =='dark':
        colors = list(filter(lambda x:x[:4]=='dark',cnames.keys()))
    elif color_style =='all':
        colors = cnames.keys()
    colors = list(map(lambda x:cnames[x], colors))
    return colors

# 封装箱线图
def boxplot(data, rows = 3, cols = 4, figsize = (13, 8), vars  =None, hue = None, width = 0.25,
            color_style ='light',subplots_adjust = (0.2, 0.2)):
    
    fig = plt.figure(figsize = figsize)
    hue = data[hue] if isinstance(hue,str) and hue in data.columns else hue
    data = data if not vars else data[vars]
    
    colors = get_colors(color_style)
    ax_num = 1
    for col in data.columns:
        if isinstance(data[col].values[0],(np.int64,np.int32,np.int16,np.int8,np.float16,np.float32,np.float64)):
            plt.subplot(rows, cols, ax_num)
            sns.boxplot(x = hue,y = data[col].values,color=random.sample(colors,1)[0],width= width)
            plt.xlabel(col)
#             data[col].plot(kind = 'box',color=random.sample(colors,1)[0])
            ax_num+=1
    
    plt.subplots_adjust(hspace = subplots_adjust[0],wspace=subplots_adjust[1])
    plt.show()

boxplot(data2)

对data2数据结合现实场景主观决定否去除异常值。

对消费时间特征进行分析：

# 将消费时间特征转换为datetime类型数据
time = pd.to_datetime(data2['消费时间']).dt.time
# 对消费时间点进行统计并按照时间排序后进行可视化分析
time.value_counts().sort_index().plot()
plt.title('消费记录统计')
plt.show()

如上可知消费时间在0点的数据量最多，明显不符合显示情况，推测可能是录入时间时出现错误等系统情况导致时间为默认的0点整点。

0点的数据量占有7000多条，且基于这些数据对后续分析仍有价值，因此暂时不进行删除等的处理。

data3箱线图分析:

time = pd.to_datetime(data3['出入日期']).dt.time
time.value_counts().sort_index().plot()
plt.title('门禁出入统计')
plt.show()

分析与data2一致，暂不处理。

保存数据：

data1.to_csv('task1_1_1.csv')
data2.to_csv('task1_1_2.csv')
data3.to_csv('task1_1_3.csv')

任务1.2

1、联结表

对data1与data2根据校园卡号进行联结，并取出为消费记录的数据。

data_2_1 = pd.merge(data1,data2,left_on='校园卡号')
data_2_1 = data_2_1[data_2_1['消费类型']=='消费']

data_2_2 = pd.merge(data1,data3,on = '门禁卡号')

简单根据校园卡号分析学生数量：

a = data_2_1.校园卡号.unique().size
b = data2.校园卡号.unique().size
sns.set_style('whitegrid',rc = {'font.family': 'SimHei'})
AxesSubplot = sns.barplot(x = ['总校园卡号','为消费类型的校园卡号'],y = [b,a])
plt.bar_label(AxesSubplot.containers[0])

可知在提供的现实某时段消费记录数据内，约有3200多名学生拥有消费记录。

data_2_1:

data_2_2:

任务2.1

绘制各食堂就餐人次的占比饼图，分析学生早中晚餐的就餐地点是否有显著差别，并在报告中进行描述。（提示：时间间隔非常接近的多次刷卡记录可能为一次就餐行为）

定义早中晚餐：

import datetime
from datetime import time

# 取出食堂的消费记录数据
data_shitang = data2[(data2['消费地点'].map(lambda x:'食堂' in x)) & (data2['消费类型'] =='消费')]
data_shitang['消费时间'] = pd.to_datetime(data_shitang.消费时间)

def eating_time(x):
    y = []
    for i in x:
        if time(5,0)<=i.time()

 
   统计分析每个食堂的早午晚餐刷卡次数。 
  fig, axes = plt.subplots(2, 3, figsize = (12, 7))
   
ax = axes.ravel()
labels = data_shitang['消费地点'].unique()
colors = list(map(lambda x:sns.xkcd_rgb[x], sns.xkcd_rgb.keys()))
colors = np.random.choice(colors,5)

ax_num = 0
for label in labels:
    data_ = data_shitang[data_shitang['消费地点']==label]  # 取出一个类别的数据
    # 对该类别数据每个特征进行统计

    d = data_['就餐类型'].value_counts()

    ax[ax_num].pie(labels = d.index, x = d.values, autopct='%.1f%%',colors = colors)
#        ax.pie(d.values, labels = d.values)
    ax[ax_num].set_title(label, fontsize = 13)
    ax_num+=1

plt.subplots_adjust(0.2,0.2) 
   
     
   由上可分析每个食堂的刷卡消费情况以及出餐类型，如教师食堂只提供午餐、学生在第三、第四食堂主要消费午餐、晚餐。 
   
  分析早中晚的各食堂就餐行为并绘制饼图： 
   该任务难点主要在于就餐次数的确定(依题意不能直接将刷卡次数当作就餐次数)，结合题意及现实，定义30分钟内同个食堂的多次刷卡为一次消费行为即一次就餐次数，不同食堂30分钟内的多次刷卡仍视为多次就餐次数。 
  # 使30分钟内的多次刷卡为一次刷卡记录
def time_filter(x):
    import datetime
    # 初始化消费次数为刷卡次数
    consums = len(x)
    # 对消费时间进行降序
    x = x.sort_values(ascending= False)
    # 定义变量使得能跳出datetime1已经计算过的在十分钟内的datetime2
    position = 0
    for num,datetime1 in enumerate(x):
        if position != 0:
            position -= 1 
            continue
        for datetime2 in x[num+1:]: 
            # 当时间小于30分钟时，consums消费次数-1
            if datetime1-datetime2
 
   
    
   
   
  data_shitang_zaocan = data_shitang[data_shitang['就餐类型'] =='早餐']
data_shitang_wucan = data_shitang[data_shitang['就餐类型'] =='午餐']
data_shitang_wancan = data_shitang[data_shitang['就餐类型'] =='晚餐']
data_shitang_ = [data_shitang_zaocan, data_shitang_wucan, data_shitang_wancan]
data_leixing = ['早餐', '午餐', '晚餐']
fig,axes = plt.subplots(1,3, figsize = (14,6))
counts = [] # 存储早午晚餐统计数据
for d, title, ax in zip(data_shitang_, data_leixing, axes):
    d = d.groupby(['消费地点','校园卡号'],as_index =False)['消费时间'].agg(time_filter)
    xiaofei_counts=d.groupby('消费地点')['消费时间'].sum()
    xiaofei_counts.name = '消费次数'
    counts.append(xiaofei_counts)
    ax.pie(labels = xiaofei_counts.index,x = xiaofei_counts, autopct='%.1f%%')
    ax.set_title(f'{title}各食堂就餐人次占比饼图')
plt.show() 
   
  使用pyecharts绘制饼图： 
  from pyecharts.charts import Pie
from pyecharts import options as opts 
def pie_(xiaofei_counts, label):
    pie = Pie()
    pie.add('就餐次数统计',[list(z) for z in zip(xiaofei_counts.index,xiaofei_counts)],radius = ['50%','70%'],
            rosetype = 'are',center=["50%", "53%"])
    pie.set_global_opts(title_opts = opts.TitleOpts(title=f'{label}行为分析饼图'),
                       legend_opts=opts.LegendOpts(pos_bottom = 0))
    # formatter中 a表示data_pair,b表示类别名，c表示类别数量,d表示百分数
    pie.set_series_opts(label_opts=opts.LabelOpts(
            position="outside",
            formatter="{a|{a}}{abg|}\n{hr|}\n {b|{b}: }{c}  {per|{d}%}  ",
            background_color="#eee",
            border_color="#aaa",
            border_width=1,
            border_radius=4,
            rich={
                "a": {"color": "#999", "lineHeight": 22, "align": "center"},
                "abg": {
                    "backgroundColor": "#e3e3e3",
                    "width": "100%",
                    "align": "right",
                    "height": 18,
                    "borderRadius": [4, 4, 0, 0],
                },
                "hr": {
                    "borderColor": "#aaa",
                    "width": "100%",
                    "borderWidth": 0.3,
                    "height": 0,
                },
                "b": {"fontSize": 14, "lineHeight": 33},
                "per": {
                    "color": "#eee",
                    "backgroundColor": "#334455",
                    "padding": [2, 4],
                    "borderRadius": 2,
                },
            },
        ),legend_opts =opts.LegendOpts(type_ = 'scroll',
                                                      
                                      orient = 'horizontal',align ='left',
                                      item_gap = 10,item_width = 25,item_height = 15,
                                      inactive_color = 'break'))

    pie.set_colors(['red',"orange", "yellow", "Cyan", "purple" ,"green","blue","#61e160","#d0fe1d"]) 
    return pie.render_notebook() 
   
   
   
   
    
   
   
   
   
   大致分析： 
   
  任务 2.2 通过食堂刷卡记录，分别绘制工作日和非工作日食堂就餐时间曲 线图，分析食堂早中晚餐的就餐峰值，并在报告中进行描述。 
  统计： 
  # 获取小时数据
data_shitang['就餐时间'] = data_shitang['消费时间'].apply(lambda x:x.hour)
# 获取是否工作日
from chinese_calendar import is_workday,is_holiday
data_shitang['是否工作日'] = data_shitang['消费时间'].apply(lambda x: '工作日' if is_workday(x) else '非工作日')

# 获取工作日与非工作日的每个时间刷卡次数统计
data_isor_workday = data_shitang.groupby(['就餐时间','是否工作日']).size().unstack()
print(data_isor_workday)

# 工作日除以21天，非工作日除以9，得到日均刷卡次数
data_isor_workday = data_isor_workday/np.array([21,9])  
# 缺失值填0处理（有的时段无刷卡次数，如凌晨）     
data_isor_workday = data_isor_workday.fillna(0).astype(np.int)

 
  可视化： 
  plt.plot(data_isor_workday.index,data_isor_workday['工作日'], label = '工作日')
plt.plot(data_isor_workday.index,data_isor_workday['非工作日'], label = '非工作日')
plt.xlabel('时间')
plt.ylabel('日均刷卡次数')
plt.xticks(range(24))
plt.legend()
plt.show() 
   
   
   
   pyecharst可视化： 
  import pyecharts
from pyecharts.charts import Line
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts import *


# 常用全局参数配置封装
def global_opts(line,x_name,y_name,title,bottom = None,left = None,split_line = False):
         line.set_global_opts(title_opts=opts.TitleOpts(title = title),
                             xaxis_opts=opts.AxisOpts(name= x_name,type_='category', name_location='center',name_gap=25,max_interval =0),
                             yaxis_opts=opts.AxisOpts(name= y_name,type_='value', name_location='end',name_gap=15,
                                                      splitline_opts=opts.SplitLineOpts(is_show=split_line,
                                                                                        linestyle_opts=opts.LineStyleOpts(opacity=1)),),
                              legend_opts =opts.LegendOpts(type_ = 'scroll',
                                                      pos_bottom=bottom, pos_left = left,
                                                      orient = 'horizontal',align ='left',
                                                      item_gap = 10,item_width = 25,item_height = 15,
                                                      inactive_color = 'break'),
                             tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
                                                     )


def mul_line_plot(data_x,data_y,x_name,y_name,title,):

    line =Line(init_opts=opts.InitOpts(theme=ThemeType.DARK,bg_color = '',width='900px',height = '550px'))
    line.add_xaxis(data_x)
    for i in data_y.columns:
        line.add_yaxis(series_name = i,y_axis =data_y.loc[:,i],is_smooth =True,symbol_size = 6,
                        linestyle_opts=opts.LineStyleOpts( width=2, type_="solid"),
                        label_opts = opts.LabelOpts(is_show=True,position = 'top',font_size =12,
                                               font_style = 'italic',font_family= 'serif',))

    global_opts(line,x_name,y_name,title,bottom = 0,left = 20)

    return line.render_notebook() 
   
  mul_line_plot(data_x=(data_isor_workday).index.tolist(),data_y=(data_isor_workday),
              x_name ='时间',y_name='日均刷卡次数',title ='就餐时间曲线图') 
   
   
   
   任务 3.1 根据学生的整体校园消费数据，计算本月人均刷卡频次和人均消 费额，并选择 3 个专业，分析不同专业间不同性别学生群体的消费特点。 
  d = data_2_1.groupby('校园卡号').agg({'消费次数':np.size,'消费金额':np.sum})[['消费金额','消费次数']]
# 封装箱线图
boxplot(data = d) 
   
   
  # 依据箱线图去除异常数据
d = d[ (d['消费金额'] < 800) & (d['消费次数'] < 180)] 
# 本月人均刷卡次数约72次 、人均消费总额288
print(d.mean()) 
   
  选择三个专业进行消费行为分析：  
   
  不同专业不同性别人均刷卡金额对比图：  
  data_3_zhuanye = data_2_1.query("专业名称 in ['18产品艺术','18会计','18动漫设计']")
a = data_3_zhuanye.groupby(['专业名称','性别'])['消费金额'].mean().unstack()
a = np.round(a,2) # 小数点两位且四舍五入

with sns.color_palette('rainbow_r'):
    bar = a.plot.bar()
    plt.xticks(rotation =0)
    plt.title('平均每次刷卡金额')
    for i in bar.containers:
        plt.bar_label(i) 
   
   使用pyecharts: 
  bar = Bar()
bar.add_xaxis(a.index.tolist())

bar.add_yaxis('女',a.iloc[:,0].tolist(),itemstyle_opts=opts.ItemStyleOpts(color='red'))
bar.add_yaxis('男',a.iloc[:,1].tolist(),itemstyle_opts=opts.ItemStyleOpts(color='blue'))

global_opts(line = bar,title = '不同专业不同性别学生群体的关系',x_name = '专业',y_name = '平均刷卡金额/元')
bar.render_notebook() 
    
   
  不同专业不同性别就餐地点对比饼图： 
  with sns.color_palette('rainbow'):
    # 封装函数，源程序在作者博客seaborn封装中可以找到
    count_pieplot(data_3_zhuanye,3,2,vars = ['消费地点','专业名称','性别'],hue = '专业名称',qita_percentage_max=  0.02,figsize=(6,11)) 
   
   
    
  pyecharts: 
  d_ = pd.pivot_table(data =data_3_zhuanye ,index =['消费地点'],columns = '专业名称',aggfunc='size',).fillna(0)

pie_(d_['18产品艺术'].sort_values(ascending=False)[:8],'18产品艺术消费地点')
# pie_(d_['18会计'].sort_values(ascending=False)[:8],'18会计消费地点')
# pie_(d_['18动漫设计'].sort_values(ascending=False)[:8],'18动漫设计消费地点') 
   
    
    
   
    
     
   
  with sns.color_palette('rainbow'):
    # 作者封装函数，需要源程序可在作者博客seaborn封装中寻找
    count_pieplot(data_3_zhuanye,1,2,vars = ['消费地点'],hue = '性别',qita_percentage_max=  0.02,figsize=(10,4)) 
   
   
    不同专业男生消费地点饼图： 
  with sns.color_palette('rainbow'):
    count_pieplot(data_3_zhuanye.query("性别 == '男'"),1,3,vars = ['消费地点','专业名称'],hue = '专业名称',qita_percentage_max=  0.02,figsize=(16,4)) 
    
   
   不同专业女生消费地点饼图： 
   
  pyecharts: 
  d_ = pd.pivot_table(data =data_3_zhuanye ,index =['消费地点'],columns = '性别',aggfunc='size',).fillna(0)

pie_(d_['男'].sort_values(ascending=False)[:10],'男生消费地点')
# pie_(d_['女'].sort_values(ascending=False)[:10],'女生消费地点') 
   
    
   
   
   
  任务 3.2 根据学生的整体校园消费行为，选择合适的特征，构建聚类模型， 分析每一类学生群体的消费特点。 
  结合背景分析，取出每次刷卡平均消费金额、总消费次数、消费总金额三个特征进行聚类 
  import sklearn
from sklearn import  cluster
from sklearn.preprocessing import StandardScaler

# 取出日常消费类型数据
data_2_1_1 = data_2_1.query("消费地点 in ['第四食堂','第一食堂','第二食堂', '红太阳超市','第五食堂','第三食堂', '好利来食品店']")


# 取出每次刷卡平均消费金额、总消费次数、消费总金额三个特征进行聚类
data = data_2_1_1.groupby(['校园卡号'],as_index=False)['消费金额'].mean()
data['本月内消费累计次数'] = data_2_1_1.groupby('校园卡号')['消费次数'].size().values
data['消费总金额'] = data_2_1_1.groupby('校园卡号')['消费金额'].sum().values
data = data.set_index('校园卡号')
data.columns = ['平均每次刷卡消费金额','本月内累计消费次数','消费总金额']
print(data) 
   
  Kmeans聚类： 
  # Kmeans聚类模型，七个聚类簇
model = cluster.KMeans(n_clusters=7)
# 标准化模型
scaler = StandardScaler()
# 标准化
data_ = scaler.fit_transform(data.iloc[:,:])
# 模型训练
model.fit(data_)

# 对数据进行聚类得到标签
labels = model.predict(data_)

# 将标签加入到data数据中
data['labels'] = labels

 
   可视化： 
  二维散点图 
  sns.set(font='SimHei')
sns.scatterplot(data =data , x = '本月内累计消费次数',y= '平均每次刷卡消费金额',hue = 'labels',palette = 'rainbow')
plt.title('七个消费群体散点图')
plt.show() 
   
   
   
  三维散点图： 
  colors = ['#a88f59', '#da467d', '#fdb915', '#69d84f', '#380282','r','b']
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(15,8))
ax = fig.add_subplot(121, projection='3d')

for i in data['labels'].unique():
    d = data[data['labels']==i]
    ax.scatter(d['本月内累计消费次数'],d['平均每次刷卡消费金额'],d['消费总金额'],c=colors[i],label =i)
    ax.set_xlabel('本月内累计消费次数')
    ax.set_ylabel('平均每次刷卡消费金额')
    ax.set_zlabel('消费总金额')
plt.title('高钾:层次聚类结果图',fontsize = 15)
plt.legend()
plt.show() 
   
   
  任务 3.3 通过对低消费学生群体的行为进行分析，探讨是否存在某些特征， 能为学校助学金评定提供参考。 
  分析并探讨低消费群体的特征为助学金评定提供建议： 
          基于任务3.2的聚类图并结合现实情况，低消费群体应为具有中等消费次数，低平均消费金额以及低消费总额的特点，因为消费次数太低说明可能很少在食堂消费，可能多为在校外饭馆等消费，不能判定为贫困学生，而消费次数高即使平均消费低也会导致高消费总额，也不能判定为贫困学生，据此分析，我们判定1号群体满足低消费贫困学生的特点，并且2号群体消费次数分布在100左右，符合一个月内正常的每天三餐的消费次数，所以若学校需要对贫困学生执行助学金政策，可在1号群体学生中从左下角开始选择（越靠近左下角代表消费总额越低）。 
   
  其他自主分析可视化图：

22.C语言Unicode编码与多字节字符处理详解余识- C语言基础 c语言数据库
目录1.Unicode简介2.字符的表示方法3.多字节字符的表示4.宽字符5.多字节字符处理函数5.1mblen5.2wctomb5.3mbtowc()5.4wcstombs5.5mbstowcs本篇原文为：C语言Unicode编码与多字节字符处理详解。更多C++进阶、rust、python、逆向等等教程，可点击此链接查看：酷程网1.Unicode简介C语言诞生时，只考虑了英语字符，使用7位的AS
python中print输出格式汇总_Python格式化字符串（格式化输出）白字不白
我们在《第一个Python程序——在屏幕上输出文本》中讲到过print()函数的用法，这只是最简单最初级的形式，print()还有很多高级的玩法，比如格式化输出，这就是本节要讲解的内容。熟悉C语言printf()函数的读者能够轻而易举学会Pythonprint()函数，它们是非常类似的。print()函数使用以%开头的转换说明符对各种类型的数据进行格式化输出，具体请看下表。表1Python转换说明
Hive 窗口函数与分析函数深度解析：开启大数据分析的新维度自节码大数据 hive 数据分析 hadoop
Hive窗口函数与分析函数深度解析：开启大数据分析的新维度在当今大数据蓬勃发展的时代，Hive作为一款强大的数据仓库工具，其窗口函数和分析函数犹如一把把精巧的手术刀，助力数据分析师们精准地剖析海量数据，挖掘出深藏其中的价值宝藏。本文将带领大家深入探索HiveQL中这些神奇函数的奥秘，从版本演进、功能特性到丰富多样的实际应用示例，全方位地呈现它们在大数据处理领域的卓越魅力。一、版本回溯与知识宝库指引
【Python Tips】多线程池加速独立运行程序——ThreadPoolExecutor 机器白学 Python python
在处理数量庞大的数据集或者大批量的循环操作时，程序如果单一运行往往会十分缓慢。假如硬件设备内存足够，CPU性能够好，同时每次循环内的任务都独立（如访问一个文件夹内大量文件）。这种时间复杂度的问题可以尝试使用多线程来处理加速。下面记录使用Python标准库中的高级接口——concurrent.futures.ThreadPoolExecutor来实现多线程加速。以一个写入txt文件的操作为例，假如有
Python wxPython 库实现文本框与按钮交互示例燕鹏01 Python python
引言在Python的图形用户界面（GUI）开发中，wxPython是一个功能强大的库。今天，我们将通过一个简单的示例，详细讲解如何使用wxPython创建一个带有按钮和文本框的窗口，并实现按钮点击事件来向文本框中添加文本。代码解析导入wxPython库importwx这行代码导入了wxPython库，它是我们创建GUI应用程序的基础。创建MyFrame类classMyFrame(wx.Frame)
《Python实现简易DDoS压力测试脚本：原理、代码与使用警示》乐茵安全 python_study chrome 前端 python 网络安全
DDoS测试脚本声明：本文所涉及代码仅供学习使用，任何人利用此造成的一切后果与本人无关源码import requestsimport threading# 目标URLtarget_url = "http://47.121.xxx.xxx/"# 发送请求的函数def send_request(): while True: try: response = re
《还在为数据表难看而烦恼？Python绘制数据表能否成为你的救星？》乐茵安全 python_study java 前端 python
利用python绘制各种数据图表绘制柱形图-源码from openpyxl import Workbookfrom openpyxl.chart import BarChart, Reference# 创建工作薄wb = Workbook(write_only=True)# 创建工作表ws = wb.create_sheet('月收入')# 准备数据rows = [ ('月份', '销售额'
求和——蓝桥杯走啦小孩 c++算法蓝桥杯数据结构
1.求和题目描述小明对数位中含有2、0、1、92、0、1、9的数字很感兴趣，在11到4040中这样的数包括1、2、9、101、2、9、10至32、3932、39和4040，共2828个，他们的和是574574。请问，在11到20192019中，所有这样的数的和是多少？运行限制最大运行时间：1s最大运行内存:128M2.代码两个代码，第一个代码中加了布尔函数进行判断，有点多此一举了，但是可以学习一下
python3安装教程 @小左 python 开发语言
1.下载python百度网盘下载python-3.12.3-amd64.exe链接：https://pan.baidu.com/s/1MV3kvVdjCdS_G-_KgefwLw?pwd=pgzu提取码：pgzu官网下载：WelcometoPython.org有很多版本，选择需要的版本下载2.安装python双击python-3.12.3-amd64.exeNext安装成功3.检查pythonwi
【2024华为OD-E卷-100分-字符串分割】（题目+思路+Java&C++&Python解析) 执着的小火车 2024华为OD-E卷华为od java c++华为算法数据结构
题目字符串分割给定一个字符串s和一个整数k，你需要将字符串s分割成恰好k个非空子字符串，使得这些子字符串中字典序最大的子字符串尽可能小。输入：第一行输入一个字符串s（只包含小写字母）。第二行输入一个整数k。
华为OD机试E卷 - 空栈压数（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 python 华为od java javascript c语言 c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述向一个空栈压入正整数，每当压入一个整数时，执行以下规则（设:栈顶至栈底整数依次编号为n1,n2,…,nx，其中n1为最新压入的整数)如果n1=n2，则n1、n2全部出栈，压入新数据m(m=2*n1)如果n1=n2+…+ny(y的范围为[3,x])，则n1,n2,…,ny全部出栈，压入新数据m(m=2*n1)。如果上述规
Python的条件判断、循环和函数（超详细教学）小星袁 Python入门级超详细教学 python 服务器开发语言 Python 循环条件函数
目录一、条件判断1.1if语句1.2ifelse语句1.3ifelifelse语句二、循环2.1累加2.1.1for循环2.1.2while循环2.2break跳出循环2.3列表表达式2.3.1定义2.3.2举例三、函数3.1求和函数3.2匿名函数一、条件判断1.1if语句A=10ifA>0:print("A是正数！")1.2ifelse语句A=-10ifA>0:print("A是正数！")els
Python进阶-在Ubuntu上部署Flask应用
随着云计算和容器化技术的普及，Linux服务器已成为部署Web应用程序的主流平台之一。Python作为一种简单易用的编程语言，适用于开发各种应用程序。本文将详细介绍如何在Ubuntu服务器上部署Python应用，包括环境准备、应用发布、配置反向代理（Nginx）、设置系统服务以及日志管理等步骤。一、部署准备在开始之前，请确保你具备以下条件：一台运行Ubuntu（如Ubuntu20.04或22.04
【华为OD-E卷 - 篮球比赛 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-篮球比赛100分（python、java、c++、js、c）】题目篮球(5V5)比赛中，每个球员拥有一个战斗力，每个队伍的所有球员战斗力之和为该队伍的总体战斗力。现有10个球员准备分为两队进行训练赛，教练希望2个队伍的战斗力差值能够尽可能的小，以达到最佳训练效果。给出10个球员的战斗力，如果你是教练，你该如何分队，才能达到最佳训练效果?请说出该分队方案下的最小战斗力差值输入描述0
【华为OD-E卷 - 敏感字段加密 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-敏感字段加密100分（python、java、c++、js、c）】题目给定一个由多个命令字组成的命令字符串：字符串长度小于等于127字节，只包含大小写字母，数字，下划线和偶数个双引号；命令字之间以一个或多个下划线_进行分割；可以通过两个双引号””来标识包含下划线_的命令字或空命令字（仅包含两个双引号的命令字），双引号不会在命令字内部出现；请对指定索引的敏感字段进行加密，替换为**
Python网络爬虫入门教程：从抓取数据到应用实现冷夜雨. python
引言在大数据时代，信息就是力量。各种网站每天产生着海量的数据，这些数据中蕴藏着巨大的商业价值和研究价值。如何快速、自动化地从互联网上获取这些信息，成为了数据科学、人工智能、市场分析等领域中的一个重要课题。Python，作为一门易于学习且功能强大的编程语言，其丰富的库和工具使得构建网络爬虫变得非常简单。网络爬虫（WebScraper）是一种自动化程序，用来从网页中提取信息。无论是用于数据分析、竞争对
编程语言大揭秘：各显神通的编程世界冷夜雨. python java c++c#javascript
在当今数字化的时代，编程语言犹如一把把神奇的钥匙，打开了通往不同技术领域的大门。从网页开发到人工智能，从数据分析到游戏制作，每一种编程语言都有其独特的优势与适用场景。今天，就让我们一同深入探索几种主流编程语言的奥秘，看看在什么情况下它们能发挥最大的威力。Python：万能胶水，快速开发的利器Python以其简洁、易读的语法著称，仿佛是用自然语言编写代码一般，新手程序员也能快速上手。它拥有庞大且丰富
MDX语言的数据库交互 Linux520小飞鱼包罗万象 golang 开发语言后端
使用MDX语言进行数据库交互的深入探讨引言在当今数据驱动的时代，数据分析和数据挖掘的需求不断增加。多维数据分析工具和语言应运而生，其中MDX（多维表达式，MultidimensionalExpressions）便是一种非常重要的工具。MDX主要用于查询多维数据集（如OLAP数据立方体），在商业智能和数据仓库领域得到了广泛应用。本文将深入探讨MDX的基本概念、语法、应用场景以及与其他数据库交互的方式
Windows中配置Python 3.11环境安装教程 Python老安 windows python3.11 python flask 开发语言电脑 microsoft
目录一、下载和安装Python3.111.1下载Python3.111.2安装Python3.11二、配置环境变量2.1检查Python是否已添加到PATH2.2手动添加Python到PATH三、验证Python和pip安装3.1验证Python安装3.2验证pip安装四、安装常用的Python包和工具4.1更新pip4.2安装虚拟环境管理工具4.2.1安装virtualenv4.2.2创建虚拟环
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
【第四天】零基础入门刷题Python-Selenium-自动化测试-打开百度的首页搜索B站然后打开B站-切换B站窗口在B站搜索框中搜索Selenium-复习XPATH详细语法 Long_poem python selenium 开发语言 xml html
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、先复习昨天的XPATH语法，然后学习怎么切换窗口二、详细代码1.对本节代码XPath表达式的解释2.在百度的首页上搜索B站后打开B站-在B站搜索框中搜索Selenium3.对切换窗口的详细介绍4.对上方的两个模块的详细介绍总结前言提示：这里可以添加本文要记录的大概内容：第零天练习补充零基础入门刷题Python-Sele
vSAN数据恢复—vSAN存储中虚拟机无法启动的数据恢复案例数据恢复
vSAN存储故障：异常断电导致vSAN存储上层虚拟机无法启动。vSAN存储结构：vSAN存储数据恢复过程：1、将故障vSAN存储上的硬盘标记后取出，硬件工程师对所有硬盘进行物理故障检测，经过检测确认异常断电并没有导致硬盘出现物理故障，都可以正常读取。将所有硬盘以只读方式进行扇区级完整镜像。镜像完成后将所有磁盘按照标记还原到原存储中。后续的数据分析和数据恢复操作都基于镜像进行，避免对原始磁盘数据造成
豆包 API 调用示例代码详解-Python版道长不会写代码 python基础教学 python 开发语言
文章目录豆包API调用示例代码详解-Python版一、事前准备二、所需Python包三、代码详解五、源码下载四、总结豆包官方API文档豆包API调用示例代码详解-Python版在本文中，我们将详细介绍如何使用Python调用豆包API，并提供相关的事前准备和代码执行步骤。一、事前准备密钥申请：要使用豆包API，首先需要申请一个授权密钥。在上述代码中，密钥存储在headers字典的Authoriza
啤酒与旅行的浪漫邂逅 typescript
旅行，是一场探索未知的奇妙旅程；啤酒，则是旅途中增添乐趣的浪漫伴侣。当两者相遇，便会碰撞出独特的火花。在欧洲的古老小镇，街边的酒馆是旅行者们必去的地方。走进一家古色古香的酒馆，点上一杯当地特色的啤酒，坐在窗边，看着外面石板路上行人来来往往。此时，啤酒的泡沫在杯中跳跃，麦芽的香气弥漫在空气中，仿佛时光都慢了下来。在这里，啤酒成为了感受当地文化的一扇窗口，每一口都能品味到小镇的历史与风情。去比利时旅行
Python加密算法有哪些？有什么作用？
Python中的常见加密算法及其应用加密算法在现代计算机科学中扮演着至关重要的角色，它们用于保护数据的机密性、完整性和验证身份。在Python中，有许多加密算法可以使用，它们各自具有不同的特点和应用场景。以下是一些常见的加密算法及其详细介绍：1.AES（AdvancedEncryptionStandard）️简介：AES是一种对称加密算法，广泛用于保护敏感数据，属于块加密算法。AES有三种密钥长度
Python - random.seed初探 - 为什么固定随机种子了每次结果还不一样 Tisfy 实用技巧 Python python 开发语言 random 随机种子
Python-random.seed初探-为什么固定随机种子了每次结果还不一样前言和很多语言一样，python的random也能设置随机种子，设置随机种子后相同的rand调用会产生相同的结果。例如下面代码在同一版本的python下，理论上不论何时运行多少次都将得到相同的结果：importrandomrandom.seed(83)a=[random.randint(0,random.randint(
牛奶：儿童成长的营养卫士 css
在孩子成长的旅程中，牛奶扮演着至关重要的角色。从婴幼儿时期的配方奶，精准调配营养成分，满足宝宝快速生长发育需求，助力大脑、骨骼发育。到孩童阶段，每天一杯纯牛奶，为奔跑玩耍的他们补充能量，钙元素让骨骼更强壮，像坚固的小卫士，支撑孩子探索世界。学校课间，一盒牛奶成为孩子们喜爱的营养补给，确保学习精力充沛。家长们看着孩子茁壮成长，心中满是欣慰，而牛奶功不可没，用它满满的营养守护孩子成长每一步，是童年不可
python范围 shix . python python 开发语言
用户图形界面-工资计算器fromtkinterimport*deff():w=int(e1.get())+int(e2.get())-int(e3.get())wage.insert(0,w)root=Tk()root.title("工资计算器")Label(root,text="每月基本工资：").pack()e1=Entry(root)e1.pack()Label(root,text="补助工
npm与npx：有何不同？
npm与npx：有何不同？原文链接：npmvs.npx:What’sthedifference?作者：FimberElemuwa✏️译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！什么是npm？npm代表NodePackageManag
XSAN数据恢复-数据从XSAN迁移到STORNEXT过程中丢失的数据恢复案例数据恢复
XSAN数据恢复环境：昆腾存储+MACOS操作系统，存储数据主要是视频类数据如MXF、MOV等格式文件。该昆腾存储中有9个数据卷：1个META信息卷和8个DATA信息卷。XSAN故障情况：将存储空间从XSAN架构迁移到STORNEXT架构后，发现存储空间中数据全部丢失。XSAN数据恢复过程：1、将昆腾存储的存储空间以只读方式进行完整镜像，后续的数据分析和数据恢复操作都基于镜像文件进行，避免对原存储
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

2019泰迪杯数据分析技能赛B题-学生校园消费行为分析

你可能感兴趣的:(python数据可视化,泰迪杯数据分析技能赛,数据分析,python,数据挖掘)