jp_zhou256

2018年"华为杯"数学建模获奖名单挖掘分析

2018年"华为杯"数学建模获奖名单挖掘分析
本文针对2018年"华为杯"数学建模6张拟获奖名单做一次简单的统计分析，以下分析结果仅代表思路，勿要以假乱真，权威结果统计以各大高校官方结果为准。以该2018年"华为杯"A，B，C，D，E，F共计6道题目的拟获奖名单为原材料。主要锻炼Python数据处理中的以下功能点的使用：
功能点：

1.把6张拟获奖名单进行拼接
··· 1.1.1.将6张表横向拼接；
··· 1.1.2.将6张表纵向拼接(后续处理主要使用按竖直方向拼接)；
··· 1.1.3.简单的检索功能；
··· ··· ··· input:传入自己学校的名称即可整理出本校的参赛情况
··· ··· ···output:该校的参赛情况整合表
完成1中的处理针对单个高校信息的抽取已经可以完成，并在Excel表格中可以很容易的做出筛选和排序，并计算各个学校总的获奖率和每道题目对应的获奖率等等。但是要实现对全国参赛的上百组高校队伍的批量分析和统计，设计详细的数据结构存储数据是必须的。第二部分将实现对全国参赛的上百组高校队伍的参赛和获奖情况的批量分析和统计。
··· 1.1.4.对汇总表的数据探索

2.抽取参赛高校列表
3.分别抽取出来每个学校的参赛信息(按学校分群，高校名做索引)
4.统计每个学校的参赛信息
··· 4.1.设计存储每一个学校参赛相关信息的数据结构
··· 4.2.分别统计每一个大学的各个赛题参与和完成获奖情况
··· 这里由宏观到微观铺开整个数据结构的组织结果：
··· ···A.宏观(全部高校参赛情况对象字典，每一个高校参赛情况对象记为xuexiao1)
··· ···B.微观:xuexiao1对象的展开
··· ···C.xuexiao1对象中的"学校各题获奖明细"展开
5.统计shanghai地区大学的参赛情况
····5.1.统计shanghai地区大学的参赛情况
····5.2.统计shanghai地区部分大学的参赛获奖情况
····5.3.统计全国参赛的情况
注：由于学生队伍成员组队方式的灵活性，本文将以队伍为研究粒度来做统计分析。
6.参赛人数的统计
7.每个大学"答题明细"对象挖掘分析
以同济大学和SMU大学为例。
··· 7.2.1.两个学校6道赛题完成情况一览
··· 7.2.2.两个学校6道赛题一等奖情况一览
··· 7.2.3.高校数模战斗力排行榜(取战斗力前100名高校)

实现过程

1. 将6张拟获奖名单进行拼接

1.1.1.将6张表横向拼接；

import pandas as pd
import xlwt
import numpy as np
file_path=r'C:/Users/Administrator/Desktop/AAA/'
data_A=pd.read_excel(file_path+'2018年最终获奖名单_A题.xls',encode='gbk')
len(data_A) #678
data_A.columns.tolist()  
#['序号', '题号', '队伍编号', '奖项', '队长姓名', '队长所在单位', '第一队友姓名', '第一队友所在单位', '第二队友姓名', '第二队友所在单位']
data_B=pd.read_excel(file_path+'2018年最终获奖名单_B题.xls',encode='gbk')
len(data_B) #1899
data_C=pd.read_excel(file_path+'2018年最终获奖名单_C题.xls',encode='gbk')
len(data_C) #5560
data_D=pd.read_excel(file_path+'2018年最终获奖名单_D题.xls',encode='gbk')
len(data_D) #557
data_E=pd.read_excel(file_path+'2018年最终获奖名单_E题.xls',encode='gbk')
len(data_E) #1509
data_F=pd.read_excel(file_path+'2018年最终获奖名单_F题.xls',encode='gbk')
len(data_F) #2004
data_all=pd.concat([data_A,data_B,data_C,data_D,data_E,data_F],axis=1) 
#横向拼接设置axis=1,沿着水平方向来拼接。
print(data_all.head(10))
len(data_all)   #5560
#data_all拼接后的维度大小为:rownum x 6*columnnum
rownum=max([len(data_A),len(data_B),len(data_C),len(data_D),len(data_E),len(data_F)])
columnnum=len(data_A.columns.tolist()  )
print(data_all.head(5))   #出于尊重他人隐私的目的,详细的结果不在此给出,后续也希望参看该篇博客文章练习的同学勿轻易泄露他人信息为盼！！！

1.1.2.将6张表纵向拼接；

import pandas as pd
import xlwt
import numpy as np
file_path=r'C:/Users/Administrator/Desktop/AAA/'
data_A=pd.read_excel(file_path+'2018年最终获奖名单_A题.xls',encode='gbk')
len(data_A) #678
data_A.columns.tolist()  
#['序号', '题号', '队伍编号', '奖项', '队长姓名', '队长所在单位', '第一队友姓名', '第一队友所在单位', '第二队友姓名', '第二队友所在单位']
data_B=pd.read_excel(file_path+'2018年最终获奖名单_B题.xls',encode='gbk')
len(data_B) #1899
data_C=pd.read_excel(file_path+'2018年最终获奖名单_C题.xls',encode='gbk')
len(data_C) #5560
data_D=pd.read_excel(file_path+'2018年最终获奖名单_D题.xls',encode='gbk')
len(data_D) #557
data_E=pd.read_excel(file_path+'2018年最终获奖名单_E题.xls',encode='gbk')
len(data_E) #1509
data_F=pd.read_excel(file_path+'2018年最终获奖名单_F题.xls',encode='gbk')
len(data_F) #2004
data_all=pd.concat([data_A,data_B,data_C,data_D,data_E,data_F],axis=0) 
#横向拼接设置axis=0,沿着竖直方向来拼接。
print(data_all.head(10))
len(data_all)   #5560
#data_all拼接后的维度大小为:rownum x columnnum
rownum=sum([len(data_A),len(data_B),len(data_C),len(data_D),len(data_E),len(data_F)]) #12207
columnnum=len(data_A.columns.tolist())    #10
print(data_all.head(5))   #出于尊重他人隐私的目的,详细的结果不在此给出,后续也希望参看该篇博客文章练习的同学勿轻易泄露他人信息为盼！！！
#保存全国竞赛汇总数据信息
data_all.to_excel(file_path+'2018全国研究生建模参赛信息汇总.xls',encoding='gbk')

1.1.3.简单的检索功能；

#1.检索自己学校的参赛情况
file_path=r'C:/Users/Administrator/Desktop/AAA/'    #outputfile path
data_SMU=data_all[((data_all['队长所在单位']=='XX大学')|
                                    (data_all['第一队友所在单位']=='XX大学')|
                                    (data_all['第二队友所在单位']=='XX大学'))]
data_SMU.to_excel(file_path+'XX大学2018研究生建模参赛信息汇总.xls',encoding='gbk')
#2.#1.获奖队伍
prized=data_SMU[~(data_SMU['奖项']=='成功参与奖')]
#2.未获奖队伍
unprized=data_SMU[data_SMU['奖项']=='成功参与奖']
prized['奖项'].value_counts()  #分别计算各个奖项获奖队伍数,默认是降序
"""
三等奖    63
二等奖    30
一等奖     3
"""
prizedCount=prized['奖项'].value_counts(ascending=True)
"""
一等奖     3
二等奖    30
三等奖    63
"""
unprizedCount=unprized['奖项'].value_counts() #计算成功参与奖的获奖队伍数
#成功参与奖    139
#2018华为杯全国研究生数学建模,XX大学队伍获奖率
prizedsum=np.sum(prizedCount[:])
prizeate=np.sum(prizedCount)/(np.sum(unprizedCount)+prizedsum) # 0.4393063583815029
prizeate # 0.4393063583815029
#XX大学总人数占2018年参赛队伍比重
rate=sum(sum(prizedCount)+unprizedCount)/data_all.shape[0] #参赛总人数=12207
rate
#3."""1.发现数据中: 一等奖（华为）和 一等奖同类异名,考虑去重复项并合并,使用正则表达式或者字符串替换"""
data_all['奖项']=data_all['奖项'].apply(lambda x:x.replace('一等奖（华为）','一等奖')) #同类异名的合并
#4.全国的获奖分层情况
chooses,category=[data_all['题号'].value_counts(ascending=True),data_all['奖项'].value_counts(ascending=True)]
chooses
category
totalNum=data_all.shape[0]
prize1_rate,prize2_rate,prize3_rate,unprize_rate=category/totalNum
print('\n一等奖: ',prize1_rate,'\n二等奖: ',prize2_rate,'\n三等奖: ',prize3_rate,'\n成功参与奖: ',unprize_rate)
#获奖人数&未获奖人数占比
lucky_count=sum(category[:3]) #获奖人数:4358
success_join_count=totalNum-lucky_count #未获奖人数:7849
print('2018年华为杯数学建模获奖率: ',prize1_rate+(prize2_rate+prize3_rate))

效果：

一等奖:  0.015073318587695584 
二等奖:  0.13008929302859015 
三等奖:  0.21184566232489555 
成功参与奖:  0.6429917260588187
2018年华为杯数学建模获奖率:  0.3570082739411813

··· 1.1.4.对汇总表的数据探索
直接选中"2018全国研究生建模参赛信息汇总.xls"中的两列:“题号"和"奖项"即可做粗略的数据探索(excel中直接点击"插入”>"图表"即可自助生成很多好看的报表)；
A.2018华为杯全国研究生数学建模各题队伍分布:

B.2018华为杯全国研究生数学建模奖项分布汇总:
1>宏观:

2>微观:

C.2018华为杯全国研究生数学建模一等奖的赛题分布：

2.抽取参赛高校列表

#高校名称列表
import pandas as pd
university_list=list(pd.concat([data_all['队长所在单位'],data_all['第一队友所在单位'],data_all['第二队友所在单位']]).unique())
university_list

['华北电力大学',
 '吉林大学',
 '东北林业大学',
 '同济大学',
 '华东师范大学',
 ……
 '美国康奈尔大学',
 '重庆医科大学',
 '北京语言大学',
 '中共上海市委党校',
 '香港大学',
 '新加坡国立大学',
 '中国人民公安大学',
 '中国航天科技集团公司航天时代电子公司（13所）',
 '中国航天科技集团公司第五研究院（511 所）',
 '中国航天科技集团公司第一研究院（14所）',
 '密歇根大学',
 '国家海洋局第一海洋研究所',
 '中国航天科工集团公司第三研究院（35所）',
 '中国地震局地球物理研究所',
 '中国航天科技集团公司第一研究院（703所）']

3.分别抽取出来每个学校的参赛信息(对学校分群)

#分别抽取出来每个学校的参赛信息
#university=[] #将各个大学分群
university={} #将各个大学分群
totalNum=data_all.shape[0] #参赛队伍总支数
for i in range(len(university_list)):
    #grade.append(university_list[i]+str(i))
    del data_SMU
    data_SMU=data_all[((data_all['队长所在单位']==university_list[i])|(data_all['第一队友所在单位']==university_list[i])|(data_all['第二队友所在单位']==university_list[i]))].reset_index(drop=True)
    del data_SMU['序号']
    university[university_list[i]]=data_SMU

4.统计每个学校的参赛信息
4.1.设计存储每一个学校参赛相关信息的数据结构

xuexiao1={'学校名称':XX大学,
          '参赛人数':1000,
          '获奖总队伍数':480,
          '未获奖总队伍数':1000-480,
          '学校各题获奖比率':[{‘A’：18.5%}，{‘B’：28.5%}，{C’：15.5%}，{‘D’：38.5%}，{‘C’：58.5%}，{‘D’：48.5%}],
          '学校获奖比':480/1000
          '学校各题获奖明细':{
          'A':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1},
          'B':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1},
          'C':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1},
          'D':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1},
          'E':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1},
          'F':{'一等奖队伍数':one_prize1, '一等奖获奖比率':one_rate1,'二等奖队伍数':two_prize1, '二等奖获奖比率':two_rate1, '三等奖队伍数':three_prize1,'三等奖获奖比率':three_rate1,'成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1, '获奖队伍数':award_prize,'获奖比率':prized_rate1}
            }
          }

4.2.分别统计每一个大学的各个赛题参与和完成获奖情况

totalUniv={}
saiti_list=['A','B','C','D','E','F']
for i in range(len(university)):
#for i in range(5):
    #print(university[university_list[0]]) #university为字典,学校名称为key
    xiexiao={}
     #xiexiao1=university[university_list[3]]
    xiexiao1=university[university_list[i]]
    #xiexiao1=university[university_list[77]] #3--同济大学，77--海事大学
    #学校名称(三列中的众数)
    zhongshu=pd.concat([xiexiao1['队长所在单位'],xiexiao1['第一队友所在单位'],xiexiao1['第二队友所在单位']]) #Series
    xiexiao['学校名称']= zhongshu.value_counts().index[0] #value_counts默认是降序,选择众数对应的索引值即为学校.
    #chooses=xiexiao1['题号'].value_counts(ascending=True) #对应赛题选做队伍支数
    ##A=xiexiao1[xiexiao1['题号']].value_counts()
    #prizeoption=xiexiao1['奖项'].unique()
    #1.分析获奖总人数
    xiexiao['参赛队伍']=len(xiexiao1)
    #totalUniv[university_list[3]]=xiexiao
    #totalUniv[university_list[i]]=xiexiao
    #2.分析该学校的各个赛题完成情况
    #2.1.选做A题的情况
    #xiexiao1[xiexiao1['题号']=='A']['奖项'].value_counts(ascending=True) #返回A赛题对应的获奖情况
    #2.2.六道赛题各自获奖情况一览表
    """
    zhou=[1,2,4,5],zhou[-1],zhou[:-1]
    """
    timu={}#存放六道赛题各自对应的获奖情况
    sum_prize1=0
    award_prize=0
    for ii in range(len(saiti_list)):
        #print(saiti_list[ii])
        #things=things.index
        #必须对things进行初始化,不然有的学校没有一等奖things[0]就错位了,就出错了.
        things=xiexiao1[xiexiao1['题号']==saiti_list[ii]]['奖项'].value_counts(ascending=True)
        #发现同济大学有B,但是B题目没有一等奖
        #things=xiexiao1[xiexiao1['题号']==saiti_list[ii]]['奖项'].value_counts(ascending=True)
        ##赋初值,因为每个奖不一定都有.
        one_rate1=0
        two_rate1=0
        three_rate1=0
        non_rate1=0
        prized_rate1=0
        try:
            #一等奖队伍数
            try:
                if ~things[things.index=='一等奖'].empty:
                    #print('1')
                    one_prize1=things[things.index=='一等奖'] #type(one_prize1)=Series
                    if len(one_prize1)==0:
                        one_prize1=0
                    elif len(one_prize1)==1:
                        #one_prize1=one_prize1.values[0,0] #将Series转换为二维数组
                        one_prize1=list(one_prize1)[0] #将Series转换为list在取值也可以
                else:
                    one_prize1=0
            except  :
                pass
            finally:
                print('one_prize1出错啦！！！！！！！！！！！')    
            #二等奖人数
            try:
                if ~things[things.index=='二等奖'].empty:
                    two_prize1=things[things.index=='二等奖']
                    if len(two_prize1)==0:
                        two_prize1=0
                    elif len(two_prize1)==1:
                        #one_prize1=one_prize1.values[0,0] #将Series转换为二维数组
                        two_prize1=list(two_prize1)[0] #将Series转换为list在取值也可以
                else:
                    two_prize1=0
            except  :
                pass
            finally:
                print('two_prize1出错啦！！！！！！！！！！！')  
            #三等奖队伍数
            try:
                if ~things[things.index=='三等奖'].empty:
                    three_prize1=things[things.index=='三等奖']
                    if len(three_prize1)==0:
                        three_prize1=0
                    elif len(three_prize1)==1:
                        #one_prize1=one_prize1.values[0,0] #将Series转换为二维数组
                        three_prize1=list(three_prize1)[0] #将Series转换为list在取值也可以
                else:
                    three_prize1=0
            except  :
                pass
            finally:
                print('three_prize1出错啦！！！！！！！！！！！')
            #成功参与奖队伍数===未获奖人数
            try:
                if ~things[things.index=='成功参与奖'].empty:
                    non_prize1=things[things.index=='成功参与奖']
                    if len(non_prize1)==0:
                        non_prize1=0
                    elif len(non_prize1)==1:
                        #one_prize1=one_prize1.values[0,0] #将Series转换为二维数组
                        non_prize1=list(non_prize1)[0] #将Series转换为list在取值也可以
                else:
                    non_prize1=0
            except  :
                pass
            finally:
                print('non_prize1出错啦！！！！！！！！！！！')
            #获奖队伍总数
            award_prize=sum(things[:-1])
            #某道赛题的参赛总队伍数
            sum_prize1=sum(things)
            #一等奖队伍与该赛题参赛队伍总数的占比
            one_rate1=one_prize1/sum_prize1
            #二等奖队伍与该赛题参赛队伍总数的占比
            two_rate1=two_prize1/sum_prize1
            #三等奖队伍与该赛题参赛队伍总数的占比
            three_rate1=three_prize1/sum_prize1
            #未获奖队伍与该赛题参赛队伍总数的占比
            non_rate1=non_prize1/sum_prize1
            #获奖队伍与该赛题参赛队伍总数的占比
            prized_rate1=award_prize/sum_prize1
            timu[saiti_list[ii]]={
                    '一等奖队伍数':one_prize1,
                    '一等奖获奖比率':one_rate1,
                    '二等奖队伍数':two_prize1,
                    '二等奖获奖比率':two_rate1,
                    '三等奖队伍数':three_prize1,
                    '三等奖获奖比率':three_rate1,
                    '成功参与奖队伍数':non_prize1,'未获奖比率':non_rate1,
                    '获奖队伍数':award_prize,'获奖比率':prized_rate1}
            #del things
        except  :
            pass
        #finally:
        #     print('出错啦！！！！！！！！！！！')
    #3.获奖总人数
    try:
        total_queue=0
        for i1 in range(len(timu)):
            try:
                total_queue+=timu[saiti_list[i1]]['获奖队伍数']
            except:
                continue
        xiexiao['获奖总队伍数']=total_queue
    except:
            pass
    #4.未获奖总人数
    try:
        un_num=0
        for i1 in range(len(timu)):
            try:
                un_num+=timu[saiti_list[i1]]['成功参与奖队伍数']
            except:
                continue
        xiexiao['未获奖总队伍数']=un_num
    except:
            pass
    #5.某赛题获奖情况本质上为一个list=[]对象
    try:
        rate_list={}
        for i1 in range(len(timu)):
            rate_list[saiti_list[i1]]=timu[saiti_list[i1]]['获奖比率']
        xiexiao['学校各题获奖比率']=rate_list
    except:
            pass
    #5.学校各道赛题完成获奖情况
    try:
        xiexiao['学校各题获奖明细']=timu
    except:
            pass
    #5.学校获奖比
    try:
        xx_rate=total_queue/len(xiexiao1) #学校的参与竞赛总人数
        xiexiao['学校获奖比']=xx_rate
    except:
            pass
    #totalUniv.append(xiexiao)
    totalUniv[university_list[i]]=xiexiao
    del xiexiao1
    
#保存字典数据:使用DataFrame
import pandas as pd
data=pd.DataFrame(totalUniv,columns=totalUniv.keys()).T
columns_name=data.columns.tolist()
#各列数值不变的条件下来重命名各列
#data.columns=[['参赛队伍', '学校各题获奖明细', '学校各题获奖比率', '学校名称', '学校获奖比', '未获奖总队伍数', '获奖总队伍数']]
#各列随着名称先后顺序发生位置变化
data=pd.DataFrame(totalUniv,columns=totalUniv.keys()).T
#重新指定列的顺序
data=data[['学校名称','参赛队伍', '获奖总队伍数', '未获奖总队伍数','学校各题获奖明细', '学校各题获奖比率',  '学校获奖比']]
#data[data['学校名称']=='XX大学']
data.to_csv('E:/jpzhou.csv',index=False)

这里由宏观到微观铺开整个数据结构的组织结果：
A.宏观:

B.微观:xuexiao1对象的展开

C.xuexiao1对象中的"学校各题获奖明细"展开

5.统计shanghai地区大学的参赛情况
····5.1.统计shanghai地区大学的参赛情况

#按照参赛人数对字典进行排序
join_party={}
for i in range(len(university_list)):
#for i in range(5):
    #print(university[university_list[0]]) #university为字典,学校名称为key
    try:
        xiexiao1=totalUniv[university_list[i]]
        num=int(xiexiao1['参赛队伍'])
        join_party[str(university_list[i])]=num
        print(xiexiao1)
    except:
        continue
univ_totalnum=list(sorted(join_party.items(),key=lambda x:x[1],reverse=True)) #默认升序,True为降序.
#上海各个高效参赛队伍直方图
#筛选出上海的高校
shanghai_univ=[]
for i in range(len(univ_totalnum)):
    for item in ['上海','华东','东华','同济','复旦','解放军第二军医']:
        if item in univ_totalnum[i][0]:
            shanghai_univ.append(univ_totalnum[i])
        else:
            continue
#删除离群点非上海的高校
del shanghai_univ[9]  #删除中国石油大学(华东)---青岛
del shanghai_univ[12] #华东交通大学----江西  
#获得上海高校列表34所
#画出直方图
import matplotlib.pyplot as plt
plt.subplots(figsize=(10,6))
plt.rcParams['font.sans-serif'] = ['SimHei']  #用来显示中文
plt.bar(range(len(shanghai_univ)),[shanghai_univ[i][1] for i in range(len(shanghai_univ))],color='blue',align='center')
plt.title("上海各高校2018年'华为杯'全国研究生数学建模竞赛参赛队伍直方图")
plt.xticks(range(len(shanghai_univ)),[shanghai_univ[i][0] for i in range(len(shanghai_univ))],rotation=90)
plt.xlim([-1,len(shanghai_univ)])
plt.xlabel("上海高校")
plt.ylabel("队伍数")
plt.tight_layout()
plt.show()            
shanghai_university=shanghai_univ
type(shanghai_university[0][0])
type(shanghai_university[0][1])

shanghai_university=shanghai_univ
type(shanghai_university[0][0])
type(shanghai_university[0][1])


#将上海高校参赛数据入数据库保存
import sqlite3
conn=sqlite3.connect('E:/代码练习区256/MathModel/cmath2018.sqlite')
curs=conn.cursor()
#conn.close()
#在Python中一个分号算是一条语句,curs.execute(sql(i))只执行一条语句
curs.execute("drop table if EXISTS unives_shanghai");
#curs.close()
curs.execute("create table unives_shanghai(uid varchar(10) PRIMARY KEY,univ_name varchar(30),groupe_num int)")
#curs.execute("insert into unives_shanghai(uid,univ_name,groupe_num) values('123456','中国科学技术大学',240)") #% ('123456','中国科学技术大学',240))

id1='10247'+str(1)
name1=shanghai_university[1][0]
num1=shanghai_university[1][1]
#print("统计的数学===(%s,%s,%d)" % (id1,name1,num1))
#curs.execute("insert into unives_shanghai(uid,univ_name,groupe_num) values('%s','%s','%d')" % (id1,name1,num1)) #% ('123456','中国科学技术大学',240))

curs.execute("select * from unives_shanghai")
df1=curs.fetchall()

#for i in range(2,len(shanghai_university)):
for i in range(len(shanghai_university)):
    try:
        curs.execute("insert into unives_shanghai(uid,univ_name,groupe_num) values('%s','%s','%d')" % ('10247'+str(i),shanghai_university[i][0],shanghai_university[i][1]))
    except Exception as ex:  #异常的抛出
        print("Exception: ", str(ex))
        pass

curs.execute("select * from unives_shanghai")
df1=curs.fetchall()
#挑选出来上海地区参赛队伍数>=100的学校
curs.execute("select * from unives_shanghai where groupe_num>=100")
df1=curs.fetchall()

注释1：
insert错误
curs.execute(“insert into unives_shanghai(univ_name,groupe_num) values(%s,%d)” % (‘zhonguo’,240))
OperationalError: no such column: zhonguo
解决办法： values中%s需要打单冒号’ ‘或者双引号" "。
curs.execute("insert into unives_shanghai(uid,univ_name,groupe_num) values(’%s’,’%s’,’%d’)" % (id1,name1,num1)) #% (‘123456’,‘XX大学’,240))

····5.2.统计shanghai地区部分大学的参赛获奖情况

#筛选出来上海各个高校的获奖情况
shanghai_get={}
for i in range(len(shanghai_university)):
    shanghai_get[shanghai_university[i][0]]=totalUniv[shanghai_university[i][0]]
#画出获奖高校获奖队伍数直方图
#排序前    
import matplotlib.pyplot as plt
plt.subplots(figsize=(10,6))
plt.rcParams['font.sans-serif'] = ['SimHei']  #用来显示中文
#for i in shanghai_get:
#    print(i)
plt.bar(range(len(shanghai_get)),[shanghai_get[i]['获奖总队伍数'] for i in shanghai_get],color='blue',align='center')
plt.title("上海各高校2018年'华为杯'全国研究生数学建模竞赛获奖队伍直方图")
plt.xticks(range(len(shanghai_get)),[shanghai_get[i]['学校名称'] for i in shanghai_get],rotation=90)
plt.xlim([-1,len(shanghai_get)])
plt.xlabel("上海高校")
plt.ylabel("获奖队伍数")
plt.tight_layout()
plt.show() 
#排序后:数据复杂不好弄,单独取出来再做分析,简化操作过程
namename={}
for i in shanghai_get:
    namename[i]=shanghai_get[i]['获奖总队伍数']
zhouzhou=sorted(namename.items(),key=lambda x:x[1],reverse=True)
import matplotlib.pyplot as plt
plt.subplots(figsize=(10,6))
plt.rcParams['font.sans-serif'] = ['SimHei']  #用来显示中文
plt.bar(range(len(zhouzhou)),[zhouzhou[i][1] for i in range(len(zhouzhou))],color='blue',align='center')
plt.title("上海各高校2018年'华为杯'全国研究生数学建模竞赛获奖队伍直方图")
plt.xticks(range(len(zhouzhou)),[zhouzhou[i][0] for i in  range(len(zhouzhou))],rotation=90)
plt.xlim([-1,len(zhouzhou)])
plt.xlabel("上海高校")
plt.ylabel("获奖队伍数")
plt.tight_layout()
plt.show()
import pandas as pd
data2=pd.DataFrame(shanghai_get,columns=shanghai_get.keys()).T
columns2=data2.columns.tolist()
data2=data2[[ '学校名称','参赛队伍', '获奖总队伍数', '未获奖总队伍数', '学校获奖比', '学校各题获奖比率']]
data2.to_csv('E:/上海高校数模获奖_data.csv',index=False)

A.排序前：

B.排序后：

备注2：上图仅节选了部分代表性高校做展示，另外为方便数据展示，对高校获奖率*1000，沪上各个高校的实际获奖率=图上获奖率数值/1000。

5.3.统计全国的情况

#全国的情况
shouzhou=sorted(join_party.items(),key=lambda x:x[1],reverse=True)
import pandas as pd
data2=pd.DataFrame(shouzhou,columns=['学校','参赛队伍数'])
columns2=data2.columns.tolist()
data2.to_csv('E:/全国高校数模参赛人数_data.csv',index=True)
#全国有实力高效的获奖情况
import pandas as pd
data2=pd.DataFrame([totalUniv[i] for i in totalUniv],index=totalUniv.keys())
columns2=data2.columns.tolist()
#指定DataFrame各列的顺序
data2=data2[['学校名称', '参赛队伍', '获奖总队伍数','未获奖总队伍数', '学校各题获奖比率', '学校获奖比']]
#data2.reindex(range(len(data2.index.tolist()))) #直接传入想要的新index即可。但是很多东西没了
data2.to_csv('E:/全国数模获奖高校战果统计_data.csv',index=False)

备注3：波峰部分都是参赛人数较多的院校。
备注4：

获奖率=该校获奖队伍数/该校参赛总队伍数，获奖率依然是一个学校整体实力的表征，尽管参赛人数少，可能获奖率高，一定程度上参赛队伍数众多的情况下，某个学校依然表现出整体的获奖率超过50%，不得不说这个学校整体学生的水平是值得点赞的！

6.参赛人数的统计

#大致可以参考如下思路来尝试完成
mouxiaoTotalnum=0
for i in range(len(data_all)):
	#三个队员均来自本校
	if data_all[i]['队长所在单位']=='XX大学')&
                                    (data_all[i]['第一队友所在单位']=='XX大学')&
                                    (data_all[i]['第二队友所在单位']=='XX大学')):
               mouxiaoTotalnum+=3   
         #仅两个队员均来自本校
	elif ((data_all[i]['队长所在单位']=='XX大学')&
                                    (data_all[i]['第一队友所在单位']=='XX大学')) or 
              ((data_all[i]['第一队友所在单位']=='XX大学')&
               (data_all[i]['第二队友所在单位']=='XX大学'))   or
                 ((data_all[i]['队长所在单位']=='XX大学') &
                                    (data_all[i]['第二队友所在单位']=='XX大学')):
               mouxiaoTotalnum+=2  
         #仅一个队员均来自本校
        elif （data_all[i]['队长所在单位']=='XX大学') or
                                    (data_all[i]['第一队友所在单位']=='XX大学')  or
                                    (data_all[i]['第二队友所在单位']=='XX大学'):
               mouxiaoTotalnum+=1

7.每个大学"答题明细"对象挖掘分析
以同济大学和SMU大学为例。


#绘制SMU大学和同济大学的答题情况
"""
数据结构设计:
item\赛题 A  B  C  D  E  F 
1   A1    B1    C1    D1    E1    F1  
2   A2    B2    C2    D2    E2    F2  
3   A3    B3    C3    D3    E3    F3  
4   A4    B4    C4    D4    E4    F4  
5   A5    B5    C5    D5    E5    F5  
6   A6    B6    C6    D6    E6    F6  
7   A7    B7    C7    D7    E7    F7  
8   A8    B8    C8    D8    E8    F8  
9   A9    B9    C9    D9    E9    F9  
10  A10   B10   C10   D10   E10   F10  
11  A11   B11   C11   D11   E11   F11  

"""
#知识点:
#1.使用矩阵(Array)的转置,np.Array().T
#2.tuple/List的转置使用列表的解析式
saiti_list=['A','B','C','D','E','F']
zhou111=[]
for i in range(6):
    shou=[]
    for j in range(11):
        shou.append(saiti_list[i]+str(j+1))
    zhou111.append(shou)
"""
['A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11']
['B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11']
['C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11']
['D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']
['E1', 'E2', 'E3', 'E4', 'E5', 'E6', 'E7', 'E8', 'E9', 'E10', 'E11']
['F1', 'F2', 'F3', 'F4', 'F5', 'F6', 'F7', 'F8', 'F9', 'F10', 'F11']
"""
#将list/tuple做转置
grid = [[row[i] for row in zhou111] for i in range(len(zhou111[0]))]  
"""
['A1', 'B1', 'C1', 'D1', 'E1', 'F1']
['A2', 'B2', 'C2', 'D2', 'E2', 'F2']
['A3', 'B3', 'C3', 'D3', 'E3', 'F3']
['A4', 'B4', 'C4', 'D4', 'E4', 'F4']
['A5', 'B5', 'C5', 'D5', 'E5', 'F5']
['A6', 'B6', 'C6', 'D6', 'E6', 'F6']
['A7', 'B7', 'C7', 'D7', 'E7', 'F7']
['A8', 'B8', 'C8', 'D8', 'E8', 'F8']
['A9', 'B9', 'C9', 'D9', 'E9', 'F9']
['A10', 'B10', 'C10', 'D10', 'E10', 'F10']
['A11', 'B11', 'C11', 'D11', 'E11', 'F11']
"""
#SMU_data1=totalUniv[university_list[77]]  #同济大学3,上海海事大学77.
SMU_data1=totalUniv[university_list[3]]
MingXi=SMU_data1['学校各题获奖明细']
huizongTable=[]
saiti_list=['A','B','C','D','E','F']
mixname=MingXi[saiti_list[i]].keys()
#指定按照这个顺序来实现信息抽取
itemlist=['一等奖队伍数','一等奖获奖比率','二等奖队伍数',  '二等奖获奖比率',  '三等奖队伍数', '三等奖获奖比率','获奖队伍数','获奖比率','成功参与奖队伍数', '未获奖比率']
len(itemlist)
renlist=['获奖队伍数','成功参与奖队伍数']
for i in range(len(saiti_list)):
    item=MingXi[saiti_list[i]] #取到每一道题的作答情况
    shou=[]
    #for j in range(10):
    #    shou.append(item[itemlist[j]])
    item1=item[itemlist[0]] #一等奖队伍数
    shou.append(item1)
    item2=item[itemlist[1]]*100 #一等奖获奖比率,为方便可视化这里*100
    shou.append(item2)
    item3=item[itemlist[2]] #二等奖队伍数
    shou.append(item3)
    item4=item[itemlist[3]]*100 #二等奖获奖比率
    shou.append(item4)
    item5=item[itemlist[4]] #三等奖队伍数
    shou.append(item5)
    item6=item[itemlist[5]]*100 #三等奖获奖比率
    shou.append(item6)
    item7=item[itemlist[6]] #获奖队伍数
    shou.append(item7)
    item8=item[itemlist[7]]*100 #获奖比率
    shou.append(item8)
    item9=item[itemlist[8]] #成功参与奖队伍数 
    shou.append(item9)
    item10=item[itemlist[9]]*100 #未获奖比率
    shou.append(item10)
    zongren=item[renlist[0]]+item[renlist[1]]
    shou.append(zongren)
    huizongTable.append(shou)
#将汇总表做转置
#ScoreTable= [[row[i] for row in huizongTable] for i in range(len(huizongTable[0]))]  
ScoreTable=np.array(huizongTable).T  #转换成为numpy.array()后直接复制到Excel中处理分析即可
#空白记事本中替换无关的[,],',等等,换行顶格写,直接粘贴到Excel可以识别自动填充cell。


def Audit_Univ(output_path,univ_index):
    #SMU_data1=totalUniv[university_list[3]]
    SMU_data1=totalUniv[university_list[univ_index]]
    MingXi=SMU_data1['学校各题获奖明细']
    huizongTable=[]
    saiti_list=['A','B','C','D','E','F']
    #mixname=MingXi[saiti_list[i]].keys()
    #指定按照这个顺序来实现信息抽取
    itemlist=['一等奖队伍数','一等奖获奖比率','二等奖队伍数',  '二等奖获奖比率',  '三等奖队伍数', '三等奖获奖比率','获奖队伍数','获奖比率','成功参与奖队伍数', '未获奖比率']
    len(itemlist)
    renlist=['获奖队伍数','成功参与奖队伍数']
    for i in range(len(saiti_list)):
        item=MingXi[saiti_list[i]] #取到每一道题的作答情况
        shou=[]
        #for j in range(10):
        #    shou.append(item[itemlist[j]])
        item1=item[itemlist[0]] #一等奖队伍数
        shou.append(item1)
        item2=item[itemlist[1]]*100 #一等奖获奖比率,为方便可视化这里*100
        shou.append(item2)
        item3=item[itemlist[2]] #二等奖队伍数
        shou.append(item3)
        item4=item[itemlist[3]]*100 #二等奖获奖比率
        shou.append(item4)
        item5=item[itemlist[4]] #三等奖队伍数
        shou.append(item5)
        item6=item[itemlist[5]]*100 #三等奖获奖比率
        shou.append(item6)
        item7=item[itemlist[6]] #获奖队伍数
        shou.append(item7)
        item8=item[itemlist[7]]*100 #获奖比率
        shou.append(item8)
        item9=item[itemlist[8]] #成功参与奖队伍数 
        shou.append(item9)
        item10=item[itemlist[9]]*100 #未获奖比率
        shou.append(item10)
        zongren=item[renlist[0]]+item[renlist[1]]
        shou.append(zongren)
        huizongTable.append(shou)
    #将汇总表做转置
    #ScoreTable= [[row[i] for row in huizongTable] for i in range(len(huizongTable[0]))]  
    ScoreTable=np.array(huizongTable).T
    #答案拼接方式
    
    output_path1=output_path+'2018华为杯数学建模成绩_'+university_list[univ_index]+'.csv'
    import pandas as pd
    index_list=[]
    for i in range(len(itemlist)):
        index_list.append(itemlist[i])
    index_list.append('参赛人数')
    data_univ=pd.DataFrame(ScoreTable,columns=saiti_list,index=index_list)
    data_univ.to_csv(output_path1)
#统计数据输出
outpath_audit='E:/2018年华为杯数学建模分析汇总/audit1112/'
Audit_Univ(outpath_audit,3)
#生成所有参赛院校的成绩报表(然后在Excel表格中可以轻松地操作这些数据---散点图、折线图、直方图、饼图等等)
for i in range(len(university_list)):
    Audit_Univ(outpath_audit,i)

7.1.运行之后的表数据如下：

2018年华为杯SMU数学建模完成情况一览表						
						
······明细··	A	B	C	D	E	F
一等奖队伍数	0	0	0	0	2	1
一等奖获奖比率	0	0	0	0	6.66667	2.43902
二等奖队伍数	0	2	16	0	5	7
二等奖获奖比率	0	4.87805	15.3846	0	16.6667	17.0732
三等奖队伍数	1	16	23	4	11	8
三等奖获奖比率	8.33333	39.0244	22.1154	57.1429	36.6667	19.5122
获奖队伍数	1	18	39	3	18	16
获奖比率	   8.33333	43.9024	37.5	42.8571	60	39.0244
成功参与奖队伍数	11	23	65	3	12	25
未获奖比率 	91.6667	56.0976	62.5	42.8571	40	60.9756
参赛人数	··12	41	104	6	30	41
						
						
						
						
2018年华为杯同济大学数学建模完成情况一览表						
						
·····明细	A	B	C	D	E	F
一等奖队伍数	1	0	1	1	2	1
一等奖获奖比率	5	0	0.444444	2.32558	3.7037	0.763359
二等奖队伍数	8	22	69	13	12	33
二等奖获奖比率	40	20.9524	30.6667	30.2326	22.2222	25.1908
三等奖队伍数	6	20	72	10	15	37
三等奖获奖比率	30	19.0476	32	23.2558	27.7778	28.2443
获奖队伍数	12	42	142	24	29	71
获奖比率	60	40	63.1111	55.814	53.7037	54.1985
成功参与奖队伍数	5	63	83	19	25	60
未获奖比率 	25	60	36.8889	44.186	46.2963	45.8015
参赛人数	17	105	225	43	54	131

7.2.将生成的.csv文件打开可以在Excel中直接做分析量化，在此不再赘述。如:
2018华为杯数学建模成绩_同济大学.csv
2018华为杯数学建模成绩_SUM大学.csv
部分可视化分析效果如下：
7.2.1.两个学校6道赛题完成情况一览：
A.同济大学:

B.SMU大学：

7.2.2.两个学校6道赛题一等奖情况一览：
A.同济大学:

B.SMU大学：

7.2.3.高校数模战斗力排行榜(取战斗力前100名高校)
高校战斗力由各个等次的奖做加权求和。
一等奖权重：one_weight=0.3，二等奖权重：two_weight=0.17，
三等奖权重：three_weight=0.09，成功参与奖权重：canyu_weight=0.02

iter_zhanli={}
def Audit_Univ(output_path,univ_index):
    #SMU_data1=totalUniv[university_list[3]]
    SMU_data1=totalUniv[university_list[univ_index]]
    MingXi=SMU_data1['学校各题获奖明细']
    huizongTable=[]
    saiti_list=['A','B','C','D','E','F']
    #mixname=MingXi[saiti_list[i]].keys()
    #指定按照这个顺序来实现信息抽取
    itemlist=['一等奖队伍数','一等奖获奖比率','二等奖队伍数',  '二等奖获奖比率',  '三等奖队伍数', '三等奖获奖比率','获奖队伍数','获奖比率','成功参与奖队伍数', '未获奖比率']
    len(itemlist)
    renlist=['获奖队伍数','成功参与奖队伍数']
    zhanlili=0  #统计每个学校总的战斗力
    for i in range(len(saiti_list)):
        try:
            item=MingXi[saiti_list[i]] #取到每一道题的作答情况
        except:
            continue
        shou=[]
        #战斗力值矩阵
        zhandouli=0
        one_prizeli=0
        one_weight=0.3
        two_prizeli=0
        two_weight=0.17
        three_prizeli=0
        three_weight=0.09
        canyu_prizeli=0
        canyu_weight=0.02
        #for j in range(10):
        #    shou.append(item[itemlist[j]])
        item1=item[itemlist[0]] #一等奖队伍数
        one_prizeli+=item1*one_weight #一等奖战斗力值累计
        shou.append(item1)
        item2=item[itemlist[1]]*100 #一等奖获奖比率,为方便可视化这里*100
        shou.append(item2)
        item3=item[itemlist[2]] #二等奖队伍数
        two_prizeli+=item3*two_weight #二等奖战斗力值累计
        shou.append(item3)
        item4=item[itemlist[3]]*100 #二等奖获奖比率
        shou.append(item4)
        item5=item[itemlist[4]] #三等奖队伍数
        three_prizeli+=item5*three_weight #三等奖战斗力值累计
        shou.append(item5)
        item6=item[itemlist[5]]*100 #三等奖获奖比率
        shou.append(item6)
        item7=item[itemlist[6]] #获奖队伍数
        shou.append(item7)
        item8=item[itemlist[7]]*100 #获奖比率
        shou.append(item8)
        item9=item[itemlist[8]] #成功参与奖队伍数
        canyu_prizeli+=item9*canyu_weight
        shou.append(item9)
        item10=item[itemlist[9]]*100 #未获奖比率
        shou.append(item10)
        zongren=item[renlist[0]]+item[renlist[1]]
        shou.append(zongren)
        #计算每道题目贡献出来的战斗力值
        zhandouli=canyu_prizeli+three_prizeli+two_prizeli+one_prizeli
        shou.append(zhandouli)
        huizongTable.append(shou)
        zhanlili+=zhandouli
    #将汇总表做转置
    #ScoreTable= [[row[i] for row in huizongTable] for i in range(len(huizongTable[0]))]  
    ScoreTable=np.array(huizongTable).T
    #各个学校的总战斗力值
    iter_zhanli[university_list[univ_index]]=zhanlili
    #答案拼接方式
    output_path1=output_path+'2018华为杯数学建模成绩_'+university_list[univ_index]+'.csv'
    import pandas as pd
    index_list=[]
    for i in range(len(itemlist)):
        index_list.append(itemlist[i])
    index_list.append('参赛人数')
    index_list.append('战斗力值')
    #data_univ=pd.DataFrame(ScoreTable,columns=saiti_list,index=index_list)
    #data_univ.to_csv(output_path1)
#统计数据输出
outpath_audit='E:/2018年华为杯数学建模分析汇总/audit1112/'
#Audit_Univ(outpath_audit,3)
#生成所有参赛院校的成绩报表(然后在Excel表格中可以轻松地操作这些数据---散点图、折线图、直方图、饼图等等)
for i in range(len(university_list)):
    Audit_Univ(outpath_audit,i)


#各个高校战斗力值排名,因为紧靠获奖人数/参赛总人数会拉低很多参赛人数多的高校的战斗力值的量化
#对各个高校的战斗力值字典进行排序(各个奖项按照权重做加和获得)
energyli=sorted(iter_zhanli.items() ,key=lambda x:x[1],reverse=True)
import matplotlib.pyplot as plt
plt.subplots(figsize=(30,15))
numnum1=100
plt.rcParams['font.sans-serif'] = ['SimHei']  #用来显示中文
#plt.bar(range(len(energyli)),[energyli[i][1] for i in range(len(energyli))],color='blue',align='center')
plt.bar(range(len(energyli[:numnum1])),[energyli[i][1] for i in range(numnum1)],color='blue',align='center')
plt.title("全国各高校2018年'华为杯'全国研究生数学建模高校战斗力排行榜")
#plt.xticks(range(len(energyli)),[energyli[i][0] for i in  range(len(energyli))],rotation=45)
#plt.xlim([-1,len(energyli)])
plt.xticks(range(numnum1),[energyli[i][0] for i in  range(numnum1)],rotation=90)
plt.xlim([-1,numnum1])
plt.xlabel("高校名称")
plt.ylabel("战斗力能量值")
plt.tight_layout()
plt.show()

8.不足
本文代码确实较多，相比较**Jean_V**的代码不够简洁。
https://blog.csdn.net/CSDN_wujian/article/details/83961212
另外，针对组队的情况，如果是一个队来自于三个院校，本文是给每个高校都投票一次，可能存在给某些院校多累计了队伍数，比各个高校官方发布数量略高，但是好处是各个高校中藏富于民的部分也都考虑在内了，总体的趋势跟各个高校官方差别甚微。在Jean_V的代码中每个队伍只投票一次，即：以队长所在高校为准来做统计分析。

你可能感兴趣的:(华为杯数学建模,Python)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st