skywuuuu

实战：运用pandas，正则表达式（re），xlrd，进行多个excel数据汇总，分类

前言

实习中的第二次实战，相比于第一次处理数据，这一次我更清晰地划分了函数功能，使得开发过程比第一次更快速了（比上次快了半天），尽管还是花了一天半（捂脸）。
第一次实战总结

Input

输入表格

文件夹中的excel文件，格式如下：

蝇类监测记录表（笼诱法）
调查日期：2030 年 4 月
调查地点： YY 省（自治区、直辖市） XX 地（市） ZZZ 县（区）
气温： 12.0 ℃；风力： 3 级；天气：晴√ 多云□ 阴□
诱饵种类：规定诱饵√；其他□：
序号	乡镇(街道)	日期	环境类型	监测地点	布笼数	苍蝇品种1	苍蝇品种2	苍蝇品种3	苍蝇品种4	……	苍蝇品种10	其他	合计	蝇种列合计	备注
1	a村	1.29	农贸市场	第一百菜市场	1	1				……		1	1
2	a村	1.29	居民区	第90中学宿舍	1					……		0	0
3	a村	1.29	绿化带	自然生态公园	1					……		0	0
……										……
8	a村	1.29	餐饮外环境	最好吃餐厅	1	0				……		0	0
9										……
10										……
11										……
……										……
填报单位： zz区天气预报中心填报人： Sky 审核人：John

Output

调查日期

调查地点

环境类型

诱饵

监测地点

苍蝇品种1

苍蝇品种2

苍蝇品种3

苍蝇品种4

……

苍蝇品种10

苍蝇品种11

苍蝇品种12

其他

经度

纬度

气温（℃）

风力（级）

天气

笼编号

监测单位

监测人

审核人

备注

2016/1/7

福建省福州市闽侯区aa街道（乡镇）

餐饮区外环境

规定诱饵

最好吃餐厅

……

晴

有或空

xx中心

Sky

John

2016/2/31

福建省福州市福州大学区bb街道（乡镇）

绿化带

规定诱饵

沧海公园

……

晴

有或空

xx中心

Sky

John

2016/3/2

福建省福州市鼓楼区uu街道（乡镇）

农贸市场

规定诱饵

第一市场

……

晴

有或空

xx中心

Sky

John

……

年-月-日

xx省yy市zz区aa街道（乡镇）

餐饮区外环境

规定诱饵

最好吃餐厅

……

晴

有或空

xx中心

Sky

John

对Input和Output的综合分析

结合Output推测从Input中提取的信息

第一行是表头（无实际意义）
第二行是调查日期，其实可以使用正则表达式提取年份和月份，但我直接从文件名种提取了，所以这一行对我也没有用。
第三行是调查地点，在这行需要提取省（自治区、直辖市），地（市）和县（区）
第四行需要提取气温，风力和天气
第五行需要提取诱饵种类
第7行-第8行的每一列都需要提取，不论有信息还是NaN
第9行-倒数第2行为空，需要跳过
最后一行需要提取填报单位，填报人和审核人

注意

使用正则表达式提取别人整理的excel数据肯定会出现各种bug，数据极有可能不像表面上一样规范，所以需要尽可能观察并兼容多的情况
在本表格中，提取出来的日期其实是小数（1.29），需要转换
本表格中有的NaN需要被处理为0，有的不需要处理
在Output表的列顺序与原表不同且有扩充，需要创建新列

函数功能分析

get_file_name(base_path)

比第一次实战总结做出了改进，使用了os.path.join和file.endswith这两个函数

def get_file_name(base_path): # base_path是最基本的文件夹绝对路径
    file_collection = []
    for dir, subDir, files in os.walk(base_path):
        # print(dir,'\t', subDir,'\t', files)
        for file in files:
            in_path = os.path.join(dir, file)  # 替换 in_path = dir + '/' + file
            if file.endswith('xlsx') or file.endswith('xls'):  # 筛选后缀为.xlsx和.xls的文件
                file_collection.append(in_path)
    return file_collection

get_year_month(file)

从文件名中提取年和月，file是文件名（叫file_name更好）

def get_year_month(file): 
    ym = re.findall(r'([0-9]{4}\.?[0-9]{2})', file) #文件名是包含yyyy.mm或yyyymm的格式
    if ym[0][4] == '.':  # 去掉小数点
        ym[0] = ym[0][:4] + ym[0][5:]
    ym[0] = ym[0][:4] + '-' + ym[0][4:] #将格式转为yyyy-mm
    return ym[0]

set_df_date(value, ym):

value是Input表格中日期列的值，是小数；ym是get_year_month(file)提取的年月，格式为yyyy-mm

def set_df_date(value, ym):
    string = str(value) # 将小数强转为str
    date = string[string.find('.') + 1:]  # 找到日
    date = ym + '-' + date  # 将年月和日结合形成时间：yyyy-mm-dd
    return date

get_sheet_df(file_name, sheet_name, col_names)

file_name为传入的文件名，sheet_name为sheet名，col_names是行数，即从第几行开始是表头（所有列的列名）

def get_sheet_df(file_name, sheet_name, col_names):
    work_book = xlrd.open_workbook(file_name) # 打开excel文件
    sheet = work_book.sheet_by_name(sheet_name) # 根据sheet_name找sheet
    # print(sheet.row_values(col_names)[0])

    df = pd.DataFrame([], columns=sheet.row_values(col_names)) # 根据列名建一个空的DataFrame
    for i in range(col_names + 1, sheet.nrows):
        if sheet.cell_value(i, 1) is '':  # excel中的空单元格数据为空字符串，也就是''
            break
        df.loc[i] = sheet.row_values(i)

    df.drop(['合计', '蝇种列合计', '布笼数'], axis=1, inplace=True)  # 丢掉没用的列，axis=1代表[row,col]的col
    df.replace('', 0, inplace=True)
    df.reset_index(drop=True, inplace=True)  # 重设索引，drop=True表示丢掉原本的索引
    # print(df)

    # 使用不同的函数得到每一列的准确数据
    invs_place = set_invs_place(sheet)
    temp, wind, weather = get_temp_wind_weather(sheet) # temp为temperature缩写
    bait_type = get_bait_type(sheet)
    unit, reporter, people_in_charge = get_unit_Reporter_PeopleInCharge(sheet)
    date = set_df_date(df.loc[0, '日期'], get_year_month(file_name))  # df.loc[0,'日期']因为同一个表格同一天的日期都是一样的，所以可以直接取一个点

    # 赋值与调整值
    for i in range(df.shape[0]):
        df.loc[i, '乡镇(街道)'] = invs_place + df.loc[i, '乡镇(街道)'] + '乡镇(街道)'
        df.loc[i, '气温(℃)*'] = temp
        df.loc[i, '风力(级)*'] = wind
        df.loc[i, '天气*'] = weather
        df.loc[i, '诱饵*'] = bait_type
        df.loc[i, '监测单位*'] = unit
        df.loc[i, '监测人*'] = reporter
        df.loc[i, '审核人'] = people_in_charge
        df.loc[i, '日期'] = date
        if df.loc[i, '环境类型'] == '餐饮外环境':
            df.loc[i, '环境类型'] = '餐饮区外环境'


    df.rename(columns={
     '序号': '笼编号', '日期': '调查日期*', '乡镇(街道)': '调查地点*'}, inplace=True) # 重命名列名

    # 补充新空列
    df[['经度', '纬度', '棕尾别麻蝇*', '瘦叶带绿蝇*']] = df.apply(lambda x: ('', '', '', ''), axis=1, result_type='expand')

    # 调整列的位置
    df = adjust_columns_position(df)
    return df

adjust_columns_position(df)

因为列的顺序有变换，所以这里手动调整位置（不懂有没有更好的方法）
补充：DataFrame调整列顺序有两个常见方法：

直接传入完整列名listdf.columns = ['aa','bb','cc']
如下方法：先保存原本的列，然后删除，再手动插入到df指定位置中
总结：两种方法都很麻烦，目前不知道有没有更好的办法。

def adjust_columns_position(df):
    df_time, df_no, df_bz, df_bait, df_jd, df_wd, df_sy, df_zy = \
        df['调查日期*'], df['笼编号'], df['备注'], df['诱饵*'], df['经度'], df['纬度'], df['瘦叶带绿蝇*'], df['棕尾别麻蝇*']
    df.drop(['调查日期*', '笼编号', '备注', '诱饵*', '经度', '纬度', '棕尾别麻蝇*', '瘦叶带绿蝇*'], axis=1, inplace=True)
    df.insert(0, '调查日期*', df_time)
    df.insert(3, '诱饵*', df_bait)
    df.insert(18, '棕尾别麻蝇*', df_zy)
    df.insert(20, '瘦叶带绿蝇*', df_sy)
    df.insert(22, '经度', df_jd)
    df.insert(23, '纬度', df_wd)
    df.insert(27, '笼编号', df_no)
    df.insert(31, '备注', df_bz)
    return df

set_invs_place(sheet)

第三行是调查地点，本来是要根据正则表达式提取结果，但是有的表格没有填写省市，为了方便起见遂直接定义省市，且已知区县，其实这边更好的处理是如果有就返回正确值，没有就返回空，之后会进行改进。
正则表达式零宽断言的用法：
(?<=expression)：表示匹配expression之后的值
(?=expression)：表示匹配expression之前的值
这边结合两者，就可以直接提取值了
[\u4e00-\u9fa5]：只匹配汉字
\s：匹配空格，tab等
之后的几个函数都有用到这边列举的思想

def set_invs_place(sheet):
    total = re.findall(r'(?<=\s)[\u4e00-\u9fa5]+(?=\s)', sheet.row_values(2)[0])  # 第三行是调查地点
    base_place = '福建省福州市'
    for value in total:
        if value == '闽侯' or value == '鼓楼':
            return base_place + value + '区'

get_temp_wind_weather(sheet)

\d：匹配数字
.：匹配小数点，注意和.区分，没有转义的小数点什么都能匹配

def get_temp_wind_weather(sheet):
    temp_wind = re.findall(r'(?<=[\s：])[\d\.]+(?=[\s℃])', sheet.row_values(3)[0])  # 第四行是气温，风力，天气
    weather = re.findall(r'(?<=[(天气：)\s])[\u4e00-\u9fa5]+(?=[√☑])', sheet.row_values(3)[0])
    # print(temp_wind)
    # print(weather)
    return temp_wind[0], temp_wind[1], weather

get_bait_type(sheet)

def get_bait_type(sheet):
    bait_type = re.findall(r'(?<=诱饵种类：)[\u4e00-\u9fa5]+(?=[√□☑])', sheet.row_values(4)[0])  # 第五行是诱饵种类
    # print(bait_type)
    return bait_type

get_unit_Reporter_PeopleInCharge(sheet)

def get_unit_Reporter_PeopleInCharge(sheet):
    total = re.findall(r'(?<=\s)[\u4e00-\u9fa5a-z]+(?=\s)', sheet.row_values(56)[0])  # 第五十七行是填报单位，填报人，审核人
    # [\u4e00-\u9fa5]代表只匹配汉字
    # print(total)
    if len(total) == 3: ## 有的没有审核人，所以len可能是2或3
        return total[0], total[1], total[2]
    elif len(total) == 2:
        return total[0], total[1], None

save_file(df, path, region)

def save_file(df, path, region):
    df.to_csv(path + '\\' + region + '汇总.csv', encoding='gbk', index=False)  # 保存为csv

完整代码

import os
import re
import pandas as pd
import numpy as np
import xlrd


def get_file_name(base_path): # 第一篇实战同款函数，但进行了大升级
    file_collection = []
    for dir, subDir, files in os.walk(base_path):
        # print(dir,'\t', subDir,'\t', files)
        for file in files:
            in_path = os.path.join(dir, file)  # 替换 in_path = dir + '/' + file
            if file.endswith('xlsx') or file.endswith('xls'):  # 筛选后缀为.xlsx和.xls的文件
                file_collection.append(in_path)
    return file_collection


def get_year_month(file):
    ym = re.findall(r'([0-9]{4}\.?[0-9]{2})', file)
    if ym[0][4] == '.':  # 去掉.
        ym[0] = ym[0][:4] + ym[0][5:]
    ym[0] = ym[0][:4] + '-' + ym[0][4:]
    # for v in ym_total:
    #     print(v)
    return ym[0]


def set_df_date(value, ym):
    string = str(value)
    date = string[string.find('.') + 1:]  # 找到日
    date = ym + '-' + date  # 将年月和日结合形成时间
    return date


def get_sheet_df(file_name, sheet_name, col_names):
    work_book = xlrd.open_workbook(file_name)
    sheet = work_book.sheet_by_name(sheet_name)
    # print(sheet.row_values(col_names)[0])

    df = pd.DataFrame([], columns=sheet.row_values(col_names))
    for i in range(col_names + 1, sheet.nrows):
        if sheet.cell_value(i, 1) is '':  # excel中的空单元格数据为空字符串，也就是''
            break
        df.loc[i] = sheet.row_values(i)

    df.drop(['合计', '蝇种列合计', '布笼数'], axis=1, inplace=True)  # 丢掉没用的列，axis=1代表[row,col]的col
    df.replace('', 0, inplace=True)
    df.reset_index(drop=True, inplace=True)  # 重设索引，drop=True表示丢掉原本的索引
    # print(df)

    # 得到每一列的准确数据
    invs_place = set_invs_place(sheet)
    temp, wind, weather = get_temp_wind_weather(sheet)
    bait_type = get_bait_type(sheet)
    unit, reporter, people_in_charge = get_unit_Reporter_PeopleInCharge(sheet)
    date = set_df_date(df.loc[0, '日期'], get_year_month(file_name))  # df.loc[0,'日期']因为同一个表格同一天的日期都是一样的，所以可以直接取一个点

    # 赋值与调整值
    for i in range(df.shape[0]):
        df.loc[i, '乡镇(街道)'] = invs_place + df.loc[i, '乡镇(街道)'] + '乡镇(街道)'
        df.loc[i, '气温(℃)*'] = temp
        df.loc[i, '风力(级)*'] = wind
        df.loc[i, '天气*'] = weather
        df.loc[i, '诱饵*'] = bait_type
        df.loc[i, '监测单位*'] = unit
        df.loc[i, '监测人*'] = reporter
        df.loc[i, '审核人'] = people_in_charge
        df.loc[i, '日期'] = date
        if df.loc[i, '环境类型'] == '餐饮外环境':
            df.loc[i, '环境类型'] = '餐饮区外环境'


    df.rename(columns={
     '序号': '笼编号', '日期': '调查日期*', '乡镇(街道)': '调查地点*'}, inplace=True)

    # 补充新空列
    df[['经度', '纬度', '棕蝇*', '绿蝇*']] = df.apply(lambda x: ('', '', '', ''), axis=1, result_type='expand')

    # 调整列的位置
    df = adjust_columns_position(df)
    return df


def adjust_columns_position(df):
    df_time, df_no, df_bz, df_bait, df_jd, df_wd, df_sy, df_zy = \
        df['调查日期*'], df['笼编号'], df['备注'], df['诱饵*'], df['经度'], df['纬度'], df['绿蝇*'], df['棕蝇*']
    df.drop(['调查日期*', '笼编号', '备注', '诱饵*', '经度', '纬度', '棕蝇*', '绿蝇*'], axis=1, inplace=True)
    df.insert(0, '调查日期*', df_time)
    df.insert(3, '诱饵*', df_bait)
    df.insert(18, '棕蝇*', df_zy)
    df.insert(20, '绿蝇*', df_sy)
    df.insert(22, '经度', df_jd)
    df.insert(23, '纬度', df_wd)
    df.insert(27, '笼编号', df_no)
    df.insert(31, '备注', df_bz)
    return df

def set_invs_place(sheet):
    total = re.findall(r'(?<=\s)[\u4e00-\u9fa5]+(?=\s)', sheet.row_values(2)[0])  # 第三行是调查地点
    base_place = '福建省福州市'
    for value in total:
        if value == '鼓楼' or value == '闽侯':
            return base_place + value + '区'


def get_temp_wind_weather(sheet):
    temp_wind = re.findall(r'(?<=[\s：])[\d\.]+(?=[\s℃])', sheet.row_values(3)[0])  # 第四行是气温，风力，天气
    weather = re.findall(r'(?<=[(天气：)\s])[\u4e00-\u9fa5]+(?=[√☑])', sheet.row_values(3)[0])
    # print(temp_wind)
    # print(weather)
    return temp_wind[0], temp_wind[1], weather


def get_bait_type(sheet):
    bait_type = re.findall(r'(?<=诱饵种类：)[\u4e00-\u9fa5]+(?=[√□☑])', sheet.row_values(4)[0])  # 第五行是诱饵种类
    # print(bait_type)
    return bait_type


def get_unit_Reporter_PeopleInCharge(sheet):
    total = re.findall(r'(?<=\s)[\u4e00-\u9fa5a-z]+(?=\s)', sheet.row_values(56)[0])  # 第五十七行是填报单位，填报人，审核人
    # [\u4e00-\u9fa5]代表只匹配汉字
    # print(total)
    if len(total) == 3:
        return total[0], total[1], total[2]
    elif len(total) == 2:
        return total[0], total[1], None


def save_file(df, path, region):
    df.to_csv(path + '\\' + region + '汇总.csv', encoding='gbk', index=False)  # 保存为csv


if __name__ == '__main__':
    base_path = r'E:\蝇密度汇总\2018-2020蝇密度'
    file_collection = get_file_name(base_path)
    df = [pd.DataFrame([]) for _ in range(2)]
    for i, file in enumerate(file_collection):
        print(i, ' ', file)
    for i, file in enumerate(file_collection):
        # print(file)
        if i < 12 or i >= 24 and i < 33:
            df[0] = df[0].append(get_sheet_df(file_name=file, sheet_name='县区1', col_names=5))
        else:
            df[1] = df[1].append(get_sheet_df(file_name=file, sheet_name='县区2', col_names=5))

    print(df[0])
    print(df[1])
    regions = ['鼓楼区', '闽侯区']
    for i in range(2):
        save_file(df=df[i], path=base_path, region=regions[i])

《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
30天风格练习-DAY2 黄希夷
Day2（重义）在一个周日/一周的最后一天，我来到位于市中心/市区繁华地带的一家购物中心/商场，中心内人很多/熙熙攘攘。我注意到/看见一个独行/孤身一人的年轻女孩/，留着一头引人注目/长过腰际的头发，上身穿一件暗红色/比正红色更深的衣服/穿在身体上的东西。走下扶梯的时候，她摔倒了/跌向地面，在她正要站起来/让身体离开地面的时候，过长/超过一般人长度的头发被支撑身体/躯干的手掌压/按在下面，她赶紧用
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
勇士赢了，我把掌声给了骑士复角度的生活
今天，不参加高考，只看NBA总决赛第三场的较量。这么说有点得罪高考生了，不过我没有当他们面秀，也没有跑到考点外面得瑟，所以我内心毫无波澜。毫无疑问，考场里不乏骑士和勇士球迷，在紧张作答语文考卷同时还心系着球队，不过我希望今天的比赛不会让你们有所分心，毕竟高考不会像比赛录像那样可以再来。今天，好像起来赶考一样，我起得很早，然而事实是睡不着，挺郁闷的，又不是我高考，我紧张什么？九点我并没有准时打开浏览
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
C语言代码练习（第十九天）小小框架 C语言 C语言重点练习 c语言
今日练习：52、有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中53、输出"魔方阵"。所谓魔方阵是指它的每一行，每一列和对角线之和均相等。54、找出一个二维数组中的鞍点，即该位置上的元素在该行上最大、在该列上最小。也可能没有鞍点。有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中运行代码intmain(){intarr[11]={1,3,9,12,15
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
大三成了分手季? 三聿鱼
图片发自App一次玩真心话大冒险的时候，知道漂亮的A学姐原来和社团那个帅帅的学长H原来是彼此的前任。知道时还是惊讶的，知道学长H现在在准备考研，上次从湖边回学校时，他说现在很忙，所以社团那边也没有再去。他想考武汉大学，每天都是泡图书馆。后来和学姐A在假期一次一次合作后，也熟络很多，知道她也将要回老家实习，想考公务员。学姐A大学专业是英语，当时想问更多，觉得不变开口，也没再问。在那次真心话大冒险中，
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
原画的线稿要怎么画？线稿这个大难题该怎么破？川川_9d43
想要画好线稿需要具备什么的条件？一、手需要一个灵活且生动的小手手~~能够自如地操控手上的物体，达到随心所欲的地步，这样高深的操纵方式需要很高的熟练度！比如：上厕所，吃饭，洗脸，手指打结等。二、握笔的姿势握笔的姿势很重要，决定了画的线条的流畅度，小编个人感觉应该没有绝对的正确姿势，就是自己的习惯，随心就好，不盲目的学习别人的握笔的姿势，就像以前的一个典故一样——邯郸学步。三、排线练习排线的时候一定要
我的一个小心愿，减肥20斤，有人一起吗张晓晓ZXX
我现在体重141斤，163cm，想减到120以内，不想吃减肥药，不喝奶昔，也不想买健身卡，就是希望通过一些运动的aPP进行训练和适当的节食，有人一起的吗？3月12号，我73公斤，现在70.9公斤，是通过咕咚app训练来的，但一个人太孤单，有一起的吗？我想知道除了小时候坚持一个月练习写字帖把字写好了，还能做什么锻炼一下自己的毅力，我也想知道100天之后，我能不能也达到理想的体重。接下来100天，愿意
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
#跟宇彤老师成为声音万人迷#第十季打卡营第二十一天# 穆希乐
今天是这季打卡营的最后一天，今天的打卡是用心诵读“初心”！很有意义的俩个字，但函给了每一位来练声的伙伴们最初的想法，让我也想起了我来练声的初心:就是想让自己的声音听起来有亲和力。从每日的基本功练习、到喜怒哀乐的绕口令在到各种的配音秀，最后俩天是用心的朗读等等，也是各种的第一次，想来有的伙伴们也和我一样是各种的第一次，这些第一次带着新鲜、刺激、更多的是激动与感恩！激动的是伙伴们在愉快的环境中每天开心
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
2021.11.18 星初呀
2021.11.18＃小狗钱钱金金先生和吉亚的对话，金先生说，我总感觉你和大多数小孩很不一样。吉雅说我思考的问题不一样。很惊讶于一个小孩这样的归纳能力。我们思考问题方式是怎样的?自从跟着小狗群练习，思考问题方式也在跟着转变，关注自己做到的，写成功日记，关注微小事情，思考问题消耗我们的注意力。注意力放在哪里，哪里就会开花结果。所以我们琢磨的东西会塑造我们的大脑，建立稳固的价值观。今天听了定投课堂一节
不凡的七月让自己的心归零
2019的七月，对于别人没什么，可对我来说，铭记在心，工作30多年的我，由于身体的原因结束我的工作生涯，退休后由于领导的契重，在公司又继续工作了三年，离职提前一个月就和领导打好招呼，我的工作是承上启下的周转站很重要，工作的严谨性和对工作态度，领导很欣赏，这一个月我尽我所能把工作做好，下个人接手好顺利进行，临别时领导又请我吃的饭，我很感动，算是给我的工作生涯画上了完美的句号。我们公司是做宠物服饰出口
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
【Golang】实现 Excel 文件下载功能 RumIV Golang golang excel 开发语言
在当今的网络应用开发中，提供数据导出功能是一项常见的需求。Excel作为一种广泛使用的电子表格格式，通常是数据导出的首选格式之一。在本教程中，我们将学习如何使用Go语言和GinWeb框架来创建一个Excel文件，并允许用户通过HTTP请求下载该文件。准备工作在开始之前，请确保您的开发环境中已经安装了Go语言和相关的开发工具。此外，您还需要安装GinWeb框架和excelize包，这两个包都将用于我
C语言---程序设计练习题目及学习方法1 Wanyu677 C语言 c语言学习方法算法
学习方法要多练习在这些题目中的代码和题目自己动手去敲练习也是在熟悉语法，写代码第一步就是熟悉语法练习是在锻炼编程思维，把实际问题转换为代码的能力学会画图画图去理解内存，理解指针这些比较难懂的知识画图可以更好的理清思路辅助理解，强化理解学会调试借助调试，更好的理解代码和感知代码找出代码中的bug和程序逻辑（1）自增自减运算符inta=5,b,c,i=10;b=a++;c=++b;printf("a=
Vicky的ScalersTalk第六轮新概念朗读持续力训练Day73 20210411 Vicky_b9de
练习材料：ModerncavemenPart-3ˈmɒdənˈkeɪvmənpɑːt-3Theyplungedintothelake,andafterloadingtheirgearonaninflatablerubberdinghy,letthecurrentcarrythemtotheotherside.Toprotectthemselvesfromtheicywater,theyhadtow
Regular Expression 正则表达式 Aimyon_36 Data Development 正则表达式 redis 数据库
RegularExpression前言1.基本匹配2.元字符2.1点运算符.2.2字符集2.2.1否定字符集2.3重复次数2.3.1*号2.3.2+号2.3.3?号2.4{}号2.5(...)特征标群2.6|或运算符2.7转码特殊字符2.8锚点2.8.1^号2.8.2$号3.简写字符集4.零宽度断言（前后预查）4.1?=...正先行断言4.2?!...负先行断言4.3?Thefatcatsaton
2019-02-26 一枚_铜钱
今天是实习第一节课，昨天已经和同学们交流过了，对于新老师，让学生适当地了解你是很有必要的。这第一节课嘛，孩子们表现也还可以大部分孩子都是很认真听讲的，也有几个上课会说话。但是我觉得孩子们对知识点的掌握速度还是很慢的，有的地方讲很多遍还是不太懂的样子。当然我自己可能也要反省，重点地方一定要明明白白告诉大家。明天切正题要快，要让学生读题，要让学生多写多练。话要尽量说得少，但句句在点子上，还得全面。下午
2022-11-25 疫情卷土而来快乐微笑每一天
原计划本周因比赛休息两天半，结果一个阳性患者疫情转变了所有，轮休课表换掉，继续周五上课；比赛顺延，假期顺延，相对应确诊病例所在区域封闭。这疫情何时是一个尽头，谁也无法知晓，唯有进出带好口罩，保护自己，方能战胜疫情。疫情无情，人间温暖，期待疫情早日过去，大地重返平安和谐。
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

实战：运用pandas，正则表达式（re），xlrd，进行多个excel数据汇总，分类

实战：运用pandas，正则表达式（re），xlrd，进行多个excel数据汇总，分类

前言

Input

输入表格

Output

对Input和Output的综合分析

结合Output推测从Input中提取的信息

注意

函数功能分析

get_file_name(base_path)

get_year_month(file)

set_df_date(value, ym):

get_sheet_df(file_name, sheet_name, col_names)

adjust_columns_position(df)

set_invs_place(sheet)

get_temp_wind_weather(sheet)

get_bait_type(sheet)

get_unit_Reporter_PeopleInCharge(sheet)

save_file(df, path, region)

完整代码

你可能感兴趣的:(实习生涯,比赛/练习,excel,正则表达式,pandas)