Python基础练习案例

Python基础练习案例

  • 一、Python基础语法
    • 1、练习案例1:求钱包余额
    • 2、练习案例2:股价计算小程序
    • 3、练习案例3:欢迎登陆小程序
  • 二、Python判断语句
    • 1、练习案例1:成年人判断
    • 2、练习案例2:我要买票吗
    • 3、练习案例3:猜猜心里数字
    • 4、练习案例4:猜数字
  • 三、Python循环语句
    • 1、练习案例1:求1-100的和
    • 2、练习案例2:猜数字案例
    • 3、练习案例3:打印九九乘法表
    • 4、练习案例4:数一数有几个a
    • 5、练习案例5:有几个偶数
    • 6、练习案例6:for循环打印九九乘法表
    • 7、练习案例7:发工资
  • 四、Python函数
    • 1、练习案例1:自动查核酸
    • 2、练习案例2:升级版自动查核酸
    • 3、练习案例3:黑马ATM
  • 五、Python数据容器
    • 1、练习案例1:列表常用功能练习
    • 2、练习案例2:取出列表内的偶数
    • 3、练习案例3:元组的基本操作
    • 4、练习案例4:分割字符串
    • 5、练习案例5:序列的切片实践
    • 6、练习案例6:信息去重
    • 7、练习案例7:升职加薪
    • 8、练习案例8:第六章PPT作业题
  • 六、Python文件操作
    • 1、练习案例1:单词计数
    • 2、练习案例2:文件备份案例
  • 七、Python异常、模块与包
    • 1、练习案例1:自定义工具包
  • 八、Python数据可视化
    • 1、练习案例1:折线图可视化
    • 2、练习案例2:地图可视化
    • 3、练习案例3:动态柱状图
  • 九、面向对象
    • 1、练习案例1:学生信息录入
    • 2、练习案例2:设计带有私有成员的手机
    • 3、练习案例3:数据分析案例
  • 十、PySpark
    • 1、练习案例1:WordCount案例
    • 2、练习案例2:城市销售分析统计案例
    • 3、练习案例3:搜索引擎日志分析

一、Python基础语法

1、练习案例1:求钱包余额

请在程序中定义如下变量:钱包余额(变量名:money),初始余额为50元。请通过程序计算,在购买了:冰淇淋10元,可乐5元后,钱包余额还剩余多少元。请通过print语句按照下图所示,进行输出:
Python基础练习案例_第1张图片
代码如下:

# Day01 变量练习
money = 50
print("当前钱包余额:", money, "元")
# 冰淇淋10元
ice_cream = 10
print("购买冰淇淋,花费:", ice_cream, "元")
# 可乐5元
coke = 5
print("购买了可乐,花费:", coke, "元")
print("最终,钱包剩余:", money - ice_cream - coke, "元")

运行结果:
Python基础练习案例_第2张图片

2、练习案例2:股价计算小程序

定义如下变量:name,公司名;stock_price,当前股价;stock_code,股票代码;stock_price_daily_growth_factor,股票每日增长系数,浮点数类型,比如1.2;growth_days,增长天数;计算经过growth_days天的增长后,股价达到了多少钱,使用字符串格式化进行输出,如果是浮点数,要求小数点精度2位数。
示例输出:

在这里插入图片描述
红色框框都是变量,要使用格式化的方式拼接进去
提示,可以使用: 当前股价 * 增长系数 ** 增长天数, 用来计算最终股价哦
如,股价19.99 * 系数1.2 ** 7天 = 71.62778419199998,小数点现在精度2位后结果:71.63

代码如下:

name = "传智播客"                       # 公司名
stock_price = 19.99                    # 当前股价
stock_code = "003032"                  # 股票代码
stock_price_daily_growth_factor = 1.2  # 股票每日增长系数
growth_days = 7                        # 增长天数
after_growth_price = stock_price * stock_price_daily_growth_factor ** growth_days
# f"{变量}的方式"
print(f"公司:{name},股票代码:{stock_code},当前股价:{stock_price}")
# % 占位符的方式
print("每日增长系数是:%.2f,经过%d天的增长后,股价达到了:%.2f" % (stock_price_daily_growth_factor, growth_days, after_growth_price))

运行结果:
Python基础练习案例_第3张图片

3、练习案例3:欢迎登陆小程序

定义两个变量,用以获取从键盘输入的内容,并给出提示信息:
变量1,变量名:user_name,记录用户名称
变量2,变量名:user_type,记录用户类型
并通过格式化字符串的形式,通过print语句输出欢迎信息,如下:

Python基础练习案例_第4张图片
代码如下:

user_name = input("请输入用户名:")
user_type = input("请输入用户类型:")
print(f"您好:{user_name},您是尊贵的:{user_type}用户,欢迎您的光临!")

运行结果:
Python基础练习案例_第5张图片

二、Python判断语句

1、练习案例1:成年人判断

结合前面学习的input输入语句,完成如下案例:
1、通过input语句,获取键盘输入,为变量age赋值。(注意转换成数字类型)
2、通过if判断是否是成年人,满足条件则输出提示信息,如下:

Python基础练习案例_第6张图片
提示:您已成年,需要补票的信息输出,来自if判断
代码如下:

print("欢迎来到黑马儿童游乐场,儿童免费,成人收费")
# input获取键盘输入,转换成数字类型
age = int(input("请输入您的年龄:"))
# if判断
if age >= 18:
    print("您已成年,游玩需要补票10元")
print("祝您游玩愉快!")

运行结果:
Python基础练习案例_第7张图片

2、练习案例2:我要买票吗

通过input语句获取键盘输入的身高,判断身高是否超过120cm,并通过print给出提示信息。
Python基础练习案例_第8张图片
代码如下:

print("欢迎来到黑马动物园")
height = int(input("请输入您的身高(cm):"))
if height > 120:
    print("您的身高超出120cm,游玩需要购票10元")
else:
    print("您的身高未超出120cm,可以免费游玩")
print("祝您游玩愉快")

运行结果:
Python基础练习案例_第9张图片
Python基础练习案例_第10张图片

3、练习案例3:猜猜心里数字

  • 定义一个变量,数字类型,内容随意。
  • 基于input语句输入猜想的数字,通过if和多次elif的组合,判断猜想数字是否和心里数字一致。
    Python基础练习案例_第11张图片

代码如下:

number = 10
if int(input("请输入第一次猜想的数字:")) == number:
    print("第一次就猜对了!")
elif int(input("不对,再猜一次:")) == number:
    print("猜对了!")
elif int(input("不对,再猜最后一次:")) == number:
    print("终于猜对了!")
else:
    print("Sorry,全部猜错啦,我想的是:%d" % number)

运行结果:
Python基础练习案例_第12张图片

4、练习案例4:猜数字

定义一个数字(1~10,随机产生),通过3次判断来猜出来数字
1、数字随机产生,范围1-10
2、有3次机会猜测数字,通过3层嵌套判断实现
3、每次猜不中,会提示大了或小了
提示,通过如下代码,可以定义一个变量num,变量内存储随机数字。
在这里插入图片描述
代码如下:

# 未使用循环语句
import random
num = random.randint(1, 10)
num1 = int(input("请输入第一次猜想的数字:"))
if num1 == num:
    print("恭喜你,猜对了!")
else:
    if num1 > num:
        print("数字猜大了")
    else:
        print("数字猜小了")
    num2 = int(input("请输入第二次猜想的数字:"))
    if num2 == num:
        print("恭喜你,猜对了!")
    else:
        if num2 > num:
            print("数字猜大了")
        else:
            print("数字猜小了")
        num3 = int(input("请输入第三次猜想的数字:"))
        if num3 == num:
            print("恭喜你,猜对了!")
        else:
            if num3 > num:
                print("数字猜大了")
            else:
                print("数字猜小了")
print(f"随机数为{num}")

运行结果:
Python基础练习案例_第13张图片

三、Python循环语句

1、练习案例1:求1-100的和

通过while循环,计算从1累加到100的和
1、终止条件不要忘记,设置为确保while循环100次
2、确保累加的数字,从1开始,到100结束

代码如下:

result = 0
i = 1
while i <= 100:
    result += i
    i = i + 1
print("1-100的累加和为%d" % result)

运行结果:
Python基础练习案例_第14张图片

2、练习案例2:猜数字案例

设置一个范围1-100的随机整数变量,通过while循环,配合input语句,判断输入的数字是否等于随机数
1、无限次机会,直到猜中为止
2、每一次猜不中,会提示大了或小了
3、猜完数字后,提示猜了几次

代码如下:

import random
random_number = random.randint(1, 100)  # 生成的随机数
guess_time = 0  # 记录猜测了几次
label = True  # 是否结束循环的标志,猜对了就结束
while label:
    usr_number = int(input("请输入你猜测的数字(1-100):"))  # 获取用户猜测的数字
    if random_number == usr_number:
        print("恭喜你猜对了!")
        label = False
    elif random_number < usr_number:
        print("你猜大了!")
    else:
        print("你猜小了!")
    guess_time += 1
print(f"你总共猜了{guess_time}次就猜对了")

运行结果:
Python基础练习案例_第15张图片

3、练习案例3:打印九九乘法表

通过while循环,输出如下九九乘法表内容
Python基础练习案例_第16张图片
代码如下:

"""
    打印九九乘法表
"""
i = 1  # 行数
while i <= 9:
    j = 1  # 列数
    while j <= i:
        print(f"{j}*{i}={i * j}", end="\t")
        j += 1
    print()
    i += 1

运行结果:
Python基础练习案例_第17张图片

4、练习案例4:数一数有几个a

定义字符串变量name,内容为:“itheima is a brand of itcast”
通过for循环,遍历此字符串,统计有多少个英文字母:“a”

在这里插入图片描述
提示:
1、计数可以在循环外定义一个整数类型变量用来做累加计数
2、判断是否为字母"a",可以通过if语句结合比较运算符来完成

代码如下:

name = "itheima is a brand of itcast"
number = 0  # 用来统计个数
for x in name:
    if x == "a":
        number += 1
print(f"{name}中共含有:{number}个字母a")

运行结果:
Python基础练习案例_第18张图片

5、练习案例5:有几个偶数

定义一个数字变量num,内容随意,并使用range()语句,获取从1到num的序列,使用for循环遍历它。在遍历的过程中,统计有多少偶数出现。
Python基础练习案例_第19张图片
提示:
1、序列可以使用:range(1, num)得到
2、偶数通过if来判断,判断数字余2是否为0即可

代码如下:

num = int(input("请输入一个数字:"))
count = 0
for x in range(1, num):
    if x % 2 == 0:
        count += 1
print(f"1到{num}(不含{num}本身)范围内,有{count}个偶数")

运行结果:
Python基础练习案例_第20张图片

6、练习案例6:for循环打印九九乘法表

代码如下:

for i in range(1, 10):
    for j in range(1, i + 1):
        print(f"{j}*{i}={i * j}", end="\t")
    print()

运行结果:
Python基础练习案例_第21张图片

7、练习案例7:发工资

代码如下:

import random
balance = 10000  # 公司账户余额
for i in range(1, 21):
    performance = random.randint(1, 10)  # 随机绩效
    if performance < 5:
        print(f"员工{i},绩效分为{performance},低于5分,不发工资,下一位")
        continue
    else:
        balance -= 1000
        print(f"员工{i},绩效分为{performance},不低于5分,发工资10000元,账户余额为:{balance}")
        if balance < 1000:
            print(f"公司账户余额为{balance},不足以发工资,准备跑路")
            break

运行结果:
Python基础练习案例_第22张图片

四、Python函数

1、练习案例1:自动查核酸

代码如下:

def auto_check():
    print("欢迎来到黑马程序员!")
    print("请出示您的健康码以及72小时核酸证明")


auto_check()

运行结果:
Python基础练习案例_第23张图片

2、练习案例2:升级版自动查核酸

代码如下:

def auto_check(temperature):
    print("欢迎来到黑马程序员!")
    print("请出示您的健康码以及72小时核酸证明,并配合测量体温!")
    if temperature <= 37.5:
        print(f"体温测量中,您的体温是:{temperature}度,体温正常请进!")
    else:
        print(f"体温测量中,您的体温是:{temperature}度,体温异常,需要隔离!")


auto_check(float(input("请输入测试的体温:")))

运行结果:
Python基础练习案例_第24张图片
Python基础练习案例_第25张图片

3、练习案例3:黑马ATM

代码如下:

money = 5000000  # 银行卡余额
name = None  # 记录客户姓名


def begin():
    """
        开始函数,用于检查账户密码等
    """
    global name
    name = input("欢迎登录本系统,请输入您的姓名:")
    count = 0  # 记录密码错误的次数,超过三次,账户锁定
    while True:
        password = input("请输入你的账户密码:")
        if password == "123456":
            print("正在进入系统,请稍候......")
            main_menu()
            break
        else:
            print("密码错误,请重新输入!")
            count += 1
        if count == 3:
            print("您已经3次输错账户密码,账户已被锁定,请联系工作人员!")
            break


def check_balance():
    """
        用于查询当前账户的余额
    """
    print("-------------余额查询中,请稍候-------------")
    print(f"{name},您好,您的余额为:{money}")


def deposit():
    """
        用于进行存款操作
    """
    global money
    print("----------------存款界面----------------")
    add_money = int(input("请将整理好的钞票放入入钞口:"))
    print("正在验钞,请稍候......")
    money = money + add_money
    print(f"{name},您好,您存款{add_money}元成功")
    print(f"{name},您好,您的余额为{money}")


def withdrawal():
    """
        用于进行取款操作
    """
    global money
    print("----------------取款界面----------------")
    sub_money = int(input("请输入你的取款金额:"))
    if sub_money > money:  # 判断账户余额是否足够
        print(f"您当前账户余额为{money},账户余额不足!")
    else:
        print("请拿走您的钞票......")
        money = money - sub_money
        print(f"{name},您好,您取款{sub_money}元成功")
        print(f"{name},您好,您的余额为{money}")


def main_menu():
    """
        主菜单界面
    """
    while True:  # 确保程序可以一直执行
        print("----------------主菜单----------------")
        print(f"{name},您好,欢迎来到黑马银行ATM,请选择操作。")
        print("查询余额\t[输入1]")
        print("存款\t\t[输入2]")
        print("取款\t\t[输入3]")
        print("退出\t\t[输入4]")
        choice = int(input("请输入您的选择:"))
        if choice == 1:
            check_balance()
        elif choice == 2:
            deposit()
        elif choice == 3:
            withdrawal()
        else:
            print("感谢您的使用,再见,祝您生活愉快!")
            break  # 用户选择退出或输入错误,程序结束


# 调用开始函数
begin()

运行结果:
Python基础练习案例_第26张图片

五、Python数据容器

1、练习案例1:列表常用功能练习

有一个列表,内容是:[21, 25, 21, 23, 22, 20],记录的是一批学生的年龄,请通过列表的功能(方法),对其进行:

  • 定义这个列表,并用变量接收它
  • 追加一个数字31,到列表的尾部
  • 追加一个新列表[29, 33, 30],到列表的尾部
  • 取出第一个元素(应是:21)
  • 取出最后一个元素(应是:30)
  • 查找元素31,在列表中的下标位置

代码如下:

mylist = [21, 25, 21, 23, 22, 20]
print(f"原列表为:{mylist}")
# 1、追加一个数字31,到列表的尾部
mylist.append(31)
print(f"追加一个数字31,到列表的尾部,新列表为:\n{mylist}")
# 2、追加一个新列表[29, 33, 30],到列表的尾部
mylist.extend([29, 33, 30])
print(f"追加一个新列表[29, 33, 30],到列表的尾部,新列表为:\n{mylist}")
# 3、取出第一个元素(应是:21)
print(f"取出列表的第一个元素,为:{mylist[0]}")
# 4、取出最后一个元素(应是:30)
print(f"取出列表最后一个元素,为:{mylist[-1]}")
# 5、查找元素31,在列表中的下标位置
print(f"查找元素31,在列表中的下标位置为:{mylist.index(31)}")

运行结果:
Python基础练习案例_第27张图片

2、练习案例2:取出列表内的偶数

定义一个列表,内容是:[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

  • 遍历列表,取出列表内的偶数,并存入一个新的列表对象中
  • 使用while循环和for循环各操作一次

代码如下:

mylist = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
new_list = []
# while 方式
index = 0  # 计数器
while index < len(mylist):
    if mylist[index] % 2 == 0:
        new_list.append(mylist[index])
    index += 1
print(f"通过while循环,从列表:{mylist}中取出偶数,组成新列表:{new_list}")

# 清空new_list
new_list.clear()
# for 方式
for element in mylist:
    if element % 2 == 0:
        new_list.append(element)
print(f"通过for循环,从列表:{mylist}中取出偶数,组成新列表:{new_list}")

运行结果:
Python基础练习案例_第28张图片

3、练习案例3:元组的基本操作

定义一个元组,内容是:(‘周杰轮’, 11, [‘football’, ‘music’]),记录的是一个学生的信息(姓名、年龄、爱好),请通过元组的功能(方法),对其进行:

  • 查询其年龄所在的下标位置
  • 查询学生的姓名
  • 删除学生爱好中的football
  • 增加爱好:coding到爱好list内

代码如下:

my_tuple = ('蔡虚鲲', 2.5, ['sing', 'jump', 'rap', 'basketball'])
# 1、查询其练习时长所在的下标位置
print(f"练习时长所在的下标位置为:{my_tuple.index(2.5)}")
# 2、查询练习生的姓名
print(f"练习生的姓名为:{my_tuple[0]}")
# 3、删除练习生爱好中的basketball
my_tuple[2].remove("basketball")
print(my_tuple)
# 4、增加爱好:增加music到爱好list内
my_tuple[2].append("music")
print(my_tuple)

运行结果:
Python基础练习案例_第29张图片

4、练习案例4:分割字符串

给定一个字符串:“itheima itcast boxuegu”

  • 统计字符串内有多少个"it"字符
  • 将字符串内的空格,全部替换为字符:“|”
  • 并按照"|"进行字符串分割,得到列表

代码如下:

my_str = "itheima itcast boxuegu"
# 1、统计字符串内有多少个"it"字符
print(f"字符串{my_str}中有{my_str.count('it')}个it字符")
# 2、将字符串内的空格,全部替换为字符:"|"
new_str = my_str.replace(" ", "|")
print(f"字符串{my_str},被替换空格后,结果为:\n{new_str}")
# 3、并按照"|"进行字符串分割,得到列表
new_list = new_str.split("|")
print(f"字符串{new_str},按照|分割后,结果为:\n{new_list}")

运行结果:
Python基础练习案例_第30张图片

5、练习案例5:序列的切片实践

有字符串:“万过薪月,员序程马黑来,nohtyP学”,请使用学过的任何方式,得到"黑马程序员"。可用方式参考:

  • 倒序字符串,切片取出或切片取出,然后倒序
  • split分隔"," replace替换"来"为空,倒序字符串

代码如下:

my_str = "万过薪月,员序程马黑来,nohtyP学"
# 1、倒序输出字符串
new_str = my_str[::-1]
# 2、记录字符串首字符的下标位置
index = new_str.index("黑")
# 3、切片得到结果
result = new_str[index:index + len("黑马程序员"):1]
# 4、输出结果
print(f"结果为:{result}")

运行结果:
Python基础练习案例_第31张图片

6、练习案例6:信息去重

有如下列表对象:my_list = [‘黑马程序员’, ‘传智播客’, ‘黑马程序员’, ‘传智播客’, ‘itheima’, ‘itcast’, ‘itheima’, ‘itcast’, ‘best’]

  • 定义一个空集合
  • 通过for循环遍历列表
  • 在for循环中将列表的元素添加至集合
  • 最终得到元素去重后的集合对象,并打印输出

代码如下:

my_list = ['黑马程序员', '传智播客', '黑马程序员', '传智播客', 'itheima', 'itcast', 'itheima', 'itcast', 'best']
my_set = set()  # 定义一个空集合
for element in my_list:
    my_set.add(element)
print(f"有列表:{my_list}")
print(f"存入集合后的结果为:{my_set}")

运行结果:
Python基础练习案例_第32张图片

7、练习案例7:升职加薪

有如下员工信息,请使用字典完成数据的记录。并通过for循环,对所有级别为1级的员工,级别上升1级,薪水增加1000元。

姓名 部门 工资 级别
王力鸿 科技部 3000 1
周杰轮 市场部 5000 2
林俊节 市场部 7000 3
张学油 科技部 4000 1
刘德滑 市场部 6000 2

代码如下:

employee_information = {
    "王力鸿": {
        "部门": "科技部",
        "工资": 3000,
        "级别": 1
    },
    "周杰轮": {
        "部门": "市场部",
        "工资": 5000,
        "级别": 2
    },
    "林俊节": {
        "部门": "市场部",
        "工资": 7000,
        "级别": 3
    },
    "张学油": {
        "部门": "科技部",
        "工资": 4000,
        "级别": 1
    },
    "刘德滑": {
        "部门": "市场部",
        "工资": 6000,
        "级别": 2
    }
}
print(f"原先的员工信息:\n{employee_information}")
for key in employee_information:
    if employee_information[key]["级别"] == 1:
        employee_information[key]["级别"] += 1
        employee_information[key]["工资"] += 1000
print(f"升职加薪后的员工信息:\n{employee_information}")

运行结果:
在这里插入图片描述

8、练习案例8:第六章PPT作业题

幸运数字6:输入任意数字,如数字8,生成nums列表,元素值为1~8,从中选取幸运数字(能够被6整除)移动到新列表lucky,打印nums与lucky。
代码如下:

"""
    幸运数字6:输入任意数字,如数字8,生成nums列表,元素值为1~8,
    从中选取幸运数字(能够被6整除)移动到新列表lucky,打印nums与lucky。
"""
nums = []
lucky = []
number = int(input("请输入任意数字:"))
for x in range(1, number + 1):
    nums.append(x)
print(f"nums列表为{nums}")
for element in nums:
    if element % 6 == 0:
        lucky.append(element)
print(f"lucky列表的内容为{lucky}")

运行结果:
Python基础练习案例_第33张图片
列表嵌套:有3个教室[[],[],[]],8名讲师[‘A’,‘B’,‘C’,‘D’,‘E’,‘F’,‘G’,‘H’],将8名讲师随机分配到3个教室中。
代码如下(我只能列出部分结果,有其他解法的大佬可以评论区评论下):

"""
    列表嵌套:有3个教室[[],[],[]],
    8名讲师['A','B','C','D','E','F','G','H'],
    将8名讲师随机分配到3个教室中(假设每个教室至少有一名讲师)
"""
teachers = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
new_list = []  # 过渡列表
result = []  # 结果列表
teachers_set = set(teachers)  # 先转换成集合,方便后面随机取出元素
index = 0
while index < len(teachers):
    new_list.append(teachers_set.pop())
    index += 1
print(new_list)
# 将过度列表转换成这种形式[[],[],[]]
print("将8名讲师随机分配到3个教室中,可能的结果有(这里没有区分教室):")
count = 0
while count < 6:
    result = []
    result.append(new_list[:1])
    result.append(new_list[1:2 + count])
    result.append(new_list[2 + count:])
    print(result)
    count += 1

运行结果:
Python基础练习案例_第34张图片

六、Python文件操作

1、练习案例1:单词计数

通过Windows的文本编辑器软件,将如下内容,复制并保存到:word.txt,文件可以存储在任意位置。
itheima itcast python
itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima
通过文件读取操作,读取此文件,统计itheima单词出现的次数。
代码如下:

count = 0  # 计数器
f = open("../data/word.txt", "r", encoding="UTF-8")
my_word = input("请输入你要查询的单词:")
for line in f:
    word_list = line.strip().split(" ")  # strip()除去字符串尾部的换行符
    for word in word_list:
        if word == my_word:
            count += 1
print(f"单词{my_word}出现的次数是{count}")
f.close()  # 关闭文件

运行结果:
Python基础练习案例_第35张图片
附:老师视频讲的方式1有些问题:如果文件中的某个单词含有“itheima”字段,也会被统计为单词“itheima”,例如单词“itheimatest”。

f = open("../data/word.txt", "r", encoding="UTF-8")
content = f.read()
count = content.count("itheima")
print(f"itheima在文件中出现次数为{count}")
f.close()

Python基础练习案例_第36张图片
所以个人认为还是方式2比较严谨一些。

2、练习案例2:文件备份案例

有一份账单文件,记录了消费收入的具体记录。读取文件,将文件写出到bill.txt.bak文件作为备份;同时,将文件内标记为测试的数据行丢弃。
代码如下(有错误):

file_read = open("../data/bill.txt", "r", encoding="UTF-8")
file_write = open("../data/bill.txt.bak", "w", encoding="UTF-8")
for line in file_read:
    if "测试" not in line:
        file_write.write(line)
file_read.close()
file_write.close()

运行结果:
没看讲解之前,我是这样写的:如果“测试”没有在读出来的行中,就将此行写入备份文件。但是这样有一个问题,如果有个人叫“刘测试”,他的数据又是“正式”的,那我不会将他写入备份文件,这就和需求不一样了。
Python基础练习案例_第37张图片

解决方法:还是精确到remark的位置,然后判断该位置是否为“测试”。修改后的代码如下:

file_read = open("../data/bill.txt", "r", encoding="UTF-8")
file_write = open("../data/bill.txt.bak", "w", encoding="UTF-8")
for line in file_read:
    word_list = line.strip().split(",")
    if word_list[-1] != "测试":
        file_write.write(line)
file_read.close()
file_write.close()

Python基础练习案例_第38张图片

七、Python异常、模块与包

1、练习案例1:自定义工具包

创建一个自定义包,名称为:my_utils (我的工具),在包内提供2个模块:
str_util.py (字符串相关工具,内含:)

  • 函数:str_reverse(s),接受传入字符串,将字符串反转返回
  • 函数:substr(s, x, y),按照下标x和y,对字符串进行切片

file_util.py(文件处理相关工具,内含:)

  • 函数:print_file_info(file_name),接收传入文件的路径,打印文件的全部内容,如文件不存在则捕获异常,输出提示信息,通过finally关闭文件对象
  • 函数:append_to_file(file_name, data),接收文件路径以及传入数据,将数据追加写入到文件中

代码如下:
str_util.py

"""
    字符串相关工具
"""
def str_reverse(s):
    """
    反转字符串
    :param s: 待反转的字符串
    :return: 反转后的字符串
    """
    return s[::-1]


def substr(s, x, y):
    """
    按照下标x和y,对字符串进行切片
    :param s: 待切片的字符串
    :param x: 切片的开始下标
    :param y: 切片的结束下标
    :return: 切片后得到的字符串
    """
    return s[x:y]


if __name__ == '__main__':
    print(f"{str_reverse('黑马程序员')}")
    print(f"{substr('黑马程序员', 1, 3)}")

file_util.py

"""
    文件处理相关工具
"""
def print_file_info(file_name):
    """
    将给定路径的文件的内容输出到控制台中
    :param file_name:待读取的文件的路径
    :return:None
    """
    f = None
    try:
        f = open(file_name, "r", encoding="UTF-8")
        print(f"文件的全部内容如下:\n{f.read()}")
    except Exception as e:
        print(f"程序出现异常了,原因是:{e}")
    finally:
        if f:  # 如果报异常了,这里的f就是None,就没有必要执行f.close()了
            f.close()


def append_to_file(file_name, data):
    """
    将指定的内容追加到指定的文件中
    :param file_name: 待写入的文件
    :param data: 写入的内容
    :return: None
    """
    f = open(file_name, "a", encoding="UTF-8")
    f.write(data)
    f.write("\n")
    f.close()


if __name__ == '__main__':
    print_file_info("../data/bill.txt")
    append_to_file("../data/test_append.txt", "测试函数功能")

效果展示:
Python基础练习案例_第39张图片

Python基础练习案例_第40张图片

八、Python数据可视化

1、练习案例1:折线图可视化

代码如下:

"""
    折线图开发
"""
import json
from pyecharts.charts import Line
from pyecharts.options import *
# 数据预处理


f_us = open("data/美国.txt", "r", encoding="UTF-8")
us_data = f_us.read()
f_jp = open("data/日本.txt", "r", encoding="UTF-8")
jp_data = f_jp.read()
f_in = open("data/印度.txt", "r", encoding="UTF-8")
in_data = f_in.read()

# 删除不符合JSON规范的开头和结尾
us_data = us_data.replace("jsonp_1629344292311_69436(", "")
us_data = us_data[:-2]
jp_data = jp_data.replace("jsonp_1629350871167_29498(", "")
jp_data = jp_data[:-2]
in_data = in_data.replace("jsonp_1629350745930_63180(", "")
in_data = in_data[:-2]

# JSON转python字典
us_dict = json.loads(us_data)
jp_dict = json.loads(jp_data)
in_dict = json.loads(in_data)

# 获取trend key
us_trend_data = us_dict['data'][0]['trend']
jp_trend_data = jp_dict['data'][0]['trend']
in_trend_data = in_dict['data'][0]['trend']

# 获取日期数据,用于x轴,截取2020年的数据(到314下标结束)
us_x_data = us_trend_data['updateDate'][:314]
jp_x_data = jp_trend_data['updateDate'][:314]
in_x_data = in_trend_data['updateDate'][:314]

# 获取确认数据,用于y轴,截取2020年的数据(到314下标结束)
us_y_data = us_trend_data['list'][0]['data'][:314]
jp_y_data = jp_trend_data['list'][0]['data'][:314]
in_y_data = in_trend_data['list'][0]['data'][:314]

# 生成图表
line = Line()  # 构建折线图对象
# 添加x轴数据
line.add_xaxis(us_x_data)
# 添加y轴数据
line.add_yaxis("美国确诊人数", us_y_data, label_opts=LabelOpts(is_show=False))
line.add_yaxis("日本确诊人数", jp_y_data, label_opts=LabelOpts(is_show=False))
line.add_yaxis("印度确诊人数", in_y_data, label_opts=LabelOpts(is_show=False))

# 设置全局选项
line.set_global_opts(
    # 设置标题
    title_opts=TitleOpts(title="2020年美日印三国确诊人数对比折线图", pos_left="center", pos_bottom="1%")
)
# 调用render方法,生成图表
line.render()

# 关闭文件对象
f_us.close()
f_jp.close()
f_in.close()

效果展示:
Python基础练习案例_第41张图片

2、练习案例2:地图可视化

全国疫情情况可视化地图
代码如下:

"""
全国疫情可视化地图开发
"""
import json
from pyecharts.charts import *
from pyecharts.options import *

# 读取数据文件
f = open("data/疫情.txt", "r", encoding="UTF-8")
data = f.read()
# 关闭文件
f.close()

# 取到各省数据
# 将字符串json转换为python的字典
data_dict = json.loads(data)
# 从字典中取出省份的数据
province_data_list = data_dict["areaTree"][0]["children"]
# 组装每个省份和确诊人数为元组,并将各个省的数据都封装到列表内
data_list = []  # 绘图要用到的数据列表
for province_data in province_data_list:
    province_name = province_data["name"]
    province_confirm = province_data["total"]["confirm"]
    data_list.append((province_name, province_confirm))
print(data_list)

# 创建地图对象
my_map = Map()
# 添加数据
my_map.add("各省份确诊人数", data_list, "china")

# 设置全局变量,定制分段的视觉映射
my_map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min": 1, "max": 9, "label": "1-9人", "color": "#CCFFFF"},
            {"min": 10, "max": 99, "label": "10-99人", "color": "#FFFF99"},
            {"min": 100, "max": 499, "label": "1-499人", "color": "#FF9966"},
            {"min": 500, "max": 999, "label": "500-999人", "color": "#FF6666"},
            {"min": 1000, "max": 9999, "label": "1000-9999人", "color": "#CC3333"},
            {"min": 10000, "label": "10000人以上", "color": "#990033"},
        ]
    )
)
# 绘图
my_map.render()

效果展示:
Python基础练习案例_第42张图片
广东省疫情可视化地图
代码如下:

# 打开文件,获取数据
import json

from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts

f = open("data/疫情.txt", "r", encoding="UTF-8")
data = f.read()

# 关闭文件
f.close()

# 将json文件数据转换成python字典
data_dict = json.loads(data)

# 得到广东省的数据
data_gd = data_dict["areaTree"][0]["children"][7]["children"]

# 取出省内各市的名称以及各市的确诊人数,组合成二元组列表
data_list_gd = []
for city in data_gd:
    city_name = city["name"] + "市"
    city_confirm = city["total"]["confirm"]
    data_list_gd.append((city_name, city_confirm))
data_list_gd.append(("云浮市", 2))
# 绘图
map_gd = Map()
map_gd.add("广东省各市疫情确诊人数地图", data_list_gd, "广东")
# 设置全局变量,定制分段的视觉映射
map_gd.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min": 1, "max": 9, "label": "1-9人", "color": "#CCFFFF"},
            {"min": 10, "max": 99, "label": "10-99人", "color": "#FFFF99"},
            {"min": 100, "max": 499, "label": "1-499人", "color": "#FF9966"},
            {"min": 500, "max": 999, "label": "500-999人", "color": "#FF6666"},
            {"min": 1000, "max": 9999, "label": "1000-9999人", "color": "#CC3333"},
            {"min": 10000, "label": "10000人以上", "color": "#990033"},
        ]
    )
)
map_gd.render("广东省各市疫情确诊人数地图.html")

效果展示:
Python基础练习案例_第43张图片
河南省疫情可视化地图
代码如下:

# 读取文件
import json

from pyecharts.charts import *
from pyecharts.options import VisualMapOpts

f = open("data/疫情.txt", "r", encoding="UTF-8")
data = f.read()

# 关闭文件
f.close()
# 获取河南省数据
# json数据转换为python字典
data_dict = json.loads(data)
# 取到河南省数据
cities_data = data_dict["areaTree"][0]["children"][3]["children"]
# 准备数据为元组并放入list
data_list = []
for city_data in cities_data:
    city_name = city_data["name"] + "市"
    city_confirm = city_data["total"]["confirm"]
    data_list.append((city_name, city_confirm))
# 构建地图
hena_map = Map()
hena_map.add("河南省疫情情况", data_list, "河南")
# 设置全局变量,定制分段的视觉映射
hena_map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min": 1, "max": 9, "label": "1-9人", "color": "#CCFFFF"},
            {"min": 10, "max": 99, "label": "10-99人", "color": "#FFFF99"},
            {"min": 100, "max": 499, "label": "1-499人", "color": "#FF9966"},
            {"min": 500, "max": 999, "label": "500-999人", "color": "#FF6666"},
            {"min": 1000, "max": 9999, "label": "1000-9999人", "color": "#CC3333"},
            {"min": 10000, "label": "10000人以上", "color": "#990033"},
        ]
    )
)
hena_map.render()

效果展示:
Python基础练习案例_第44张图片

3、练习案例3:动态柱状图

通过pyechars可以实现数据的动态显示, 直观的感受1960~2019年全世界各国GDP的变化趋势
代码如下:

"""
    GDP动态柱状图
"""
from pyecharts.charts import *
from pyecharts.options import *
from pyecharts.globals import *
# 读取数据
f = open("data/1960-2019全球GDP数据.csv", "r", encoding="GB2312")
data_lines = f.readlines()

# 关闭文件
f.close()

# 删除表头
data_lines.pop(0)

# 将数据转换成字典存储,格式为:{ 年份:[[国家,GDP], [国家,GDP], ......], 年份:[[国家,GDP], [国家,GDP], ......], ...... }
data_dict = {}  # 定义一个字典对象
for line in data_lines:
    year = int(line.split(",")[0])      # 年份
    country = line.split(",")[1]        # 国家
    gdp = float(line.split(",")[2])     # gdp数值
    try:
        data_dict[year].append([country, gdp])
    except KeyError:
        data_dict[year] = []
        data_dict[year].append([country, gdp])

# 创建时间线对象
timeline = Timeline({"theme": ThemeType.LIGHT})

# 排序年份
sorted_year_list = sorted(data_dict.keys())
for sorted_year in sorted_year_list:
    data_dict[sorted_year].sort(key=lambda element: element[1], reverse=True)
    # 取出该年份GDP前8名的国家
    year_data = data_dict[sorted_year][0:8]
    x_data = []
    y_data = []
    for country_gdp in year_data:
        x_data.append(country_gdp[0])               # x轴添加国家
        y_data.append(country_gdp[1] / 100000000)   # y轴添加gdp数据
    # 构建柱状图
    bar = Bar()
    x_data.reverse()
    y_data.reverse()
    bar.add_xaxis(x_data)
    bar.add_yaxis("GDP(亿)", y_data, label_opts=LabelOpts(position="right"))
    bar.reversal_axis()  # 反转x轴和y轴
    bar.set_global_opts(
        title_opts=TitleOpts(title=f"{sorted_year}年全球GDP前8的国家")
    )  # 设置标题
    timeline.add(bar, str(sorted_year))  # 将bar对象添加到时间线中

# 设置时间线自动播放
timeline.add_schema(
    play_interval=1000,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=False
)

# 绘制柱状图
timeline.render("1960-2019全球GDP前8国家.html")

效果展示:
Python基础练习案例_第45张图片

九、面向对象

1、练习案例1:学生信息录入

开学了,有一批学生信息需要录入系统,请设计一个类,记录学生的:姓名、年龄、地址,这3类信息。

  • 通过 for 循环,配合 input 输入语句,并使用构造方法,完成学生信息的键盘录入
  • 输入完成后,使用 print 语句,完成信息的输出

代码如下:

"""
    学生信息录入
"""
# 创建类
class Student:
    name = None
    age = None
    address = None

    # 使用构造方法
    def __init__(self):
        self.name = input("请输入学生姓名:")
        self.age = int(input("请输入学生年龄:"))
        self.address = input("请输入学生地址:")

# for循环录入信息并输出
for i in range(1, 11):
    print(f"当前录入第{i}位学生的信息,总共需要录入10位学生的信息")
    # 创建类对象
    stu = Student()
    print(f"学生{i}信息录入完成,信息为:【学生姓名:{stu.name},年龄:{stu.age},地址:{stu.address}】")

运行结果:
Python基础练习案例_第46张图片

2、练习案例2:设计带有私有成员的手机

设计一个手机类,内部包含:
私有成员变量:__is_5g_enable,类型bool,True表示开启5g,False表示关闭5g
私有成员方法:__check_5g(),会判断私有成员__is_5g_enable的值

  • 若为True,打印输出:5g开启
  • 若为False,打印输出:5g关闭,使用4g网络

公开成员方法:call_by_5g(),调用它会执行
调用私有成员方法:__check_5g(),判断5g网络状态,打印输出:正在通话中

通过完成这个类的设计和使用,体会封装中私有成员的作用

  • 对用户公开的,call_by_5g()方法
  • 对用户隐藏的,__is_5g_enable私有变量和__check_5g私有成员

代码如下:

"""
    设计带有私有成员的手机
"""
# 创建类
class Phone:
    __is_5g_enable = False

    def __check_5g(self):
        if self.__is_5g_enable is True:
            print("5g开启")
        else:
            print("5g关闭,使用4g网络")

    def call_by_5g(self):
        self.__check_5g()
        print("正在通话中")

# 创建类对象
phone = Phone()
phone.call_by_5g()

运行结果:
Python基础练习案例_第47张图片

3、练习案例3:数据分析案例

某公司,有2份数据文件,现需要对其进行分析处理,计算每日的销售额并以柱状图表的形式进行展示。
Python基础练习案例_第48张图片
数据内容:
Python基础练习案例_第49张图片

  • 1月份数据是普通文本,使用逗号分割数据记录,从前到后分别是(日期,订单id,销售额,销售省份)
  • 2月份数据是JSON数据,同样包含(日期,订单id,销售额,销售省份)

需求分析:
Python基础练习案例_第50张图片
代码如下:

file_define.py

"""
    和文件相关的类定义
"""
import json
from data_define import Record

# 先定义一个抽象类用来做顶层设计,确定有哪些功能需要实现
class FileReader:
    def read_data(self) -> list[Record]:
        """ 读取文件的数据,读到的每一条数据都转换为Record对象,将它们都封装到list内返回 """
        pass


class TextFileReader(FileReader):
    def __init__(self, path):
        self.path = path    # 定义成员变量记录文件的路径

    # 复写父类的方法
    def read_data(self) -> list[Record]:
        record_list: list[Record] = []
        f = open(self.path, "r", encoding="UTF-8")
        for line in f.readlines():
            line = line.strip()  # 消除读取到的每一行数据中的\n
            data_list = line.split(",")
            record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
            record_list.append(record)
        f.close()  # 关闭文件
        return record_list


class JsonFileReader(FileReader):
    def __init__(self, path):
        self.path = path    # 定义成员变量记录文件的路径

    # 复写父类的方法
    def read_data(self) -> list[Record]:
        record_list: list[Record] = []
        f = open(self.path, "r", encoding="UTF-8")
        for line in f.readlines():
            data_dict = json.loads(line)
            record = Record(data_dict["date"], data_dict["order_id"], int(data_dict["money"]), data_dict["province"])
            record_list.append(record)
        f.close()  # 关闭文件
        return record_list


if __name__ == '__main__':
    text_file_reader = TextFileReader("data/2011年1月销售数据.txt")
    json_file_reader = JsonFileReader("data/2011年2月销售数据JSON.txt")
    list1 = text_file_reader.read_data()
    list2 = json_file_reader.read_data()
    for l1 in list1:
        print(l1)
    for l2 in list2:
        print(l2)

data_define.py

"""
    数据定义的类
"""
class Record:
    def __init__(self, date, order_id, money, province):
        self.date = date            # 订单日期
        self.order_id = order_id    # 订单ID
        self.money = money          # 订单金额
        self.province = province    # 销售金额

    def __str__(self):
        return f"{self.date},{self.order_id},{self.money},{self.province}"

main.py

from pyecharts.charts import Bar
from pyecharts.globals import ThemeType
from pyecharts.options import *
from file_define import *

text_file_reader = TextFileReader("data/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("data/2011年2月销售数据JSON.txt")

jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()

# 将两个月的数据合并成一个list存储
all_data: list[Record] = jan_data + feb_data

# 开始进行数据计算,使用字典进行操作
# {'2011-01-01': 59242, '2011-01-02': 58479, '2011-01-03': 52336, ...}
data_dict = {}
for record in all_data:
    if record.date in data_dict.keys():
        # 当前日期已经有记录了,所以和老记录做累加即可
        data_dict[record.date] += record.money
    else:
        data_dict[record.date] = record.money
# print(data_dict)

# 可视化图表开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))
bar.add_xaxis(list(data_dict.keys()))                                                   # 添加x轴的数据
bar.add_yaxis("销售额", list(data_dict.values()), label_opts=LabelOpts(is_show=False))   # 添加y轴数据
bar.set_global_opts(
    title_opts=TitleOpts(title="每日销售额"),
    xaxis_opts=AxisOpts(axislabel_opts={"rotate": 45})
)
bar.render("每日销售额柱状图.html")

效果展示:
Python基础练习案例_第51张图片

十、PySpark

1、练习案例1:WordCount案例

读取文件,统计文件内,单词的出现数量
代码如下:

from pyspark import SparkConf, SparkContext
import os

# 构建执行环境入口对象
os.environ['PYSPARK_PYTHON'] = "C:/Users/Administrator/AppData/Local/Programs/Python/Python310/python.exe"
conf = SparkConf().setMaster("local[*]").setAppName("test1")
sc = SparkContext(conf=conf)

# 读取数据文件
rdd = sc.textFile("../../data/word.txt")

# 取出全部单词
word_rdd = rdd.flatMap(lambda x: x.split(" "))
word_tuple_rdd = word_rdd.map(lambda word: (word, 1))
result_rdd = word_tuple_rdd.reduceByKey(lambda a, b: a + b)
print(result_rdd.collect())

sc.stop()

运行结果:
在这里插入图片描述

2、练习案例2:城市销售分析统计案例

使用Spark读取文件进行计算:

  • 各个城市销售额排名,从大到小
  • 全部城市,有哪些商品类别在售卖
  • 北京市有哪些商品类别在售卖

代码如下:

import json
from pyspark import SparkConf, SparkContext
import os

os.environ['PYSPARK_PYTHON'] = "C:/Users/Administrator/AppData/Local/Programs/Python/Python310/python.exe"
conf = SparkConf().setMaster("local[*]").setAppName("test2")
sc = SparkContext(conf=conf)

# 读取文件得到rdd
file_rdd = sc.textFile("../../data/orders.txt")
# 取出一个个JSON字符串,转换成字典
json_str_rdd = file_rdd.flatMap(lambda x: x.split("|"))
dict_rdd = json_str_rdd.map(lambda x: json.loads(x))

# TODO 需求1:城市销售额排名
# 取出城市和销售额,组成二元组(城市, 销售额)
city_money_rdd = dict_rdd.map(lambda x: (x["areaName"], int(x["money"])))
# 按城市分组,按销售额聚合
city_result_rdd = city_money_rdd.reduceByKey(lambda a, b: a + b)
# 按销售额聚合结果进行排序
result1_rdd = city_result_rdd.sortBy(lambda x: x[1], ascending=False, numPartitions=1)
print("城市销售额排名为:\n", result1_rdd.collect())

# TODO 需求2:全部城市有哪些商品类型在售卖
result2_rdd = dict_rdd.map(lambda x: x['category']).distinct()
print("全部城市有如下商品类型在售卖:\n", result2_rdd.collect())

# TODO 需求3:北京市有哪些商品类型在售卖
result3_rdd = dict_rdd.filter(lambda x: x['areaName'] == "北京").map(lambda x: x['category']).distinct()
result3_rdd.saveAsTextFile("../../data/test")
print("北京市有如下商品类型在售卖:\n", result3_rdd.collect())

sc.stop()

运行结果:
Python基础练习案例_第52张图片

3、练习案例3:搜索引擎日志分析

读取文件转换成RDD,并完成:

  • 打印输出:热门搜索时间段(小时精度)Top3
  • 打印输出:热门搜索词Top3
  • 打印输出:统计黑马程序员关键字在哪个时段被搜索最多
  • 将数据转换为JSON格式,写出为文件

代码如下:

from pyspark import SparkConf, SparkContext
import os

os.environ["PYSPARK_PYTHON"] = "C:/Users/Administrator/AppData/Local/Programs/Python/Python310/python.exe"
conf = SparkConf().setMaster("local[*]").setAppName("last_test")
conf.set("spark.default.parallelism", "1")
sc = SparkContext(conf=conf)
# 读取文件转换成RDD
file_rdd = sc.textFile("../../data/search_log.txt")

# TODO 需求1:热门搜索时间段Top3(精度为小时)
result1 = file_rdd.map(lambda x: (x.split("\t")[0][:2], 1))\
    .reduceByKey(lambda a, b: a + b)\
    .sortBy(lambda x: x[1], ascending=False, numPartitions=1)\
    .take(3)
print("热门搜索时间段Top3为:", result1)

# TODO 需求2:热门搜索词Top3
result2 = file_rdd.map(lambda x: (x.split("\t")[2], 1))\
    .reduceByKey(lambda a, b: a + b).sortBy(lambda x: x[1], ascending=False, numPartitions=1)\
    .take(3)
print("热门搜索词Top3为:", result2)

# TODO 需求3:统计黑马程序员关键字在什么时段被搜索最多
result3 = file_rdd.map(lambda x: x.split("\t"))\
    .filter(lambda x: x[2] == "黑马程序员")\
    .map(lambda x: (x[0][:2], 1))\
    .reduceByKey(lambda a, b: a + b)\
    .sortBy(lambda x: x[1], ascending=False, numPartitions=1)\
    .take(1)
print("黑马程序员关键字在以下时段被搜索最多:", result3)

# TODO 需求4:将数据转换成JSON格式,输出到文件中
file_rdd.map(lambda x: x.split("\t"))\
    .map(lambda x: {"time": x[0], "user_id": x[1], "key_word": x[2], "rank1": x[3], "rank2": x[4], "url": x[5]})\
    .saveAsTextFile("../../output_json")

sc.stop()

运行结果:
Python基础练习案例_第53张图片
Python基础练习案例_第54张图片

你可能感兴趣的:(python+大数据,python,pyspark)