安迪python学习笔记

2. Series对象-一维数据

【目录】

文章目录

2. Series对象-一维数据
- 1. 知识回顾-创建字典
- 2. 调用库的类、函数、变量语法
- 3. 实例化类创建一个对象
- 4. Series一维数组
- 5. pd.Series创建一个Series对象
- 6. data = 列表
- 7. 同时传入data和index
- 8. data = 字典
- 9. Series对象的3要素：索引+数据+类型
- - 9.1 data=列表，列表元素均为字符串
  - 9.2 data=列表，列表元素均为字符串+整数
  - 9.3 data=列表，列表元素均为整数
  - 9.4 data=列表，列表元素均为浮点数
- 10. Series类的values和index属性
- 11. 利用index获取Series的索引
- 12. 利用values获取Series的值
- 13. 课堂练习
- 14. 总结
- 15. 课后练习

【正文】

2. Series对象-一维数据

【学习时间】

60分钟

1. 知识回顾-创建字典

【语法】

一个字典主要由5部分构成：

1. 英文大括号{ }
1. 字典的键
1. 键与值之间用英文冒号:隔开
1. 字典的值
1. 键值对之间用英文逗号,分隔

code_dict字典名。
字典用{ }大括号表示。注意集合也用{ }大括号表示。
北京是字典键。
:英文冒号。
100000是字典的值。
'北京':100000称为一个键值对。
2个键值对之间用英文逗号,分隔。

【课堂练习】

创建一个字典。

字典的键为：姓名 和 性别。

姓名 对应的值是 ['张三', '李四', '王五']。

性别对应的值是 ['男','女','男']。

【代码示例】

# 字典的键为'姓名'和'年龄'，
# 字典的值为['张三', '李四', '王五']、['男','女','男']
my_dict = {'姓名': ['张三', '李四', '王五'], '性别': ['男','女','男']}

# 打印字典
print(my_dict)

【终端输出】

{'姓名': ['张三', '李四', '王五'], '性别': ['男', '女', '男']}

2. 调用库的类、函数、变量语法

调用库的类：库名.类名( )，如 csv.DictReader()
调用库的函数：库名.函数名( )，如 os.mkdir()
调用库的变量：库名.变量名，如 os.name

【总结】

不管调用什么，库名后都需要紧跟一个英文小圆点.。
调用类和函数需要加英文圆括号( )。
调用变量不用加英文圆括号( )，因为变量没有参数可以传递。

【课堂练习】

已知库名为pandas。
Series是pandas库的一个类。
请完善代码调用Series类。

【代码示例】

# 导入pandas库并简写为pd
import pandas as pd

# 调用库的类：库名.类名( )
# pd是库名，Series是类名
s = pd.Series()

3. 实例化类创建一个对象

在面向对象编程中，类是一个模板，而对象则是根据这个模板创建出来的具体实体。

通过实例化，我们可以使用类中定义的属性和方法来完成相应的操作。

【创建对象语法】

对象名 = 类名()

等号的左边是我们给创建对象起的名字。
等号右边写类名，表示这个对象是根据这个类生产出来的。
类名后紧跟一对英文圆括号( )。

【查看对象属性语法】

对象名.属性名

属性是定义在类里的变量。

【课堂练习】

已知类名为Cars。
请用上述类创建一个aodi_A6 对象。
该对象的颜色属性为红色，车型属性为小轿车。

【代码示例】

# 定义一个车类，类名为Cars
class Cars:
     # 直接写在类里的变量称为类属性
    color= "红色"
    type_1 = "小轿车"

# 创建对象
# 对象名 = 类名()
aodi_A6 = Cars( )  

# 查看对象的属性
# 对象名.属性名
# aodi_A6是对象名，color是属性名
print(aodi_A6.color)

【终端输出】

红色

4. Series一维数组

pandas库的核心数据结构是两种类型的数据对象：Series和DataFrame。

Series[ˈsɪəriːz]：系列。

Series：一维数组。

【什么是Series数据？】

Series是pandas库中的一种数据结构，用于表示一维的标签化数据。

Series可以存储任意类型的数据。

Series的每个数据都会自动关联一个索引。

索引可以是数字或字符串。

【什么是一维数据？】

一维数据是指只有一个维度的数据集合。

一维数据通常表示为单行或单列的数据集，其中每个元素都可以通过索引来访问。

下图所示的就是一维数组：

5. pd.Series创建一个Series对象

【语法】

pd.Series(data, index)

【参数】

pd是库名。
.英文小圆点。库名后接一个小圆点表示调用。
Series类名。
data是必需参数，表示要传递的数据。
index是可选参数，用于自定义索引。

index[ˈɪndeks]：索引。

实例化类创建对象的语法为：对象名 = 类名()

pd.Series(data, index)也是一个实例化类创建对象语句。

只是这里的类不是自定义的类，而是调用的pandas库的类。

pd.Series(data, index)实例化Series类后得到一个Series对象。

实例化Series类必须传递一个data参数。

data参数的数据类型可以是列表、数组、字典等。

下面我们依次来看。

6. data = 列表

【代码示例】

# 导入pandas库并简写为pd
import pandas as pd 

data =["赵", "钱", "孙", "李"]

s1 = pd.Series(data)
print(type(s1))
print(s1)

【终端输出】


0    赵
1    钱
2    孙
3    李
dtype: object

【代码解析】

终端输出的表示实例化Series类后得到一个Series对象。

Series对象是一个一维数组。

pd是库名。
.英文小圆点，库名后接一个小圆点表示调用。
Series类名。
data 存储的是一个列表。

在没有index参数的情况下，pd.Series(data) 会自动为列表中的每一个元素分配对应的数字索引。

默认索引是从 0 开始，以 0, 1, 2, 3,… 的形式按序分配给列表中的元素。

第1个元素赵，自动分配索引0 。
第2个元素钱，自动分配索引1 。
第3个元素孙，自动分配索引2 。
第4个元素李，自动分配索引3 。

上面的0 1 2 3就是默认的数据索引。

7. 同时传入data和index

【代码示例】

# 导入pandas库并简写为pd
import pandas as pd 

data =["赵", "钱", "孙", "李"]
index=['A','B','C','D']

s1 = pd.Series(data, index )
print(s1)

【终端输出】

A    赵
B    钱
C    孙
D    李
dtype: object

【代码解析】

这里的代码相对于上一段代码多传入了一个参数index。

pd是库名。
.英文小圆点，库名后接一个小圆点表示调用。
Series类名。
data 存储的是一个列表。
index=['A','B','C','D']表示用A B C D做为数据索引。

【有没有index的区别】

没有index参数，赵对应的索引为默认索引0。

有index参数，赵对应的索引为传入的索引A。

8. data = 字典

【代码示例】

# 导入pandas库并简写为pd
import pandas as pd 

data = {'A':'赵','B':'钱','C':'孙','D':'李'}
s1 = pd.Series(data)
print(s1)

【终端输出】

A    赵
B    钱
C    孙
D    李
dtype: object

当传入的data数据类型为字典时：
字典的键A B C D就是数据的索引。
字典的值赵钱孙李是数据的值。

9. Series对象的3要素：索引+数据+类型

9.1 data=列表，列表元素均为字符串

# 导入pandas库并简写为pd
import pandas as pd 

# 列表的元素均为字符串
data = ["赵", "钱", "孙", "李"]

s1 = pd.Series(data)
print(s1)

【终端输出】

0    赵
1    钱
2    孙
3    李
dtype: object

输出一个Series如下图所示：

dtype：类型。

object[ˈɒbdʒɪkt]：对象。

左侧的0 1 2 3 是索引。
右侧的赵钱孙李是数据。
dtype指pandas库中的数据类型。
object表示数据类型为字符串。

在Series对象中，只要有一条数据是字符串类型，则dtype就为 object。

上面的代码传给参数data的数据只有字符串类型。

终端输出dtype: object，object等价于字符串类型。

dtype: object字符串类型。

9.2 data=列表，列表元素均为字符串+整数

# 导入pandas库并简写为pd
import pandas as pd 

# 列表的元素均为字符串+整数
data = ["赵", "钱", 1, 2]

s1 = pd.Series(data)
print(s1)

【终端输出】

0    赵
1    钱
2    1
3    2
dtype: object

列表data的元素有字符串赵钱，也有整数1 2 。

但在Series对象中，只要有一条数据是字符串类型，则dtype就为 object。

因此终端输出dtype: object，object等价于字符串类型。

9.3 data=列表，列表元素均为整数

# 导入pandas库并简写为pd
import pandas as pd 

# 列表的元素均为整数
data = [1, 2, 3, 4]

s1 = pd.Series(data)
print(s1)

【终端输出】

0    1
1    2
2    3
3    4
dtype: int64

列表data的元素均为字符串。

终端输出dtype: int64，数据均为整数。

9.4 data=列表，列表元素均为浮点数

# 导入pandas库并简写为pd
import pandas as pd 

# 列表的元素均为浮点数
data = [1.1, 2.2, 3.3, 4.4]

s1 = pd.Series(data)
print(s1)

【终端输出】

0    1.1
1    2.2
2    3.3
3    4.4
dtype: float64

列表data的元素均为浮点数。

终端输出dtype: float64，数据均为浮点数。

10. Series类的values和index属性

Series类是pandas库中的一个数据结构，它有两个属性：values和index。

values属性是一个一维数组，用于存储Series对象中的数据。

这个数组可以包含不同的数据类型，如整数、浮点数、字符串等。

我们可以通过访问这个属性来获取Series对象中的数据。

index属性是一个索引对象，用于标识Series对象中每个数据项的标签。

索引可以是整数、字符串或其他数据类型。

通过index属性，我们可以对Series对象进行标签化的访问和操作。

11. 利用index获取Series的索引

# 导入pandas库并简写为pd
import pandas as pd 

data = {'A':'赵','B':'钱','C':'孙','D':'李'}

# 调用库的类：库名.类名( )
# pd是库名，Series是类名
# 创建对象：对象名 = 类名()
# s1是对象名，Series是类名
s1 = pd.Series(data)

# 查看对象的属性
# 对象名.属性名
print(s1.index)

【终端输出】

Index(['A', 'B', 'C', 'D'], dtype='object')

【代码解析】

s1是实例化类后创建的对象，是对象名。
index是该对象具有的属性。
对象名.属性名可输出属性。

Index表是对象的索引，因此这里输出的就是数据的索引值['A', 'B', 'C', 'D']。

12. 利用values获取Series的值

# 导入pandas库并简写为pd
import pandas as pd 

data = {'A':'赵','B':'钱','C':'孙','D':'李'}

# 调用库的类：库名.类名( )
# pd是库名，Series是类名
# 创建对象：对象名 = 类名()
# s1是对象名，Series是类名
s1 = pd.Series(data)

# 查看对象的属性
# 对象名.属性名
print(s1.values)

【终端输出】

['赵' '钱' '孙' '李']

values表是对象的数据，因此这里输出的就是对象中的数据['赵' '钱' '孙' '李']。

13. 课堂练习

【目标任务】

假设你正在记录每天的体重，并且你有以下数据：

星期一: 55
星期二: 54
星期三: 53
星期四: 52
星期五: 51

要求使用上面这些数据创建一个名为 weight 的 Series 对象，并将星期作为索引。

最后分别输出Series 对象的索引和数据。

【代码示例】

import pandas as pd

data = [55, 54, 53, 52, 51]
index = ['星期一', '星期二', '星期三', '星期四', '星期五']

weight = pd.Series(data, index)

print(weight)

print("Series对象的索引：",weight.index)

print("Series对象的数据：",weight.values)

【终端输出】

星期一    55
星期二    54
星期三    53
星期四    52
星期五    51
dtype: int64
Series对象的索引： Index(['星期一', '星期二', '星期三', '星期四', '星期五'], dtype='object')
Series对象的数据： [55 54 53 52 51]

14. 总结

15. 课后练习

【目标任务】

已知2个列表如下：

list_1 = [1, 2, 3, 4]
iist_2 = [9, 8, 7, 6]

要求将这两个列表中的元素一一对应相加，返回一个新列表。

【一一相加】

1+9 = 10
2+8 = 10
3+7 = 10
4+6 = 10

【返回的列表】

list_3 = [10, 10, 10, 10]

【代码示例】

list_1 = [1, 2, 3, 4]
list_2 = [9, 8, 7, 6]
result = []

for i in range(len(list_1)):
    result.append(list_1[i] + list_2[i])

print(result)

【终端输出】

[10, 10, 10, 10]

【代码解析】

list_1 = [1, 2, 3, 4]
print(len(list_1))

【终端输出】

len函数是一个内置函数，在Python中用于返回一个对象的长度或元素个数。

它可以用于字符串、列表、元组、字典等可迭代对象。

当应用于字符串时，len函数返回字符串中字符的个数。

当应用于列表、元组或字典时，len函数返回容器中元素的个数。

上面的列表有4个元素，因此len(list_1)=4

for i in range(len(list_1))等价于for i in range(4)。

list_1 = [1, 2, 3, 4]
list_1[0]

【终端输出】

列表索引取值语法列表名[索引]。
list_1[0]取到列表的第一元素1。

list_1[i] + list_2[i]

2个列表的索引均为i，就实现了列表取值的一一对应。

取值后将2个元素进行加法运算，就实现了题目的求和。

result.append(list_1[i] + list_2[i])

向列表中增加元素的语法为列表名.append(要增加的元素)。
result是列表名。
append向列表增加元素的函数。
list_1[i] + list_2[i]要增加的元素。

上面这个方法是我们在基础语法部分学习的方法，今天学了Series后，我们可以用更简洁的办法来计算出2个列表一一对应的和。

用Series的相关知识该怎么计算呢，大家先动动脑想一想吧！

【参考答案】

你可能感兴趣的:(python)

spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
python读取zip包内文件_Python模块学习：zipfile zip文件操作 weixin_40001634 python读取zip包内文件
最近在写一个网络客户端下载程序，用于下载服务器上的数据。有些数据(如文本，office文档)如果直接传输的话，将会增加通信的数据量，使下载时间变长。服务器在传输这些数据之前先对其进行压缩，客户端接收到数据之后进行解压，这样可以减小网通传输数据的通信量，缩短下载的时间，从而增加客户体验。以前用C#做类似应用程序的时候，我会用SharpZipLib这个开源组件，现在用Python做类似的工作，只要使用
python制作登陆窗口_python登陆界面 weixin_39758494 python制作登陆窗口
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！print(账号密码错误！请重试。)returnfalsebutton(master,text=登陆,width=10,command=test).grid(row=3,column=0,sticky=w,padx=10,pady=5)button(master,text=退出,wid
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？潮易 python 开发语言
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？这个问题涉及到Python编程中的MQTT（MessageQueuingTelemetryTransport）库的使用，该库允许我们创建客户端订阅和发布消息到MQTT服务器。以下是一个简单的步骤：1.安装MQTT库：可以使用pip安装`paho-mqtt`库。```pythonpipinstallpaho-mqtt```2.创建一个MQTT客
Python-tkinter自制登录界面（含注册） GCHEK python 开发语言
简单的用户登录、注册界面importtkinterastkimporttimeimportsubprocessimportsysimportosimporttkinter.messageboxwindow=tk.Tk()window.title('GCHEK')window.geometry('400x300')#设置储存用户信息的容器，这里用的txt。ifnotos.path.exists('U
Python爬虫requests(详细) dme. Python爬虫零基础入门爬虫 python
本文来学爬虫使用requests模块的常见操作。1.URL参数无论是在发送GET/POST请求时，网址URL都可能会携带参数，例如：http://www.5xclass.cn?age=19&name=dengres=requests.get(url="https://www.5xclass.cn?age=19&name=deng")res=requests.get(url="https://www
使用python计算等比数列求和的方法 HAMYHF windows
在python中，计算Sum=m+mm+mmm+mmmm+.....+mmmmm.....,输入两个数m,n。m的位数累加到n的值，列出算式并计算出结果：#为了打印出算式，并计算出结果，将m,mm这些放入到列表中#定义列表中的m初始值为0,用Ele来代表m,mm....Ele=0#定义总和为0Sum=0#定义一个空列表List=[]#输入两个值n=int(input("inputadigit：")
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st