L缶神

Python（三）pandas数据分析、Seaborn的数据可视化

一、Pandas

二、Pandas-Serise

三、DataFrame

1、DataFrame的创建

2、删除操作：

3、获取操作：

获取列数据：

获取行数据：

根据具体条件获取数据

4、文件操作

四、使用jupyter notebook完成文件相关操作

五、Seaborn可视化

六、pandas数据写入mysql

七、pandas数据清洗

（一）处理缺失数据

（二）分析数据问题

1、没有列头

2、空值数据

3、非法数据

4、数据单位不统一

5、空值填充

6、切分为多列

一、Pandas

1、pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数

2、pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能

3、对于金融行业的用户，pandas提供了大量适合于金融数据的高性能时间序列功能和工具

4、学统计的人会对R语言比较熟悉，R提供的data.frame对象功能仅仅是pandas的DataFrame所提供的功能的一个子集

5、pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具，它是基于Numpy构建的，有很多操作是类似的

6、约定本小节编写程序之前默认运行了import pandas as pd和 from pandas import Series,DataFrame

7、pandas的下载：控制台中输入命令：pip install pandas进行下载pandas

二、Pandas-Serise

Series是一种类似于一维数组的对象，由数据(各种NumPy数据类型)以及与之相关的数据标签(即索引)组成

可以通过字典构建Series对象，Series对象的索引也是可以修改的

举例：

import pandas as pd
 
data = [1, 2, 3]
series1 = pd.Series(data=data)
print(series1, type(series1))
# 获取下标为0的数据
print(series1[0])
print(">" * 70)
# 通过字典创建series
data1 = {1: "java", 2: "python", 3: "scala"}
series2 = pd.Series(data=data1)
print(series2, type(series2))
# 根据key值进行获取数据
print("根据key值获取数据:"+series2[2])
print(">" * 70)
# 创建series给定下标 根据给定key值进行创建
series3=pd.Series(data=data1, index=[2, 3])
print(series3)

结果：

相关函数：获取最大值与获取最小值：series1.max();series1.min()

结果：3 1

三、DataFrame

DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型(数值、字符串、布尔值等)

DataFrame既有行索引也有列索引，可以看做由Series组成的字典

1、DataFrame的创建

DataFrame的创建可以通过字典创建，也可以通过列表创建，在使用列表创建时，默认情况下输出的列名称为数字顺序，可以在创建时加入设置列名称：columns=... ...

# 创建dataframe
# 通过字典进行创建
data2 = {"Language": ["Python", "java", "scala", "sql"],
         "application": ["pySpark", "Hadoop", "Spark", "Hive"]
         }
df1 = pd.DataFrame(data=data2)
print(df1)

# 通过列表进行创建 可以增加列名称
data3 = [["java", "1"], ["Python", "2"], ["scala", "3"]]
df2 = pd.DataFrame(data=data3, columns=["language", "year"])
print(df2, type(df2))

结果：

当dataframe中只有一列数据时，仍然表示的是一个dataframe，而不是series

data4 = [[1], [2], [3]]
df3 = pd.DataFrame(data=data4)
print(df3, type(df3))

结果：

2、删除操作：

使用Drop方法进行删除操作

格式：DataFrame.drop(labels=["行/列名称"]，axis=0:表示行/1:表示列)

当想要进行删除操作时，需要指定删除的是行数据还是列数据

这里的指定有一个变量axis，若在进行删除操作时，不加axis的值，axis默认为0，表示删除行数据

但是这里进行删除后的dataframe是一个新的dataframe，若想使被删除的原dataframe在删除后变为删除后的表，需要使用inplace方法进行替换

格式：DataFrame.drop(labels=["行/列名称"]，axis=0:表示行/1:表示列，inplace=True)

这里的inplace默认为False

# 删除df2中的列数据Number
df4=df2.drop(labels=["Number"], axis=1)
print(df4)
# 这里删除后的数据存到了df4中，df2中并未被删除
#使用inplace使df2中数据也被删除
print(">" * 70)
df2.drop(labels=["Number"], axis=1, inplace=True)
print(df2)

结果：

3、获取操作：

dataframe中进行获取数据时，有多种获取数据的方法

获取列数据：

1、通过key（列）获取数据

2、通过.+列名称进行获取

获取行数据：

1、通过dataframe.loc[index(行下标)]进行获取固定下标的一行数据

2、通过dataframe.head()进行从前获取5行数据

3、通过dataframe.tail()进行从后获取5行的数据

举例：

# 获取数据,通过key(列)进行获取
print(">" * 70)
print(df["application"], type(df["application"]))
# 通过.列名称获取
print(df.application,type(df.application))
 
data5 = {
    "Language": ["A", "B", "C", "D", "E", "F", "G"],
    "words": ["a", "b", "c", "d", "e", "f", "g"]
}
df5 = pd.DataFrame(data5)
print(df5.loc[2])  # 获取下标为2的数据
print(df5.head()) # 获取前5行数据
print(df5.tail()) # 获取后5行数据

结果：

根据结果得出：通过列进行取值后，取出的数据为一个Series

获取行数据结果：

根据结果得出： 通过行获取的数据，是一个DataFrame

根据具体条件获取数据

创建一个DataFrame，从其中获取到年龄小于18的学生信息

# 创建一个学生DataFrame
data6 = {
    "name": ["张同学", "李同学", "王同学"],
    "age": [17, 19, 16]
}
df6 = pd.DataFrame(data=data6)
print(df6)
# 获取年龄小于18的结果
print("----获取年龄小于18的结果----")
print(df6["age"] < 18)
# 进一步获取年龄小于18的同学的信息
print("----进一步获取年龄小于18的同学的信息----")
print(df6[df6["age"] < 18])

结果：

使用describe可以针对Series或者DataFrame列进行计算汇总统计

对df6进行汇总统计：print(df6.describe())

数据1到3的内容表示他的四分位数

4、文件操作

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数，常用的函数为read_csv和read_table

read_csv：从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号。

read_table：从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符(“\t”)

read_csv中可以指定name的值，即读取到的文件存入dataframe中的列名称，使用names=[... ...]

# 读取文件
df7 = pd.read_csv("D:\PyCharmProjects\day47\data\students.txt", names=["id", "name", "age", "gender", "clazz"])
print(df7)
print(df7.head())

结果：

read_csv/read_table常用参数介绍:

path :表示文件系统位置、URL、文件型对象的字符串

sep/delimiter:用于对行中个字段进行拆分的字符序列或正则表达式

header:用做列名的行号。默认为0(第一行)，若无header行，设为None

names:用于结果的列名列表，结合header=None skiprows: 需要忽略的行数

na_values:一组用于替换NA的值

nrows:需要读取的行数(从文件开始处算起)

verbose:打印各种解析器信息，比如“非数值列中缺失值的数量”

encoding:用于unicode的文本格式编码。例如，“utf-8”表示用UTF-8 编码的文本

四、使用jupyter notebook完成文件相关操作

在控制台输入jupyter notebook启动jupyter，跳转页面至网页，没有跳转就手动点击网址跳转

在跳转后的网址中新建一个ipynb文件

点击该名称，可以重命名该文件，初次创建该文件时，文件名默认为Untitled

在jupyter下先导入pandas，再执行读取文件操作

取该文件前一百行数据

需求：统计各班级的人数

实现：

这里可以看见对该结果进行获取类型，发现是Series

想要将其转换为DataFrame需要加上命令：reset_index()

进一步改进，更改列名id为人数cnt，并将结果替换原来的clazz_num保存

以cnt的值从大到小实现排序：

读取成绩文件score.txt，设置列名

更改列名称并替换：

将该成绩表与学生表相关联：

实现关联需要使用merge方法

格式：左表.merge(右表，left_on="左表关联列"，right_on="右表关联列"，how='关联方式')

left_on表示左表中用来关联的列名称

right_on表示右表中用来关联的列名称

how表示用来关联的方式，类似于sql中连表联查中的左联右联和内联，这其中的关联方式有很多种：left，right，outer，inner，cross

改进：有关学生id出现了两个，删除其中一个student_id

统计每个班的前三名，先进行分组，然后使用rank函数进行排名操作，并且设置ascending=False

使连接后的表进行倒序排列

五、Seaborn可视化

。。。。。。。。。。。。。。。。。

六、pandas数据写入mysql

写入MySQL操作需要先下载包sqlalchemy

下载完之后进入到jupyter中

为虚拟机创建一个新的数据库，用于将数据写入该数据库中，这里创建一个stu数据库

写入MySQL，使用to_sql即可写入MySQL中，具体流程可以看成：

获取引擎，生成执行器，执行to_sql，具体格式如下：

结果：生成日志文件，自动创建表，再执行写入操作

进入到表中检验：进入stu数据库再进行查看

pandas读取数据库数据

使用read_sql进行读取数据库数据

七、pandas数据清洗

（一）处理缺失数据

读取所要清洗的数据

发现表中有的地方是NaN，表示null值

缺失数据是最常见的问题之一。产生这个问题有以下原因：

1、从来没有填正确过

2、数据不可用

3、计算错误

无论什么原因，只要有空白值得存在，就会引起后续的数据分析的错误。下面介绍几个处理缺失数据的方法：

1、为缺失数据赋值默认值

2、去掉/删除缺失数据行

3、去掉/删除缺失率高的列

使用fillna填充null值为空字符串：

加上赋值操作：country列中的第五行的NaN值被换为了空字符串

将电影时长duration列中的NaN使用均值填充：

上面提到过表中取出一列数据，该数据为Series类型，所以可以使用Series中的mean方法求出均值，再将均值填充NaN

删除某行全部为null值的数据
movie.dropna(how='all'),该表中没有全部为null的数据，故执行后不改变

规范化数据类型

movie.info:查看当前表的各列属性

加载数据集时指定数据类型：加载该数据集时可以把该数据集中的title_year类型指定为str类型

data = pd.read_csv('./data/movie_metadata.csv', dtype={'title_year':str})

将内容转为大写

将genres中的内容全部转为大写

切分数据

将导演director_name列的名字切分为两列数据

结果：

（二）分析数据问题

1、没有列头

读取数据时发现该数据集没有列头，需要再加载数据集时加入列名

2、空值数据

删除其中行数据全部为null值的行

3、非法数据

观察发现这其中的name列含有非法的字符

去除非法字符：

用平均值替换age中的NaN值：

4、数据单位不统一

表中weight列的数据单位不统一，需要将lbs单位换位kgs，同时用均值填充NaN值：

这里由于取出的数据是一个Series类型，所以不可以转为int，使用map方法实现该操作

将数据除去单位换算为千克单位的数值，通过切分[:-3]从后往前的第四个数取出，先转为str，再转为float，再换算，换算后转为int不保留小数

换算之后将其加入到data表中

5、空值填充

将空值填充为平均值：

过程中使用astype将取到的没有单位的数据转为int类型，然后才能求平均值

将f0612列中的空值填充为均值：

6、切分为多列

需求：

将后六列变为三列，分别表示性别，时间段，心率

需要使用melt方法

melt方法参数：

参数一：具体的dataframe；参数二：id_vars：表示不需要变更的列

参数三：需要转换的列的新列名；参数四： value_name表示原表中数值列的列名

使用melt方法对表进行初步转换：

结果：共六十行

去除为'-'的行：结果共三十行

将取出的数据变成一个新的dataframe：

将新的dataframe的sex_hour进行切分：

结果：共三十行

这里已经基本完成了该需求，可以改进：将多余的sex_hour列删除：

【第四天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-两种常见的递归算法（持续更新） Long_poem python 算法开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的搜索算法2.两种常见的递归算法3.两种详细的递归算法代码1）斐波那契数列2）阶乘总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种常见的
Python 装饰器详解：@staticmethod 与 @classmethod 的区别与用法：中英双语阿正的梦工坊 Python python 开发语言
缘由：今天在看Huggingface的源码的时候，https://github.com/huggingface/transformers/blob/v4.47.1/src/transformers/models/auto/configuration_auto.py#L897对几个装饰器有所疑问，学习一下。Python装饰器详解：@staticmethod与@classmethod的区别与用法在Py
python机器学习方安乐 python python 机器学习人工智能
Python机器学习是当前最为热门的机器学习领域之一，其简洁、易用、高效的特点，让越来越多的开发者开始探索其应用。本文将从以下几个方面介绍Python机器学习的基础知识和实践案例，帮助读者更好地理解和应用机器学习技术。前提Python机器学习的应用领域A.图像识别和计算机视觉B.自然语言处理和文本分析C.数据挖掘和推荐系统深度学习A.神经网络的基本原理B.常用的深度学习框架和算法C.深度学习在图像
基于Python的豆瓣电影爬虫数据分析可视化设计与实现计算机软件程序设计 Python爬虫 Python程序设计数据分析 python 爬虫
【1】系统介绍1.研究背景随着互联网的快速发展，电影产业已经成为全球文化产业的重要组成部分。观众对电影的需求和兴趣日益增长，而在线电影平台如豆瓣电影（DoubanMovie）成为了用户获取电影信息、发表评论和评分的主要渠道之一。豆瓣电影不仅提供了丰富的电影资料，还拥有庞大的用户群体，这些用户生成的内容（UGC）为电影市场分析提供了宝贵的数据资源。然而，尽管豆瓣电影平台提供了大量的公开数据，但这些数
Python实现itemCF协同过滤推荐算法并计算召回率、准确率、F1分数和覆盖率计算机软件程序设计机器学习 python 推荐算法开发语言
一个完整的Python实现，包括ItemCF协同过滤算法的实现以及召回率、准确率、F1分数和覆盖率等评估指标的计算。将使用Pandas进行数据处理，Scikit-learn进行相似度计算，并编写函数来生成推荐列表和评估模型性能。1.数据准备首先，需要准备数据。假设有一个用户-物品评分矩阵（可以是显式评分或隐式反馈），表示用户对不同酒店的喜好程度。这里可以使用Pandas来处理数据。importpa
自然语言处理（NLP）-总览图学习汤姆和佩琦 NLP 自然语言处理学习人工智能
文章目录自然语言处理（NLP）-总览图学习1.一张总览图的学习1.语音学（Phonology）2.形态学（Morphology）3.句法学（Syntax）4.语义学（Semantics）5.推理（Reasoning）小结自然语言处理（NLP）-总览图学习转自《Python自然语言处理第二版》1.一张总览图的学习这张图片展示了一个自然语言处理的流程模型，涵盖了从语音分析到应用推理和执行的多个阶段，每
panda3d python_Panda3D weixin_39994949 panda3d python
Panda3DPanda3Disagameengine,aframeworkfor3DrenderingandgamedevelopmentforPythonandC++programs.Panda3Disopen-sourceandfreeforanypurpose,includingcommercialventures,thankstoitsliberallicense.Tolearnmore
Python Web应用开发进阶：集成数据库与SQLAlchemy Evaporator Core Python开发经验 python 前端数据库
引言在上一篇《PythonWeb应用开发入门：从零搭建一个简单的Web应用》中，我们学习了如何使用Flask框架搭建一个简单的Web应用。然而，大多数Web应用都需要与数据库进行交互，以存储和检索数据。本文将深入探讨如何在Flask应用中集成数据库，并使用SQLAlchemy进行数据操作。一、数据库选择与安装1.1选择数据库在PythonWeb开发中，常用的数据库有SQLite、MySQL、Pos
震惊！996加班写教程？OUT了！我用Python+AI，一键自动生成，效率提升100倍！ lizhijianwill 人工智能 python 开发语言改行学it java javascript
导语：你是否还在为了撰写技术教程而苦苦挣扎？是否还在996的工位上，熬夜爆肝，只为输出一篇高质量的技术文档？醒醒吧！这个时代变了！今天，我就要告诉你一个颠覆传统的秘密武器，让你彻底告别低效的手工教程编写模式，拥抱AI，解放生产力，让效率飞起来！时代焦虑：AI浪潮来袭，你还在用“石器时代”的方法写教程？2024年，AI技术已经渗透到我们生活的方方面面。“AI智能体”、“思维链”、“生产力革命”这些词
基于Python的自然语言处理系列（2）：Word2Vec（负采样）会飞的Anthony 自然语言处理人工智能信息系统自然语言处理 word2vec 人工智能
在本系列的第二篇文章中，我们将继续探讨Word2Vec模型，这次重点介绍负采样（NegativeSampling）技术。负采样是一种优化Skip-gram模型训练效率的技术，它能在大规模语料库中显著减少计算复杂度。接下来，我们将通过详细的代码实现和理论讲解，帮助你理解负采样的工作原理及其在Word2Vec中的应用。1.Word2Vec（负采样）原理1.1负采样的背景在Word2Vec的Skip-g
如何运用python爬虫获取大型资讯类网站文章，并同时导出pdf或word格式文本？大懒猫软件深度学习 python 网络爬虫自然语言处理
这里，我们以比较知名的商业新知网站https://www.shangyexinzhi.com/为例进行代码编写，下面进行代码应用思路。第一部分，分析网站结构首先，我们来分析，要使用Python技术分析一个网站的结构，通常可以通过以下步骤实现：获取网站的HTML内容：使用requests库来获取网站的HTML源代码。解析HTML内容：使用BeautifulSoup库来解析HTML，提取网站的结构信息
Python知识点：基于Python工具和技术，如何使用Truffle进行智能合约开发与部署杰哥在此 Python系列 python 智能合约开发语言编程面试
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用Truffle与Python进行智能合约开发与部署Truffle是一个强大的开发框架，它为以太坊智能合约的开发、测试和部署提供了一整套工具。虽然Truffle主要使用JavaScript和Solidity，但是它也可以与Python工具和技术配合使用，以实现更灵活的开发流程。
leetcode_字符串 14.最长公共前缀函数 MiyamiKK57 leetcode 算法 python
14.编写一个函数来查找字符串数组中的最长公共前缀如果不存在公共前缀，返回空字符串“”1.startswith()方法调用Python内置的startwith()方法，用于检查字符串是否以指定的子字符串开头语法：str.startswith(prefix[,start[,end]])prefix：指定要检查的开头子字符串，可以是一个字符串或包含多个字符串的元组。start（可选）：起始检查的位置（
25.1.6 python基础程序练习 MiyamiKK57 python
23.暂停后输出暂停一段时间后输出importtimetime.sleep(2)#停顿2秒后输出print('helloworld')24.成绩if语句利用条件运算符的嵌套来完成此题；学习成绩>=90分的同学用A表示，60-89分的用B表示，60以下用C表示a=int(input('请输入成绩：'))ifa>=90:print('A')elif60<=a<90:print('B')else:pri
使用Python进行3D游戏开发 2301_79366332 python 3d pygame Python
Python是一种功能强大且易于学习的编程语言，它也可以用于开发3D游戏。虽然Python在游戏开发方面可能不如其他专门的游戏引擎和语言，但它仍然提供了许多库和工具，可以帮助您构建简单的3D游戏。在本文中，我们将探讨如何使用Python进行基本的3D游戏开发。安装所需的库要开始使用Python进行3D游戏开发，您需要安装一些必要的库。其中，最重要的是Pygame库和PyOpenGL库。Pygame
通过Python编程语言实现“机器学习”小项目教程案例胡萝卜不甜机器学习 python 机器学习开发语言
1.Python与机器学习概述1.1Python语言特点Python是一种广泛使用的高级编程语言，具有简洁、易读、易学的特点，这使得它成为初学者和专业人士的首选语言之一。简洁性：Python的语法简洁明了，减少了代码量，提高了开发效率。例如，与其他语言相比，Python可以用更少的代码实现相同的功能，这使得代码更容易编写和维护。易读性：Python的代码风格类似于英语，易于理解和阅读。这种易读性使
Python知识点：如何使用Panda3D进行3D游戏开发杰哥在此 Python系列 python 3d 开发语言编程面试
使用Panda3D进行3D游戏开发是一个相对复杂但功能强大的过程。Panda3D是一个基于Python和C++的开源引擎，专为3D游戏开发而设计。它支持物理、动画、着色器、碰撞检测等，能够制作高质量的3D游戏。以下是如何使用Panda3D进行3D游戏开发的基本步骤。1.安装Panda3D首先，你需要安装Panda3D。你可以使用以下命令安装：pipinstallpanda3d2.创建一个基本的Pa
pycharm新建python的快捷键_Pycharm超级好用的快捷键——效率之王 weixin_39679468
最重要的快捷键ctrl+shift+A:万能命令行shift两次:查看资源文件新建工程第一步操作module设置把空包分层去掉,compactemptymiddlepackage设置当前的工程是utf-8,设置的Editor-->FileEncodings-->全部改成utf-8,注释ctrl+/:单行注释光标操作ctrl+alt+enter:向上插入shift+enter:向下插入end:光标操
【python】GUI框架——wxPython 草莓泰面包 python python 开发语言
文章目录GUIwxPython结构启动界面——wx.App代码遇到报错：wx.Frame()框架wx.Panel()容器布局——wx.SizerBox布局管理器（默认水平布局）控件statictext文本类字体格式Fonttextctrl输入文本类wx.Validator是用于验证用户输入的类，它允许您自定义输入验证规则和错误处理。Button按钮FileDialogMessageDialogEv
Python中的异常处理 -- (转) weixin_30379531
python中的异常异常是指程序中的例外，违例情况。异常机制是指程序出现错误后，程序的处理方法。当出现错误后，程序的执行流程发生改变，程序的控制权转移到异常处理。Exception类是常用的异常类，该类包括StandardError，StopIteration,GeneratorExit,Warning等异常类。StandardError类是python中的错误异常，如果程序上出现逻辑错误，将引发
如何获取股票行情数据接口？有哪些可靠的途径与方法？财云量化 python炒股自动化量化交易程序化交易股票行情数据接口可靠途径官方渠道股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
「Py」基础语法篇之 Python缩进规则何曾参静谧「Py」Python程序设计数据库
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「UG/NX」BlockUI集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」NX定制开发「Py」Python程序设计「Math」探秘数学世界「PK」Pa
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
python json 用法云连山 python python json
JSON简介JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式。它基于JavaScript的一个子集，易于人阅读和编写，同时也易于机器解析和生成。在Python中，使用json模块来处理JSON数据。JSON支持的数据类型主要有对象（在Python中类似于字典）、数组（在Python中类似于列表）、字符串、数字、布尔值和null。将Python对象转换为JSON
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
python的小技巧一 2401_87368790 python 开发语言
print(res)####一个数值的范围比较*常规的写法deftest_judge5(self):“”"判断一个值得的范围大小@return:“”"num=int(input(“请输入一个数字：”))ifnum>=0andnum>在判断字典的某一个key是否为空，可以用try…exception来实现>>>deftest_judge3(self):dict_data={“user_base”:{
Python演奏《起风了》 2401_86461228 python 数据库
代码：importctypesimportthreadingimporttimewinmm=ctypes.windll.winmmclassScale:Rest=0C8=108B7=107A7s=106A7=105G7s=104G7=103F7s=102F7=101E7=100D7s=99D7=98C7s=97C7=96B6=95A6s=94A6=93G6s=92G6=91F6s=90F6=89E
【Python】自动化神器PyAutoGUI —告别手动操作，一键模拟鼠标键盘，玩转微信及各种软件自动化墩墩分墩 Python python 自动化自动化脚本自动化测试 pyautogui
文章目录1.PyAutoGUI简介2.不同操作系统引入模块3.全局延迟和临时休眠4,自动防故障功能5.获取屏幕分辨率—用于定位，这是最关键的，找到要点击的位置（像素坐标）6.获取鼠标位置7.判断坐标是否在屏幕范围内：8.鼠标移动8.1.鼠标移动的基本操作8.2.鼠标移动效果-缓动/渐变（Tween/Easing）9.鼠标点击10.鼠标滚轮控制11.鼠标拖拽12.键盘控制13.消息弹窗函数14.屏幕
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

Python（三）pandas数据分析、Seaborn的数据可视化

一、Pandas

二、Pandas-Serise

三、DataFrame

1、DataFrame的创建

2、 删除操作：

3、获取操作：

获取列数据：

获取行数据：

根据具体条件获取数据

4、文件操作

四、使用jupyter notebook完成文件相关操作

五、Seaborn可视化

六、pandas数据写入mysql

七、pandas数据清洗

（一）处理缺失数据

（二）分析数据问题

1、没有列头

2、空值数据

3、非法数据

4、数据单位不统一

5、空值填充

6、切分为多列

你可能感兴趣的:(python,python)

2、删除操作：