开始King

数据分析：numpy和pandas基础操作详解

数据处理基础

numpy基础
- 1.numpy创建数组及基础属性
- 2.数组的特点
- 3.创建常见数组
- 4.数组数据类型
- 5.生成随机数
- 6.一维数组索引
- 7.布尔索引
- 8. 多维数组的索引
- 9.实际问题
- 10.数组的转置和换轴
- 11.Numpy矩阵介绍
- 12.通用函数介绍
- 13数组广播机制
- 14Numpy读写二进制文件
- 15Numpy读写文本文件
pandas基础
- 1Pandas简介
- 2.pandas读取文本文件
- 3存储数据框
- 4.pandas读取excel文件
- 5将数据框存储为excel文件
- 6.构建数据框
- 7.查看数据框的常用属性
- 8. 按行列顺序访问数据框中的元素
- 9.按行列名称访问数据框中的元素
- 10.修改数据框中的元素
- 11.删除数据框的元素
- 12.描述分析数据框中的元素
- 13.转换成时间类型数据
- 14.时间类型数据的常用操作
- 15.groupby分组操作
- 16.agg操作
- 透视表

numpy基础

1.numpy创建数组及基础属性

numpy是数据处理的基础，pandas也是基于numpy的，首先是numpy数组的创建。
一般我们默认导入了一下库

import numpy as np
import pandas as pd

1.numpy创建数组及基础属性

arr=np.array([[1,2,3],[4,5,6],[7,8,9]])

本文使用的编译环境是jupyter notebook，python3.7。如果想要安装jupyter可以参考我的另一篇文章点击此处不过只要是python3的版本都可以运行，也可以选择自己喜欢的编译器，不影响程序运行

numpy的核心特征之一就是N-维数组对象----ndarray。一个ndarray的每个元素均为相同类型
numpy的基础属性：shape ，dtype ，ndim， size
每一个数组都有一个shape属性用来表征数组每一维度的数量；每个数组都有一个dtype属性用来描述数组的数据类型。ndim返回数组的维数。size返回数组元素个数。

2.数组的特点

数组可以进行矢量运算，比如如果想把list的每个元素平方，用list ** 2这样的运算会报错，而数组不会

3.创建常见数组

除了np.array还有很多函数可以创建新数组，例如np.zeros可以一次行创建全0数组，ones可以一次性创建全1数组，empty则可以创建没有初始化的数组(np.empty有时会返回未初始化的垃圾值)。
eye创建对角线全为1的二维数组
np.logspace(start=开始值，stop=结束值，num=元素个数，base=指定对数的底, endpoint=是否包含结束值)base默认为10
np.linspace()创建等差数列，（start=开始值，stop=结束值，num=元素个数）

np.diag() 创建对角数组

arange是Python内建函数range的数组版
Numpy没有特别指明的话，默认的数据结构是float64

4.数组数据类型

数据类型，即dtype也称元数据，表示数据的数据

数据类型的转化，可以用astype方法显式的转换数组的数据类型，也可以直接用函数转换。

5.生成随机数

生成无约束条件的随机数
生成指定shape的均匀随机数
生成符合正太分布的随机数
random具体函数用法

6.一维数组索引

单个元素索引

连续元素切片特点是左闭右开

只取了前两位，因为取不到2
注意[]内都是切片的，返回的维度不会发生改变，如上图，而将索引和切片混合就可以得到低纬度的切片。如
同时注意切片和索引的区别(切片会保留原数据的结构)
虽然返回的是同一个元素，但是维度不同，切片返回的是一个数组，是一个矢量

7.布尔索引

举个例子就非常容易明白了
只有索引为True的会返回，所以可以根据这一特点筛选想要的数据
注意Python的关键字and和or对布尔数组并没有用，请使用&（and）和 |（or）来代替。

8. 多维数组的索引

多维数组的索引
首先用reshape函数重构一个多维数组
这是一个二维数组，假如我们要取12这个元素，那么我们要找出12所在的行列索引,中间用逗号隔开

对二维数组的切片与一维数组类似
也可以逻辑索引和切片混合

9.实际问题

9.实际问题
求解距离距离矩阵
代码

10.数组的转置和换轴

转置是一种特殊的数据重组形式，可以返回底层数据的视图而不需要复制任何内容。
还有就是数组的展平ravel函数flatten函数等

还有一些其他的用法
 这里只介绍部分用法
数组的换轴，transpose方法可以接收包含轴编号的元组，具体用法点击此处

11.Numpy矩阵介绍

首先是矩阵的生成

mat函数mat可以从字符串或者列表中生成,其中字符串的表示中，矩阵的行与行之间用分号隔开，行内的元素之间用空格隔开(也可以用逗号)。

numpy.matrix(data, dtype=None, copy=True)如果date是字符串则将其解释为以逗号或空格分隔列的矩阵，以及分隔行的分号。

numpy.bmat详情点击

矩阵运算

矩阵的属性

12.通用函数介绍

一元通用函数：

函数名	描述
abs，fabs	逐元素的计算整数浮点数或复数的绝对值
sqrt	计算每个元素的平方根
exp	计算每个元素的自然指数值

二元通用函数

函数名	描述
multiply	将数组的对应元素相乘
add	将数组的对应元素相加
subtract	在第二个数组中，将第一个数组中的包含的元素去除

这部运算涉及到下面要讲的广播机制

13数组广播机制

广播描述了算法如何在不同形状的数组之间进行运算，它是一个强大的功能。
广播机制的原则是：如果对于每个结尾维度（及从尾部开始的），轴长度都匹配或者其中一个是1，两个数组就是可以兼容广播的。
下面举一个反例

一维数组【1，2，3】会向下进行广播，变成和二维数组相同的shape，然后对应元素相加
然后是二维数组的广播
注意这两数组都是二维数组，不过第二个数组只有一列，数组向右进行广播

14Numpy读写二进制文件

实际情况中使用较少
 保存多个数组到一个文件中，注意不能直接print输出文件内容，而要指明查看的文件中的具体数据对象

15Numpy读写文本文件

delimiter:指定文件分割符

pandas基础

1Pandas简介

pandas有两个常用的数据结构：Serise和DataFrame。
Serise是一种一维的有数据标签的数组型对象，DataFrame二维数据表，既有行索引也有列索引
pandas在数据分析处理中有非常重要的地位，具有一下特点：

2.pandas读取文本文件

1.文本文件读取
一般使用pd.read_csv(这个函数不仅仅可以读取csv文件还可以读取txt等其他文件)
注意读取文件的时候一定要清楚文件的分割符是什么，以及文件的编码格式：utf-8,utf-16,gbk,gb2312,gb18030。后三种是多用于中文的解码
如果编码格式不对的话就会出现乱码的情况，如下
加上编码格式
如果数据中没有列名称读取数据可以设置参数header=None

数据量过大，以下图片均为部分数据展示

3存储数据框

数据保存会默认传递index
左边比原数据多了一列从0开始的index

如果想保留原数据可以设参数index=None
不要列名称可以使用header=None
读取和存储的时候都有header参数，注意区分

4.pandas读取excel文件

1.excel文件读取
 想要读取不同的表只需要设置参数sheet_name

5将数据框存储为excel文件

这样保存数据左边也会出现一列从0开始的index，可以加参数index
s

6.构建数据框

一维序列，类比列表，但是每个元素具有名称。如果从DataFrame中取出一列返回的数据结构就是Series。
也可以直接用字典构建Series
创建DataFrame,可以用列表充当data
可以指定index和列名称（columns）

也可以用字典创建DataFrame,这样的话字典的键就会充当类名称，值就是数据源

还可以创建一些特殊的DataFrame,如果不传入data参数，就会创建缺失值型的数据框
还可以创建全零

7.查看数据框的常用属性

查看DataFrame的常见属性

8. 按行列顺序访问数据框中的元素

首先就是单列数据访问
访问任意两列
如果你只需要看数据的前几行可以
看数据的后几行

如果想访问数据框中某个特定的元素,iloc函数指明元素所在的行列
取某一行或者某一列
行列顺序访问也可使用切片的方法
注意获取到的数据的数据结构
因为df.iloc[:,0:1] 左右都是索引，维度不变。

9.按行列名称访问数据框中的元素

当数据框的数量较大的时候，按顺序访问较为麻烦，这时后可以采用按行列名称访问数据框中的元素。
先构建一个新的数据框
使用loc函数进行名称的访问
注意按照行列名称进行访问的时候，切片df.loc['a':'c','C']是闭区间，从‘a’到‘c’，因为按位置索引的时候可以判断3前面的数是2，而计算机无法判断‘c’前面的一个数是什么。

10.修改数据框中的元素

例如

对整列数据进行修改，有两种方式

增加数据

11.删除数据框的元素

删除某行或某列需要用到pandas提供的方法drop
注意默认inplace=False,不对原数据修改
如果想要修改原数据
删除行

12.描述分析数据框中的元素

数值型特征的描述性统计-----Numpy中的描述性统计函数。
pandas库基于Numpy，自然也可以用这些函数对数据框进行描述性统计。
首先构建数据框
每一行的均值
用pandas自带的方法的形式
了解数据的整体分布情况
还可以统计每一列元素的计数结果，也就是统计这一列每个元素的出现次数

13.转换成时间类型数据

pands时间相关的类
在多数情况下，对时间类型数据进行分析的前提就是将原本为字符串的时间转换为标准时间类型。pandas继承了NumPy库和datetime库的时间相关模块，提供了6种时间相关的类。
Timestamp作为时间类中最基础的，也是最为常用的类型，在多数情况下，时间相关的字符串都会转换成为Timestamp。pandas提供了to_datetime函数，能够实现这一目标
首先我们的数据是点击此处
提取码p53u
'lock_time’不是我们想要的时间类型

除了将数据字原始DataFrame中直接转换为Timestamp格式外,还可以将数据单独提取出来将其转换
为DatetimeIndex或者PeriodIndex。
转换为PeriodIndex的时候需要注意，需要通过freq参数指定时间间隔，常用的时间间隔有Y为年，M为月，D为日，H为小时，T为分钟，S为秒。两个函数可以用来转换数据还可以用来创建时间序列数据，其参数非常类似。
参数设置

14.时间类型数据的常用操作

Timestamp类常用属性
在多数涉及时间相关的数据处理，统计分析的过程中，需要提取时间中的年份，月份等数据，使用对应的Timestamp类属性就能够实现这一目的。

比如获取当前时间的年份，对单个数据的操作是

如果想要对一列进行操作
还可以进行时间的加减

15.groupby分组操作

首先读入我们的数据，数据在上面的网盘链接里
从中提取三列数据，以’order_id’为分组依据
分组后的结果是不能直接访问的，需要进行agg操作

16.agg操作

比如对数据进行求均值

还可以同时进行多种操作
还可以采用字典的形式，对不同列进行不同的函数处理
你也可以自定义函数操作

透视表

python：使用gdal和numpy进行遥感时间序列最大值合成 _养乐多_ python处理遥感数据 python numpy 开发语言
作者：CSDN@_养乐多_本文将介绍使用python编程语言，进行遥感数据时间序列最大值合成的代码。代码中使用了numpy和gdal，通过numpy广播机制实现时间序列最大值合成，并以NDVI时间序列数据为例。代码方便易运行，逻辑简单，速度快。只需要输入单波段遥感数据，就可输出最大值合成影像。输入输出如下图所示，文章目录一、完整代码一、完整代码importosimportglobimportnum
YOLOv8实例分割训练自己的数据集 NoContours YOLO python 开发语言
转载https://blog.csdn.net/m0_51530640/article/details/1299752571.利用labelme进行数据标注1.1Labelme安装方法首先安装Anaconda，然后运行下列命令：####################forPython2####################condacreate--name=labelmepython=2.7s
青少年Python趣学编程：用代码开启无限可能【文末好书推荐】一键难忘好书推荐 python pygame 开发语言
文章目录青少年Python趣学编程：用代码开启无限可能1.为什么选择Python？2.从小游戏开始：让编程变得有趣3.学习编程的关键步骤4.提供项目和挑战：激发创造力《青少年Python趣学编程（微课视频版）》【好书推荐】购书链接本书特色✨内容亮点配套资源适用人群青少年Python趣学编程：用代码开启无限可能在当今数字化的时代，编程已成为一种基础技能，尤其对于青少年来说，学习编程不仅能帮助他们理解
智联招聘爬虫 m0_74823878 面试学习路线阿里巴巴爬虫
使用Python和Selenium进行招聘信息爬取在当今数字化时代，数据已成为企业决策的重要依据。对于人力资源部门或求职者而言，获取最新的招聘信息至关重要。然而，手动浏览和收集招聘信息不仅耗时费力，而且效率低下。为了解决这个问题，我们可以使用Python和Selenium库来自动化这一过程，实现从招聘网站上批量爬取招聘信息。准备工作在开始之前，你需要确保已经安装了以下库：Python（建议版本3.
Mac M1安装Python---kalrry kalrry Python python macos 开发语言
MacM1安装Python---kalrry一、准备二、安装三、配置环境变量1、配置环境2、测试3、pip3与pip建立软链接四、参考备份一、准备Python3.9.1发布后开始支持苹果M1和macOS11BigSur也就是我们要下载3.9.1以后的版本，最好选择最新稳定版python官网下载python阿里网盘下载—sa65二、安装双击正常一路next安装即可三、配置环境变量1、配置环境命令行输
记录一次M1芯片Mac折腾安装Python3的过程 Onemud macos python linux
记录一次M1芯片Mac折腾安装Python3的过程前言：是要用python搞一个跟url接口交互的脚本，来配合做服务迁移工作，但在开发和测试脚本是让python环境卡住了脖（电脑装了很多个python，并且多版本间管理的比较混乱）所以想先调试好一个版本能用就好；并且脚本用到requests库，需要给python安装一下。总结两件事：装好python3.9，得能用给python3.9装上reques
python正态检验_Python检验数据是否正态分布 weixin_39748858 python正态检验
在对数据进行处理前，有事需要判断数据是否呈正态分布，比如线性回归，比如使用3-sigma判断数据是否异常。常用的正态分布检测方法：Shapiro-WilktestShapiro-Wilktest是一种在频率上统计检验中检验正态性的方法。该检验的零检验是样本$x_1,\cdots,x_n$来自于一个正态分布的母体。这个检验的统计量是：$$W=\frac{(\sum_{i=1}^{n}a_{i}x_{
python爬取pdf_python爬取在线教程转成pdf weixin_39842237 python爬取pdf
1、网站介绍之前再搜资料的时候经常会跳转到如下图所示的在线教程：01.教程样式包括一些github的项目也纷纷将教程链接指向这个网站。经过一番查找，该网站是一个可以创建、托管和浏览文档的网站，其网址为：https://readthedocs.org。在上面可以找到很多优质的资源。该网站虽然提供了下载功能，但是有些教程并没有提供PDF格式文件的下载，如图：02.下载该教程只提供了HTML格式文件的下
MySQL 8.0 社区版安装与配置全流程指南（Windows平台） waicsdn_haha 程序员教程数据库 mysql windows python django pygame virtualenv
一、软件定位与特性MySQL8.0是开源关系型数据库管理系统的里程碑版本，支持ACID事务、JSON文档存储、窗口函数等特性，广泛应用于Web开发、数据分析等领域。相较于旧版本，8.0版引入以下核心升级：性能优化：查询速度提升2倍以上安全性增强：默认启用caching_sha2_password认证插件功能扩展：支持CTE（公共表表达式）和原子DDL二、安装环境准备1.系统要求项目最低配置推荐配置
Python常见库的使用浪子西科 Python python 开发语言
文章目录人工智能与机器学习1.NumPy2.Pandas3.Scikit-learn4.TensorFlow5.PyTorch数据可视化1.Matplotlib2.Seaborn网络请求与爬虫1.Requests2.Scrapy自动化测试1.unittest2.pytest自然语言处理1.NLTK2.SpaCy数据库操作1.SQLite32.SQLAlchemy日期和时间处理1.datetime2
python 绘制正态分布图点云侠 CloudCompare python 开发语言算法 3d
目录一、概述二、代码实现三、结果展示一、概述在Python中，可以使用numpy库中的normal()函数或random.normal()方法生成正态分布的随机数，同时也利用scipy库的norm.pdf()函数来计算正态分布的概率密度函数。二、代码实现importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.statsimportnorm#创建
服务器/mac m1配置python环境 LoveSeven.Lin macos python 开发语言
目录服务器配置环境一、安装miniconda二、创建环境三、激活环境四、conda安装Macm1配置环境一、安装Miniforge3二、创建环境三、激活环境四、安装tensorflow五、测试运行服务器配置环境一、安装miniconda#step1:获取安装shell脚本文件wgethttps://repo.continuum.io/miniconda/Miniconda3-latest-Linu
Mac M1芯片通过源码安装Python2.7.x 乌萨奇敲代码 macos python
文章目录MacM1芯片通过源码安装Python2.7.x1.下载源码2.安装依赖3.配置环境4.配置编译选项5.编译6.验证安装MacM1芯片通过源码安装Python2.7.x首先，由于AppleM1芯片使用的是ARM架构，已经不支持Python2.7.x了，所以需要利用Rosetta手动编译Python2.7.x，这里以安装Python2.7.17为例。1.下载源码首先，从Python官方网站下
龙龙内存遍历神器：高效CPU内存检测与数据分析利器山峰999 算法软件工程测试工具 windows
在软件开发与游戏修改领域，一款功能强大的内存遍历工具无疑是每位开发者与修改者的必备之选。今天，我们为大家隆重介绍一款备受好评的内存遍历神器——龙龙内存遍历工具电脑版。这款工具以其卓越的性能、丰富的功能以及便捷的操作体验，赢得了广大用户的青睐。接下来，让我们一同深入了解这款工具的独特魅力。一、软件概述龙龙内存遍历工具电脑版是一款专为CPU内存检测设计的强大工具。它不仅能够快速检测CPU的内存情况，还
在Mac M1上安装Python 3并设置环境变量 JieLun_C macos python 开发语言 Python
在MacM1上安装Python3并设置环境变量MacM1是基于AppleSilicon芯片的新一代Mac电脑。如果你是MacM1用户，并且想要安装Python3并设置环境变量，那么你来对地方了。本文将为你提供详细的步骤和相应的源代码。以下是在MacM1上安装Python3并设置环境变量的步骤：步骤1：安装HomebrewHomebrew是一个流行的包管理器，可以帮助我们在Mac上安装各种软件包。打
基于Python的PDF文件自动下载爬虫技术——详细教程与实例 Python爬虫项目 2025年爬虫实战项目 python pdf 爬虫开发语言信息可视化
1.引言在信息时代，许多网站提供了PDF格式的文档，如新闻报道、学术论文、合同文件等。对于科研人员或数据分析师来说，批量下载和分析这些PDF文件是非常有用的。Python作为一种高效且易于学习的编程语言，在网络数据抓取（即爬虫技术）方面拥有强大的库和工具，使得自动化下载网站中的PDF文件变得十分简单。在本篇博客中，我们将详细介绍如何使用Python爬虫技术抓取网页中的所有PDF文件，并自动下载到本
Python 从基础到进阶（一套打通）浪子西科 Python python 开发语言
文章目录一、Python入门1.1Python简介1.2安装PythonWindowsLinuxmacOS1.3第一个Python程序交互式环境脚本文件二、Python基础语法2.1变量和数据类型变量数据类型数字类型字符串类型（str）布尔类型（bool）2.2运算符算术运算符比较运算符逻辑运算符位运算符2.3控制流语句条件语句循环语句`for`循环`while`循环三、Python数据结构3.1
一文读懂智能体架构：模块化设计如何提升效率与灵活性功城师人工智能大语言模型自然语言处理大模型深度学习智能体 LLM
随着人工智能技术的快速发展，智能体在企业知识管理、客户服务、业务数据分析等领域的应用愈加广泛。一个优秀的智能体设计不仅要具备高效处理用户需求的能力，还需要灵活适配不同场景的任务需求。本文将通过一个智能体的具体设计流程图，结合实际案例，详细解析其架构设计、功能实现及背后的技术逻辑，帮助大家深入了解智能体的构建过程。一、智能体设计的核心思路在智能体的设计过程中，最关键的是对用户需求的精准理解和快速响应
安装Miniconda3-Python 3.8环境管理工具 Lemaden
本文还有配套的精品资源，点击获取简介：Miniconda3-py38_4.11.0-Windows-x86_64.zip提供了一个针对Python3.8版本的轻量级Miniconda发行版，适用于64位Windows系统。它包括Python解释器、Conda包管理器和基本科学计算库，支持创建独立的Python环境。此版本的Conda包管理器版本号为4.11.0。用户可以通过安装后使用Conda命令
kitti数据集【图片、点云、IMU、GPS】话题发布（kitti2bag方式+python源码方式） liiiuzy ROS学习 python
kitti数据集传感器话题发布一、前期准备工作kitti数据集转bag安装vscode新建工作环境安装opencv-python二、发布图片三、发布点云数据四、整理前两次的代码五、添加汽车图片和摄像头视角常规写法优化写法六、发布IMU七、发布GPS一、前期准备工作kitti数据集转bag如果只是想把kitti数据集转成bag，直接用kiiti2bag指令就可以完成，教程在下面链接中。后文是详细的代
深入探讨Conda：Python环境与包管理器一休哥助手 python conda python 开发语言
目录引言Conda概述什么是CondaConda的优势Conda的安装与配置安装Conda配置CondaConda常用命令环境管理命令
跨平台编程：在Conda中搭建R语言环境的终极指南 2401_85812026 conda r语言开发语言
跨平台编程：在Conda中搭建R语言环境的终极指南在数据科学和统计分析领域，R语言以其强大的数据处理能力和丰富的图形表示功能而广受欢迎。然而，对于习惯了使用Linux操作系统的用户来说，如何方便地在Conda环境中安装和配置R语言环境是一个常见问题。本文将详细指导您如何在Conda中安装R语言环境，确保您能够顺利地进行数据分析和编程工作。️一、Conda与R语言的结合艺术Conda是一个开源的包管
CSDN 博客文章：Genesis 安装指南与环境配置（Python 3.9+） qq_27492797 python 开发语言
引言随着人工智能和机器学习的蓬勃发展，各式各样的框架和工具如雨后春笋般涌现，为科研人员和开发者的创新之路提供强大支持。今天，我们聚焦于Genesis——一个在物理模拟、计算机图形学以及机器人领域展现出卓越潜力的先进平台。需要特别说明的是，目前Genesis项目中备受期待的对话式生成AI接口，当前仍处于概念展示阶段，仅存在于PPT之中，尚未对外开放，大家在关注其发展时需留意这一情况。本文将着重介绍如
星河飞雪网络安全学习笔记-安全见闻1-3 芝士布偶网络安全
安全见闻-了解安全知识编程语言日常编程语言C语言：一种通用的、面向过程的编程语言，广泛运用于系统软件呵呵嵌入式开发C++：面向对象的编程语言，常用于游戏开发、高性能计算等领域Java：一种广泛使用的面向对象编程语言、具有跨平台性、应用于企业级应用开发等Python（萌新推荐）：简洁易学，拥有丰富的库，适用于数据分析、人工智能、web开发等Javascript：主要用于网页前端开发，也可用于服务器端
【肝帝一周总结：全网最全最细】十万字python教程，学不会找我！教到你会为止！！内容超多，建议收藏慢慢看！川川菜鸟 python全栈基础教程系列 python pycharm 2021最新教案
文章目录推荐：个人推荐学习系列，推荐的一定是好的！0、源码下载地址一、内容过多，前言一定要看二、python入门三、python缩进四、Python注释1.单行注释2.多行注释五、Python变量1.变量定义理解2.变量名命名3.分配多个值4.输出变量5.全局变量与局部变量，全局关键字6.练习题六、Python数据类型1.置数据类型2.获取数据类型3.设置数据类型4.设置特定数据类型6.练习题七、
【Python爬虫(79)】解锁区块链+爬虫：数据采集的未来新范式奔跑吧邓邓子 Python爬虫 python 爬虫区块链开发语言
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、区块链原理与分布式账本技术2.1区块链核心概念2.2分
【Python爬虫(80)】当Python爬虫邂逅边缘计算：探索数据采集新境界奔跑吧邓邓子 Python爬虫 python 爬虫边缘计算开发语言
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、边缘计算：概念与架构剖析2.1边缘计算的概念2.2边缘
Python--内置函数与推导式（下）索然无味io Python安全开发 python 开发语言 windows 网络安全 web安全笔记学习
3.内置函数数学运算类函数说明示例abs绝对值abs(-10)→10pow幂运算pow(2,3)→8sum求和sum([1,2,3])→6divmod返回商和余数divmod(10,3)→(3,1)数据转换类#进制转换print(bin(10))#'0b1010'print(hex(255))#'0xff'#字符与编码转换print(ord('A'))#65print(chr(97))#'a'迭代
Python命令速查 hongyuT python Python
什么也不做donothingpass安装依赖sudoapt-getinstall-fpip更换源pipinstallpackage_name-ihttps://pypi.tuna.tsinghua.edu.cn/simplepip安装pip：python2.x:sudoaptinstallpython-pippython3.x:sudoaptinstallpython3-pip升级pip：pyth
在 Linux 系统上编译安装高版本 Python perfect12312645 python
在Linux系统上进行软件安装时，我们经常会面临各种挑战，其中一个典型的情况就是官网不再提供所需软件的二进制包，这时我们就不得不进行编译安装。本文将为你详细展示如何在CentOS7.6系统上完成高版本Python的编译安装，并涵盖了一系列前置依赖的安装、高版本OpenSSL的编译安装以及相关的环境配置过程，帮助你克服可能遇到的困难。一、实验环境说明本次实验使用的系统是CentOS7.6，你可以通过
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "xxxxx@xxxxx.com"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

数据分析：numpy和pandas基础操作详解

数据处理基础

numpy基础

1.numpy创建数组及基础属性

2.数组的特点

3.创建常见数组

4.数组数据类型

5.生成随机数

6.一维数组索引

7.布尔索引

8. 多维数组的索引

9.实际问题

10.数组的转置和换轴

11.Numpy矩阵介绍

12.通用函数介绍

13数组广播机制

14Numpy读写二进制文件

15Numpy读写文本文件

pandas基础

1Pandas简介

2.pandas读取文本文件

3存储数据框

4.pandas读取excel文件

5将数据框存储为excel文件

6.构建数据框

7.查看数据框的常用属性

8. 按行列顺序访问数据框中的元素

9.按行列名称访问数据框中的元素

10.修改数据框中的元素

11.删除数据框的元素

12.描述分析数据框中的元素

13.转换成时间类型数据

14.时间类型数据的常用操作

15.groupby分组操作

16.agg操作

透视表

你可能感兴趣的:(数据分析,python,numpy,数据分析)