E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
利用Python进行数据分析
《
利用Python进行数据分析
》第10章 时间序列、日期和时间数据类型笔记
时间序列日期和时间数据类型及工具Python标准库包含用于日期(date)和时间(time)数据的数据类型,还有日历方面的功能。主要会用到datetime、time以及calendar模块。datetime.datetime(也可以简写为datetime)是用得最多的数据类型frompandasimportSeries,DataFrameimportpandasaspdimportnumpyasn
龍猫君
·
2020-04-02 18:41
微信读书墨水屏版上线
从贵的一塌糊涂的花书《深度学习》到最新版本的《
利用Python进行数据分析
(第二版)》,再到面试必备刷题书籍《剑指Offer》等等工具书,一应俱全。比在网上找到的各
MightBan
·
2020-04-02 01:47
《
利用Python进行数据分析
》 11.6 重新采样和频率转换(二)
11.6重新采样和频率转换11.6.2向上采样和插值1.向上采样:从低频率转换到高频率,不需要聚合示例:带有每周数据的DataFrame(见图11-1)当对这些数据使用聚合函数时,每一组只有一个值,并且会在间隙中产生缺失值。我们使用asfreq方法在不聚合的情况下转换到高频率。图11-1:asfreq方法2.fillna和reindex方法中可用的填充或插值方法可用于重采样(见图11-2)图11-
ipy烽
·
2020-03-31 01:02
如何
利用python进行数据分析
如何
利用python进行数据分析
?首先要知道为什么要用python进行数据分析,今天科多大数据来简单介绍一下为什么要用python进行数据分析:一、whyPython?
大数据在说话
·
2020-03-29 00:59
利用Python进行数据分析
(6) NumPy基础: 矢量计算
矢量化指的是用数组表达式代替循环来操作数组里的每个元素。通用函数(ufunc函数)NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数。例如,square函数计算各元素的平方,rint函数将各元素四舍五入:还有一些函数接受2个参数,叫二元ufunc,比如add函数和maximum函数:numpy.where函数numpy.where函数是三元表达式xif
杨存村長
·
2020-03-29 00:56
《
利用Python进行数据分析
·第2版》【Chapter 3.1】Python 的数据结构
【Chapter3】Python的数据结构、函数和文件本章讨论Python的内置功能,我们会从Python最基础的数据结构开始:元组、列表、字典和集合。然后会讨论创建你自己的、可重复使用的Python函数。最后,会学习Python的文件对象,以及如何与本地硬盘交互。3.1数据结构和序列元组(Tuple)元组是长度固定,不可改变的序列(可以看做长度固定,且不可变的列表)。创建元祖的方法是用逗号:1.
蜘蛛的梦呓
·
2020-03-27 01:20
《
利用Python进行数据分析
》 10.4 数据透视表与交叉表
10.4.1数据透视表1.数据透视表简介数据透视表是电子表格程序和其他数据分析软件中常见的数据汇总工具。它根据一个或多个键聚合一张表的数据,将数据在矩形格式中排列,其中一些分组键是沿着行的,另一些是沿着列的。Python中的pandas透视表是通过groupby工具以及使用分层索引的重塑操作实现的DataFrame拥有一个pivot_table方法,并且还有一个顶层的pandas.pivot_ta
ipy烽
·
2020-03-26 20:43
《
利用python进行数据分析
》1.0——Numpy库
目录:Tab键自动完成%run命令“Ctri-C”中断正在执行的代码忘记输入和输出文本怎么办创建数组zero和onesarange(),生成一定长度的数量dtype,将一块内存解释为TED数据类型所需的信息astype,转换dtype切片布尔型索引花式索引:利用整数数组进行索引数据转置和轴兑换通用函数np.meshgrid函数(接受两个一维数组,并产生两个二维矩阵)np.where函数(根据另一个
鬼宇书生
·
2020-03-23 04:07
Numpy:数组合矢量计算
然而看完《
利用Python进行数据分析
》后,也对它没有多大印象的。但是学了一段时间R语言,并且将R语言和Python进行一些比较,再次学习Numpy就特别轻松了。
徐洲更hoptop
·
2020-03-22 18:29
利用Python进行数据分析
之Numpy学习笔记(一)
NumPy首先说一下这篇文章不是NumPy的教程,而是对学习的记录,旨在在以后需要用的时候能够知道WhatisNumPy。镇上官方NumPy参考手册,这才是系统学习NumPy的真正去处。约定:importnumpyasnp简介:NumPy(NumericalPython)是高性能科学计算和数据分析的基础包。NumPy的主要对象是同构数据多维容器(homogeneousmultidimensiona
Moscow1147
·
2020-03-22 03:31
《
利用Python进行数据分析
》第9章 分组级运算和转换笔记
分组级运算和转换聚合是分组运算的其中一种。它是数据转换的一个特例,它接受能够将一维数组简化为标量值的函数。接下来将介绍transform和apply方法,它们能够执行更多其他的分组运算。如果要为一个DataFrame添加一个用于存放各索引分组平均值的列。一个办法是先聚合再合并df=DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two'
龍猫君
·
2020-03-21 09:09
0. matplotlib入门
这篇笔记主要来自《
利用python进行数据分析
》的第八章第一节,对matplotlib的基本使用介绍的特别清晰。
ydlstartx
·
2020-03-21 01:02
学习资料
教程菜鸟教程网易课程:疯狂的Python:快速入门精讲**网易课程:零基础入门学习Python**书籍1.Python核心编程(基础)2.Python网络数据采集(爬虫)3.Python数据分析实战(机器学习)4.
利用
村上春竹
·
2020-03-18 19:34
利用Python进行数据分析
Numpy
Numpy全名NumericalPython常见的标准引用importnumpyasnpndarray:N维数组对象,其所有元素必须是相同类型,,其中含有两种重要类型:data1=[6,7.5,8,0,1]#浮点和整数算同一类型arr1=np.array(data1)(1)shape:各维度大小的元组(2)dtype:数组类型的对象importnumpyasnpdata1=[6,7.5,8,0,1
品味轩辕
·
2020-03-15 19:58
013【数据分析】
利用Python进行数据分析
第二版 (2017) 中文笔记
第二版英文封面中期回顾:10月下旬我就开始在做这本书的笔记,现在三周过去了,这期间发生了很多事,但终于,终于,完成了一半……不过,起码现在已经完成了一半,总算是有点底气贴出来以飨读者。写中文笔记比我想的要花时间,不过这个笔记有两个好处:适合英文不好的初学者拿来练习。我已经尽量翻译成中文了,对于英文不好的同学更友好一些;可以直接当字典来索引,以后遇到问题直接找对应的章节,不用到处问来问去。第二版的主
赤乐君
·
2020-03-15 03:53
利用Python进行数据分析
(2) 尝试处理一份JSON数据并生成条形图
一、JSON数据准备首先准备一份JSON数据,这份数据共有3560条数据,每条内容结构如下:本示例主要是以tz(timezone时区)这一字段的值,分析这份数据里时区的分布情况。二、将JSON数据转换成Python字典代码如下:三、统计tz值分布情况,以“时区:总数”的形式生成统计结果要想达到这一目的,需要先将records转换成DataFrame,DataFrame是Pandas里最重要的数据结
杨存村長
·
2020-03-14 13:12
利用Python进行数据分析
(8) pandas基础: Series和DataFrame的基本操作
一、reindex()方法:重新索引针对Series的重新索引操作重新索引指的是根据index参数重新进行排序。如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。不想用缺失值,可以用fill_value参数指定填充值。fill_value会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用method参数,可选的参数值为ffill和bfill
杨存村長
·
2020-03-13 23:01
《
利用Python进行数据分析
》Numpy数组(部分笔记)
transpose函数在读图片时,会用到这么的一段代码:image_vector_len=np.prod(image_size)#总元素大小,3*55*47img=Image.open(path)arr_img=np.asarray(img,dtype='float64')arr_img=arr_img.transpose(2,0,1).reshape((image_vector_len,))#4
恋雪咏霜
·
2020-03-13 22:08
SOTON私人定制:
利用Python进行数据分析
(分组运算)
数据分析比较常见的步骤是将对数据集进行分组然后应用函数,这步也可以称之为分组运算。HadleyWickham大神为此创造了一个专用术语“split-apply-combine",即拆分-应用-合并。那么当我们谈论分组运算的时候,我们其实在谈论什么呢?Splitting:根据标准对数据进行拆分分组Applying:对每组都分别应用一个函数Combining:将结果合并新的数据结构分组运算一般要求的数
徐洲更hoptop
·
2020-03-13 20:09
使用pandas进行SEO日志分析
虽然网络上有比较多的SEO日志分析工具,比如爱站,光年,但那都是固定维度的,不如自己写的灵活,想怎么拆分就怎么拆分,加上最近在学习[《
利用python进行数据分析
》][pandas-book]这本书,正好可以用来练习练习
担得一身好酱油
·
2020-03-13 11:39
天池精准医疗大赛——个人赛后总结(一)
一、参赛背景一条工程狗也有自己的数据挖掘梦,自己一直对算法感兴趣,期间关注了很多热门的公众号,天天在CSDN的博客下面学习大牛的经验,也学习了李航老师的《统计学习方法》、周志华老师的《机器学习》、《
利用
_从前从前_
·
2020-03-13 04:18
利用Python进行数据分析
(5) NumPy基础: ndarray索引和切片
概念理解索引即通过一个无符号整数值获取数组里的值。切片即对数组里某个片段的描述。一维数组一维数组的索引一维数组的索引和Python列表的功能类似:一维数组的切片一维数组的切片语法格式为array[index1:index2],意思是从index1索引位置开始,到index2索引(不包括index2)位置结束的一段数组。例如:当把一个值赋值为一个切片时,该值会作用于此数组片段里每一个元素,例如:二维
杨存村長
·
2020-03-09 07:03
利用Python进行数据分析
(11) pandas基础: 层次化索引
层次化索引层次化索引是你能在一个数组上拥有多个索引,例如:有点像Excel里的合并单元格对么?以外层索引的方式选择数据子集:以内层索引的方式选择数据:层次化索引在数据重塑和分组中扮演着很重要的角色,例如,上面的层次化索引数据可以转换为一个DataFrame:对于一个DataFrame,横轴和竖轴都可以有层次化索引,例如:重排分级顺序swaplevel()函数可以将两个级别的数据进行交换,例如:so
杨存村長
·
2020-03-09 07:25
利用Python进行数据分析
(13) pandas基础: 数据重塑/轴向旋转
重塑重塑指的是将数据重新排列,也叫轴向旋转。DataFrame提供了两个方法:stack:将数据的列“旋转”为行。unstack:将数据的行“旋转”为列。例如:处理堆叠格式堆叠格式也叫长格式,一般关系型数据库存储时间序列的数据会采用此种格式,例如:虽然这种存储格式对于关系型数据库是好的,不仅保持了关系完整性还提供了方便的查询支持。但是对于数据操作可能就不那么方便了,DataFrame的数据格式才更
杨存村長
·
2020-03-09 04:15
利用Python进行数据分析
- 准备工作
概述该系列是关于《
利用Python进行数据分析
》的学习笔记。
大圣软件
·
2020-03-08 00:42
《
利用python进行数据分析
》大纲
第5章Pandas入门Series的创建obj=pd.Series([4,7,-5,3])#创建Series对象obj.values#返回值array([4,7,-5,3])obj.index#返回索引可以指定indexobj2=pd.Series([4,7,-5,3],index=['d','b','a','c'])由字典类型数据生成sdata={'Ohio':35000,'Texas':710
Qu Lite
·
2020-03-07 11:18
利用Python进行数据分析
(7) pandas Series和DataFrame简单介绍
一、pandas是什么pandas是基于NumPy的一个Python数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。pandas有两个主要的数据结构:Series和DataFrame。二、SeriesSeries是一个一维数组对象,类似于NumPy的一维array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。将Python数组转换成Ser
杨存村長
·
2020-03-06 07:58
利用Python进行数据分析
(1) 简单介绍
一、处理数据的基本内容数据分析是指对数据进行控制、处理、整理、分析的过程。在这里,“数据”是指结构化的数据,例如:记录、多维数组、Excel里的数据、关系型数据库中的数据、数据表等。二、说说Python这门语言Python是现在最受欢迎的动态编程语言之一(还有Perl、Ruby等)。近些年非常流行用Python建站,比如流行的PythonWeb框架Django。Python这类语言被称为脚本语言,
杨存村長
·
2020-03-02 05:00
2016图书清单(好书会写简单介绍)-0054
(两星及以下不推荐,浪费时间)一、技术相关1、《
利用Python进行数据分析
》❤❤❤2、《Python学些手册》❤❤❤❤❤3、《工业4.0实战:装备制造业数字化之道》❤❤❤❤4、《新产品开发就用IPD》
wwling2001
·
2020-03-01 12:14
利用Python进行数据分析
基础系列随笔汇总
一共15篇随笔,主要是为了记录数据分析过程中的一些小demo,分享给其他需要的网友,更为了方便以后自己查看,15篇随笔,每篇内容基本都是以一句说明加一段代码的方式,保持简单小巧,看起来也清晰,一共可以划分为三个大部分:第一部分简单介绍数据分析,以一个小例子简单说明了什么是数据分析和IPython工具;第二部分是NumPy的基础使用,NumPy是Python包,提供科学计算功能,主要是ndarray
杨存村長
·
2020-02-28 17:36
《
利用python进行数据分析
》Chapter 8
本章主要内容为对存在于不同文件的数据或者以不易于进行分析的格式存储的数据进行数据联合、连接以及重新排列。1.分层索引pandas的多层索引,即允许在一个轴向上拥有多个(两个或两个以上)索引层级。分层索引可以看作一种在更低维度的形式中处理更高维度数据的方式。data=pd.Series(np.random.randn(9),index=[['a','a','a','b','b','c','c','d
Luuuuuuuuuuke
·
2020-02-28 11:35
Python-数据分析
《
利用Python进行数据分析
》Chapter 7
在数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。这样的工作占了分析师80%以上的时间。本章内容主要讲解pandas中用于缺失值、重复值、字符串操作和其他分析数据转换的工具。1.处理缺失值pandas对象的所有描述性统计信息默认情况下是排除缺失值的。对于数值型数据,pandas使用浮点值NaN来表示缺失值,所以NaN是容易检测到的标识值。1.1过滤缺失值a.在Seri
Luuuuuuuuuuke
·
2020-02-27 11:43
Python-数据分析
[NBA]三双场次平均数据,谁最豪华?谁最经济?
前言最近刚读完《
利用Python进行数据分析
》,知识点还不是很牢固,于是想找些数据练手,刚好自己是个篮球迷,于是找了些NBA数据统计网站作为数据的来源,并借此来走一遍数据分析的流程。
davidac
·
2020-02-27 09:33
《
利用Python进行数据分析
》Chapter 6
本章主要介绍pandas对数据分输入和输出。通常有以下几种类型:读取文本文件及硬盘上其他更高效的格式文件、从数据库载入数据、与网络资源进行交互(比如WebAPI)。1.文本格式数据的读写使用最多的函数:read_csv:从文件、URL或文件型对象读取分隔好的数据,默认分隔符是逗号read_table:从文件、URL或文件型对象读取分隔好的数据,默认分隔符是制表符(’\t’)read_excel:从
Luuuuuuuuuuke
·
2020-02-24 10:07
Python-数据分析
《
利用Python进行数据分析
》 10.2数据聚合
10.2数据聚合1.聚合是指所有根据数组产生标量值得数据转换过程例如mean、count、min、sum都是聚合操作。常见的聚合,例如表10-1中的操作都有了优化实现。图10-1:优化的groupby方法2.使用自行制定的聚合,并再调用已经在分组对象上定义好的方法示例:使用Series方法quantile聚合,在内部,GroupBy有效的对Series进行切片,为每一块调用piece.quanti
ipy烽
·
2020-02-23 20:12
pandas使用技巧系列总览
|pandas|python简介:本系列教程主要讲解了数据分析库pandas的使用方法,内容参考了KevinMarkham的DataanalysisinPythonwithpandas视频教程,还有《
利用
夜雨寒山
·
2020-02-22 22:44
《
利用Python进行数据分析
》Chapter 5
本章主要介绍pandas数据结构和基本操作。Numpy适合处理同质型的数值类数组数据,而pandas是用来处理表格型或异质型数据的,经常和其他数值计算工具,比如NumPy和Scipy,以及可视化工具matplotlib一起使用的。1.数据结构1.1Series1.1.1一种一维的数组型对象,包含了一个值序列,并且包含了数据标签,即索引。obj=pd.Series([4,5,-5,3])obj041
Luuuuuuuuuuke
·
2020-02-22 14:28
Python-数据分析
利用Python进行数据分析
的笔记-实战USDA食品数据库
本案例是利用书中的示例美国农业部(USDA)制作了一份有关食物营养信息的数据库。这边提供一个JSON格式的文件foods-2011-10-03.jsonhttps://github.com/re4lfl0w/ipython/blob/master/books/python_data_analysis/ch07/foods-2011-10-03.json这边代码运行的环境是JupyterNotebo
JaeGwen
·
2020-02-21 23:31
利用python进行数据分析
|云胡读书|第二章练习部分
开学入手这本书,现在已经三月中旬,还没刷完第二章节。惭愧惭愧,每天做一件开心的事情,今天开心的事情就是这件吧~case01_尝试画图case02_理解变量和参数传递case03_尝试函数传参-可改变传递对象case04_类型的读取对象引用不涉及类型case05_补课修改的字符串case06_强赋类型case07_灵魂画手解释range遍历条件求和case08_三元表达式第二章完结~撒花✿✿ヽ(°▽
云胡Ruby
·
2020-02-21 04:30
《
利用python进行数据分析
》数据加载、存储与文件格式(部分笔记)
利用lxml.objectify解析XML代码如下:fromlxmlimportobjectifypath=''parsed=objectify.parse(open(path))root=parsed.getroot()部分结果如下:更详细可参考http://blog.csdn.net/nnnnnnnnnnnny/article/details/53700759读取Excel文件参考http:/
恋雪咏霜
·
2020-02-19 17:23
利用Python进行数据分析
(15) pandas基础: 字符串操作
字符串对象方法split()方法拆分字符串:strip()方法去掉空白符和换行符:split()结合strip()使用:"+"符号可以将多个字符串连接起来:join()方法也是连接字符串,比较它和"+"符号的区别:in关键字判断一个字符串是否包含在另一个字符串中:index()方法和find()方法判断一个子字符串的位置:index()方法和find()方法的区别是:如果不包含子字符串,index
杨存村長
·
2020-02-19 12:22
python数据分析
利用python进行数据分析
需要使用的工具pandas:数据分析处理库numpy:科学计算库库matplotlib:数据可视化库使用anaconda安装python环境可参考:致Python初学者们-Anaconda
鬼宇书生
·
2020-02-19 10:14
西儿马 | python的path问题:No such file or directory
iPyhon里演练《
利用Python进行数据分析
》中的示例:来自bit.ly的1.usa.gov数据。
西儿马
·
2020-02-17 16:36
Pandas 数据加载、存储与文件格式: read_csv, to_csv
Pandas数据加载、存储与文件格式摘自《
利用Python进行数据分析
2版》读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用WebAPI操作网络资源。
Mr-chen
·
2020-02-17 12:00
利用Python进行数据分析
之Numpy学习笔记(二)
NumPy这一篇文章主要来讲索引,但是先不直接说各种索引的用法,先胡扯会需要知道的,也不是什么重点,但是就是需要知道。没有先后顺序,就是胡扯。以下所有的英文引用均来自官方介绍Indexing。ndarrayscanbeindexedusingthestandardPythonx[obj]syntax,wherexisthearrayandobjtheselection.Therearethreek
Moscow1147
·
2020-02-17 09:04
《
利用Python进行数据分析
》第6章 数据加载、存储与文件格式
接下来要着重介绍pandas的输入输出对象,输入输出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用WebAPI操作网络资源。读写文本格式的数据read_csv和read_table可能会用到的多:我将大致介绍一下这些函数在将文本数据转换为DataFrame时所用到的一些技术。这些函数的选项可以划分为以下几个大类:索引:将一个或多个列当做返回的DataFra
龍猫君
·
2020-02-16 09:48
《
利用Python进行数据分析
》 10.1 GroupBy机制
10.1GroupBy机制1.HadleyWickham创造了用于描述组操作的术语拆分-应用-联合(split-apply-combine)第一步,数据包含在pandas对象中,可以是Series、DataFrame或其他数据结构第二步,根据你提供的一个或多个键分离到各个组中注:分离操作是在数据对象的特定轴向上进行的。例如,DataFrame可以在它的行方向(axis=0)或列方向(axis=1)
ipy烽
·
2020-02-13 08:43
【译】python数据科学家的学习路径。
该路径提供了你需要学习的
利用Python进行数据分析
的所有步骤的完整概述。如果你已经有一些相关的背景知识,或者你不需要路径中的所有内容,你可
小盐罐儿
·
2020-02-08 11:09
利用Python进行数据分析
之Numpy学习笔记(三)
NumPy本篇文章主要讲解NumPy的科学计算函数,虽然在写这篇文章的时候还是感觉这篇文章要比前两篇文章要好些一点,但是,NumPy的这些函数才是更加重要的,做数据分析不是创建ndarray,而是操作ndarray进行计算,获取更深层的数据。所有的函数并没有进行详细解释,需要用到直接在IPython中输入+“?”查看。通用函数(UniversalFunctions)是一种对数据执行元素级运算的函数
Moscow1147
·
2020-02-08 03:05
我是如何拿到第一个算法实习offer的?
下面开始吹水……image.png二、学习过程1.理论基础课本:《机器学习》、《概率论与数理统计》视频:吴恩达机器学习、吴恩达深度学习、李宏毅机器学习、机器学习-白板推导2.代码能力课本:《机器学习实战》、《
利用
Swifer
·
2020-02-07 08:41
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他