E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Pandas学习
《Python数据分析与展示》-
Pandas学习
笔记07
Pandas数据特征分析Pandas库的数据排序.sort_index()方法在指定轴上根据索引进行排序,默认升序.sort_index(axis=0,ascending=True)实例:In[1]:importpandasaspdIn[2]:importnumpyasnpIn[3]:b=pd.DataFrame(np.arange(20).reshape(4,5),index=['c','a',
nodoself
·
2018-08-23 22:33
Python数据分析与展示
Pandas
笔记
Python dataframe修改列顺序(
pandas学习
)
前言这种需要的很多,在网上看了很多种解决方法。这里总结一下。为自己以后使用的时候,方便查询内容方法一:最简洁的方法order=['date','time','open','high','low','close','volumefrom','volumeto']df=df[order]比如说,这里,就可以之保证列的顺序是按照这样的排序的。总之,就是给一个list。方法二:查询自下面的链接。https
肥宅_Sean
·
2018-08-22 15:51
Python
Pandas学习
笔记八——数据透视表
数据透视表数据透视表是一种类似于Groupby的操作方法,常见于Excel与类似的表格应用中。数据透视表将每一列作为输入,输出将数据不断细分为多个维度累计信息的二维数据表。数据透视表相比与Groupby操作更像是一种多维的GroupBy累计操作。也就是说,虽然你也可以分割-应用-组合,但是分割和组合不是发生在一维索引上,而是在二维网络上(行和列同时分组)#示例使用泰坦尼克号的乘客信息importn
盐味橙汁
·
2018-08-15 13:32
python
学习笔记
数据科学
Pandas学习
总结
pandas数据类型https://www.jb51.net/article/139630.htm文件路径有中文或者文件里面有中文字mydata=pd.read_csv(u"例子.csv",encoding="gbk")#gb2312orgb18030Pandas中进行数据类型转换有三种基本方法:使用astype()函数进行强制类型转换自定义函数进行数据类型转换使用Pandas提供的函数如to_n
机器人X
·
2018-08-14 20:51
pandas
Pandas学习
笔记七——累计与分组
累计与分组在对比较大的数据进行分析时,一项基本的工作就是有效的数据累计(summarization):计算累计(aggragation)指标,如sum()、mean()、median()、min()和max(),其中每一项指标都呈现出大数据集的特征。一、简单的累计计算简单的累计计算是对DataFrame或者Series对象使用累计函数:sum()、mean()、median()、min()和max
盐味橙汁
·
2018-08-14 18:17
python
学习笔记
数据科学
Pandas学习
笔记六——合并数据集:连接(join)和合并(merge)操作
合并数据集:连接(join)和合并(merge)操作Pandas的基本特性之一就是高性能的内存式数据连接(join)和合并(merge)操作。pd.merge()实现的功能基于关系代数的一部分。关系代数是处理关系型数据的通用理论,巨大部分数据库的可用操作都以此为理论基础。Pandas的pd.merge()方法与Series和DataFrame的join()方法就是基于这些关系代数对应的基本操作规则
盐味橙汁
·
2018-08-14 13:55
python
学习笔记
数据科学
Pandas学习
笔记六——合并数据集:Concat操作
合并数据集:Concat操作#为了方便后面的演示,这里定义一个能够快速创建DataFrame的函数importnumpyasnpimportpandasaspddefmake_df(cols,index):"""一个简单的DataFrame"""data={c:[str(c)+str(i)foriinindex]forcincols}returnpd.DataFrame(data,index)#通
盐味橙汁
·
2018-08-13 23:48
python
学习笔记
Pandas学习
笔记五——层级索引
Pandas学习
——层级索引pandas数据结构中最常用的是Series和DataFrame,它们分别用于处理一维数据和二维数据。
盐味橙汁
·
2018-08-13 22:14
python
学习笔记
Pandas学习
笔记三——从DataFrame中选择数据
DataFrame数据选择方法DataFrame在某些方面像二维化或结构化的数组,在某些方面又像一个共享索引的若干Series对象构成的字典。所以,选择DataFrame中的数据可以从上面两个角度出发。将DataFrame看作字典importnumpyasnpimportpandasaspd#创建一个DataFrame对象area=pd.Series({'California':423967,'T
盐味橙汁
·
2018-08-13 15:39
python
学习笔记
Pandas学习
笔记二——创建pandas的DataFrame对象的3种方法
创建pandas的DataFrame对象的5种方法Pandas的DataFrame对象可以通过许多方式创建,这里举几个常用的例子。通过Series对象创建#1、通过单个Series对象创建。DataFrame是一组Series对象的集合,可以用单个Series创建一个单列的DataFrameimportpandasaspdimportnumpyasnp#先创建一个Series对象area=pd.S
盐味橙汁
·
2018-08-13 11:24
python
学习笔记
Pandas学习
笔记一——如何创建Series对象
如何创建Series对象常见的创建Pandas对象的方式,都像这样的形式:pd.Series(data,index=index)其中,index是一个可选参数,data参数支持多种数据类型例如,data可以时列表或Numpy数组,这是index默认值为整数序列:pd.Series([2,4,6])Out[58]:021426dtype:int64data也可以是一个标量,创建Series对象时会重
盐味橙汁
·
2018-08-12 22:35
python
学习笔记
Pandas学习
笔记 Series DataFrame
SeriesimportnumpyasnpimportpandasaspdimportsysfrompandasimportSeries,DataFrameobj=Series([4,7,-5,3],index=['d','b','a','c'])objobj[['d','c']]obj['b']=6objobj*2obj[obj>2]np.exp(obj)sdata={'hi':35,'mi':
qq_42052864
·
2018-08-12 15:40
Pandas
pandas
Series
DataFrame
pandas学习
总结
在pandas中:string属于object类型integer属于int类型boolean属于bool类型还存在着float、datatime等类型read_csv()方法只能读取不带中文的文件目录和文件名。若是存在中文需要open()方法打开,在进行读取,否则回报错importpandasf=open("H:\\机器学习\\机器学习\\01.python数据分析与机器学习实战\\视频课程\\资
ShaoDu
·
2018-08-12 08:42
学习总结
pandas学习
python
pandas学习
(一) Series和DataFrame简介
简介pandas是一个开源的Python库,为Python提供了高性能,易于使用的数据结构和数据分析工具。Anaconda中自带pandas,如果没有安装anaconda,使用pipinstallpandas安装基本数据结构SeriesSeries是一种类似于以为数组的对象,由一组数据及一组与之相关的索引(默认是从0开始的int64序列)组成。导入:frompandasimportSeries创建
闻榴莲的猫
·
2018-08-06 14:03
pandas 学习心得(2):选择数据的操作
阅读体验不佳(与有道云笔记的markdown解析不同),因此建议进入传送门jupyternotebook:
pandas学习
心得(2):选择数据的操作这个系列是我学习《python数据科学手册》所做的笔记用于个人备忘顺便分享
不做废物
·
2018-08-02 23:54
【
pandas学习
笔记】综合整理
1.ReindexSeriesReindeximportnumpyasnpimportpandasaspd>>>s1=pd.Series(np.random.randn(1,4).tolist()[0],index=['A','B','C','D'])#先将数组转成listA0.523862B-0.341507C-0.368576D0.335503dtype:float64>>>s2=s1.rei
Datawhale
·
2018-07-13 19:02
python
【
pandas学习
笔记】DataFrame
1.创建DataFrame可以通过以下方式进行创建1.list2.dictionary3.ndarrays4.2dndnarrays等通过dictionarykey默认为列名#索引自动添加df=pd.DataFrame({'Student_1':[90,100,95],'Student_2':[60,80,100]})#索引主动添加df=pd.DataFrame({'Student_1':[90,
Datawhale
·
2018-07-12 15:05
python
【
pandas学习
笔记】Series
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt%matplotlibinline创建Series以及对Series的相关操作#自动添加索引#np.nan:emptyvalue>>>s1=pd.Series([1,2,3,4,np.nan,5,6,7])01.012.023.034.04NaN55.066.077.0dtype:
Datawhale
·
2018-07-12 11:45
python
杨景院
Pandas学习
笔记(持续更新中)
Pandas数据结构Series:基本概念及创建Series数据结构Series是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引importnumpyasnpimportpandasaspd#导入numpy、pandas模块s=pd.Series(np.random.rand(5))print(s)print(type(s))#查看数据、数据
景院stata学习笔记
·
2018-06-26 18:24
Pandas学习
笔记
importpandasaspdimportdatetimeimportnumpyasnp#rank函数S=pd.Series([3,5,1,9])S.rank(method='average')#rank函数返回S中每个元素在所有元素中的排名,按照从小到大顺序。#3在所有元素中排名第二,9排第四02.013.021.034.0dtype:float64S=pd.Series([4,5,1,9,2
随遇而安_小强
·
2018-06-17 21:21
python
学习笔记
pandas学习
笔记(2)
练习:泰坦尼克号逃生率kaggle上一道经典题目,拿来做一点小练习。有一个csv文件(点击下载)密码:yqto。里面包含船上人员的以下信息:编号、标签值、舱位等级、名字、性别、年龄、个人兄弟姐妹的数量、个人老人孩子的数量、船票编号、船票价格、所在位置(缺失值比较多)、登船地点。importpandasaspdimportnumpyasnp#读取一个csv文件titanic_train=pd.rea
am_skyf
·
2018-05-29 00:10
Pandas学习
随笔(1)
前言虽然说一直都有使用过python的pandas,但是其实很多时候都是使用些基本的东西,毕竟如果不注重效率的话,很多时候也不用在意更加高级的用法,或者更加基础和正规的用法。由于最近多了个经常会被抠细节的师妹,我觉得还是用一些业余时间将这个pandas快速的过一遍,而且其实也经常遇到类似于reshape这样的操作,虽然可以用更为复杂的方法解决,但是毕竟不够优雅。以下从一个半路开始学起pandas的
栽生物坑里的信息汪
·
2018-05-26 10:44
Pandas学习
随笔(4) Option
前言这个部分其实我之前也没接触过,但是在阅读官方文档的时候发现了这个部分,这个部分其实完全不影响工作的效率,但是会影响工作的体验,所以既然我是写到哪算哪,也就写写这个部分吧,这个部分的图片会比较多,当然其实用IPYTHONNOTEBOOK展示其实是最好的,但是又不支持,所以也就这样吧,部分代码我会放到github上以进行交互使用?主要内容pd.options一个储存设置的字典Wrapperpd.g
栽生物坑里的信息汪
·
2018-05-09 10:56
Pandas学习
笔记(三)——读取 CSV、TXT文件
pandas是数据分析专用库。从外部读写文件也属于数据处理的一部分。pandas提供了多种I/OAPI函数。支持多种类型数据的读取。常用的函数如下:读取函数写入函数read_csvto_csvread_excelto_excelread_hdfto_hdfread_sqlto_sqlread_jsonto_jsonread_htmlto_htmlread_statato_stataread_cli
还没入门就可以放弃
·
2018-04-23 21:40
Python
Python数据分析之
pandas学习
2018-04-22
(转)https://www.cnblogs.com/nxld/p/6058591.htmlPython数据分析之
pandas学习
Python中的pandas模块进行数据分析。
开子的私家地
·
2018-04-22 17:37
pandas学习
之——cumcount()
参考:点击打开链接一目了然:>>>df=pd.DataFrame([['a'],['a'],['a'],['b'],['b'],['a']],...columns=['A'])>>>dfA0a1a2a3b4b5a>>>df.groupby('A').cumcount()001122304153dtype:int64>>>df.groupby('A').cumcount(ascending=Fals
akenseren
·
2018-03-07 16:09
机器学习
python
pandas学习
笔记
df假设是我们要进行计算的dataframe。有些是函数,比如说pd.isnull(),而有些是methods,比如说df.drop()。df.drop():删除行或者列。这样生成一个新的dataframe,但可以设置参数,选择是否在原df也删除行或者列。axis=1表示,删除的是列;默认不改变原来的df,但是加上inplace=True会删除在原df中的行或者列。df.shift(i):表示df
elibneh
·
2018-03-06 17:06
python学习
python
pandas
DataFrame
【AI基础】python:
pandas学习
笔记
importpandassub_info=pandas.read_csv("contract.csv")#sub_info#print(sub_info)type(sub_info)#print(sub_info.dtypes)first_rows=sub_info.head(1)#print(first_rows)#print(sub_info.columns)#print(sub_info.s
浮尔魔司
·
2018-03-01 15:11
python
pandas
人工智能
AI学习笔记
Pandas学习
笔记(3) 数据存取与可视化
Pandas数据存取Pandas支持包含csv,excel,hdf,sql,json,html,stata,sas,clipboard,pickle等格式的数据文件存储,以统一的命名风格存取,以csv为例pd.read_csv()从csv文件中读取数据,参数为文件路径返回值为一个DataFrame会自动添加index(从0开始)pd.to_csv()用于以指定格式保存数据,和read方法对应数据可
GYBinLero
·
2018-02-06 00:21
Pandas学习
笔记(2)数据的处理方法
准备工作创建一个6X4的DataFrame,行索引为时间序列,列索引为字母dates=pd.date_range('20180205',periods=6)df=pd.DataFrame(np.arange(24).reshape((6,4)),index=dates,columns=['A','B','C','D'])outputs:ABCD2018-02-0501232018-02-06456
GYBinLero
·
2018-02-05 23:19
Pandas学习
笔记(1)基本数据类型及属性
Pandas介绍PythonDataAnalysisLibrary即Pandas是基于NumPy的一种Python数据分析工具包,包含丰富的数据类型和便捷的操作方式。基本数据类型Series对应Python中的列表和NumPy的一维数组,Series可以指定索引内容,默认索引与Python相同从0开始的整形数importpandasaspds=pd.Series([1,20,33,np.nan,5
GYBinLero
·
2018-02-05 19:00
用scikit-learn和
pandas学习
线性回归
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。1.获取数据,定义问题没有数据,当然没法研究机器学习啦。:)这里我们用UCI大学公开的机器学习数据来跑线性回归。数据的介绍在这:http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant
鸟儿窝
·
2018-02-03 16:20
机器学习
统计学与
pandas学习
(六)—— 夏普比率
第六章《标准差(S.D.)也可用于理解高风险、高回报(夏普比率)》。总结投资基本上是对高风险、高回报的商品,还是低风险、低回报的商品的选择。这种商品的差异,是“性质的差异”,并不意味着优劣。可以说,在同样的平均收益率之下,S.D.小的是优良的金融商品,而在同样的S.D.之下,平均收益率大的是优良的金融商品。就此意义上来说,金融商品优劣性的评价基准是夏普比率(SPM)。夏普比率的公式(X的夏普比率)
fanzhh
·
2018-01-04 14:38
pandas学习
之合并merge
pandas中的merge和concat类似,但主要是用于两组有keycolumn的数据,统一索引的数据.通常也被用在Database的处理当中.依照一组key合并importpandasaspd#定义资料集并打印出left=pd.DataFrame({'key':['K0','K1','K2','K3'],'A':['A0','A1','A2','A3'],'B':['B0','B1','B2'
changzoe
·
2017-12-15 11:18
python
学习资料
github.com/kailashahirwar/cheatsheets-ai优矿新手教程https://uqer.io/community/share/569cb902228e5b8ffc7450cf
Pandas
woodwood2000
·
2017-12-08 03:03
pandas学习
笔记D2
#获取昨日的日期importdatetimenow_time=datetime.datetime.now()yesterday_time=now_time+datetime.timedelta(days=-1)yesterday_time_nyr=yesterday_time.strftime('%Y%m%d')#格式化输出……此处省略数据源的读取,直接给出写入文件代码,将‘新老师’sheet表和
EmilyForever18
·
2017-12-07 15:39
pandas
昨天
python
python学习笔记
pandas学习
笔记
一、pandas的主要类型pandas主要有两种形式:Series和DataFrameSeries:–index属性,默认是从0开始的整数,可以用index来设定–numpy的数组运算会保留索引和值之间的链接–可以用字典创建Series,则字典的键就可以变成索引–可以通过赋值的方式就地修改–name属性‘obj.name='population'DataFrame:–index属性–columns
lirining
·
2017-11-19 21:00
python
pandas
索引
Pandas学习
笔记(DataFrame基本操作)
对于生成的dDataFrame,下一步进行的是对他的基本操作,增、减、改、查。一.数据选取从已有的DataFrame中取出其中一列或几列,并对其进行操作。Pandas取出DataFrame的列有两种方式,两个方式没有好与坏之分,还是看个人喜欢用哪个#-*-coding:utf-8-*-importpandasaspddf=pd.DataFrame({'goods':['cokecola','egg
Jakob_Hu
·
2017-10-25 21:47
Pandas
从简单的线性回归入门机器学习
声明:参考用Sckit-Learn和
Pandas学习
线性回归入门机器学习仅仅靠这一篇文章还是有些不够,建议大家戳一戳文中的链接,看一下相关的知识。
hustqb
·
2017-10-10 15:22
机器学习
Pandas学习
(二)——双色球开奖数据分析
学习笔记汇总
Pandas学习
(一)–数据的导入
pandas学习
(二)–双色球数据分析
pandas学习
(三)–NAB球员薪资分析
pandas学习
(四)–数据的归一化
pandas学习
(五)–
pandas学习
视频本章主要利用双色球开奖数据来学习
骑着炮弹进城
·
2017-08-26 11:27
python
pandas学习
数据分析学习
pandas学习
笔记
1.创建一个空的DataFramedf_empty=pd.DataFrame(columns=['A','B','C','D'])2.分组使用聚合函数时,可以不生成索引。df.groupby(['a','b'],as_index=False).mean()3.转换聚合只是其中的一种方法,转换也是。4.层次化索引选取根据索引获取数据。因为现在有两层索引,当通过外层索引获取数据的时候,可以直接利用外层
glory8901
·
2017-05-24 09:21
pandas
Numpy,
Pandas学习
笔记(一)
最近在学习数据分析,对学的进行了些整理,方便以后查看。欢迎交流。下面的代码用到的模块都事先做了导入:importnumpyasnpimportpandasaspdfrompandasimportSeries,DataFrame一、各对象的理解Numpy创建的对象其实是一个多维的数组(ndarray),n(多),d(dim维度),array(数组)Pandas创建的对象有Series和DataFra
不_初心
·
2017-05-15 11:44
最小二乘法的多元线性回归
线性模型的最小二乘可以有很多方法来实现,比如直接使用矩阵运算求解析解,sklearn包(参考:用scikit-learn和
pandas学习
线性回归、用scikit-learn求解多元线性回归问题),或scipy
NodYoung
·
2017-05-14 14:48
Python
用scikit-learn和
pandas学习
线性回归
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。1.获取数据,定义问题没有数据,当然没法研究机器学习啦。:)这里我们用UCI大学公开的机器学习数据来跑线性回归。数据的介绍在这:http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant
张立达
·
2017-05-03 15:32
下载地址
飞扬
python-
Pandas学习
如何对数据集随机抽样?
摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。应用场景:我有10W行数据,每一行都11列的属性。现在,我们只需要随机抽取其中的2W行。实现方法很简单:利用Pandas库中的sample。DataFrame.sample(n=None,frac=None,replace=False,weights=None,ran
kingsam_
·
2017-05-02 14:55
python-pandas学习
Pandas学习
(一)——数据的导入
欢迎加入python学习交流群667279387学习笔记汇总
Pandas学习
(一)–数据的导入
pandas学习
(二)–双色球数据分析
pandas学习
(三)–NAB球员薪资分析
pandas学习
(四)–数据的归一化
骑着炮弹进城
·
2017-04-25 10:21
python
数据分析
pandas学习
数据分析学习
pandas学习
(一)
最近在做JData算法大赛,作为一个新手,第一次参加这样的比赛,还处于没入门的状态,但是还是希望可以慢慢做,慢慢玩数据,来提高自己。其中有一个数据文件——JData_Action_1604,这是一个用户行为文件,我看在数据的时候,第一个用户User_id——100259在短短的时间内就出现了很多的交互(行为)。为此,我想提取出在JData_Action_1604文件中有关User_id——1002
Jinlong_Xu
·
2017-03-31 13:42
machine
learning
Python
data
mining
pandas学习
:对series和dataframe进行排序
本问主要写根据索引或者值对series和dataframe进行排序的方法代码:#coding=utf-8importpandasaspdimportnumpyasnp#以下实现排序功能。series=pd.Series([3,4,1,6],index=['b','a','d','c'])frame=pd.DataFrame([[2,4,1,5],[3,1,4,5],[5,1,4,2]],colum
乱世流星01
·
2017-03-01 10:44
数据挖掘
机器学习
Pandas
series
DataFrame
机器学习
python科学运算库numpy,
pandas学习
记录
Python中对数组修剪至少可以通过两种方式:>>>importnumpyasnp>>>>>>a=np.arange(10)>>>aarray([0,1,2,3,4,5,6,7,8,9])>>>a[a>5]=5#方法1:通过布尔判断剔除不合要求的值>>>aarray([0,1,2,3,4,5,5,5,5,5])>>>b=np.arange(10)>>>b.clip(0,5)#方法2:通过clip(
晓东邪
·
2016-10-27 21:57
numpy
pandas
python
numpy
数据修剪
pandas
pandas学习
笔记
注册登录添加关注作者steveysy2016.06.1715:50*写了2505字,被2人关注,获得了2个喜欢
Pandas学习
笔记字数2319阅读198评论0喜欢2收藏文章分享1.安装如果做数据分析用途建议使用
GeekLeee
·
2016-10-13 21:07
爬虫-数据分析
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他