python数据分析学习笔记八

第八章应用数据库

1 基于sqlite3的轻量级访问

轻盈的关系型数据库

示例代码如下：


import sqlite3

# 创建数据库联接
with sqlite3.connect(":memory:") as con:
    # 取得游标
    c = con.cursor()
    # 创建数据库表
    c.execute('''
        CREATE TABLE sensors(
                            data text,
                            city text,
                            code text,
                            sensor_id real,
                            temperature real)
    ''')

# 查询数据库表
for table in c.execute("SELECT name FROM sqlite_master WHERE type='table'"):
    print('Table', table)

# 添加记录
c.execute("INSERT INTO sensors VALUES('2016-02-27','uTRECHT','Red',42,15.14)")
# 查询所有记录
c.execute("SELECT * FROM sensors")
print(c.fetchone())
# 删除表
con.execute("DROP TABLE sensors")
# 查询数据库表
print("#of table", c.execute("SELECT COUNT (*) FROM sqlite_master WHERE type='table'").fetchone()[0])
# 关闭联接
con.close()

运行结果如下：

Table ('sensors',)

('2016-02-27', 'uTRECHT', 'Red', 42.0,15.14)

#of table 0

2 通过pandas访问数据库

示例代码如下：


import statsmodels.api as sm
from pandas.io.sql import read_sql
import sqlite3

# 创建数据库联接
with sqlite3.connect(":memory:") as con:
    # 取得游标
    c = con.cursor()

    # 加载数据
    data_loader = sm.datasets.sunspots.load_pandas()
    df = data_loader.data
    # 创建元组列表
    rows = [tuple(x) for x in df.values]
    # 创建一个未规定数据类型的数据表
    con.execute("CREATE TABLE sunspots (year,sunactivity)")
    # 添加多条记录
    con.executemany("INSERT INTO sunspots(year,sunactivity) VALUES (?,?)", rows)
    # 查询总记录数
    c.execute("SELECT COUNT(*) FROM sunspots")
    print(c.fetchone())
    # 删除表中记录,并显示受影响行数
    print("Deleted", con.execute("DELETE FROM sunspots where sunactivity >20").rowcount, "row")

    # 使用read_sql执行查询并返回dataFrame结果
    print(read_sql("SELECT * FROM sunspots where year <1732", con))
    # 删除数据表
    con.execute("DROP TABLE sunspots")
    c.close()

运行结果如下：

(309,)

Deleted 217 row

year sunactivity

0 1700.0 5.0

1 1701.0 11.0

2 1702.0 16.0

3 1707.0 20.0

4 1708.0 10.0

5 1709.0 8.0

6 1710.0 3.0

7 1711.0 0.0

8 1712.0 0.0

9 1713.0 2.0

10 1714.0 11.0

11 1723.0 11.0

3 SQLAlchemy

可以把python中的类映射为数据库中的表，类以于java中的hibernate

示例代码如下:

Alchemy_entities.py


from sqlalchemy import Column, ForeignKey, Integer, Float, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import relationship
from sqlalchemy import create_engine
from sqlalchemy import UniqueConstraint

# 超类
Base = declarative_base()

# 观测站表
class Station(Base):
    __tablename__ = 'station'  # 表名
    id = Column(Integer, primary_key=True)  # id
    name = Column(String(14), nullable=False, unique=True)  # 观测站名称

    def __repr__(self):
        return "Id=%d name=%s" % (self.id, self.name)


# 传感器表
class Sensor(Base):
    __tablename__ = 'sensor'  # 表名
    id = Column(Integer, primary_key=True)  # id
    last = Column(Integer)
    multiplier = Column(Float)
    station_id = Column(Integer, ForeignKey('station.id'))  # 外键
    station = relationship(Station)

    def __repr__(self):
        return "Id=%d last=%d multiplier=%.1f station_id=%d" % (self.id, self.last, self.multiplier, self.station_id)


if __name__ == "__main__":
    print("This script is used by another script. Run python alchemy_query.py")

Populate_db.py


from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from .alchemy_entities import Base, Sensor, Station


def populate(engine):
    # 创建DBSession对象
    Base.metadata.bind = engine
    DBSession = sessionmaker(bind=engine)
    session = DBSession()

    # 创建两个观测站
    de_bilt = Station(name='De Bilt')
    session.add(de_bilt)

    session.add(Station(name='Utrecht'))
    session.commit()
    print('Station', de_bilt)

    # 添加传感器记录
    temp_sesor = Sensor(last=20, multiplier=.1, station=de_bilt)
    session.add(temp_sesor)
    session.commit()
    print("Sensor", temp_sesor)


if __name__ == "__main__":
    print("This script is used by another script. Run python alchemy_query.py")

Alchemy_query.py


from Eight.alchemy_entities import Base, Station, Sensor
from Eight.populate_db import populate
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
import os
from pandas.io.sql import read_sql

# 创建引擎
engine = create_engine('sqlite:///demo.db')
# 删除数据表
Base.metadata.drop_all(engine)
# 创建数据表
Base.metadata.create_all(engine)
populate(engine)
Base.metadata.bind = engine
DBSession = sessionmaker()
DBSession.bind = engine
session = DBSession()

# 查询station表中的第一行记录
station = session.query(Station).first()

# 查询所有station
print('all station', session.query(Station).all())
# 查询所有sensor
print('all sensor', session.query(Sensor).all())
# 查询第一个station的第一个sensor
print('query sensor by station', session.query(Sensor).filter(Sensor.station == station).one())
# 使用pandas的read_sql查询
print('read_sql all station', read_sql("SELECT * FROM station", engine.raw_connection()))

# 删除数据库,没有执行
try:
    os.remove('demo.db')
    print('Delete demo.db')
except OSError as e:
    # [WinError 32] 另一个程序正在使用此文件，进程无法访问。: 'demo.db'
    print(e)
    pass

运行结果如下:

Station Id=1 name=De Bilt

Sensor Id=1 last=20 multiplier=0.1station_id=1

all station [Id=1 name=De Bilt, Id=2name=Utrecht]

all sensor [Id=1 last=20 multiplier=0.1station_id=1]

query sensor by station Id=1 last=20multiplier=0.1 station_id=1

read_sql all station id name

0 1 De Bilt

1 2 Utrecht

[WinError 32] 另一个程序正在使用此文件，进程无法访问。: 'demo.db'

4 Pony ORM

Python写的orm包


from pony.orm import Database, db_session
from pandas.io.sql import to_sql
import statsmodels.api as sm

# 创建sqlite数据库
db = Database('sqlite', ':memory:')

# 加载数据并写入数据库
with db_session:
    data_loader = sm.datasets.sunspots.load_pandas()
    df = data_loader.data
    to_sql(df, "sunspots", db.get_connection())
    print(db.select("count(*) FROM sunspots"))

运行结果如下:

[309]

5 Dataset 懒人数据库

是sqlalchemy的一个包装器


import dataset
from pandas.io.sql import read_sql
from pandas.io.sql import to_sql
import statsmodels.api as sm

# 创建数据库连接
db = dataset.connect('sqlite:///:memory:')
# 创建books表
table = db["books"]
# 添加数据,在调用insert时会自动添加表模式
table.insert(dict(title="Numpy Beginner's guide", author='Ivan Idris'))
table.insert(dict(title="Numpy Cookbook", author='Ivan Idris'))
table.insert(dict(title="Learning Numpy", author='Ivan Idris'))
# 使用pandas的read_sql查询数据
print(read_sql('SELECT * FROM books', db.executable.raw_connection()))

# 加载数据
data_loader = sm.datasets.sunspots.load_pandas()
df = data_loader.data
to_sql(df, "sunspots", db.executable.raw_connection())
table = db['sunspots']

# 查询前5条数据
for row in table.find(_limit=5):
    print(row)
print("Table", db.tables)

运行结果如下:

id author title

0 1 Ivan Idris Numpy Beginner's guide

1 2 Ivan Idris Numpy Cookbook

2 3 Ivan Idris Learning Numpy

OrderedDict([('index', 0), ('YEAR',1700.0), ('SUNACTIVITY', 5.0)])

OrderedDict([('index', 1), ('YEAR',1701.0), ('SUNACTIVITY', 11.0)])

OrderedDict([('index', 2), ('YEAR',1702.0), ('SUNACTIVITY', 16.0)])

OrderedDict([('index', 3), ('YEAR',1703.0), ('SUNACTIVITY', 23.0)])

OrderedDict([('index', 4), ('YEAR',1704.0), ('SUNACTIVITY', 36.0)])

Table ['books', 'sunspots']

Process finished with exit code 0

6 pymongo与mongodb

指定数据存储的目录

Mkdir h:/data/db

Mongod --dbpath h:/data/db

Python安装mongodb的驱动程序

Python -m pip install pymongo

查看当前驱动版本号

C:\Users\Administrator>python -m pipfreeze|grep pymongo

pymongo==3.3.1

与mongodb 的测试数据库进行联接

示例代码如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2017/1/3 11:41
# @Author  : Retacn
# @Site    : 连接mongodb测试数据库
# @File    : mongodb_conn.py
# @Software: PyCharm
__author__ = "retacn"
__copyright__ = "property of mankind."
__license__ = "CN"
__version__ = "0.0.1"
__maintainer__ = "retacn"
__email__ = "[email protected]"
__status__ = "Development"

from pymongo import MongoClient
import statsmodels.api as sm
import json
import pandas as pd

# 创建数据库连接
client = MongoClient()
db = client.test_database

# 创建json并保存到数据库中
data_loader = sm.datasets.sunspots.load_pandas()
df = data_loader.data
rows = json.loads(df.T.to_json()).values()
db.sunspots.insert(rows)

#查询所有内容
cursor = db['sunspots'].find({})
df = pd.DataFrame(list(cursor))
print(df)

db.drop_collection('sunspots')

运行结果如下：

SUNACTIVITY YEAR _id

0 16.6 1825.0 586b24872e29db269c8854f4

1 11.0 1745.0 586b24872e29db269c8854f5

2 4.3 1856.0 586b24872e29db269c8854f6

3 26.1 1921.0 586b24872e29db269c8854f7

4 15.5 1975.0 586b24872e29db269c8854f8

5 47.8 1831.0 586b24872e29db269c8854f9

6 38.0 1955.0 586b24872e29db269c8854fa

7 14.2 1922.0 586b24872e29db269c8854fb

8 37.6 1920.0 586b24872e29db269c8854fc

9 6.4 1797.0 586b24872e29db269c8854fd

10 4.1 1798.0 586b24872e29db269c8854fe

11 28.0 1720.0 586b24872e29db269c8854ff

12 111.2 1871.0 586b24872e29db269c885500

13 83.4 1750.0 586b24872e29db269c885501

14 27.9 1963.0 586b24872e29db269c885502

15 85.9 1761.0 586b24872e29db269c885503

16 32.3 1880.0 586b24872e29db269c885504

17 70.9 1830.0 586b24872e29db269c885505

18 17.9 1985.0 586b24872e29db269c885506

19 8.6 1996.0 586b24872e29db269c885507

20 88.8 1939.0 586b24872e29db269c885508

21 16.3 1866.0 586b24872e29db269c885509

22 22.0 1746.0 586b24872e29db269c88550a

23 1.4 1913.0 586b24872e29db269c88550b

24 5.0 1812.0 586b24872e29db269c88550c

25 14.5 1800.0 586b24872e29db269c88550d

26 84.8 1780.0 586b24872e29db269c88550e

27 138.3 1837.0 586b24872e29db269c88550f

28 54.8 1858.0 586b24872e29db269c885510

29 12.2 1813.0 586b24872e29db269c885511

.. ... ... ...

279 132.0 1787.0 586b24872e29db269c88560b

280 9.6 1944.0 586b24872e29db269c88560c

281 47.8 1752.0 586b24872e29db269c88560d

282 139.0 1870.0 586b24872e29db269c88560e

283 5.7 1911.0 586b24872e29db269c88560f

284 20.6 1854.0 586b24872e29db269c885610

285 121.5 1836.0 586b24872e29db269c885611

286 159.0 1959.0 586b24872e29db269c885612

287 59.1 1862.0 586b24872e29db269c885613

288 64.6 1840.0 586b24872e29db269c885614

289 66.5 1772.0 586b24872e29db269c885615

290 5.0 1902.0 586b24872e29db269c885616

291 82.9 1786.0 586b24872e29db269c885617

292 24.2 1842.0 586b24872e29db269c885618

293 4.4 1954.0 586b24872e29db269c885619

294 95.8 1860.0 586b24872e29db269c88561a

295 109.6 1938.0 586b24872e29db269c88561b

296 21.0 1724.0 586b24872e29db269c88561c

297 5.0 1700.0 586b24872e29db269c88561d

298 63.7 1883.0 586b24872e29db269c88561e

299 25.4 1886.0 586b24872e29db269c88561f

300 12.1 1899.0 586b24872e29db269c885620

301 61.5 1846.0 586b24872e29db269c885621

302 35.6 1891.0 586b24872e29db269c885622

303 79.7 1936.0 586b24872e29db269c885623

304 77.2 1861.0 586b24872e29db269c885624

305 36.3 1826.0 586b24872e29db269c885625

306 6.0 1879.0 586b24872e29db269c885626

307 26.2 1897.0 586b24872e29db269c885627

308 41.0 1794.0 586b24872e29db269c885628

[309 rows x 3 columns]

7 利用redis存储数据

是一个in-memory型的键值数据库,是c写的

示例代码如下:


import redis
import statsmodels.api as sm
import pandas as pd

# 与redis建立连接
r = redis.StrictRedis()

# 加载数据
data_loader = sm.datasets.sunspots.load_pandas()
df = data_loader.data

# 通过json字符串创建记录
data = df.T.to_json()
r.set('sunspots', data)

# 检索记录
blob = r.get('sunspots')
print(pd.read_json(blob))

运行结果如下:

0 1 10 100 101 102 103 104 105 \

SUNACTIVITY 5 11 3 14.5 34 45 43.1 47.5 42.2

YEAR 1700 1701 1710 1800.0 1801 1802 1803.0 1804.0 1805.0

106 ... 90 91 92 93 94 95 96 \

SUNACTIVITY 28.1 ... 89.9 66.6 60 46.9 41 21.3 16

YEAR 1806.0 ... 1790.0 1791.0 1792 1793.0 1794 1795.0 1796

97 98 99

SUNACTIVITY 6.4 4.1 6.8

YEAR 1797.0 1798.0 1799.0

8 Apache Cassandra

是结合了键值和传统关系型数据库特性的混合型数据库,是面向列的数据库

Cassandra安装

1下载apache-cassandra-3.10-bin.tar.gz

2 修改cassandra.bat,添加JAVA_HOME变量

set JAVA_HOME=C:\Java\jdk1.8.0_71

如果本机内存不够大,可以将虚拟机内存调小.默认为2G

-Xms512m^

-Xmx512m^

3 python已安装略

4 修改cqlsh.bat.，设置python路径

set path =D:\Python35

5 添加环境变量

Path=F:\apache-cassandra-3.10\bin;

6 cmd执行cassandra,启动数据库

学习本章时未找到支持python3.5的驱动,所以使用ptyhon2.7

示列代码如下:


from cassandra import ConsistencyLevel
from cassandra.cluster import Cluster
from cassandra.query import SimpleStatement
import statsmodels.api as sm

# 与集群建立联接,并创建一个会话
cluster = Cluster()
session = cluster.connect()

# keyspace用来存储数据表的容器.
session.execute(
    "CREATE KEYSPACE IF NOT EXISTS mykeyspace WITH REPLICATION = { 'class' : 'SimpleStrategy', 'replication_factor' : 1 };")
session.set_keyspace('mykeyspace')

# 创建数据表
session.execute("CREATE TABLE IF NOT EXISTS sunspots (year decimal PRIMARY KEY, sunactivity decimal);")
# 添加数据操作
query = SimpleStatement(
    "INSERT INTO sunspots (year, sunactivity) VALUES (%s, %s)",
    consistency_level=ConsistencyLevel.QUORUM)

# 加载数据
data_loader = sm.datasets.sunspots.load_pandas()
df = data_loader.data
rows = [tuple(x) for x in df.values]

# 添加数据
for row in rows:
    session.execute(query, row)

# 输出总记录数
print(session.execute("SELECT COUNT(*) FROM sunspots")._current_rows[0])

session.execute('DROP KEYSPACE mykeyspace')
cluster.shutdown()

运行结果如下:

Row(count=309)

3.Python数据分析—数据分析入门知识图谱&索引(知识体系中篇) 以山河作礼。 Python数据分析项目数据分析知识图谱数据挖掘 python 开发语言
3.Python数据分析—数据分析入门知识图谱&索引-知识体系中篇一·个人简介二·数据获取和处理2.1数据来源：2.2数据清洗：2.2.1缺失值处理：2.2.2异常值处理：2.3数据转换：2.3.1数据类型转换：2.3.2数据编码：2.4数据合并与重塑：2.4.1数据合并：2.4.2数据拼接：2.4.3数据重塑：三·数据探索与分析3.1描述性统计分析3.2数据可视化原则和技巧3.3探索性数据分析（
numpy和matplotlib小例子 Roy Teng numpy matplotlib
最近准备学《Python数据分析与挖掘实战》这本书，刚看到第二章numpy和matplotlib这一部分，发现这个图挺有意思的，就做个笔记记录一下，日后发现有意思的继续更。importnumpyasnpimportmatplotlib.pyplotaspltx=np.linspace(0,10,1000)y=np.sin(x)+1z=np.cos(x**2)+1plt.figure(figsize
跨界协作：借助gRPC实现Python数据分析能力的共享工业甲酰苯胺 python 数据分析开发语言
gRPC是一个高性能、开源、通用的远程过程调用（RPC）框架，由Google推出。它基于HTTP/2协议标准设计开发，默认采用ProtocolBuffers数据序列化协议，支持多种开发语言。在gRPC中，客户端可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法，使得您能够更容易地创建分布式应用和服务。gRPC支持多种语言，并提供了丰富的接口和库，以及简单易用的API，方便开发者进行快
BI 数据分析，数据库，Office，可视化，数据仓库阿里数据专家数据分析数据库数据仓库 excel AIGC powerpoint 数据挖掘
AIGCChatGPT职场案例AI绘画与短视频制作PowerBI商业智能68集Mysql8.054集Oracle21C142集Office2021实战应用Python数据分析实战，ETLInformatica数据仓库案例实战51集Excel2021实操100集，Excel2021函数大全80集Excel2021高级图表应用89集，Excel2021大屏可视化制作56集Excel2021实用技巧30
python3 数据分析项目案例,python数据分析报告范文 2301_81895949 oracle
这篇文章主要介绍了python3数据分析项目案例，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。1需求分析随着科学技术的不断发展，信息流通日益方便，信息数据不断膨胀，充斥在各行各业。由于数据非常庞大，所以即使在搜索引擎存在的情况下，搜索结果的准确率也不高，这使得在网上查找关键有效信息也变为一项极具挑战性的复杂任务python编程代码画哆啦
Python数据分析：NumPy、Pandas与Matplotlib库数据小爬虫 api 电商api python 数据分析 numpy scrapy 开发语言 pandas
Python是一种强大的编程语言，特别适合数据分析，主要得益于其丰富的库生态系统。NumPy、Pandas和Matplotlib是Python中最常用的数据分析库。以下是对这三个库的简要介绍以及相应的代码示例。1.NumPyNumPy是Python的一个基本库，用于处理大型多维数组和矩阵，支持大量的高级数学函数。python复制代码importnumpyasnp#创建一个NumPy数组arr=np
Python数据分析实战【八】：用matplotlib、seaborn、pyecharts绘制散点图【文末源码地址】帅帅的Python 数据分析 matplotlib python 数据分析 seaborn pyecharts
文章目录散点图matplotlib绘制散点图seaborn绘制散点图pyecharts绘制散点图源码地址本文可以学习到以下内容：matplotlib中文乱码解决办法seaborn中文乱码解决办法seaborn库csv数据下载地址用matplotlib、seaborn、pyecharts绘制散点图散点图小凡在做数据分析的时候，经常需要对数据进行可视化操作，这样可以更加直观的了解数据，从而更好的分析数
超详细 | Python数据可视化入门教程（Pandas、Matplotlib、Seaborn、Pyecharts）酒酿小小丸子 python 信息可视化 pandas 数据分析数据挖掘
什么是数据可视化？数据可视化是为了使得数据更高效地反应数据情况，便于让读者更高效阅读，通过数据可视化突出数据背后的规律，以此突出数据中的重要因素，如果使用Python做数据可视化，建议学好如下这四个Python数据分析包，分别是：Pandas、Matplotlib、Seaborn、Pyecharts学好以上四个数据分析包，做可视化足够用了，全文较长，建议耐心看完，学习后即可使用Python做数据可
Python 可视化数据图表绘制这篇就够了碎像 python 信息可视化开发语言
1.温习大家可以先看我之前写的关于Python可视化数据图表的入门的文章，这方便我们理解接下来的内容。链接如下：Python数据分析可视化数据图表入门这篇就够了-CSDN博客https://blog.csdn.net/qq_69183322/article/details/1360194712.绘制折线图的plot其他参数我们在绘制折线图的时候除了使用plot函数常用的label，color，ma
Python数据分析 Pandas进阶（下）这篇就够了碎像 pandas
建议先看我写的Pandas快速入门和Pandas进阶(上)、（中），这样方便理解接下来的内容入门篇Python数据分析Pandas快速入门至进阶这篇就够了_pythonpandas-CSDN博客https://blog.csdn.net/qq_69183322/article/details/135891946进阶篇Python数据分析Pandas进阶（上）这篇就够了-CSDN博客https://
Python数据分析 Pandas快速入门至进阶这篇就够了碎像 python 数据分析 pandas
1.简述PandasPandas是Python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来。它基于NumPy构建，提供了大量库和标准数据模型，用于高效地处理大型数据集。Pandas的主要特点包括：DataFrame：这是一种高效快速的数据结构模式，支持自定义索引。数据加载：Pandas可以将不同格式的数据文件加载到内存中。数据对齐：
python数据分析——对numpy的ndarray进行索引、切片、以及数组的一些计算函数千寻之路 python numpy 数据结构
对数组进行索引对数组进行索引时，直接使用[]中加入数字进行索引，有两种代码写法，如下：importnumpyasnpa=np.random.random((2,3,4))print(a)#索引print(a[0][1][1])print(a[0,1,1])#结果与上面代码相同，但是更简洁表示索引到第0维数组的一行一列，运行结果如下：利用布尔类型的数组进行数据索引，最终返回的结果是对应索引数组中数据
python数据分析-Numpy库 weixin_45988458 python 数据分析 numpy
numpy三剑客importnumpyasnpimportpandasaspdimportmatplotlibpyplotasplt在数据分析中，NumPy、Pandas和Matplotlib是非常常用的三个库，它们各自扮演着不同的角色，提供了强大的功能和工具，可以方便地进行数据分析和可视化。NumPy（NumericalPython）：NumPy是Python中的一个核心库，提供了高性能的多维数
python数据分析numpy基础之sqrt用法和示例梯阅线条 python numpy python
1python数据分析numpy基础之sqrt用法和示例python的numpy库的sqrt()函数用于计算数组各元素的平方根，相当于arr**0.5。用法numpy.sqrt(x,/,out=None,*,where=True,casting='same_kind',order='K',dtype=None,subok=True[,signature,extobj])=描述numpy.sqrt(
python数据分析numpy基础之meshgrid生成网格点坐标梯阅线条 python python numpy
1python数据分析numpy基础之meshgrid生成网格点坐标python的numpy库的meshgrid()函数用于生成网格点的坐标矩阵。用法numpy.meshgrid(*xi,copy=True,sparse=False,indexing='xy')描述返回坐标向量中的坐标矩阵列表。入参*xi：可选，array_likex1，x2，…，xn，表示网格坐标的一维数组；copy：可选，bo
【python数据分析基础】—dataframe中index的相关操作（添加、修改index的列名、修改index索引值等） sodaloveer python数据分析基础知识 python 数据分析 pandas
文章目录前言一、添加、修改index的列名二、修改index索引值前言本文主要讲dataframe结构中index的相关操作，index相当于是数据表的行。一、添加、修改index的列名新建一个dataframe表，我们可以自定义index的值，如下：importpandasaspdimportnumpyasnpframe=pd.DataFrame(np.random.randn(3,3),ind
【python数据分析的基础知识】— 取指定序列为某些值时对应其他序列的值 sodaloveer python数据分析基础知识 python 数据分析开发语言
文章目录一、需求场景二、实现思路三、实现过程一、需求场景有两个内容一一对应的序列，分别为A，B。我们希望根据已知A序列中的某些字段，提取出B序列的对应的值。本例中，A，B序列分别为广东省地市编号及地市编号对应的名称。要求我们根据A序列广东省地市编号取其对应的中文名称。最后，输出结果为列表类型。二、实现思路方法一：列表+循环1、确定要取地市编号列的城市编号2、返回地市编号列的索引3、对应取地市名称列
python数据分析numpy基础之abs()用法和示例梯阅线条 python python numpy
1python数据分析numpy基础之abs()用法和示例python的通用函数ufunc(Universalfunctions)是一种对ndarray多维数组中的数据执行元素级运算的函数，即对数组的每个元素都调用通用函数。numpy的通用函数分为一元ufunc和二元ufunc。一元ufunc接收一个ndarray入参进行运算，二元ufunc接收二个ndarray进行运算。用法numpy.abso
python数据分析numpy基础之fabs用法和示例梯阅线条 python python numpy
1python数据分析numpy基础之fabs用法和示例python的numpy库的fabs()函数用于计算多维数组的每个元素的绝对值，绝对值都为浮点数，并且不能计算复数的绝对值，速度会比abs()快。用法numpy.fabs(x,/,out=None,*,where=True,casting='same_kind',order='K',dtype=None,subok=True[,signatu
Python数据分析从入门到进阶：模型评估和选择（含详细代码）程序员老冉 python 数据分析开发语言
引言之前我们介绍了机器学习的一些基础性工作，介绍了如何对数据进行预处理，接下来我们可以根据这些数据以及我们的研究目标建立模型。那么如何选择合适的模型呢？首先需要对这些模型的效果进行评估。本文介绍如何使用sklearn代码进行模型评估模型评估对模型评估的基本步骤如下：首先将要将数据集分为训练集和测试集对训练集进行模型拟合确定合适的评估指标计算在测试集上的评估指标1数据集划分在机器学习问题中，从理论上
Python数据分析（Matplotlib、NumPy、Pandas）侯静川 python 数据分析 matplotlib numpy pandas
Python数据分析(Numpy、Matplotlib、Pandas)教程：黑马程序员链接：https://www.bilibili.com/video/BV1hx411d7jb?p=1一、基础概念和环境1.1什么是数据分析数据分析是通过对收集到的数据进行解释、整理、转化和建模，以提取出有意义的信息、得出结论并支持决策的过程。1.2为什么要学习数据分析是Python数据科学的基础机器学习的基础1.
python从入门到精通（十七）：python的图形化界面开发 HACKNOE python python pycharm 爬虫 beautifulsoup 开发语言安全
python数据分析和可视化基础TkinterTkinter模块的概念导入模块实例化窗口对象调用窗口设置窗口大小设置窗口位置设置窗口的标题添加标签控件添加标签定位添加输入框定位添加点击按钮设计按钮功能TkinterTkinter模块的概念Tkinter是Python的标准GUI库，它提供了丰富的组件和布局管理器，能够帮助我们快速地创建图形用户界面应用程序。导入模块python3importtkin
Python数据分析与展示_Numpy_Matplotlib_Pandas qq_繁华笔记 python 数据分析 numpy
一、Python数据分析与展示掌握表示、清洗、统计和展示数据的能力主题思想与一组数据相关的那些事儿：如何理解一组数据表达的含义摘要：有损地提取数据特征的过程内容组织全课程包括：8个内容单元，共12个单元全课程总长4周，每周3个单元每周包含一个实战型实例编辑工具使用AnacondaIDE集成开发工具需要理解和掌握如下工具的使用：condaSpyderIPython实例实例1：图像的手绘效果实例2：引
用 Python 分析过往 36 年春晚节目数据，发现一些趣事 Vincent8080 python
看过那么多春晚，哪一年、哪些节目、哪些人你还留有深刻印象呢。记忆中，只完整地看过2005年到2015年十年春晚。05年之前，还很小，看不懂；15年之后，长大了，也看不懂。如今，距离第一届春晚1983年，整整过去了36年，3轮的「十二生肖」年。趁今年春晚还没到，来回顾一下过往36届春晚的一些有趣数据。分析内容接下来，通过Python数据分析，会回答下面这些问题，在知道答案之前，你可以先猜猜看：谁导演
python从入门到精通（十）：python爬虫的初级使用 HACKNOE python python 爬虫开发语言
python数据分析和可视化基础python爬虫分析python的4种爬虫方法第一种：基于urllib库的方法（一）任务介绍（二）认识爬虫2.1了解爬虫的商业价值2.2爬虫的原理（三）基本流程3.1准备工作3.1.1分析网页3.1.1http请求方法3.1.1.1请求报文3.1.1.2响应报文3.1.1.3请求报文常见请求方法3.1.1.4常见的请求头字段3.1.1.5常见的响应头字段3.1.1.
python从入门到精通（十）：python常见标准库的使用 HACKNOE python python pyqt
python数据分析和可视化基础（一）Python中处理日期和时间的模块time导入time模块time获取当前时间戳localtime获取当前时间asctime获取格式化的时间ctime获取格式化的时间gmtime获取格式化的时间strftime格式化日期strptime格式化日期格式化日期字符datetime导入datetime获取当前的日期时间创建datetime对象格式化时间获取datet
python从入门到精通（七）：封装、继承、多态 HACKNOE python python pycharm
python数据分析和可视化基础第二十六章：python面向对象编程（七）继承7.1面向对象三大特性7.2单继承7.3继承的语法7.3.1专业术语7.3.2继承的传递性7.3.3继承传递中的注意事项7.4方法的重写7.4.1覆盖父类的方法7.4.2对父类方法进行扩展7.4.3Python2调用父类方法7.5父类的私有属性和私有方法7.6多继承7.6.1多继承概念7.6.2多继承的语法7.6.3多继
Python数据分析顶峰相见_li python 数据分析开发语言
Python数据分析\1.环境准备CPython—>Jupyter—>Pandas+周边库—>专业人士Anaconda—>CPython+conda+Jupyter+190+库—>适合小白Miniconda—>CPython+conda—>小白专业\2.工具介绍PyCharmProfessionalEdition—>工程化开发VScode/JupyterNotebook/JupyterLab—>数
Python数据分析实战【十一】：学习用scorecardpy搭建风控评分卡模型【文末源码地址】帅帅的Python 机器学习数据分析 python 机器学习
文章目录评分卡模型一、数据预处理scorecardpy自带数据查看数据行列查看数据内容,用sample()比head()可以看更多的数据统计每个变量的缺失占比情况查看数据的信息查看每个变量有多少分类描述性统计数据之间的相关性二、数据筛选sc.var_filter()划分数据三、变量分箱woebin()woebin_plot()分箱调整四、WOE转化五、建立模型六、模型评估七、评分稳定性评分映射计算
解读《对比Excel轻松学习Python数据分析》刹那流转
内容：鹤鹤编辑：紫岸这本书是一本工具书，对于非专业领域的人来说，可能不是特别适合。我之前是看过一些关于写python的一些基础语法知识的书，但是在实际的工作应用中，暂时没有实操过，很多知识就忘记了。而我在工作中做数据处理比较常用的工具是Excel。所以我看这本书的初衷是希望能结合我日常处理数据的Excel的操作来做Python的实操，用以熟悉python的工作环境和相关语法。这本书比较好的一点是在
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

python数据分析学习笔记八

你可能感兴趣的:(python数据分析)