xingxiliang

Pandas快速总结

Series数据结构

# 带标签的一列
import pandas as pd;

a = pd.Series( [1,2,3,4,5]);
a

0    1
1    2
2    3
3    4
4    5
dtype: int64

# 传入index
a = pd.Series([1,2,3,4,5], index=['a', 'b', 'c', 'd', 'e'], dtype=float);
a

a    1.0
b    2.0
c    3.0
d    4.0
e    5.0
dtype: float64

# 从numpy    ndarray导入 
import numpy as np;

a = np.arange(5);
b = pd.Series(a);
print(b)
print(type(a))

0    0
1    1
2    2
3    3
4    4
dtype: int32

# 从dict产生
dic = {
     'name':'Lee', 'sex':'man', 'age':18}
a = pd.Series(dic)
print(a)

age      18
name    Lee
sex     man
dtype: object

# 手动传入一个索引的时候 以索引为准, 从字典中查找，找不到就直接NaN
my_dict = {
     'name':'xing', 'sex':'man', 'age':18};
a = pd.Series(my_dict, index = ['name', 'color'])
a

name     xing
color     NaN
dtype: object

# 索引的数量多于 数据内容的时候会自动填充
a = pd.Series(5, [0, 1, 2])
a

0    5
1    5
2    5
dtype: int64

a = pd.Series([3], [0, 1, 2])
a

0    3
1    3
2    3
dtype: int64

DataFrame数据结构

# 从numpy 导入
a = np.random.randint(0, 10, (2,3))
df = pd.DataFrame(a, index=['a', 'b'], columns = ['x', 'y', 'z']);
df

	x	y	z
a	4	3	2
b	5	6	9

# 把Series变为DF
# 一维的字典不能直接转
population = {
     'beijing':3434, 'shanghai':2343, 'guangzhou':11232};
s = pd.Series(population);
df = pd.DataFrame(s);
df

	0
beijing	3434
guangzhou	11232
shanghai	2343

type(df)

pandas.core.frame.DataFrame

# 还是从series导入，但是加上列名
df = pd.DataFrame(s, columns=['pop_num'])
df

	pop_num
beijing	3434
guangzhou	11232
shanghai	2343

# 字典的字典就可以构建df了
popu = {
     'bj':9898, 'sh':89887, 'gz':11232}
df = pd.DataFrame({
     'gdp':popu})  # 字典的字典
df

	gdp
bj	9898
gz	11232
sh	89887

gdp = {
     'bj':0.998, 'sh':0.889, 'gz':1.232}
df = pd.DataFrame({
     'gdp':gdp, 'popu':popu})
df

	gdp	popu
bj	0.998	9898
gz	1.232	11232
sh	0.889	89887

# 他会自动扩充
# 单一数值会被自动扩充
df = pd.DataFrame({
      'gdp': gdp, 'popu':popu, 'country':'China'})
df

	country	gdp	popu
bj	China	0.998	9898
gz	China	1.232	11232
sh	China	0.889	89887

pandas里面数据的属性

# values属性转为numpy的array数据
df = pd.DataFrame({
     'gdp':gdp, 'popu':popu});
df

	gdp	popu
bj	0.998	9898
gz	1.232	11232
sh	0.889	89887

df.values

array([[  9.98000000e-01,   9.89800000e+03],
       [  1.23200000e+00,   1.12320000e+04],
       [  8.89000000e-01,   8.98870000e+04]])

# values属性转为numpy的array数据
df = pd.DataFrame({
     'gdp':gdp, 'popu':popu, 'country':"China"});
df

	country	gdp	popu
bj	China	0.998	9898
gz	China	1.232	11232
sh	China	0.889	89887

df.values #计算速度更快

array([['China', 0.998, 9898],
       ['China', 1.232, 11232],
       ['China', 0.889, 89887]], dtype=object)

df.index

Index(['bj', 'gz', 'sh'], dtype='object')

df.columns

Index(['country', 'gdp', 'popu'], dtype='object')

df.shape

(3, 3)

df.dtypes

country     object
gdp        float64
popu         int64
dtype: object

df.size

索引查找数据

df = pd.DataFrame({
     'gdp':gdp, 'popu':popu});
df

	gdp	popu
bj	0.998	9898
gz	1.232	11232
sh	0.889	89887

# 取一列
df['gdp']

bj    0.998
gz    1.232
sh    0.889
Name: gdp, dtype: float64

df.gdp # 对于上面方法的简写

bj    0.998
gz    1.232
sh    0.889
Name: gdp, dtype: float64

# 取一行
df.loc['sh']

gdp         0.889
popu    89887.000
Name: sh, dtype: float64

df.loc[ ['sh', 'bj']] #取多行需要传入列表

	gdp	popu
sh	0.889	89887
bj	0.998	9898

df.loc[ 'bj':'gz'] # 切片可以取到左闭右闭的索引的 一个表格

	gdp	popu
bj	0.998	9898
gz	1.232	11232

# 用位置拿去
df.iloc[ 0]

gdp        0.998
popu    9898.000
Name: bj, dtype: float64

df.iloc[ [0, 2]]

	gdp	popu
bj	0.998	9898
sh	0.889	89887

df.loc['sh', 'gdp'] #精确到一个cell

0.88900000000000001

# iloc 取一个cell
df.iloc[ 0, 1]

# 专为 ndarray之后再取数
df.values[0][1]

9898.0

# 1: 1到最后  ：表示所有的列
df.iloc[ 1:, :]

	gdp	popu
gz	1.232	11232
sh	0.889	89887

df.gdp > 0

bj    True
gz    True
sh    True
Name: gdp, dtype: bool

df.gdp > 0.9

bj     True
gz     True
sh    False
Name: gdp, dtype: bool

df.loc[ df.gdp>0.9] # 用bool变量来筛选

	gdp	popu
bj	0.998	9898
gz	1.232	11232

df[ df.gdp>0.9]

	gdp	popu
bj	0.998	9898
gz	1.232	11232

DF里面的赋值

df.iloc[ 0, 1] = 0 #修改cell
df

	gdp	popu
bj	0.998	0
gz	1.232	11232
sh	0.889	89887

new_column = pd.Series(['010','020','0755'], index=['bj', 'sh','gz']);
new_column

bj     010
sh     020
gz    0755
dtype: object

df['tel'] = new_column #增加一列
df

	gdp	popu	tel
bj	0.998	0	010
gz	1.232	11232	0755
sh	0.889	89887	020

查看数据的基本特征

dates = pd.date_range('2020-1-1', periods=6)
dates

DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04',
               '2020-01-05', '2020-01-06'],
              dtype='datetime64[ns]', freq='D')

df = pd.DataFrame(np.random.randint(0, 10, (6,5)), index = dates, columns=list('ABCDE'))
df

	A	B	C	D	E
2020-01-01	4	9	8	8	8
2020-01-02	4	5	5	8	7
2020-01-03	1	0	3	2	0
2020-01-04	9	5	9	6	0
2020-01-05	7	8	3	8	0
2020-01-06	4	3	1	0	8

df.describe() # 对于每一列的描述，看整体结构

	A	B	C	D	E
count	6.000000	6.000000	6.000000	6.000000	6.000000
mean	4.833333	5.000000	4.833333	5.333333	3.833333
std	2.786874	3.286335	3.125167	3.502380	4.215052
min	1.000000	0.000000	1.000000	0.000000	0.000000
25%	4.000000	3.500000	3.000000	3.000000	0.000000
50%	4.000000	5.000000	4.000000	7.000000	3.500000
75%	6.250000	7.250000	7.250000	8.000000	7.750000
max	9.000000	9.000000	9.000000	8.000000	8.000000

df.info() # 描述信息


DatetimeIndex: 6 entries, 2020-01-01 to 2020-01-06
Freq: D
Data columns (total 5 columns):
A    6 non-null int32
B    6 non-null int32
C    6 non-null int32
D    6 non-null int32
E    6 non-null int32
dtypes: int32(5)
memory usage: 168.0 bytes

df.head(1) # 前几行

	A	B	C	D	E
2020-01-01	4	9	8	8	8

df.tail(2)

	A	B	C	D	E
2020-01-05	7	8	3	8	0
2020-01-06	4	3	1	0	8

df.T # 转置

	2020-01-01 00:00:00	2020-01-02 00:00:00	2020-01-03 00:00:00	2020-01-04 00:00:00	2020-01-05 00:00:00	2020-01-06 00:00:00
A	4	4	1	9	7	4
B	9	5	0	5	8	3
C	8	5	3	9	3	1
D	8	8	2	6	8	0
E	8	7	0	0	0	8

df.sort_index() #默认 按照行索引升序

	A	B	C	D	E
2020-01-01	4	9	8	8	8
2020-01-02	4	5	5	8	7
2020-01-03	1	0	3	2	0
2020-01-04	9	5	9	6	0
2020-01-05	7	8	3	8	0
2020-01-06	4	3	1	0	8

df.sort_index(ascending=False) #默认 按照行索引排序

	A	B	C	D	E
2020-01-06	4	3	1	0	8
2020-01-05	7	8	3	8	0
2020-01-04	9	5	9	6	0
2020-01-03	1	0	3	2	0
2020-01-02	4	5	5	8	7
2020-01-01	4	9	8	8	8

df.sort_index(axis=1, ascending=False) # 按照列索引 降序  按照索引排序

	E	D	C	B	A
2020-01-01	8	8	8	9	4
2020-01-02	7	8	5	5	4
2020-01-03	0	2	3	0	1
2020-01-04	0	6	9	5	9
2020-01-05	0	8	3	8	7
2020-01-06	8	0	1	3	4

# 按照值排序
df.sort_values('B') #默认是按照某一列的值 对各个行排序

	A	B	C	D	E
2020-01-03	1	0	3	2	0
2020-01-06	4	3	1	0	8
2020-01-02	4	5	5	8	7
2020-01-04	9	5	9	6	0
2020-01-05	7	8	3	8	0
2020-01-01	4	9	8	8	8

df.sort_values(dates[0], axis=1)

	A	C	D	E	B
2020-01-01	4	8	8	8	9
2020-01-02	4	5	8	7	5
2020-01-03	1	3	2	0	0
2020-01-04	9	9	6	0	5
2020-01-05	7	3	8	0	8
2020-01-06	4	1	0	8	3

数据计算

a = pd.DataFrame([1, 2, 3])
a

	0
0	1
1	2
2	3

a-2

	0
0	-1
1	0
2	1

b = pd.DataFrame([1,3,4])
a+b

	0
0	2
1	5
2	7

a*b

	0
0	1
1	6
2	12

b.T

	0	1	2
0	1	3	4

a.dot(b.T) #矩阵乘法

	0	1	2
0	1	3	4
1	2	6	8
2	3	9	12

a = pd.DataFrame(np.random.randint(0, 20, (2,2)), columns=['A', 'B'])
a

	A	B
0	17	1
1	4	11

b = pd.DataFrame(np.random.randint(0, 20, (3,3)), columns = ['A', 'B', 'C'])
b

	A	B	C
0	9	5	17
1	9	12	16
2	0	13	4

a+b # 有点地方就想加，没有的地方就为NaN

	A	B	C
0	26.0	6.0	NaN
1	13.0	23.0	NaN
2	NaN	NaN	NaN

a.add(b, fill_value=11111111) # 先填充到 shape相同再计算

	A	B	C
0	26.0	6.0	11111128.0
1	13.0	23.0	11111127.0
2	11111111.0	11111124.0	11111115.0

缺失值的处理

a = pd.DataFrame(np.arange(9).reshape(3,3))
a

	0	1	2
0	0	1	2
1	3	4	5
2	6	7	8

a.iloc[ :2, 2] = np.NaN
a

	0	1	2
0	0	1	NaN
1	3	4	NaN
2	6	7	8.0

# 丢掉 缺失值
a.dropna()
a

	0	1	2
0	0	1	NaN
1	3	4	NaN
2	6	7	8.0

a.dropna() #按照行丢弃

	0	1	2
2	6	7	8.0

a.dropna(axis=1) # 按照列丢弃

	0	1
0	0	1
1	3	4
2	6	7

a.dropna(axis=1, how='all') # 全部缺失才丢弃

	0	1	2
0	0	1	NaN
1	3	4	NaN
2	6	7	8.0

a.fillna(999) #帮我们修改

	0	1	2
0	0	1	999.0
1	3	4	999.0
2	6	7	8.0

合并和对齐

a = pd.DataFrame(np.zeros((3,4)), columns=['a', 'b', 'c', 'd'])
a

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

b = pd.DataFrame(np.zeros( (3,4)), columns=list('abcd'))
b

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

# 合并，拼接
pd.concat([a, b]) # 需要传递一个列表进去

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

# 让pd帮我们重新索引
pd.concat( [a, b], ignore_index=True)

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
3	0.0	0.0	0.0	0.0
4	0.0	0.0	0.0	0.0
5	0.0	0.0	0.0	0.0

# 水平合并
pd.concat( [a, b], axis=1)

	a	b	c	d	a	b	c	d
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

pd.concat( [a, b], axis=1, ignore_index=True) # ignoreindex 会帮助我们废弃原来的不好用的列名

	0	1	2	3	4	5	6	7
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

# shape不同的时候怎么办
a = pd.DataFrame(np.ones( (3,3)), index=[0, 1, 2], columns=list('abc'))
b = pd.DataFrame(np.ones( (3,3)), index=[2, 3, 4], columns = list('cde'))
pd.concat([a, b])

	a	b	c	d	e
0	1.0	1.0	1.0	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN
2	1.0	1.0	1.0	NaN	NaN
2	NaN	NaN	1.0	1.0	1.0
3	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	1.0	1.0	1.0

pd.concat( [a, b], axis=1)

	a	b	c	c	d	e
0	1.0	1.0	1.0	NaN	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN	NaN
2	1.0	1.0	1.0	1.0	1.0	1.0
3	NaN	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	NaN	1.0	1.0	1.0

# 增加一行的办法
a = pd.DataFrame( np.ones( (3,4)), index=[0, 1, 2], columns=['a', 'b','c','d'])
a

	a	b	c	d
0	1.0	1.0	1.0	1.0
1	1.0	1.0	1.0	1.0
2	1.0	1.0	1.0	1.0

b = pd.Series([100, 100, 100, 100], index=list('abcd'))
b

a    100
b    100
c    100
d    100
dtype: int64

a.append(b, ignore_index=True) # 添加一行

	a	b	c	d
0	1.0	1.0	1.0	1.0
1	1.0	1.0	1.0	1.0
2	1.0	1.0	1.0	1.0
3	100.0	100.0	100.0	100.0

# 对齐 用merge方法,,会通过调整行的上下， 根据相同的‘列’保证其数值不变，
a = pd.DataFrame([[-1, 1], 
                 [-2,  0]], index=[1, 2], columns=["A", "B"]);
b = pd.DataFrame([[1, 11], 
                 [0,   10]], index=[1, 2], columns= ['B', 'C']);
print(a)
print(b)

pd.merge( a,b)

	A	B	C
0	-1	1	11
1	-2	0	10

b = pd.DataFrame([[0, 20], 
                  [1, 21]], index=[1,2], columns = ['B', 'C']);
b

	B	C
1	0	20
2	1	21

	A	B
1	-1	1
2	-2	0

pd.merge(a, b)

	A	B	C
0	-1	1	21
1	-2	0	20

分组

df = pd.DataFrame({
     
    'key':list('ABCCBA'),
    'data1':range(6), # range是python自带的 np.arange 是numpy里面的
    'data2':range(20,26)
})
df

	data1	data2	key
0	0	20	A
1	1	21	B
2	2	22	C
3	3	23	C
4	4	24	B
5	5	25	A

groups = df.groupby('key')
groups

groups.sum() # 每一组的sum

	data1	data2
key
A	5	45
B	5	45
C	5	45

groups.data1.sum()  # 针对其中一列 sum

key
A    5
B    5
C    5
Name: data1, dtype: int32

groups.median()

	data1	data2
key
A	2.5	22.5
B	2.5	22.5
C	2.5	22.5

groups['data1'].mean()#Seies类型的返回值

key
A    2.5
B    2.5
C    2.5
Name: data1, dtype: float64

groups.apply(lambda x:x['data1']/x['data1'].sum())

key   
A    0    0.0
     5    1.0
B    1    0.2
     4    0.8
C    2    0.4
     3    0.6
Name: data1, dtype: float64

def func(x):
    x['data1'] /= x['data1'].sum()
    return x

groups.apply(func)

	data1	data2
0	0.0	20
1	0.2	21
2	0.4	22
3	0.6	23
4	0.8	24
5	1.0	25

def func(x):
    x['data1'] /= x['data1'].sum()
    return x

df.groupby('key').apply(func)  #归一化，，用这个把简单

	data1	data2	key
0	0.0	20	A
1	0.2	21	B
2	0.4	22	C
3	0.6	23	C
4	0.8	24	B
5	1.0	25	A

数据透视表

import seaborn as sns
titanic = sns.load_dataset('titanic')

titanic.head()

	survived	pclass	sex	age	sibsp	fare	embarked	class	who	adult_male	deck	embark_town	alive	alone
0	0	3	male	22.0	1	7.2500	S	Third	man	True	NaN	Southampton	no	False
1	1	1	female	38.0	1	71.2833	C	First	woman	False	C	Cherbourg	yes	False
2	1	3	female	26.0	0	7.9250	S	Third	woman	False	NaN	Southampton	yes	True
3	1	1	female	35.0	1	53.1000	S	First	woman	False	C	Southampton	yes	False
4	0	3	male	35.0	0	8.0500	S	Third	man	True	NaN	Southampton	no	True

titanic.pivot_table('survived', index='sex', columns='class')#透视表

class	First	Second	Third
sex
female	0.968085	0.921053	0.500000
male	0.368852	0.157407	0.135447

你可能感兴趣的:(数据分析)

中国双非高校经费TOP榜数据分析归零鸟高考考研高校大学
当我们习惯性仰望985、211这些“国家队”时，一批地方重点支持的高校正悄悄发力，手握重金，展现出不逊于名校的“钞能力”。特别是“双非”大学中的佼佼者，它们的年度经费预算，足以让许多普通院校望尘莫及。今天就带大家揭开2024年全国高校经费预算的神秘面纱，尤其关注那些没有985/211光环，却获得财政“真金白银”大力支持的双非实力派们！（数据综合整理自各高校2024年公开预算报告及相关教育资讯平台，
Python Pandas 如何进行数据分组统计 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 网络 ai
PythonPandas如何进行数据分组统计关键词：PythonPandas、数据分组、groupby、聚合函数、数据透视表、数据统计、数据分析摘要：本文将深入探讨如何使用PythonPandas库进行高效的数据分组统计操作。我们将从基础概念入手，详细讲解groupby机制的原理和使用方法，介绍各种聚合函数的应用，探讨高级分组技巧，并通过实际案例展示如何解决复杂的数据分析问题。文章还将涵盖性能优化
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
基于MATLAB的资源优化与工期固定-资源均衡分析方法研究【附代码】拉勾科研工作室 matlab 开发语言
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）资源均衡优化相关理论与问题分类在现代工程项目中，资源的合理分配和使用是确保项目按时完成、成本可控的关键因素。资源均衡优化作为项目管理中的核心环节，旨在通过调整资源的使用方案，使资源消耗在整个工期内尽可能平稳，避免
医学图像增强的层级化模糊与虚拟仪器无参考质量评价研究【附代码】拉勾科研工作室计算机视觉图像处理人工智能
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）层级模糊隶属度的X光医学图像增强算法针对X光医学图像普遍存在的对比度差、细节模糊等问题，本算法提出了一种基于层级模糊隶属度的增强方法。该方法的核心思想在于利用拉普拉斯金字塔分解图像，并在多尺度下分层计算模糊隶属度
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
为什么90%企业的AI数据分析都失败了？奥威BI给出破局方案 qq_43696218 人工智能数据分析数据挖掘
一、引言：AI数据分析在数字化转型中的核心地位在当今企业全面数字化转型的背景下，‌AI数据分析已成为解锁业务增长潜力的关键钥匙。然而，市场上众多AI数据分析产品常陷入“伪需求场景”，看似前沿却难以真正落地。本文将深入探讨奥威BI如何通过其AI数据分析能力，突破伪需求，实现数据价值的最大化。二、AI数据分析：伪需求场景的挑战伪需求场景的定义与表现AI数据分析领域的伪需求场景，指的是那些表面创新实则难
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
Cursor MySQL MCP 完整操作配置指南 z日火开发分享 mcp cursor mysql
概述本指南帮助您在Windows环境下配置Cursor编辑器的MySQLMCP服务器，实现通过AI助手对数据库进行完整的增删改查操作。功能特性：✅自然语言数据库查询✅智能数据插入和更新✅安全的数据删除操作✅自动数据分析和报告生成快速配置1.环境检查#检查必要组件node--version#Node.js>=16mysql--version#MySQL5.7+cursor--version#Curs
AI助力基因数据分析：用Python玩转生命密码的秘密 Echo_Wish 前沿技术人工智能人工智能数据分析 python
AI助力基因数据分析：用Python玩转生命密码的秘密说到基因数据，听起来是不是感觉有点高大上？其实，基因数据分析正变得越来越“接地气”，而AI正是这条路上的神奇钥匙。今天，咱们就用Python聊聊如何利用AI技术做基因数据分析与建模，帮你破解生命的密码，找到疾病预测、个性化医疗的新路子。一、基因数据为何如此特别？基因组测序技术让我们能够获取人体细胞内数以百万计的DNA序列变异信息。但数据量巨大、
python做生物信息学分析_Python从零开始第五章生物信息学①提取差异基因吴敬欣 python做生物信息学分析
目前来说，做生物信息学的人越来越多，但是我觉得目前而言做生信的主要有三类人：老本行是做实验的，做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)主要是做生信的，主要涵盖高通量测序数据分析，组学数据分析等等，专门从事生物学数据分析的这群人，其大部分也是本科生物狗作为强大的生力军，以调包写R，python为主。那么这群人就要熟悉看各种包的tutorial以及如何进行常规
数据与ChatBI
ChatBI的核心是让用户用自然语言（如“帮我看看这周的销售额走势”）直接获取数据分析结果，无需懂SQL或技术细节。整个过程就像AI“听懂”你的话、理解需求、生成查询、验证执行、并可视化展示结果。首先，ChatBI的系统架构图展示了整个流程的关键步骤。它从用户输入开始，经过多个AI模块处理，最终输出交互式报表。现在来一步步解析ChatBI的工作流程。1.语音/文字输入——解放双手的起点这是什么？一
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
Jupyter完全指南：一文搞定Notebook和Lab的所有玩法 network爬虫 JupyterNotebook jupyter python ide 数据分析
Jupyter完全指南：一文搞定Notebook和Lab的所有玩法目录引言：为什么Jupyter是数据科学家的最爱Jupyter生态系统概览JupyterNotebookvsJupyterLab：选择哪一个？安装与环境配置Notebook基础操作详解Magic命令：让你的工作流更高效JupyterLab高级功能探索实战案例：数据分析项目完整流程扩展插件与自定义配置性能优化与最佳实践常见问题解答总结
关于电商秒杀系统中防超卖、以及高性能下单的处理方案简述 Java鼠鼠吖 java
秒杀抢购系统的成功平稳运行，有一些需要注意的知识点。1高并发，以及刷接口等黑客请求对服务端的负载冲击2高并发时带来的超卖，即商品数量的控制3高负载下，下单的速度和成功率的保证4其他以秒杀单品为例，如抢小米手机。解决方案探讨：第一步限制前端发来的请求量免费领取Java学习资料譬如定在了周二10点开启抢购，那么在之前的一周时间内，都会有预约通知，或者普通的用户浏览。通过预约量、浏览量等数据分析，大概能
从实验到生产：DeepSeek大模型工程化部署的关键步骤与风险控制一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、引言：大模型部署迈入“工程化时代”随着DeepSeek等开源大语言模型（LLM）的发展，大模型不再是AI实验室的专属工具，越来越多的企业正尝试将其纳入业务生产系统，应用于客服问答、合同审查、数据分析、自动写作等场景。但模型的能力≠可用的系统。从模型下载到模型上线，中间隔着“部署的鸿沟”：资源配置、服务稳定性、响应效率、安全控制、上线合规……一
计算机毕业设计项目、管理系统、可视化大屏、大数据分析、协同过滤、推荐系统、SSM、SpringBoot、Spring、Mybatis、小程序项目编号1000-1499 lonzgzhouzhou spring 课程设计 spring boot
大家好，我是DeBug，很高兴你能来阅读！作为一名热爱编程的程序员，我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里，我将会结合实际项目经验，分享编程技巧、最佳实践以及解决问题的方法。无论你是初学者还是有一定经验的程序员，我都希望能够为你提供有价值的内容，帮助你更好地理解编程世界。让我们一起探索编程的乐趣，一起成长，一起学习，谢谢你们的支持与关注！【源码咨询】可接Java程序设计，Bug
开发数字化绿色低碳园区系统：分阶段实施指南 Hy行者勇哥绿色智造 ·产品设计与管理物联网华为云架构
目录摘要背景核心模块阶段性开发分阶段开发实施第一阶段（3-6个月）：搭建核心骨架第二阶段（6-9个月）：扩展功能第三阶段（9-12个月）：深度定制技术选型注意事项实施计划表小结摘要数字化绿色低碳园区系统通过物联网、能源管理和数据分析等技术，实现节能减排和智慧管理。本文针对目前市场低迷，需求不振，开发资源有限的团队，提出基于低代码平台的开发策略，分为三阶段（核心骨架、功能扩展、深度优化），覆盖所有必
Gitea 服务器监控面板的搭建 shengyin714959 笔记最高笔记服务器 gitea 数据库
Prometheus是一个开源的服务监控系统和时序数据库。Grafana是一个可视化的数据分析面板，它可以从Prometheus中查询时序数据，绘制漂亮的数据图表。本文作者在实践中使用Prometheus抓取和存储Gitea服务器的运行数据，并基于Grafana提供的开源数据面板创建了一个自己服务器的Gitea性能监控面板。工作原理为了更清晰地理解Prometheus的工作原理，我在下方列出了Pr
AI测试驱动的大前端质量保障体系构建与实践欧阳天羲 AI 开发前端人工智能前端
一、引言：大前端测试的新挑战与AI破局在大前端开发规模与复杂度持续攀升的背景下，传统测试方法已难以满足快速迭代的需求。随着小程序、APP和Web应用的多端协同开发成为常态，测试覆盖率不足、执行效率低下、缺陷定位困难等问题日益凸显。AI凭借强大的数据分析与智能决策能力，为构建高效、精准的大前端质量保障体系提供了新路径。本文将结合多端项目实践，深入探讨AI在大前端测试各环节的应用，通过实际代码示例展示
AI辅助大前端开发的性能瓶颈突破与体验优化
在大前端开发技术飞速发展的当下，应用功能日趋复杂，性能瓶颈已成为制约用户体验的关键因素。AI凭借强大的数据分析与智能决策能力，为大前端开发带来了性能优化的新思路。本文将结合小程序、APP和Web等典型开发场景，深入探讨AI在大前端性能优化中的具体应用，并通过丰富的代码示例展示实践过程。一、资源加载优化（一）智能资源预加载在大前端应用中，资源加载速度直接影响页面的启动时间。AI通过分析用户行为数据和
良品超市进销存管理系统设计与实现（开题报告、高质量、毕业设计、毕业论文） AA-老高(接毕设) 计算机专业课程设计人工智能 java spring maven spring boot spring cloud
毕业论文（设计）题目良品超市进销存管理系统设计与实现课题来源□科研R应用□教学□其它成果类别□论文R设计一、课题的研究意义选题的目的良品超市作为一家日益壮大的零售企业，面临着激烈的市场竞争和日益复杂的供应链管理。在当前的商业环境中，如何高效管理商品的进销存，降低运营成本，提高顾客满意度，已成为企业亟需解决的问题。传统的手工记录和简单的电子表格无法满足日常运营中的快速更新和数据分析需求，常常导致库存
ICBDDM2025：大数据与数字化管理前沿峰会鸭鸭鸭进京赶烤学术会议大数据图像处理计算机视觉 AI编程人工智能机器人考研
在选择大学专业时，可以先从自身兴趣、能力和职业规划出发，初步确定几个感兴趣的领域。然后结合外部环境因素，如专业前景、教育资源和就业情况等，对这些专业进行深入的分析和比较。大数据专业：是一个热门且前沿的学科领域，它涉及到数据的收集、存储、处理、分析和应用等多个方面。课程设置基础课程数学基础：高等数学、线性代数、概率论与数理统计等。这些课程为大数据分析提供了必要的数学工具，例如线性代数在机器学习算法中
AI对于普通人的影响抬起右手 AI分享人工智能
‌一、当前影响（2025年）‌‌就业结构剧变‌‌岗位替代‌：制造业、客服、基础数据分析等重复性工作被AI加速替代，初级原画师、文案工作者失业率显著上升（裁员比例达30%）。‌新兴职业‌：AI训练师、数据标注员、伦理审计师等岗位需求激增，全球需转型技能人群超3.75亿。‌技能焦虑‌：47%岗位面临自动化风险，普通人需快速掌握人机协作能力。‌生活便利性提升‌‌智能家居‌：40%家庭实现自动化环境调节（
WIND金融客户端Python接口文档：Python环境下的金融大数据利器邴韵芯
WIND金融客户端Python接口文档：Python环境下的金融大数据利器【下载地址】WIND金融客户端Python接口文档WINDPY是WIND金融客户端为Python开发者提供的强大接口，支持在Python环境中便捷访问WIND金融数据库。它提供了丰富的函数和命令，涵盖历史数据、实时行情、交易操作等多种功能，适用于量化交易、数据分析等场景。无论是获取股票、基金、债券等金融产品的历史序列、分钟数
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
3	0.0	0.0	0.0	0.0
4	0.0	0.0	0.0	0.0
5	0.0	0.0	0.0	0.0

	a	b	c	d	a	b	c	d
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	0	1	2	3	4	5	6	7
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	a	b	c	d	e
0	1.0	1.0	1.0	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN
2	1.0	1.0	1.0	NaN	NaN
2	NaN	NaN	1.0	1.0	1.0
3	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	1.0	1.0	1.0

	a	b	c	c	d	e
0	1.0	1.0	1.0	NaN	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN	NaN
2	1.0	1.0	1.0	1.0	1.0	1.0
3	NaN	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	NaN	1.0	1.0	1.0

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
3	0.0	0.0	0.0	0.0
4	0.0	0.0	0.0	0.0
5	0.0	0.0	0.0	0.0

	a	b	c	d	a	b	c	d
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	0	1	2	3	4	5	6	7
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	a	b	c	d	e
0	1.0	1.0	1.0	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN
2	1.0	1.0	1.0	NaN	NaN
2	NaN	NaN	1.0	1.0	1.0
3	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	1.0	1.0	1.0

	a	b	c	c	d	e
0	1.0	1.0	1.0	NaN	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN	NaN
2	1.0	1.0	1.0	1.0	1.0	1.0
3	NaN	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	NaN	1.0	1.0	1.0

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0

	a	b	c	d
0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0
3	0.0	0.0	0.0	0.0
4	0.0	0.0	0.0	0.0
5	0.0	0.0	0.0	0.0

	a	b	c	d	a	b	c	d
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	0	1	2	3	4	5	6	7
0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
1	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0

	a	b	c	d	e
0	1.0	1.0	1.0	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN
2	1.0	1.0	1.0	NaN	NaN
2	NaN	NaN	1.0	1.0	1.0
3	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	1.0	1.0	1.0

	a	b	c	c	d	e
0	1.0	1.0	1.0	NaN	NaN	NaN
1	1.0	1.0	1.0	NaN	NaN	NaN
2	1.0	1.0	1.0	1.0	1.0	1.0
3	NaN	NaN	NaN	1.0	1.0	1.0
4	NaN	NaN	NaN	1.0	1.0	1.0