Python 数据处理

Python 数据处理_第1张图片
Python 数据处理_第2张图片


Python 数据处理_第3张图片


Python 数据处理_第4张图片


Python 数据处理_第5张图片


Python 数据处理_第6张图片


Python 数据处理_第7张图片

from sklearn.preprocessing import MinMaxScaler# -*- coding: utf-8 -*-

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data1.csv')


Python 数据处理_第8张图片

#Min-Max标准化

scaler = MinMaxScaler()

data['标准化累计票房'] = scaler.fit_transform(data['累计票房'])

data['标准化豆瓣评分'] = scaler.fit_transform(data['豆瓣评分'])


Python 数据处理_第9张图片

#Z-Score标准化

from sklearn.preprocessing import scale

data['标准化累计票房'] = scale(data['累计票房'])

data['标准化豆瓣评分'] = scale(data['豆瓣评分'])

Python 数据处理_第10张图片

#Normalizer归一化

from sklearn.preprocessing import Normalizer

scaler = Normalizer()

data['归一化累计票房'] = scaler.fit_transform(

data['累计票房']

)[0]

data['归一化豆瓣评分'] = scaler.fit_transform(

data['豆瓣评分']

)[0]


Python 数据处理_第11张图片


Python 数据处理_第12张图片

# -*- coding: utf-8 -*-

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data2.csv')


Python 数据处理_第13张图片

data['症状'] = data['症状'].astype('category')

dummiesData = pandas.get_dummies(

data,

columns=['症状'],

prefix=['症状'],

prefix_sep="_"

)


Python 数据处理_第14张图片


Python 数据处理_第15张图片

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data3.csv')


Python 数据处理_第16张图片

from sklearn.preprocessing import Imputer;

#'mean', 'median', 'most_frequent'

imputer = Imputer(strategy='mean')

imputer.fit_transform(data[['累计票房']])

你可能感兴趣的:(Python 数据处理)