_烟雨画桥_

python大数据语言基础期末复习笔记

前言：

复习笔记，主要是对老师ppt和网上的一些资料进行汇总。

一、语言基础：（非重点）

命名规范：变量名、模块名、包名通常采用小写，可使用下划线，通常前缀有一个下划线的变量名为全局变量。例如：rulemodule.py #模块名，即文件名_rule=’rule information’
python使用缩进来组织代码，而不是其他语言比如R、C++、java和Perl那样用大括号。
python语句都不是以分号结尾，而分号也是可以用于在一行内将多条语句进行分隔。
python语言的一个重要特征就是对象模型的一致性。每一个数值、字符串、数据结构、函数、类、模块以及所有存在于python解释器中的事物都是python的对象。每一个对象都会关联到一种数据类型和内部数据。（不需要理解）
检查两个引用是否指向同一个对象可以用 is 关键字。is not 在你检查两个关键字是不是相同对象时也是有效的。
可变对象与不可变对象。Python中的大部分对象，例如列表、字典、Numpy数组都是可变对象，大多数用户定义的类型（类）也是可变的。可变对象中包含的对象和值是可以被修改的。还有其他的对象是不可变的，比如字符串、元组。
数值类型。基础的python数字类型就是int 和 float。int 可以存储任意大小的数字。float表示浮点数，每一个浮点数都是双精度64位数值。
字符串。字符串是Unicode字符的序列，因此可以被看作是一种序列。

数据类型：（重点）

1.列表：

(1)创建列表：

List_a = []

List_a.append(1)

List_a=[]
List_a.append(1)
List_a.append(2)
print(List_a)

#[1,2]

List_a=list((1,2,3,4))

List_a=list((1,2,3,4))
print(List_a)

#[1,2,3,4]

List_a=[I for I in range(4)](列表生成式)

List_a=[I for I in range(4)]
print(List_a)

#[0,1,2,3]

(2)常用方法：

Insert(<下标>,<元素>)：在指定下标的位置上面插入元素
```
List_a=[1,2,4]
List_a.insert(3,2)
print(List_a)


#[1,2,3,4]
```

pop(<下标>):删除指定下标的元素

List_a = [1, 2, 4]
List_a.pop(2)
print(List_a)

#[1,2]

remove(<元素>)：删除一个指定元素，下标小的优先

List_a = [1, 2,3,2, 4]
List_a.remove(2)
print(List_a)

#[1,3,2,4]

count(<元素>)：返回指定列表中元素的数目
```
List_a = [1, 2,3,2, 4]
a=List_a.count(2)
print(a)

#2
```
index(<元素>)：返回指定元素的下标，小的优先
```
List_a = [1, 2,3,2, 4]
a=List_a.index(2)
print(a)

#1
```

copy(): 复制列表（浅拷贝）

List_a = [[1], 2, 3, 2, 4]
List_b = List_a.copy()
print(List_a)#[[1], 2, 3, 2, 4]
print(List_b)#[[1], 2, 3, 2, 4]
List_a[0][0] = 6
print(List_b)#[[6], 2, 3, 2, 4]

sort(, )：reverse=True 正序排序，反正逆序，key排序方式为函数（例如：lambda x:-x)，按照返回值大小排序

List_a = [1, 5, 3, 2, 4]
List_b=List_a.copy()
List_b.sort()
print(List_b)#[1, 2, 3, 4, 5]

List_b=List_a.copy()
List_b.sort(reverse=True)
print(List_b)#[5, 4, 3, 2, 1]

List_b=List_a.copy()
List_b.sort(key=lambda x:-x)
print(List_b)#[5, 4, 3, 2, 1]

reserve()：反转函数

List_a = [1, 5, 3, 2, 4]
List_b=List_a.copy()
List_b.reverse()
print(List_a)#[1, 5, 3, 2, 4]
print(List_b)#[4, 2, 3, 5, 1]

clear()：删除函数

List_a = [1, 5, 3, 2, 4]
List_a.clear()
print(List_a)#[]

(3)切片：

格式List_a[strat:end:step]：start 表示起始索引，end 表示结束索引，step 表示步长。

相当：b = [List_a[((i+len(List_a))% len(List_a))] for i in range(start,end,step)]（列表生成式）

List_a=[‘one’,’twe’,’three’,’four’,’five’]

元素	one	Twe	three	four	Five
正向索引	0	1	2	3	4
反向索引	-5	-4	-3	-2	-1

List_a = ['one', 'twe', 'three', 'four', 'five']
print(List_a[0: 5])#['one', 'twe', 'three', 'four', 'five']
print(List_a[0: 5: 2])#['one', 'three', 'five']
print(List_a[0:-1:1])#['one', 'twe', 'three', 'four']

(4)列表拼接：

List_c=List_a+List_b

List_a = ['one', 'twe', 'three', 'four', 'five']
List_b=[1,2,3,4]
List_c=List_b+List_a
print(List_c)#[1, 2, 3, 4, 'one', 'twe', 'three', 'four', 'five']

List_a.extend(<列表>）

List_a = ['one', 'twe', 'three', 'four', 'five']
List_b = [1, 2, 3, 4]
List_a.extend(List_b)
print(List_a)#['one', 'twe', 'three', 'four', 'five', 1, 2, 3, 4]

2.内置函数

len()：返回列表长度

List_a = ['one', 'twe', 'three', 'four', 'five']
print(len(List_a))#5

type()：返回数据类型

List_a = ['one', 'twe', 'three', 'four', 'five']
print(type(List_a))#

3.元组：

(1)建立元组：

Tup_a=1,2,3,4
```
Tup_a=1,2,3,4
print(Tup_a)#(1,2,3,4)
```
Tup_a=(1,2,3,4)
```
Tup_a=(1,2,3,4)
print(Tup_a)#(1,2,3,4)
```

Tup_a=tuple(List_a)

List_a=[1,2,3,4]
Tup_a=tuple(List_a)
print(Tup_a)#(1,2,3,4)

Tup_a=tuple(String_a)

String_a = "1234"
Tup_a = tuple(String_a)
print(Tup_a)  # ('1','2','3','4')

(2)元组拼接

Tup_c=Tup_a+Tup_b
Tup_b=Tup_a*4

4.字典：

(1)建立字典：

Dict_a={‘a’:”adn”,4:5}

Dict_a={'a':"adn",4:5}
print(Dict_a)#{'a': 'adn', 4: 5}

(2)添加元素：

Dict_a[6]=90

Dict_a={'a':"adn",4:5}
Dict_a[6]=90
print(Dict_a)#{'a': 'adn', 4: 5,6:90}

(3)常见方法：

len()	测量字典中键值对个数
keys()	返回字典中所有的key
values()	返回包含value的列表
items()	返回包含(键值,实值)元组的列表
in \ not in	判断key是否存在字典中
popitem()	从字典中删除最后一个键值对
pop()	删除拥有指定键的元素
get()	查找拥有指定键的元素，如果当前查找的key不存在则返回第⼆个参数(默认值)，如果省略第⼆个参数，则返回 None。

(4)遍历：

value:

for i in dict_a.values():

keys:

for i in dict_a.keys():

所有项：

for i in dict_a.items():

Dict_a = {'a': "adn", 4: 5}
Dict_a[6] = 90
for i in Dict_a.values():
    print(i,end=' ')#adn 5 90 
print()
for i in Dict_a.keys():
    print(i,end=' ')#a 4 6 
print()
for i,j in Dict_a.items():
    print(f"{i}:{j}",end=' ')#a:adn 4:5 6:90

5.函数（重点）：

(1)创建函数：

Python 中使用def语句创建函数，其一般的格式如下所示：

def <函数名>(<参数1>,<参数2>,<参数3>……):

       <函数主体>

       return <返回值>

例子：

def myfuns(a,b):

       c=a**b

       return c

(2)调用函数

myfuns(2,2)

在 Python 中，还允许在函数中返回多个值。只需将返回值以逗号隔开，放在return关键字后面即可。例子：

def myfuns(a,b):

       return a-b,a+b,a/b,a**b

a,b,c,d=myfuns(2,3)

print(a,b,c,d)

#-1,5,0,8

(3)参数传递：

实参与形参按照从左到右的位置顺序依次赋值。

def f(x,a,b,c):

   return a*x**2+b*x+c

print (f(2,1,2,3))

为了避免位置参数赋值带来的混乱，Python 允许调用函数时通过关键字参数的形式指定形参与实参的对应关系。调用者使用name=value的形式来指定函数中的哪个形参接受某个值：

def fun(name,age,score):

    print("姓名:{0},年龄:{1},分数:{2}".format(name,age,score))

fun("Tom",20,100)

fun(name="Tom",score=100,age=20)

在定义函数时，为形参指定默认值，就可以让该形参在调用时变为可选

单个星号将一组可变数量的位置参数组合成参数值的元组。在函数内部可以通过访问元组中的每个元素来使用参数。

def variablefun(name,*args):

    print("位置参数：",name)

    print("可变参数：",args)

   

variablefun("Python","简洁","优雅","面向对象")

针对形参的关键字参数赋值形式，利用 Python 定义函数时，在形参前面加上双星号**来定义收集关键字参数的形参。此时形参是字典类型。

def fun(**args):

    print(args)

fun(a=1,b=2)

fun(1,2)#(错误)

在调用函数时，实参也可以使用*和**语法。此时不是收集参数，正好相反，实参前加上*或**执行的是参数解包。通常来说，在列表、元组等类型的实参值前加上*，将这些类型的元素解包成位置参数的形式；在字典类型的实参值前加上**，将字典的元组解包成关键字参数的形式。

当调用者的数据存储在列表中时，可以通过在列表前加上*对列表解包来实现位置参数形式的调用。

def myfun(a,b,c,d):

    print(a,b,c,d)

mylist = [10,20,30,40]

myfun(*mylist)

当调用者的数据存储在字典中时，可以通过在字典前加上**对字典解包来实现关键字参数形式的调用。

def fun(name,age,sex):

    print("姓名：",name)

    print("年龄：",sex)

    print("性别：",age)

mydict = {'name':'Tom','age':20,'sex':'男'}

fun(**mydict)

6.类

(1)定义类：

class ClassName：

    “”“类的帮助信息”“”     # 类文本字符串
    
    statement            # 类体

ClassName：用于指定类名，一般使用大写字母开头。

“类的帮助信息”：用于指定类的文档字符串。

statement：类体，主要由类变量（或类成员）、方法和属性等定义语句组成。

(2)创建类的对象：

class语句本身并不创建该类的对象。所以在类定义完成以后，可以通过以下方法实例化该类的对象：

MyOr= ClassName()

(3)初始化：

在创建类后，类通常会自动创建一个__init__()方法,类似C++中的构造方法。每当创建一个类的新实例时，Python都会自动执行它。__init__()方法必须包含一个参数self，并且必须是第一参数。（self参数是一个指向实例本身的引用，用于访问类中的属性和方法。）

class Animal:

    def __init__(self):

        print("我是动物类")



wild = Animal()

(4)成员：

def <函数名>(self,<参数1>,<参数2>,<参数3>……):

       <函数主体>

       return <返回值>

方法：

模板如下：

使用：

class Animal:

    def __init__(self):
        
        print("我是动物类")
    
    def Eat(self):
        
        print(“进食中”)



Wild=Animal()

Wild.Eat()

self为必备参数

变量：

例子：

class Animal:

       eatsound=”进食中”

       def __init__(self):

               print("我是动物类")

       def Eat(self):

              print(“进食中”)



Wild=Animal()

print(Wild.eatsound)

(5)访问限制：

在Python中，以下划线开头的变量名和方法名有特殊的含义，尤其是在类的定义中。

_xxx：受保护成员，不能用'from module import *'导入；

__xxx__：系统定义的特殊成员；

__xxx：私有成员，只有类对象自己能访问，子类对象不能直接访问到这个成员，但在对象外部可以通过“对象名._类名__xxx”这样的特殊方式来访问。

注意：Python中不存在严格意义上的私有成员。

二．Numpy使用（重点）

1.建立数组的方法：

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

序号	参数及描述
1.	object 任何暴露数组接口方法的对象都会返回一个数组或任何（嵌套）序列。
2.	dtype 数组的所需数据类型，可选。
3.	copy 可选，默认为true，对象是否被复制。
4.	order C（按行）、F（按列）或A（任意，默认）。
5.	subok 默认情况下，返回的数组被强制为基类数组。如果为true，则返回子类。
6.	ndmin 指定返回数组的最小维数。

numpy.zeros(shape, dtype = float, order = 'C')(全为0的数组)

b = np.zeros((2,3))
print(b)

#[[0. 0. 0.]
# [0. 0. 0.]]

numpy.empty(shape, dtype = float, order = 'C')(空数组)

import numpy as np
b = np.empty((2,3))
print(b)
#[[1.e-323 0.e+000 0.e+000]
# [0.e+000 0.e+000 0.e+000]]

numpy.ones(shape, dtype = None, order = 'C')(全为1的数组)

import numpy as np
b = np.ones((2,3))
print(b)

#[[1. 1. 1.]
# [1. 1. 1.]]

shape 空数组的形状，整数或整数元组
dtype 所需的输出数组类型，可选
order 'C'为按行的 C 风格数组，'F'为按列的 Fortran 风格数组

numpy.asarray(a, dtype = None, order = None)(将Python序列转换为ndarray)

a为任意形式的Python序列

import numpy as np
a=[[1,2],[3,4]]
b = np.asarray(a)
print(b)

#[[1 2]
# [3 4]]

linspace(start,stop,num）（等差数列）

start：开始下标
end：结束下标

num：数列数目

import numpy as np
b = np.linspace(1,5,9)
print(b)#[1.  1.5 2.  2.5 3.  3.5 4.  4.5 5. ]

arange(start,stop,step,dtype）（和range函数用法基本一致)

import numpy as np
b = np.arange(1,10,2)
print(b)#[1 3 5 7 9]

2.数据类型

1.	bool_ 存储为一个字节的布尔值（真或假）
2.	int_ 默认整数，相当于 C 的long，通常为int32或int64
3.	intc 相当于 C 的int，通常为int32或int64
4.	intp 用于索引的整数，相当于 C 的size_t，通常为int32或int64
5.	int8 字节（-128 ~ 127）
6.	int16 16 位整数（-32768 ~ 32767）
7.	int32 32 位整数（-2147483648 ~ 2147483647）
8.	int64 64 位整数（-9223372036854775808 ~ 9223372036854775807）
9.	uint8 8 位无符号整数（0 ~ 255）
10.	uint16 16 位无符号整数（0 ~ 65535）
11.	uint32 32 位无符号整数（0 ~ 4294967295）
12.	uint64 64 位无符号整数（0 ~ 18446744073709551615）
13.	float_ float64的简写
14.	float16 半精度浮点：符号位，5 位指数，10 位尾数
15.	float32 单精度浮点：符号位，8 位指数，23 位尾数
16.	float64 双精度浮点：符号位，11 位指数，52 位尾数
17.	complex_ complex128的简写
18.	complex64 复数，由两个 32 位浮点表示（实部和虚部）
19.	complex128 复数，由两个 64 位浮点表示（实部和虚部）

3.属性

shape：返回数组大小，可通过直接改变shape属性调整数组大小。
ndim：返回数组维度。
itemsize：返回数组单个元素长度。

flags：返回该数组的其他属性。

import numpy as np
a=np.array([[1,2],[3,4]])

print(a.ndim)#2
print(a.shape)#(2, 2)
print(a.itemsize)#4

print(a.flags)

#  C_CONTIGUOUS : True
#  F_CONTIGUOUS : False
#  OWNDATA : True
#  WRITEABLE : True
#  ALIGNED : True
#  WRITEBACKIFCOPY : False

4.常用方法

numpy.reshape(arr, newshape, order)(修改形状)

arr：要修改形状的数组
newshape：整数或者整数数组，新的形状应当兼容原有形状
```
a=np.array([[1,2],[3,4]])
b=np.reshape(a,(4))
print(b)#[1 2 3 4]
```

numpy.ndarray.T(数组转置)

import numpy as np
a=np.array([[1,2],[3,4]])
b=a.T
print(b)
#[[1 3]
# [2 4]]

numpy.concatenate((arr1, arr2, ...), axis)

arr1, arr2, ...：相同类型的数组序列

axis：沿着它连接数组的轴，默认为 0

import numpy as np
a=np.array([[1,2],[3,4]])
b=np.array([[5,6],[7,8]])
print(np.concatenate([a,b]))
#[[1 2]
# [3 4]
# [5 6]
# [7 8]]

print(np.concatenate([a,b],axis=1))
#[[1 2 5 6]
# [3 4 7 8]]

numpy.split(ary, indices_or_sections, axis)( 沿特定的轴将数组分割为子数组)

ary：被分割的输入数组
indices_or_sections：可以是整数，表明要从输入数组创建的，等大小的子数组的数量。如果此参数是一维数组，则其元素表明要创建新子数组的点。

axis：默认为 0

import numpy as np
a=np.array([[1,2],[3,4],[5,6],[7,8]])
b,c=np.split(a,2)
print(b)
#[[1 2]
# [3 4]]

print(c)
#[[5 6]
# [7 8]]
b,c=np.split(a,[1])
print(b)
#[[1 2]]

print(c)
#[[3 4]
# [5 6]
# [7 8]]
b,c=np.split(a,2,axis=1)
print(b)
#[[1]
# [3]
# [5]
# [7]]

print(c)
#[[2]
# [4]
# [6]
# [8]]

numpy.resize(arr, shape)

返回指定大小的新数组。如果新大小大于原始大小，则包含原始数组中的元素的重复副本。与reshape类似。

import numpy as np
a=np.array([[1,2],[3,4],[5,6],[7,8]])
b=np.resize(a,5)
print(b)#[1 2 3 4 5]
b=np.resize(a,10)
print(b)#[1 2 3 4 5 6 7 8 1 2]

numpy.insert(arr, obj, values, axis)

arr：输入数组

obj：在其之前插入值的索引

values：要插入的值

axis：沿着它插入的轴，如果未提供，则输入数组会被展开

import numpy as np
a=np.array([[1,2],[3,4],[5,6],[7,8]])
b=np.insert(a,0,19)
print(b)#[19  1  2  3  4  5  6  7  8]

b=np.insert(a,0,10,axis=0)
print(b)
#[[10 10]
# [ 1  2]
# [ 3  4]
# [ 5  6]
# [ 7  8]]

b=np.insert(a,0,10,axis=1)
print(b)
#[[10  1  2]
# [10  3  4]
# [10  5  6]
# [10  7  8]]

numpy.unique(arr)数组去重

import numpy as np
a=np.array([[1,2],[3,4],[3,2],[7,8]])
b=np.unique(a)
print(b)
#[1 2 3 4 7 8]

三、Pandas使用

1.DataFrame构造

DataFrame(data , index , columns , dtype , copy )

data:数据

index:行标题

columns:列标题

dtype:类型

copy:是否深拷贝

如果data类型为字典，可省略列标题

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
print(a)

   one  twe  three  four
a    1    2      3     4
b    5    6      7     8

2.文件读取

read_csv(filepath_or_buffer, delimiter, header, engine, encoding)

filepath_or_buffer ：文件路径,

delimiter :分隔符

header : 是否第一行为列标题,

engine : 引擎

encoding : 编码

read_excel(filepath_or_buffer, header, names)

filepath_or_buffer:路径

header : 指定哪一行为标题

names : 指定列标题

3.常用函数

head(num=5)#查看前几行数据

tail(num=5)#查看后几行数据

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
print(a.head(1))
   one  twe  three  four
a    1    2      3     4

print(a.tail(1))
   one  twe  three  four
b    5    6      7     8

info()#查看数据信息

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
print(a.info)

describe()#查看数据统计信息

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
print(a.describe())

            one       twe     three      four
count  2.000000  2.000000  2.000000  2.000000
mean   3.000000  4.000000  5.000000  6.000000
std    2.828427  2.828427  2.828427  2.828427
min    1.000000  2.000000  3.000000  4.000000
25%    2.000000  3.000000  4.000000  5.000000
50%    3.000000  4.000000  5.000000  6.000000
75%    4.000000  5.000000  6.000000  7.000000
max    5.000000  6.000000  7.000000  8.000000

pandas.merge(left = dataFrame1,right = dataFrame2,left_index = True, right_index = True, how = 'inner') 用于合并两个 DataFrame 对象或 Series对象。只能用于两个表的拼接（左右拼接，不能用于上下拼接。

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
b=pd.DataFrame([[11,12,13,14],[15,16,17,18]],index=['a','b'],columns=['one1','twe1','three1','four1'])
print(pd.merge(left=a,right=b,left_index=True,right_index=True,how = 'inner'))

   one  twe  three  four  one1  twe1  three1  four1
a    1    2      3     4    11    12      13     14
b    5    6      7     8    15    16      17     18

drop(key, axis = 1, inplace = False)(删除列或者行)

(使用, axis = 0表示对行操作, axis = 1表示针对列的操作, inplace为True, 则直接在源数据上进行修改, 否则源数据会保持原样)

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
print(a.drop('one',axis=1))

   twe  three  four
a    2      3     4
b    6      7     8

DataFrame.loc[‘name’]=[](增加行)

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
a.loc['c']=[1,2,3,4]
print(a)

   one  twe  three  four
a    1    2      3     4
b    5    6      7     8
c    1    2      3     4

DataFrame[‘name’]=[](增加列)

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
a['five']=[1,2]
print(a)

   one  twe  three  four  five
a    1    2      3     4     1
b    5    6      7     8     2

df.insert(loc, column, value, allow_duplicates=False)(增加列)

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
a.insert(loc=0,column='five',value=2)
print(a)

   five  one  twe  three  four
a     2    1    2      3     4
b     2    5    6      7     8

concat(dataFrame列表)( 将这些dataFrame的数据纵向叠加)

import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,8]],index=['a','b'],columns=['one','twe','three','four'])
b=pd.DataFrame([[11,12,13,14],[15,16,17,18]],index=['a','b'],columns=['one','twe','three','five'])
c=pd.concat([a,b])
print(c)

   one  twe  three  four  five
a    1    2      3   4.0   NaN
b    5    6      7   8.0   NaN
a   11   12     13   NaN  14.0
b   15   16     17   NaN  18.0

dropna() (只要一行中任意一个字段为空，就会被删除)

import numpy as np
import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,np.nan]],index=['a','b'],columns=['one','twe','three','four'])
print(a)
a=a.dropna()
print(a)

   one  twe  three  four
a    1    2      3   4.0
b    5    6      7   NaN
   one  twe  three  four
a    1    2      3   4.0

isnull()(返回布尔DataFrame对象)

import numpy as np
import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,np.nan]],index=['a','b'],columns=['one','twe','three','four'])
print(a)
a=a.isnull()
print(a)

fillna(值)( 用值填充空值)

import numpy as np
import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,np.nan]],index=['a','b'],columns=['one','twe','three','four'])
print(a)
a=a.fillna(109)
print(a)

   one  twe  three  four
a    1    2      3   4.0
b    5    6      7   NaN
   one  twe  three   four
a    1    2      3    4.0
b    5    6      7  109.0

drop_duplicates( keep = 'first' 或 'last')( 删除完全重复行, 可指定某字段重复时删除, 默认保留第一个, 后面重复的会删掉)

import numpy as np
import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,np.nan]],index=['a','b'],columns=['one','twe','three','four'])
a=pd.concat([a,a])
print(a)
a=a.drop_duplicates()
print(a)

   one  twe  three  four
a    1    2      3   4.0
b    5    6      7   NaN
a    1    2      3   4.0
b    5    6      7   NaN
   one  twe  three  four
a    1    2      3   4.0
b    5    6      7   NaN

sort_values(by = 列名, ascending = 是否升序)( 对指定列排序)

import numpy as np
import pandas as pd
a=pd.DataFrame([[1,2,3,4],[5,6,7,np.nan]],index=['a','b'],columns=['one','twe','three','four'])
a=pd.concat([a,a])
print(a)
a=a.sort_values('one')
print(a)

   one  twe  three  four
a    1    2      3   4.0
b    5    6      7   NaN
a    1    2      3   4.0
b    5    6      7   NaN
   one  twe  three  four
a    1    2      3   4.0
a    1    2      3   4.0
b    5    6      7   NaN
b    5    6      7   NaN

sort_index(ascending=False,ignore_index=True)(可以将DataFrame按照索引的大小顺序重新排列)

groupby('列名')( 对指定列分组, 就是把该列值一样的分成一组)

cut(x = 切分数据, bins = 切分方式, right = 是否包含右区间, labels = 分割后每段的名字列表)( 对一个数组进行分段)

set_index(keys,drop=True)keys:列索引名称或者列索引名称的列表drop:默认为True，当作新的索引，删除原来索引(重新设置索引)

data[列索引].value_count()(统计每种数据的个数)

isin(值)(条件筛选)

4.索引

dataFrame.iloc[行下标, 列下标]

dataFrame.iloc[行下标数组, 列下标数组]

dataFrame.iloc[行布尔列表, 列布尔列表]

data.loc[行标签,列标签]

四、matplotlib使用(非重点)

1.折线图

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
fig = plt.figure()
ax = plt.axes()

x = np.linspace(0, 10, 1000)
plt.plot(x, np.sin(x))
plt.plot(x, np.cos(x))

plt.show()

2.散点图

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
x = np.linspace(0, 10, 30)
y = np.sin(x)

plt.plot(x, y, 'o', color='black')


plt.show()

3.条形图

import matplotlib.pyplot as plt
GDP = [12406.8,13908.57,9386.87,9143.64]
plt.rcParams['font.sans-serif'] =['Microsoft YaHei']#显示中文

plt.rcParams['axes.unicode_minus'] = False
plt.bar(range(4), GDP, align = 'center',color='steelblue', alpha = 0.8)
plt.ylabel('GDP')
plt.title('四个直辖市GDP大比拼')
plt.xticks(range(4),['北京市','上海市','天津市','重庆市'])
plt.ylim([5000,15000])
for x,y in enumerate(GDP):
    plt.text(x,y+100,'%s' %round(y,1),ha='center')
plt.show()

4.直方图

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
x1 = np.random.normal(0, 0.8, 1000)
x2 = np.random.normal(-2, 1, 1000)
x3 = np.random.normal(3, 2, 1000)

kwargs = dict(histtype='stepfilled', alpha=0.3, density=True, bins=40)

plt.hist(x1, **kwargs)
plt.hist(x2, **kwargs)
plt.hist(x3, **kwargs)
plt.show()

你可能感兴趣的:(笔记)

Django笔记11：路由配置详解向东的笔记本 Django笔记 Django学习笔记路由 django urls
配置网站的URL可以说是我们用Django进行网站开发的第一步，Django的路由设置也由原来的1.0版本的正则表达式配置变成了现在2.0版本的路径配置方式，我个人是很喜欢路径配置的方式的，因为这种方式看起来很简洁。接下来我就对路径、正则表达式这两种方式的配置规则做一下整理。1.路径配置首先需要在项目或者APP的urls.py中导入path和views，需要注意的是仅仅在APP下定义URL规则是不
PAT 甲级 1039 金秋飞雪算法 c++数据结构 pat考试
不知道为啥书上（算法笔记）说的是不能用map会超时但是我的没有。。。注意只能用cin>>s;方式读入字符串（？）反正不能用scanf（“%s”,s）;QAQiter->first指向键值(在这里就是string)iter->second指向数值(在这里就是vector)使用for(autoj:m[name])遍历的时候大括号内的j不用加*（与另外一种方式区分一下）#include#include#
网络安全-蓝队基础 One_Blanks 网络安全网络 HW 蓝队安全
声明学习视频来自B站UP主泷羽sec，如涉及侵权马上删除文章。笔记的只是方便各位师傅学习知识，以下网站只涉及学习内容，其他的都与本人无关，切莫逾越法律红线，否则后果自负。✍作者简介：致力于网络安全领域，目前作为一名学习者，很荣幸成为一名分享者，最终目标是成为一名开拓者，很有趣也十分有意义‍♂️个人主页：@One_Blanks欢迎评论点赞收藏加关注+X：NOSYSTEMISSAFE文章目录蓝队基础企
计算机网络笔记、面试八股（三）—— HTTPS协议 Your_Raymond 计算机网络 https 计算机网络 ssl
本章目录3.HTTPS协议3.1HTTPS协议简介3.2SSL/TLS协议3.2.1SSL/TLS功能的实现3.3HTTP和HTTPS的区别3.4HTTPS协议的优点3.5HTTPS协议的缺点3.6HTTPS协议的工作流程3.7HTTPS是如何解决HTTP的缺点的3.7.1解决内容可能被窃听的问题——加密3.7.1.1方法1.对称加密3.7.1.2方法2.非对称加密3.7.1.3方法3.对称加密+
基于Flask的抖音用户浏览行为分析系统的设计与实现码界筑梦坊 python项目 flask python 后端毕业设计
【FLask】基于Flask的抖音用户浏览行为分析系统的设计与实现（完整系统源码+开发笔记+详细部署教程）✅目录一、项目简介二、项目界面展示三、项目视频展示一、项目简介随着移动互联网的迅猛发展，短视频平台如抖音已成为人们日常生活中不可或缺的一部分，其庞大的用户群体和丰富的用户行为数据为深入研究用户行为提供了宝贵的资源。通过对抖音用户浏览行为的分析，企业可以更好地理解用户需求，优化内容推荐算法，提升
嵌入式秋招八股文笔记——C基础 I_LOVE_STM32 c语言 c++数据结构
C语言基础：1.Main函数的参数传递：Main函数的参数intargc，char*argv[]，在很多Linux初学者阅读代码时都不知道是什么意思，其中intargc表示程序运行时命令行指令的个数，char*argv[]则存放指向各个参数的指针。例如：intmain(intargc,char**argv){for(inti=0;i
Vue项目搭建 yxmanyxman vue vue-cli 脚手架 npm webpack
好吧，很久没碰过这个blog。有什么笔记我都是记在现实的笔记本上面，无奈有时候记得乱，找不到，这边markdown。最近在做Vue项目，搭建环境避免不了。一开始学习的时候，还是先学webpack的基本知识，一步一步配置入口文件等等。后面当然就嫌麻烦了，尤大大的vue-cli打遍天下无敌手。命令vueinitwebpack有两种版本，一个simple版vueinitwebpack-simple，si
Kotlin 开发Android笔记之Kotlin开发篇笑忘书客 Android Kotlin Kotlin开发 Kotlin语言开发 Android
Kotlin开发Android笔记之Kotlin开发篇省略findViewById()方法正常写法：valbtn=findViewById(R.id.btn)btn.setOnClickListener{Toast.makeText(this,"提示",Toast.LENGTH_SHORT).s}但Kotlin项目在创建的时候引用了插件applyplugin:‘kotlin-android-ext
【Excel笔记_5】 LET 函数中数据范围不连续的处理方法科熊小猪 Office excel 笔记
在LET函数中，如果数据范围是不连续的（比如DK4:DK176和DK188:DK242），直接使用ABS计算偏差会导致错误，因为Excel不支持对多个不连续区域执行数学运算。正确的方法可以使用VSTACK（Excel365/2021支持）或CHOOSE（适用于更早的Excel版本）将不连续区域合并，然后进行计算。方法1：使用VSTACK（Excel365/2021）=LET(data,VSTACK
Go 学习笔记（61）— Go 高阶函数、函数作为一等公民（函数作为输入参数、返回值、变量）的写法 wohu007 Go golang 函数作为变量
函数在Go语言中属于“一等公民（First-ClassCitizen）”拥有“一等公民”待遇的语法元素可以如下使用可以存储在变量中；可以作为参数传递给函数；可以在函数内部创建并可以作为返回值从函数返回；1.函数可以存储在变量中var(myFprintf=func(wio.Writer,formatstring,a...interface
Mongodb学习笔记 --- python读取mongodb数据杨鑫newlfe Python 数据库大数据挖掘与大数据应用案例
#-*-coding:utf-8-*-importpymongo__author__='yangxin'classMongodbConn(object):
MongoDB学习笔记-解析jsonCommand内容人生偌只如初见 MongoDB mongodb 笔记 java
如果需要屏蔽其他项目对MongoDB的直接访问操作，统一由一个入口访问操作MongoDB，可以考虑直接传入jsonCommand语句解析执行。相关依赖包org.springframework.bootspring-boot-starter-data-mongodb2.4.2部分代码@ResourceprotectedMongoPropertiesmongoProperties;publicList
OpenMV学习笔记----sensor、image 没有名字的鬼学习笔记 python 计算机视觉图像处理人工智能 Openmv
目录一、感光元件----sensorsensor.reset()sensor.set_pixformat()sensor.set_framesize()sensor.skip_frames(n=10)sensor.snapshot()sensor.set_auto_gain()sensor.set_auto_whitebal()sensor.set_auto_exposure(enable[\,e
React学习笔记 26:28 React react.js 学习笔记
1、React初步认识React构建Web和原生交互界面的库，相较于其它前端框架的优势，具有丰富的生态跨平台支持。1.1、React的开发依赖开发React必须依赖三个库：react：包含react所必须的核心代码；react-dom：react渲染在不同平台所需要的核心代码；babel：将jsx转换成React代码的工具；1.2、VSCode代码片段我们在前面练习React的过程中，有些代码片段
intra-mart实现简易登录页面笔记追逐梦想永不停笔记
一、前言最近在学习intra-mart框架，在此总结下笔记。intra-mart是一个前后端不分离的框架，开发时主要用的就是xml、html、js这几个文件；xml文件当做配置文件，html当做前端页面文件，js当做后端文件（js里能连接数据库）；所以js文件需要注意，因为算后端文件，其中的语法与前端开发的js有些不太相同（日志打印不能用console.log）。二、代码部分1.路由文件WEB-I
每日一题———37.堆排序而塞过每日一题堆数据结构大根堆小根堆建堆算法时间复杂度
前言数据结构每日一题声明：因个人能力有限，本文仅是个人的学习记录笔记，有错误之处还望指出概念堆:n个关键序列L[1,2…n],满足下面一条性质称为堆大根堆：满足L(i)>=L(2i)且L（i）>=L(2i+1)小根堆：满足L(i)=左右与顺序无关，小根堆也一样：只要满足：根左右子树端点）不满足则进行调整,将更小的元素下坠，一直到满足要求//建立大根堆voidBuildMaxHeap(inta[],
台式电脑投影切屏快捷键_电脑投影切屏快捷键隔壁王医生台式电脑投影切屏快捷键
电脑投影切屏快捷键电脑投影到投影仪有两种方式，一种是传统的有线方式，一种是当下比较流行的无线投屏方式。有线投影连接1、用一根HDMI或者VGA线，将笔记本与投影仪对接。2、投影仪设置—投影仪上选择信号源为高清信号(VGA)—确认—投影仪出现无信号。3、笔记本设置—按住FN+投影仪图标组合(不同牌子的笔记本键位不一样，但是都有投影仪图标的)—选择复制—OK，投影成功了。电脑投影切屏快捷键IBM笔记本
Java_类加载器学编程的小程 Java java 开发语言类加载器
小程一言类加载器的基础双亲委派模型核心思想优势各类加载器的职责类加载器的工作流程举例：如何在Java中使用类加载器启动类加载器、扩展类加载器与系统类加载器输出解释自定义类加载器类加载器与类冲突总结小程一言本专栏是对Java知识点的总结。在学习Java的过程中，学习的笔记，加入自己的思考，结合各种资料的整理。文章与程序一样，一定都是不完美的，因为不完美，才拥有不断追求完美的动力类加载器的基础首先要明
【书生·浦语大模型实战营】学习笔记（一）：全链路开源体系介绍 GoAI 深入浅出LLM 深入浅出AI 大模型书生人工智能 LLM llama
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接【书生·浦语大模
Effective Modern C++ 条款3：理解decltype 举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item3:Understanddecltypedecltype是一个奇怪的东西。给它一个名字或者表达式decltype就会告诉你这个名字或者表达式的类型。通常，它会精确的告诉你你想要的结果。但有时候它得出的结果也会让你挠头半天，最后只能求助网上问答或参考资料寻求启示。我们将从一个简单的情况开始，没有任何令人惊讶的情况。相比模板类型推导和auto类
面试官：Node文件查找的优先级与Require方法的文件查找策略 linwu-hi 前端面试 anti-design-vue 状态模式 node nodejs
大厂学习资料这是我整理的学习资料，非常系统和完善，欢迎一起学习现代JavaScript高级小册深入浅出Dart现代TypeScript高级小册linwu的算法笔记面试官：Node文件查找的优先级与Require方法的文件查找策略在Node.js中，模块化是一个重要的特性，它允许我们将代码组织成独立的、可重用的模块。模块之间的导入和导出通过exports、module.exports和require
Python Pandas | 数据分析编程练习100例笔记 yatingliu2019 python 数据分析开发语言
#课程视频网站：PythonPandas数据分析，编程练习100例_哔哩哔哩_bilibili#目前更新到视频69正在自学pythonpandas。附上自己的学习笔记(如下)B站PythonPandas数据分析，编程练习100例https://download.csdn.net/download/qq_51870267/82336064
Vue演练场基础知识（七）插槽暗暗那 vue.js javascript 前端
为学习Vue基础知识，我动手操作通关了Vue演练场，该演练场教程的目标是快速体验使用Vue是什么感受，设置偏好时我选的是选项式+单文件组件。以下是我结合深入指南写的总结笔记，希望对Vue初学者有所帮助。文章目录十五.插槽插槽内容与出口渲染作用域默认内容具名插槽条件插槽动态插槽名作用域插槽具名作用域插槽高级列表组件示例无渲染组件十五.插槽插槽内容与出口父组件可以用props向子组件传递js表达式，e
免费搭建个人博客——hexo搭建教程暗暗那 github node.js bash 经验分享笔记
最近在学习一些算法课程，学习的过程中写了一些笔记，想找个地方放一下。之前看到过一些大佬创建了样式丰富、干货满满的个人博客，感到非常羡慕，于是也萌生了我也搭建一个个人博客的念头。一番搜索后，在知乎上找到了一个hexo个人博客建立教程，非常详细地介绍了如何从0到1搭建hexo博客，就动手跟着这位博主的教程做了。做的过程中踩了一些坑，也阅读了网上其他博主写的hexo教程，花了5、6天总算是搭建起来了。在
前端如何防止数据被异常篡改并且复原数据
每天，我们都在和各种文档打交道，PRD、技术方案、个人笔记等等等。其实文档排版有很多学问，就像我，对排版有强迫症，见不得英文与中文之间不加空格。所以，最近在做这么一个谷歌扩展插件chrome-extension-text-formatting，通过谷歌扩展，快速将选中文本，格式化为符合中文文案排版指北的文本。emmm，什么是排版指南？简单来说它的目的在于统一中文文案、排版的相关用法，降低团队成员之
坐标变换学习笔记—代码篇Matlab sunqin_csdn SLAM
坐标变换学习笔记—代码篇Matlab四元数→\to→旋转矩阵quat2dcmquat2rotm四元数→\to→欧拉角quat2anglequat2eul旋转矩阵→\to→四元数dcm2quatrotm2quat旋转矩阵→\to→欧拉角dcm2angle欧拉角→\to→旋转矩阵angle2dcmeul2rotm欧拉角→\to→四元数angle2quateul2quat小结&代码验证参考在Matlab
Java基础学习笔记-强制类型转换蝴蝶不愿意 Java基础学习笔记学习笔记
###数据类型转化不同基本数据类型之间进行运算时需要进行类型转换。除布尔类型外，所有基本数据类型进行运算时都要考虑类型转换，主要应用在算术运算时和赋值运算时。（1）算术运算时存储位数越多，类型的级别越高。不同类型的操作数，首先自动转换为表达式中最高级别的数据类型然后进行运算，运算的结果是最高级别的数据类型，简称低级别自动转换为高级别。![[类型转换.png]]（2）赋值运算转换方式有自动类型转换和
React：TypeScript + react-redux + redux toolkit SEKIRO_DJ TypeScript react redux react.js 前端 typescript
目录报错reduxtoolkit简易使用笔记报错最初我也只是使用redux+react-redux+redux-thunk，但最近使用创建项目，使用dispatch出现了报错TS2345:Argumentoftype'RootThunkAction'isnotassignabletoparameteroftype'AnyAction'.Property'type'ismissingintype'R
Vue3学习笔记-计算属性-6 YuLiu12321 学习笔记 vue.js
在模板中代替表达式，使得代码简便，同时含有计算缓存。使用computed类。加1{{CountData}}exportdefault{data(){return{count:0,}},methods:{addCount:function(e){console.log(e);this.count++;}},computed:{CountData(){if(this.count>3){return"已
Vue学习笔记--＞＞基础篇丑小鸭变黑天鹅笔记 vue
Vue学习笔记一、Vue核心1、Vue的基本认识1、官网2、介绍3、特点4、与其它前端JS框架的关联5、vue扩展插件2、Vue的基本使用3、理解Vue的MVVM4、模板语法5、计算属性基本使用6、强制绑定class和style7、条件渲染8、列表渲染维护状态数组更新检测9、列表的搜索与排序10、事件处理11、表单数据的自动收集12、Vue生命周期13、过渡和动画1、css过渡2、css动画3、自
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，