Nicole_Liang

python 数据结构（Data Structure）

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

一、Data Structure

1.List

列表是Python自带的数据结构，是一个按照定顺序存储对象的数据结构。通常通过索引访问列表，索引从0开始。

(1)修改列表:给列表赋值

x = [1,1,1]

x[1] = 2 #使用索引法给特定位置的元素赋值

x

[1, 2, 1]

len(x)

3

x[100] = 2    #注意：不能给不存在的元素赋值，如果列表的长度为2，就不能给索引为100的元素赋值

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
 in ()
----> 1 x[100] = 2

IndexError: list assignment index out of range

x = [None]*101

x[100] = 2

len(x) #将x的长度初始化为101

101

（2）删除元素

sample_list = [1, 2, 3]

del sample_list[2]  #删除列表中的元素

sample_list

[1, 2]

（3）切片

除开可以使用索引来访问单个元素外，还可以使用切片来访问特定范围内的元素，切片用于提取序列的元素，第一个索引是包含在切片内，但第二个索引是切片后余下的第一个元素的编号

sample_list[0: 2] # 取第一个到第二个元素

[1, 2]

sample_list[1: ] # 取第二个到最后一个元素

[2, 3]

sample_list[: 2] # 取第一个到第二个元素，序列起始于开头，可以省略前面的索引

[1, 2]

sample_list[-2] #提取列表中倒数第二个元素

2

sample_list[-3:-1]  #从倒数第三个到倒数第一个元素，不包括最后一个元素

[1, 2]

sample_list[-3:0]  #执行切片操作时，如果第一索引指定的元素位于第二个索引指定的元素的后面（倒数第3个元素位于第一个元素的后面），结果就为空序列。

[]

sample_list[-2:] #如果切片借宿于序列末尾，可以省略第二个索引

[2, 3]

sample_list[:] #复制整个序列

[1, 2, 3]

''.join(a)

'hello'

(4)列表方法

方法是于对象联系紧密的函数，通常采用下面的调用方式：

object.method(argument)

append：用于将一个对象附加到列表末尾

lst = [1,2,3]
lst.append(4)  
lst
[1, 2, 3, 4]

clear:就地清空列表内容

lst = [1,2,3]
lst.clear()
lst
[]

copy:复制列表

lst = [1,2,3]

b = lst  #常规的复制只是将另一个名称关联到列表

b[1] = 4

lst

[1, 4, 3]

lst = [1,2,3]

b = lst.copy() #不改变lst的值

b[1] = 4

lst

[1, 2, 3]

extend：能够同时将多个值附加到列表末尾

和拼接的区别在于extend会修改被扩展的序列

a = [1,2,3]

b = [4,5,6]

a.extend(b)  #extend会修改原来的序列

a

[1, 2, 3, 4, 5, 6]

a = [1,2,3]

b = [4,5,6]

a + b

[1, 2, 3, 4, 5, 6]

a   #拼接不会修改原来的序列

[1, 2, 3]

a[len(a):] = b   #采用该方式可以得到和extend同样的效果

a    

[1, 2, 3, 4, 5, 6]

index：在列表中查找值第一次出现的索引

knights = ['We','are','the','knights','who','say','ni']
knights.index('who')  #搜索单词who，返回其所在的索引
4
knights[4]  #搜索索引为4的元素
'who'

insert：用于将一个对象插入到列表中

numbers = [1,2,3,5,6,7]
numbers.insert(3,'four') #将four插入到索引为3的位置中
numbers
[1, 2, 3, 'four', 5, 6, 7]
numbers = [1,2,3,5,6,7]
numbers[3:3] = ['four'] #可以使用切片来进行相同的操作
numbers
[1, 2, 3, 'four', 5, 6, 7]

pop：从列表中删除一个元素（默认情况下删除末尾的元素），并返回该元素

x = [1,2,3]

x.pop() #删除末尾的元素

3

x

[1, 2]

x.pop(0)   #删除索引为0的元素

1

x

[2]

x = [1,2,3]

x.append(x.pop())

x

[1, 2, 3]

remove:用于删除第一个为指定值的元素

x = ['to','be','or','not','to','be']
x.remove('be')  #删除第一个be
x
['to', 'or', 'not', 'to', 'be']
x.remove('bee')  #当删除一个不在list中的元素时会报错
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
 in ()
----> 1 x.remove('bee')

ValueError: list.remove(x): x not in list
reverse:按相反的顺序排序列表中的元素

x = [1,2,3]
x.reverse()
x
[3, 2, 1]

sort:用于对列表就地排序

x =[4,6,2,1,7,9]
y = x.sort()  #因为sort修改x是不反悔任何值额，最终的结果是x经过排序的，而y只包含none
print(y)   #返回结果
None
x
[1, 2, 4, 6, 7, 9]
###正确的方法
x =[4,6,2,1,7,9]
y = x.copy()  #将x关联到y中
y.sort()
x
[4, 6, 2, 1, 7, 9]
y
[1, 2, 4, 6, 7, 9]
###法二：
x =[4,6,2,1,7,9]
y = sorted(x)  #sorted()函数返回值
x
[4, 6, 2, 1, 7, 9]
y
[1, 2, 4, 6, 7, 9]
sorted('python')
['h', 'n', 'o', 'p', 't', 'y']
x = [4,6,2,1,7,9]
x.sort(reverse = True)  #先对x进行排序再反转
x
[9, 7, 6, 4, 2, 1]

2.set

集合跟數學中的集合是相同的概念，集合中國沒有重複的元素，並且元素之間沒有順序

set([1,2,3,2])  #返回{1,2,3},利用set

a = {1,2,3,2} #或者使用花括号

a
{1, 2, 3}
0xAF 
175
x = {}   #default为dict
type(x)  #可以使用type来查看
dict
x = {"name": "cookie","age":12}   #当有key值时表示dict
x
{'age': 12, 'name': 'cookie'}
x = {12,13,12,45}   #当不存在key值时表示是dict
x
{12, 13, 45}
type(x)
set

3.Tuple

元组由不能改变的元素组成，你可以像操作列表一样通过索引访问单个元素或者通过切片来访问多个元素）

（1）创建一个tuplle

1,2,3  #tuple的语法很简单，只要讲一些值用逗号分隔开就能创建一个元组
(1, 2, 3)
(1,2,3) #或者使用圆括号
(1, 2, 3)
() #空元组用不包含任何内容的元括号表示
()
42
42
42,  #虽然只有一个值，当后面也要加上逗号，表示创建的为元组
(42,)
（2）使用list创建tuple

tuple([1,2,3])
(1, 2, 3)
tuple('abc') 
('a', 'b', 'c')
tuple((1,2,3))  #如果参数本身已经是元组，则原封不动返回它
(1, 2, 3)

（3）tuple的访问

sample_tuple = (1,3,2)
sample_tuple[0] #访问tuple中的第一个元素
1
sample_tuple[0] = 100 #报错，因为元组中的元素时不能改变的
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
 in ()
----> 1 sample_tuple[0] = 100 #报错，因为元组中的元素时不能改变的

TypeError: 'tuple' object does not support item assignment

4.Dict

字典是有一个或多个键值对组成的列表。每个键与其值之间用冒号(:)分隔，项之间用逗号分隔，而整个字典放在花括号中。

(1)创建Dict

items = [('name','Gumby'),('age',42)]
items
[('name', 'Gumby'), ('age', 42)]
d = dict(items)  #使用dict函数从其他映射或键-值对序列创建字典
d
{'age': 42, 'name': 'Gumby'}
d['name']
'Gumby'
d = dict(name='Gumby',age=42)  #使用dict函数时用等号
d
{'age': 42, 'name': 'Gumby'}
d = {age: 42, name: 'Gumby'}  #key值要用引号括起来
---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
 in ()
----> 1 d = {age: 42, name: 'Gumby'}

NameError: name 'age' is not defined
d = {'age': 42, 'name': 'Gumby'}
d
{'age': 42, 'name': 'Gumby'}

(2)dict的基本操作

x = {}
x[42] = 'Foobar' #dict允许将一个值付给一个空字典的键42，而list则不允许这种操作
x
{42: 'Foobar'}
len(x)  #求字典包含的项数
1
del x[42]  #删除x中key值为42的值
x
{}
sample_dict={'name':'daniel','age':27}
sample_dict['name'] #字典中的值可以通过键进行访问
'daniel'
{'name':'cookie','scores':[12,30,20]}   #键值对中的值可以是字符、字符串、数字、其它对象，比如列表等。
{'name': 'cookie', 'scores': [12, 30, 20]}

（3）将字符串格式设置功能应用于字典

phonebook = {'Beth':'9102','Alice':'2341','Cecil':'3258'}
phonebook
{'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}
"Cecil 's phone number is {Cecil}.".format_map(phonebook)
"Cecil 's phone number is 3258."

(4)字典方法

clear：删除所有的字典项，这种操作时就地执行的，因此什么都不会反悔

d = {}
d['name']= 'Gumby'
d['age'] = 42
d
{'age': 42, 'name': 'Gumby'}
returned_value = d.clear()
d
{}
print(returned_value)  #操作就地进行，且不返回任何值
None

copy：返回一个新字典

浅复制，当替换副本中的值时，原件不收影响

x = {'username':'admin','machines':['foo','bar','baz']}
y = x.copy()
y['username'] = 'mlh'
y['machines'].remove('bar')
y
{'machines': ['foo', 'baz'], 'username': 'mlh'}
x
{'machines': ['foo', 'baz'], 'username': 'admin'}

深复制，同时复制值及其包含的所有值

from copy import deepcopy
d = {}
d['names'] = ['Alfred','Bertrand']
d
{'names': ['Alfred', 'Bertrand']}
c = d.copy()  #浅复制
dc = deepcopy(d)  #深复制
d['names'].append('Clive')
c
{'names': ['Alfred', 'Bertrand', 'Clive']}
dc
{'names': ['Alfred', 'Bertrand']}

fromkeys:创建一个新字典，其中包含指定的键，且每个键对应的值都是None

{}.fromkeys(['name','age']) #先创建一个字典，再对其调用方法fromkeys来创建另一个字典
{'age': None, 'name': None}
dict.fromkeys(['name','age']) #直接对dict调用方法fromkeys
{'age': None, 'name': None}
dict.fromkeys(['name','age'],'(unknown)')  #可以提供特定的值
{'age': '(unknown)', 'name': '(unknown)'}

get：方法get为访问字典提供了宽松的环境，如果您试图访问dict中没有的item，将会引发错误

d = {}
print(d['name'])  #访问dict中没有的item会引发错误
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
 in ()
----> 1 print(d['name'])

KeyError: 'name'
print(d.get('name'))  #使用get访问不存在的key时，没有引发异常，而是返回None
None
d.get('name','N/A') #可以指定默认的返回值
'N/A'
d['name'] = 'Eric'
d.get('name')  #如果dict中包含指定的key，则get的作用和普通的字典查找一样
'Eric'

items:返回一个包含所有字典项的列表，其中每个元素都为（key，value）形式

d = {'title':'python web site','url':'http://www.python.org','spam':0}
d.items() #返回值属于一种名为字典视图的特殊数据类型
dict_items([('title', 'python web site'), ('url', 'http://www.python.org'), ('spam', 0)])
it = d.items()
len(it)  #确定dict的长度
3
('spam',0) in it #执行成员资格检查
True
d['spam'] = 1
('spam',0) in it   #视图的一个优点是不复制，它始终是底层字典的反映
False
d['spam'] = 0
('spam',0) in it
True

keys：返回一个字典视图，其中包括指定字典中的键

d.keys()  #返回dict中的keys

dict_keys(['title', 'url', 'spam'])

pop：用于获取与指定键相关联的值，并将该键-值从字典中删除

d = {'x':1,'y':2}
d.pop('x')
1
d
{'y': 2}
d.pop(1)  #参数为dict中的key
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
 in ()
----> 1 d.pop(1)

KeyError: 1

popitem:类似于list.pop，但list.pop弹出列表中的最后一个元素，而popitem随机弹出一个字典项，因为字典项的顺序是不确定的，它没有最后一个元素的概念。

d = {'title':'python web site','url':'http://www.python.org','spam':0}
d.popitem()  #随机第删除一个item
('spam', 0)
d
{'title': 'python web site', 'url': 'http://www.python.org'}

setdefault：类似get，因为它也获取与指定键相关联的值，但除此之外，setdefault还在字典不包含指定的键时，在字典中添加指定的key-value对

d = {}
d.setdefault('name','N/A')  #如果指定的key不存在，则返回指定的value并相应地更新dict
'N/A'
d
{'name': 'N/A'}
d['name'] = 'Gumby'
d.setdefault('name','N/A') #如果指定的key存在，则返回其value，并保持dict不变
'Gumby'
d
{'name': 'Gumby'}
d = {}
print(d.setdefault('name'))  #和get一样，value是可选的，如果没有指定，默认为None
None
d
{'name': None}

update：使用一个字典中的item更新另外一个dict

d = {'title':'python web site',
        'url':'http://www.python.org',
         'changed':'Mar 14 22:09:15 MET 2016'}
x = {'title':'python language website'}
d.update(x) #更新d中的title项
d
{'changed': 'Mar 14 22:09:15 MET 2016',
 'title': 'python language website',
 'url': 'http://www.python.org'}

values：返回一个由dict中的value组成的字典视图

d = {}
d[1] = 1
d[2] = 2
d[3] = 3
d[4] = 1
d.values()
dict_values([1, 2, 3, 1])
d
{1: 1, 2: 2, 3: 3, 4: 1}

5.Array

array是numpy模块提供的一种一维或者多维数组，当利用机器学习进行模型训练时，我们通常会把数据集转换成array传递给算法进行训练

（1）数组的形式

np.array([1,2,3])
array([1, 2, 3])
np.array([[3,4,3],[3,4,5]]) #返回一个2*3的多维数组/矩阵
array([[3, 4, 3],
       [3, 4, 5]])
sample_array = np.array([1,2,3])
sample_array
array([1, 2, 3])

（2）数组的基本统计量

sample_array.min()    #返回array中的最小值1
1
sample_array.max()    #返回array中的最大值
3
sample_array.mean()   #返回数组中的均值
2.0
sample_array.sum()   #求和
6
sample_array.std()    #标准差
0.816496580927726
sample_array.shape  #返回数组的形状为
(3,)
sample_array.resize((3,1)) #改变数组的形状
sample_array
array([[1],
       [2],
       [3]])
sample_array.T  #得到数组的转置
array([[1, 2, 3]])
np.array([1,2])*2 #对数组进行加减乘除
array([2, 4])
np.array([1,2])*np.array([1,2])#数组的乘法
array([1, 4])

6.series

series是pandas模块提供的一种以为的数组，它类似numpy中国的Array,但是有一些特殊的功能，pandas的数据结构都会包含索引，索引可以是数字，也可以是字符

sample_series = pd.Series([1,1,3],index=['a','b','c'])

sample_series.value_counts()  #统计每个series中每个值出现的次数

1    2
3    1
dtype: int64

（1）处理数据

sample_series.unique()

array([1, 3], dtype=int64)

sample_series.abs()

sample_series.corr()

sample_series.diff()

sample_series.describe()

sample_series.dropna()

sample_series.drop_duplicates()

a    1
b    1
c    3
dtype: int64

（2）series还提供了很多函数计算统计量

sample_series.mean()

sample_series.kurtosis()

sample_series.median()

sample_series.max()

sample_series.min()

sample_series.mode()

sample_series.skew()

7.DataFrame

DataFrame是一种极为强大的数据结构。除了具备Series的功能和结构以外，还提供了更多的数据处理、分析相关的函数和功能。

sample_df = pd.DataFrame({'name': ['daniel', 'cookie', 'cookie'], 
                           "score": [90, 80, 100]})

sample_df.loc[sample_df['name'] == 'cookie', 'score']

sample_df.groupby('name').mean()

	score
name
cookie	90
daniel	90

二、read data

1、Text File

pd.read_csv(filename, sep=',', header='infer', index_col=None, use_cols=None)

2、Excel

pd.read_excel(filename, sheetname=0, header=0, skiprows=False, 
              index_col=None, use_cols=None)

3、Database

pd.read_sql(query, connection)##通常我们需要提供一个连接字符串给这个函数去连接相应的数据库。mysql+pymysql://data_viewer:test@localhost/test?charset=utf8

---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
 in ()
----> 1 pd.read_sql(query, connection)##通常我们需要提供一个连接字符串给这个函数去连接相应的数据库。mysql+pymysql://data_viewer:test@localhost/test?charset=utf8

NameError: name 'query' is not defined

三、Know Your Data

当通过pandas将数据读取到DataFrame后，首先可以查看数据的一些性质。假设df 是一个DataFrame，通过下面的命令可以查看数据的基本状况。

df = pd.DataFrame({'name': ['daniel', 'cookie', 'cookie'], 
                           "score": [90, 80, 100]})

1.查看数据的基本情况

（1）查看具体分布

df.head()   #查看前N条记录，默认是5条

	name	score
0	daniel	90
1	cookie	80
2	cookie	100

df.sample(2)  #随机查看2条记录

	name	score
0	daniel	90
1	cookie	80

df.info()   #查看数据的数据类型和空值情况。


RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
name     3 non-null object
score    3 non-null int64
dtypes: int64(1), object(1)
memory usage: 128.0+ bytes

df.describe()  #查看数据的基本统计值。

	score
count	3.0
mean	90.0
std	10.0
min	80.0
25%	85.0
50%	90.0
75%	95.0
max	100.0

df.corr()  #查看数据之间的相关系数。

	score
score	1.0

（2）查看数据缺失情况

np.product(df.shape)  #product将数组中的元素连乘，shape求数据框的形状，求数据框中值的个数

df.isnull().sum().sum()   #先对每一列求和，再对每一行求和

df.isnull().sum().sum() / np.product(df.shape)  # 查看数据总体的缺失程度

0.0

str.replace(old, new[, max])replace()方法把字符串中的 old（旧字符串）替换成 new(新字符串)，如果指定第三个参数max，则替换不超过 max 次。

 df.isnull().replace(False, True).sum()   #将df中的False值替换成True

age      4
count    4
name     4
dtype: int64

df.isnull().sum() / df.isnull().replace(False, True).sum()  #查看每个变量的缺失程度

name     0.0
score    0.0
dtype: float64

（3）分组

df.groupby('state').mean() # 以state进行分组，返回每组的均值

df.groupby(['state', 'city']).mean()  # 以state和city进行分组，返回每组的均值

2.Process Data

通常我们的数据中会有一些缺失值，异常值需要处理，以及一些数据需要清理，整理格式，编码等。Pandas提供了很多有用的函数。

（1）丢弃缺失值

# 删除所有包含缺失值的行
df.dropna()

# 删除所有包含缺失值的列
df.dropna(axis=1)

（2）处理重复值

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)参数这个drop_duplicate方法是对DataFrame格式的数据，去除特定列下面的重复行。返回DataFrame格式的数据。 subset : column label or sequence of labels, optional 用来指定特定的列，默认所有列 keep : {‘first’, ‘last’, False}, default ‘first’，默认保留第一次出现的项删除重复项并保留第一次出现的项 inplace : boolean, default False，默认在原有数据上修改是直接在原来数据上修改还是保留一个副本

# 删除重复的行
df.drop_duplicates()

（3）处理缺失值

# 以0填充所有缺失值
df.fillna(0)

#以空值所在列的下一个值进行填充，如果下一个值也是空值，则不填充
df.fillna(method='bfill', axis=0)  #pad (ffill) or backfill (bfill)，用前面一个数值填充还是后面一个数值填充

	age	count	name
0	20	80	daniel
1	3	90	cookie
2	27	100	derrick
3	26	200	renee

（4）利用apply函数清理数据

# 假设数据中的name都是以first name-last name的形式存储，想要分理出first name可以利用匿名函数
df.apply(lambda row: str(row['name']).split('-')[0], axis=1)   #对每一行使用函数

0     daniel
1     cookie
2    derrick
3      renee
dtype: object

# 对于复杂的处理过程可以编写函数
def process_zipcode(zipcode):
    if zipcode:
        new_zip = str(zipcode).strip().split('-')
        if len(new_zip) == 3:
            return new_zip[-1]
        elif len(new_zip) == 2:
            return new_zip[-1]
        else:
            return new_zip[0]
    else:
        return

df.apply(lambda row: process_zipcode(row['zipcode']), axis=1)

（5）生成虚拟变量

# 将df中的非数字的变量转换为以dummy_为前缀的虚拟变量
pd.get_dummies(df, prefix='dummy', prefix_sep='_')

3.Data Visualization

Pandas的DataFrame提供了matplotlib数据可视化包的接口，可以十分方便的直接通过DataFrame对象进行数据可视化。

df = pd.DataFrame({
    'name': ['daniel', 'cookie', 'derrick', 'renee'],
    'age': [20, 3, 27, 26],
    'count': [80, 90, 100, 200],
})
df.plot() # 默认做出DataFrame中数值型变量的折线图

df.plot(kind='bar', x='age', y='count') # Bar Plot

df.plot(kind='hist', x='age') # Histogram

df.plot(kind='box', x='age') # Box Plot

df.plot(kind='scatter', x='age', y='count') # Scatter Plot

4.Write Data

当我们处理完数据后，就需要将数据写入文件或者数据库进行存储。Pandas提供了一下很方便的函数完成这些工作。

# 将数据框存储为test.csv，并且不保存索引，并用utf8进行编码
df.to_csv('test.csv', index=False, encoding='uft8')

# 将数据写入test.xlsx的test表格，不保存索引，并用utf8进行编码
df.to_excel('test.xlsx', index=False, encoding='utf8', sheet_name='test')

# 将数据写入数据库中的test表，如果test表存在，就在现有的表中插入这些数据，不保存索引
df.to_sql('test', conn, if_exists='append', index=False)

你可能感兴趣的:(python,数据处理)

python使用技巧超超是超超 python
1、耗时装饰器importtimedefdecorate(func):definner():begin=time.time()result=func()end=time.time()print(f'函数{func}耗时{end-begin}')returnresultreturninner2、查看代码运行耗时fromline_profilerimportLineProfilerdefoperati
Anaconda与python和pycharm的安装及其关系 Daylight.. 学习笔记 pycharm python ide
Anaconda与python和pycharm的安装及其关系一、Anaconda与python和pycharm的关系：1.Anaconda包含python，并且里面含有许多常用的库。（安装了Anaconda就不需要安装python了）2.pycharm是一种IDE（集成开发环境），在其中可以编写Python程序。（工具和语言的关系）。二、如何安装？Anaconda的安装Anaconda官网下载地址
ImportError: cannot import name ‘Mapping‘ from ‘collections‘ AI算法网奇 python基础前端 javascript 数据库
ImportError:cannotimportname'Mapping'from'collections'解决方法：fromcollections.abcimportMapping#正确导入Mappingdefprocess_mapping(data):ifisinstance(data,Mapping):#使用Mapping进行类型检查#处理映射类型的代码pass测试命令：python-c"f
python图形界面化编程GUI（二）常用的组件(Text、Radiobutton、Checkbutton、Canvas)和布局管理器(gird、pack、place) hwwaizs python-GUI图形化编程 python 开发语言
Text文本框Text(多行文本框)的主要用于显示多行文本，还可以显示网页链接,图片,HTML页面,甚至CSS样式表，添加组件等。主要用来显示信息，也常被当做简单的文本处理器、⽂本编辑器或者网页浏览器来使用。IDLE就是Text组件构成的。insert插入的时候可以用INSERT代表当前光标的位置，END代表在结尾的位置，也可以用插入小数的形式，2.3代表第二行第三列后插入。fromtkinter
【深度解析】最短路径算法：Dijkstra与Floyd-Warshall 吴师兄大模型算法数据结构 python 最短路径算法 Dijkstra算法 Floyd-Warshall 开发语言
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析05-栈数据结构详解：Python实现与经典应用场景06-深入理解队列数据结构：从定义到Python实现与应用场景07-双端队列（Deque）详解：Python实现与滑动窗口应
CSE 231 Computer Python program 后端
CSE231Spring2025ComputerProject#4LearningobjectivesThisassignmentfocusesonthedesign,implementationandtestingofaPythonprogramthatusescharacterstringsforlookingattheDNAsequencesforkeyproteinsandseeingho
全网最全！DeepSeek 新手入门教程合集人工智能deepseek
如果你是初次接触DeepSeek的普通用户或开发者，面对海量教程却无从下手？别担心！本文为你整理全网最易懂、最实用的DeepSeek学习资源，涵盖快速上手、编程实战、系统手册等，附直达链接，收藏这一篇就够了！一、快速入门指南《DeepSeek入门教程》-博客园亮点：手把手教你注册账号、获取APIKey，并提供Python调用多轮对话的代码示例，适合初级开发者。直达链接：点击查看核心内容：API调用
集中式架构vs分布式架构谦亨有终架构架构分布式
一、集中式架构如何准确理解集中式架构1.集中式架构的定义集中式架构是一种将系统的所有计算、存储、数据处理和控制逻辑集中在一个或少数几个节点上运行的架构模式。这些中央节点（服务器或主机）作为系统的核心，负责处理所有用户请求和业务逻辑，客户端只负责请求和展示。2.核心特性单一控制中心：所有服务和资源都由中央节点统一管理。资源集中管理：数据和计算资源位于同一位置，便于维护和扩展。高一致性：由于资源集中管
【Python】Python入门——判断语句 zhoushanguhe Python python 编程开发语言
Python入门——判断语句。内容包括if语句、条件表达式、三元运算、match语句等。目录一、if语句1.基本if-else语句2.常用比较运算符3.if-else连写4.pass语句5.变量的作用域二、条件表达式三、三元运算四、match语句五、其他一、if语句1.基本if-else语句当条件成立时，执行某些语句；否则执行另一些语句。注意：if和else后需要加上冒号:if语句的代码块需要缩进
兄弟们，我的deepseek终于可以控制浏览器了：Part 1/n，含代码几道之旅 Dify：智能体（Agent）工作流知识库全搞定几道之旅AI专栏VVVIP 人工智能
文章目录前言helloworld前言其实，deepseek控制浏览器咱之前就发过，只不过当时没有想到这么好的标题，哈哈。所依赖的，依然是BrowserUse这个项目BrowserUse项目官网helloworld按照官网配置好环境后，只需新建一个python文件（例如，叫main.py?）然后运行即可。fromlangchain_openaiimportChatOpenAIfrombrowser_
CSE 231 Computer Python program 后端
CSE231Spring2025ComputerProject#4LearningobjectivesThisassignmentfocusesonthedesign,implementationandtestingofaPythonprogramthatusescharacterstringsforlookingattheDNAsequencesforkeyproteinsandseeingho
【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3 仙人掌_lz 人工智能人工智能 AI 部署自然语言处理
简介KTransformers是一个灵活的、以Python为中心的框架，旨在通过先进的内核优化和放置/并行策略提升HuggingFaceTransformers的使用体验。它具有高度的可扩展性，用户可通过单行代码注入优化模块，获得兼容Transformers的接口、符合OpenAI和Ollama的RESTfulAPI，甚至简化的ChatGPT风格的WebUI。KTransformers的性能优化基
C语言-回调函数的应用 woainizhongguo. C/C++c语言
什么是回调函数回调函数就是一个被作为参数传递的函数。在C语言中，回调函数只能使用函数指针实现，在C++、Python、ECMAScript等更现代的编程语言中还可以使用仿函数或匿名函数。工作机制⑴定义一个回调函数；⑵提供函数实现的一方在初始化的时候，将回调函数的函数指针注册给调用者；⑶当特定的事件或条件发生的时候，调用者使用函数指针调用回调函数对事件进行处理。应用案例（1）应用层：通过调用hal层
Python Union 联合类型注解详解人才程序员杂谈 python 服务器 java linux 后端软件工程开发语言
文章目录PythonUnion联合类型注解详解1.什么是Union联合类型？**语法（Python3.9及之前版本）**：**语法（Python3.10及之后版本）**：2.Union联合类型注解示例**(1)使用Union来表示多个类型的参数****(2)使用`|`来表示联合类型（Python3.10及之后版本）**3.使用Union进行复杂类型注解**(1)使用Union与列表结合****(2
释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
ffmpeg-python安装 neverayever 计算机 ffmpeg python linux
centos-ffmpeg-python安装安装ffmpeg一：下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网，可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载，然后上传至服
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
探索A10技术的应用与未来发展潜力智能计算研究中心其他
内容概要A10技术是一项正在逐步成熟并对多个行业产生深远影响的前沿技术。其发展历程可以追溯到早期的研发阶段，至今已经经过了多次技术迭代与升级。以下是对A10技术核心应用和优势的概述，通过这些内容可以帮助读者更好地理解其用途：应用领域具体应用主要优势信息技术数据处理与分析提高数据处理效率制造业自动化与智能生产降低生产成本医疗行业远程监控与智能诊断提升医疗服务质量交通运输智能交通系统优化交通流量环保领
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
清华大学第四发《DeepSeek+DeepResearch 让科研像聊天一样简单》人工智能
当下科研领域，传统模式急需改变，清华大学第四版《DeepSeek+DeepResearch：让科研像聊天一样简单》全文一共86页，以下是文档的关键内容总结：一、智能组合优势DeepSeek与DeepResearch构建先进技术体系，有强大模型运算、智能数据处理和友好交互界面。模型在数据处理速度、精准度和泛化能力上远超传统模型。数据采集渠道广、处理快，能读取多种格式文件。数据分析深入，可视化直观，还
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
HarmonyOS Next智能家居控制系统的模型转换与数据处理实战 harmonyos
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统（截止目前API12）构建智能家居控制系统中模型转换与数据处理技术的实战应用，基于实际开发经验进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、智能家居系统需求与技术选型（一）功能需求分析设备状态监测需求智能家居控制系统需要实时监测各种智能设
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag