N刻后告诉你

[学习笔记]Python for Data Analysis, 3E-3.内置数据结构，函数和文件

3.1数据结构和序列

元组

元组是一个固定长度的、元素不可变的Python对象序列。

# 创建元组最简单方法是用括号括起来的逗号分隔序列(括号可以省略)
tup = (4, 5, 6)
tup = 4, 5, 6

# 通过调用tuple可以将任何序列和迭代器转化为元组。
tuple([4, 0, 2]) # (4, 0, 2)
tuple('string')  # ('s', 't', 'r', 'i', 'n', 'g')

# 元组可以通过中括号[]来访问其中的元素。
tup[0] # 4

# 元组的元素可以是元组。
nested_tup = (4, 5, 6), (7, 8)

# 虽然存储在元组中的对象可能是可变的，但是一旦元组被创建，就不能将这个对象更改为别的对象。但是如果它可变，可以修改这个对象。
tup = tuple(['foo', [1, 2], True])
tup[2] = False # 无法赋值，因为tuple不可变
tup[1].append(3) # tuple中的对象是list，可变，可以修改

# 元组可以通过+运算符进行拼接
(4, None, 'foo') + (6, 0) + ('bar', ) # (4, None, 'foo', 6, 0, 'bar')

# 元组可以通过*运算符进行复制和拼接
('foo', 'bar') * 4 # ('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

解包元组

# 如果尝试将类似元组的表达式赋值给变量，Python会尝试解压缩右侧的值(甚至具有嵌套元组的序列也可以解包)
a, b, c = (4, 5, 6)
a, b, (c, d) = 4, 5, (6, 7)

# 变量解包的一个常见用途是迭代元组或列表序列
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for a, b, c in seq:
    print(f'a={a}, b={b}, c={c}')
    
# 在变量解包中，利用*rest获得任意长度元组元素，以达到提取元组开头元素的目的
values = 1, 2, 3, 4, 5
a, b, *rest = values # a=1, b=2, rest=[3, 4, 5]
# rest部分有时候是不需要的，所以常常也用_代替，即上一行代码可改为
a, b, *_ = values

元组方法

# 元组方法中一个特别有用的方法是'count'方法，它也可以用于列表
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2) # 返回4

列表

列表是一个可变长的、元素可变的Python对象序列。

# 使用[]或使用list函数创建列表
a_list = [2, 3, 7, None]
b_list = list(('foo', 'bar', 'baz'))

# 修改列表元素
b_list[1] = 'peekaboo'

# list内置函数在数据处理中经常被用于具像化迭代器或生成器表达式
gen = range(10)

# 连接和合并列表
[4, None, 'foo'] + [7, 8, (2, 3)] # 通过+运算符进行列表串联
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)]) # 通过extend函数追加列表(比串联方案更快)

字典

字典可能是最重要的内置Python数据结构。在其他编程语言中，字典有时候称为哈希映射或关联数组。字典存储键值对的集合，其中键和值是Python对象。

# 创建字典的方法是用大括号和冒号来分隔键和值
empty_dict = {} # 创建空字典
d1 = {'a': 'some value', 'b': [1, 2, 3, 4]}

# 插入、访问元素
d1[7] = 'an integer
d1['b']

# 检查字典中是否包含某个键
'b' in d1

# 通过del关键字或pop方法(会返回值)来删除键值对
del d1['a'] # 删除d1的键'a'和其对应的值
ret = d1.pop('b') # pop方法在删除键值对的同时还会返回值，这里ret的值是[1, 2, 3, 4]

# keys()和values()方法可以分别提供键和值的迭代器，items()方法可以迭代访问键值对组成的二元组
list(d1.keys()) # 获得键组成的列表
list(d1.values())  # 获得值组成的列表
list(d1.items()) # 获得列表，其元素为键值对组成的元组

# 使用update()方法可以将一个字典合并到另一个字典中
d1.update({'b': 'foo', 'c': 12}) # 如果有重复的键，则对应的旧值会被丢弃，更新为新值

# 从序列创建字典
mapping = {}
for key, value in zip(key_list, value_list): # zip()函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象
    mapping[key] = value
# 由于字典本质上是二元组的集合，因此可以通过dict()函数接受一个二元组的列表来生成字典
tuples = zip(range(5), reversed(range(5)))
mapping = dict(tuples)

# 字典的get()方法、pop()方法、setdefault()方法支持默认值
value = some_dict.get(key, default_value) # 如果key不在字典的键中，则返回default_value值
value = some_dict.pop(key, default_value) # 如果key不在字典的键中，则返回default_value值
# 利用setdefault()方法将单词列表按照首字母分类为列表字典
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}
for word in words:
    letter = word[0]
    by_letter.setdefault(letter, []).append(word) # setdefault()方法会返回letter键对应的值，如果没有对应的键则创建，同时值设置为[]
# 内置的collections模块有一个有用的类defaultdict。通过传递一个类型或者函数，字典会为后续添加的每个键创建默认值(上面的例子可改为)
from collections import defaultdict
by_letter = defaultdict(list)
for word in words:
    by_letter[word[0]].append(word)

# 字典的键通常要求是不可变对象，如标量类型(int, float, 字符串)或元组(元组中所有对象也要求不可变)，这样才能保证哈希可处理。通过hash()函数可以检查对象是否可哈希
hash('string') # 可哈希
hash((1, 2, (2, 3))) # 可哈希
hash((1, 2, [2, 3])) # 不可哈希，因为元组中的对象[2, 3]为列表，它是可变的
# 注意：要将列表作为键，一般选择是将其转化为元组

集合

集合是唯一元素的无序集合。

# 创建集合可以通过set()函数或者带有大括号的集合文本
set([2, 2, 2, 1, 3, 3])
{2, 2, 2, 1, 3, 3}

# 集合支持包括并集(union)、交集、差分和对称差分等集合运算
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}
a.union(b) # 并集, {1, 2, 3, 4, 5, 6, 7, 8}
a | b      # 并集, {1, 2, 3, 4, 5, 6, 7, 8}
a.intersection(b) # 交集
a & b      # 交集
# 如果将不是集合的输入传递给union或intersection，Python会在执行操作前将输入转化为集合。但使用二元运算符'|'或'&'时，两个对象必须是集合。

[表]Python集合操作

# 与字典键一样，集合元素通常是不可变的，并且它们必须是可哈希的。为了在集合中存储类似列表的元素(或其他可变序列)，可以将它们转换为元组。

内置序列函数

enumerate

# enumerate()函数可以返回collection序列的一系列的(index, value)元组组成的序列
for index, value in enumerate(collection):
    # do something with value

sorted

# sorted()函数可以返回一个排好序的列表
sorted('horse race')

zip

# zip()函数将多个列表、元组或其他序列的元素配对以创建元组组成的zip对象，再通过list()函数可以将其转化为列表
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
zipped = zip(seq1, seq2)
list(zipped) # [('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

# zip可以接受任意数量的序列，并且产生的元素数量由最短序列的元素数量决定：
seq3 = [False, True]
list(zip(seq1, seq2, seq3)) # [('foo', 'one', False), ('bar', 'two', True)]

# zip的常见用途是同时迭代多个序列，甚至可能结合enumerate()函数：
for index, (a, b) in enumerate(zip(seq1, seq2)):
    print(f'{index}: {a}, {b}')

reversed

# reversed会逆序迭代序列元素
list(reversed(range(10)))
# 注意：reversed是一个生成器，它在利用list()函数或for循环实现之前不会创建反向序列

列表、集合以及字典推导式

[expr for value in collection if condition]# 列表推导式的一般形式
{key-expr: value-expr for value in collection if condition} # 字典推导式的一般形式
{expr for value in collection if condition} # 集合推导式的一般形式

# 嵌套列表推导式
all_data = [["John", "Emily", "Michael", "Mary", "Steven"], ["Maria", "Juan", "Javier", "Natalia", "Pilar"]]
result = [name for names in all_data for name in names if name.count('a') >= 2] # 有点像嵌套循环，大循环在前，小循环在后，过滤条件放在末尾

3.2函数

函数是Python中代码组织和重用的主要和最重要方法。

# 每个函数都可以有位置参数和关键字参数。关键字参数常用于指定默认值或可选参数(这里定义了一个函数，其中可选参数z的默认值为1.5):
def my_function2(x, y, z=1.5):
    if z > 1:
        return z*(x+y)
    else:
        return z/(x+y)
# 虽然关键字参数可选，但调用函数时，位置参数必须指定。无论是否提供关键字都可以将值传递给关键字参数z，但是鼓励使用关键字
my_functon2(5, 6, z=0.7)   # 使用关键字传参
my_function2(3.14, 7, 3.5) # 不使用关键字传参
# 函数参数中的主要限制是关键字参数必须跟在位置参数之后。并且可以以任意顺序指定关键字参数(这使你不必记住函数参数的指定顺序，只需要记住它们的名字是什么)

命名空间、作用域和本地函数

# 函数可以访问在函数内部创建的变量，也可以访问函数外部更高(甚至全局)作用域中的变量。用来描述Python中变量范围的术语称为命名空间。
# 默认情况下，在函数中分配的任何变量都将分配给本地命名空间。本地命名空间是在调用函数时创建的，并立即由函数的参数填充。函数完成后，本地命名空间被销毁。
# 可以在函数范围之外分配变量，但这些变量必须使用global或nonlocal关键字显式声明：
a = None
def bind_a_variable():
    global a # 不声明代码也可通过，但是鼓励声明
    a = []
bind_a_variable()
print(a)
# nonlocal允许函数修改在非全局的更高级别作用域中定义的变量(可以参考Python文档来了解)

不鼓励使用global关键字。通常，全局变量用于在系统中存储某种状态。如果你发现自己使用了很多全局变量，则表明你需要面向对象的编程(使用类)。

返回多个值

# Python中返回多个值实际上是返回一个对象(元组或字典等)
def f():
    a = 5
    b = 6
    c = 7
    return {'a': a, 'b': b, 'c': c} # 返回一个字典对象

函数是对象

# 数据处理，将一堆转换(去除空格、删除标点符号、规范大小写)应用于以下字符串列表
import re # 为了使用re模块内置的字符串方法以及用于正则表达式的标准化库
states = ["   Alabama ", "Georgia!", "Georgia", "georgia", "FlOrIda", "south   carolina##", "West virginia?"]
def remove_punctuation(value): # 移除标点符号
    return re.sub('[!#?]', '', value) # 将字符串value中的!#?替换为空字符
    
clean_ops = [str.strip, remove_punctuation, str.title] # 函数是对象，str.strip是可以去掉空格，str.title可以将首字母大写
def clean_strings(strings, ops):
    result = []
    for value in strings:
        for func in ops:
            value = func(value)
        result.append(value)
    return result
    
clean_strings(states, clean_ops)

# 你可以用函数作为别的函数(如内置函数map)的参数，它会将这个函数应用到序列的每一个元素(map可以用作没有过滤器的列表生成式的替代方法)
for x in map(remove_punctuation, states):
    print(x)

匿名(Lambda)函数

# Python支持所谓的匿名或Lambda函数，这是一种编写包含单个语句的函数的方法。它由关键字lambda定义，lambda除了表示“我们正在声明一个匿名函数”之外，没有任何含义
# 匿名函数更加简洁，因为他不需要编写函数声明。
equiv_anon = lambda x: x*2 # 匿名函数可以像正常函数一样使用equiv_anon(5)
# 匿名函数的一个示例：根据每个字符串中不同字母的数量对字符串集排序
strings = ["foo", "card", "bar", "aaaa", "abab"]
strings.sort(key=lambda x: len(set(x)))

生成器

Python中的许多对象都支持迭代，如列表中的对象或文件中的行。这是通过迭代器协议实现的，迭代器协议是使对象可迭代的通用方法

# 迭代字典会产生字典键
some_dict = {'a': 1, 'b': 2, 'c': 3}
for key in some_dict: # Python会首先尝试从字典中创建一个迭代器iter(some_dict)
    print(key)

迭代器是被用于如for循环的环境中才会生成对象给Python解释器的对象。大多数需要列表或类似列表的对象的方法也接受任何可迭代对象。这些方法包括如min，max的内置方法，以及如list和tuple的类型构造方法

list(dict_iterator)

生成器函数

类似于编写普通函数，生成器是一种方便的方法用于构造新的可迭代对象。不同于普通函数一次执行返回单个结果，生成器可以通过暂停和恢复执行来返回多个值的序列。为了创建一个生成器，在函数中需要使用yield关键字而不是return关键字。

# 构造生成器函数squares
def squares(n=10):
    print(f'Generating squares from 1 to {n ** 2}')
    for i in range(1, n+1):
        yield i ** 2
# 创建生成器对象gen，此时不会执行任何代码
gen = squares()
# 从生成器请求元素，它才开始执行代码
for x in gen:
    print(x, end = ' ')

注意：由于生成器一次生成一个元素的输出，而不是一次生成整个列表，因此它可以帮你的程序使用更好内存

生成器表达式

创建生成器的另一种方法是使用生成器表达式。这是一个类似于列表、字典和集合推导式的生成器。为了创建它，只需要将列表推导式的’[]‘改为’()'。

# 创建生成器表达式
gen = (x ** 2 for x in range(100))
# 这等价于以下更详细的生成器函数
def _make_gen():
    for x in range(100):
        yield x ** 2
gen = _make_gen()
# 在某些情况下，可以用生成器表达式代替列表推导式作为函数参数：
sum(x ** 2 for x in range(100))
dict((i, i ** 2) for i in range(5))

itertools模块

标准库itertools模块有许多常见数据算法的生成器集合。

# group函数以任何序列和一个函数为输入，按照函数返回值对序列中的元素进行分组
import itertools
def first_letter(x):
    return x[0]
names = ["Alan", "Adam", "Wes", "Will", "Albert", "Steven"]
for letter, names in itertools.groupby(names, first_letter):
    print(letter, list(names)) # names是一个生成器

下表是一些好用的itertools模块中的函数。

[表]一些有用的itertools函数

错误和异常处理

优雅地处理Python错误或异常是构建健壮程序的重要组成部分。在数据分析应用程序中，许多函数仅适用于某些类型的输入。例如，Python的float函数能够将字符串转换为浮点数，但是对不合适的输入会报ValueError：

float('1.2345') # 正确转化为1.2345
float('something') # 报错：ValueError

# 通过将函数包含在try/except块中进行异常处理
def attempt_float(x):
    try:
        return float(x)
    except:      # 可以只指定ValueError，也可以设置异常类型的元组(TypeError, ValueError)来捕获多个异常类型，注意括号是必须的
        return x # 仅在引发异常时，才会执行except块中的代码
        
# 使用finally语句，可以保证无论try块中的代码成功执行或异常，finally块中的语句都能执行
f = open(pah, mode='w')
try:
    write_to_file(f)
finally:
    f.close() # 一定会执行
   
# 在try...except后，使用else语句，可以在try块成功时执行else里面的代码
f = open(path, mode='w')
try:
    write_to_file(f)
except:
    print('Failed')    # try块中的内容没有被正确执行，则执行except内的语句
else:
    print('Succeeded') # try块中的内容被正确执行，则执行else内的语句
finally:
    f.close()

Ipython中的异常

当你在使用"%run"运行脚本或执行任何语句时发生异常，则IPython将默认打印一个完整的调用堆栈跟踪(traceback)，并在堆栈中的每个点的周围显示几行上下文。

与标准Python解释器(不提供任何额外的上下文)相比，拥有额外的上下文具有很大的优势。你可以使用magic命令控制显示的上下文量。在“附录B：更多关于Ipython系统”中可以看到，在错误发生后，可以通过%debug或%pdb魔术方法来单步执行堆栈。

3.3文件和操作系统

本书的大部分内容都使用高级工具如pandas.read_csv来从磁盘读取数据到Python数据结构中。但是，了解如何在Python中使用文件的基础知识非常重要。

# 要打开文件进行读取或写入，可以使用内置的open函数，同时设置文件的相对路径或者绝对路径，以及一个可选的文件编码：
path = 'examples/segismundo.txt'
f = open(path, encoding='utf-8') # 默认情况下，文件以只读模式打开
for line in f: # 将文件对象视为列表，通过for循环访问这些行
    print(line)
f.close() # 当使用open创建文件对象时，建议处理完文件后通过f.close()将其关闭，关闭文件会将其资源释放回操作系统

# 通过with语句可以更方便清理打开的文件，在退出with块之后文件f会自动被关闭
with open(path, encoding='utf-8') as f:
    lines = [x.rstrip() for x in f]
# 注意：不能确保文件已关闭在许多小程序和小脚本中不会有问题，但是在需要与大量文件交互的程序中，可能会是一个问题

下表是所有有效的文件读/写模式的列表：

[表]Python文件模式

# 对于可读文件，一些最常用的方法是：read, seek和tell. 

# read从文件中返回一定数量的字符(由文件的编码决定)或字节(如果文件是以二进制模式打开，则返回字节)。参数未指定则返回整个文件。
f1 = open(path)
f1.read(10) # 读取10个字符：'Sueña el r'
f2 = open(path, mode='rb') # 二进制只读
f2.read(10) # 读取10个字节：b'Sue\xc3\xb1a el '
# 注意：这里字符'ñ'对应两个字节'\xc3\xb1'

# tell方法返回文件读/写指针当前的位置
f1.tell() # 返回11：当前指针指向第11个字节(从0开始记录)
f2.tell() # 返回10：当前指针指向第10个字节
# 注意：即使我们从以文本模式打开的文件f1中读取了10个字符，位置仍是11，因为使用默认编码解码10个字符需要花费很多字节。你可以在sys模块中检查默认编码：
import sys
sys.getdefaultencoding() # 返回'utf-8'
# 若想要跨平台的情况下获得一致性的行为，最好在打开文件时传递编码(如广泛使用的'utf-8'编码)

# seek方法将改变文本读/写指针到指定的位置
fileObject.seek(offset, whence=0) # 调用seek函数的一般格式：offset表示移动偏移的字节数
# whence表示从哪个位置开始，0表示从文件头开始，1表示从当前位置开始，2表示从文件末尾开始
f1.seek(3) # 当前指针移到第3个字节
f1.read(1) # 从当前指针开始读取一个字符：返回'ñ'，对应两个字节，于是指针移动两个字节
f1.tell()  # 当前指针移动到第5个字节

# 关闭文件
f1.close()
f2.close()

# 若要将文本写入文件，可以使用文件的write或writelines方法。例如，我们可以创建一个没有空行的examples/segismundo.txt文件如下：
path = 'examples/segismundo.txt'
with open('tmp.txt', mode='w') as handle: # 只写模式('w')创建tmp.txt文件
    handle.writelines(x for x in open(path) if len(x)>1) # 读取'examples/segismundo.txt'的每一行，如果长度>1则写入
with open('tmp.txt') as f: # 只读模式('r')打开tmp.txt文件
    lines = f.readlines()  # 返回文件的全部行组成的列表
lines
# 注意：若readlines()指定参数size，则返回size行的列表

[表]重要的Python文件方法或属性

文件中的字节和统一码(Unicode)

Python文件的默认行为(无论是可读的还是可写的)是文本模式，这意味着你往往使用的是Python字符串(即，Unicode)。这与二进制文本模式形成鲜明对比，二进制文本模式可以通过附加’b’到文件模式中来实现。

# 重新访问上一节中的文件(它包含具有UTF-8编码的非ASCII字符)
with open(pah) as f:
    chars = f.read(10)
chars # 返回'Sueña el r'
len(chars)

UTF-8是一种可变长度的Unicode编码，因此当我们从文件中请求一定数量的字符时，Python会从文件中读取足够的字节(最少10个，最多40个字节)来解码这么多字符。

# 如果我用'rb'(二进制只读)打开文件，则read函数会请求确切的字节数
with open(path, mode='rb') as f:
    data = f.read(10)
data # 返回b'Sue\xc3\xb1a el '

根据文本编码，你能够将字节解码为str对象，但前提是每个编码的Unicdoe字符都已完全形成

data.decode('utf-8') # 能够正常进行'utf-8'解码

data[:4].decode('utf-8') # 由于第四个字节0xc3不能被'utf-8'解码称正常的字符，所以解码失败

文本模式与open函数的encoding选项结合，提供了一种从一个Unicode到另一个Unicode编码的便捷方法：

sink_path = 'sink.txt'
with open(path) as source:
    with open(sink_path, 'x', encoding='iso-8859-1') as sink:
        sink.write(source.read())
with open(sink_path, encoding='iso-8859-1') as f:
    print(f.read(10))

在以二进制文件以外的任何模式打开文件时，请注意用seek函数。如果文件读/写指针位于Unicode字符的字节中间，则后续读取将导致错误：

f = open(path, encoding='utf-8')
f.read(5)
f.seek(4)
f.read(1) # 此时落在指针落在0xb1上，读取一个字节无法构成合法的unicode字符，报错

3.4结论

有了Python环境和语言的一些基础知识，现在是时候继续学习Python中的Numpy和面向数组的计算了。

你可能感兴趣的:(python,python,学习)

PHP 网络编程介绍来恩1003 PHP 从入门到精通 php 网络开发语言
PHP学习资料PHP学习资料PHP学习资料在当今数字化时代，网络编程是开发各类应用必不可少的技能。PHP作为一门广泛应用于Web开发的编程语言，同样具备强大的网络编程能力。接下来，我们将深入探讨PHP中网络连接的建立、Socket编程、HTTP请求与响应等网络相关的操作。一、网络连接的建立在PHP中建立网络连接，主要是通过使用内置的函数来实现与远程服务器的通信。最常见的是使用fsockopen函数
PHP 安全与加密：守护 Web 应用的基石来恩1003 PHP 从入门到精通 php 安全前端
PHP学习资料PHP学习资料PHP学习资料在当今数字化时代，Web应用无处不在，而PHP作为一种广泛使用的服务器端脚本语言，承载着无数网站和应用的核心逻辑。然而，随着网络攻击手段日益复杂，PHP应用面临着诸多安全威胁，如SQL注入、XSS攻击等，同时，数据的加密保护也至关重要。本文将深入探讨PHP中的安全问题及加密算法的应用，帮助开发者构建更安全可靠的Web应用。一、PHP安全之殇——SQL注入攻
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
第26篇：pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA使用lora微调的模型异构个性化联邦学习还不秃顶的计科生联邦学习深度学习人工智能开发语言
第一部分：解决的问题联邦学习（FederatedLearning,FL）是一种分布式机器学习方法，允许客户端在本地数据上训练模型，同时通过中心服务器共享学习成果。传统FL框架假设客户端使用相同的模型结构（模型同构），但在实际中可能面对：统计异质性：客户端的数据分布不均（non-IID）。资源异质性：客户端硬件资源有限。模型异质性：客户端可能拥有不同的模型结构。模型异构的个性化联邦学习（MHPFL）
零基础学会asp.net做AI大模型网站/小程序十六：专栏总结借雨醉东风 asp.net 小程序后端
本专栏以实战为主，轻理论。如果哪里有不太懂的，可关注博主后加个人微信（平台规定文章中不能贴联系方式，需先关注博主，再加微信），后续一起交流学习。-------------------------------------正文----------------------------------------目录本专栏总结后续方向项目简介项目结构使用方法项目地址关键特点LLaMA机器学习简介使用LLaMA
GPT (Generative Pre-trained Transformer) 彬彬侠自然语言处理 gpt transformer 预训练 NLP 自然语言处理
GPT(GenerativePre-trainedTransformer)是由OpenAI提出的一个基于Transformer架构的自回归语言模型。GPT模型通过大规模无监督预训练，使用大量的文本数据进行学习，然后再进行微调（fine-tuning）来适应具体的下游任务。GPT的设计目标是能够理解和生成自然语言文本，并且它以其出色的自然语言生成能力在多个领域取得了显著的成果。GPT的基本原理GPT
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析... 985小水博一枚呀论文解读深度学习目标检测 YOLO 人工智能算法架构网络
【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…文章目录【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解
Vue.js 从新手到专家：第七章高级渲染、动态组件和插件合成 caifox菜狐狸 Vue.js 从新手到专家前端 javascript 开发语言 vue.js ecmascript 前端框架 vite
欢迎来到《Vue.js从新手到专家》的第七章！在这一章中，我们将深入探讨Vue.js的高级渲染技术、动态组件的使用以及如何通过插件扩展应用程序的功能。这些技能将帮助你构建更加灵活和可维护的应用程序。通过学习本章内容，你将掌握以下技能：理解Render函数和JSX的基本概念及其应用场景。学习函数式组件的定义及其实现方式。掌握如何为函数式组件定义Props和Emits。学习如何使用Vue插件全局地添加
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
Mysql学习笔记-Mysql基础进阶少年无为 Mysql Mysql 数据库多表查询数据库备份 Mysql查询
#知识点1.DQL:查询语句1.排序查询2.聚合函数3.分组查询4.分页查询2.约束3.多表之间的关系4.范式5.数据库的备份和还原#DQL:查询语句1.排序查询*语法：orderby子句*orderby排序字段1排序方式1，排序字段2排序方式2...*排序方式：*ASC：升序，默认的。*DESC：降序。*注意：*如果有多个排序条件，则当前边的条件值一样时，才会判断第二条件。2.聚合函数：将一列数
嵌入式学习DAY28 --- 线程、同步和互斥问题、如何实现同步和互斥？楼台的春风嵌入式学习多线程 c语言嵌入式 linux ubuntu
嵌入式入门学习笔记，遇到的问题以及心得体会！DAY28概述：一、线程二、同步和互斥问题三、如何实现同步四、如何实现互斥笔记：一、线程1、什么是线程：（1）线程是轻量级的进程（2）线程存在于进程内，不能独立存在（3）线程参与CPU调度，进程是系统资源分配最小单位，线程是系统调度的最小单位（4）在单核CPU中，多线程并发属于伪并发，但是不牵扯虚拟地址空间的切换，所以开销比进程间切换要小很多（5）在多核
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
Android arcgis加载在线底图 Angie洛林 android arcgis
我整理的一些关于【信息系统】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/mic-position/757.html在Android中使用ArcGIS加载在线底图ArcGIS是Esri提供的一套强大的地理信息系统（GIS）解决方案，支持多种平台，包括Android。本文将介绍如何在Android应用中使用ArcGIS加载在线底图，并配有相关代码示
深度学习环境配置——Anaconda安装 tyyhmtyyhm 深度学习环境配置深度学习人工智能
目录Ⅰ.Windows系统安装Anaconda1.1下载安装Ⅱ.Linux系统安装Anaconda（适用于服务器安装）2.1下载2.2安装操作系统：windows11/ubuntu20/ubuntu18更新时间：20240221Ⅰ.Windows系统安装Anaconda1.1下载安装https://www.anaconda.com/download默认安装即可。Ⅱ.Linux系统安装Anacond
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
（九万字）面向2025年BOSS直聘人工智能算法工程师高频面试题解析快撑死的鱼人工智能回归 python pytorch
面向2025年BOSS直聘人工智能算法工程师高频面试题解析1.机器学习（ML）理论解析机器学习是让计算机从数据中学习规律的一套方法论，包含监督学习、无监督学习和强化学习等范式。在监督学习中，给定带标签的数据，算法尝试学习从输入到输出的映射关系；无监督学习则在缺乏标签的情况下挖掘数据内在结构；强化学习则让智能体通过与环境交互、依据奖赏反馈来改进策略(Q-learning-Wikipedia)。机器学
《数组》学习——有序数组的平方小翔很开心我在CSDN学算法学习
有序数组的平方题目：给你一个按非递减顺序排序的整数数组nums，返回每个数字的平方组成的新数组，要求也按非递减顺序排序。测试用例：输入：nums=[-4,-1,0,3,10]输出：[0,1,9,16,100]解释：平方后，数组变为[16,1,0,9,100]，排序后，数组变为[0,1,9,16,100]该题，有两种解法：暴力排序解法双指针法（快慢指针法）测试程序：（双指针法的求解）#include
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http