谈笑233

Python自学笔记D9——IO编程、进程、线程和正则表达式

文章目录

IO编程
- 文件读写
- StringIO和BytesIO
- 操作文件和目录
- 序列化
进程和线程
- 多进程
- 多线程
- ThreadLocal
- 多进程和多线程对比
- 分布式进程
正则表达式

IO编程

由于程序和运行时数据是在内存中驻留，由CPU这个超快的计算核心来执行，涉及到数据交换的地方，通常是磁盘、网络等，就需要IO接口。

比如你打开浏览器，访问网站，先output请求html信息，接下来Input。所以，通常，程序完成IO操作会有Input和Output两个数据流。当然也有只用一个的情况，比如，从磁盘读取文件到内存，就只有Input操作，反过来，把数据写到磁盘文件里，就只是一个Output操作。

IO编程中，Stream（流）是一个很重要的概念，可以把流想象成一个水管，数据就是水管里的水，但是只能单向流动。Input Stream就是数据从外面（磁盘、网络）流进内存，Output Stream就是数据从内存流到外面去。

而由于CPU和内存速度远高于外设，因此出现了两种不同的IO方式：

同步IO：CPU等到外设读取完后再继续下一步。
异步IO：CPU先执行后续程序去了（效率高，编程模型复杂人，如：回调、轮询）

文件读写

用法基本和c兼容

>>> f = open('/Users/michael/test.txt', 'r')#读文件
>>> f.read()
>>> f.close()
#两种方法避免文件不存在
try:
    f = open('/path/to/file', 'r')
    print(f.read())
finally:
    if f:
        f.close()
#第二种
with open('/path/to/file', 'r') as f:
    print(f.read())

调用read()会一次性读取文件的全部内容，如果文件有10G，内存就爆了，所以，要保险起见，可以反复调用read(size)方法，每次最多读取size个字节的内容。

另外，调用readline()可以每次读取一行内容，调用readlines()一次读取所有内容并按行返回list。（读取配置文件较为方便）因此，要根据需要决定怎么调用。

for line in f.readlines():
    print(line.strip()) # 把末尾的'\n'删掉

file-like Object

像open()函数返回的这种有个read()方法的对象，在Python中统称为file-like Object。除了file外，还可以是内存的字节流，网络流，自定义流等等。

StringIO就是在内存中创建的file-like Object，常用作临时缓冲。

二进制文件和不同字符编码文件读取

下为读取二进制和gbk编码文件，遇到乱码时忽略。

>>> f = open('/Users/michael/gbk.txt', 'rb')
>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk',errors='ignore')

写文件

同读文件，r改成w即可，如果同名想要添加至末尾则可以传入一个’a’。

StringIO和BytesIO

StringIO:在内存中读写str，和文件一样。

 from io import StringIO
>>> f = StringIO('Hello!\nHi!\nGoodbye!')
>>> while True:
...     s = f.readline()
...     if s == '':
...         break
...     print(s.strip())
...
Hello!
Hi!
Goodbye!

BytesIO

顾名思义，读取bytes的IO

>>> from io import BytesIO
>>> f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
>>> f.read()
b'\xe4\xb8\xad\xe6\x96\x87'

注意！有个指针指向问题

如果使用stringIO进行初始化，指针永远会回到开头的位置
如果使用write，则指针会指向write写入的字符串最后！

>>>a = StringIO('abcdefg') 
>>>>a.getvalue() 'abcdefg' 
>>>>a.write('12')
>>>>a.getvalue() '12cdefg'
>>>>a.write('12')
>>>>a.getvalue() '1212efg'

操作文件和目录

Python内置的os模块也可以直接调用操作系统提供的接口函数。
jion,split合并拆分

# 查看当前目录的绝对路径:
>>> os.path.abspath('.')
'/Users/michael'
# 在某个目录下创建一个新目录，首先把新目录的完整路径表示出来:
>>> os.path.join('/Users/michael', 'testdir')
'/Users/michael/testdir'#一定要先join合在一起，不要手打！
# 然后创建一个目录:
>>> os.mkdir('/Users/michael/testdir')
# 删掉一个目录:
>>> os.rmdir('/Users/michael/testdir')
>>> os.path.split('/Users/michael/testdir/file.txt')#拆分
('/Users/michael/testdir', 'file.txt')
>>> os.path.splitext('/path/to/file.txt')#获取拓展名
('/path/to/file', '.txt')
# 对文件重命名:
>>> os.rename('test.txt', 'test.py')
# 删掉文件:
>>> os.remove('test.py')
>>> [x for x in os.listdir('.') if os.path.isdir(x)]#输出所有目录
['.lein', '.local', '.m2', '.npm', '.ssh', '.Trash', '.vim', 'Applications', 'Desktop', ...]

shutil模块中也补充了一些os没有的功能，比如copyfile()等

作业：编写一个能在目录及子子子目录中找到文件名带有某字符串的文件的程序，打印相对路径。

import os
from os import path
def str_in_filename(folder, keystr):
    all_files = os.walk(folder)        # 用walk方法遍历目标路径
    files_list = []
    folder_list = []
    for all_folder, all_folder_name, all_filename in all_files:
        for file_name in all_filename:              
            if keystr.lower() in file_name.lower():         
                files_list.append(path.join(all_folder, file_name)) 
    print(files_list)
if __name__ == "__main__":
    str_in_filename(r'.', 'xls')
    #递归方式实现：方法2
def str_in_filename_re(folder, keystr):
    files_list = os.listdir(folder)
    for filename in files_list:
        full_filename = os.path.join(folder, filename)
        if os.path.isdir(full_filename):
            try:                # 有些目录没有权限进入，会出错，这里要try一下
                str_in_filename_re(full_filename, keystr)       
            except BaseException as e:
                print(e)
        elif keystr.lower() in filename.lower():
            target_list.append(full_filename)
if __name__ == "__main__":
    # str_in_filename(r'.', 'xls')
    target_list = []
    str_in_filename_re(r'D:\Downloads', 'xls')
    print(target_list)

序列化

更改变量时，只存在于内存中，如果不进行存储，就相当于没有进行改变。

我们把变量从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。
Python提供了pickle模块来实现序列化。
过于鸡肋！只能在py中使用，不进行展开！

JSON！

最基础的转换：dumps和loads

>>> import json
>>> d = dict(name='Bob', age=20, score=88)
>>> json_str = json.dumps(d)
'{"age": 20, "score": 88, "name": "Bob"}'
>>> json.loads(json_str)
{'age': 20, 'score': 88, 'name': 'Bob'}

进阶：class与JSON的转换

可以使用default，把他变成一个可以序列为JSON的对象

#前提是类没有定义__slot__
print(json.dumps(s, default=lambda obj: obj.__dict__))
#无前提，但是每一个不同的类都要重写一次，转换成dic再存
def student2dict(std):
    return {
        'name': std.name,
        'age': std.age,
        'score': std.score
    }
#
obj = dict(name='小明', age=20)
s = json.dumps(obj, ensure_ascii=False)#打印中文，如果True则unicode

进程和线程

单核多任务是假多任务：就是操作系统轮流让各个任务交替执行，任务1执行0.01秒，切换到任务2，任务2执行0.01秒，再切换到任务3，执行0.01秒……这样反复执行下去。

多核可以做到多任务，分为以下三种，一般如果任务过多也采用轮询制度：
多进程模式；
多线程模式；
多进程+多线程模式。

一个任务一般是一个进程
一个进程至少有一个线程，可以有多个线程（任务）

多进程

Unix/Linux操作系统提供了一个fork()系统调用（window无！！）

调用一次，会创建父子进程返回两次，子进程永远返回0，而父进程返回子进程的ID，因此子进程通过getppid()可以轻松拿到父进程ID,getpid拿自己的。

multiprocessing
window中只能使用这个来进行多进程的编写

from multiprocessing import Process
import os

# 子进程要执行的代码
def run_proc(name):
    print('Run child process %s (%s)...' % (name, os.getpid()))
#以上为子进程拿自己的ID
if __name__=='__main__':
    print('Parent process %s.' % os.getpid())#父进程拿自己的ID
    p = Process(target=run_proc, args=('test',))
    print('Child process will start.')
    p.start()
    p.join()
    print('Child process end.')

当启动多个线程时，使用线程池来控制线程的多少！

from multiprocessing import Pool
import os, time, random

def long_time_task(name):
    print('Run task %s (%s)...' % (name, os.getpid()))
    start = time.time()
    time.sleep(random.random() * 3)
    end = time.time()
    print('Task %s runs %0.2f seconds.' % (name, (end - start)))

if __name__=='__main__':
    print('Parent process %s.' % os.getpid())
    p = Pool(4)
    for i in range(5):
        p.apply_async(long_time_task, args=(i,))
    print('Waiting for all subprocesses done...')
    p.close()#线程池必须得close
    p.join()
    print('All subprocesses done.')
    #结果如下
Parent process 669.
Waiting for all subprocesses done...
Run task 0 (671)...
Run task 1 (672)...
Run task 2 (673)...
Run task 3 (674)...
Task 2 runs 0.14 seconds.
Run task 4 (673)...
Task 1 runs 0.27 seconds.
Task 3 runs 0.86 seconds.
Task 0 runs 1.41 seconds.
Task 4 runs 1.91 seconds.
All subprocesses done.
#其中主进程创建进程池，启动子进程，关闭进程池，等待子进程完毕，打印。

子进程

可以使用子进程来在python编译中模拟命令行的方式。

import subprocess

print('$ nslookup www.python.org')
r = subprocess.call(['nslookup', 'www.python.org'])
print('Exit code:', r)

进程间通信

import multiprocessing
import time
def foo(aa):
    time.sleep(0.1)
    ss = aa.get()  # 管子的另一端放在子进程这里，子进程接收到了数据
    print('子进程已收到数据...')
    print(ss)  # 子进程打印出了数据内容...

if __name__ == '__main__':  # 要加这行...

    tx = multiprocessing.Queue()  # 创建进程通信的Queue，你可以理解为我拿了个管子来...
    jc = multiprocessing.Process(target=foo, args=(tx,))  # 创建子进程
    jc.start()  # 启子子进程

    print('主进程准备发送数据...')
    tx.put('有内鬼，终止交易！')  # 将管子的一端放在主进程这里，主进程往管子里丢入数据↑
    jc.join()

多线程

Python的多线程是Posix Thread，不是模拟出来的线程。
一般使用import threading即可

import time, threading

# 新线程执行的代码:
def loop():
    print('thread %s is running...' % threading.current_thread().name)
    n = 0
    while n < 5:
        n = n + 1
        print('thread %s >>> %s' % (threading.current_thread().name, n))
        time.sleep(1)
    print('thread %s ended.' % threading.current_thread().name)

print('thread %s is running...' % threading.current_thread().name)
t = threading.Thread(target=loop, name='LoopThread')
t.start()
t.join()
print('thread %s ended.' % threading.current_thread().name)

#结果
thread MainThread is running...
thread LoopThread is running...
thread LoopThread >>> 1
thread LoopThread >>> 2
thread LoopThread >>> 3
thread LoopThread >>> 4
thread LoopThread >>> 5
thread LoopThread ended.
thread MainThread ended.

LOCK

多进程中，同一个变量，各自有一份拷贝存在于每个进程中，互不影响，

而多线程中，所有变量都由所有线程共享，任何一个变量都可以被任何一个线程修改，多个线程同时改一个变量内容就很完全混乱！

import time, threading

# 假定这是你的银行存款:
balance = 0
lock = threading.Lock()
def change_it(n):
    # 先存后取，结果应该为0:
    global balance
    balance = balance + n
    balance = balance - n
def run_thread(n):
    for i in range(100000):
        # 先要获取锁:
        lock.acquire()
        try:
            # 放心地改吧:
            change_it(n)
        finally:
            # 改完了一定要释放锁:
            lock.release()
t1 = threading.Thread(target=run_thread, args=(5,))
t2 = threading.Thread(target=run_thread, args=(8,))
t1.start()
t2.start()
t1.join()
t2.join()
print(balance)
#必须加上run_thread中的锁！不然答案就会变成40 -11 30等

本质上是因为高级语言运算，一条balance+=n会分成两条进行运算，因此每次都要进行4条运算，两次一共进行八条，这八条语句运行的顺序是随机的，因此会导致数值混乱。

参考着改了个画图的小例子，如果加入join则主线程会等子线程完全完成后再继续。

import threading, time, turtle
def draw():
    print("Thread '%s' is running..." % threading.current_thread().name)
    t = turtle.Pen()
    turtle.bgcolor('black')
    colors = ['red', 'yellow', 'green', 'blue']
    for x in range(50):
        t.pencolor(colors[x % 4])
        t.forward(x*2)
        t.right(91)
    print("Thread '%s' is ending..." % threading.current_thread().name)
if __name__ == "__main__":
    print("Thread '%s' is running..." % threading.current_thread().name)
    t = threading.Thread(target=draw, name='DrawThread')
    t.start()
    # t.join()    # 如果加了join，那么主线程就必须一直等待子线程画完之后才能继续，否则就是看上去同时进行。
    n = 0
    while n < 20:
        n += 1
        time.sleep(0.5)
        print('Thread %s ==> %d' % (threading.current_thread().name, n))
    print("Thread '%s' is ending..." % threading.current_thread().name)

Python无法使用多线程利用多核

任何Python线程执行前，必须先获得GIL锁，然后，每执行100条字节码，解释器就自动释放GIL锁，让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁，所以，多线程在Python中只能交替执行，即使100个线程跑在100核CPU上，也只能用到1个核。

因此Python只能使用多进程利用多核，以及使用C扩展多线程多核！

ThreadLocal

使用ThreadLocal可以轻松地调用每一个线程中的独立变量，而不需要一个个写。

每一个线程都可以调用ThreadLocal的变量，ThreadLocal会处理并创建一个个对应不同线程的不同变量，因此不会造成冲突，比如下文中的local_school。

import threading
    
# 创建全局ThreadLocal对象:
local_school = threading.local()

def process_student():
    # 获取当前线程关联的student:
    std = local_school.student
    print('Hello, %s (in %s)' % (std, threading.current_thread().name))

def process_thread(name):
    # 绑定ThreadLocal的student:
    local_school.student = name
    process_student()

t1 = threading.Thread(target= process_thread, args=('Alice',), name='Thread-A')
t2 = threading.Thread(target= process_thread, args=('Bob',), name='Thread-B')
t1.start()
t2.start()
t1.join()
t2.join()

#结果
Hello, Alice (in Thread-A)
Hello, Bob (in Thread-B)

ThreadLocal最常用的地方就是为每个线程绑定一个数据库连接，HTTP请求，用户身份信息等，这样一个线程的所有调用到的处理函数都可以非常方便地访问这些资源。

多进程和多线程对比

多进程：
优点：稳定性高，因为一个子进程崩溃了，不会影响主进程和其他子进程。
缺点：创建进程的代价大，在Unix/Linux系统下，用fork调用还行，在Windows下创建进程开销巨大。另外，操作系统能同时运行的进程数也是有限的，在内存和CPU的限制下，如果有几千个进程同时运行，操作系统连调度都会成问题。

多线程：
优点：在Windows下，多线程的效率比多进程要高。
缺点：任何一个线程挂掉都可能直接造成整个进程崩溃，因为所有线程共享进程的内存。

多任务有很多好处，但是也有坏处。由于有一些切换的开销（保存现场、准备新环境等），因此线程过多也会带来坏处

计算密集型和IO密集型

前者主要是要通过大量的计算来消耗CPU的资源，全靠运算。
后者主要涉及网络、磁盘等，时间花在等IO传输上，一般任务越多效率越高。

异步IO

异步之前解释过了，这里主要是使用单进程单线程模型来执行多任务，这种全新的模型称为事件驱动模型

分布式进程

Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。

以下为一个简单的分布式例子，分别在两个cmd打开，先master后worker

# task_master.py

import random, time, queue
from multiprocessing.managers import BaseManager

# 发送任务的队列:
task_queue = queue.Queue()
# 接收结果的队列:
result_queue = queue.Queue()

# 从BaseManager继承的QueueManager:
class QueueManager(BaseManager):
    pass
def gettask():
    return task_queue
def getresult():
    return result_queue
# 把两个Queue都注册到网络上, callable参数关联了Queue对象:
def do_task_master():
    QueueManager.register('get_task_queue', callable=gettask)
    QueueManager.register('get_result_queue', callable=getresult)
# 绑定端口5000, 设置验证码'abc':
    manager = QueueManager(address=('127.0.0.1', 5000), authkey=b'abc')
# 启动Queue:
    manager.start()
# 获得通过网络访问的Queue对象:
    task = manager.get_task_queue()
    result = manager.get_result_queue()
# 放几个任务进去:
    for i in range(10):
        n = random.randint(0, 10000)
        print('Put task %d...' % n)
        task.put(n)
# 从result队列读取结果:
    print('Try get results...')
    for i in range(10):
        r = result.get(timeout=10)
        print('Result: %s' % r)
# 关闭:
    manager.shutdown()
    print('master exit.')
if __name__ == '__main__':
    do_task_master()
#
# task_worker.py

import time, sys, queue
from multiprocessing.managers import BaseManager

# 创建类似的QueueManager:
class QueueManager(BaseManager):
    pass

# 由于这个QueueManager只从网络上获取Queue，所以注册时只提供名字:
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')

# 连接到服务器，也就是运行task_master.py的机器:
server_addr = '127.0.0.1'
print('Connect to server %s...' % server_addr)
# 端口和验证码注意保持与task_master.py设置的完全一致:
m = QueueManager(address=(server_addr, 5000), authkey=b'abc')
# 从网络连接:
m.connect()
# 获取Queue的对象:
task = m.get_task_queue()
result = m.get_result_queue()
# 从task队列取任务,并把结果写入result队列:
for i in range(10):
    try:
        n = task.get(timeout=1)
        print('run task %d * %d...' % (n, n))
        r = '%d * %d = %d' % (n, n, n*n)
        time.sleep(1)
        result.put(r)
    except Queue.Empty:
        print('task queue is empty.')
# 处理结束:
print('worker exit.')

结果计算n^2，如果将其改成发送邮件则可以做到邮件异步发送

正则表达式

正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则，凡是符合规则的字符串，我们就认为它“匹配”了，否则，该字符串就是不合法的。

\d 可以匹配一个数字
\w 可以匹配一个字母或数字
.可以匹配任意字符
*表示任意个字符（包括0个）
+表示至少一个字符
?表示0个或1个字符
{n}表示n个字符
{n,m}表示n-m个字符：
\s可匹配一个空格或者tab等
\符号可以转义，输出该符号

进阶
[a-zA-Z_][0-9a-zA-Z_]*匹配python合法对象
[a-zA-Z_][0-9a-zA-Z_]{0, 19}最多1+19个字母
A|B可以匹配A或B
^表示行的开头， ^\d表示必须以数字开头
$表示行的结束， $ \d表示必须以数字结束。

re模块
建议使用r来避免转义符号的出现

>>> import re
>>> re.match(r'^\d{3}\-\d{3,8}$', '010-12345')
<_sre.SRE_Match object; span=(0, 9), match='010-12345'>
>>> re.match(r'^\d{3}\-\d{3,8}$', '010 12345')
>>>

切分字符串

>>> re.split(r'\s+', 'a b   c')
['a', 'b', 'c']
>>> re.split(r'[\s\,]+', 'a,b, c  d')
['a', 'b', 'c', 'd']

分组
除了简单地判断是否匹配之外，正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组（Group）

>>> m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345')
>>> m
<_sre.SRE_Match object; span=(0, 9), match='010-12345'>
>>> m.group(0)
'010-12345'
>>> m.group(1)
'010'
>>> m.group(2)
'12345'

贪婪匹配

正则匹配默认是贪婪匹配，也就是匹配尽可能多的字符，加一个?可以非贪婪匹配。

>>> re.match(r'^(\d+?)(0*)$', '102300').groups()
('1023', '00')#贪婪则'102300',''

编译
当我们在Python中使用正则表达式时，re模块内部会干两件事情：

1、编译正则表达式，如果正则表达式的字符串本身不合法，会报错；
2、用编译后的正则表达式去匹配字符串

因此比较复杂时可以进行预编译

>>> import re
# 编译:
>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用：
>>> re_telephone.match('010-12345').groups()
('010', '12345')
>>> re_telephone.match('010-8086').groups()
('010', '8086')

作业：一、验证email
二、验证email并提取名字

import re 
def is_valid_email(addr):
    return bool(re.match(r'^(\w+)(\.\w+)*@(\w+)(\.\w+)*$', addr))
#测试
# 测试:
assert is_valid_email('[email protected]')
assert is_valid_email('[email protected]')
assert not is_valid_email('bob#example.com')
assert not is_valid_email('[email protected]')
print('ok')
#二
import re
def name_of_email(addr):
    ret=re.match(r'?\s*\w*@\w+\.\w+',addr)
    return ret.group(1)
# 测试:
assert name_of_email(' [email protected]') == 'Tom Paris'
assert name_of_email('[email protected]') == 'tom'
print('ok')

你可能感兴趣的:(python自学笔记)

Python自学笔记D9——IO编程、进程、线程和正则表达式谈笑233 python自学笔记
文章目录IO编程文件读写StringIO和BytesIO操作文件和目录序列化进程和线程多进程多线程ThreadLocal多进程和多线程对比分布式进程正则表达式IO编程由于程序和运行时数据是在内存中驻留，由CPU这个超快的计算核心来执行，涉及到数据交换的地方，通常是磁盘、网络等，就需要IO接口。比如你打开浏览器，访问网站，先output请求html信息，接下来Input。所以，通常，程序完成IO操作
大佬的Python自学笔记.pdf，强烈建议收藏程序猿汤姆编程语言 Python 爬虫 python 笔记 pdf pygame 开发语言爬虫学习方法
字节跳动大佬的Python自学笔记这是我的一个朋友自学资料包，通过这个资料包自学拿到了字节跳动的Offer，下面是他之前入门学习Python时候的学习资料，非常全面，从Python基础、到web开发、数据分析、机器学习、深度学习、金融量化统统都有，该手册是HTML版本，左侧是目录，可以点击，右侧是对目录知识点的讲解，适合python学习者，对某些知识点不熟悉的话，将页面保存到浏览器书签，可以快速在
过一遍Python基础---Day4之面向对象斯丢匹德先森关于Python python 开发语言
目录文章声明⭐⭐⭐让我们开始今天的学习吧！面向对象⭐⭐⭐文章声明⭐⭐⭐该文章为我（有编程语言基础，非编程小白）的Python自学笔记知识来源为Python官方文档/菜鸟教程，归纳为自己的语言与理解记录于此不出意外的话，我大抵会持续更新想要了解前端开发（技术栈大致有：Vue2/3、微信小程序、uniapp、HarmonyOS、NodeJS、Typescript）与Python的小伙伴，可以关注我！谢
过一遍Python基础---Day3 斯丢匹德先森关于Python python 开发语言
目录文章声明⭐⭐⭐让我们开始今天的学习吧！元组字典集合文章声明⭐⭐⭐该文章为我（有编程语言基础，非编程小白）的Python自学笔记知识来源为Python官方文档/菜鸟教程，归纳为自己的语言与理解记录于此不出意外的话，我大抵会持续更新想要了解前端开发（技术栈大致有：Vue2/3、微信小程序、uniapp、HarmonyOS、NodeJS、Typescript）与Python的小伙伴，可以关注我！谢谢
过一遍Python基础---Day4 斯丢匹德先森关于Python python 开发语言
目录文章声明⭐⭐⭐让我们开始今天的学习吧！if语句match...case语句for语句while语句break语句、continue语句、pass语句Python推导式列表推导式字典推导式集合推导式元组推导式（生成器表达式）函数lambda（匿名函数）文章声明⭐⭐⭐该文章为我（有编程语言基础，非编程小白）的Python自学笔记知识来源为Python官方文档/菜鸟教程，归纳为自己的语言与理解记录于
过一遍Python基础---Day5 斯丢匹德先森关于Python python 开发语言
目录文章声明⭐⭐⭐让我们开始今天的学习吧！迭代器生成器错误和异常异常处理文章声明⭐⭐⭐该文章为我（有编程语言基础，非编程小白）的Python自学笔记知识来源为Python官方文档/菜鸟教程，归纳为自己的语言与理解记录于此不出意外的话，我大抵会持续更新想要了解前端开发（技术栈大致有：Vue2/3、微信小程序、uniapp、HarmonyOS、NodeJS、Typescript）与Python的小伙伴
Python自学笔记 weixin_45746472 python 开发语言 numpy
文章目录1、变量2、字符串3、常用函数4、模块使用5、数字类型6、布尔类型7、分支和循环8、列表[]9、元组（）10、字符串11、序列12、字典——映射关系13、集合14、函数15、永久存储16、异常1、变量（1）变量名不能以数字开头（2）变量名区分大小写（3）变量名可以用汉字（4）x,y=y,x可以实现x,y值互换2、字符串用单引号或者双引号将内容引起用单还是双取决于字符串中有没有不可避免的单或
【Python自学笔记】python os.getcwd文件目录找不对&&关于“None”在VSCode里面的奇葩报错百里香酚兰笔记
写小组项目的时候需要按照路径读入数据表，数据库和图片列表显示到html，按ChatGPT的答案写了pythonos.getcwd()，结果迁移到同组同学的电脑上总是报错。经过一番查询，在CSDN上发现一个完美解决问题的好帖，特此存下链接方便日后查询：https://blog.csdn.net/weixin_39559015/article/details/110971883?utm_medium=
【Python自学笔记】Flask调教方法Internel Server Error 百里香酚兰 Python自学笔记 python 笔记 flask
收到老师的小组作业任务说是写一个自动报告程序，用Python+SQLite+HTML实现，好吧。前面没什么问题，打开VSCode，连数据库+读数据+处理+可视化+模板拼凑，最后调用Flask框架出网页报告的时候总报错连接不了。但换了jinjia2的渲染代码，又能看见模板和生成的html文件，目录也没有什么问题。模板：生成的html代码：我搜了好几个帖子，最后发现是Flask的路径很刁钻的问题：1.
Python自学笔记鲸鸟与鹿
Python面向对象Python可以运行在任何带有ANSIC编译器的平台上Python源文件通常用.py扩展名Python中默认的编码格式是ASCII格式，在没修改编码格式时无法正确打印汉字，所以在读取中文时会报错。解决方法为只要在文件开头加入#-*-coding:UTF-8-*-或者#coding=utf-8就行了Python标识符在Python里，标识符由字母、数字、下划线组成。在Python
python自学笔记（一）简单爬虫篇忍之刃爬虫 python 网络爬虫
自学python也有2年了（断断续续的，不是一直学习的那种），所以一直没有学精，时间长了把已经学会的也忘记了，用到的时候还要重新去查资料，很不方便还耽误时间。在这里记录一下已学过一些技能，后期用的时候方便查找，不用再去网上找大量资料再去筛选有用的信息了，同时也希望给新入门的同学一些思路，共同学习，共同成长。我是一个纯小白学过来的，在这里建议新手要先把基础打扎实，python的关键词很少，入门很简单
解决Playwright无法登录Google账号的问题 xiaoqiangclub 网络教程 python playwright
文章目录问题描述解决问题免费登录生成代码问题描述当使用playwright需要登入google帐号的时候，有可能会出现下面的情况：无法登录，提示浏览器不安全（因为我们是脚本使用）【Python自学笔记】微软自动化测试工具playwright，微软版selenium解决问题解决上面这个无法登入的问题要分2种情况，如果我们只是需要通过代码来登入，那么很简单，只需要添加参数--disable-blink
《流畅的Python》及Python自学笔记 sdguy_nobody 小点 python 笔记开发语言 git github
学习课程：流畅的Python-木易可3小时快速入门Python北京理工大学Python语言程序设计使用书籍：《流畅的Python》流畅的Python代码实例：《流畅的Python》第1章Python数据模型“散装”知识点：数据类型：整型、浮点型、复数、字符串、列表list[]、元组tuple()、集合、字典dictionary{}数字计算类型变化关系：复数>浮点数>整数逻辑运算：not>and>o
Python自学笔记——基础篇 dreautumn 学习笔记 Python学习笔记 python
本笔记参考视频为：https://www.bilibili.com/video/BV1ex411x7Em?p=101，有兴趣的可以直接移步B站Python编程Sec.1第一个Python程序1第一个HelloPython程序1.1Python源程序的基本概念1.2演练步骤1.3演练扩展——认识错误(BUG)2Python2.x与3.x版本简介3执行Python程序的三种方式3.1解释器python
Python自学笔记8：实操案例五（循环输出26个字母对应的ASCII码值，模拟用户登录，猜数游戏，计算100-999之间的水仙花数）百里香酚兰 Python自学笔记 python 游戏开发语言
Python自学笔记8：实操案例五（循环输出26个字母对应的ASCII码值，模拟用户登录，猜数游戏，计算100-999之间的水仙花数）1.循环输出26个字母对应的ASCII码值第一种是用for循环输出：x=97#代表a的ASCI码值for_inrange(1,27):print(chr(x),'----->',x)#转换成对应的英文字母，再输出ASCII码值x+=1第二种是while循环输出：pr
Python自学笔记三：jupyter notebook buyue__ Python python jupyter
本机环境：macOS11.6+python3.7使用pip安装pip3install--userjupyter如果你安装了Anaconda，那么就无需再次安装jupyternotebook，因为已经内置在里面。Anaconda是Python的数据科学发行版本，不仅自带Python软件，还内置了Jupyter、Pandas、Numpy、Matplotlib等几百种数据科学库。一次安装，应有尽有。当然
Python自学笔记二：Linux 上下载和安装 Python ironmao Python自学笔记 python linux 开发语言
用钢铁意志，成就不平凡人生。上期我们学习了windows下载并安装Pythonhttps://mp.csdn.net/mp_blog/creation/editor/130959185这期我们学习在Linux上下载和安装Python，可以按照以下步骤进行：1.打开终端（Terminal），输入以下命令以更新软件包列表：sudoaptupdat2.安装Python。如果您希望安装最新版本的Pytho
【Python自学笔记】Python必须掌握的技能：使用logging自定义log日志(源码） xiaoqiangclub 自学笔记 python logging 日志
文章目录编程日志配置文件自定义log编程日志这是一个我自己用的编程日志源码（注意：运行时请将下列示例中的中文注释删除，否则可能会报错！）#!/usr/bin/envpython3#coding:utf-8#Author:xiaoqiang#微信公众号:xiaoqiangclub#Software:PyCharm#File:myLogging.py#Time:2021/5/2821:00import
【Python自学笔记】Python好用的模块收集（持续更新...） xiaoqiangclub 网络教程 Python 实用模块
文章目录日志模块钉钉机器人命令助手持续更新中，如果您有其他实用好用的模块欢迎留言...日志模块写代码离不开日志，自定义一个理想的日志对于小白来说可能是一件很反锁的事情，就像我刚学习Python的时候自己写的一个自定义日志，为了解决这个痛点，今天就和大家分享一个可以快速无脑自定义日志的模块nb_log模块简介模块名称项目地址安装命令使用文档nb_log点击访问pipinstall-ihttps://
【Python自学笔记】报错No module Named Wandb 百里香酚兰 Python自学笔记 python 开发语言
【Python自学笔记】已经装了wandb，还报错NomoduleNamedWandb方法1.重启cmd和jupyternotebook直接把窗口和cmd页面全关了，重新打开，再次运行安装和启动代码：!pipinstallwandbimportwandbwandb.init(project="你自己的项目名字",entity="你自己的用户名")具体填什么内容在你wandb的项目官网上会有给你复制
【Python自学笔记】python模糊查找redis数据库中的所有key（keys scan） xiaoqiangclub 自学笔记 redis 数据库 python
文章目录使用key获取数据模糊查找keysscan使用key获取数据使用key从reids数据库中获取对应的value，参考代码#自用代码，仅供参考REDIS_URL="redis://127.0.0.1:6379/1"defget_redis_cache_data(key):"""从redis中获取缓存数据"""ifnot
【Python自学笔记】微软自动化测试工具playwright xiaoqiangclub 自学笔记测试工具 python microsoft playwright
文章目录介绍安装使用截图调试模式动作录制&代码生成点击元素&自动等待相关文档介绍Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。作为针对Python语言纯自动化的工具，可更快的实现自动化。安装依次执行#安装库pipinstallplaywri
【Python自学笔记】re.sub()如何正确的替换单个或多个字符串 xiaoqiangclub 自学笔记 python re re.sub
文章目录re.sub()re.sub()假如我们有一个字符串s='\r\n江南好，风景旧曾谙。日出江花红胜火，春来江水绿如蓝。能不忆江南？\r\n'，现在我们需要将字符串按句换行，可以参考如下示例#_*_coding:UTF-8_*_#开发人员：Xiaoqiang#微信公众号:xiaoqiangclub#开发时间：2022/7/1710:39#文件名称：test.py#项目描述：re.sub()使
Python笔记财务小白的 day6 python编程基础（4）天天向上的orange
【转眼已到2020年。最近3个月真是成堆的压力。春节前稍微闲下来一丢丢，继续开始更新Python自学笔记。】CH6字符串操作1.处理字符串（1）字符串中有引号如何处理。a.双引号image.pngb.转义字符“/”转义字符包含一个倒斜杠（\），紧跟着是想要添加到字符串中的字符。（尽管它包含两个字符，但大家公认它是一个转义字符。）image.pngimage.pngc.原始串字符可以在字符串开始的引
【Python自学笔记】Python异步装饰器 xiaoqiangclub 自学笔记 python 开发语言异步装饰器
文章目录说明同步装饰器异步装饰器说明python中的装饰器让我们的代码更加灵活简洁，在同步的情况下我们可以很简单的写出一个同步装饰器，但是在异步函数的情况下，我们要如何写这个装饰器呢，具体方式请参考下列代码同步装饰器示例代码#_*_coding:UTF-8_*_#开发人员：Xiaoqiang#微信公众号：xiaoqiangclub#开发时间：2022/4/309:15#文件名称：decorator
Python自学笔记1：定义了函数但是还报未定义？百里香酚兰 Python自学笔记 python 开发语言
Python自学笔记：定义了函数但是还报未定义？省流助手：解决办法：试试把报未定义的函数放在main函数前面解题过程：这几天因为项目作业需要，在b站上找了个Python教程想入入门网课传送门（非广告）好不容易，看到了最后的实战项目——学生信息管理系统照着老师敲完第137节的代码，一运行发现报错，说未定义我不理解，于是求助大佬同学，大佬说要不你把menu函数移到main函数前面看看？我觉得这很扯，因
Python自学笔记——3.基础数据类型转换闻浅问涧
基础数据类型转换数据类型转换的形式自动类型转换强制类型转换可变数据类型：列表，字典，集合不可变数据类型；字符串，数字，元组容器数据类型：字符串，列表，元组，字典，集合非容器数据类型：数字1.自动类型转换a=Trueb=2c=3.14d=1+2jprint(a+b,type(a+b))print(b+c,type(b+c))print(c+d,type(c+d))当两个不用的数值进行运算时，结果会向
Python自学笔记——4.运算符闻浅问涧
运算符算术运算符赋值运算符比较运算符逻辑运算符成员运算符算数运算符a=2b=3c=5d=-5f='abc'g='def'm=[a,a,a,a,c,a,c,d,f,f]n=[b,b,b,b,b,c,a,a,g,b]o=['+','-','*','/','%','**','//','//','+','*']foriinrange(0,10):x,y=m[i],n[i]ifi==0:z=x+yelifi
Python自学笔记——1.变量的定义闻浅问涧
第一种定义a=10b=20第二种定义a,b=10,20交换变量的数据a=10b=20c=aa=bb=c
Python自学笔记——2.数据类型闻浅问涧
数据类型数据类型就是数据的表现形式常用的数据类型字符串类型string数字类型整型int浮点型float复数complex布尔型bool列表类型list元组类型tuple字典类型dict集合类型set1.字符串类型a='itisstra'b="itisstrb"c='itis"strc"'d='''itisalongstr.itisalongstr.itisalongstr.'''e='ab\tc
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR