jeffery0207

python subprocess-更优雅的创建子进程

简介

如PEP324所言，在任何编程语言中，启动进程都是非常常见的任务，python也是如此，而不正确的启动进程方式会给程序带来很大安全风险。Subprocess模块开发之前，标准库已有大量用于进程创建的接口函数（如os.system、os.spawn*），但是略显混乱使开发者难以抉择，因此Subprocess的目的是打造一个“统一”模块来提供之前进程创建相关函数的功能实现。与之前的相关接口相比，提供了以下增强功能：

一个“统一”的模块来提供以前进程创建相关函数的所有功能；
跨进程异常优化：子进程中的异常会在父进程再次抛出，以便检测子进程执行情况；
提供用于在fork和exec之间执行自定义代码的钩子;
没有隐式调用/bin/sh，这意味着不需要对危险的shell meta characters进行转义；
支持文件描述符重定向的所有组合；
使用subprocess模块，可以控制在执行新程序之前是否应关闭所有打开的文件描述符；
支持连接多个子进程 ;
支持universal newline；
支持communication()方法，它使发送stdin数据以及读取stdout和stderr数据变得容易，而没有死锁的风险;

subprocess 基础

`subprocess.run`

subprocess推荐使用run 函数来处理它所能够处理的一切cases, 如果需要更高级灵活的定制化使用，则可以使用其底层的popen接口来实现。run函数signature为：

def subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, capture_output=False, shell=False, cwd=None, timeout=None, check=False, encoding=None, errors=None, text=None, env=None, universal_newlines=None, *other_popen_kwargs)->subprocess.CompletedProcess:
  pass

上面写的参数只是最常见的参数，完整的函数列表在很大程度上与popen函数的参数相同，即这个函数的大多数参数都被传递到该接口。(timeout、input、check和capture_output除外)。该函数常用参数如下：

args，必选参数，数据类型应为一个string 或则一个sequence（list, tuple等等）。通常最好传递一个sequence，因为它允许模块处理任何必需的参数转义和引用; 如果传递的是字符串，则shell必须为True，否则该字符串必须简单地为要执行的程序的名字，而不能指定任何参数。

在复杂情况下，构建一个sequence-like的参数可以借助shlex.split()来实现

>>> import shlex, subprocess
>>> command_line = input()
/bin/vikings -input eggs.txt -output "spam spam.txt" -cmd "echo '$MONEY'"
>>> args = shlex.split(command_line)
>>> print(args)
['/bin/vikings', '-input', 'eggs.txt', '-output', 'spam spam.txt', '-cmd', "echo '$MONEY'"]
>>> p = subprocess.Popen(args) # Success!

shell模式执行等同于：Popen(['/bin/sh', '-c', args[0], args[1], ...])

## 以下两句代码等价,都是通过shell模式执行`ls -l`
subprocess.run('ls -l', shell=True)
subprocess.run(['/bin/sh', '-c', 'ls -l'], shell=False)

## 下面代码通过非shell模式执行`ls -l`
subprocess.run(['ls', '-l'], shell=False)

# 下面代码实际执行的是`ls`
subprocess.run(['/bin/sh', '-c', 'ls', '-l'], shell=False)

当使用shell=True时，要注意可能潜在的安全问题，需要确保所有空格和元字符都被适当地引用，以避免shell注入漏洞。如下面的例子：

from shlex import quote

>>> filename = 'somefile; rm -rf ~' # 有这么一个奇怪的文件名
>>> command = 'ls -l {}'.format(filename)
>>> print(command)  # executed by a shell: boom!
ls -l somefile; rm -rf ~
>>> subprocess.run(command, shell=True)  # 这时就会有极大的安全隐患

>>> command = 'ls -l {}'.format(quote(filename))  # 使用shlex.quote对文件名进行正确的转义
>>> print(command)
ls -l 'somefile; rm -rf ~'
>>> subprocess.run(command, shell=True)

capture_output , 如果capture_output=True，则将捕获stdout和stderr，调用时内部的Popen对象将自动使用stdout=PIPE和stderr = PIPE创建标准输出和标准错误对象；传递stdout和stderr参数时不能同时传递capture_output参数。如果希望捕获并将两个stream合并为一个，使用stdout=PIPE和stderr = STDOUT。
check，如果check=True，并且进程以非零退出代码退出，则将抛出CalledProcessError异常。
input，该参数传递给Popen.communicate()，然后传递给子进程的stdin。该参数数据类型应为字节序列（bytes）;但如果指定了encoding , errors参数或则 text=True，参数则必须为字符串。使用该参数时，内部Popen对象，将使用stdin = PIPE自动创建该对象，不能同时使用stdin参数。
timeout，该参数传递给Popen.communicate()，如果指定时间之后子进程仍未结束，子进程将被kill，并抛出TimeoutExpired异常。
stdin，stdout和stderr分别指定执行程序的标准输入，标准输出和标准错误文件的file handles。如subprocess.PIPE, subprocess.DEVNULL, 或者 None。此外，stderr可以设定为subprocess.STDOUT，这表示来自子进程的stderr数据应重定向到与stdout相同的file handle中。默认情况下，stdin，stdout和stderr对应的file handle都是以binary的方式打开。
encoding, errors , text 。当传递encoding, errors参数或 text=True时，stdin，stdout和stderr对应的file handle以text的模式打开。universal_newlines 和text同义，为了保持向下兼容而保留。默认情况下，文件对象以二进制的方式打开。
env，通过传递mappings对象，给子进程提供环境变量，该参数直接传递给Popen函数。
shell, 如果shell=True，则将通过Shell执行指定的命令。当使用shell=True时，shlex.quote() 函数可用于正确地转义字符串中的空格和Shell元字符。
函数返回数据类型为subprocess.CompletedProcess, 该对象包含以下属性或方法：
- args, 调用该进程的参数，同subprocess.run(args，***) 中的args；
- returncode，当值为0时，代表子进程执行成功；负值 -N 指示进程被signal N所终止 (POSIX only); None代表未终止；
- stdout,stderr ,代表子进程的标准输出和标准错误；
- check_returncode(), check子进程是否执行成功，若执行失败将抛出异常；

old high level interfaces

run 函数在 Python 3.5 新增，之前使用该模块的high level interface包括三个函数: call(), check_call(), check_output()。这三个函数参数和subprocess.run()的函数参数含义相同。但需要注意的是，这三个函数的参数列表略微不同，函数signature如下：

subprocess.call(args, *, stdin=None, stdout=None, stderr=None, shell=False, cwd=None, timeout=None, **other_popen_kwargs)

执行args参数所指定的程序并等待其完成。当shell=True, 无论子进程执行成功与否，返回值为return code;当shell=False，子进程如果执行失败，将会抛出异常；该函数旨在对os.system()进行功能增强，同时易于使用。

subprocess.check_call(args, *, stdin=None, stdout=None, stderr=None, shell=False, cwd=None, timeout=None, **other_popen_kwargs)

执行args参数所指定的程序并等待其完成，如果子进程返回0，则函数返回；若子进程失败，则抛出异常；
subprocess.check_output(args, *, stdin=None, stderr=None, shell=False, cwd=None, encoding=None, errors=None, universal_newlines=None, timeout=None, text=None, **other_popen_kwargs)

执行args参数所指定的程序并返回其输出，如果子进程执行失败将抛出异常; 该函数的返回值默认为bytes

注意: 请勿在subprocess.call及``subprocess.check_call中使用stdout=PIPE或stderr=PIPE。如果子进程输出信息过大将会耗尽OS管道缓冲区的缓冲，该子进程将阻塞; 要禁止这两个函数的stdout或stderr，可以通过subprocess.DEVNULL`设置。

`subprocess.Popen`

`Popen构造函数`

上面四个high level interfaces 底层的进程创建及进程管理实际上都是基于subprocess.Popen类来实现，当需要定制化更灵活的进程调用时，这个函数会是一个更好的选择。首先看该类的构造函数如下：

class subprocess.Popen(args, bufsize=-1, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, shell=False, cwd=None, env=None, universal_newlines=None, startupinfo=None, creationflags=0,start_new_session=False,restore_signals=True,close_fds=True,pass_fds=(), *, encoding=None, errors=None, text=None):
  pass

此时，你会发现很多熟悉的参数。因为high level function本身大部分参数也确实传递给了Popen类。该类的作用即是创建 (fork) 并执行 (exec) 子进程。在POSIX，该类使用类似os.execvp()的方式执行子进程；在windows上，则使用windows系统的CreateProcess()函数执行子进程。Popen构造函数参数十分丰富，除了上面介绍的还有一大堆参数需要注意。close_fds, pass_fds与file handle相关；restore_signals与POSIX信号相关；start_new_session, startupinfo, creationflags则和子进程的创建相关；另外，以下参数可能需要特别关注：

bufsize, 在创建stdin / stdout / stderr管道文件对象时，bufsize将作为open()函数的相应参数
- 0 代表unbuffered
- 1 代表 line buffered
- 其他正数代表buffer size
- 负数代表使用系统默认的buffer size (io.DEFAULT_BUFFER_SIZE)

excutable，这个参数不常见，当shell=True时，在POSIX上，可使用该参数指定不同于默认的/bin/shshell来执行子进程；而当shell=False时，这个用法似乎不太常见，我能想到的一个例子可能如下：
```
## 以下两行命令等价
>>> subprocess.run(['bedtools','intersect', '--help'])
>>> subprocess.run(['','intersect', '--help'], executable='bedtools')
```
From 官方文档： executable replaces the program to execute specified by args. However, the original args is still passed to the program. Most programs treat the program specified by args as the command name, which can then be different from the program actually executed.
preexec_fn, 该参数可绑定一个callable对象，该对象将在子进程执行之前在子进程中调用。需要注意的是，在应用程序中存在线程的情况下，该参数应该避免使用，可能会引发死锁。

def say_hello():
  print('hello!!!')
subprocess.run(['ls'], preexec_fn=say_hello)

cwd, 指定该参数时，函数在执行子进程之前将会将工作目录设置为cwd。

`Popen方法与属性`

Popen.poll() check子进程是否已终止，如果结束则返回return code，反之返回None
Popen.wait(timeout=None)等待子进程终止，如果timeout时间内子进程不结束，则会抛出TimeoutExpired异常

当使用stdout=PIPE 或则 stderr=PIPE时，避免使用该函数，使用``Popen.communicate()`以避免死锁的发生。
Popen.communicate(input=None, timeout=None)

与进程交互：将input指定数据发送到stdin；从stdout和stderr读取数据，直到到达文件末尾，等待进程终止。所以，返回值是一个tuple: (stdout_data, stderr_data)。如果timeout时间内子进程不结束，则会抛出TimeoutExpired异常。其中需要注意的是，捕获异常之后，可以再次调用该函数，因为子进程并没有被kill。因此，如果超时结束程序的话，需要现正确kill子进程：
```
proc = subprocess.Popen(...)
try:
    outs, errs = proc.communicate(timeout=15)
except TimeoutExpired:
    proc.kill()
    outs, errs = proc.communicate()
```
Popen.send_signal(signal) 向子进程发送信号
Popen.terminate() 停止子进程，在POSIX上，实际上即是向子进程发送SIGTERM信号；在windows上则是调用TerminateProcess()函数
Popen.kill() 杀掉子进程，在POSIX上，实际上即是向子进程发送SIGKILL信号；在windows上则是调用terminate()函数
属性包括.args：子进程命令；.returncode：子进程终止返回值；.pid：子进程进程号；.stdin,.stdout, .stderr分别代表标准输入输出，标准错误，默认为bytes，这几个属性类似于open()函数返回值，是一个可读的stream对象

异常处理

subprocess模块共包含三个异常处理类: 基类SubprocessError, 及其两个子类TimeoutExpired,CalledProcessError，前者在在等待子进程超时时抛出；后者在调用check_call()或check_output()返回非零状态值时抛出。他们共同的属性包括:

cmd , 该子进程的命令
output , 子进程所capture的标准输出 (如调用run()或则check_output())，否则为None
stdout, output的别名
stderr, 子进程所capture的标准错误 (如调用run()) ,否则为None

TimeoutExpired还包括timeout，指示所设置的timeout的值；CalledProcessError则还包括属性returncode;

Subprocess 应用

在官方文档中给出很多例子指导我们如何使用subprocess替代旧的接口，具体例子如下：

shell 命令行, 比如要实现一个简单的shell command line 命令 ls -lhrt，可以有以下几种等价的方式：

## shell cmd ls -lhrt
>>> output = check_output(["ls", "-lhrt"])
>>> subprocess.run(['ls', '-lhrt'], stdout=subprocess.PIPE).stdout
>>> output = subprocess.Popen(["ls", "-lhrt"], stdout=subprocess.PIPE).communicate()[0]

shell 管道操作，比如想看一个文件前100行中哪些数据包含关键字’python’，shell cmd可以这样写：cat test.txt | head -n 100 | grep python，使用subprocess可以这样写：

>>> from subprocess import *
>>> p1 = Popen(["cat", 'test.txt'], stdout=PIPE)
>>> p2 = Popen(["head", "-n", "100"], stdin=p1.stdout, stdout=PIPE)
>>> p3 = Popen(["grep", "python"], stdin=p2.stdout, stdout=PIPE)
>>> output = p3.communicate()[0]
>>> output.decode()

替代os.system()，前面有提到subprocess.call()是为os.system设置的增强版，应用如下：

from subprocess import *
try:
    retcode = call("ls" + " -hrtl", shell=True)
    if retcode < 0:
        print("Child was terminated by signal", -retcode, file=sys.stderr)
    else:
        print("Child returned", retcode, file=sys.stderr)
except OSError as e:
    print("Execution failed:", e, file=sys.stderr)

替代os.spawn*()，该家族包括八个变体，os.spawnl(), os.spawnle(), os.spawnlp(), os.spawnlpe(), os.spawnv(), os.spawnve(), os.spawnvp(), os.spawnvpe(), l和v变体分别代表fixed parameters和variable parameters, p变体函数默认使用环境变量$PATH寻找program file (如ls, cp)，e变体则是函数增加一个env mappings 参数来指定子进程执行的环境变量，不使用当前进程的环境变量，具体见官方文档 os.spawn*。官方建议这些函数都可用subprocess替代，如常见的两个场景如下：
```
### 场景1 P_NOWAIT
pid = os.spawnlp(os.P_NOWAIT, "ls", "ls", "-hlrt")
==>
pid = Popen(["/bin/mycmd", "myarg"]).pid

### 场景2
retcode = os.spawnlp(os.P_WAIT, "/bin/mycmd", "mycmd", "myarg")
==>
retcode = call(["/bin/mycmd", "myarg"])
```

替代os.popen*()，该系列一共包括4个变体，分别是os.popen(), os.popen2(), os.popen3(),os.popen()4，首先需要理解的是os.popen()是基于subprocess.Popen实现的一个方法，用于从一个命令打开一个管道，存在r或w两种模式。比如：

>>> f = os.popen(cmd='ls -lhrt', mode='r', buffering=-1)  # cmd必须是字符串，其以shell的方式执行
>>> f.read()
'total 0\n-rw-r--r-- 1 liunianping qukun 8 Jan 29 20:50 test.txt\n'
>>>
>>> f.close()

而剩下三个变体其实不是基于subprocess来实现的，并且功能差别仅仅在于返回值，三者返回值依次是：(child_stdin, child_stdout), (child_stdin, child_stdout, child_stderr), (child_stdin, child_stdout_and_stderr), 因此，我们自然也可以使用subprocess模块函数来替代它：

### popen2
(child_stdin, child_stdout) = os.popen2(cmd, mode, bufsize)
## ==>
p = Popen(cmd, shell=True, bufsize=bufsize,
          stdin=PIPE, stdout=PIPE, close_fds=True)
(child_stdin, child_stdout) = (p.stdin, p.stdout)

### popen3
(child_stdin,
 child_stdout,
 child_stderr) = os.popen3(cmd, mode, bufsize)
## ==>
p = Popen(cmd, shell=True, bufsize=bufsize,
          stdin=PIPE, stdout=PIPE, stderr=PIPE, close_fds=True)
(child_stdin,
 child_stdout,
 child_stderr) = (p.stdin, p.stdout, p.stderr)
 
### popen4
 (child_stdin, child_stdout_and_stderr) = os.popen4(cmd, mode, bufsize)
## ==>
p = Popen(cmd, shell=True, bufsize=bufsize,
          stdin=PIPE, stdout=PIPE, stderr=STDOUT, close_fds=True)
(child_stdin, child_stdout_and_stderr) = (p.stdin, p.stdout)

其他

subprocess中还提供另外两个python2.x中 commands模块中的旧版shell调用功能getstatusoutput和getoutput，查看python源码可以看到它的实现其实也非常简单，就是借助subprocess.check_output()函数捕获shell 命令的输出，最终返回return_code以及output:

def getstatusoutput(cmd):
    try:
        data = check_output(cmd, shell=True, text=True, stderr=STDOUT)
        exitcode = 0
    except CalledProcessError as ex:
        data = ex.output
        exitcode = ex.returncode
    if data[-1:] == '\n':
        data = data[:-1]
    return exitcode, data

def getoutput(cmd):
    return getstatusoutput(cmd)[1]

写在篇尾

subprocess是基于python2 中popen2模块发展而来，专门为替代python中众多繁杂的子进程创建方法而设计，平时使用的过程中，subprocess.run()以及subprocess.call可以满足我们大多数的使用需求，但是更深入的了解该package的设计思想可以让我们更加灵活的控制复杂场景下的子进程任务。

参考

python3 subprocess
PEP324

你可能感兴趣的:(Python,python,多进程)

Python网络爬虫核心面试题闲人编程程序员面试 python 爬虫开发语言面试网络编程
网络爬虫1.爬虫项目中如何处理请求失败的问题？2.解释HTTP协议中的持久连接和非持久连接。3.什么是HTTP的持久化Cookie和会话Cookie？4.如何在爬虫项目中检测并处理网络抖动和丢包？5.在爬虫项目中，如何使用HEAD请求提高效率？6.如何在爬虫项目中实现HTTP请求的限速？7.解释HTTP2相对于HTTP1.1的主要改进。8.如何在爬虫项目中模拟HTTP重试和重定向？9.什么是COR
Python全局解释器锁GIL与多线程程序媛一枚~ Python OpenCV 图像处理 Python进阶 Python OpenCV python 多线程全局解释器锁GIL
Python中如果是I/O密集型的操作，用多线程（协程Asyncio、线程Threading），如果I/O操作很慢，需要很多任务/线程协同操作，用Asyncio，如果需要有限数量的任务/线程，那么使用多线程。如果是CPU密集型操作，用多进程（multeprocessing）。一、GILGIL（GlobalInterpreterLock，即全局解释器锁），Python实质上并不存在真正的多线程，只有
Python 面试时需要知道的 10 个问题及详解迪小莫学AI python 面试开发语言
Python面试时需要知道的10个问题及详解在Python的面试中，考察的重点通常是基础知识、编程思维和实际应用能力。掌握Python的核心概念不仅能帮助你在面试中脱颖而出，还能让你在实际工作中高效编写代码。下面我们将详细解答10个Python面试中常见的问题，帮助你更加深入理解Python的基本特性和应用。1.Python中的全局、受保护和私有属性是什么？在Python中，属性的访问权限并不像J
python解奥赛运算题 Python数据分析与机器学习 python 开发语言算法贪心算法
有一个以文字代替数字的算术表达式如下图所示，已知4个替代数字的文字中没有重复，编写程序求出文字所替代的数字。按逻辑思维:如果3位数和3位数相加等于4位数，则“青”只能是1:“山”+“青”大于等于10，因此“山”只能是9，得出“龙”是0:个位的两个“山”相加，推得“外”等于8。而按计算思维，则注重于程序的实现，用穷举法设计嵌套的4层循环，把所有的数字都试一遍，找出4个数字不相互重复的合满足加法等式条
《CPython Internals》阅读笔记：p285-p328 codists 读书笔记 python
《CPythonInternals》学习第15天，p285-p328总结，总计44页。一、技术总结1.shallowcomparisonp285,InObjectsobject.c,thebaseimplementationoftheobjecttypeiswritteninpureCcode.Therearesomeconcreteimplementationsofbasiclogic,like
《CPython Internals》阅读笔记：p250-p284 codists 读书笔记 python
《CPythonInternals》学习第14天，250-p284总结，总计25页。一、技术总结介于我觉得作者写得乱七八糟的，读完我已经不想说话了，所以今日无技术总结。二、英语总结(生词：2)1.spawn(1)spawn:来自于词根expandere。(2)expandere:ex-(“out”)+pandere(“tospread”)spawn原来的意思是“spreadingoutoffish
《CPython Internals》阅读笔记：p221-p231 codists 笔记
《CPythonInternals》学习第12天，p221-p231总结，总计11页。一、技术总结无。二、英语总结(生词：2)1.atatimeidiom.separately(单独地)inthespecifiedgroups(一次)。示例：(1)Icanonlydoonethingatatim(我一次只能做一件事)。(2)Wecarriedtheboxestwoatatimeupthestair
《CPython Internals》阅读笔记：p152-p176 codists 读书笔记 python
《CPythonInternals》学习第10天，p152-p176总结，总计25页。一、技术总结1.addinganitemtoalistmy_list=[]my_list.append(obj)上面的代码涉及两个指令：LOAD_FAST,LIST_APPEND。整章看下来这有这点算是可以记的了，其它的只感觉作者在零零碎碎的罗列内容。二、英语总结(生词：1)无。关于英语的注解同步更新汇总到htt
《CPython Internals》阅读笔记：p1-p19 codists 笔记
《CPythonInternals》学习第1天，p1-p19总结，总计19页。一、技术总结无。二、英语总结(生词：2)1.humblevshumbled(1)humble:humus(“earth”)adj.字面意思是“ontheground”,后面引申为“lowlyinkind,state,condition(卑微)”,“notproudthatyouareimportant(谦卑)”。(2)h
Linux离线安装Python chudu
#下载openssl，如果不先安装openssl，后续pip、requests库使用会有很多问题wget--no-check-certificatehttps://www.openssl.org/source/openssl-1.1.1g.tar.gztar-zxvfopenssl-1.1.1g.tar.gzcdopenssl-1.1.1g./configshared--openssldir=/u
深入解析：使用 Python 爬虫获取苏宁商品详情数据小爬虫@ python 爬虫开发语言
在当今数字化时代，电商数据已成为市场分析、用户研究和商业决策的重要依据。苏宁易购作为国内知名的电商平台，其商品详情页包含了丰富的信息，如商品价格、描述、评价等。这些数据对于商家和市场研究者来说具有极高的价值。本文将详细介绍如何使用Python爬虫获取苏宁商品的详细信息，并提供完整的代码示例。一、爬虫简介爬虫是一种自动化程序，用于从互联网上抓取网页内容。Python因其简洁的语法和强大的库支持，成为
【网络安全 | Python爬虫】URL、HTTP基础必知必会秋说爬虫 http 网络安全
文章目录URL概念及组成结构HTTP概念简述浏览器接收资源HTTP协议的结构请求结构请求行请求头请求体请求差异及参数说明响应结构状态行响应头响应体推广URL概念及组成结构在开始爬虫的开发实战前，需要了解的是URL的概念及组成结构，这具有基础性和必要性。URL（UniformResourceLocator，统一资源定位符）是用于在互联网上定位和标识资源的字符串。它提供了一种标准的方式来指示资源的位置
什么是网络爬虫？Python爬虫到底怎么学？糯米导航文末下载资源 python
最近我在研究Python网络爬虫，发现这玩意儿真是有趣，干脆和大家聊聊我的心得吧！咱们都知道，网络上的信息多得就像大海里的水，而网络爬虫就像一个勤劳的小矿工，能帮我们从这片浩瀚的信息海洋中挖掘出需要的内容。接下来，我就带你们一步步看看该怎么用Python搞定网络爬虫。为啥选择Python写爬虫？说到Python，简直是写爬虫的最佳选择！它有许多现成的库，就像拥有了各种好用的工具，使得我们的工作变得
《CPython Internals》阅读笔记：p329-p335 codists 读书笔记 python
《CPythonInternals》学习第16天，p329-p335总结，总计7页。一、技术总结1.debuggingp331,Therearetwotypesofdebugger,consoleandvisual——作者将debugger分为两类：(1)console：lldb(MAC系统使用),GDB(Linux系统使用))。(2)visual：VisualStudioDebugger,CLi
大模型：LangChain技术讲解玉成226 【大模型】langchain
一、什么是LangChain1、介绍LangChain是一个用于开发由大型语言模型提供支持的Python框架。它提供了一系列工具和组件，帮助我们将语言模型集成到自己的应用程序中。有了它之后，我们可以更轻松地实现对话系统、文本生成、文本分类、问答系统等功能。2、LangChain官网文档官网：https://python.langchain.com/docs/introduction/3、LangC
lisp语言与python_Lisp 语言优点那么多，为什么国内很少运用？特殊后勤小干事 lisp语言与python
为什么Lisp没有流行起来本文探讨的是为什么Lisp语言不再被广泛使用的。很久以前，这种语言站在计算机科学研究的前沿，特别是人工智能的研究方面。现在，它很少被用到，这一切并不是因为古老,类似古老的语言却被广泛应用.其他类似的古老的语言有FORTRAN,COBOL,LISP,BASIC,和ALGOL家族,这些语言的唯一不同之处在于,他们为谁设计,FORTRAN是为科学家和工程师设计的,他们在计算机上
CS书籍、代码资源下载网址 sun_kang CS Guide &&Links linux java tutorials debian documentation linux内核
CS网址收藏啄木鸟Pythonic开源社区：http://www.woodpecker.org.cn/中国IT实验室（游戏开发）：http://game.chinaitlab.com/游戏开发资源网：http://www.gameres.com/国内游戏开发论坛：http://bbs.gameres.com/国外的游戏开发站：http://www.gamedev.net/《问道》游戏开发论坛：ht
Python爬虫项目合集：200个Python爬虫项目带你从入门到精通人工智能_SYBH 爬虫试读 2025年爬虫百篇实战宝典:从入门到精通 python 爬虫数据分析信息可视化爬虫项目大全 Python爬虫项目合集爬虫从入门到精通项目
适合人群无论你是刚接触编程的初学者，还是已经掌握一定Python基础并希望深入了解网络数据采集的开发者，这个专栏都将为你提供系统化的学习路径。通过循序渐进的理论讲解、代码实例和实践项目，你将获得扎实的爬虫开发技能，适应不同场景下的数据采集需求。专栏特色从基础到高级，内容体系全面专栏内容从爬虫的基础知识与工作原理开始讲解，逐渐覆盖静态网页、动态网页、API数据爬取等实用技术。后续还将深入解析反爬机制
FunASR语言识别的环境安装、推理山山而川_R FunASR r语言 xcode 开发语言
目录一、环境配置1、创建虚拟环境2、安装环境及pytorch官网：pytorch下载地址3、安装funasr之前，确保已经安装了下面依赖环境:python代码调用（推荐）4、模型下载5、启动funasr服务二、客户端连接2.1html连接三、推理识别模型1、实时语音识别2、非实时语音识别一、环境配置源码地址：FunASRFunASR/README_zh.mdatmain·alibaba-damo-
安装线程自由（无GIL锁）Python及Pytorch方法为什么每天的风都这么大 python pytorch 开发语言
参考资料：https://py-free-threading.github.io/installing_cpython/https://github.com/pytorch/pytorch/issues/130249https://download.pytorch.org/whl/torch/截至当前（2025.1.22），最新的线程自由Python版本为13.1，因此下面的方法适用于该版本安装P
如何使用python技术爬取下载百度文库文档？大懒猫软件 python 百度开发语言
使用Python爬取百度文库文档需要通过分析网页结构和接口请求来实现。以下是一个基于搜索结果的实现方法，适用于爬取百度文库中的文档内容：第一部分：获取百度文库文档实现步骤获取文档ID和基本信息通过文档的URL获取文档ID，并解析页面内容以获取文档的类型、标题等信息。请求文档信息接口使用getdocinfo接口获取文档的页数、MD5校验码等参数。请求文档正文内容根据文档类型（如txt、doc等），请
使用Motherduck构建云端DuckDB服务 GEAWfaacc oracle 数据库 python
技术背景介绍Motherduck是一种托管的DuckDB云端服务，它允许用户在云中轻松地管理和查询DuckDB数据库。DuckDB是一个内存内分析数据库，专为处理分析型工作负载而设计，与其在本地运行不同，Motherduck提供了一个云平台来管理和扩展这些数据库任务。在本文中，我们将深入探讨如何通过Python设置和使用Motherduck服务，包括具体的代码实现。核心原理解析通过Motherdu
Scheme语言的区块链程韵珂包罗万象 golang 开发语言后端
Scheme语言的区块链探索引言区块链技术自从比特币推出以来，已迅速成为全球瞩目的焦点。其去中心化、不易篡改的特点使得区块链在多个领域展现出了巨大的潜力。通常，区块链的实现主要依赖于多种编程语言，例如C++、Java、Python等。然而，Scheme语言以其独特的表达能力和强大的抽象特性，也为区块链的实现提供了新的视角。本文将深入探讨Scheme语言如何在区块链中发挥作用，并介绍如何使用Sche
Perl语言的软件开发工具 Code侠客行包罗万象 golang 开发语言后端
Perl语言的软件开发工具引言Perl是一种功能强大且灵活的高级编程语言，自1987年由拉里·沃尔（LarryWall）创建以来，就广泛应用于文本处理、系统管理、网络编程、Web开发等多个领域。作为一种脚本语言，Perl以其简洁的语法和强大的正则表达式处理能力而受到开发者的青睐。在实际开发过程中，虽然没有像Java或Python那样广泛流行，但Perl也有着自己独特的生态系统，其中包括许多强大的开
【Python实战】元组！编程小白的必修课！努力学习的耶耶 python
想对大家说的话：大家好呀，耶耶最近打算开一起新的专栏，带着大家敲代码，让大家在了解python理论的基础上学会实操，真正做到大彻大悟！在这里，我会将Python代码像拆解精密玩具一样，一步步剖析，确保每一步的来龙去脉都清晰可见。我会详细解释为什么选择特定的关键字和结构，通过对比不同类型的代码片段，让你不仅知其然，更知其所以然！！！拜托大家给我点一个关注！让我们一起进步吧！！！上期本期学习了如何处理
Python酷库之旅-第三方库Pandas(056) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲211、pandas.Series.truncate方法211-1、语法211-2、参数211-3、功能211-4、返回值211-5、说明211-6、用法211-6-1、数据准备211-6-2、代码示例211-6-3、结果输出212、pandas.Series.where方法212-1、语法212-2、参数212-3、功能212-4、返回值212-5、说明212-6、用法212-6
2025年01月18日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：MiniCPM-o项目地址url：https://github.com/OpenBMB/MiniCPM-o项目语言：Python历史star数：15141今日star数：736项目维护者：yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介：MiniCPM-o2.6：适用于手机上视觉、语音和多模式直播的GPT-4o级多模态大规模语
pycharm无法创建python file_pycharm无法导入本地模块的解决方式 weixin_39873356 file
最近学习python的django，需要导入本地的view模块，参考一些别人导入包的方法importsyssys.path.append('C:\\Users\\hhua\\Desktop')#括号中的内容为A所在的目录importA.Demo1#不能加.py否则会报错(错误为没有这个文件A.Demo1.py)但是不论用相对路径导入还是绝对路径导入，运行都会出错，但是我又用命令行试了一遍，发现命令
GitHub Actions是什么 ZhangJiQun&MXP 2021 论文教学 github workflow
目录GitHubActions是什么GitHubActions的使用方法示例注意事项GitHubActions配置文件中-工作流的：Workflow一、自动化任务执行二、规范团队协作三、灵活配置和定制四、提高开发效率五、集成GitHub生态六、可复用性和共享性仓库中的“Actions”部分，特别是聚焦于在M1Mac上执行Python测试的工作流程。以下是对界面上各个部分的详细解释：顶部导航栏：包含
python字符串处理函数汇总程序媛小本 python 开发语言
Python是一种充满活力的编程语言，其用途范围广泛，其中包括字符串处理。Python提供了许多强大的字符串处理函数库，可以方便地对字符串进行各种操作。在本文中，我们将讨论Python字符串处理函数的各种用途和方法，以及如何利用这些函数来解决常见的字符串处理问题。一、字符串的基本操作字符串是Python中最常用的数据类型之一，它们可以用单引号或双引号来表示。Python字符串处理函数可以处理许多字
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found