weixin_30435261

Python基础教程【读书笔记】 - 2016/7/31

希望通过博客园持续的更新，分享和记录Python基础知识到高级应用的点点滴滴！

第十波：第10章充电时刻

　　Python语言的核心非常强大，同时还提供了更多值得一试的工具。Python的标准安装包括一组模块，称为标准库standard library、展示这些模块的工作方式，讨论如何分析它们，学习它们所提供的功能。

[10.1] 模块

　　已经知道如何创建和执行自己的程序，也学会了怎么用import从外部模块获取函数并且为自己的程序使用。接下来看看怎么编写自己的模块。

[10.1.1] 模块是程序

　　任何Python程序都可以作为模块导入。程序的名字很重要，保存的位置也很重要。在导入模块的时候，可能会看到有新文件出现---这个以.pyc为扩展名的文件时经过编译的，已经转换成Python能够更加有效地处理的文件。如果稍后导入同一个模块，python会导入.pyc文件而不是.py文件，除非.py文件已经改变---在这种情况下，会生成新的.pyc文件。删除.pyc文件不会顺海程序---必要的时候会创建新的.pyc文件。

　　如你所见，在导入模块的时候，其中的代码被执行了。不过如果再次导入模块，就什么都不会发生了：

　　>>>import hello

　　>>>hello world!

　　>>>import hello

　　>>>

　　为什么这次没用了呢？因为导入模块并不意味着在导入时执行某些操作。它们主要用于定义，比如变量、函数和类等。此外，因为只需要定义这些东西一次，导入模块多次和导入一次的效果是一样的。

[10.1.2] 模块用于定义

　　模块在第一次导入到程序中时被执行。真正的用处在于他们（像类一样）可以保持自己的作用域。这就意味着定义的所有类和函数以及赋值后的变量都称为模块的特性。这看起来挺复杂得，用起来却很简单。

　　1. 在模块中定义函数

　　假设我们编写了一个模块，并且将它存储为hello2.py文件。可以像下面这样导入：

　　>>>import hello2

　　模块会被执行，这意味着hello函数在模块的作用域内被定义了。因此可以通过以下方式来访问函数：

　　>>>hello2.hello()

　　hello world!

　　可以通过同样的方法来使用任何在模块的全局作用域中定义的名称。

　　为什么要这样做呢？为什么不在主程序中定义好一切呢？主要原因四代码重用code reuse。如果把代码放在模块中，就可以再多个程序中使用这些代码。为了让代码可重用，请将它模块化！

　　2. 在模块中增加测试代码

　　模块用来定义函数、类和其他一些内容，但是有些时候，在模块中添加一些检查模块本身是否正常工作的测试代码是很有用的。　举例来说，假如想要确保hello函数工作正常，你可能会将hello2模块重写为新的模块，如下代码：

　　#hello3.py

　　def hello():

　　　　print "hello,world!"

　　# A test

　　hello()

　　这看起来是合理的---如果将它作为普通程序运行，会发现它能够正常工作。但如果将它作为模块导入，然后再其他程序中使用hello函数，测试代码就会被执行：

　　>>>import hello3

　　hello,world!

　　>>>hello3.hello()

　　hello,world!

　　这可不是你想要的。避免这种情况的关键在于：“告知”模块本身是作为程序运行还是导入其他程序。为了实现这一点，需要使用__name__变量：

　　>>>__name__

　　'__main__'

　　>>>hello3.__name__

　　'hello3'

　　如你所见，在“主程序”中，变量__name__的值是'__main__'。而在导入的模块中，这个值就被设定为模块的名字。因此，为了让模块的测试代码更加好用，可以将其放置在if语句中，如下代码清单：

　　# hello4.py

　　def hello():

　　　　print "hello,world!"

　　def test():

　　　　hello()

　　if __name__=='__main__":test()　

　　如果将它作为程序运行，hello函数会被执行。而作为模块导入时，它的行为就会像普通模块一样：

　　>>>import hello4

　　>>>hello4.hello()

　　hello,world!

　　我们将测试代码放在了test函数中，也可以直接将它们放入if语句。但是，将测试代码放入独立的test函数会更灵活，这样做既是在把模块导入其他程序之后，仍然可以对其进行测试。如果需要编写完整的测试代码，将其放置在单独的程序中会更好。

[10.1.3] 让你的模块可用

　　在理想的情况下，一开始sys.path本身就应该包含正确的目录（包括你的模块的目录）。有两种方法可以做到这一点：一是将模块放置在合适的位置，另外则是告诉解释器去哪里查找需要的模块。

　　1. 将模块放置在正确位置

　　将你的模块放置在正确的位置是很容易的。只需要找出python解释器从哪里查找模块，然后将你的文件放置在那里即可。

　　如果机器上的python解释器是由管理员安装的，而你又没有管理员权限，可能无法将你的模块存储在python使用的目录中。这种情况下，需要使用另外一个解决方案：告诉解释器去哪里查找。

　　那些（称为搜索路径的）目录的列表可以在sys模块中的path变量中找到：

　　 >>>import sys,pprint

　　>>>pprint.pprint(sys.path)

　　['C:\\Python\\Lib\\idlelib',

　　...,

　　'C:\\Python\\lib\\site-packages']

　　提示：如果你的数据结构过大，不能在一行打印完。可以使用pprint模块中的pprint函数替代普通的print语句。pprint是个相当好的打印函数，能够提供更加智能的打印输出。

　　每个字符串都提供了一个放置模块的目录，解释器可以从这些目录中找到所需要的模块。尽管这些目录都可以使用，但是site-packages目录是最佳选择，因为它就是用来做这些事情的。查看你的sys.path，找到site-packages目录。只要将模块放入类似site-packages目录中，所有程序就都能将其导入了。

　　2. 告诉编辑器去哪里找

　　标准的实现方法是在PYTHONPATH环境变量中包含模块所在的目录。PYTHONPATH环境变量的内容会因为使用的操作系统不同而有差异，但从基本上来说，它于sys.path很类似---是一个目录列表。

　　环境变量并不是Python解释器的一部分---它们是操作系统的一部分，基本上，它相当于python变量，不过是在python解释器外设置的。在UNIX和MACOX中，可以在主目录中找到它，将下面命令添加到这个文件中，从而将~/python加入到PYTHONPATH：

　　export PYTHONPATH=$PYTHONPATH:~/python

　　注意，多个路径以冒号分隔。在windows系统中，开始菜单>设置>控制面板>双击系统图标。在“高级”选项卡，点击“环境变量”按钮，其中一栏是用户变量，另外一栏是系统变量。需要修改的是用户变量，“编辑”按钮进行编辑PYTHONPATH。

　　3. 命名模块

　　包含模块代码的文件的名字要和模块名一样。再加上.py扩展名。

[10.1.4] 包

　　为了组织好模块，你可以讲它们分组为包package。包基本上就是另外一类模块，有趣的地方就是它们能包含其他模块。当模块存储在文件中时，包就是模块所在的目录。为了让python将其作为包对待，它必须包含一个命名为__init__.py的文件。如果将它作为普通模块导入的话，文件的内容就是包的内容。比如有个名为constants的包，文件constants/__init__.py包括语句PI=3.14，可以像下面这么做：

　　import constants

　　print constants.PI

　　为了将模块放置在包内，直接把模块放在包目录内即可。

　　比如，如果要建立一个叫做drawing的包，其中包括名为shapes和colors的模块，就需要创建如下所示的文件和目录：

　　~/python/　　　　　　PYTHONPATH中的目录

　　~/python/drawing/　　　　包目录（drawing包）

　　~/python/drawing/__init__.py　　　　　　包代码（drawing模块）

　　~/python/drawing/colors.py　　　　　　　 colors模块

　　~/python/drawing/shapes.py　　　　　　 shapes模块

　　假定已经将目录~/python放置在PYTHONPATH中。依照这个设置，下面的语句都是合法的：

　　import drawing　　　　# imports the drawing package

　　import drawing.colors　　　　# import the colors module

　　from drawing import shapes 　　　　# import the shapes module

　　在第1条语句drawing中__init__模块的内容是可用的，但drawing和colors模块则不可用。在执行第2条语句之后，colors模块可用了，但只能通过全名drawing.colors来使用。在执行第3条语句之后，shapes模块可用，可以通过短名（也就是仅使用shapes）来使用。

[10.2] 探究模块

　　在讲述标准库模块前，先学会如何独立地探究模块。这种技能极有价值。

[10.2.1] 模块中有什么

　　探究模块最直接的方式就是在python解释器中研究他们。当然，要做的第一件事就是导入它。

　　>>>import copy

　　没有引发异常---所以它是存在的，但是它能做什么？它又有什么？

　　1. 使用dir　

　　查看模块包含的内容可以使用dir函数，它会将对象（以及模块的所有函数、类、变量等）的所有特性列出。例如打印出dir(copy)的内容，一些名字以下划线开始---暗示（约定俗成）它们并不是为在模块外部使用而准备的。

　　>>>[n for n in dir(copy) if not n.startswith('_')]　

　　2. __all__变量

　　可以列表本身获得正确答案。在完整的dir(copy)列表中，可能注意到了__all__这个名字。这个变量包含一个列表，这个列表在模块本身中被设置。

　　>>>copy.__all__

　　['Error','copy','deepcopy']

　　__all__列表从哪来，它为什么会在那？第一个问题容易回答，它是在copy模块内部被设置的，像下面这样：

　　__all__=['Error','copy','deepcopy']

　　那么它为什么在那呢？它定义了模块的共有接口（public interface）。更准确地说，它告诉解释器：从模块导入所有名字表示什么含义。因此，如果你使用如下代码：

　　from copy import *

　　那么你只能使用__all__变量中的3个函数。要导入PyStringMap的话，你就得显式的实现，或者导入copy然后使用copy.PyStringMap，或者使用from copy import PyStringMap。

　　在编写模块的时候，像设置__all__这样的技术是相当有用的。因为模块中可能会有一大堆其他程序不需要或不想要的变量、函数和类，__all__会“客气地”将它们过滤了出去。如果没有设定__all__，用import *语句默认将会输出模块中所有不以下划线开头的全局名称。

[10.2.2] 用help获取帮助

　　对语言的精通程度决定了对模块探究的深度。还有个标注函数能够为你提供日常所需的信息，这个函数叫做help。

　　>>>help(copy.copy)

　　help in function copy in module copy:

　　copy(x)

　　　　shallow copy operation on arbitrary Python objects.

　　　　see the module's __doc__ string for more info.

　　这些内容告诉你：copy带有一个参数x，并且是“浅复制操作”。还提到了模块的__doc__字符串。__doc__文档字符串，它是写在函数开头并且简述函数功能的字符串。这个字符串可以通过函数的__doc__特性引用。模块也可以有文档字符串（写在模块开头），类也一样（写在类开头）。

　　事实上前面的帮助文本是从copy函数的文档字符串中取出的：

　　>>>print copy.copy.__doc__

　　使用help与直接检查文档字符串相比，它的好处在于会获得更多信息，比如函数签名（也就是所带的参数）。试着调用help(copy)会打印出很多信息，包括copy和deepcopy之间区别的透彻的讨论（从本质来说，deepcopy(x)会将存储在x中的值作为属性进行复制，而copy(x)只是复制x，将x中的值绑定到副本的属性上）。

[10.2.3] 文档

　　模块信息的自然来源当然是文档。可以直接查看：

　　>>>print range.__doc__

　　这样就获得了关于range函数的精确描述。有些时候需要十分透彻地描述这些模块和函数是如何工作的。所有的这些文档都可以在Python网站（http://python.org/doc）找到。

[10.2.4] 使用源代码

　　阅读源代码，是学习Python最好的方式。但问题在于源代码在哪里呢？一种方案是检查sys.path，然后自己找。另外一种快捷的方法是检查模块的__file__属性：

　　>>>print copy.__file__

　　但注意一些模块并不包含任何可以阅读的Python源代码。它们可能已经融入到解释器内了（比如sys模块），或者可能是C程序语言携程的。

[10.3] 标准库：一些最爱

　　“充电时刻”用于描述Python丰富的标准库。模块的描述并不完全，但是会强调每个模块比较有趣的特征。

[10.3.1] sys

　　sys模块让你能够访问与Python解释器联系紧密的变量和函数。如下是sys模块中一些重要的函数和变量：

　　argv　　　　命令行参数，包括脚本名称

　　exit([arg]　　　　退出当前的程序，可选参数为给定的返回值或者错误信息

　　modules　　　　映射模块名字到载入模块的字典

　　path　　　　　　查找模块所在目录的目录名列表

　　platform　　　　类似sunos5或者win32的平台标识符

　　stdin　　　　　　标准输入流---一个类文件file-like对象

　　stout　　　　　标准输出流---一个类文件对象

　　stderr　　　　　标准错误流---一个类文件对象

　　变量sys.argv包括传递到python解释器的参数，包括脚本名称。

　　函数sys.exit可以退出当前程序。可以提供一个整数作为参数，用来标识程序是否成功运行。或者可以提供字符串参数，用作错误信息，对于用户找出程序停止运行的原因会很有用。这样，程序就会在退出的时候提供错误信息和标识程序运行失败的代码。

　　映射sys.modules将模块名映射到实际存在的模块上，它只应用于目前导入的模块。

　　sys.path是一个字符串列表，其中的每个字符串都是一个目录名。在import语句执行时，解释器就会从这些目录中查找模块。

　　sys.platform模块变量是解释器正在其上运行的平台的名称。

　　sys.stdin、sys.stdout和sys.stderr模块变量是类文件流对象。它们表示标准UNIX概念中的标准输入、标准输出和标准错误。简单来说，Python利用sys.stdin获得输入（比如用于函数input和raw_input中的输入），利用sys.stdout输出。

　　举例来说，思考下反序打印参数的问题。当你通过命令行调用Python脚本时，可能会在后面加上一些参数---这就是命令行参数。这些参数会放置在sys.argv列表中，脚本的名字为sys.argv[0]。反序打印这些参数如下：

　　# reverseargs.py

　　import sys

　　args = sys.argv[1:]

　　args.reverse()

　　print ' '.join(args)

　　对sys.argv进行了复制。可以修改原始的列表，但是这样做通常是不安全的，因为程序的其他部分可能也需要原始参数的sys.argv。跳过了sys.argv的第一个元素---脚本的名字。使用args.reverse()方法对列表进行反向排序，但是不能打印出这个操作的结果---这是个返回None的原地修改操作。下面是另外一种做法：

　　print ' '.join(reversed(sys.argvp[1:]))

[10.3.2] OS

　　OS模块为你提供了访问多个操作系统服务的功能。os模块包括的内容很多。os和它的子模块os.path还包括一些用于检查、构造、删除目录和文件的函数，以及一些处理路径的函数。

　　environ　　　　对环境变量进行映射；

　　system　　　　在子shell中执行操作系统命令

　　sep　　　　　　路径中的分割符

　　pathsep　　　分隔路径的分隔符

　　linesep　　　　行分隔符（'\n','\r','\r\n'）

　　urandom(n)　返回n字节的加密强随机数据

　　os.environ映射包含环境变量。比如要访问系统变量PYTHONPATH，可以使用表达式os.environ['PYTHONPATH']。这个映射也可以用来更高系统环境变量，不过并非所有系统都支持。

　　os.stem函数用户运行外部程序。

　　os.sep模块变量是用于路径名中的分隔符。

　　模块变量os.linesep用于文本文件的字符串分隔符。

　　urandom函数使用一个依赖于系统的随机数的源。

　　windows特有的函数---os.startfile。接受一般路径，就算包含空格也没有问题。

[10.3.3] fileinput

　　fileinput模块让你能够轻松地遍历文本文件的所有行。如果通过以下方式调用脚本：

　　$python some_script.py file1.txt file2.txt file3.txt

　　这样可以依次对file1到file3文件中的所有行进行遍历。比如在UNIX的管道中，使用标准的UNIX命令cat：

　　$cat file.txt | python some_script.py

　　fileinput.input是其中最重要的函数。它会返回能够用于for循环遍历的对象。如果不想使用默认行为（fileinput查找需要循环遍历的文件），那么可以给函数提供（序列形式的）一个或多个文件名。还能降inplace参数设置为真值以进行原地处理。对于要访问的每一行，需要打印出替代的内容，以返回到当前的输入文件中。在进行原地处理的时候，可选的backup参数将文件名扩展备份到通过原始文件创建的备份文件中。

　　input([files[,inplace[,backup]])　　　　便于遍历多个输入流中的行

　　filename()　　　　　　　　　　返回当前文件的名称

　　lineno()　　　　　　　　　　　返回当前（累计）的行数

　　filelineno()　　　　　　　　　返回当前文件的行数

　　isfirstline()　　　　　　　　　检查当前行是否是文件的第一行

　　isstdin()　　　　　　　　　　　检查最后一行是否来自sys.stdin

　　nextfile()　　　　　　　　　　关闭当前文件，移动到下一个文件

　　close()　　　　　　　　　　　关闭序列

　　fileinput.filename函数返回当前正在处理的文件名。

　　fileinput.lineno返回当前的行数，这个数值是累计的，所以在完成一个文件的处理并且开始处理下一个文件的时候，行数并不会重置，而是将上一个文件的最后行数加1作为计数的起始。

　　fileinput.filelineno函数返回当前处理文件的当前行数。每次处理完一个文件并且开始处理下一个文件时，行数都会重置为1，然后重新开始计数。

　　fileinput.isfirstline函数在当前行是当前文件的第一行时返回真值，反之返回假值。

　　fileinput.isstdin函数在当前文件为sys.stdin时返回真值，否则返回假值。

　　fileinput.nextfile函数会关闭当前文件，跳到下一个文件，跳过的行并不计。

　　fileinput.close函数关闭整个文件链，结束迭代。

　　# numberlines.py

　　import fileinput

　　for line in fileinput.input(inplace=True):

　　　　line=line.rstrip()

　　　　num=fileinput.lineno()

　　　　print '%-40s # %2i' % (line,num)

　　注意，要小心使用inplace参数---它很容易破坏文件。

[10.3.4] 集合、堆和双端队列

　　在计算机编程当中，我们可以看到很多有用的数据结构，而python支持其中相对通用的类型。例如字典（或者说散列表）、列表（或者说动态数组）是语言必不可少的一部分。其他一些数据结构尽管不是那么重要，但有些时候也能派上用场。

　　1. 集合

　　集合set在，Set类位于sets模块中。集合通过set类型的实现称为了语言的一部分，这意味着不需要导入sets模块，就可以直接创建集合。如set(range(10))。集合是由序列或者其他可迭代的对象构建的，主要用于检查成员资格，因此副本是被忽略的。和字典一样，集合元素的顺序是随意的，因此不应该以元素的顺序作为依据进行编程。

　　除了检查成员资格外，还可以使用标准的集合操作，比如求并集和交集。比如想要找出两个集合并集，可以使用其中一个集合的union方法或者使用按位与运算符“|”：

　　a=set([1,2,3])

　　b=set([2,3,4])

　　>>>a.union(b)

　　>>>a|b

　　set([1,2,3,4])

　　以下列出了一些其他方法和对应的运算符，方法的名称已经清楚地表明了其用途：

　　&、<=、>=、-、^、

　　如果需要一个函数，用于查找并且打印两个集合的并集，可以使用来自set类型的union方法的未绑定版本，这种做法很有用，比如结合reduce来使用：

　　mySets=[]　　

　　for i in range(10):

　　　　mySets.append(set(range(i,i+5)))

　　reduce(set.union,mySets)

　　集合是可变的，不能用做字典中的键。另外一个问题就是集合本身只能包含不可变值，所以也就不能包含其他集合。在实际当中，集合的集合是很常用的，通过frozenset类型，用于代表不可变的集合：

　　a=set()

　　b=set()

　　a.add(b)　　# TypeError:set objects are unhashable

　　a.add(frozenset(b))

　　frozenset构造函数创建给定集合的副本，不管是将集合作为其他集合成员还是字典的键，frozenset都很有用。

　　2. 堆

　　另外一个众所周知的数据结构是堆heap。它是优先队列的一种。使用优先队列能够以任意顺序增加对象，并且能在任何时间找到最小的元素，也就是说它比用于列表的min方法要有效率得多。

　　事实上，python中没有独立的堆类型---只有一个包含一些堆操作函数的模块，这个模块叫做heapq（q是queue的缩写，即队列），包含6个函数。其中4个直接和堆操作相关。你必须将列表作为堆对象本身。

　　heappush(heap,x)　　　　将x入堆

　　heappop(heap)　　　　　将堆中最小的元素弹出

　　heapify(heap)　　　　　　将heap属性强制应用到任意一个列表

　　heapreplace(heap,x)　　将堆中最小的元素弹出，同时将x入堆

　　nlargest(n,iter)　　　　　返回iter中第n大的元素

　　nsmallest(n,iter)　　　　返回iter中第n小的元素

　　heappush函数用于增加堆的项。注意，不能将它用于任何之前讲述的列表中---只能用于通过各种堆函数简历的列表中。原因是元素的顺序很重要（尽管看起来是随意排列，元素并不是进行严格排序的）。

　　from heapq import *

　　from random import shuffle

　　data=range(10)

　　shuffle(data)

　　heap=[]

　　for n in data:

　　　　heappush(heap,n)

　　[0,1,3,6,2,8,4,7,9,5]

　　heappush(heap,0.5)

　　[0,0.5,3,6,1,8,4,7,8,5,2]

　　元素的顺序并不像看起来那么随意。它们虽然不是严格排序的，但是也有规则的：位于i位置上的元素总比i//2位置处的元素大（反过来说就是i位置处的元素总比2*i以及2*i+1位置处的元素小）。这是底层算法的基础，而这个特性称为堆属性heap property。

　　heappop函数弹出最小的元素---一般来说都是在索引0处的元素，并且会确保剩余元素中最小的那个占据这个位置（保持刚才提到的堆属性）。一般来说，尽管弹出列表的第一个元素并不是很有效率得，但是这里不是问题，因为heappop在“幕后”会做一些精巧的移位操作。

　　heapify函数使用任意列表作为参数，并且通过尽可能少的移位操作，将其转换为合法的堆。如果没有用heappush建立堆，那么在使用heappush和heappop前应该使用这个函数。

　　heap=[5,8,0,3,6,7,9,1,4,2]

　　heapify(heap)

　　>>>heap

　　[0,1,5,3,2,7,9,8,4,6]

　　heapq模块中剩下的两个函数nlargest(n,iter)和nsamllest(n,iter)分别用来寻找任何可迭代对象iter中第n大或第n小的元素。你可以使用排序和分片完成这个工作，但是堆算法更快而且更有效地使用内容。

　　3. 双端队列（以及其他集合类型）

　　双端队列double-ended queue。在需要按照元素增加的顺序来移除元素时非常有用。python增加了collections模块，它包括deque类型。

　　双端队列通过可迭代对象（比如集合）创建，而且有些非常有用的方法。

　　from collections import deque　　

　　q=deque(range(5))

　　q.append(5)

　　q.appendleft(6)

　　>>>q

　　deque([6,0,1,2,3,4,5])

　　>>>q.pop()

　　>>>q.popleft()

　　>>>q.rotate(3)

　　>>>q

　　deque([2,3,4,0,1])

　　双端队列好用的原因是它能够有效地在开头（左侧）增加和弹出元素，这是在列表中无法实现的。除此之外，使用双端队列的好处还有：能够有效地旋转（rotate）元素（也就是将它们左移或者右移，使头尾相连）。双端队列对象还有extend和extendleft方法，extend和列表的extend方法差不多，extendleft则类似于appendleft、

[10.3.5] time

　　time模块所包括的函数能够实现以下功能：获取当前时间、操作时间和日期、从字符串读取时间以及格式化时间为字符串。日期可以用实数，或者是包含9个整数的元组。这些整数的意义如下所示，比如，元组：

　　(2009,1,21,12,2,56,0,21,0)

　　表示2008年1月21日12时2分56秒，星期一，并且是当前的第21天。

　　如下表Python日期元组的字段含义。

　　索引　　　　字段　　　　　　值

　　0　　　　　　年

　　1　　　　　　月

　　2　　　　　　日

　　3　　　　　　时

　　4　　　　　　分

　　5　　　　　　秒

　　6　　　　　　周

　　7　　　　　　儒历日

　　8　　　　　　夏令时

　　time模块中最重要的函数如下所示：

　　asctime([tuple])　　　　　　将时间元组转换为字符串

　　localtime([secs])　　　　　将秒数转换为日期元组，以本地时间为准

　　mktime(tuple)　　　　　　将时间元组转换为本地时间

　　sleep(secs)　　　　　　　　休眠（不做任何事情）secs秒

　　strptime(string[,format])　将字符串解析为时间元组

　　time()　　　　　　　　　　当前时间

　　函数time.asctime将当前时间格式转化为字符串：

　　>>>time.asctime()

　　'Fri Dec 22 05:21:27 2009'

　　函数time.localtime将实数转换为本地时间的日期元组。如果想获得全球统一时间，则可以使用gmtime。

　　函数time.mktime将日期元组转换为从新纪元开始计算的描述，它于localtime的功能相反。

　　函数time.sleep让解释器等待给定的描述。

　　函数time.strptime将asctime格式化过的字符串转换为日期元组。

　　函数time.time使用自然新纪元开始计算的描述返回当前时间。尽管每个平台的新纪元可能不同，但是你仍然可以通过计算某时间发生前后time的结果来对该时间计时，然后计算差值。

　　此外，python还提供了两个和时间密切相关的模块：datetime（支持日期和时间的算法）和timeit（帮助开发人员对代码段的执行时间进行计时）。

[10.3.6] random

　　random模块包括返回随机数的函数，可以用于模拟或者用于任何产生随机输出的程序。

　　事实上，所产生的数字都是伪随机数（pseudo-random），也就是说它们看起来是完全随机的，但实际上，它们以一个可预测的系统作为基础。不过，由于这个系统模块在伪装随机方面十分优秀，所以也就不必要对此过多担心了（除非为了实现强加密的目标，因为在这种情况下，这些数字就显得不够强了，无法抵抗某些特定的攻击）。如果需要真的随机性，应该使用os模块的urandom函数。random模块内的SystemRandom类也是基于同种功能，可以让数据接近真正的随机性。

　　这个模块中的一些重要函数如下所示：

　　random()　　　　　　　　返回0≤n<1之间的随机实数n

　　getrandbits(n)　　　　　以长整型形式返回n个随机位

　　uniform(a,b)　　　　　　返回实际实数n，其中a≤n

　　randrange([start],stop,[step])　　　　返回range([start],stop,[step])中的随机数

　　choice(seq)　　　　　　从序列seq中返回随机元素

　　shuffle(seq[,random])　　　　原地制定序列seq

　　sample(seq,n)　　　　　　　　从序列seq中选择n个随机且独立的元素

　　函数random.random是基本的随机函数之一，它只是返回0~1的伪随机数。除非这就是你想要的，否则你应该使用其他提供了额外功能的函数。random.getrandbits以长整型形式返回给定的位数。如果处理的是真正的随机事物，这个函数尤为有用。

　　为函数random.uniform提供两个数值参数a和b，它会返回在a~b的随机（平均分布的）实数n。所以，比如需要随机的角度值，可以使用uniform(0,360)。

　　调用函数range可以获得一个范围，而使用与之相同的参数来调用标准函数random.randrange则能够产生该范围内的随机整数。比如想要获得1-10的随机数，可以使用randrange(1,11)，如果想要获得小于20的随机正奇数，可以使用randrange(1,20,2)。

　　函数random.choice从给定序列中选择随机元素。

　　函数random.shuffle将给定序列的元素进行随机位移，每种排列的可能性都是近似相等的。

　　函数random.sample从给定序列中选择给定数目的元素，同时确保元素互不相同。

　　从统计学的角度来说，还有些于uniform类似的函数，它们会根据其他各种不同的分布规则进行抽取，从而返回随机数。这些分布包括贝塔分布、指数分布、高斯分布，等等。

　　from random import *

　　from time import *

　　date1=(2008,1,1,0,0,0,-1,-1,-1)

　　time1=mktime(date1)

　　date2=(2009,1,1,0,0,0,-1,-1,-1)

　　time2=mktime(date2)

　　random_time=uniform(time1,time2)

　　print asctime(localtime(random_time))

[10.3.7] shelve

　　下一张会介绍如何在文件中存储数据。但如果只需要一个简单的存储方案，那么shelve模块可以满足你大部分的需要。shelve中唯一有趣的函数是open。在调用它的时候（使用文件名作为参数），它会返回一个Shelf对象，可以用它来存储内容。只需要把它当做普通的字典来操作即可，在完成工作（并且将内容存储到磁盘中）之后，调用它的close方法。

　　1. 潜在的陷阱

　　shelve.open函数返回的对象并不是普通的映射是很重要的。如下面的例子所示：

　　import shelve

　　s=shelve.open('test.dat')

　　s['x]=['a','b','c']

　　s['x'].append('d')

　　>>>s['x']

　　['a','b','c']

　　'd'去哪了？很容易解释：当你在shelf对象中查找元素的时候，这个对象都会根据已经存储的版本进行重新构建，当你将元素赋给某个键的时候，它就被存储了。上述例子中执行的操作如下：

　　列表['a','b','c']存储在键x下；

　　获得存储的表示，并且根据它来创建新的列表，而‘d’被添加到这个副本中。修改的版本还没有被保存！

　　最终，再次获得原始版本---没有‘d’！

　　为了正确地使用shelv模块修改存储的对象，必须将临时变量绑定到获得的副本上，并且在它被修改后重新存储这个副本：

　　temp=s['x']

　　temp.append('d')

　　s['x']=temp

　　>>>s['x']

　　['a','b','c','d']

　　python2.4之后的版本还有个解决方法：将open函数的writeback参数设为true。如果这样做，所有从shelf读取或者赋值到shelf的数据结构都会保存在内存（缓存）中，并且只有在关闭shelf的时候才写回到磁盘中。如果处理的数据不大，并且不想考虑这些问题，那么将writeback设为true的方法还是不错的。

　　2. 简单的数据库示例

　　如下代码给出了一个简单的使用shelf模块的数据库应用程序。

　　# database.py

　　import sys.shelve

　　def store_person(db):

　　　　"""

　　　　query user for data and store it in the shelf object

　　　　"""

　　　　pid=raw_input('Enter unique ID number: ')

　　　　person={}

　　　　person['name']=raw_input('Enter name:')

　　　　person['age']=raw_input('Enter age:')

　　　　person['phone']=raw_input('Enter phone number:')

　　　　db[pid]=person

　　def lookup_person(db):

　　　　"""

　　　　query user for ID and desired field.and fetch the corresponding data from the shelf object

　　　　"""

　　　　pid=raw_input('Enter ID number:')

　　　　field=raw_input('What would you like to know?(name,age,phone) ')

　　　　field=field.strip().lower()

　　　　print field.capitalize()+':',db[pid][field]　　

　　def print_help():

　　　　print 'the available commands are:'

　　　　print 'store:stores information about a person'

　　　　print 'lookup:looks up a person from ID number'

　　　　print 'quit:save changes and exit'

　　　　print '? :prints this message'

　　def enter_command():

　　　　cmd=raw_input('Enter command(? for help):')

　　　　cmd=cmd.strp().lower()

　　　　return cmd

　　def main():

　　　　database=shelf.open('C:\\database.dat')

　　　　try:

　　　　　　while True:

　　　　　　　　cmd=enter_command()

　　　　　　　　if cmd=='store':

　　　　　　　　　　store_person(database)

　　　　　　　　elif cmd=='lookup':

　　　　　　　　　　lookup_person(database)

　　　　　　　　elif cmd=='?':

　　　　　　　　　　print help()

　　　　　　　　elif cmd=='quit':

　　　　　　　　　　return

　　finally:

　　　　database.close()

　　if __name__=='__main__':main()　　

　　将所有内容都放到函数中会让程序更加结构化（可能的改进是将函数组织为类的方法）；

　　主程序放在main函数中，只有在if __name__=='__main__'条件成立的时候才被调用，这意味着可以在其他程序中将这个程序作为模块导入，然后调用main函数；

　　在main函数中打开数据库shelf，然后将其作为参数传递给另外需要它的函数。当然也可以使用全局变量。不过在大多数情况下最好避免使用全局变量；

　　在一些值中进行读取之后，对读取的内容调用strip金额lower函数以生成一个修改后的版本。这么做的原因在于：如果提供的键与数据库存储的键相匹配，那么他们应该完全一样。如果总是对用户的输入使用strip和lower函数，那么就可以让用户随意输入大小写字母和添加空格。

　　使用try/finally确保数据库能正确关闭。我们永远不知道什么时候会出错。如果程序在没有正确关闭数据库的情况下终止，那么数据库文件就有可能被损坏了，这样的数据文件是毫无用处的。使用try/finally就可以避免这种情况。

[10.3.8] re

　　re模块包含对正则表达式regular expression的支持。学习正则的关键是一次只学习一点---查找满足特定任务需要的那部分内容，预先将它们全部记住是没有必要的。接下来将会对re模块主要特征和正则表达式的进行介绍。

　　1. 什么是正则表达式

　　正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串，可以匹配其自身。可以用这种匹配行为搜索文件中的模式，并且用计算后的值替换特定模式，或者将文本进行分段。

　　通配符

　　正则表达式可以匹配多于一个的字符串，可以使用一些特殊字符创建这类模式。比如点好（.）可以匹配任何字符（除了换行符），所以正则表达式'.ython'可以匹配字符串‘python’和‘jython’。还能匹配‘qython’、‘+ython’或者 ‘ ython’（第一个字母是空格），但是不会匹配‘cpython’或者‘ython’这样的字符串，因为点好只能匹配一个字母，而不是两个或零个。

　　因为它可以匹配“任何字符串”（除换行符外的任何单个字符），点好就称为通配符wildcard。

　　对特殊字符进行转义

　　在正则表达式中如果将特殊字符作为普通字符使用会遇到问题。比如，假设需要匹配字符串‘python.org’，直接用‘python.org’模式可以吗？这么做是可以的，但是这样会匹配‘pythonzorg’，这可不是所期望的结果。为了让特殊字符串表现得像普通字符一样，需要对它进行转义---可以再它前面加上反斜线。因此，在这里可以使用‘python\\.org’，这样只会匹配‘python.org’了。

　　为了获得re模块所需的单个反斜线，需要在字符串中使用两个反斜线---为了通过解释器进行转义。这样就需要两个级别的转义了：（1）通过解释器转义；（2）通过re模块转义。如果厌烦了使用双斜线，那么可以使用原始字符串，比如r‘python.org’。

　　字符集

　　匹配任意字符可能很有用，但有些时候需要更多的控制权。可以使用中括号括住字符串来创建字符集（character set）。字符集可以匹配它所包括的任意字符，所以‘[pj]ython’能够匹配‘python’和‘jython’，而非其他内容。可以使用范围，比如p‘[a-z]’能够匹配a到z的任意一个字符，还可以通过一个接一个的方式将范围联合起来使用。比如‘[a-zA-Z0-9]’能匹配任意大小写字母和苏子（注意字符集只能匹配一个这样的字符）。

　　为了反转字符集，可以再开头使用^字符，比如‘[^abc]’可以匹配任何除了a、b、c之外的字符。

　　选择符合子模式

　　在字符串的每个字符都各不相同的情况下，字符集是很好用的。但如果只想匹配字符串‘python’和‘perl’呢？取而代之的是用于选择项的特殊字符：管道符号（|）。因此，所需的模式可以写成‘python|perl’。

　　但是有些时候不需要对整个模式使用选择运算符---只是模式的一部分。这是可以使用圆括号括起需要的部分，或称子模式subparttern。前例可以写成‘p(ython|erl)’。

　　可选项和重复子模式

　　在子模式后面加上问号，它就编程了可选项。它可能出现在匹配字符串中，但并非必须的。例如，下面这个模式：

　　r'(http://)?(www\.)?python\.org'

　　只能匹配下列字符串：

　　'http://www.python.org'

　　'http://python.org'

　　'www.python.org'

　　'python.org'

　　对于上述例子，下面这些内容值得注意：

　　对点号进行了转义，防止它被作为通配符使用；

　　使用原始字符串减少所需反斜线的数量；

　　每个可选子模式都用圆括号括起；

　　可选子模式出现与否均可，而且相互独立。

　　问号表示子模式可以出现一次或者根本不出现。下面这些运算符允许子模式重复多次：

　　（pattern）*：允许模式重复0次或多次；

　　（pattern）+：允许模式重复1次或多次；

　　（pattern）{m,n}：允许模式重复m~n此。

　　字符串的开始和结尾

　　在寻找子字符串时，确定子字符串位于整个字符串的开始还是结尾是很有用的。比如，只想在字符串的开头而不是其他位置匹配'ht+p'，那么久可以使用脱字符（^）标记开始：‘^ht+p’会匹配‘http://python.org’以及‘httttp://python.org’。

　　类似的，字符串结尾用美元符号（$）标识。

　　2. re模块的内容

　　re模块包含一些有用的操作正则表达式的函数。

　　compile(pattern[,flags])　　　　根据包含正则表达式的字符串创建模式对象

　　search(pattern,string[,flags])　　　　在字符串中寻找模式

　　match(pattern,sting[,flags])　　　　在字符串的开始处匹配模式

　　split(pattern,string[,maxsplit=0])　　　　根据模式的匹配项来分割字符串

　　findall(pattern,string)　　　　列出字符串中模式的所有匹配项

　　sub(pat,repl,string[,count=0])　　　　将字符串中所有pat的匹配项用repl替换

　　escape(string)　　　　将字符串中所有特殊正则表达式字符转义

　　函数re.compile将正则表达式转换为模式对象，可以实现更有效率的匹配。如果在调用search或math函数的时候使用字符串表示的正则表达式，它们也会在内部将字符串转义为正则表达式对象。使用compile完成一次转换之后，在每次使用模式的时候就不用进行转换。模式对象本身也有查找/匹配的函数。

　　函数re.search会在给定字符串中寻找第一个匹配给定正则表达式的字符串。一旦找到子字符串，函数就会返回MatchObject（值为True），否则返回None（值为False）。因为返回值的性质，所以该函数可以用在条件语句中，如下：

　　if re.search(pat,string):

　　　　print 'Found it!'

　　函数re.match会在给定字符串的开头匹配正则表达式。因此，re.match('p','python')返回真。而re.match('p','www.python.org')则返回假None。

　　函数re.spilt会根据模式的匹配项来分割字符串。使用完整的正则表达式代替了固定的分隔符字符串。返回值是子字符串的列表。maxsplit参数表示字符串最多可以分割成的不分数。

　　函数re.findall以列表形式返回给定模式的所有匹配项。比如查找标点符号：

　　pat=r'[.?\-",]+'

　　re.findall(pat,text)

　　注意，横线（-）被转义了，所以python不会将其解释为字符串范围的一部分。

　　函数re.sub的作用在于：使用给定的替换内容将匹配模式的子字符串替换掉。

　　re.escape是一个很使用的函数，可以对字符串中所有可能被解释为正则运算符的字符进行转义的应用函数。如果字符串很长且包含很多特殊字符，而你又不想输入一大堆反斜线，或者字符串来自于用户，且要用作正则表达式的一部分的时候，可以使用这个函数。

　　>>>re.escape('www.python.org')

　　'www\\.python\\.org'

　　>>>re.escape('But where is the ambiguity?')

　　'But\\ where\\ is\\ the\\ ambiguty\\?'

　　3. 匹配对象和组

　　对于re模块中哪些能够对字符串进行模式匹配的函数而言，当能找到匹配项的时候，它们都会返回MatchObject对象。这些对象包括匹配模式的子字符串的信息。它们还包含了哪个模式匹配了子字符串哪部分的信息---这些“部分”叫做组group。

　　简而言之，组就是防止在圆括号内的子模式。组的序号取决于它左侧的括号数。组0就是整个模式，所以在下面的模式中：

　　'there (was a (wee) (cooper)) who (lived in Fyfe)'

　　包含下面这些组：

　　0　　there was a wee cooper who lived in Fyfe

　　1　　was a wee cooper

　　2　　wee

　　3　　cooper　　

　　4　　lived in Fyfe

　　一般来说，如果组中包含诸如通配符或者重复运算符之类的特殊字符，那么你可能会对是什么与给定组实现了匹配感兴趣，比如在下面的模式中：

　　r'www\.(.+)\.com$'

　　组0包含整个字符串，而组1则包含位于'www.'和'.com'之间的所有内容。

　　re匹配对象的一些重要方法如下所示：

　　group([group1,...])　　　　获取给定子模式（组）的匹配项

　　start([group])　　　　　　返回给定组的匹配项的开始位置

　　end([group])　　　　　　返回给定组的匹配项的结束位置

　　span([group])　　　　　　返回一个组的开始和结束位置

　　group方法返回模式中与给定组匹配的（子）字符串。如果没有给出组号，默认组为0。如果给定一个组号，会返回单个字符串。否则会将对应给定组数的字符串作为元组返回。

　　start方法返回给定组匹配项的开始索引。

　　end类似于start，但是返回结果是结束索引加1。

　　方法span以元组的形式返回给定组的开始和结束位置的索引。

　　思考以下的例子：

　　>>>m=re.match(r'www\.(.*)\..{3}','www.python.org')

　　>>>m.group(1)

　　'python'

　　>>>m.start(1)

　　>>>m.end(1)

　　>>>m.span(1)

　　(4,10)

　　4. 作为替换的组号和函数

　　在使用re.sub的第一个例子中，只是把一个字符串用其他的内容替换掉了。用replace这个字符串方法能轻松达到同样的效果。当然，正则表达式很有用，因为它们允许以更灵活的方式搜索，同时它们也允许进行功能更强大的替换。

　　见证re.sub强大功能的最简单方式就是在替换字符串中使用组号。在替换内容中以‘\\n’形式出现的任何转义序列序列都会被模式中于组n匹配的字符串替换掉。例如，假设要把‘*something*’用‘something’替换掉，前者是普通文本文档中进行强调的常见方法，而后者则是相应的HTML代码。首先建立正则表达式：

　　>>>emphasis_pattern=r'\*([^\*]+)\*'

　　正则表达式很容易变得难以理解，所以为了以后能够读懂代码，使用有意义的变量名是很重要的。

　　现在模式已经搞定，接下来就可以使用re.sub进行替换了：

　　>>>re.sub(emphasis_pattern,r'\1','hello,*world*!')

　　'hello,world!'

　　将函数作为替换内容可以让替换功能变得更强大。可以对匹配的子字符串做任何事，并且可以细化处理过程，以生成替换内容。

　　贪婪与非贪婪模式：

　　重复运算符默认是贪婪greedy的，这意味着它会进行尽可能多的匹配。但是如何避免过于贪婪呢？只要使用重复运算符的非贪婪版本即可。所有的重复运算符都可以通过在其后面加上一个问号变成非贪婪版本。

　　这里用+?运算符代替了+，意味着模式也会像之前那样对一个或者多个通配符进行匹配，但是它会进行尽可能少的匹配，因为它是非贪婪的。

　　5. 找出Email的发信人

　　这个问题可以不使用正则表达式解决---可以使用email模块。

　　# find_sender.py

　　import fileinput,re

　　pat=re.compile('From:(.*)<.*?>%')

　　for line in fileinput.input():

　　　　m=pat.match(line)

　　　　if m:print m.group(1)

　　6. 模板系统示例

　　模板是一种通过放入具体值从而得到某种已完成文本的文件。Python有一种高级的模板机制：字符串格式化。但是使用正则表达式可以让系统更加高级。

[10.3.9] 其他有趣的标准模块

　　下面介绍一些很酷的库：

　　functools：可以从这个库找到一些功能，让你能够通过部分参数来使用某个函数，稍后再为剩下的参数提供数值。Python3.0中filter和reduce包含在该模块中。

　　difflib：这个库让你可以计算两个序列的相似程度。还能让你从一些序列中找出和提供的原始序列“最像”的那个。difflib可以用于创建简单的搜索程序。

　　hashlib：通过这个模块，可以通过字符串计算小“签名”。如果为两个不同的字符串计算出了签名，几乎可以确保这两个签名完全不同。该模块应用于大文本文件，同时在加密和安全性方面有很多用途。

　　csv：CSV是逗号分隔值Comma-Separated Values的简写，这是一种很多程序都可以用来存储表格式数据的简单格式。它主要用于在不同程序间交换数据。使用CSV模块可以轻松写CSV文件，同时以显而易见的方式来处理这种格式的某些很难处理的地方。

　　timeit、profile和trace：timeit模块是衡量代码片段运行时间的工具，它有很多神秘功能，应该用它来代替time模块进行性能测试。profile模块可用于代码片段效率的全面分析。trace模块可以提供总的分析。这在写测试代码的时候很有用。

　　datetime：如果time模块不能满足时间追踪方面的需求，那么datetime可能就有用武之地。它支持特殊的日期和时间对象，让你能够以多种方式对它们进行构建和联合。它的接口在很多方面比time的接口要更加直观。

　　itertools：有很多工具用来创建和联合迭代器，还包括实现以下的功能：将可迭代的对象链接起来、创建返回无限连续整数的迭代器，从而通过重复访问可迭代对象进行循环等等。

　　logging：通过简单的print语句打印出程序的哪些方面很有用。如果希望对程序进行跟踪但又不想打印出太多调试内容，那么久需要将这些信息写入日志文件中了。这个模块提供了一组标准的工具，以便让开发人员管理一个或多个核心的日志文件，同时还对日志信息提供了多层次的优先级。

　　getopt和optparse：在UNIX中，命令行程序经常使用不同的选项或者开关运行。这些信息都可以再sys.argv中找到，但是自己要正确处理他们就没有这么简单了。针对这个问题，getopt库是个切实可行的解决方案，而optparse则更新、更强大并且更易用。

　　cmd：使用这个模块可以编写命令行解释器。可以自定义命令，以便让用户能够通过提示符来执行。

[10.4] 小结

　　本章讲述了模块的知识：如何创建、如何探究以及如何使用标准Python库中的模块。

　　模块：从基本上来说，模块就是子程序，它的主函数则用于定义，包括定义函数、类和变量。如果模块包含测试代码，那么久应该讲这部分代码放置在检查__name__=='__main__'是否为真的if语句中，能够在PYTHONPATH中找到的模块都可以导入。语句import foo可以导入存储在foo.py文件中的模块。

　　包：包是包含有其他模块的模块。包是作为包含__init__.py文件的目录来实现的。

　　探究模块：将模块导入交互式编辑器后，可以使用很多方法对其进行探究，比如使用dir、检查__all__变量以及使用help函数。文档和源代码是获取信息和内部机制的极好来源。

　　标准库：sys、os、fileinput、sets、heapq、deque、time、random、shelve、re

[10.4.1] 本章的新函数

　　dir(obj)　　　　　　返回按字母顺序排序的属性名称列表

　　help([obj])　　　　提供交互式帮助或关于特定对象的交互式帮助信息

　　reload(module)　　返回已经导入模块的重新载入版本

转载于:https://www.cnblogs.com/pythonMLer/p/5702044.html

你可能感兴趣的:(Python基础教程【读书笔记】 - 2016/7/31)

B - N! HDU - 1042 Ws＿ c++算法开发语言
GivenanintegerN(0≤N≤10000),yourtaskistocalculateN!InputOneNinoneline,processtotheendoffile.OutputForeachN,outputN!inoneline.SampleInputcopyOutputcopy123126翻译：这个问题是计算给定整数N的阶乘N!，其中0≤N≤10000。阶乘的定义是从1到N的所
Alaninyl-Hydroxyproline；76400-25-4；A-Hyp perhaps_chutai 健康医疗
基本信息英文名称：Alaninyl-Hydroxyproline中文名称：丙氨酰-羟基脯氨酸氨基酸序列：丙氨酸-羟基脯氨酸单字母序列：A-Hyp三字母序列：Ala-Hyp分子量：199.22分子式：C₈H₁₄N₂O₄CAS号：76400-25-4等电点：一般没有明确报道，理论上可根据其结构中氨基和羧基等的解离情况大致估算，但无特别确切的单一数值。结构信息H-Ala-Hyp-OH是由丙氨酸（Ala）
【深度解析】最短路径算法：Dijkstra与Floyd-Warshall 吴师兄大模型算法数据结构 python 最短路径算法 Dijkstra算法 Floyd-Warshall 开发语言
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析05-栈数据结构详解：Python实现与经典应用场景06-深入理解队列数据结构：从定义到Python实现与应用场景07-双端队列（Deque）详解：Python实现与滑动窗口应
141，【1】buuctf web [SUCTF 2019]EasyWeb rzydal web 安全
进入靶场代码审计18){die('Oneinchlong,oneinchstrong!');}//使用正则表达式检查$hhh是否包含特定字符集（包括一些常见字符和控制字符等），如果包含则终止脚本执行if(preg_match('/[\x00-0-9A-Za-z\'"\`~_&.,|=[\x7F]+/i',$hhh))die('Trysomethingelse!');//获取$hhh中使用到的字符，
CSE 231 Computer Python program 后端
CSE231Spring2025ComputerProject#4LearningobjectivesThisassignmentfocusesonthedesign,implementationandtestingofaPythonprogramthatusescharacterstringsforlookingattheDNAsequencesforkeyproteinsandseeingho
PHAS0008 - Experimental Methods 后端
PHAS0008-ExperimentalMethodsCoursework(2024-25)TobesubmittedviaMoodle/Turnitinby17:00onMonday24thFebruary2025.Answerstoquestions1-3shouldbetype-writtenandsubmittedasasinglepdffile.Pleasebecarefultoexp
【大语言模型_3】ollama本地加载deepseek模型后回答混乱问题解决没枕头我咋睡觉大语言模型语言模型人工智能自然语言处理
背景：本地下载了DeepSeek-R1-Distill-Qwen-7B模型后，通过ollamacreateDeepSeek-R1-Distill-Qwen-7B-fds7b.mf加载模型启动后回答混乱，无法使用。解决方法重新下载模型，选择了DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf重新编写ds7b.mf文件，文件内容如下：FROM/root/zml/DeepSe
《计算机组成及汇编语言原理》阅读笔记：p1-p8 编程
《计算机组成及汇编语言原理》学习第1天，p1-p8总结，总计8页。一、技术总结1.Intel8088microprocessor(微处理器)，1979-1988。2.MS-DOSMicrosoftDiskOperatingSystem的缩写，是一个操作系统(operatingsystem)。3.Moore'sLaw&Moore'ssecondlaw(1)Moore'slawThenumberoft
关于启动vue项目，出现：Error [ERR_MODULE_NOT_FOUND]: Cannot find module ‘xxx‘此类错误 zkkkkkkkkkkkkk vue vue node.js npm
目录一、问题报错二、原因分析三、解决方法一、问题报错node环境变量配置有问题：(base)xxx@M73H-15:~/VueProject/pproject-vue$npmrundev/usr/bin/env:“node”:没有那个文件或目录vue项目启动有问题：(base)xxx:~/VueProject/pproject-vue$npmrundev>[email protected]
Linux 系统中的 .7z 压缩与解压详解 Crazy learner Linux基本命令 C++与python编程 linux 7z
目录一、安装p7zip工具二、压缩文件到.7z格式三、解压.7z文件五、常见操作实例六、总结在Linux系统中，.7z是一种高效的压缩文件格式，通常使用p7zip工具来进行操作。7z格式以其高压缩率和支持多种压缩算法（如LZMA、LZMA2等）而闻名。本文将深入讲解如何在Linux环境下使用.7z文件格式进行压缩和解压操作，并通过多个实例帮助你掌握这些技能。一、安装p7zip工具在大多数Linux
CSE 231 Computer Python program 后端
CSE231Spring2025ComputerProject#4LearningobjectivesThisassignmentfocusesonthedesign,implementationandtestingofaPythonprogramthatusescharacterstringsforlookingattheDNAsequencesforkeyproteinsandseeingho
国外7个最佳大语言模型 (LLM) API推荐程序员后端
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
解决win11下taskmgr放在“启动”文件夹中无法自启动问题 nicekwell windows的使用 windows
https://superuser.com/questions/1647652/why-the-task-manager-automatically-does-not-start-from-the-startup-folder-at-usewindows中设置开机自动启动的常用方法是把要启动的程序或文件的快捷方式放到C:\Users\\AppData\Roaming\Microsoft\Windo
Tomcat 8 安装包下载 m0_74824517 面试学习路线阿里巴巴 tomcat java
Tomcat8安装包下载【下载地址】Tomcat8安装包下载本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署Tomcat8服务器[这里是图片001]项目地址:https://gitcode.com/open-source-toolkit/fda7c简介本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署To
国鑫DeepSeek 671B本地部署方案：以高精度、高性价比重塑AI推理新标杆 Gooxi国鑫人工智能服务器
随着DeepSeek大模型应用火爆全球，官方服务器总是被挤爆。而且基于企业对数据安全、网络、算力的更高需求，模型本地化部署的需求日益增长，如何在有限预算内实现高效、精准的AI推理能力，成为众多企业的核心诉求。国鑫作为深耕AI领域的技术先锋，推出基于4台48GRTX4090或8台24GRTX4090服务器的2套DeepSeek“满血”版本地部署方案，以FP16高精度、高性价比、强扩展性三大优势，为企
FPGA设计怎么学？薪资前景好吗？博览鸿蒙 FPGA fpga开发
FPGA前端设计和各岗位之间有着很多联系，是一个薪资待遇高，前景发展好的岗位。但这个岗位的门槛也比较高，很多人不知道怎么学习，下面就和宸极教育一起来了解一下吧。数字前端设计必备技能1、熟悉数字电路设计2、熟悉Verilog或VHDL3、熟悉异步电路设计4、熟悉FIFO的设计5、熟悉UNIX系统及其工具的使用6、熟悉脚本语言Perl、Shell、Tcl等7、熟悉C/C++语言、SystemVeril
嵌入式MCU平台汇总 TENET- 嵌入式单片机嵌入式硬件 mcu
文章目录1.单片机（MCU）2.数字信号处理器（DSP）3.ARMCortex系列4.超低功耗MCU5.物联网MCU（IoTMCU）6.开源架构MCU（RISC-V）7.可编程逻辑器件（FPGA）1.单片机（MCU）概念:单片机（MicrocontrollerUnit，MCU）是集成了中央处理器（CPU）、存储器（RAM、ROM或Flash）、输入输出端口（I/O）以及各种外设（如定时器、串行通信
【Tools/macOS系列】macOS终端配置：zsh+iTerm2+OhMyZsh 飞翔的鲲【实用工具专栏】macOS zsh iTerm2 终端 ohmyzsh
DATE:2021.7.17文章目录1、前言2、参考3、终端和vim配置效果图4、终端配置步骤4.1、安装iTerm24.2、安装oh-my-zsh4.3、主题和颜色4.4、插件4.5、特殊字体Hackherdfont4.6、vim配置4.7、随时唤起4.8、自定义界面壁纸1、前言macOS的终端Terminal界面非常简单，没有Linux下面的颜色设置和自动补齐等功能，用起来非常不方便。本文讲解
Kate文本编辑器 v24.12.9013 开源高级文本代码编辑器 SSASASA11 编辑器
链接：https://pan.quark.cn/s/5577e74ab648Kate是一个可以跨平台使用的免费高级文本编辑器，支持标签页、代码高亮、显示行号、显示缩略图的滚动条、多文件查找、横向或者纵向显示多个视图等众多高级特性。软件功能1、双击当前标签页创建新标签页。2、支持启用/禁用自动换行。3、强大的多文件查找和替换功能。利用这个功能可以一键查找/替换所有已打开的文本中的内容。支持正则表达式
Linux-ISCSI DC_BLOG Linux linux 服务器
文章目录iSCSIiSCSI配置作者主页：点击！Linux专栏：点击！⏰️创作时间：2025年02月17日19点50分iSCSI协议是没有同步机制的，要想解决同步机制，需要配置集群文件系统或者是分布式文件系统，防止数据不同步的问题iSCSI基于IP协议的技术标准，该技术允许用户通过TCP/IP网络来构建SANiSCCI的基本组成使用3260端口进行传输iSCCI会话的建立是通过启动器（Initat
纯前端导入导出txt文件今天吃了嘛o 前端导入导出txt文件 javascript html html5
1.html部分导入导出{{alone}}2.js部分导出的时候我尝试了很多次改变编码格式为gb2312的，但是无果，所以我再读取的时候先读取文件判断了文件编码格式，然后再去根据编码格式读取文件并展示页面。exportdefault{data(){return{works:[],};},methods:{handleBeforeUpload(file){this.fileList=[file];c
202312青少年软件编程（scratch图形化）等级考试试卷（四级） MarcoPage Scarch 考试题库开发语言青少年编程
第1题：【单选题】运行下列程序，输入“abcdef”，程序结束后，变量“字符串”是？（）A:fedcbB:bcdefC:abcdeD:edbca【正确答案】:B
基于若依和flowable6.7.2的ruoyi-nbcio流程管理系统正式发布宁波阿成 ruoyi-nbcio 若依 flowable flowable 若依 ruoyi-nbcio ruoyi java vue
更多ruoyi-nbcio功能请看演示系统gitee源代码地址前后端代码：https://gitee.com/nbacheng/ruoyi-nbcio演示地址：RuoYi-Nbcio后台管理系统项目概要本项目基于RuoYi-Flowable-Plus进行二次开发，从nbcio-boot(https://gitee.com/nbacheng/nbcio-boot)项目</
若依前后端分离集成CAS详细教程 Roc-xb 单点登录前后端分离 CAS
目录一、后端配置1、添加cas依赖2、修改配置文件3、修改LoginUser.java4、修改Constants.java5、添加CasProperties.java6、添加CasUserDetailsService.java7、添加CasAuthenticationSuccessHandler.java8、修改SecurityConfig9、启动后端二、前端配置1、修改settings.js2、
一文读懂MUSIC算法DOA估计的数学原理并仿真迎风打盹儿阵列信号处理 MUSIC算法 DOA估计阵列信号处理信号子空间噪声子空间
一文读懂MUSIC算法DOA估计的数学原理并仿真文章目录前言一、DOA估计基本原理二、MATLAB仿真总结前言MUSIC（MultipleSignalClassification）算法于1979年由R.O.Schmidt提出，是阵列信号处理中广泛应用的经典DOA（DirectionofArrival）估计算法，凭借其超分辨的估计性能受到广泛关注。本文将从数学公式推导的角度出发系统阐述MUSIC算法
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理 dorabighead javascript 开发语言 ecmascript
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理大家好！我是小哆啦，欢迎回到《JavaScript高级程序设计》的读书笔记大本营！在这章中，我们要聊的是两个让人头疼又迷人的话题——变量、作用域与内存管理。有些人一提到这些，就会感到一阵头晕目眩，恍若置身一场JavaScript版的迷宫大冒险！但今天，小哆啦会带你们轻松过关，深入了解这些概念，并且保持足够的幽默感，让你既能笑着学
【架构】分层架构 (Layered Architecture) _君莫笑软件架构架构 c++
一、分层模型基础理论![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0365cf0bfa754229bdedca6b472bffc7.png1.核心定义分层架构（LayeredArchitecture）模型是一种常见的软件设计架构，它将软件系统按照功能划分为不同的层次，每个层次都有特定的职责和功能，层与层之间存在清晰的依赖关系。这种架构有助于提高软件的可
Docker 部署AnythingLLM 炫爱小七 docker 容器 ai
两个指令搞定1.下载镜像dockerpullmintplexlabs/anythingllm2.运行容器exportSTORAGE_LOCATION=$HOME/anythingllmmkdir-p$STORAGE_LOCATIONchmod-R777$STORAGE_LOCATIONtouch"$STORAGE_LOCATION/.env"dockerrun-d-p3001:3001\--cap
基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。嵌入式程序员小刘物联网单片机嵌入式硬件开源
本项目基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。关注微信公众号，提前获取相关推文一、需求分析核心功能:热图像采集:读取热红外传感器数据。图像处理:将原始传感器数据转换为可显示的彩色或灰度热图像。图像显示:在LCD屏幕上实时显示热图像。温度测量:计算并显示图像中特定点的温度值
华为昇腾服务器部署DeepSeek模型实战 gzroy 人工智能语言模型
在华为的昇腾服务器上部署了DeepSeekR1的模型进行验证测试，记录一下相关的过程。服务器是配置了8块910B3的显卡，每块显卡有64GB显存，根据DeepSeekR1各个模型的参数计算，如果部署R1的Qwen14B版本，需要1张显卡，如果是32B版本，需要2张，Llama70B的模型需要4张显卡。如果是R1全参数版本，则需要32张显卡，也就是4台满配的昇腾服务器。这里先选择32B的模型进行部署
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C