signjing

python标准库_csv

简介

所谓的csv（逗号分隔值Comma Separated Values）格式是最通用的用于电子表格和数据库的导入和导出格式。因为没有“csv标准”，所以格式被读写它的许多应用程序自由定义。缺乏标准也意味着不同应用程序在产生和使用数据时总是存在一些微小的差异。这些差异使得处理来自多种源的CSV文件时令人头疼。同时，分隔符和引用符的多样性，使得所有格式足够相近以至于编写一个能够有效操作这种数据，对程序员隐藏读写数据细节的独立模块成为可能。

函数

读文件

可以使用reader()创建一个对象从csv文件读取数据。这个阅读器可以用作一个迭代器，按顺序处理文件的行。

$ cat s_player_school_table.csv

c_school_id,c_hp_fixed,c_hp_factor,c_mana_fixed,c_mana_factor,c_ap_factor

0,150,20,140,15,1

1,90,20,140,15,1

2,180,20,151,15,1

3,229,20,177,15,4.4

4,208,20,177,15,6.7

5,208,20,177,15,6.7

$ cat read_csv.py

import csv

import sys

with open(sys.argv[1],'r') as csv_file:

csv_reader=csv.reader(csv_file)

for row in csv_reader:

print row

reader()的第一个参数是文本行的源。上例中是一个文件，也可以是任何可迭代的对象（如stringIO实例、list等等）。还可以指定其他可选参数，来控制如何解析输入数据。

$ cat read_from_list.py

import csv

csv_file=csv.reader(['hello','signjing','goodnight'])

for i in csv_file:

print i

$ python read_from_list.py

['hello']

['signjing']

['good night']

读文件时，输入数据的每一行都会解析，并转换为一个字符串list。

$ python read_csv.pys_player_school_table.csv

['c_school_id', 'c_hp_fixed','c_hp_factor', 'c_mana_fixed', 'c_mana_factor', 'c_ap_factor']

['0', '150', '20', '140', '15', '1']

['1', '90', '20', '140', '15', '1']

['2', '180', '20', '151', '15', '1']

['3', '229', '20', '177', '15', '4.4']

['4', '208', '20', '177', '15', '6.7']

['5', '208', '20', '177', '15', '6.7']

这个解析器会处理嵌在字符串中的换行符，正是这个原因，这里的行（row）并不一定等同于文件的一个输入行（line）。

$ cat s_player_school_table.csv

c_school_id,c_hp_fixed,c_hp_factor,c_mana_fixed,c_mana_factor,c_ap_factor

0,150,20,"abc

def",15,1

1,90,20,140,15,1

$ python read_csv.pys_player_school_table.csv

['c_school_id', 'c_hp_fixed','c_hp_factor', 'c_mana_fixed', 'c_mana_factor', 'c_ap_factor']

['0', '150', '20', 'abc\ndef','15', '1']

['1', '90', '20', '140', '15', '1']

由解析器返回时，输入中带换行符的字段仍保留内部换行符。

阅读器对象

$ cat s_player_school_table.csv

c_school_id,c_hp_fixed,c_hp_factor,c_mana_fixed,c_mana_factor,c_ap_factor

0,150,20,"abc

def",15,1

1,90,20,140,15,1

$ cat attributes.py

import csv

with open('s_player_school_table.csv','r')as f:

csv_file=csv.reader(f)

for i in csv_file:

print csv_file.dialect

print i

print csv_file.line_num

with open('s_player_school_table.csv','r')as f:

csv_file=csv.DictReader(f)

print csv_file.fieldnames

$ python attributes.py

<_csv.Dialect object at 0xb7c64ac0>

['c_school_id', 'c_hp_fixed','c_hp_factor', 'c_mana_fixed', 'c_mana_factor', 'c_ap_factor']

<_csv.Dialect object at 0xb7c64ac0>

['0', '150', '20', 'abc\ndef', '15', '1']

<_csv.Dialect object at 0xb7c64ac0>

['1', '90', '20', '140', '15', '1']

['c_school_id', 'c_hp_fixed','c_hp_factor', 'c_mana_fixed', 'c_mana_factor', 'c_ap_factor']

写文件

写csv文件与读csv文件同样容易。可以使用writer()创建一个对象来写数据，然后使用writerow()迭代处理文本行进行打印。

$ cat write_a_csv.py

import sys

import csv

with open(sys.argv[1],'w') as csv_file:

csv_writer=csv.writer(csv_file)

csv_writer.writerow(('a','b','c'))

for i in range(3):

csv_writer.writerow( (i+1,

chr(ord('a')+i),

'08/%02d/07' %(i+1),

)

print open(sys.argv[1],'r').read()

执行结果：

a,b,c

1,a,08/01/07

2,b,08/02/07

3,c,08/03/07

$ cat temp.csv

a,b,c

1,a,08/01/07

2,b,08/02/07

3,c,08/03/07

引导：

对于书写器，默认的引号行为有所不同。要加引号，需要将quoting参数设置为另外某种引号模式。

writer=csv.writer(f,quoting=csv.QUOTE_NONNUMERIC)

这样，QUOTE_NONNUMERIC会在所有包含非数值内容的列周围加引号。

$ python write_a_csv.py temp.csv

"a","b","c"

1,"a","08/01/07"

2,"b","08/02/07"

3,"c","08/03/07"

$ cat temp.csv

"a","b","c"

1,"a","08/01/07"

2,"b","08/02/07"

3,"c","08/03/07"

$ cat write_a_csv.py

import sys

import csv

with open(sys.argv[1],'w') as csv_file:

csv_writer=csv.writer(csv_file,quoting=csv.QUOTE_NONNUMERIC)

csv_writer.writerow(('a','b','c'))

for i in range(3):

csv_writer.writerow( (i+1,

chr(ord('a')+i),

'08/%02d/07'%(i+1),

)

print open(sys.argv[1],'r').read()

有4种不同的引号选项，在csv模块中定义为四个变量：

QUOTE_ALL不论类型是什么，对所有字段都加引号。

QUOTE_MINIMAL对包含特殊字符的字段加引号（所谓特殊字符是指，对于一个用相同方言和选项配置的解析器，可能会造成混淆的字符）。这是默认选项。

QUOTE_NONNUMERIC对所有非整数或浮点数的字段加引号。在阅读器中使用时，不加引号的输入字段会转换为浮点数。

QUOTE_NONE输出中所有内容都不加引号。在阅读器中使用时，引号字符包含在字段值中（正常情况下，它们会处理为定界符并去除）。

方言

逗号分隔值文件没有明确定义的标准，所以解析器必须灵活。这种灵活性意味着可以用很多参数来控制csv如何解析或写数据。并不是将各个参数单独传入阅读器和书写器，可以把它们成组在一起构成一个方言（dialect）对象。

dialect类可以按名注册，这样csv模块的调用者就不需要提前知道参数设置。可以用list_dialects()获取完整的已注册方言列表。

$ cat csv_list_dialects.py

import csv

print csv.list_dialects()

$ python csv_list_dialects.py

['excel-tab', 'excel']

这个标准库包含两个方言：excel和excel-tabs。excel方言用于处理采用Microsoft Excel默认导出格式的数据，也可以处理openoffice或neooffice。

创建方言

可以不使用逗号来分隔字段，输入文件使用了竖线（|）：

$ cat testdata.pipes

"Title 1"|"Title2"|"Title 3"

1|"first line

second line"|08/18/07

$ cat csv_dialect.py

import csv

csv.register_dialect('pipes',delimiter='|')

print csv.list_dialects()

with open('testdata.pipes','r') as f:

reader=csv.reader(f,dialect='pipes')

for row in reader:

print row

$ python csv_dialect.py testdata.pipes

['excel-tab', 'excel', 'pipes']

['Title 1', 'Title 2', 'Title 3']

['1', 'first line\nsecond line','08/18/07']

使用“pipes”方言，可以像逗号定界文件一样读取文件。

方言参数

方言指定了解析或写一个数据文件时使用的所有记号（token）。

csv方言参数

属性	默认值	含义
delimiter	,	字段分隔符（一个字符）
doublequote	True	这个标志控制quotechar实例是否成对
escapechar	None	这个字符用来指示一个转义序列
lineterminator	\r\n	书写器使用这个字符结束一行
quotechar	“	这个字符串用来包围包含特殊值的字段（一个字符）
quoting	QUOTE_MINIMAL	控制前面介绍的引号行为
skipinitialspace	False	忽略字段定界符后面的空白符
strict	False	当设置为True时，错误的csv输入将弹出异常Error。

执行结果：

$ python csv_dialect_variations.py

Dialect:"escaped"

delimiter = ',' skipinitialspace = 0

doublequote = 0 quoting = QUOTE_NONE

quotechar = '"' lineterminator = '\r\n'

escapechar = '\\'

Dialect:"excel"

delimiter = ',' skipinitialspace = 0

doublequote = 1 quoting = QUOTE_MINIMAL

quotechar = '"' lineterminator = '\r\n'

escapechar = None

Dialect:"excel-tab"

delimiter = '\t' skipinitialspace = 0

doublequote= 1 quoting = QUOTE_MINIMAL

quotechar = '"' lineterminator = '\r\n'

escapechar = None

Dialect:"singlequote"

delimiter = ',' skipinitialspace = 0

doublequote = 1 quoting = QUOTE_ALL

quotechar = "'" lineterminator = '\r\n'

escapechar = None

'col1','1','10/01/2010','specialchars:"'' , to parse'

源文件：

$ cat csv_dialect_variations.py

import csv

import sys

csv.register_dialect('escaped',

escapechar='\\',

doublequote=False,

quoting=csv.QUOTE_NONE,

)

csv.register_dialect('singlequote',

quotechar="'",

quoting=csv.QUOTE_ALL,

)

quoting_modes=dict( (getattr(csv,n),n)

for n in dir(csv)

ifn.startswith('QUOTE_')

)

for name in sorted(csv.list_dialects()):

print 'Dialect:"%s"\n' % name

dialect=csv.get_dialect(name)

print ' delimiter = %-6r skipinitialspace = %r' %(

dialect.delimiter,dialect.skipinitialspace)

print ' doublequote = %-6r quoting = %s' %(

dialect.doublequote,quoting_modes[dialect.quoting])

print ' quotechar = %-6r lineterminator = %r' %(

dialect.quotechar,dialect.lineterminator)

print ' escapechar = %-6r' % dialect.escapechar

writer=csv.writer(sys.stdout,dialect=dialect)

writer.writerow(

('col1',1,'10/01/2010',

'special chars:"\' %s to parse' % dialect.delimiter)

)

自动检测方言

要配置方言来解析一个输入文件，最好的办法就是提前知道正确的设置。对于方言参数未知的数据，可以用Sniffer类来做一个有根据地猜测。sniff()方法取一个输入数据样本和一个可选的参数（给出可能的定界字符）。

$ cat csv_dialect_sniffer.py

import csv

from StringIO import StringIO

import textwrap

csv.register_dialect('escaped',

escapechar='\\',

doublequote=False,

quoting=csv.QUOTE_NONE)

csv.register_dialect('singlequote',

quotechar="'",

quoting=csv.QUOTE_ALL)

# generate sample data for all knowndialects

samples=[]

for name in sorted(csv.list_dialects()):

buffer=StringIO()

dialect=csv.get_dialect(name)

write=csv.writer(buffer,dialect=dialect)

write.writerow(

('col1',1,'10/01/2010',

'special chars "\' %s toparse' % dialect.delimiter)

)

samples.append( (name,dialect,buffer.getvalue()) )

# guess the dialect for a given sample,andthen use the results to

# parse the data.

sniffer=csv.Sniffer()

for name,expected,sample in samples:

print 'Dialect:"%s"\n' % name

dialect=sniffer.sniff(sample,delimiters=',\t')

reader=csv.reader(StringIO(sample),dialect=dialect)

print reader.next()

sniff()会返回一个Dialect实例，其中包含用于解析数据的设置。这个结果并不总是尽善尽美，示例中的“escaped”方言可以说明这一点。

$ python csv_dialect_sniffer.py

Dialect:"escaped"

['col1', '1', '10/01/2010', 'special chars\\"\' \\', ' to parse']

Dialect:"excel"

['col1', '1', '10/01/2010', 'special chars"\' ', ' to parse"']

Dialect:"excel-tab"

['col1', '1', '10/01/2010', 'special chars"\' ', ' to parse"']

Dialect:"singlequote"

['col1', '1', '10/01/2010', 'special chars"\' , to parse']

获取方言

$ cat get_dialect.py

import csv

print csv.list_dialects()

list1=['excel','nothing']

print list1

for l in list1:

try:

print csv.get_dialect(l)

except Exception,e:

print e

$ python get_dialect.py

['excel-tab', 'excel']

['excel', 'nothing']

<_csv.Dialect object at 0xb7c88a60>

unknown dialect

删除方言

$ cat unregister_dialect.py

import csv

print csv.list_dialects()

list1=['excel','abc']

print list1

for l in list1:

try:

csv.unregister_dialect('excel')

print csv.list_dialects()

except Exception,e:

print e

$ python unregister_dialect.py

['excel-tab', 'excel']

['excel', 'abc']

['excel-tab']

unknown dialect

字段长度限制

$ cat field_size_limit.py

import csv

with open('s_player_school_table.csv','r')as f:

csv_file=csv.reader(f)

for c in csv_file:

print csv.field_size_limit()

with open('s_player_school_table.csv','r')as f:

limit=100

csv_file=csv.reader(f)

for c in csv_file:

limit+=1

print csv.field_size_limit(limit)

$ python field_size_limit.py

131072

101

102

由此可见，如果设置了限制，则函数先返回当前的长度限制，然后在使用新的limit覆盖原有的limit值。

使用字段名

除了处理数据序列，csv模块还包括一些类，可以将行作为字典来处理，从而可以对字段命名。DictReader和DictWriter类将行转换为字典而不是列表。字典的键可以传入，也可以由输入的第一行推导得出（如果行包含首部）。

$ cat csv_dictreader.py

import csv

import sys

with open(sys.argv[1],'r') as f:

reader=csv.DictReader(f)

for row in reader:

print row

$ cat temp.csv

"a","b","c"

1,"a","08/01/07"

2,"b","08/02/07"

3,"c","08/03/07"

$ python csv_dictreader.py temp.csv

{'a': '1', 'c': '08/01/07', 'b': 'a'}

{'a': '2', 'c': '08/02/07', 'b': 'b'}

{'a': '3', 'c': '08/03/07', 'b': 'c'}

基于字典的阅读器和书写器会实现为基于序列的类的包装器，它们使用相同的方法和参数。阅读器api唯一的差别是：行将作为字典返回，而不是作为列表或元组。

必须为DictWriter提供一个字段名列表，使它知道如何在输出中确定列的顺序。

$ python csv_dictwriter.py temp.csv

Title 1,Title 2,Title 3

1,a,08/01/07

2,b,08/02/07

3,c,08/03/07

$ cat temp.csv

Title 1,Title 2,Title 3

1,a,08/01/07

2,b,08/02/07

3,c,08/03/07

$ cat csv_dictwriter.py

import csv

import sys

with open(sys.argv[1],'w') as f:

fieldnames=('Title 1','Title 2','Title 3')

headers=dict( (n,n) for n in fieldnames )

writer=csv.DictWriter(f,fieldnames=fieldnames)

writer.writerow(headers)

for i in range(3):

writer.writerow({'Title 1':i+1,

'Title2':chr(ord('a')+i),

'Title3':'08/%02d/07' %(i+1),

})

print open(sys.argv[1],'r').read()

字段名并不会自动写至文件，所以需要在写其他数据之前显式写出。

$ cat write_a_csv.py

import sys

import csv

with open(sys.argv[1],'w') as csv_file:

csv_writer=csv.writer(csv_file,quoting=csv.QUOTE_NONNUMERIC)

csv_writer.writerow(('a','b','c'))

for i in range(3):

csv_writer.writerow( (i+1,

chr(ord('a')+i),

'08/%02d/07' %(i+1),

)

print open(sys.argv[1],'r').read()

[signjing@localhost share_db]$ catcsv_dictwriter.py

import csv

import sys

with open(sys.argv[1],'w') as f:

fieldnames=('Title 1','Title 2','Title 3')

headers=dict( (n,n) for n in fieldnames )

writer=csv.DictWriter(f,fieldnames=fieldnames)

writer.writerow(headers)

for i in range(3):

writer.writerow({'Title 1':i+1,

'Title2':chr(ord('a')+i),

'Title 3':'08/%02d/07' %(i+1),

})

print open(sys.argv[1],'r').read()

生词本

1. encounter [inˈkauntə]

vt. 不期而遇;遭遇;对抗;

n. 相遇，碰见;遭遇战;对决，冲突;

vi. 碰见，尤指不期而遇

2. acronym [ˈækrəˌnɪm]

n. 首字母缩略词

3. standardized [ˈstændəˌdaizd]

adj. 标准的，定型的;

v. 使合乎规格，使标准化（ standardize的过去式和过去分词）

4. numeric [nju:ˈmerik]

adj. 数字的;数值的

5. assigned [ə'saɪnd]

n.[计][修]（已）赋值[分配]；[计]指定的，赋值的

adj.指定的，赋值的

v.分配( assign的过去式和过去分词 )；指派；指定；（作为说明或原因）提出

6. Proposal [prəˈpəuzəl]

n. 提议;建议;求婚;〈美〉投标

7. spreadsheet [ˈspredˌʃi:t]

n. 电子制表软件，电子数据表

8. subtle [ˈsʌtl]

adj. 微妙的;敏感的;狡猾的;巧妙的

9. annoying [əˈnɔɪɪŋ]

adj. 讨厌的;恼人的;

v. 骚扰（annoy的ing形式）

10. quoting [kwəutɪŋ]

v. 引用，援引（ quote的现在分词）;报价;引述;为（股票、黄金或外汇）报价

11. overall [ˈəuvərɔ:l]

adj. 全部的;全体的;一切在内的;综合的;

adv. 全面地;总地;总的说来;

n. 工装裤;罩衫;〈英〉（军官的）紧身军裤

12. efficiently [ɪˈfɪʃəntlɪ]

adv. 效率高地;有效地

13. manipulate [məˈnipjuleit]

vt. 操作，处理;巧妙地控制;操纵;[医] 推拿，调整

14. tabular [ˈtæbjələ]

adj. 表格的;按表格计算的;平坦的;平板（状）的

15. preferred [priˈfə:d]

adj. 首选的;

v. 提出（请求、控诉等）（ prefer的过去式和过去分词）;提升;建议;选择某事物（而不选择他事物）

16. precise [priˈsais]

adj. 清晰的;精确的;正规的;精密

17. Accordingly [əˈkɔ:diŋli]

adv. 因此，于是;依据;照着，相应地

18. According [əˈkɔ:diŋ]

adv. 依照;

v. 给予（ accord的现在分词）;使和谐一致;使符合;使适合adj. 相符的，和谐的，相应的

19. dialect [ˈdaiəlekt]

n. 方言，土语;语调;[语]语支;专业用语

20. iterate [ˈɪtəˌreɪt]

vt. 重复;反复申明

21. protocol [ˈprəʊtəˌkɔ:l, -ˌkəʊl, -ˌkɔl]

n. 礼仪;（外交条约的）草案;（数据传递的）协议;科学实验报告（或计划）;

vt. 把……写入议定书，在议定书中拟定（或颁布）;

vi. 拟定议定书，拟定草案

22. optional [ˈɔpʃənl]

adj. 可选择的;随意的，任意的;非强制的;选修科目

23. Previously [ˈpri:vjəslɪ]

adv. 事先;以前;仓促;“previous”的派生

24. carriage return

n. 回车

25. consequence [ˈkɔnsikwəns]

n. 结果，成果;[逻]结论;重要性;推论

26. responsible [riˈspɔnsəbl]

adj. 尽责的;承担责任;负有责任的;懂道理的

27. immutable [ɪˈmju:təbəl]

adj. 不可改变的

28. underlying [ˌʌndəˈlaiiŋ]

adj. 潜在的，含蓄的;基础的;表面下的，下层的;[法]优先的;

v. 优先于（underlie的ing形式）;构成……的基础（或起因），引起

29. so-called [ˈsəʊˈkɔ:ld]

adj. 所谓的，号称的

30. vary [ˈvɛəri]

vi. 变化;不同，偏离;[生]变异;

vt. 使不同;使多样化;[音乐]变奏

31. reflecting [rɪˈflektɪŋ]

adj. 反射的，引起反射的;沉思的;

v. 反射（光、热、声或影像）（ reflect的现在分词）;考虑;反照;表达

你可能感兴趣的:(python,python零基础)

Docker：3、在VSCode上安装并运行python程序或JavaScript程序 shanshandeisu docker docker vscode python 容器运维 js
1.VSCode上安装并运行python程序：1.1.安装Docker插件1.2.新建自动化脚本DockerFileFROMpython:3.-slim-busterWORKDIR/appCOPY..RUNpip3install-rrequirements.txtCMD["python3","app.py"]COPY，第一个点代表根目录下的所有文件，第二个点表示当前的工作路径。RUN允许我们在创建
跟我一起学Python数据处理（七十五）：网页抓取之网页分析技巧 lilye66 python 开发语言 pandas matplotlib
跟我一起学Python数据处理（七十五）：网页抓取之网页分析技巧大家好呀！在Python数据处理的学习道路上，我深知独自摸索可能会遇到不少困难，所以希望通过这些博客，能和大家一起学习、共同进步，让我们都能更熟练地掌握这门技术。今天，咱们接着深入探讨网页抓取中的关键环节——分析网页。一、网页抓取与网页分析的关联网页抓取是获取网络数据的重要手段，在数据处理流程里占据着关键位置。而网页分析则是网页抓取的
跨语言语义理解与生成：多语言预训练方法及一致性优化策略网罗开发 AI 大模型人工智能深度学习负载均衡
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python 抽象基类 ABC ：从实践到优雅 python
今天我们来聊聊Python中的抽象基类（AbstractBaseClass，简称ABC）。虽然这个概念在Python中已经存在很久了，但在日常开发中，很多人可能用得并不多，或者用得不够优雅。让我们从一个实际场景开始：假设你正在开发一个文件处理系统，需要支持不同格式的文件读写，比如JSON、CSV、XML等。初始版本：简单但不够严谨我们先来看看最简单的实现方式：classFileHandler:de
Python 并发编程实战：优雅地使用 concurrent.futures python
在Python多线程编程中，concurrent.futures模块提供了一个高层的接口来异步执行可调用对象。今天，我们将通过一个循序渐进的案例，深入了解如何使用这个强大的工具。从一个模拟场景开始假设我们需要处理一批网络请求。为了模拟这个场景，我们使用sleep来代表耗时操作：importtimeimportrandomdefslow_operation(task_id):"""模拟一个耗时的网络
shutil 标准库： Python 文件操作的万用刀 python
今天来聊一个被低估的Python标准库-shutil。工作中我们用Python（尤其是写一些短小轻快的脚本）虽然经常和文件打交道，却很少用到shutil。但实际上，shutil提供了比os模块更高级的文件操作接口，能让我们写出更Pythonic的代码。从一个真实场景说起最近在整理项目代码时，需要将散落在各处的配置文件归类到统一目录。按以往的习惯，我会这样写：importos#创建目标目录ifnot
Python 自带的日期日历处理大师：calendar 库 python
在Python开发中，我们经常需要处理日期和时间。虽然datetime库是最常用的选择，但其实Python标准库中的calendar模块也是一个强大的工具，特别适合处理日历相关的计算和展示。从一个真实场景开始假设你正在开发一个会议室预订系统，需要：展示月度视图计算工作日处理节假日逻辑让我们看看如何用calendar来优雅地解决这些问题。基础用法：生成日历importcalendar#创建日历对象c
Python性能优化的幕后功臣： __pycache__与字节码缓存机制 python
在日常Python开发中，我们经常会看到项目目录下神秘的__pycache__文件夹和.pyc文件。作为经验丰富的Python开发者，今天让我们深入理解这个性能优化机制。从一个性能困扰说起最近在优化一个数据处理微服务时，发现每次启动服务都需要2-3秒的预热时间。通过profile可以发现大量时间花在了Python模块的加载上。Python的编译过程与大多数人的认知不同，Python并不是纯解释型语
Python Generator：一个被低估的性能利器 python
调用OpenAI的API时，设置stream=True，接着forchunkincompletion:我们就可以“流式”地获取响应的内容。而非等待远程的模型将所有内容生成完毕，再返回给我们（这通常要等很久）。本文讨论这背后的PythonGenerator。从一个经典问题开始假设我们要处理一个超大的日志文件，需要按行读取并分析。传统的做法是：defread_log_file(filename):re
Python `__slots__` 进阶指南：不止于节省内存，从原理到实践 python
相信不少Python开发者都听说过__slots__，知道它可以帮助节省内存。但你是否思考过它背后的原理，以及在实际开发中的其他妙用？让我们一起深入探讨。从一个性能问题说起假设你的一个系统需要处理大量的订单对象：classOrder:def__init__(self,order_id,symbol,price,quantity):self.order_id=order_idself.symbol=
Python 元类（Meta Class）：解密 Python 面向对象编程的幕后推手后端python
在Python编程中，我们每天都在和类打交道，但是你是否也和我一样想过：类本身是什么？是谁创建了类？元类（MetaClass）就是用来创建类的"类"。今天让我们一起深入理解这个强大而神秘的特性。从一个简单的类说起classPerson:def__init__(self,name):self.name=namedefgreet(self):returnf"Hello,I'm{self.name}"#
langchain系列（二）- 提示词模板以及消息码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250212说明：技术梳理提示词模板理论说明提示模板将用户输入和参数转换为语言模型的指令，以此来实现模型的响应，帮助它理解上下文并生成相关且连贯的基于语言的输出。其接受一个字典作为输入，其中每个键代表提示
langchain系列 - FewShotPromptTemplate 少量示例码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250220说明：技术梳理，针对FewShotPromptTemplate专门来写一篇博客概念说明few-shot最初来源于机器学习的概念，还有one-shot、zero-shot概念，概念如下：机器学习
nginx ngx_http_module(9) 指令详解 s_fox_ nginx nginx http 运维
nginxngx_http_module(9)指令详解nginx模块目录nginx全指令目录一、目录1.1模块简介ngx_http_uwsgi_module：uWSGI支持模块，允许Nginx与uWSGI服务器进行通信。uWSGI是一种应用服务器协议，广泛用于PythonWeb应用的部署。通过该模块，Nginx可以将动态请求转发给uWSGI服务器处理，并将响应返回给客户端。常用的指令包括uwsgi
sql注入之python脚本进行时间盲注和布尔盲注温柔小胖 sql 数据库网络安全
一、什么是时间盲注和布尔盲注？答：时间盲注是攻击者通过构造恶意sql语句利用sleep()等延迟函数来观察数据库响应时间差异来进行推断信息和条件判断。如果条件为真，数据库会执行延时操作，如果为假则立即返回。响应时间较短。SELECTIF(1=1,SLEEP(5),0);如果条件为真、数据库会暂停5s如果条件为假、数据库会立即返回布尔盲注通过观察数据库返回的不同响应（如真或假）来推断信息。攻击者构造
Python中的生成器表达式（generator expression） Java资深爱好者 python python 开发语言
Python中的生成器表达式（generatorexpression）是一种类似于列表解析（listcomprehension）的语法结构，但它返回的是一个生成器（generator）对象，而不是一个完整的列表。生成器对象是一个迭代器，它可以逐个产生元素，而不是一次性生成所有元素，从而节省内存空间。生成器表达式在形式上与列表解析非常相似，但是它们使用圆括号()而不是方括号[]。当你迭代生成器表达式
Ollama部署大模型，本地调用居7然 android 人工智能 chatgpt 爬虫开发语言 AI编程
Ollama简单介绍Ollama是一个强大的大型语言模型平台，它允许用户轻松地下载、安装和运行各种大型语言模型。在本文中，我将指导你如何在你的本地机器上部署Ollama，并展示如何使用Python进行简单的API调用以访问这些模型最近很多人在学习大模型的时候，也遇到这个问题了，Ollama下载的模型，如果不想在命令行里面直接使用，而是想用Python去调用大模型该如何去使用？这是Ollama的官网
PyInstaller参数大揭秘：一文读懂打包神器的核心密码 Abossss Python python
一、引言在Python开发的广阔领域中，我们常常会面临这样一个问题：如何将自己精心编写的Python脚本，分享给那些没有Python环境的小伙伴，或者部署到生产环境中呢？这时候，PyInstaller库就如同一位救星，闪亮登场。PyInstaller是一个功能强大的跨平台打包工具，它可以将Python脚本及其所有依赖项，打包成一个独立的可执行文件。这意味着，无论目标系统是否安装了Python环境，
量化交易策略都有哪些？怎么运用？股票程序化交易接口 Python股票量化交易股票API接口量化交易量化交易策略均值回归动量策略风险控制股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>均值回归策略：寻找价格的回归点均值回归的原理均值回归策略是基于一种市场现象，即价格不会永远偏离其长期的平均值。从市场的历史数据来看，无论是股票、期货还是其他金融资产，价格总是围绕着一个均值上下波动。这就像一个有弹性的绳子，当价格被拉伸
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页杰九 vue.js spring boot java
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页往期的文章都在这里啦，大家有兴趣可以看一下后端部分：【全栈】SprintBoot+vue3迷你商城（1）【全栈】SprintBoot+vue3迷你商城（2）【全栈】SprintBoot+vue3迷你商城-扩展：利用python爬虫爬取商品数据【全栈】SprintBoot+vue3迷你商城（3）【全栈】SprintBoot+vue3
有需要2025年参加蓝桥杯比赛的同学往下看！！！岱宗夫up 教程蓝桥杯职场和发展
有需要2025年参加蓝桥杯比赛的同学往下下看！！！以下是关于近两年（2023年和2024年）蓝桥杯Python组考点的详细总结：一、2023年蓝桥杯Python考点分析在2023年的蓝桥杯Python竞赛中，考点主要集中在基础算法、数据结构、动态规划、数学、高精度计算以及二分查找等方面。（一）基础算法基础算法是竞赛的基石，包括枚举、排序（如冒泡排序、选择排序、插入排序等）、搜索（如BFS和DFS）
Ubuntu22 安装多个版本的python 莫忘初心丶 python 数据库开发语言
前言使用pyenv是一个很好的选择，尤其是在需要管理多个Python版本时。它提供了一个简单的方法来安装、切换和管理多个版本的Python，而不必依赖系统的包管理器或update-alternatives。特别是当你需要在同一系统中频繁切换Python版本时，pyenv会显得更加方便。目录前言为什么使用`pyenv`安装`pyenv`1.安装依赖2.安装`pyenv`3.配置shell环境4.安装
python的继承 zhangbeizhen18 L01-基础
记录：备忘录。1.继承classPerson(object):def__init__(self,p_name,p_addr,p_age):self.name=p_nameself.addr=p_addrself.age=p_ageclassGirl(Person):def__init__(self,g_name,g_addr,g_age,g_bra_cup):Person.__init__(sel
【MySQL】表空间丢失处理（Tablespace is missing for table 错误处理） m0_74824823 面试学习路线阿里巴巴 mysql 数据库
问题背景最近，我在运行一个基于Python爬虫的项目时，爬虫需要频繁与MySQL数据库交互。不幸的是，在数据爬取过程中，Windows系统突然强制更新并重启。这次意外中断导致MySQL数据库的三个表格（2022年、2023年和2024年的数据表）出现了“Tablespaceismissing”的错误。起初，我尝试了常规的CHECKTABLE和REPAIRTABLE方法，但这些都没有解决问题。最终，
Python 继承详解江湖一条鱼 python
继承是面向对象编程（OOP）的一个重要特性，允许一个类（子类）从另一个类（父类）继承属性和方法。继承可以提高代码的重用性，增强程序的可扩展性和可维护性。目录一、继承的作用二、继承的语法1.单继承2.多继承三、子类扩展1.添加新功能2.重写父类方法3.调用父类方法四、继承的特殊情况1.子类初始化父类2.方法解析顺序（MRO）五、抽象类与接口1.抽象类2.接口3.ABC类4.使用方法1.定义抽象基类2
【如何学习商城源码】启山智软商城源码微信小程序小程序 java
学习商城源码是一个系统而深入的过程，需要掌握多种方法和技巧。以下是一些建议，帮助你有效地学习商城源码：一、搭建学习环境准备开发工具编程语言相关：根据商城源码使用的编程语言，安装相应的集成开发环境（IDE）。例如，若源码是Java语言编写的，可安装IntelliJIDEA或Eclipse；若是Python语言，可选择PyCharm等。这些IDE能帮助你高效地编辑、调试代码，提供语法高亮、自动补全等功
从零创建一个 Django 项目 m0_74824823 面试学习路线阿里巴巴 django python 后端
1.准备环境在开始之前，确保你的开发环境满足以下要求：安装了Python(推荐3.8或更高版本)。安装pip包管理工具。如果要使用MySQL或PostgreSQL，确保对应的数据库已安装。创建虚拟环境在项目目录中创建并激活虚拟环境，保证项目依赖隔离：#创建虚拟环境python-mvenvenv#激活虚拟环境#WindowsenvScriptsactivate#Linux/Macsourceenv/
anaconda中的python在pycharm中用不了_Pycharm中使用Anaconda 白白前
Pycharm中使用Anaconda问题：安装完Pycharm和Anaconda后，想让Pycharm能调用Anaconda中包含的各种包。这样就不用重复安装各种包了。Anaconda下载安装Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包，Anaconda的下载文件比较大(约515MB)。安装Anacond
python - 永久存储 susie0815 python python 服务器
打开文件使用open()函数打开文件时，openfilemode（文件打开模式）是一个决定了以何种方式打开文件以及对文件可以进行哪些操作的重要参数。基本模式只读模式（‘r’）默认的打开模式，用于读取文件。如果文件不存在，会抛出FileNotFoundError异常。try:file=open('test.txt','r')content=file.read()print(content)file.
自动化测试的学习路线 Ws＿学习
自动化测试是提高软件开发效率和质量的关键手段。学习自动化测试通常涉及多个方面的技能，从基础的编程语言知识到测试工具的使用，再到实际的测试脚本编写和执行。以下是一个学习自动化测试的路线图，帮助你有条不紊地掌握相关技能：1.基础知识在开始自动化测试之前，首先要具备一定的编程和软件测试基础：编程语言：Python、Java、JavaScript或者Ruby（根据你选择的自动化测试工具决定）软件测试基础：
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象