XIUXIU179

序列输入// 输出

1 分析或读取序列

Bio.SeqIO.parse()将序列数据读成 SeqRecord 对象。它有两个参数:第一个参数是要读取的 handle。handle 是一个要读的打开文件,但是可以从命令行输出,或者可以从网上下载。第二个参数是一个小写的序列特征格式--我们不会为你猜想文件格式。到

http://biopython.org/wiki/SeqIO 查看支持的文件格式。这会返回一个给出SeqRecord 对象的迭代器,它主要用于 for 循环中。有时你会发现自己在处理仅仅包含单一记录的文件。对于此种情况,Biopython 1.45 引入了 Bio.SeqIO.read()函数。这也使用 handle 和格式作为参数。如果有一个或仅仅一个记录,将作为一个 SeqRecord 对象返回。

1.1 读取序列文件

总体上来将 Bio.SeqIO.parse() 是用来读取序列文件并作为 SeqRecord 对象 ,往往用在 for 循环中:

from Bio import SeqIO
handle = open("ls_orchid.fasta")
for seq_record in SeqIO.parse(handle, "fasta") :
print seq_record.id
print repr(seq_record.seq)
print len(seq_record.seq)

handle.close()

这个例子是 2.4 节的,它会载入包含 orchid DNA 序列的 FASTA 格式文件
19Biopython 中文指南
生物信息学论坛 http://www.bioxxx.cn 倾力奉献
ls_orchid.fasta. 如果想载入一个 GenBank 格式文件,例如 ls_orchid.gbk,改下文
件名和格式就可以了:
from Bio import SeqIO
handle = open("ls_orchid.gbk")
for seq_record in SeqIO.parse(handle, "genbank") :
print seq_record.id
print seq_record.seq
print len(seq_record.seq)
handle.close()
类似的,如果你想读取另一种文件格式的文件,同时假定 Bio.SeqIO.parse()支持该格式,你需要做的就是将格式字符串改为合适的,例如 "swiss"代表SwissProt 文件,或者"embl"代表 EMBL 文本文件。具体文件格式列表可参看 wiki页面 (http://biopython.org/wiki/SeqIO).

1.2 在序列文件中重复记录

在以上的例子中,我们往往使用 for 循环来遍历记录。你可以使用 for 循环和其他支持遍历的 python 对象(列表,元组及字符串)。Bio.SeqIO 返回的对象往往是 SeqRecord 对象的遍历。你需要轮流查看每一个记录,但是仅仅一次。附加一点是当你处理大文件时,使用 iterator 会节约你的内存。除了使用 for 循环 ,你也可以使用.next()方法来逐步调试条目:
from Bio import SeqIO
handle = open("ls_orchid.fasta")
record_iterator = SeqIO.parse(handle, "fasta")
first_record = record_iterator.next()
print first_record.id
print first_record.description
second_record = record_iterator.next()
print second_record.id
print second_record.description
handle.close()

如果你使用.next(),没有更多的结果,你将得到一个特殊的 python 对象 None或者一个 StopIteration 错误。我们也考虑了一个特殊的情况,当你的序列文件中包含多个记录,但是你仅仅想要第一个。这种情况下,以下代码就很简明:

from Bio import SeqIO
first_record = SeqIO.parse(open("ls_orchid.gbk"), "genbank").next()

一个注意事项--像这样使用.next()方法将会忽略文件中任何添加的记录。当你的文件中仅仅有一条记录时,就像这一章中的某些在线的例子,或者包含单个染色体的 GenBank 文件,那么使用新的 Bio.SeqIO.read()函数替代。这将会检查是否有其他非期待的记录存在。

1.3 在一个序列文件

在前一节中,我们讨论了 Bio.SeqIO.parse()给出 SeqRecord 遍历,你逐个的得到了记录。最常用的是使用两一个顺序来存取记录。 Python 列表数据类型很适合这个,我们可以使用 list()把记录遍历转变为一个包含 SeqRecord 对象的列表:
from Bio import SeqIO
handle = open("ls_orchid.gbk")
records = list(SeqIO.parse(handle, "genbank"))
handle.close()
print "Found %i records" % len(records)
print "The last record"
last_record = records[-1] #using Python's list tricks
print last_record.id
print repr(last_record.seq)
print len(last_record.seq)
print "The first record"
first_record = records[0] #remember, Python counts from zero
print first_record.id
print repr(first_record.seq)
print len(first_record.seq)
Giving:
Found 94 records

The last record
Z78439.1
Seq('CATTGTTGAGATCACATAATAATTGATCGAGTTAATCTGGAGGATCTGT
TTACT...GCC', IUPACAmbiguousDNA())
592
The first record
Z78533.1
Seq('CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGA
CCGTGG...CGC', IUPACAmbiguousDNA())
740

当然,你一可以继续对 SeqRecord 对象列表使用 for 循环。使用一个 list 比一个 iterator 更灵活(例如,你可以通过 list 长度来确定记录的数目),但是会使用更多的内存,因为它把记录一次性全部包括在内存里。

1.4 提取数据

假定你想要从 ls_orchid.gbk 文件中提取物种列表。让我们先来看下文件的第一条记录,看下物种信息存储在那个部分。
from Bio import SeqIO
record_iterator = SeqIO.parse(open("ls_orchid.gbk"), "genbank")
first_record = record_iterator.next()
print first_record
会给出以下的信息:
ID: Z78533.1
Name: Z78533
Desription: C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA.
/source=Cypripedium irapeanum
/taxonomy=['Eukaryota', 'Viridiplantae', 'Streptophyta', ..., 'Cypripedium']
/keywords=['5.8S ribosomal RNA', '5.8S rRNA gene', 'internal transcribed spacer',
'ITS1', 'ITS2']
/references=[...]
/accessions=['Z78533']
/data_file_division=PLN
/date=30-NOV-2006
/organism=Cypripedium irapeanum
/gi=2765658

Seq('CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGG...CGC', IUPACAmbiguousDNA())

我们所需要的信息 Cypripedium irapeanum 存储在注释字典,在 source 和organism 后,因此,我们可以这样获得:
print first_record.annotations["source"]或者:print first_record.annotations["organism"]一般来说, organism 是用在科学命名上(拉丁语) ,source 是一个通常的名字。在这个例子中,像平常一样,它们是一致的。现在让我们遍历所有记录,构建一个每一个 orchid 序列组成的物种的列表:
from Bio import SeqIO
handle = open("ls_orchid.gbk")
all_species = []
for seq_record in SeqIO.parse(handle, "genbank") :
all_species.append(seq_record.annotations["organism"])
handle.close()

print all_specie

另一个方法是使用列表 comprehension:
from Bio import SeqIO
all_species
=
[seq_record.annotations["organism"]
for
seq_record
in
SeqIO.parse(open("ls_orchid.gbk"), "genbank")]
print all_species
不管哪一个方法,结果是:
['Cypripedium irapeanum', 'Cypripedium californicum', ..., 'Paphiopedilumbarbatum']
很好,这很容易,因为 GenBank 文件是使用标准方式进行注释的。现在,假设你想从 FASTA 文件,而不是 GenBank 文件中提取物种的列表。坏消息是你需要写一些代码从记录描述行提取你想要的数据--如果信息是在文件中的第一个位置。对于这个例子,注意,如果你使用空格分解描述行,那样的话,物种处于第 1 个位置(第 0 位置是记录标识符)。因此我们可以这样做:
from Bio import SeqIO
handle = open("ls_orchid.fasta")
all_species = []
for seq_record in SeqIO.parse(handle, "fasta") :
all_species.append(seq_record.description.split()[1])
handle.close()
print all_species
给出:
['C.irapeanum', 'C.californicum', 'C.fasciculatum', 'C.margaritaceum', ..., 'P.barbatum']
更简介的使用 list comprehension 方法:
from Bio import SeqIO
all_species
=
[seq_record.description.split()[1]
for
seq_record
in
SeqIO.parse(open("ls_orchid.fasta"), "fasta")]
print all_species

一般来说,从 FASTA 描述行提取信息并不是十分顺利,如果使用更好的注释文件格式,例如 GenBank 或 EMBL,这种注释信息分类将会更容易处理。

2 从网上分析序列

在先前的章节中,我们从一个文件 handle 来分析序列数据。我们暗示 handles并不总是来自于文件,在本节中,将使用 handles 连接网络下载序列。注意,因为你可以下载序列数据,并且分析成 SeqRecord 对象,这并意味着总是一个好的主意。一般来说,你需要下载序列,保存以备重用的。

2.1 从网上分析 GenBank 记录

现在我们仅仅连接到 NCBI使用它们的 GI 号从 GenBank 中得到些 orchid 的蛋白质。首先,我们先提取一个记录。记住,当你希望 handle 包含仅仅一个记录时,使用 Bio.SeqIO.read() 函数 :

rom Bio import Entrez
form Bio import SeqIO
handle = Entrez.efetch(db="protein", rettype="genbank", id="6273291")
seq_record = SeqIO.read(handle, "genbank")
handle.close()
print "%s with %i features" % (seq_record.id, len(seq_record.features))
期望输出为:
gi|6273291|gb|AF191665.1|AF191665 with 3 features
NCBI 同时会让你选择其他格式,例如 FASTA 文件。如果你不关心 GenBank文件中的注释和特性,那会是一个很好的下载选择,因为它更小些:
from Bio import Entrez
form Bio import SeqIO
handle = Entrez.efetch(db="protein", rettype="fasta", id="6273291")
seq_record = SeqIO.read(handle, "fasta")
handle.close()
print "%s with %i features" % (seq_record.id, len(seq_record.features))
期望输出:
gi|6273291|gb|AF191665.1|AF191665 with 0 features
现在让我们取回更多的记录。这次,handle 包含多条记录,因此我们需要使
用 Bio.SeqIO.parse() 函数:
from Bio import Entrez
form Bio import SeqIO
handle = Entrez.efetch(db="protein", rettype="genbank", id="6273291,6273290,627
3289")
for seq_record in SeqIO.parse(handle, "genbank") :
print seq_record.id, seq_record.description[:50] + "..."
print "Sequence length %i," % len(seq_record),
print "%i features," % len(seq_record.features),

print "from: %s" % seq_record.annotations['source']

handle.close()
将给出以下的输出:
AF191665.1 Opuntia marenae rpl16 gene; chloroplast gene for c...
Sequence length 902, 3 features, from: chloroplast Opuntia marenae
AF191664.1 Opuntia clavata rpl16 gene; chloroplast gene for c...
Sequence length 899, 3 features, from: chloroplast Grusonia clavata
AF191663.1 Opuntia bradtiana rpl16 gene; chloroplast gene for...
Sequence length 899, 3 features, from: chloroplast Opuntia bradtianaa
查看第七章关于 Bio.Entrez 模块的更多信息,确信你读了 NCBI 使用 Entrez

2.2 从网上分析 SwissProt 序列

现在让我们使用 handle 从 ExPASy 下载一个 SwissProt 文件,更多内容在第8章。正如上面所讲,Bio.SeqIO.read()函数包含在 1.45 版本(或更高)中。
from Bio import ExPASy
from Bio import SeqIO
handle = ExPASy.get_sprot_raw("O23729")
seq_record = SeqIO.read(handle, "swiss")
handle.close()
print seq_record.id
print seq_record.name
print seq_record.description
print repr(seq_record.seq)
print "Length %i" % len(seq_record)
print seq_record.annotations['keywords']
假定你的网络连接通畅,你会得到以下返回结果:
O23729
CHS3_BROFI
Chalcone synthase 3 (EC 2.3.1.74) (Naringenin-chalcone synthase 3).
Seq('MAPAMEEIRQAQRAEGPAAVLAIGTSTPPNALYQADYPDYYFRITKSEHLTELK...GAE', ProteinAlphabet())
Length 394
['Acyltransferase', 'Flavonoid biosynthesis', 'Transferase']

3 序列文件作为字典

下一件事我们需要做的是,使用 python 的字典数据类型,就像在数据库里索引和定位 orchid 文件一样。对于大的文件这是很有用的,因为你仅仅需要存取文件的某个元素,做成一个好的快速的数据库。你可以使用 SeqIO.to_dict()函数来生成一个 SeqRecord 字典(在内存里)。默认的,这将使用到每一个记录的标识符(id)作为关键词。让我们用 GenBank 文件试一下:
from Bio import SeqIO
handle = open("ls_orchid.gbk")
orchid_dict = SeqIO.to_dict(SeqIO.parse(handle, "genbank"))
handle.close()
由于这个可变的 orchid_dict 成为一个 python 字典,我们可以使用我们已有
的所有关键词进行查找:
>>> print orchid_dict.keys()
['Z78484.1', 'Z78464.1', 'Z78455.1', 'Z78442.1', 'Z78532.1', 'Z78453.1', ..., 'Z78471.1']
我们可以通过关键词来存取一个单 SeqRecord 对象,就像平常一样控制该对象:
>>> seq_record = orchid_dict["Z78475.1"]
>>> print seq_record.description
P.supardii 5.8S rRNA gene and ITS1 and ITS2 DNA
>>> print repr(seq_record.seq)
Seq('CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGTTGAGA
TCACAT...GGT', IUPACAmbiguousDNA())
所以,很容易创建一个内存里的关于 GenBank 记录的数据库。接下来,我

们将使用 FASTA 格式来试一下。

3.1 写入序列文件

我们将讨论使用 Bio.SeqIO.parse()进行序列输入(读取文件),现在,我们将看一下 Bio.SeqIO.write()进行序列输出(写入文件)。这个函数包含有三个变量:一些 SeqRecord 对象,一个要写入的 handle 及一个序列格式。这里有一个例子,我们以创建一些 SeqRecord 对象开始(手动,而非从一个文件载入)

from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
from Bio.Alphabet import generic_protein
rec1
=
SeqRecord(Seq("MMYQQGCFAGGTVLRLAKDLAENNRGARVLVVCSEITAVTF
RGPSETHLDSMVGQALFGD" \
+"GAGAVIVGSDPDLSVERPLYELVWTGATLLPDSEGAIDGHLREV
GLTFHLLKDVPGLISK" \
+"NIEKSLKEAFTPLGISDWNSTFWIAHPGGPAILDQVEAKLGLKE
EKMRATREVLSEYGNM" \
+"SSAC", generic_protein),
id="gi|14150838|gb|AAK54648.1|AF376133_1",
description="chalcone synthase [Cucumis sativus]")
rec2
=
SeqRecord(Seq("YPDYYFRITNREHKAELKEKFQRMCDKSMIKKRYMYLTEEIL
KENPSMCEYMAPSLDARQ" \
+"DMVVVEIPKLGKEAAVKAIKEWGQ", generic_protein),
id="gi|13919613|gb|AAK33142.1|",
description="chalcone synthase [Fragaria vesca subsp. bracteata]")
rec3
=
SeqRecord(Seq("MVTVEEFRRAQCAEGPATVMAIGTATPSNCVDQSTYPDYYFR
ITNSEHKVELKEKFKRMC" \
+"EKSMIKKRYMHLTEEILKENPNICAYMAPSLDARQDIVVVEVP
KLGKEAAQKAIKEWGQP" \
+"KSKITHLVFCTTSGVDMPGCDYQLTKLLGLRPSVKRFMMYQQ
GCFAGGTVLRMAKDLAEN" \
+"NKGARVLVVCSEITAVTFRGPNDTHLDSLVGQALFGDGAAAVII
GSDPIPEVERPLFELV" \
+"SAAQTLLPDSEGAIDGHLREVGLTFHLLKDVPGLISKNIEKSLVE
AFQPLGISDWNSLFW" \

+"IAHPGGPAILDQVELKLGLKQEKLKATRKVLSNYGNMSSACVL
FILDEMRKASAKEGLGT" \
+"TGEGLEWGVLFGFGPGLTVETVVLHSVAT", generic_protein),
id="gi|13925890|gb|AAK49457.1|",
description="chalcone synthase [Nicotiana tabacum]")
my_records = [rec1, rec2, rec3]
现在我们有了一个 SeqRecord 对象列表,我们将把它们写入到一个 FASTA
格式文件中。
from Bio import SeqIO
handle = open("my_example.fasta", "w")
# 原文中为 faa
SeqIO.write(my_records, handle, "fasta")
handle.close()
在你最喜欢的文本编辑器中打开这个文件,你可以得到像下面的结果::
>gi|14150838|gb|AAK54648.1|AF376133_1 chalcone synthase [Cucumis sativus]
MMYQQGCFAGGTVLRLAKDLAENNRGARVLVVCSEITAVTFRGPSETHLDSMVGQALFGDGAGAVIVGSDPDLSVERPLYELVWTGATLLPDSEGAIDGHLREVGLTFHLLKDVPGLISKNIEKSLKEAFTPLGISDWNSTFWIAHPGGPAILDQVEAKLGLKEEKMRATREV
LSEYGNMSSAC
>gi|13919613|gb|AAK33142.1| chalcone synthase [Fragaria vesca subsp. bracteata]
YPDYYFRITNREHKAELKEKFQRMCDKSMIKKRYMYLTEEILKENPSMCEYMAPSLDARQDMVVVEIPKLGKEAAVKAIKEWGQ
>gi|13925890|gb|AAK49457.1| chalcone synthase [Nicotiana tabacum]

MVTVEEFRRAQCAEGPATVMAIGTATPSNCVDQSTYPDYYFRITNSEHKVELKEKFKRMCEKSMIKKRYMHLTEEILKENPNICAYMAPSLDARQDIVVVEVPKLGKEAAQKAIKEWGQPKSKITHLVFCTTSGVDMPGCDYQLTKLLGLRPSVKRFMMYQQGCFAGGTVLRMAKDLAENNKGARVLVVCSEITAVTFRGPNDTHLDSLVGQALFGDGAAAVIIGSDPIPEVERPLFELVSAAQTLLPDSEGAIDGHLREVGLTFHLLKDVPGLISKNIEKSLVEAFQPLGISDWNSLFWIAHPGGPAILDQVELKLGLKQEKLKATRKVLSNYGNMSSACVLFILDEMRKASAKEGLGTTGEGLEWGVLFGFGPGLTVETVVLHSVAT

3.2 指定字典的键

使用 FASTA 文件代替,用法和上面的相似:
from Bio import SeqIO
handle = open("ls_orchid.fasta")
orchid_dict = SeqIO.to_dict(SeqIO.parse(handle, "fasta"))
handle.close()
print orchid_dict.keys()
这一次,键是:
['gi|2765596|emb|Z78471.1|PDZ78471', 'gi|2765646|emb|Z78521.1|CCZ78521', ...
..., 'gi|2765613|emb|Z78488.1|PTZ78488', 'gi|2765583|emb|Z78458.1|PHZ78458']

当我们在先前的 2.4.1 节分析 FASTA 文件时,你就需要认识这些字符串。假定你更愿意使用其他作为键--像 AC 号。这给了我们一个很好的 SeqIO.to_dict()的选择参数 key_function, 将让你定义你所使用的记录的字典的键。首先,当给出 SeqRecord 对象时,你需要写你自己的函数来得到你想要的键。一般来说,函数细节将依赖于你处理的输入记录的分类。但是对于 orchids,我们仅仅需要使用"|",把标识符分开,然后返回第四个条目:

def get_accession(record) :
""""Given a SeqRecord, return the accession number as a string
e.g. "gi|2765613|emb|Z78488.1|PTZ78488" -> "Z78488.1"
"""

parts = record.id.split("|")
assert len(parts) == 5 and parts[0] == "gi" and parts[2] == "emb"
return parts[3]
这样,我们可以把这个函数送到 SeqIO.to_dict()函数以构建字典:
from Bio import SeqIO
handle = open("ls_orchid.fasta")
orchid_dict
=
SeqIO.to_dict(SeqIO.parse(handle,
"fasta"),
key_function=get_accession)
handle.close()
print orchid_dict.keys()
最后,像预期的那样,新的字典键:
>>> print orchid_dict.keys()
['Z78484.1', 'Z78464.1', 'Z78455.1', 'Z78442.1', 'Z78532.1', 'Z78453.1', ..., 'Z78471.1']
我希望并不是十分复杂!

3.3 使用 SEGUID 来索引一个字典

给出另外一个处理 SeqRecord 对象字典的例子,我们需要使用 SEGUIDchecksum 函数(在 Biopython 1.44 中添加).这是一个最近的 checksum,冲突会很稀少 (也就是说,两个不同的序列使用一个相同的 checksum)在 CRC64checksum 上改进。再次处理 orchids 的 GenBank 文件:
from Bio import SeqIO
from Bio.SeqUtils.CheckSum import seguid
for record in SeqIO.parse(open("ls_orchid.gbk"), "genbank") :
print record.id, seguid(record.seq)
会给出:
Z78533.1 JUEoWn6DPhgZ9nAyowsgtoD9TTo
Z78532.1 MN/s0q9zDoCVEEc+k/IFwCNF2pY
...
Z78439.1 H+JfaShya/4yyAj7IbMqgNkxdxQ

现在,重新调用 Bio.SeqIO.to_dict()函数的 key_function 变量期待一个函数将SeqRecord 变成一个字符串。我们不能直接使用 seguid()函数,因为它将给出一个 Seq 对象(或一个字符串)但是,我们可以使用 python 的 lambda 特性创造一个“一次性”的函数给 Bio.SeqIO.to_dict()代替:
from Bio import SeqIO
from Bio.SeqUtils.CheckSum import seguid
seguid_dict = SeqIO.to_dict(SeqIO.parse(open("ls_orchid.gbk"), "genbank"),lambda
rec : seguid(rec.seq))
record = seguid_dict["MN/s0q9zDoCVEEc+k/IFwCNF2pY"]
print record.id
print record.description
那会检索到记录 Z78532.1,文件中的第二个条目。

4.1 在序列文件格式间转化

在先前的例子中,我们使用了一个 SeqRecord 对象列表作为 Bio.SeqIO.parse()的输入,但是它也接受 SeqRecord iterator,就像我们在 Bio.SeqIO.parse()中所得到的一样—这使得我们很简单的进行文件转化。例如,我们将读取 ls_orchid.gbk文件,然后输出为 FASTA 格式:
from Bio import SeqIO
in_handle = open("ls_orchid.gbk", "r")
out_handle = open("my_example.fasta", "w")
SeqIO.write(SeqIO.parse(in_handle, "genbank"), out_handle, "fasta")
in_handle.close()
out_handle.close()
事实上,你可以在一行中完成,通过关闭文件 handle。这是一个不好的格
式,但是很简洁:
from Bio import SeqIO
SeqIO.write(SeqIO.parse(open("ls_orchid.gbk"), "genbank"), open("my_example.faa",

"w"), "fasta")

4.2 转化序列文件成它们的反向互补

假如你有一个核酸序列文件,你希望把它转变成包含它们反向互补序列的文件。这次我们需要做些工作来转换我们得到的文件中的 SeqRecords 成适合保存的输出文件。我们将使用 Bio.SeqIO.parse()从一个文件中载入一些核酸序列开始。然后使用 Seq 对象的内置函数.reverse_complement()方法,打印出它们的反向互补。
from Bio import SeqIO
in_handle = open("ls_orchid.gbk")
for record in SeqIO.parse(in_handle, "genbank") :
print record.id
print record.seq.reverse_complement().tostring()
in_handle.close()
现在,如果你想保存这些反向互补序列到一个文件中,我们需要创造SeqRecord 对象。对于此,我想写我们自己的函数会更简洁,我们可以决定如何命名我们的新记录:
from Bio.SeqRecord import SeqRecord
def make_rc_record(record) :
"""Returns a new SeqRecord with the reverse complement sequence"""
rc_rec = SeqRecord(seq = record.seq.reverse_complement(), \
id = "rc_" + record.id, \
name = "rc_" + record.name, \
description = "reverse complement")
return rc_rec
然后,我们可以使用这个来把输入记录转变为反向互补记录以输出。如果你不介意一次将所有的记录保存在内存中,这样的话,python 的 map()函数是一个非常好的方式来解决做这个:
from Bio import SeqIO
in_handle = open("ls_orchid.fasta", "r")
records = map(make_rc_record, SeqIO.parse(in_handle, "fasta"))
in_handle.close()
out_handle = open("rev_comp.fasta", "w")
SeqIO.write(records, out_handle, "fasta")

out_handle.close()

这是一个展现 list comprehension 强大功能的好地方,你可以使用最简单的形式完成冗长的相当的任务:
records = [make_rc_record(rec) for rec in SeqIO.parse(in_handle, "fasta")]
list comprehension 有一个对其内容很好的修饰,你可以添加一个条件语句:
records = [make_rc_record(rec) for rec in SeqIO.parse(in_handle, "fasta") if
len(rec)<700]
这会在内存中创建一个序列长度小于 700 碱基对的反向互补记录。但是,如果你使用 Python 2.4 或更高版本,我们可以使用一个 generator 表达式来做相同的事情。但是这不是在内存中一次性创建所有的记录:
records = (make_rc_record(rec) for rec in SeqIO.parse(in_handle, "fasta") if
len(rec)<700)
如果你喜欢压缩的代码,不介意不严格的文件 handle,我们可以简化这个成
一长行:
from Bio import SeqIO
SeqIO.write((make_rc_record(rec) for rec in \
SeqIO.parse(open("ls_orchid.fasta", "r"), "fasta") if len(rec) < 700), \
open("rev_comp.fasta", "w"), "fasta")
个人观点,我认为以上的代码片段有点太压缩了,下面的代码更易阅读:
from Bio import SeqIO
records = (make_rc_record(rec) for rec in \
SeqIO.parse(open("ls_orchid.fasta", "r"), "fasta") \
if len(rec) < 700)
SeqIO.write(records, open("rev_comp.fasta", "w"), "fasta")
或者,对于 2.3 版本或更老版本:
from Bio import SeqIO
records = [make_rc_record(rec) for rec in \
SeqIO.parse(open("ls_orchid.fasta", "r"), "fasta") \
if len(rec) < 700]
SeqIO.write(records, open("rev_comp.fasta", "w"), "fasta")

基于Python的人工智能驱动基因组变异算法：设计与应用（上） Allen_LVyingbo python 医疗高效编程研发 python 人工智能算法健康医疗
一、引言1.1研究目标与内容本研究旨在设计并应用基于Python的人工智能驱动的基因组变异算法，以应对基因组学研究中日益增长的数据挑战，提高对基因组变异的理解和应用能力。主要研究内容包括：数据预处理：利用Python的Biopython、pandas等库，对来自公共数据库（如dbSNP、ClinVar、1000GenomesProject）的基因组数据（VCF、BAM、FASTA等格式）进行清洗、
Biopython提取和分离复合体PDB文件中所有链的结构信息 qq_27390023 生物信息学 python
从蛋白质复合体的PDB文件中提取每个链的结构信息，并保存成单独的pdb文件。示例代码fromBioimportPDBdefextract_chain_sequences(pdb_file,output_dir):"""从PDB文件中提取所有链的序列，并保存为独立的PDB文件。:parampdb_file:蛋白质复合体PDB文件路径:paramoutput_dir:输出目录，用于保存各链的PDB文件
Biopython从pdb文件中提取蛋白质链的信息 qq_27390023 开发语言 python
使用Biopython的PDB模块可以方便地解析PDB文件并提取你需要的信息。下面是一个示例代码，用于提取PDB文件中的链名称、序列和长度：示例代码fromBioimportPDB#读取PDB文件pdb_file="/Users/zhengxueming/Downloads/1a0h.pdb"parser=PDB.PDBParser(QUIET=True)structure=parser.get_
pythonnet-C#调用python脚本-含matplotlib+biopython 陆沙 c#和WPF python大法好 c#python matplotlib 生物信息
本地环境：win10，.NETCore6，Python3.9.13，pythonnet3.0.3测试的包：biopython1.82，matplotlib3.5.2参考：GitHub-pythonnet/pythonnet:Pythonfor.NETisapackagethatgivesPythonprogrammersnearlyseamlessintegrationwiththe.NETCom
计算叶绿体基因组LSC/IR/SSC的GC含量小明的数据分析笔记本
我这里使用python和biopython，关于python和Biopython的安装可以参考我的B站视频https://www.bilibili.com/video/BV1sA411x7xmhttps://www.bilibili.com/video/BV1GV411Y7ihimage.png输入文件就是叶绿体基因组的fasta文件，经过注释你已经知道LSC/IR/SSC的位置坐标，比如自己的叶
用Python做生信分析--环境配置 Xxxx. .Xxxx python python 开发语言算法笔记 c语言
文章目录pandas模块安装方法查看pandas是否安装好，以及版本的查看numpy模块安装方法查看numpy是否安装好，以及版本的查看biopython模块安装方法查看biopython是否安装好，以及版本的查看jupyter-notebook（我比较喜欢用这个写代码jupyternotebook快捷键pandas模块安装方法pipinstall-ihttps://pypi.tuna.tsing
Python-44 用Biopython计算DNA/RNA的GC含量和分子量 2020-08-25 RashidinAbdu
具体实现与解释如下：fromBio.SeqUtilsimportGCdna=("GCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCTGTTATGGGTCGTTGGAAGGGTGGTCGTGCT")dna1=("GACC")CONTENT=GC(dna)#计算GC含量print("GCcontentis")print(CONTENT)fromBio.SeqUtilsimportmole
利用Biopython来进行序列比对生信阿拉丁
作者：童蒙编辑：angelica前言序列比对在生物信息中很常见，通过比较序列的相似度来推测其相关的功能。序列比对一般针对的是两条或者多条序列，可以是DNA、RNA或者蛋白序列，来推测序列间的区域的相似度。识别相似区域使我们能够推断出许多信息，比如物种之间保存了哪些特征，不同物种在遗传上有多接近，物种是如何进化的等等。Biopython为序列比对提供了广泛的支持。我们今天从最简单的两条序列比对开始，
Genebank文件.gbk转fasta格式文件队长的生物实验室
这里用到python中Biopython包完成。步骤：1.安装Biopython包，在anacondaprompt中使用pipinstallbiopython或在Spyder中使用!pipinstallbiopython安装；2.gbk文件转核酸序列fromBioimportSeqIOgbk_filename="c00079_GUT_GEN...region001.gbk"#.gbk文件名faa_
Biopython的安装（使用pip）暮色下的烟波澜
2020-02-191、pip安装biopythonpython#查看确认python已安装pipinstallbiopython#1）使用pip安装biopython；#2）然后返回顺便给我安装了biopython和numpy；#3）最后安装在我的环境下面的./lib/python3.7/site-packages这里面（两个都是）python#调出python2、验证Biopython安装pr
clermontyping安装使用 Odd_guy 生物信息学 bash linux 数据分析
1安装依赖根据github主页提供的指示，我们需要安装以下依赖：1.1BLAST+下载并解压包：wgethttps://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/ncbi-blast-2.14.1+-x64-linux.tar.gztarzxvpfncbi-blast-2.14.1+-x64-linux.tar.gz1.2Biopython安装bi
PubMed数据采集及存储到MySQL数据库的Python实现代码飞翔数据库 mysql python Python
PubMed数据采集及存储到MySQL数据库的Python实现概述在生物医学领域，PubMed是一个常用的文献数据库，包含大量的医学文献摘要和全文信息。本文将介绍如何使用Python从PubMed中获取数据，并将其转化为DataFrame格式后存储到MySQL数据库中。我们将使用Python的Biopython库来实现PubMed数据的获取，pandas库用于处理数据并创建DataFrame，以及
202310-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream 小果运维生信分析-bioinfo 学习数据分析
MetaPhlAn4是一种基于DNA序列的微生物组分析工具，它能够从宏基因组测序数据中识别和分离微生物的组成。以下是安装和使用MetaPhlAn4的步骤：安装MetaPhlAn4：裸机环境，手动安装（1.安装依赖项：MetaPhlAn4需要Python3.7以上的版本（建议使用Anaconda环境），同时还需要安装Biopython、pandas和numpy等包。可以使用pip命令进行安装，例如：
biopython在pip以后import报错 Devin561
背景：python版本3.7.4用pipinstallbiopython成功后，发现importBio一直报错，最后经过一番折腾，在https://stackoverflow.com/questions/49848517/biopython-no-module-named-bio网站中找到了答案用pip3安装以后，成功importpip3install-ihttps://pypi.tuna.tsi
报错 | Bio.Alphabet has been removed from Biopython biogeeker
YoucansolvethisbydowngradingBiopythonto1.77：condainstallbiopython==1.77
BioPython ① | 统计蛋白序列中20种氨基酸的的个数和频率 Dream of Grass 生物信息 Python强基计划 python 生物信息华农氨基酸频率统计
统计蛋白序列中20种氨基酸的的个数和频率题目MNAPERQPQPDGGDAPGHEPGGSPQDELDFSILFDYEYLNPNEEEPNAHKVASPPSGPAYPDDVLDYGLKPYSPLASLSGEPPGRFGEPDRVGPQKFLSAAKPAGASGLSPRIEITPSHELIQAVGPLRMRDAGLLVEQPPLAGVAASPRFTLPVPGFEGYREPLCLSPASSGSSASF
为什么 Biopython 的在线 BLAST 这么慢？ BioIT爱好者
用过网页版本BLAST的童鞋都会发现，提交的序列比对往往在几分钟，甚至几十秒就可以得到比对的结果；而通过调用API却要花费几十分钟或者更长的时间！这到底是为什么呢？ncbi_blast.pngNCBIWWW基本用法首先，我们来看一下提供了基于API在线比对的Biopython模块。Biopython中的BLAST提供了overtheInternet和locally两种选择：Bio.Blast.NC
gff格式转gggenes的输入格式江有枫xx linux r语言
其实这种问题应该用biopython解决才是正解，但本人才疏学浅，就暂时这样快速瞎搞一下。使用prodigal得到的基因位置信息文件gff3或gff信息太多，但要用gggenes作图只需要序列名，起始坐标，结束坐标和方向（+1或-1）直接在linux中使用awk操作，生成这四列内容awk'!/^#/{count[$1]++;if($7=="+"){print$1"_"count[$1],$4,$5
Biopython序列比对 qq_27390023 python 生物信息学
从InterPro网站（https://www.ebi.ac.uk/interpro/download/Pfam/）下载多序列比对文件Pfam-A.seed.gz（含多个多序列比对）wget https://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.seed.gz解压，取第一个多多序列比对文件catPfam-A.seed|wh
Anaconda命令大全 ZHOUZAIHUI
1管理conda(1)检查condaconda--versionConda会返回你安装Anaconda软件的版本。(2)升级condacondaupdatecondaConda会检查可升级版本，并同时显示可升级的包。2管理运行环境(1)创建新运行环境condacreate--namesnowflakesbiopython创建名为snowflakes的新运行环境，其中包含包biopython(2)激
关于msms、biopython_residuedepth.py学习一条咸鱼在网游随便写写 linux centos ubuntu
问题：使用biopython中Residuedepth的时候，出现报错：显示未安装msms1、介绍（1）MSMS是一种生物信息学工具，全称为MolecularSurfaceandMolecularVolumefromMS。它主要用于计算蛋白质的分子表面积和体积，可用于研究蛋白质间相互作用、药物设计等领域。使用MSMS可以将一个蛋白质的三维结构文件（比如PDB格式）作为输入，经过计算后输出分子表面积
Biopython之序列输入多啦A梦的时光机_648d
Biopython1.序列输入主要功能是Bio.SeqIO.parse()获取filehandle（或文件名）和格式名称，并返回SeqRecord迭代器。这使您可以执行以下操作：fromBioimportSeqIOforrecordinSeqIO.parse("example.fasta","fasta"):print(record.id)orusingahandle:fromBioimportS
Biopython学习笔记（四）访问NCBI Entrez数据库生信start_site
Entrez是一个检索系统，供人们访问NCBI里各个数据库。比如说：PubMed,GenBank,GEO等等。你可以通过网站来搜索你想要的内容：https://www.ncbi.nlm.nih.gov/search/。当然你也可以使用Biopython的Bio.Entrez模块来访问Entrez。Bio.Entrez利用EUtils，包含８个工具，具体请见https://www.ncbi.nlm.
Biopython学习笔记（三）Blast 生信start_site
使用BLAST通常可以分成2个步。这两步都可以用上Biopython。第一步，提交你的查询序列，运行BLAST，并得到输出数据。第二步，用Python解析BLAST的输出，并作进一步分析。通过Internet运行BLAST使用Bio.Blast.NCBIWWW模块的里qblast()来调用在线版本的BLAST。有三个参数：（１）用来搜索blast程序。目前只支持：blastn,blastp,bla
python操作gff格式注释文件的简单小例子小明的数据分析笔记本
这里借助biopython模块参考链接是https://biopython.org/wiki/GFF_Parsing这里BCBio模块里GFF()函数解析的内容和Bio模块里SeqIO()函数解析的内容很像cds和外显子的关系cds是codingsequence的缩写具体关系看下图来自链接https://www.jianshu.com/p/cc5cd7053d6eimage.png开头结尾的外显子
安装ribotree-利用蒙特卡洛搜索树的RNA设计工具 June vinvin AI for Science python 深度学习
目录1安装依赖1.1安装arnie1.2安装DegScore1.3安装RiboGraphViz1.4安装biopython1.5安装Eternafold1.6安装linearfold和linearpartition2测试依赖3运行ribotree4附录1安装依赖1.1安装arniearnie用于管理各种RNA热动力学折叠的软件，下载连接：https://github.com/DasLab/arni
2021-01-15 基因组注释文件gff3转 gtf格式小郑的学习笔记
这个其实在服务器联网的状态下，操作起来十分简单首先给服务器安装conda然后用conda安装gffreadcondainstall-cbiocondagffread安装好之后，一条命令搞定gffreadHC.gff3-T-oHC.gtf反过来也可以gffreadHC.gtf-oHC.gff3如果没有linux系统，那么可以采用biopython详见：https://cloud.tencent.co
python sys.path.extend,如何设置Cygwin上的PYTHONPATH？玲珑阁玉韦 python sys.path.extend
IntheBiopythoninstallationinstructions,itsaysthatifBiopythondoesn'tworkI'msupposedtodothis:exportPYTHONPATH=$PYTHONPATH':/directory/where/you/put/Biopython'ItrieddoingthatinCygwinfromthe~directoryusin
Biopython教程发呆的比目鱼 DrugAi 人工智能
Biopython教程参考：https://biopython-cn.readthedocs.io/zh_CN/latest/index.html蛋白质文件获取Entrez方法fromBioimportEntrezEntrez.email='邮箱名'#如'[email protected]'handle=Entrez.esearch(db='protein',term='2rbg')record=E
DNA-蛋白翻译过程的Python实现 EmmettPeng 杂七杂八的Python小代码生物信息学 python
引言最近为了给平台上加上一个将DNA序列翻译为蛋白序列的工具，写了一个任何生信玩家初学时都会写的代码。看了一些别人的翻译工具，我也想尽量把代码写的完整一点，在这个过程中首次接触并使用了BioPython，目前看起来还是很好用的。代码#!/bin/python3fromBio.Seqimporttranslate,reverse_complementfromBioimportSeqIOfromBio
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓