剑九黄

《用Python进行自然语言处理》第2章获得文本语料和词汇资源

1. 什么是有用的文本语料和词汇资源，我们如何使用 Python 获取它们?
2. 哪些 Python 结构最适合这项工作?
3. 编写 Python 代码时我们如何避免重复的工作?

2.1 获取文本语料库

古腾堡语料库

import nltk
print(nltk.corpus.gutenberg.fileids()[:5])


#挑选这些文本的第一个 ——简·奥斯丁的《爱玛》——并给它一个简短的名称 emma，然后找出它包含多少个词
emma = nltk.corpus.gutenberg.words('austen-emma.txt')
print(len(emma))


#通过循环遍历前面列出的 gutenberg 文件标识符链表相应的 fileid，然后计算统计每个文本
from nltk.corpus import gutenberg
for fileid in gutenberg.fileids():
    #raw() 函数给我们没有进行过任何语言学处理的文件的内容。告诉我们文本中出现的词汇个数，包括词之间的空格。
    num_chars = len(gutenberg.raw(fileid))
    #print(gutenberg.raw(fileid))
    print(num_chars)
    num_words = len(gutenberg.words(fileid))
    print(gutenberg.words(fileid))
    print(num_words)
    #sents()函数把 文本划分成句子，其中每一个句子是一个词链表。
    print(gutenberg.sents(fileid))
    num_sents = len(gutenberg.sents(fileid))
    num_vocab = len(set([w.lower() for w in gutenberg.words(fileid)]))
    #平均词长、平均句子长度和本文中每个词出现的平均次数
    print(int(num_chars/num_words), int(num_words/num_sents), int(num_words/num_vocab), fileid)
    break

网络和聊天文本

#虽然古腾堡项目包含成千上万的书籍，它代表既定的文学。考虑较不正式的语言也是 很重要的。
#NLTK的网络文本小集合的内容包括 Firefox交流论坛，在纽约无意听到的对话， 《加勒比海盗》的电影剧本，个人广告和葡萄酒的评论
from nltk.corpus import webtext
for fileid in webtext.fileids():
    print(fileid,"内容：" + webtext.raw(fileid)[:10], '...', '\n')
    
    
#即时消息聊天会话语料库
#例如: 10-19- 20s_706posts.xml 包含 2006 年 10 月 19 日从 20 多岁聊天室收集的 706 个帖子。
from nltk.corpus import nps_chat
chatroom = nps_chat.posts('10-19-20s_706posts.xml')
print(chatroom[123])

布朗语料库

#布朗语料库是第一个百万词级的英语电子语料库,由布朗大学于 1961 年创建。
#这个 语料库包含 500 个不同来源的文本，按照文体分类，如:新闻、社论等。
#以将语料库作为词链表或者句子链表来访问(每个句子本身也是一个词链表 )。 我们可以指定特定的类别或文件阅读
from nltk.corpus import brown
print(brown.categories()[:5])
print(brown.words(categories='news'))
print(brown.words(fileids=['cg22']))



#布朗语料库是一个研究文体之间的系统性差异 ——一种叫做文体学的语言学研究——很方便的资源。
#让我们来比较不同文体中的情态动词的用法

#第一步:产生特定文体的计数
from nltk.corpus import brown
news_text = brown.words(categories='news')
fdist = nltk.FreqDist([w.lower() for w in news_text]) 
modals = ['can', 'could', 'may', 'might', 'must', 'will']
for m in modals:
    print(m + ':', fdist[m], end=" " )
    
#下面，我们来统计每一个感兴趣的文体。我们使用 NLTK 提供的带条件的频率分布函数
#fdist.tabulate()  绘制频率分布表
print()
cfd = nltk.ConditionalFreqDist(
    (genre, word)
    for genre in brown.categories()
    for word in brown.words(categories=genre))
genres = ['news', 'religion', 'hobbies', 'science_fiction', 'romance', 'humor']
modals = ['can', 'could', 'may', 'might', 'must', 'will']
cfd.tabulate(conditions=genres, samples=modals)
#新闻文体中最常见的情态动词是 will，而言情文体中最常见的情态动词是 could

路透社语料库

#路透社语料库包含 10,788 个新闻文档，共计 130 万字。这些文档分成 90 个主题，按照 “训练”和“测试”分为两组。
#因此，fileid 为“test/14826”的文档属于测试组。这样分割 是为了训练和测试算法
from nltk.corpus import reuters
print(reuters.fileids()[:5])#文档
print(len(reuters.fileids()))

print(reuters.categories()[:5])#主题
print(len(reuters.categories()))



#与布朗语料库不同，路透社语料库的类别是有互相重叠的，只是因为新闻报道往往涉及多个主题。
#我们可以查找由一个或多个文档涵盖的主题，也可以查找包含在一个或多个类别 中的文档。
#为方便起见，语料库方法既接受单个的 fileid 也接受 fileids 列表作为参数。
print(reuters.categories('training/9865'))  #该文档涉及好几个主题
print(reuters.categories(['training/9865', 'training/9880']))
print(reuters.fileids('barley')[:5])
print(reuters.fileids(['barley', 'corn'])[:5])



#类似的，我们可以以文档或类别为单位查找我们想要的词或句子。
#这些文本中最开始的几个词是标题，按照惯例以大写字母存储。
print(reuters.words('training/9865')[:5])
print(reuters.words(['training/9865', 'training/9880']))
print(reuters.words(categories=['barley', 'corn']))

就职演说语料库

from nltk.corpus import inaugural
print(inaugural.fileids()[:5])
#每个文本的年代都出现在它的文件名中。要从文件名中获得年代，我们使用 fileid[:4]提取前四个字符。
print([fileid[:4] for fileid in inaugural.fileids()][:5])



#让我们来看看词汇 america 和 citizen 随时间推移的使用情况
cfd = nltk.ConditionalFreqDist(
            (target, fileid[:4])
            for fileid in inaugural.fileids()         
            for w in inaugural.words(fileid)
            for target in ['america', 'citizen']
            #使用 w.lower()将就职演说语料库中的词汇转换成小写。
            # startswith()检查它们是否以“目 标”词汇 america 或 citizen 开始。
            if w.lower().startswith(target))
cfd.plot()

标注文本语料库

许多文本语料库都包含语言学标注，有词性标注、命名实体、句法结构、语义角色等。

在其他语言的语料库

#NLTK 包含多国语言语料库。某些情况下你在使用这些语料库之前需要学习如何在 Python中处理字符编码
print(nltk.corpus.cess_esp.words())
print(nltk.corpus.floresta.words())
print(nltk.corpus.indian.words('hindi.pos'))
print(nltk.corpus.udhr.fileids()[:5])
print(nltk.corpus.udhr.words('Javanese-Latin1')[11:])

#条件频率分布来研究 “世界人权宣言”(udhr)语料库中不同语言版本中的字长差异
from nltk.corpus import udhr
languages = ['Chickasaw', 'English', 'German_Deutsch', 'Greenlandic_Inuktikut', 'Hungarian_Magyar', 'Ibibio_Efik'] 
cfd = nltk.ConditionalFreqDist(
    (lang, len(word))
    for lang in languages
    for word in udhr.words(lang + '-Latin1'))
cfd.plot(cumulative=True)

文本语料库的结构

到目前为止，我们已经看到了大量的语料库结构。最简单的一种没有任何结构，仅仅是一个文本集合。
通常，文本会按照其可能对应的文体、来源、作者、语言等分类。
有时，这些类别会重叠，尤其是在按主题分类的情况下，因为一个文本可能与多个主题相关。
偶尔的，文本集有一个时间结构，新闻集合是最常见的例子。
NLTK中定义的基本语料库函数
fi leids() 语料库中的文件
fileids([categories]) 这些分类对应的语料库中的文件
categories() 语料库中的分类
categories([fileids]) 这些文件对应的语料库中的分类
raw() 语料库的原始内容
raw(fi leids=[f 1,f2, f3] ) 指定文件的原始内容
raw(categori es=[c1,c2]) 指定分类的原始内容
words() 整个语料库中的词汇
wor ds( fi leids=[f1, f2, f3]) 指定文件中的词汇
wor ds( categori es=[c1, c2] ) 指定分类中的词汇
sents() 指定分类中的句子
sents (fileids=[f 1,f2, f3] ) 指定文件中的句子
sents(categories=[c1,c2]) 指定分类中的句子
abspath(fileid) 指定文件在磁盘上的位置
encoding(fileid) 文件的编码(如果知道的话)
open(fileid) 打开指定语料库文件的文件流
root() 到本地安装的语料库根目录的路径

raw = gutenberg.raw('burgess-busterbrown.txt')
print(raw[1:20])


words = gutenberg.words('burgess-busterbrown.txt')
print(words[1:10])


sents = gutenberg.sents('burgess-busterbrown.txt')
print(sents[1:3])

载入你自己的语料库

2.2 条件频率分布

当语料文本被分为几类(文体、主题、作者等)时，我们可以计算每个类别独立的频率分布。
条件频率分布是频率分布的集合，每个频率分布有一个不同的“条件”。这个条件通常是文本的类别

条件和事件

#频率分布计算观察到的事件，如文本中出现的词汇。
#条件频率分布需要给每个时间关联一个条件，所以不是处理一个词序列
text = ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...] 
#我们必须处理的是一个配对序列
pairs = [('news', 'The'), ('news', 'Fulton'), ('news', 'County'), ...]
#每对的形式是:(条件，事件)。如果我们按文体处理整个布朗语料库，将有 15 个条件(每个文体一个条件)和 1,161,192 个事件(每一个词一个事件)。

按文体计数词汇

# #FreqDist( ) 以一个简单的链表作为输入，ConditionalFreqDist( ) 以一个配对链表作为输入。
from nltk.corpus import brown
cfd = nltk.ConditionalFreqDist(
        (genre, word)
        for genre in brown.categories()
        for word in brown.words(categories=genre))



#只看两个文体:新闻和言情。对于每个文体，我们遍历文体中的每个词以产生文体与词的配对。
genre_word = [(genre, word)
             for genre in ['news', 'romance']
             for word in brown.words(categories=genre)]
print(len(genre_word))

#链表 genre_word 的前几个配对将是('news',word)的形式，而最后几个配对将是('romance', word)的形式。
print(genre_word[:4])
print(genre_word[-4:])


#使用此配对链表创建一个 ConditionalFreqDist，并将它保存在一个变 量 cfd 中。
#像往常一样，我们可以输入变量的名称来检查它，并确认它有两个条件
cfd = nltk.ConditionalFreqDist(genre_word)
print(cfd)
print(cfd.conditions())
#访问这两个条件，它们每一个都只是一个频率分布:
print(cfd['news'])
print(cfd['romance'])
print(list(cfd['romance'])[:5])
print(cfd['romance']['could'])

绘制分布图和分布表

#除了组合两个或两个以上的频率分布和更容易初始化之外，ConditionalFreqDist 还为 制表和绘图提供了一些有用的方法。
#条件是词 america 或 citizen ，被绘图的计数是在特定演讲中出现的词的次数。
#它利用了每个演讲的文件名——例如 1 865-Lincoln.txt——的前4个字符包含年代的事实。
#这段代码为文件 1865-Lincoln.txt 中每 个小写形式以america开头的词——如:Americans——产生一个配对('america', '1865')。
from nltk.corpus import inaugural
cfd = nltk.ConditionalFreqDist(
        (target, fileid[:4])
        for fileid in inaugural.fileids()
        for w in inaugural.words(fileid)
        for target in ['america', 'citizen']
        if w.lower().startswith(target))
cfd.plot()



#图中的计数来源于词长 。它利用了每一种语言的文件名是语言名称后面跟 '-Latin1' (字符编码)的事实。
from nltk.corpus import udhr
languages = ['Chickasaw', 'English', 'German_Deutsch', 'Greenlandic_Inuktikut', 'Hungarian_Magyar', 'Ibibio_Efik'] 
cfd = nltk.ConditionalFreqDist(
    (lang, len(word)) 
    for lang in languages
    for word in udhr.words(lang + '-Latin1'))
cfd.plot()



#为两种语言和长度少于 10 个字符的词汇绘制累计频率数据表
cfd.tabulate(conditions=['English', 'German_Deutsch'],
            samples=range(10), cumlative=True)

使用双连词生成随机文本

#我们可以使用条件频率分布创建一个双连词表(词对，在 1.3 节介绍过 )。bigrams()函数 接受一个词汇链表，并建立一个连续的词对链表。
sent = ['In', 'the', 'beginning', 'God', 'created', 'the', 'heaven', 'and', 'the', 'earth', '.']
print(list(nltk.bigrams(sent))[:5])


#产生随机文本:此程序获得《创世记》文本中所有的双连词，然后构造一个条件频率分布来记录哪些词汇最有可能跟在给定词的后面 ;
#例如:living 后面最可能的词是 creature;generate_model()函数使用这些数据和种子词随机产生文本。
def generate_model(cfdist, word, num=15):
    for i in range(num):
        print(word, end=" ")
        word = cfdist[word].max()
text = nltk.corpus.genesis.words('english-kjv.txt')
bigrams = nltk.bigrams(text)
cfd = nltk.ConditionalFreqDist(bigrams)

print(cfd['living'])

print(generate_model(cfd, 'living'))

NLTK 中的条件频率分布 :定义、访问和可视化一个计数的条件频率分布的常用方法和习惯用法
cfdist= ConditionalFreqDist(pairs) 从配对链表中创建条件频率分布
cf di st.condi tions() 将条件按字母排序
cfdist[condition] 此条件下的频率分布
cfdist[condition][sample] 此条件下给定样本的频率
cfdist.tabulate() 为条件频率分布制表
cfdist.tabulate(samples, conditions) 指定样本和条件限制下制表
cfdist.plot() 为条件频率分布绘图
cfdist.plot(samples, conditions) 指定样本和条件限制下绘图
cfdist1 < cfdist2 测试样本在cfdist1中出现次数是否小于在cfdist2中出现次数

2.3 更多关于 Python:代码重用

使用文本编辑器创建程序

函数

#个Python函数:这个函数试图生成任何英语名词的复数形式。
def plural(word):
    if word.endswith('y'):
        return word[:-1] + 'ies'
    elif word[-1] in 'sx' or word[-2:] in ['sh', 'ch']:
        return word + 'es' 
    elif word.endswith('an'):
        return word[:-2] + 'en' 
    else:
        return word + 's'
print(plural('fairy'))
print(plural('woman'))

模块

#在一个文件中的变量和函数定义的集合被称为一个Python 模块(module)。相关模块的集合称为一个包(package)。
#处理布朗语料库的NLTK代码是一个模块，处理各种不同的语料库的代码的集合是一个包。NLTK 的本身是包的集合，有时被称为一个库(library)。

2.4 词典资源

词汇列表语料库

#过滤文本:此程序计算文本的词汇表，然后删除所有在现有的词汇列表中出现的元素，只留下罕见或拼写错误的词。
def unusual_words(text):
    text_vocab = set(w.lower() for w in text if w.isalpha())
    english_vocab = set(w.lower() for w in nltk.corpus.words.words())
    unusual = text_vocab.difference(english_vocab)
    return sorted(unusual)

print(unusual_words(nltk.corpus.gutenberg.words('austen-sense.txt'))[:5])
print(unusual_words(nltk.corpus.nps_chat.words())[:5])



#还有一个停用词语料库，就是那些高频词汇，如:the，to，我们有时在进一步的处理之前想要将它们从文档中过滤。
#停用词通常几乎没有什么词汇内容，而它们的出现会使区分文 本变困难。
from nltk.corpus import stopwords
print(stopwords.words('english')[:5])


#让我们定义一个函数来计算文本中没有在停用词列表中的词的比例。
def content_fraction(text):
    stopwords = nltk.corpus.stopwords.words('english')
    content = [w for w in text if w.lower() not in stopwords]
    return len(content) / len(text)
print(content_fraction(nltk.corpus.reuters.words()))



#另一个词汇列表是名字语料库，包括 8000 个按性别分类的名字。
#男性和女性的名字存储在单独的文件中。让我们找出同时出现在两个文件中的名字即性别暧昧的名字:
names = nltk.corpus.names
print(names.fileids())
male_names = names.words('male.txt')
female_names = names.words('female.txt')
print([w for w in male_names if w in female_names][:5])


#正如大家都知道的，以字母 a 结尾的名字几乎都是女性。我们可以在图中看到这一点以及一些其它的模式，该图是由下面的代码产生的
#条件频率分布:此图显示男性和女性名字的结尾字母;多数以 a，e 或 i 结尾的名字是女性;
#以 h 和 l 结尾的男性和女性同样多;以 k，o，r，s 和 t 结尾的更可能是男性。
cfd = nltk.ConditionalFreqDist(
        (fileid, name[-1])
        for fileid in names.fileids()
        for name in names.words(fileid))
cfd.plot()

发音的词典

#一个稍微丰富的词典资源是一个表格(或电子表格)，在每一行中含有一个词加一些性质。
#NLTK 中包括美国英语的 CMU 发音词典，它是为语音合成器使用而设计的。
entries = nltk.corpus.cmudict.entries()
print(len(entries))
for entry in entries[39943:39951]:
    print(entry)
    
    
#每个条目由两部分组成，我们可以用一个复杂的 for 语句来一个一个的处理这些。
#我们没有写 for entry in entries:，而是用两个变量名 word 和 pron 替换 entry。
#现在,每次通过循环时，word 被分配条目的第一部分，pron 被分配条目的第二部分:
for word, pron in entries:
    if len(pron) == 3:
        ph1, ph2, ph3 = pron
        if ph1 == 'P' and ph3 == 'T':
            print(word, ph2)
            
            
#通过指定词典的名字后面跟一个包含在方括号 里的关键字(例如:词 fire)来查词典
prondict = nltk.corpus.cmudict.dict()
prondict['file']

比较词表

#表格词典的另一个例子是比较词表。NLTK中包含了所谓的斯瓦迪士核心词列表(Swa desh wordlists)，
#几种语言中约 200 个常用词的列表。语言标识符使用 ISO639 双字母码。
from nltk.corpus import swadesh
print(swadesh.fileids()[:5])
print(swadesh.words('en')[:5])

#可以通过在 entries()方法中指定一个语言链表来访问多语言中的同源词。更进一步，我们可以把它转换成一个简单的词典
fr2en = swadesh.entries(['fr', 'en'])
print(fr2en[:5])
translate = dict(fr2en)
print(translate['chien'])
print(translate['jeter'])

词汇工具: Toolbox 和 Shoebox

# Toolbox文件由一个大量条目的集合组成，其中每个条目由一个或多个字段组成。
#大多数字段都是可选的或重复的，这意味着这个词汇资源不能作为一个表格或电子表格来处 理。
#条目包括一系列的属性-值对，如('ps', 'V')，表示词性是'V'(动词)，('ge', 'gag')表示英文注释是'gag'
from nltk.corpus import toolbox
print(toolbox.entries('rotokas.dic')[:1])

2.5 WordNet

WordNet 是面向语义的英语词典，类似与传统辞典，但具有更丰富的结构
NLTK 中包括英语 WordNet，共有 155,287 个词和 117,659 个同义词集合。
我们将以寻找同义词和它们在 WordNet 中如何访问开始。

意义与同义词

#如果我们用 automobile 替换掉(1a)中的词 motorcar，变成(1b)，句子的意 思几乎保持不变:
# a. Benz is credited with the invention of the motorcar. 
# b. Benz is credited with the invention of the automobile.
#因为句子中所有其他成分都保持不变，我们可以得出结论:motorcar 和 automobile 有相 同的含义即它们是同义词。


#在 WordNet的帮助下，我们可以探索这些词:
#motorcar 只有一个可能的含义，它被定义为 car.n.01，car 的第一个名词意义。car.n.01 被称为 synset 或“同义词集”
from nltk.corpus import wordnet as wn
print(wn.synsets('motorcar'))

print(wn.synset('car.n.01').lemma_names()) #注意原书代码有误

#同义词集中的每个词可以有多种含义,同义词集也有一些一 般的定义和例句:
print(wn.synset('car.n.01').definition())
print(wn.synset('car.n.01').examples())


#虽然定义帮助人们了解一个同义词集的本意，同义词集中的词往往对我们的程序更有用
#为了消除歧义，我们将这些词标注为 car.n.01.automobile，car.n.01.motorcar等。 这种同义词集和词的配对叫做词条。
# 得到指定同义词集的所有词条
print(wn.synset('car.n.01').lemmas())
# 查找特定的 词条
print(wn.lemma('car.n.01.automobile'))
# 得到一个词条对应的同义词集
print(wn.lemma('car.n.01.automobile').synset())
# 得到一个词条的“名字
print(wn.lemma('car.n.01.automobile').name())


#与词 automobile 和 motorcar 这些意义明确的只有一个同义词集的词不同，词 car 是含糊的，有五个同义词集:
print(wn.synsets('car'))
for synset in wn.synsets('car'):
    print(synset.lemma_names())
#为方便起见，我们可以用下面的方式访问所有包含词 car 的词条。
print(wn.lemmas('car'))

WordNet 的层次结构

#WordNet的同义词集对应于抽象的概念，它们并不总是有对应的英语词汇。
#这些概念在 层次结构中相互联系在一起。一些概念也很一般，如实体、状态、事件;这些被称为独一无 二的根同义词集。

#WordNet使在概念之间漫游变的容易。例如:一个如摩托车这样的概念，我们可以看到 它的更加具体(直接)的概念——下位词。
motorcar = wn.synset('car.n.01')
types_of_motorcar = motorcar.hyponyms()
print(types_of_motorcar[26])
print(sorted([lemma.name() for synset in types_of_motorcar for lemma in synset.lemmas()]))

#可以通过访问上位词来浏览层次结构。有些词有多条路径，因为它们可以归类在一个以上的分类中。
#car.n.01与 entity.n.01之间有两条路径，因为 wheeled_vehicle.n. 01 可以同时被归类为车辆和容器。
print(motorcar.hypernyms())
paths = motorcar.hypernym_paths()
print(len(paths))
print([synset.name() for synset in paths[0]][:5]) 
print([synset.name() for synset in paths[1]][:5])

语义相似度

#我们已经看到同义词集之间构成复杂的词汇关系网络。给定一个同义词集，我们可以遍 历 WordNet 网络来查找相关含义的同义词集。
#知道哪些词是语义相关的，对索引文本集合 非常有用，当搜索一个一般性的用语——
#例如:车辆——时就可以匹配包含具体用语——例 如豪华轿车——的文档。

#如果两个同义 词集共用一个非常具体的上位词——在上位词层次结构中处于较低层的上位词——它们一 定有密切的联系。
right = wn.synset('right_whale.n.01') 
orca = wn.synset('orca.n.01')
minke = wn.synset('minke_whale.n.01') 
tortoise = wn.synset('tortoise.n.01') 
novel = wn.synset('novel.n.01')
print(right.lowest_common_hypernyms(minke))
print(right.lowest_common_hypernyms(orca))

2.6 小结

文本语料库是一个大型结构化文本的集合。NLTK包含了许多语料库，如:布朗语料库 nltk.corpus.brown。
有些文本语料库是分类的，例如通过文体或者主题分类,有时候语料库的分类会相互重叠。
条件频率分布是一个频率分布的集合，每个分布都有一个不同的条件。它们可以用于通过给定内容或者文体对词的频率计数。
行数较多的 Python 程序应该使用文本编辑器来输入，保存为.py 后缀的文件，并使用 import 语句来访问。
Python 函数允许你将一段特定的代码块与一个名字联系起来，然后重用这些代码想用多少次就用多少次。
一些被称为“方法”的函数与一个对象联系在起来，我们使用对象名称跟一个点然后跟方法名称来调用它，就像:x.funct(y)或者 word.isalpha()。
要想找到一些关于变量 v 的信息，可以在 Pyhon 交互式解释器中输入 help(v)来阅读这一类对象的帮助条目。
WordNet是一个面向语义的英语词典，由同义词的集合—或称为同义词集(synsets)— 组成，并且组织成一个网络。
默认情况下有些函数是不能使用的，必须使用 Python 的 i mport 语句来访问。

你可能感兴趣的:(自然语言处理,python)

火爆全网的条形竞赛图，Python轻松实现统计学家
image这个动图叫条形竞赛图，非常适合制作随时间变动的数据。我已经用streamlit+bar_chart_race实现了，然后白嫖了heroku的服务器，大家通过下面的网址上传csv格式的表格就可以轻松制作条形竞赛图，生成的视频可以保存本地。https://bar-chart-race-app.herokuapp.com/本文我将实现过程介绍一下，白嫖服务器+部署留在下期再讲。纯matplot
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
基于 Python 的网站信息探测工具设计与实现计算机毕业设计指导 python 网络服务器
基于Python的网站信息探测工具设计与实现摘要在渗透测试与网络安全评估中，信息探测是最基础且关键的一步。通过对目标网站的操作系统、服务器、CMS、端口、目录结构等信息进行自动化探测，可为后续攻击路径识别提供基础数据支撑。传统工具如WhatWeb、FOFA等虽功能强大，但在定制化与扩展性方面受限。本文设计并实现了一款基于Python的轻量级网站信息探测工具，支持URL/IP扫描、开放端口探测、CM
使用CrewAI创建一个研究团队 AI量化投资 php 开发语言多智能体智能体人工智能
本指导文档将带你一步步完成使用CrewAI框架创建你的第一个AI代理团队的过程。通过这个简单的示例，你将学习如何构建一个研究团队，用于研究和分析指定主题，并生成一份综合报告。本教程基于CrewAI官方文档，适合初学者快速上手。前提条件在开始之前，请确保你已完成以下准备工作：安装Python：确保你的系统安装了Python版本在3.10到3.13之间。你可以通过以下命令检查Python版本：pyth
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
Python FastMCP：让你的AI工具链飞起来
PythonFastMCP：让你的AI工具链飞起来FastMCPFastMCP是什么？1.工具(Tools)：赋予LLM执行能力2.Resources（资源）：安全数据通道3.Prompts（提示模板）：标准化LLM交互4.组件协同：构建项目AI工具链5.部署架构与性能优化博主热门文章推荐：官方文档：FastMCP官方文档：https://gofastmcp.com/MCP协议规范：https:/
Python 解析 PDF 文件的基础方法电脑维修员xy python pdf 前端
```htmlPython解析PDF文件的基础方法Python解析PDF文件的基础方法在现代数据处理和信息提取任务中，PDF文件是一种常见的文档格式。然而，PDF文件的结构复杂且难以直接解析，尤其是当需要从中提取文本或数据时。幸运的是，Python提供了多种强大的库来帮助我们轻松地解析PDF文件。1.PyPDF2库PyPDF2是一个功能强大的Python库，用于处理PDF文件。它可以读取、分割、合
socket网络通信TCP与UDP原理及代码实现（c++、python）
目录Socket原理通信协议原理TCPUDP代码实现TCPC++pythonUDPC++pythonSocket原理Socket（套接字）是计算机网络中用于实现进程间通信的一种机制，特别是在不同主机之间通过网络进行数据传输时。它是网络编程的核心概念之一，为应用程序提供了统一的接口，使得开发者可以通过网络发送和接收数据。可以将Socket类比为电话系统中的“电话机”。两台设备通过Socket建立连接
【Qt Designer使用快捷键】
QtDesigner简介QtDesigner是Qt框架提供的可视化界面设计工具，用于快速创建GUI（图形用户界面）。用户可通过拖拽控件（如按钮、文本框等）设计界面，无需手动编写布局代码。生成的界面文件（.ui）可通过pyuic或uic工具转换为代码（如Python或C++），与业务逻辑集成。常用快捷键及用途通用操作Ctrl+N：新建界面文件。Ctrl+O：打开现有.ui文件。Ctrl+S：保存当前
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
008、Python+fastapi，第一个后台管理项目走向第8步：ubutun 20.04下配置远程桌面、安装vscode+python环境配置浪淘沙jkp 学习 fastapi
一、说明白飘了3个月无影云电脑，开始选了个windowsserver非常不好用，后台改为ubuntu想升级到22，没成功，那就20.04吧。今天先安装下开发环境，后续2个月就想把他当做开发服务器，不知道行不行，公网ip是否可以外部链接。本来想装个宝塔面板直接管理，不过那玩意用了一次，决定说方便也不方便，还是放弃，要用也搞个掏钱的，你懂的，免费的不放心啊那我们就一个一个安装好了，大概要安装mysql
python爬大学生就业信息报告_Python语言爬虫——Python 岗位分析报告 weixin_39578457
本文主要向大家介绍了Python语言爬虫——Python岗位分析报告，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。前两篇我们分别爬取了糗事百科和妹子图网站，学习了Requests,BeautifulSoup的基本使用。不过前两篇都是从静态HTML页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取Ajax请求返回的结果。本篇以拉勾网为例来说明一下如何获取Ajax请求内容
快速入门Robocorp：用Python构建和操作工作流 jaioyfpo python 开发语言
快速入门Robocorp：用Python构建和操作工作流引言在现代开发环境中，自动化是提高效率和降低成本的关键。Robocorp作为一个强大的平台，它帮助您使用Python构建和操作工作流，无论在何地运行都可以保持无缝连接和高扩展性。本文将带领您快速入门Robocorp的基本安装和设置，并展示如何使用ActionServer进行项目的创建和管理。主要内容1.安装和设置要开始使用Robocorp，首
Python关于pandas的基础知识 WeiJingYu. python pandas 开发语言
一.扫盲（一）、pandas是什么pandas是Python的一个第三方数据处理库，它提供了高效、灵活的数据结构（如Series和DataFrame），能方便地对结构化数据进行清洗、转换、分析和处理。（二）、pandas与NumPy的关系NumPy是Python中用于科学计算的基础库，主要用于存储和处理数值型数组。但它有一个局限，就是不能直接存储和处理字符串等非数值类型的数据。而pandas是在N
Python 爬虫——Pyppeteer
Python爬虫——PyppeteerPythonSpider——Pyppeteer一、爬虫的两种方式二、Pyppeteer三、爬虫实现PythonSpider——Pyppeteer爬虫具有时效性，该文产生于2023年末一、爬虫的两种方式爬虫大致可以分为两类方式：直接请求直接请求的方式一般是使用python的HTTP请求库发起HTTP请求，然后接收返回的数据再进行解析，这种方式存在很大的局限性。当
Python关于numpy的基础知识数组的升维 WeiJingYu. python numpy 开发语言
在Python数据处理中，numpy是常用的科学计算库，数组操作是其核心内容之一。下面通过代码示例，展示如何从Python自带列表构建numpy一维数组，再进一步升维构建二维数组。\importnumpyasnp#一维数组构建：从Python列表到numpy一维数组list1=[1,2,3,4,5]#Python自带的列表数据类型print("Python列表list1:",list1)v=np.
Selenium Python 代码之打开网页自动填充内容并搜索 iCloudEnd
SeleniumPython代码之打开网页自动填充内容并搜索流程通过id找到文本框inputElement.send_keys(Keys.BACK_SPACE)发送删除键，清除一下之前文字inputElement.send_keys(Keys.BACK_SPACE)发送需要查询对内容并送个回车inputElement=driver1.find_element_by_id("TextBox1")in
python双引号打不出来_在python 3中使用单引号和双引号时出错 - python weixin_39897749 python双引号打不出来
使用os.system（）函数时，我在python中遇到了EOL错误。以下是代码行生成错误：os.system("catsubdomains.txt|cut-d'"'-f1")基本上，我试图使用分号[“]修改输出字符串（双引号）参考方案如果需要在带"的字符串中编写"，则可以将其写为\""catsubdomains.txt|cut-d'\"'-f1"在PythonCloudFunction中使用错误
python办自动化--读取邮箱中特定的邮件，并下载特定的附件宝山哥哥 python办公自动化 python 自动化信息可视化
系列文章目录python办公自动化–数据可视化（pandas+matplotlib）–生成条形图和饼状图python办公自动化–数据可视化（pandas+matplotlib）–生成折线图python办公自动化–数据可视化（pandas读取excel文件，matplotlib生成可视化图表）python办公自动化-openpyxl学习-工资表生成工资条python办公自动化–使用将csv大文件分割
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
第二阶段-第二章—8天Python从入门到精通【itheima】-133节（SQL——DQL——基础查询） Patrick_kafka sql python 数据库开发语言学习 android 程序人生
目录133节——DQL：基础查询1.学习目标2.基础数据查询：select3.进行过滤的基础数据查询：where4.代码演练5.小节总结6.关于MySQL和SQL的DDL、DML、DCL、DQL的最底层逻辑MySQL与SQL的底层逻辑：从磁盘到内存的数据流解析一、DDL（数据定义语言）：构建数据大厦的蓝图二、DML（数据操作语言）：数据流动的三重关卡三、DCL（数据控制语言）：权限的多维管控四、D
Python爬虫教程：抓取地方政府网站的公开文件与政策信息 Python爬虫项目 python 爬虫开发语言数据分析 mysql
1.引言在信息化时代，政府网站已成为信息公开的重要渠道。各级地方政府网站上发布的政策、公告和公开文件，通常包含了政府决策、法律法规等关键信息。爬取这些公开数据，可以为研究人员、政策分析师、企业决策者等提供有价值的数据支持。本文将通过Python爬虫技术，展示如何抓取地方政府网站上的公开文件、政策等信息。我们将使用最新的爬虫技术，如requests、BeautifulSoup、Selenium等工具
Python 库手册：xml.etree.ElementTree 处理 XML 数据模块
xml.etree.ElementTree（简称ElementTree）是Python标准库中用于解析、创建和操作XML数据的模块。它提供了一种轻量、易用的方式来读取、修改和写入XML文件，适用于配置文件处理、数据交换、网络通信等应用场景。常见应用场景：（1）读取XML配置文件并提取参数。（2）修改XML数据结构（如节点属性、内容）。（3）创建新的XML文档并保存。（4）从WebAPI获取的XML
[学习] 笛卡尔坐标系的任意移动与旋转详解极客不孤独学习算法信号处理
笛卡尔坐标系的任意移动与旋转详解文章目录笛卡尔坐标系的任意移动与旋转详解**1.笛卡尔坐标系基础****2.坐标变换原理****2.1平移变换****2.2旋转变换****3.组合变换**Python仿真与动态展示**动画说明**：**关键数学原理**：1.笛卡尔坐标系基础笛卡尔坐标系用(x,y)(x,y)(x,y)表示平面内任意点的位置，原点为(0,0)(0,0)(0,0)。几何图形可视为点的集
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

《用Python进行自然语言处理》第2章 获得文本语料和词汇资源