无水先生

【NLP的Python库（04/4）】：Flair

一、说明

Flair是一个现代的NLP库。从文本处理到文档语义，支持所有核心 NLP 任务。Flair使用现代转换器神经网络模型来完成多项任务，并结合了其他Python库，可以选择特定的模型。其清晰的API和注释文本的数据结构，以及多语言支持，使其成为NLP项目的良好候选者。

本文可帮助你开始使用 Flair。安装后，您将学习如何应用文本处理和文本语法任务，然后查看对文本和文档语义的丰富支持。

本文的技术上下文是和 。所有示例也应该适用于较新的版本。Python v3.11Flair v0.12.2

这篇文章最初出现在我的博客 admantium.com。

二、安装

Flair库可以通过pip安装：

python3 -m pip install flair

安装最多可能需要 30 分钟，因为还需要安装其他几个库。此外，在使用序列器、标记器或数据集时，需要下载其他数据。

三、自然语言处理任务

Flair 支持所有核心 NLP 任务，并提供其他功能来创建词向量和训练自定义音序器。

文本处理

标记化
词形还原
句法分块

文本语法

词性标记

文本语义

语义帧解析
命名实体识别

文档语义

情绪分析
语言毒性分析

此外，Flair 还支持以下附加功能：

数据
语料库管理
文本矢量
模型训练

四、文本处理

4.1 标记化

标记化会自动应用于 Flair 中。基本数据结构包装任何长度的文本并生成令牌。Sentence

from flair.data import Sentence

# Source: Wikipedia, Artificial Intelligence, https://en.wikipedia.org/wiki/Artificial_intelligence
paragraph = '''Artificial intelligence was founded as an academic discipline in 1956, and in the years since it has experienced several waves of optimism, followed by disappointment and the loss of funding (known as an "AI winter"), followed by new approaches, success, and renewed funding. AI research has tried and discarded many different approaches, including simulating the brain, modeling human problem solving, formal logic, large databases of knowledge, and imitating animal behavior. In the first decades of the 21st century, highly mathematical and statistical machine learning has dominated the field, and this technique has proved highly successful, helping to solve many challenging problems throughout industry and academia.'''

doc = Sentence(paragraph)
tokens = [token for token in doc]

print(tokens)
# [Token[0]: "Artificial", Token[1]: "intelligence", Token[2]: "was", Token[3]: "founded", Token[4]: "as", Token[5]: "an", Token[6]: "academic", Token[7]: "discipline",

4.2 词性标记

检测文本中额外的句法（和语义）信息涉及使用，一种特定于Flair的数据结构，它结合了预定义的转换器模型用于特定任务。Classifiers

对于POS标签，Flair提供了14种不同的型号，支持英语，德语，葡萄牙语和更多语言。

基本的英语语言分类器定义了以下类型：pos

The following snippet shows how to use the POS sequencer:

from flair.data import Sentence
from flair.nn import Classifier

pos = Classifier.load('pos')
# SequenceTagger predicts: Dictionary with 53 tags: , O, UH, ,, VBD, PRP, VB, PRP$, NN, RB, ., DT, JJ, VBP, VBG, IN, CD, NNS, NNP, WRB, VBZ, WDT, CC, TO, MD, VBN, WP, :, RP, EX, JJR, FW, XX, HYPH, POS, RBR, JJS, PDT, NNPS, RBS, AFX, WP$, -LRB-, -RRB-, ``, '', LS, $, SYM, ADD

doc = Sentence(paragraph)
pos.predict(doc)

print(doc.to_tagged_string())
# ["Artificial"/JJ,
# "intelligence"/NN,
# "was"/VBD,
# "founded"/VBN,
# "as"/IN,
# "an"/DT,
# "academic"/JJ,

4.3 句法分块

分块是提取具有不同含义的连贯标记集的过程，例如名词短语、介词短语、形容词短语等。

分类器用于此任务。下面是一个示例：chunk

from flair.data import Sentence
from flair.nn import Classifier

chunk = Classifier.load('chunk')
# SequenceTagger predicts: Dictionary with 47 tags: O, S-NP, B-NP, E-NP, I-NP, S-VP, B-VP, E-VP, I-VP, S-PP, B-PP, E-PP, I-PP, S-ADVP, B-ADVP, E-ADVP, I-ADVP, S-SBAR, B-SBAR, E-SBAR, I-SBAR, S-ADJP, B-ADJP, E-ADJP, I-ADJP, S-PRT, B-PRT, E-PRT, I-PRT, S-CONJP, B-CONJP, E-CONJP, I-CONJP, S-INTJ, B-INTJ, E-INTJ, I-INTJ, S-LST, B-LST, E-LST, I-LST, S-UCP, B-UCP, E-UCP, I-UCP, , 

doc = Sentence(paragraph)
chunk.predict(doc)

print(doc.to_tagged_string())
# ["Artificial intelligence"/NP,
# "was founded"/VP,
# "as"/PP,
# "an academic discipline"/NP,
# "in"/PP,
# "1956"/NP,
# "and"/PP,
# "in"/PP,
# "the years"/NP,

五、文本语义

5.1 语义帧解析

语义框架是一种 NLP 技术，它用其语义含义标记标记序列。这有助于确定句子的情绪和主题。

和以前一样，语义框架是通过加载特定的分类器来使用的。尽管此功能被标记为实验性功能，但在撰写本文时使用时，它运行良好。flair v0.12.2

frame = Classifier.load('frame')
# SequenceTagger predicts: Dictionary with 4852 tags: , be.01, be.03, have.01, say.01, do.01, have.03, do.02, be.02, know.01, think.01, come.01, see.01, want.01, go.02, ...

doc = Sentence(paragraph)
frame.predict(doc)
print(doc.to_tagged_string())
# ["was"/be.03, "founded"/found.01, "has"/have.01, "experienced"/experience.01, "waves"/wave.04, "followed"/follow.01, "disappointment"/disappoint.01,

5.2 命名实体识别

命名实体是句子中的人物、地点或日期。Flair提供不同的NER模型。

让我们将默认值与较大的.nerner-ontonotes-fast

#Source: Wikipedia, Artificial Intelligence, https://en.wikipedia.org/wiki/Artificial_intelligence
paragraph = '''
In 2011, in a Jeopardy! quiz show exhibition match, IBM's question answering system, Watson, defeated the two greatest Jeopardy! champions, Brad Rutter and Ken Jennings, by a significant margin.
'''

ner = Classifier.load('ner')
# SequenceTagger predicts: Dictionary with 20 tags: , O, S-ORG, S-MISC, B-PER, E-PER, S-LOC, B-ORG, E-ORG, I-PER, S-PER, B-MISC, I-MISC, E-MISC, I-ORG, B-LOC, E-LOC, I-LOC, , 

doc = Sentence(paragraph)
ner.predict(doc)

print(doc.get_spans('ner'))
# [Span[5:7]: "Jeopardy!" → MISC (0.5985)
# Span[12:13]: "IBM" → ORG (0.998)
# Span[18:19]: "Watson" → PER (1.0)
# Span[28:30]: "Brad Rutter" → PER (1.0)
# Span[31:33]: "Ken Jennings" → PER (0.9999)]

通过该模型，所有人员和组织都得到认可。ner

ner = Classifier.load('ner-ontonotes-fast')
# SequenceTagger predicts: Dictionary with 75 tags: O, S-PERSON, B-PERSON, E-PERSON, I-PERSON, S-GPE, B-GPE, E-GPE, I-GPE, S-ORG, B-ORG, E-ORG, I-ORG, S-DATE, B-DATE, E-DATE, I-DATE, S-CARDINAL, B-CARDINAL, E-CARDINAL, I-CARDINAL, S-NORP, B-NORP, E-NORP, I-NORP, S-MONEY, B-MONEY, E-MONEY, I-MONEY, S-PERCENT, B-PERCENT, E-PERCENT, I-PERCENT, S-ORDINAL, B-ORDINAL, E-ORDINAL, I-ORDINAL, S-LOC, B-LOC, E-LOC, I-LOC, S-TIME, B-TIME, E-TIME, I-TIME, S-WORK_OF_ART, B-WORK_OF_ART, E-WORK_OF_ART, I-WORK_OF_ART, S-FAC

doc = Sentence(paragraph)
ner.predict(doc)

print(list(doc.get_labels()))
# [Span[1:2]: "2011"'/'DATE' (0.9984)
# Span[12:13]: "IBM"'/'ORG' (1.0)
# Span[18:19]: "Watson"'/'PERSON' (0.9913)
# Span[22:23]: "two"'/'CARDINAL' (0.9995)
# Span[24:25]: "Jeopardy"'/'WORK_OF_ART' (0.938)
# Span[28:30]: "Brad Rutter"'/'PERSON' (0.9939)
# Span[31:33]: "Ken Jennings"'/'PERSON' (0.9914)]

用、数字、日期甚至危险被识别。ner-ontonotes-fast

六、文档语义

6.1 情绪分析

Flair的情感分析通常应用于句子，但通过将整个文本包装在数据结构中，它也可以应用于整个文本。它将输出句子的正或负的二元分类。Sentence

#Source: Wikipedia, Artificial Intelligence,https://en.wikipedia.org/wiki/Artificial_intelligence
sentiment = Classifier.load('sentiment')

doc = Sentence(paragraph)
sentiment.predict(doc)
print(doc)
# Sentence[124]: "Artificial intelligence was founded ..." → POSITIVE (0.9992)

6.2 语言毒性分析

Flair提供了一个检测语言毒性的模型，但只有德语版本。它是在可从海德堡大学下载的特定数据集上进行训练的，

以下代码片段检测攻击性语言的用法。

paragraph = '''
Was für Bullshit.
'''

toxic_language = Classifier.load('de-offensive-language')
doc = Sentence(paragraph)
toxic_language.predict(doc)

print(list(doc.get_lables()))
# Sentence[16]: "Was für Bullshit." → OFFENSE (0.9772)

七、附加属性

7.1 Datasets

Flair includes several datasets and corpus, see the complete list.

其中一些数据集用于训练特定于 Flair 的任务的模型，例如 NER 或关系提取。其他数据集是GLUE语言基准和文本集合。

下面是一个如何加载文本分类数据集以检测 Reddit 帖子中的情绪的示例。

import flair.datasets

data = flair.datasets.GO_EMOTIONS()

len(data.train)
# 43410

data.train[42000]
# This is quite common on people on such forums. I have a feeling they are a tad sarcastic." → APPROVAL (1.0); NEUTRAL (1.0)

7.1 语料库管理

在 Flair 中，对象表示为训练新的标记器或分类器而准备的文档。此对象由名为和的树不同集合组成，每个集合都包含 Sentence 对象。Corpustraindevtest

7.2 文本矢量

Flair 支持不同的矢量化方案：启用预训练的词向量（如手套）和来自不同转换器模型的词向量，通过转换器库加载。

让我们看看如何使用这两种方法标记段落。

from flair.embeddings import WordEmbeddings

embeddings = WordEmbeddings('glove')
doc = Sentence(paragraph)
embeddings.embed(doc)
for token in doc:
    print(token)
    print(token.embedding)

# Token[0]: "Artificial"
# tensor([ 0.3455,  0.3144, -0.0313,  0.6368,  0.2727, -0.6197, -0.5177, -0.2368,
#         -0.0166,  0.0344, -0.1542,  0.0435,  0.7298,  0.1112,  1.3430,  ...,
# Token[1]: "intelligence"
# tensor([-0.3110, -0.4329,  0.7773, -0.3112,  0.0529, -0.8502, -0.3537, -0.7053,
#          0.0845,  0.8877,  0.8353, -0.4164,  0.3670,  0.6083,  0.0085,  ...,

对于转换器嵌入：

from flair.embeddings import TransformerWordEmbeddings

embedding = TransformerWordEmbeddings('bert-base-uncased')
doc = Sentence(paragraph)
embedding.embed(doc)
for token in doc:
    print(token)
    print(token.embedding)

# Token[0]: "Artificial"
# tensor([ 1.0723e-01,  9.7490e-02, -6.8251e-01, -6.4322e-02,  6.3791e-01,
#          3.8582e-01, -2.0940e-01,  1.4441e-01,  2.4147e-01, ...)
# Token[1]: "intelligence"
# tensor([-9.9221e-02, -1.9465e-01, -4.9403e-01, -4.1582e-01,  1.4902e+00,
#          3.6126e-01,  3.6648e-01,  3.7578e-01, -4.8785e-01, ...)

此外，可以使用文档嵌入对完整文档进行矢量化，而不是单个标记。

7.3 模型训练

Flair 包括用于训练可用作序列标记器或文本分类器的新模型的函数。它提供数据集的加载、模型定义、训练配置和执行。对于大多数这些步骤，使用转换器库。

下面是官方文档中的一个示例，用于在康奈尔语料库上训练用于词性标记的模型。

# Source: FlairNLP, How model Training works in Flair, https://flairnlp.github.io/docs/tutorial-training/how-model-training-works#example-training-a-part-of-speech-tagger

from flair.datasets import UD_ENGLISH
from flair.embeddings import WordEmbeddings
from flair.models import SequenceTagger
from flair.trainers import ModelTrainer

# 1. load the corpus
corpus = UD_ENGLISH().downsample(0.1)
print(corpus)
#Corpus: 1254 train + 200 dev + 208 test sentences

# 2. what label do we want to predict?
label_type = 'upos'

# 3. make the label dictionary from the corpus
label_dict = corpus.make_label_dictionary(label_type=label_type)
print(label_dict)
# Dictionary created for label 'upos' with 18 values: NOUN (seen 3642 times), VERB (seen 2375 times), PUNCT (seen 2359 times), ADP (seen 1865 times), PRON (seen 1852 times), DET (seen 1721 times), ADJ (seen 1321 times), AUX (seen 1269 times), PROPN (seen 1203 times), ADV (seen 1083 times), CCONJ (seen 700 times), PART (seen 611 times), SCONJ (seen 405 times), NUM (seen 398 times), INTJ (seen 75 times), X (seen 63 times), SYM (seen 60 times)

# 4. initialize embeddings
embeddings = WordEmbeddings('glove')

# 5. initialize sequence tagger
model = SequenceTagger(hidden_size=256,
                        embeddings=embeddings,
                        tag_dictionary=label_dict,
                        tag_type=label_type)
print(model)
# Model: "SequenceTagger(
#   (embeddings): WordEmbeddings(
#     'glove'
#     (embedding): Embedding(400001, 100)
#   )
#   (word_dropout): WordDropout(p=0.05)
#   (locked_dropout): LockedDropout(p=0.5)
#   (embedding2nn): Linear(in_features=100, out_features=100, bias=True)
#   (rnn): LSTM(100, 256, batch_first=True, bidirectional=True)
#   (linear): Linear(in_features=512, out_features=20, bias=True)
#   (loss_function): ViterbiLoss()
#   (crf): CRF()
# )"

# 6. initialize trainer
trainer = ModelTrainer(model, corpus)

# 7. start training
trainer.train('resources/taggers/example-upos',
              learning_rate=0.1,
              mini_batch_size=32,
              max_epochs=10)
# Parameters:
#  - learning_rate: "0.100000"
#  - mini_batch_size: "32"
#  - patience: "3"
#  - anneal_factor: "0.5"
#  - max_epochs: "10"
#  - shuffle: "True"
#  - train_with_dev: "False"
# epoch 1 - iter 4/40 - loss 3.12352573 - time (sec): 1.06 - samples/sec: 2397.20 - lr: 0.100000
# ...
# epoch 1 - iter 4/40 - loss 3.12352573 - time (sec): 1.06 - samples/sec: 2397.20 - lr: 0.100000
# Results:
# - F-score (micro) 0.7877
# - F-score (macro) 0.6621
# - Accuracy 0.7877
# By class:
#               precision    recall  f1-score   support
#         NOUN     0.7231    0.8495    0.7812       412
#        PUNCT     0.9082    0.9858    0.9454       281
#         VERB     0.7048    0.7403    0.7221       258
#         PRON     0.9070    0.8986    0.9028       217
#          ADP     0.8377    0.8791    0.8579       182
#          DET     1.0000    0.8757    0.9338       169
#          ADJ     0.6087    0.6490    0.6282       151
#        PROPN     0.7538    0.5568    0.6405       176
#          AUX     0.8077    0.8678    0.8367       121
#          ADV     0.5446    0.4661    0.5023       118
#        CCONJ     0.9880    0.9425    0.9647        87
#         PART     0.6825    0.8600    0.7611        50
#          NUM     0.7368    0.5000    0.5957        56
#        SCONJ     0.6667    0.3429    0.4528        35
#         INTJ     1.0000    0.4167    0.5882        12
#          SYM     0.5000    0.0833    0.1429        12
#            X     0.0000    0.0000    0.0000         9
#     accuracy                         0.7877      2346
#    macro avg     0.7276    0.6420    0.6621      2346
# weighted avg     0.7854    0.7877    0.7808      2346

八、总结

Flair 是一个现代 NLP 库，支持所有核心 NLP 任务。本文介绍了如何应用文本处理、文本语法、文本语义和文档语义任务。Flair 的显著特点是它对选定任务的多语言支持，例如命名实体识别和词性标记，以及它对转换器神经网络的使用。此外，还存在用于模型训练的完整功能集，从训练数据准备、模型和训练配置到训练执行和指标计算。

使用C#打造预约日程管理系统 Ready-Player
本文还有配套的精品资源，点击获取简介：在信息技术领域，日程管理是重要需求。本文介绍如何使用C#语言实现一个名为"AppointmentSchedule"的预约日程管理系统。首先，文章将引导读者设计一个存储日程信息的数据结构，并提供一个容器类来管理多个预约。然后，文章将讨论如何处理预约冲突并提供用户界面设计建议。同时，也会探讨数据持久化的方法，以及如何为系统添加提醒功能和网络同步功能。最后，开发者可
Python装饰器与闭包：实战应用与深入理解
背景简介本章深入探讨了Python装饰器与闭包的核心概念，展示了它们在实际编程中的灵活应用和强大功能。装饰器的魔力：保持元数据与链式应用在Python中，装饰器是一种修改或增强函数行为的强大工具，它能够让我们在不改变原始函数代码的情况下，为其添加新功能。保持函数的元数据是装饰器的一个重要特性，它确保了装饰后的函数保持其身份和文档字符串信息。这对于代码的可读性和维护性至关重要。当需要将多个装饰器应用
python闭包的应用场景_简单谈谈Python中的闭包 weixin_39587113 python闭包的应用场景
Python中的闭包前几天又有人留言，关于其中一个闭包和re.sub的使用不太清楚。我在脚本之家搜索了下，发现没有写过闭包相关的东西，所以决定总结一下，完善Python的内容。1.闭包的概念首先还得从基本概念说起，什么是闭包呢？来看下维基上的解释:在计算机科学中，闭包(Closure)是词法闭包(LexicalClosure)的简称，是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在
2018-11-23班主任心育活动设计36例（15）紫萱草1126
我能做事有主次（注意计划性）今天要分享的是我能做事有主次，是关于注意计划性的案例。学生做事总是缺乏计划性和条理性，每次都要等到睡觉前，才想起功课只做了一点点；总是要等到走进教室后，才发现该带的学习用具没有带。。。。。。。本课案例，希望引导学生提高集中注意力的品质，学会做事有主次，做事有计划。要对自己要做的事情能集中注意力，并做到有具体的时间规划，有准备，有措施，有安排，有步骤。[if!suppor
日精进京心达张新波
在北京这个城市，我不想求大，规模适中即可，把他变成精品修理厂，培养优秀合伙人技师，修出高质量的汽车就是说凡想到京心达来的师傅，都必须排队接受考验才能进来、所有的技师都经过我的严格的系统化培训。达标才能留任，每一个人都是精英，交完税后，把大部分利润分配给员工，让京心达人变成行业工资标准最高的人。成为大家羡慕的职业，他们愿意在京心达工作到退休，将这份工作当成毕生的事业这是我的构想，我和京心达一起成长…
《自动控制原理》实验报告：典型系统的时域响应和稳定性分析戒了9 算法机器学习人工智能课程设计学习方法
实验目的及实验性质本实验的主要目的是深入研究和理解二阶系统的动态特性，以及这些特性如何影响系统的过渡过程。通过本实验，我们将能够掌握二阶系统特征参量（阻尼比ξ和自然频率ωn）对系统过渡过程的具体影响。我们将通过实验来观察和分析这些特征参量如何决定系统的响应速度、超调量以及稳定状态，从而更全面地理解二阶系统的行为。此外，我们还将探讨在不同的阻尼比条件下，二阶对象的响应曲线如何变化，并分析这些变化对系
马斯克AI大模型Grok开源了！
2024年3月18日，马斯克的AI创企xAI兑现承诺，正式发布了此前备受期待大模型Grok-1。代码和模型权重已上线GitHub:https://github.com/xai-org/grok-1截止目前，Grok已经在GitHub上获得了35.2k颗Star，还在不断上升中。Grok官方博客介绍：https://x.ai/blog/grok-os遵照Apache2.0协议开放了Grok-1混合专
开篇向水一生
在基于Internet的互联网已经成熟的时代，我们考虑利用相似的理念和技术去改造传统工业中的环节时，这便自然而然的得到了工业互联网的概念。它的本身上还是在解决信息流在各个节点之间传递的问题，只是因为异构的系统太多，要统一出一套标准来，确实是一项任重道远的大工程。工业互联网的实现远比我们现在看到的『传统』意义上的互联网要难，这有很大一部分是由于历史遗留问题而造成的局面，它不像我们现在看到的这种IT互
leetcode: 167. 两数之和 II - 输入有序数组 -兮 #leetcode leetcode 算法数据结构
中等难度题目描述给你一个下标从1开始的整数数组numbers，该数组已按非递减顺序排列，请你从数组中找出满足相加之和等于目标数target的两个数。如果设这两个数分别是numbers[index1]和numbers[index2]，则1twoSum(vector&numbers,inttarget){intk=numbers.size()-1;vectorres({1,2});for(vector
数据科学简讯 2023-04-07 数科每日
image.png头条SegmentAnything图像分割的重大进步图像分割是提取图像中代表特定对象（例如人或桌子）的所有像素的过程。由于几个原因，这是一项艰巨的任务，通常它要么需要大量预定义对象的数据集，要么需要一些的初级监督数据。Meta的这个全新的、完全开源的模型感觉就像是功能上的飞跃。他们收集了大量数据集，简化了注释功能，并创建了一个可以在浏览器中实时运行的模型。并提供演示、代码和论文。
网络爬虫——python爬取豆瓣评论 SSeaflower 爬虫 python 开发语言
网络爬虫——python爬取豆瓣评论一、网络爬虫概述1.1网络爬虫定义网络爬虫，又被称为网络蜘蛛（WebSpider）、网络机器人等。它根据网页地址（URL）爬取网页内容，网页地址（URL）就是我们在浏览器中输入的网站链接。例如：https://www.baidu.com；https://movie.douban.com/。网络爬虫不仅能够复制网页信息和下载音视频，还可以做到网站的模拟登录和行为链
挑战自我明天会更好_828b
从上个月元瑞老师说要办一个免费写作群，我考虑再三报了个名。为什么说考虑再三呢？1.因为我自己知道肚里墨水少。2.我不是个自律的人。3.怕自己坚持不了多久。有一次我和元瑞老师谈了谈我的过虑。老师说道:"借口太多，可以不报，以自愿为主。”“我想试试，就怕写不好。”“写不分好坏，只要求完成数量。”老师的"写不分好坏，只要求完成数量”让我坚定了要试一下的念头。跟元瑞老师谈过后，我试着写了第一篇文章，把它发
PDF 助手ApowerPDF：阅读编辑转换页面管理，一站式搞定所有 PDF 需求
各位办公小能手们！今天给你们介绍一款超厉害的软件，叫ApowerPDF。软件下载地址安装包它就像是一个超级全能选手，集PDF阅读、编辑、转换还有页面管理这些功能于一身。它能修改文本和图表内容，字体的颜色大小随便调，还能插入图片、添加链接，简直不要太方便。页面操作方面，分割、合并、删除、旋转，自定义页眉页脚背景，这些操作都能轻松搞定，就像玩游戏一样简单。它还有个内置的转换引擎，能把PDF转换成Wor
200 种格式转换FileConverter：图片视频音频文档随意转，免费开源超好用文哥工具箱1 电脑软件构建开源软件
各位文件处理小能手们！今天给你们介绍个超牛的免费开源工具——FileConverter。软件下载地址安装包这玩意儿就像个万能魔法师，能让图片、视频、音频、文档等200多种格式随意转换，就跟变戏法似的！你知道吗，用户只要在右键菜单点一点，就能快速完成转换操作，简直不要太方便！而且啊，这软件还自带压缩功能，压缩比例和旋转参数都能随便调，就像给文件量身定制衣服一样。更厉害的是，它支持离线处理，不用网络也
C#使用Quartz.NET详细讲解 diaochejiang2761 c#
C#使用Quartz.NET详细讲解Quartz.NET是一个开源的作业调度框架，是OpenSymphony的QuartzAPI的.NET移植，它用C#写成，可用于winform和asp.net应用中。它提供了巨大的灵活性而不牺牲简单性。你能够用它来为执行一个作业而创建简单的或复杂的调度。它有很多特征，如：数据库支持，集群，插件，支持cron-like表达式等等。你曾经需要应用执行一个任务吗？这个
VUE实训（三）昨天的牛肉
目标：创建学院管理模块（学院和学校关联起来）一、后台三步骤：1、打开projectName文件，在models目录下创建academy.js文件，接着文件操作：constmongoose=require('mongoose')constSchema=mongoose.Schemaconstfeld={name:String,//人物标签major:String,renshu:Number,scho
git常用命令行和注意事项捂耳听雨
第一部分：免密码推送1，命令配置gitconfig--globaluser.name"这里换上你的用户名"gitconfig--globaluser.email"这里换上你的邮箱"2.生成秘钥ssh-keygen-trsa-C"这里换上你的邮箱"，需要确认四次3.在系统用户目录下生成两个文件，分别是id_rsa(私钥)和id_rsa.pub(公钥)4.进入github的设置页面，点击SSHandG
Python 中的深拷贝、浅拷贝与等号赋值：理解对象复制的本质小羊苏八 python 开发语言
目录1.等号赋值（=）2.浅拷贝（copy.copy()）3.深拷贝（copy.deepcopy()）4.不可变对象与可变对象5.性能对比6.实际应用场景7.总结前言在Python中，对象的复制是一个常见的操作，但很多人对深拷贝、浅拷贝和等号赋值之间的区别感到困惑。本文将通过详细的示例和解释，帮助你深入理解这三种操作的本质和应用场景。1.等号赋值（=）在Python中，等号赋值是最基本的对象操作之
Python中的分支结构小羊苏八 #python python 开发语言
文章目录前言一、Python分支结构概述二、if语句详解三、if-else语句详解四、if-elif-else语句详解五、嵌套分支结构六、分支结构的注意事项七、实际应用场景八、总结前言在Python编程的世界里，分支结构如同现实中的道路岔口，根据不同的条件引导程序流向不同的执行路径。它是构建复杂逻辑、实现智能决策的关键所在。本文将带你全面了解Python的分支结构，从基础语法到实际应用，让你轻松掌
No.8 阳光正好，微风不燥盛夏的自留地
大家好，我是盛夏，今天是2022年的11月6日，星期日。今天的体感宛若春风得意。于是我一早就背上我的小背包，迎着风儿呼呼呼骑车玩咯～有好多小伙伴分享了周复盘，也有小伙伴提出:写文字的时候必须要先弄清楚到底是写给谁看的？别人愿不愿意看，看完之后会不会启发？可谓灵魂拷问。于我，现阶段，我只想单纯的记录碎片时刻，去感悟生活的奥秘。001阅读篇第8章《成就自己的事业和职业》原文摘录:你可以做自己希望做的任
成都学习之旅。叮当爸爸
5月26日早上8:00，我们来到了成都站，将开始为期三天的长度学习之旅26号，整天都是暴躁日，没有安排什么课，于是就和室友一起商量去熊猫养殖基地转一转。熊猫养殖基地位于3号线的熊猫大道处，坐地铁很方便，从我们所在的酒店1号线转3号线，然后在雪花大道下车即可，下车后就能看到关于熊猫养殖基地购票站，在购票价可以把门票和车票一起购买，还是方便。从购票处前往养殖基地，需要坐专线大巴。大巴将近行驶有个10分
标题 “Python 网络爬虫 —— selenium库驱动浏览器 WeiJingYu. python 爬虫 selenium
一、Selenium库核心认知Selenium库是Web应用程序测试与自动化操作的利器，能驱动浏览器（如Edge、Firefox等）执行点击、输入、打开、验证等操作。与Requests库差异显著：Requests库仅能获取网页原始代码，而Selenium基于浏览器驱动程序工作，浏览器可渲染网页源代码，借此能轻松拿到渲染后的数据信息（如JS动态加载内容），完美解决Requests库无法处理的动态页面
Python网络爬虫实现selenium对百度识图二次开发以及批量保存Excel WeiJingYu. python 爬虫 selenium
一.百度识图自动上传图片fromseleniumimportwebdriverfromselenium.webdriver.edge.optionsimportOptionsfromselenium.webdriver.common.byimportByedge_options=Options()edge_options.binary_location=r"C:\ProgramFiles(x86)
Python关于操作文件夹的讲解——Python 操作文件和文件夹 WeiJingYu. python 开发语言
借助os库，可完成文件大小查询、文件/文件夹删除、重命名等操作，满足多样化文件管理需求。（一）查询文件大小os库path模块的getsize(path)方法，能获取指定路径文件占用内存大小，单位为字节。字节是计算机存储基本单位，常见存储单位换算关系如下：单位换算关系说明字节（Byte）1字节=8位（bit）存储基本单元千字节（KB）1KB=1024Byte日常文件大小常用表述兆字节（MB）1MB=
这几句话，道尽中国五千年的气度琴棋书画APP
沧桑数千年，自古至于今，无数圣人先贤、名士豪杰，留下诸多豪言精语和肺腑之言，尤其是这10句话，最能代表中国精神，也是中国人的精神命脉所在。中国气概：人若犯我明犯强汉者，虽远必诛！——《汉书·陈汤传》汉朝强盛之时，“犯强汉者，虽远必诛”的确是被践行的事实。虽远必诛的前提是被犯，属于自卫反击。所以，汉武帝的多数征伐还是师出有名。国力强盛，则是底气。不过，当国家间尚存利益、理念的纠纷，人类还不尽是谦谦君
西湖 — 荷花花时间的花
去年三月份到杭州，就开始心心念念着“接天莲叶无穷碧”的荷花，一月去好几次西湖，奈何西湖一到周末节假日就人满为患。苏堤白堤和断桥只能见着密密麻麻的游人。七月开始陆陆续续刷到荷花要开了的消息，终于选了一个周末，来到这里。在荷花边走走停停，坐在路边石凳上看花。离湖边最近的花，也有一两米，用手去够是不可能够着的，远远的看，也看不完全。这样的荷花和庭院里养着的完全不一样。中间还忽然来了阵暴雨。天色都暗沉下来
考研·教育学｜第3章教育与社会发展 3.1复习笔记静观纪世
一、教育的社会制约性1.生产力对教育的制约(1)生产力制约着教育事业发展的规模和速度;(2)生产力的发展水平制约着人才的培养规格和教育结构;(3)生产力的发展促进着内容、教学方法和教学组织形式的发展和改革。2.社会经济政治制度对教育的制约(1)社会经济政治制度的性质制约教育的性质；(2)社会经济政治制度制约教育的宗旨和目的；(3)社会经济政治制度制约教育的领导权；(4)社会经济政治制度制约受教育权
从架构到API，你真的掌握了Electron的全貌吗？露露在前端 javascript 前端前端框架 vue.js 面试架构
前言Electron的原理是每个开发Electron应用的开发者都需要了解的知识内容，因为知道整个原理全貌后你才能在设计一个应用的时候更加的合理，遇到问题才知道从哪个方面去分析。这篇文章将主要从架构层面，协作方式，底层支持，源码层面，API设计等方面来剖析Electron的原理。架构层面两个组件Electron的核心架构是基于Chromium和Node.js两个主要组件，各自扮演不同的角色。Chr
绘本讲师训练营【52期】12/21实践原创《My Dad》家庭亲子故事会冒险啦啦
52010曾丹封面绘本：《MyDad》作者：AnthonyBrowne出版社：DoubledayUK·关于绘本：《我爸爸》是安东尼布朗的经典之作，也是妈妈们的必买系列绘本之一，尤其在传送父爱之情，塑造父亲形象，这无疑是一本清单作品。这也是安东尼布朗大师为纪念他对他父亲的感情创作的绘本，里面藏有无数的可爱的小心思，暗藏着深刻的寓意，绘本同时可爱又有创意，充满诙谐幽默和想象力，让大人感叹，让孩子欢喜。
程序员最喜爱的5款开发工具，每一款都爱不释手！小宇java
如果说编程是吃饭，那么开发工具就是程序员手中的筷子，每个人拿筷子的手法都不一样，拿的筷子品种也不一样，而一旦熟悉了一种拿捏方式和筷子样式，就很难去接受其他人使用筷子的品种和方法，这也算是程序员的一种特性吧！选择什么样的编辑器还和所从事的行业息息相关，那小编现在就程序员最喜欢的5中编辑器做个介绍。0.AtomAtom是github专门为程序员推出的一个跨平台文本编辑器。具有简洁和直观的图形用户界面，
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement