weixin_39965514

spacy库的安装与使用_使用spaCy让自然语言处理变得更简单

介绍

自然语言处理(NLP)是人工智能的主要领域之一。NLP在许多智能应用程序中扮演着重要的角色，例如自动聊天机器人、文章摘要、多语言翻译和数据识别。每一个利用NLP来理解非结构化文本数据的行业，不仅要求准确，而且要迅速获得结果。

自然语言处理是一个广阔的领域，NLP中的一些任务是文本分类、机器翻译、问题应答和概念识别。在我的其中一篇文章中，我讨论了在NLP实现中使用的各种工具和组件。文章大多数都在论及库-NLTK (自然语言工具包)组件。

而在这篇文章中，我将说一说强大的spaCy组件。

1.关于spaCy和安装

1.1 关于

spaCy是用Cython语言编写的，(Python的C扩展，它的目的是将C语言的性能交给Python程序)。它是一个相当快的NLP库。spaCy提供了一个简洁的API来访问它的方法和属性，它由经过训练的机器(以及深度)学习模型来管理。

1.2 安装

spaCy的数据以及它的模型可以使用python包索引和设置工具轻松地安装。使用以下命令在您的计算机中来安装spaCy:

sudo pip install spacy

对于Python3，在上面的命令中使用“pip3”替换“pip”。或者点这里下载源代码并在解压之后运行以下命令:

python setup.py install

下载所有的数据和模型，在安装之后运行以下命令:

python -m spacy.en.download all

现在准备就绪去探索和使用spaCy啦！

2.spaCy的pipeline和属性

通过创建pipeline来启动spaCy实现和对不同属性的访问。Pipeline是通过加载模型来创建的。程序包中提供了不同类型的模型，其中包含关于语言的信息—词汇表、受过训练的向量、语法和实体。

我们将加载一个英语核心web的默认模型。

import spacy

nlp = spacy.load(“en”)

对象“NLP”用于创建文档、访问语言注释和不同的NLP属性。让我们通过在pipeline中加载文本数据来创建一个文档。我使用从tripadvisor网站获得的酒店的评论。数据文件可以在这里下载。

document = unicode(open(filename).read().decode('utf8'))

document = nlp(document)

这份文件现在已经成为了spaCy英语模型的类的一部分，并与许多属性相关联。

文档(或Token)的属性可以使用以下命令列出:

dir(document)

>> [ 'doc', 'ents', … 'mem']

这将输出大量的文档属性，例如-Token、Token的引用索引、语音标记的一部分、实体、向量、情绪、词汇表等等。让我们来探索其中的一些属性。

2.1令牌化技术(TOKENIZATION)

每个spaCy文档都被标记为句子，并进一步进入Tokens，可以通过迭代文档来访问:

# first token of the doc

document[0]

>> Nice

# last token of the doc

document[len(document)-5]

>> boston

# List of sentences of our doc

list(document.sents)

>> [ Nice place Better than some reviews give it credit for.,

Overall, the rooms were a bit small but nice.,

...

Everything was clean, the view was wonderful and it is very well located (the Prudential Center makes shopping and eating easy and the T is nearby for jaunts out and about the city).]

2.2 词性标注(POS)

词性标注是词在语法正确的句子中所使用的词的属性。这些标记可以用作信息过滤、统计模型和基于规则的解析的文本特性。

让我们检查一下我们文档的所有pos标签:

# get all tags

all_tags = {w.pos: w.pos_ for w in document}

>> {97: u'SYM', 98: u'VERB', 99: u'X', 101: u'SPACE', 82: u'ADJ', 83: u'ADP', 84: u'ADV', 87: u'CCONJ', 88: u'DET', 89: u'INTJ', 90: u'NOUN', 91: u'NUM', 92: u'PART', 93: u'PRON', 94: u'PROPN', 95: u'PUNCT'}

# all tags of first sentence of our document

for word in list(document.sents)[0]:

print word, word.tag_

>> ( Nice, u'JJ') (place, u'NN') (Better, u'NNP') (than, u'IN') (some, u'DT') (reviews, u'NNS') (give, u'VBP') (it, u'PRP') (creit, u'NN') (for, u'IN') (., u'.')

让我们来研究一下文档的一些top unigrams。我已经创建了一个基本的预处理和文本清洗功能。

#define some parameters

noisy_pos_tags = [“PROP”]

min_token_length = 2

#Function to check if the token is a noise or not

def isNoise(token):

is_noise = False

if token.pos_ in noisy_pos_tags:

is_noise = True

elif token.is_stop == True:

is_noise = True

elif len(token.string) <= min_token_length:

is_noise = True

return is_noise

def cleanup(token, lower = True):

if lower:

token = token.lower()

return token.strip()

# top unigrams used in the reviews

from collections import Counter

cleaned_list = [cleanup(word.string) for word in document if not isNoise(word)]

Counter(cleaned_list) .most_common(5)

>> [( u'hotel', 683), (u'room', 652), (u'great', 300), (u'sheraton', 285), (u'location', 271)]

2.3 实体检测(ENTITY DETECTION)

spaCy由一个快速的实体识别模型组成，它能够识别来自文档的实体短语。实体可以是不同类型的，例如:人、位置、组织、日期、数字等等。这些实体可以通过“.ents”属性来访问。

让我们在文档中找到所有命名实体的类型。

labels = set([w.label_ for w in document.ents])

for label in labels:

entities = [cleanup(e.string, lower=False) for e in document.ents if label==e.label_]

entities = list(set(entities))

print label,entities

2.4 依存句法分析(DEPENDENCY PARSING)

spaCy的一个最强大的特性是极其快速和准确的句法依存解析(syntactic dependency parser)，它能够通过轻量级API来访问。Parser也可用于句子边界检测和短语分块。这些关系可以通过属性“.children” , “.root”, “.ancestor”等等来访问。

# extract all review sentences that contains the term - hotel

hotel = [sent for sent in document.sents if 'hotel' in sent.string.lower()]

# create dependency tree

sentence = hotel[2] for word in sentence:

print word, ': ', str(list(word.children))

>> A : [] cab : [A, from]

from : [airport, to]

the : []

airport : [the]

to : [hotel]

the : [] hotel :

[the] can : []

be : [cab, can, cheaper, .]

cheaper : [than] than :

[shuttles]

the : []

shuttles : [the, depending]

depending : [time] what : []

time : [what, of] of : [day]

the : [] day :

[the, go] you :

[]

go : [you]

. : []

让我们来解析包含“hotel”一词的所有句子的依存树，并检查“hotel”使用的形容词(用“adj”)标记。我创建了一个自定义功能，来解析依存树并提取相关的pos标记。

# check all adjectives used with a word

def pos_words (sentence, token, ptag):

sentences = [sent for sent in sentence.sents if token in sent.string]

pwrds = []

for sent in sentences:

for word in sent:

if character in word.string:

pwrds.extend([child.string.strip() for child in word.children

if child.pos_ == ptag] )

return Counter(pwrds).most_common(10)

pos_words(document, 'hotel', “ADJ”)

>> [(u'other', 20), (u'great', 10), (u'good', 7), (u'better', 6), (u'nice', 6), (u'different', 5), (u'many', 5), (u'best', 4), (u'my', 4), (u'wonderful', 3)]

2.5 名词短语(NOUN PHRASES)

依存树也能用来产生名词短语:

# Generate Noun Phrases

doc = nlp(u'I love data science on analytics vidhya')

for np in doc.noun_chunks:

print np.text, np.root.dep_, np.root.head.text

>> I nsubj love

data science dobj love

analytics pobj on

3.向量集成词汇

spaCy也提供了密集的内置集成，实值向量代表了分布相似性信息。它用GloVe来生成向量。Glove是一种不受监督的学习算法，用于获取单词的向量表示。

让我们创建一些单词向量并执行一些有趣的操作。

from numpy import dot

from numpy.linalg import norm

from spacy.en import English

parser = English()

#Generate word vector of the word - apple

apple = parser.vocab[u'apple']

#Cosine similarity function

cosine = lambda v1, v2: dot(v1, v2) / (norm(v1) * norm(v2))

others = list({w for w in parser.vocab if w.has_vector and w.orth_.islower() and w.lower_ != unicode("apple")})

# sort by similarity score

others.sort(key=lambda w: cosine(w.vector, apple.vector))

others.reverse()

print "top most similar words to apple:"

for word in others[:10]:

print word.orth_

>> apples iphone f ruit juice cherry lemon banana pie mac orange

4.机器学习文本使用spaCy

在机器学习模型中，集成spaCy是非常简单和直接的。让我们使用sklearn构建一个自定义文本分类器(classifier)。我们将创建一个具有以下组件的sklearn pipeline: cleaner, tokenizer, vectorizer, classifier.。对于tokenizer和vectorizer，我们将使用spaCy来构建我们自己的自定义模块。

from sklearn.feature_extraction.stop_words import ENGLISH_STOP_WORDS as stopwords

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.metrics import accuracy_score

from sklearn.base import TransformerMixin

from sklearn.pipeline import Pipeline

from sklearn.svm import LinearSVC

import string

punctuations = string.punctuation

from spacy.en import English

parser = English()

#Custom transformer using spaCy

class predictors(TransformerMixin):

def transform(self, X, **transform_params):

return [clean_text(text) for text in X]

def fit(self, X, y=None, **fit_params):

return self

def get_params(self, deep=True):

return {}

# Basic utility function to clean the text

def clean_text(text):

return text.strip().lower()

现在让我们使用spaCy解析器和一些基本的清洗创建一个自定义的tokenizer功能。这里需要注意的一点是，文本特性可以替换为单词向量(尤其是在深度学习模型中)。

#Create spacy tokenizer that parses a sentence and generates tokens

#these can also be replaced by word vectors

def spacy_tokenizer(sentence):

tokens = parser(sentence)

tokens = [tok.lemma_.lower().strip() if tok.lemma_ != "-PRON-" else tok.lower_ for tok in tokens]

tokens = [tok for tok in tokens if (tok not in stopwords and tok not in punctuations)] return tokens

#create vectorizer object to generate feature vectors, we will use custom spacy’s tokenizer

vectorizer = CountVectorizer(tokenizer = spacy_tokenizer, ngram_range=(1,1)) classifier = LinearSVC()

现在我们准备开始创建pipeline，加载数据(这里的示例)，还有运行分类(classifier)模型。

# Create the pipeline to clean, tokenize, vectorize, and classify

pipe = Pipeline([("cleaner", predictors()),

('vectorizer', vectorizer),

('classifier', classifier)])

# Load sample data

train = [('I love this sandwich.', 'pos'),

('this is an amazing place!', 'pos'),

('I feel very good about these beers.', 'pos'),

('this is my best work.', 'pos'),

("what an awesome view", 'pos'),

('I do not like this restaurant', 'neg'),

('I am tired of this stuff.', 'neg'),

("I can't deal with this", 'neg'),

('he is my sworn enemy!', 'neg'),

('my boss is horrible.', 'neg')]

test = [('the beer was good.', 'pos'),

('I do not enjoy my job', 'neg'),

("I ain't feelin dandy today.", 'neg'),

("I feel amazing!", 'pos'),

('Gary is a good friend of mine.', 'pos'),

("I can't believe I'm doing this.", 'neg')]

# Create model and measure accuracy

pipe.fit([x[0] for x in train], [x[1] for x in train])

pred_data = pipe.predict([x[0] for x in test])

for (sample, pred) in zip(test, pred_data):

print sample, pred

print "Accuracy:", accuracy_score([x[1] for x in test], pred_data)

>> ('the beer was good.', 'pos') pos

('I do not enjoy my job', 'neg') neg

("I ain't feelin dandy today.", 'neg') neg

('I feel amazing!', 'pos') pos

('Gary is a good friend of mine.', 'pos') pos

("I can't believe I'm doing this.", 'neg') neg

Accuracy: 1.0

5.与其他库作比较

spaCy对于几乎所有的NLP任务来说，都是非常强大的。如果你想知道为什么的话? 让我们将spaCy与其他著名的实现NLP的工具(NLTK和Core NLP)进行比较

有效性特征

Feature

Spacy

NLTK

Core NLP

Easy installation

Python API

Multi Language support

Tokenization

Part-of-speech tagging

Sentence segmentation

Dependency parsing

Entity Recognition

Integrated word vectors

Sentiment analysis

Coreference resolution

速率: 主要功能 – TOKENIZER, TAGGING, PARSING

Package

Tokenizer

Tagging

Parsing

spaCy

0.2ms

1ms

19ms

CoreNLP

2ms

10ms

49ms

NLTK

4ms

443ms

–

精确度: 实体抽取

Package

Precition

Recall

F-Score

spaCy

0.72

0.65

0.69

CoreNLP

0.79

0.73

0.76

NLTK

0.51

0.65

0.58

此文为编译作品，作者 SHIVAM BANSAL，原网站https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/

银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程小猿搬码 Redis Redis7 KylinV10 银河麒麟国产操作系统
银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程文章目录银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程1.下载2.安装过程1.解压2.编译源码3.测试编译结果（可选）4.安装Redis5.安装位置6.复制配置文件7.修改redis.conf文件8.启动Redis服务9.客户端测试10.设置开机自启动3.开启远程访问1.编辑redis.conf2.开启防火墙
无人机：科技改变生活的神奇力量光伏一点通无人机科技生活
无人机，作为一种高科技产品，已经在我们的生活中发挥着越来越重要的作用。从军事侦察到民用拍摄，从农业监测到物流配送，无人机的应用领域正在迅速扩展。本文将为您详细介绍无人机的多种应用，帮助您更全面地了解这一现代科技产物。1.军事侦察与打击无人机在军事领域的应用可以追溯到早期的侦察任务。它们能够在高空进行观测和监视，提供广阔的视野和精准的信息，支持军事作战计划的制定。现代无人机不仅能进行侦察和监视，还能
什么是 Redis yqcoder redis 数据库缓存
Redis（RemoteDictionaryServer）是一个开源的、基于内存的键值存储系统，常用作数据库、缓存和消息中间件。它支持多种数据结构，如字符串、哈希、列表、集合、有序集合等，并提供丰富的操作命令。主要特点高性能：数据存储在内存中，读写速度极快。持久化：支持RDB和AOF两种方式，确保数据在重启后不丢失。数据结构丰富：支持字符串、哈希、列表、集合、有序集合等多种类型。原子操作：所有操作
Prometheus + Grafana 配置监控指标笑远 prometheus grafana 运维数据库
Prometheus+Grafana配置监控指标在前一篇指南中，我们详细介绍了如何安装和配置Prometheus与Grafana。接下来，我们将深入探讨如何配置Prometheus来采集具体的监控指标，并使用Grafana将这些指标可视化。本指南将涵盖以下内容：选择和配置Exporters（除了NodeExporter之外）配置Prometheus以采集相关指标在Grafana中创建和配置仪表板高
机器人技能列表极梦网络无忧杂谈机器人
一、机器人制作基础入门（一）机器人概述1.机器人的定义与分类2.机器人的发展历程与现状3.机器人在各领域的应用案例（二）必备工具与材料4.常用电子工具介绍（万用表、电烙铁等）5.机械加工工具（螺丝刀、钳子、扳手等）6.电子元件（电阻、电容、二极管等）7.结构材料（塑料、金属、木材等）二、电子电路基础（一）电路原理与设计8.电路基本概念（电流、电压、电阻等）9.欧姆定律与基尔霍夫定律10.简单电路设
a16z Speedrun：加速科技与娱乐的未来花生糖@ 技术创业之路：从创意到企业科技娱乐 AI
引言a16z（AndreessenHorowitz）作为硅谷最具影响力的风投公司之一，一直致力于支持那些打破常规、创造新可能性的创始人。随着科技和娱乐领域的融合日益加深，a16z推出了Speedrun计划，旨在帮助前沿科技和娱乐领域的初创公司快速成长。专注于推动游戏、AI、3D、流媒体、平台、游戏技术、XR等领域的创新。a16z联合创始人马克·安德森（MarcAndreessen）在speedru
golang字符串常用的系统函数平谷一勺 Golang基础篇 golang java 开发语言 go字符串基本函数字符串常用方法
1.说明字符串在开发中，使用频率非常高，所以我们需要掌握字符串的常用方法。2.统计字符串的长度按字节len（str）go的编码统一为utf-8（ascii的字符字母和数字占一个字节，汉字占三个字节）str:="hello"fmt.Println(len(str))//5str="hello杭"fmt.Println(len(str))//83.字符串遍历处理带有中文的字符串r:=[]rune(st
人工智能：重塑未来生活与工作的科技力量 Geektec 问答专栏人工智能应用创新
方向一：介绍人工智能技术的发展历程和现状，指出它的应用领域和前景一、人工智能技术的发展历程人工智能（ArtificialIntelligence,AI）作为一门学科，其起源可以追溯到20世纪50年代。最初，AI的研究主要集中在逻辑推理、机器学习和自然语言处理等领域，目标是使机器能够模拟人类的智能行为。尽管在早期的探索中，AI遭遇了诸多挑战和瓶颈，但其发展潜力逐渐被认可，并在随后几十年中得到了迅速的
pyenv 管理多个 Python 版本(1) 数据科学工厂 python
引言你是否曾希望参与一个支持多个Python版本的项目，但又不知道如何轻松地测试所有这些版本？你是否对Python的最新版本感到好奇？或许你想尝试这些新功能，但又不想冒险破坏你的开发环境。幸运的是，如果你使用pyenv，管理多个Python版本并不复杂。本文[1]将向你展示如何高效地在项目上工作，同时减少因尝试使用正确版本的Python而产生的困扰。通过本文，你将学会：安装多个Python版本安装
[python多版本管理] pyenv-win 详细安装和使用 java我跟你拼了其他 python 开发语言多版本管理
文章目录第一种安装方式介绍pyenv快速启动pyenv-win命令验证安装手动检查设置使用如何更新pyenvAnnouncements第二种安装方式安装pyenv-win配置环境变量安装Python版本切换Python版本查看已安装版本创建虚拟环境（可选）Python常用的版本Python3.x系列关于Python2.x系列总结第一种安装方式介绍python的[pyenv][1]是一个很好的工具，
如何优化AI模型的Prompt：深度指南 Earth explosion 人工智能 prompt
随着人工智能（AI）技术的快速发展，AI模型在文本生成、翻译、问答等领域的应用越来越广泛。在使用这些模型时，**Prompt（提示）**的质量直接影响输出结果的好坏。优化Prompt不仅能提升生成文本的准确性，还能显著提高工作效率。作为一个希望提升AI应用效果的普通人，如何才能优化Prompt呢？本文将为你提供一份详细的指南，涵盖从基础知识到高级技巧的各个方面。一、什么是Prompt？1.1定义P
Android文件选择器的优化之旅 t0_54manong 编程问题解决手册 android 个人开发
在Android开发中，我们经常需要用户从设备中选择文件。最近，我在处理一个项目时遇到了一个有趣的问题：如何限制用户只能选择一个文件，而不是多个。下面我将详细介绍如何实现这个功能，并提供一个实际的例子。问题描述通常，我们使用Intent.ACTION_OPEN_DOCUMENT来启动文件选择器。在默认情况下，这个选择器允许用户选择多个文件，但有时候我们希望用户只能选择一个文件。这不仅可以提高用户体
用 Pinia 点燃 Vue 3 应用：状态管理革新之旅心中的灯塔 vue.js 前端 javascript
用Pinia点燃Vue3应用：状态管理革新之旅用Pinia点燃Vue3应用：状态管理革新之旅什么是Pinia？安装与基础配置创建和使用Store定义Store在组件中使用Store高级用法组合多个Store持久化状态总结用Pinia点燃Vue3应用：状态管理革新之旅在构建现代前端应用时，如何高效管理状态一直是开发者关注的焦点。随着Vue3的普及，官方推荐的状态管理方案Pinia因其轻量、灵活和易于
使用Lodash工具后代码行数瞬间缩短... lodasharraylist
背景:最近在做报表.涉及到echarts图表.多层柱状图叠加展示.然后后端给出来的结构是二维数组.需要前端自行处理成图表可用的数据格式.echarts数据是是动态的.需求效果图的样子:echarts相似的官网案例代码:option={tooltip:{trigger:'axis',},legend:{data:['Direct','MailAd','AffiliateAd','VideoAd','
IntelliJ IDE 插件开发指南人工智能_SYBH 课程推荐 2025年前后端实战项目 ide java intellij-idea
IntelliJIDE插件开发指南-洪进锋-掘金小册作者介绍洪进锋，字节跳动后端研发工程师，参与过高并发系统（百万QPS）设计与研发工作。在开源项目方面混过Sharding-JDBC的PR。个人开发的IntelliJIDE插件RedisManager，目前在官方插件库中下载量30K，评分4.37（满分5分）。小册介绍目前国内插件开发方面的资料比较少且零散，特别是涉及到一些IDE中的高级特性，例如语
项目使用mybatis-plus分页插件和pageHelper分页插件引起失效问题！ JavinLu mybatis java springboot 个人开发深度学习
一、背景项目中以前的源码是使用pageHelper分页插件来实现。涉及到的sql代码还是要手写部分。而目前在Springboot项目中，使用的主流的方式就是一个基于mybatis-plus的.page()的分页，当然这种分页方式是适用于一些简单的查询和简单场景下。对于多表联查等场景，可能还是需要通过手写sql来实现复杂查询。这时候就可以使用pageHelper的分页插件。二、问题描述在同时使用my
AI 行业发展趋势：科技创新引领未来变革我是阿萌畅聊AI 人工智能科技学习
在当今数字化时代，人工智能（AI）行业正以前所未有的速度蓬勃发展，深刻地改变着我们的生活、工作和社会格局。从基础技术的突破到广泛的应用场景拓展，AI展现出了一系列令人瞩目的发展趋势，预示着一个充满无限可能的未来。一、技术创新持续突破模型规模与性能提升AI模型正朝着更大规模、更复杂的方向发展。以GPT系列为代表的大语言模型，参数数量不断攀升，从GPT-2的15亿参数到GPT-4的万亿级参数，模型的语
Anthropic 的模型调皮的芋头深度学习神经网络机器学习人工智能
Anthropic的模型（特别是Claude系列）之所以在性能和推理能力上表现强劲，可以从技术设计、研究理念、训练方法以及应用优化等多个方面进行详细分析。以下是基于当前信息（截至2025年3月13日）和行业趋势的深入剖析：1.技术设计与安全导向Anthropic由前OpenAI研究员创立，核心理念是将安全性、可解释性和可控性融入模型设计。这种设计哲学直接影响了Claude模型的性能：Constit
【通缩螺旋的深度解析与科技破局路径】调皮的芋头机器学习神经网络
通缩螺旋的深度解析与科技破局路径一、通缩螺旋的形成机制与恶性循环通缩螺旋（DeflationarySpiral）是经济学中描述价格持续下跌与经济衰退相互强化的动态过程，其核心逻辑可拆解为以下链条：需求端萎缩：居民消费信心不足（如中国2023年消费者信心指数创历史新低），导致商品价格下行压力加剧。企业端收缩：企业收入增速放缓（2023年中国规上工业企业利润同比-2.3%），被迫削减投资/裁员（青年失
笔记-python之celery使用详解大白砌墙笔记 python 开发语言
Celery是一个用于处理异步任务的Python库，它允许你将任务分发到多个worker进行处理。以下是Celery的使用详解：安装Celery使用pip安装Celery：pipinstallcelery创建Celery实例首先，需要创建一个Celery实例，指定broker（消息中间件）和backend（结果存储）。fromceleryimportCeleryapp=Celery('tasks'
【儿童自信的生物学机制】调皮的芋头机器学习数据库
在继续深入探讨儿童自信的生物学机制时，我们需要将视角拓展至神经递质系统、突触动态平衡以及跨脑区网络整合等更深层的神经发育规律。以下从三个新颖维度展开分析：一、神经递质系统的发育失衡现象儿童自信水平随年龄增长呈现U型曲线变化的现象，确实蕴含着复杂的生物进化机制与神经发育规律。从进化生物学视角来看，人类幼态持续特征决定了早期自信的生存价值：新生儿通过哭闹表达需求（平均每天1.5小时发声），这种原始自信
【python】虚拟环境工具pyenv 南隅。 python python 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录0x0安装配置pyenv和virturalenv插件0x00pyenv0x01pyenv-virtualenv插件0x02pyenv下载安装包速度0x1使用pyenv0x2卸载pyenv0x3pyenv配置问题0x30问题描述0x31debug0x32problem0x33复现0x4补充0x40windows的python虚拟
计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档) 山逸网络数据库 java mysql
计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档)计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档)本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win1
怎么使用jwt，token以及redis进行续期？曦月不可及? java
怎么使用jwt，token以及redis进行续期？什么是jwt?什么是token?结合JWT、Token和Redis进行续期的一般步骤：生成JWT：用户登录成功后，服务器生成一个JWT，并返回给客户端。importio.jsonwebtoken.Jwts;importio.jsonwebtoken.SignatureAlgorithm;publicclassJwtUtil{privatestati
VRAR：重塑现实界限的未来科技力量 JiYan_cyan 业界资讯
VRAR：重塑现实界限的未来科技力量一、VRAR引领虚拟现实与增强现实技术的融合随着科技的快速发展，VR（虚拟现实）与AR（增强现实）技术在日常生活中的作用日益突出。这两种技术通过模拟现实与虚拟元素的无缝结合，给人类带来了全新的沉浸式体验。特别是在游戏、娱乐、教育以及商业领域，VRAR展现出了巨大的潜力。从单纯的虚拟世界构建到与现实世界的交融，VRAR正在打破技术的边界。这一趋势不仅在年轻一代中引
使用Python编写Web应用程序的框架 - Celery YOUFDJ python 前端开发语言 Python
使用Python编写Web应用程序的框架-CeleryCelery是一个功能强大的Python库，用于编写具有异步任务处理和分布式消息传递功能的Web应用程序。它是一个开源项目，广泛应用于许多大型的网络应用和分布式系统中。本文将介绍Celery框架的基本概念和使用方法，并提供相应的源代码示例来帮助您更好地理解和使用Celery。Celery的安装要开始使用Celery，您需要首先安装它。您可以使用
MySQL常用函数详解及SQL代码示例漏洞猎人001 数据库学习 mysql sql android
MySQL常用函数详解及SQL代码示例引言当前日期和时间函数字符串函数数学函数聚合函数结论引言MySQL作为一种广泛使用的关系型数据库管理系统，提供了丰富的内置函数来简化数据查询、处理和转换。掌握这些函数可以大大提高数据库操作的效率和准确性。本文将详细介绍MySQL中一些常用的函数，并配以SQL代码示例，帮助读者更好地理解和应用这些函数。当前日期和时间函数在当前时间（中国北京时间2025年03月1
离散数学-万字课堂笔记-期末考试-考研复习-北航离散数学1 桃木山人考研数学离散数学期末
第一章逻辑语言1.1逻辑运算1.2命题逻辑合式公式1.3谓词逻辑合式公式1.4自然语言命题第二章命题逻辑语义2.1命题合式公式语义2.2推论式与等价式的语义2.3变换合式公式的语义2.4命题公式范式2.5等式演算2.6完全集第三章谓词逻辑语义3.1谓词合式公式语义3.2推论关系和相等关系3.3前束范式与斯科伦范式3.4一阶理论语言3.5论域、结构与模型第四章逻辑公理系统4.1形式系统4.2命题逻辑
使用Redis实现分布式锁的技术详解智能编织者 redis 分布式数据库
使用Redis实现分布式锁的技术详解一、引言二、分布式锁的基本概念三、Redis实现分布式锁的原理1.SETNX命令2.SET命令的扩展参数3.Lua脚本保证原子性四、Redis实现分布式锁的步骤1.引入Redis依赖2.加锁实现3.释放锁实现4.设置锁过期时间五、代码演示1.引入依赖2.加锁与释放锁的工具类3.使用示例六、注意事项与优化1.死锁问题2.锁竞争与重试机制一、引言在分布式系统中，多个
DeepSeek R1有什么不同新加坡内哥谈技术人工智能深度学习机器人科技
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/深度思考实验室（DeepSeek）最近发布了全新的推理模型R1，声称该模型不仅性能超越目
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

spacy库的安装与使用_使用spaCy让自然语言处理变得更简单

你可能感兴趣的:(spacy库的安装与使用)