99.99％

基于出行住宿评论数据的情感分析研究（民宿篇，含python代码）

本次用到的是爱彼迎民宿评论数据：

链接：https://pan.baidu.com/s/1fIhjn1DrPV8wxqnJ0DdumA
提取码：lpy3

停用词汇总：

链接：https://pan.baidu.com/s/1mEyql8pqz8XeVU_xBYkKfQ
提取码：02eb

情感分析用词：
链接：https://pan.baidu.com/s/1TKR8xBFMhUH7AZPePqBGJQ
提取码：7wwz

文章目录

研究背景

研究意义

二、数据预处理

1.引入库

2. 合并生成总数据

3. 剔除无价值数据

三、爱彼迎民宿数据的数据分析

1. 爱彼迎数据分析具体步骤

1.1 分词并用SnowNLP进行初步分析

1.2 词性标注

四、情感数据分析和预测

1. LinearSVC模型预测情感

优化处理向下采样

2. 自定义情感倾向分析模型

3. 使用LDA主题分类模型进行数据分析

4. 各城市评论数据比较

总结

研究背景

随着国内互联网产业的发展，社会中涌现出携程、爱彼迎等一批基于互联网的出行服务平台，人们在生活中也习惯于使用这些平台作为出行指导，而出行最重要的版块之一就是住宿。特别是在中途长途行程中，住宿是人们必须考虑的一项。

近年来我国大力发展服务业，住宿版块作为服务业的支柱之一，其行业的发展关系到整个服务业链条的发展，住宿版块当前主要有两种形式，一是传统的酒店行业，另一种是近些年新兴的短期民宿行业，民宿相比于酒店往往性价比更高，拥有更大和更多功能的空间，而酒店的服务和饮食往往优于民宿，两者各有利弊。2022年5月24日，民宿的龙头平台爱彼迎宣布将在2022年7月30日起暂停在中国大陆的服务，外界普遍猜测爱彼迎暂停服务是由于疫情管控导致民宿市场冷清。疫情给住宿服务业带来的冲击是有目共睹的，疫情对民宿与酒店行业都造成了影响，但是爱彼迎作为民宿平台选择退出大陆市场，而携程和美团等平台上的酒店预订业务仍旧平稳运营，这背后除了有疫情因素作为催化剂，是否还存在着其他因素的影响。

研究意义

本文通过对民宿与酒店的相关用户评论数据进行情感分析，获取民宿与酒店带给用户体验的异同点，从而更好地分析出民宿与酒店各自的优势和劣势所在，找出在疫情背景下，影响酒店与民宿平台发展的因素，从而找到近年来住宿行业发展的问题与矛盾的所在。

一、数据集介绍

链接：https://pan.baidu.com/s/1fIhjn1DrPV8wxqnJ0DdumA
提取码：lpy3

数据集来源于和鲸社区的爱彼迎评论数据集，数据集中包含爱彼迎用户的评论数据，根据民宿所在地分为北京、上海、重庆、成都、广州、杭州、南京、苏州、西安共9个地区，每个地区的评论数据以txt文本的格式存储。

二、数据预处理

1.引入库

import os
import jieba
import re
from collections import Counter
import pandas as pd
import numpy as np
from gensim.models import word2vec
import gensim
import logging
import os
import pyLDAvis
import pyLDAvis.sklearn
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import LatentDirichletAllocation
from pyecharts.charts import Bar
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")

2. 合并生成总数据

为了对总体数据进行分析，我将9个地区的txt合并为总数据.txt文件：

allfile=[ '北京.txt','上海.txt', '重庆.txt','广州.txt', '杭州.txt', '南京.txt', '西安.txt', '成都.txt',  '苏州.txt']
def hecheng(file_name,File_name='总数据.txt'):
    with open(file_name,encoding='utf-8',mode='r',errors='ignore') as f1,open(File_name,encoding='utf-8',mode='a+',errors='ignore') as F:
        for line in f1:
            F.seek(0,2)
            F.write(line)


for i in allfile:
    if str(i).endswith('.txt'):
        hecheng('./爱彼迎民宿/'+i)

导入总数据并且转化为dataframe：

import pandas as pd
from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt
import PIL
import numpy as np
path = '总数据.txt'
f = open(path,"r",encoding='utf-8')

data=[]
for line in f.readlines():
            line=line.strip().split("\t")
            data.append(line)

f.close()

minsu=pd.DataFrame(data).dropna(axis=0)
minsu.columns=['comment']

3. 剔除无价值数据

共剔除以下几类数据：

1）英文数据，由于北京、上海、重庆等城市都是国际化都市，所以数据集中包含了部分英文数据，我在预处理时首先就将数据中的英文评论和评论文本中的空白行去除，具体方法就是将空白行标记为缺失值，再将包含英文字母的评论换为缺失值，然后进行再删去文本中所有缺失值。

2）重复词，例如：爱彼迎、民宿、北京、上海、重庆、广州、杭州、南京、成都、苏州、西安，这些词虽然频繁出现，但对于分析评论特点没有帮助，数字也是如此。

3）短评论，例如：挺不错、真的好、特别喜欢，这种只有一个或是几个字的评论，这种没有实际意义的文本数据对于数据分析没有任何帮助，所以我对少于5个字的短文本进行了清除。

import re
# 去除数字、爱彼迎等词语
strinfo = re.compile('[0-9]|爱彼迎|民宿|北京|上海|重庆|广州|杭州|南京|成都|苏州|西安')
minsu['comment'] =  minsu['comment'].apply(lambda x: strinfo.sub('',x))

#第一步 将空字符的行替换为nan，方便进行删除
minsu.replace(to_replace=r'^\s*$', value=np.nan, regex=True, inplace=True)
minsu.replace(to_replace=r'[a-zA-Z]', value=np.nan, regex=True, inplace=True)

#第二步 删除所有值为nan的行
minsu.dropna(axis=0, how='any', inplace=True)

#去除短评论
minsu = minsu[minsu['comment'].apply(len)>=4]

三、爱彼迎民宿数据的数据分析

1. 爱彼迎数据分析具体步骤

首先使用SnowNLP进行初步分析，为数据添加level列，即好评或差评，之后使用LinerSVC模型进行好差评的预测，然后为了进一步准确提取正负向评论中的关键词并进行主题分类，我使用基于词典匹配的情感倾向分析模型对评论数据的情感进一步准确化并提取其中的关键词，最终进行LDA主题分类分别对积极评论以及消极评论进行主题划分。

1.1 分词并用SnowNLP进行初步分析

通过SnowNLP给每条评论一个情感评分，虽然不完全准确，但可以作为参考。

停用词汇总文件：

链接：https://pan.baidu.com/s/1mEyql8pqz8XeVU_xBYkKfQ
提取码：02eb

添加一列emotion列，存储情感评分：

from snownlp import SnowNLP
minsu['emotion'] = minsu['comment'].apply(lambda x:SnowNLP(x).sentiments)

from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt
import PIL

text = ''
for s in minsu['comment']:
    text += s
data_cut = ' '.join(jieba.lcut(text))


path = '停用词汇总.txt'
f = open(path,"r",encoding='utf-8').read()


word_cloud = WordCloud(font_path="simsun.ttc", 
                       background_color="white", 
                       stopwords=f
                       )
 

word_cloud.generate(data_cut)
plt.subplots(figsize=(15,8))
plt.imshow(word_cloud)
plt.axis("off")
plt.show()

添加评论情绪列（好评or差评）：

def pingjia(emotion):
    if emotion >= 0.4:
        return '好评'

    else:
        return '差评'

minsu['level'] = minsu['emotion'].map(lambda x: pingjia(x))
minsu

1.2 词性标注

为了方便模型筛选有实际意义的评论，我将评论数据进行分词操作，主要是为了方便情感倾向分析模型关于含有名词评论的筛选，我还在分词的同时，给每个词加上了词性，例如：n名词、v动词、x标点符号等。此处以爱彼迎北京地区的评论数据作为例子，展示分词结果：

有时因为设备性能和jupiternotebook软件限制，数据量大时运行会极为缓慢，将数据拆成9份来运行会更快，如果代码跑不动就拆分成几份然后合并。

seg_word = minsu['comment'].apply(fenci)

n_word = seg_word.apply(lambda x: len(x))
n_content = [[x+1]*y for x,y in zip(list(seg_word.index), list(n_word))]
index_content = sum(n_content, [])
seg_word = sum(seg_word, [])
word = [x[0] for x in seg_word]
cixing = [x[1] for x in seg_word]
level = [[x]*y for x,y in zip(list(minsu1['level']), list(n_word))]
level = sum(level, [])
result = pd.DataFrame({ "index_content":index_content,"word":word,
                       "cixing":cixing,
                       "level":level})

result = result[result['cixing'] != 'x']
#删除停用词
path = '停用词汇总.txt'
f = open(path,"r",encoding='utf-8')
stop = f.readlines()
stop = [x.replace('\n', '') for x in stop]
word = list(set(word) - set(stop))
result = result[result['word'].isin(word)]

词性标注并且去除停用词之后的数据长这样：

给数据标个号，方便之后的情感分析预测。

四、情感数据分析和预测

1. LinearSVC模型预测情感

因为我在实验中深感标注情感信息的不易，所以我想用一个模型实现对评论数据情感的精准预测。这里我使用的是分类问题中比较常用的线性支持向量分类模型，将总数据集随机划分为训练集和验证集，训练集占70%的数据量，验证集占30%的数据量，其中train_X是经过TF_IDF算法向量化之后的特征词矩阵。

在实验中我使用的是默认参数的LinearSVC模型，利用模型的fit函数来对数据集做训练，最终打印模型在验证集数据上的准确率。模型最初的准确率为0.8752187189076063，但是此时数据集中评论标签是不平衡数据，即负向评论少，正向评论多，所以我接下来采用向下采样的方法，正负向评论各采集12842条，然后再用模型进行训练，发现准确率降低为0.7200882429275889，虽然准确率降低了，但我认为这才是模型真正的准确率，显然这个模型还有继续优化的空间，我后续也会继续进行研究。

第一步：切分训练集测试集；

import copy
minsu666=copy.deepcopy(minsu)
minsu['level'] = minsu['level'].map(lambda x:1.0 if x == '好评' else 0.0)

from sklearn.feature_extraction.text import TfidfVectorizer as TFIDF  # 原始文本转化为tf-idf的特征矩阵
from sklearn.svm import LinearSVC
from sklearn.calibration import CalibratedClassifierCV
from sklearn.model_selection import train_test_split

train_X,valid_X,train_y,valid_y = train_test_split(minsu['comment'],minsu['level'],test_size=0.3,random_state=24)

model_tfidf = TFIDF(min_df=5, max_features=5000, ngram_range=(1,3), use_idf=1, smooth_idf=1)
model_tfidf.fit(train_X)
train_vec = model_tfidf.transform(train_X)

第二步：训练模型；

model_tfidf = TFIDF(min_df=5, max_features=5000, ngram_range=(1,3), use_idf=1, smooth_idf=1)
model_tfidf.fit(train_X)
train_vec = model_tfidf.transform(train_X)

第三步：验证并统计结果；

# 把文档转换成矩阵
valid_vec = model_tfidf.transform(valid_X)
# 验证
pre_valid = clf.predict_proba(valid_vec)
pre_valid = clf.predict(valid_vec)
print('正例:',sum(pre_valid == 1))
print('负例:',sum(pre_valid == 0))

看一下准确率：

from sklearn.metrics import accuracy_score

score = accuracy_score(pre_valid,valid_y)
print("准确率:",score)

优化处理向下采样

由于负向情感的评价太少了，所以我进行了下采样，希望能看到更加真实的预测结果：

def under_sampling(data, target_col, balance_rate, random_state):
    if target_col == 1:
        target_col = "level"
    major, minor = data[target_col].value_counts(sort=True, 
                                                 ascending=False).index
    line_no = pd.Series(data[target_col].values, 
                        index=range(data.shape[0]))
    minor_ln = line_no[line_no.eq(minor)].index
    major_ln = line_no[line_no.eq(major)]
    major_ln = major_ln.sample(n=int(minor_ln.size * balance_rate),
                               random_state=random_state).index
    bingo_ln = minor_ln.append(major_ln)
    return data.iloc[bingo_ln, :]
data_u_s = under_sampling(minsu, target_col=1, 
                            balance_rate=1, random_state=1)
print("自定义函数结果\n%s" % data_u_s["level"].value_counts())

from sklearn.feature_extraction.text import TfidfVectorizer as TFIDF  # 原始文本转化为tf-idf的特征矩阵
from sklearn.svm import LinearSVC
from sklearn.calibration import CalibratedClassifierCV
from sklearn.model_selection import train_test_split

# 训练集验证集划分
train_X,valid_X,train_y,valid_y = train_test_split(data_u_s['comment'],data_u_s['level'],test_size=0.3,random_state=24)

model_tfidf = TFIDF(min_df=2, max_features=5000, ngram_range=(1,5), use_idf=1, smooth_idf=1)
model_tfidf.fit(train_X)
train_vec = model_tfidf.transform(train_X)

# 模型训练
model_SVC = LinearSVC()
clf = CalibratedClassifierCV(model_SVC)
clf.fit(train_vec,train_y)
# 把文档转换成矩阵
valid_vec = model_tfidf.transform(valid_X)
# 验证
pre_valid = clf.predict_proba(valid_vec)
pre_valid = clf.predict(valid_vec)
print('正例:',sum(pre_valid == 1))
print('负例:',sum(pre_valid == 0))

from sklearn.metrics import accuracy_score

score = accuracy_score(pre_valid,valid_y)
print("准确率:",score)

2. 自定义情感倾向分析模型

情感分析词汇（正负面评价词语、正负面情绪词、否定词）：

链接：https://pan.baidu.com/s/1TKR8xBFMhUH7AZPePqBGJQ
提取码：7wwz

word = pd.read_csv("./word_zong.csv")
path="./情感分析用词/情感极性词典"

pos_comment = pd.read_csv(path+"/正面评价词语.txt", header=None,sep="/n", encoding = 'utf-8', engine='python')
neg_comment = pd.read_csv(path+"/负面评价词语.txt", header=None,sep="/n", encoding = 'utf-8', engine='python')
pos_emotion = pd.read_csv(path+"/正面情绪词.txt", header=None,sep="/n", encoding = 'utf-8', engine='python')
neg_emotion = pd.read_csv(path+"/负面情绪词.txt", header=None,sep="/n", encoding = 'utf-8', engine='python') 


positive = set(pos_comment.iloc[:,0])|set(pos_emotion.iloc[:,0])
negative = set(neg_comment.iloc[:,0])|set(neg_emotion.iloc[:,0])


intersection = positive&negative

positive = list(positive - intersection)
negative = list(negative - intersection)

positive = pd.DataFrame({"word":positive,"weight":[1]*len(positive)})
negative = pd.DataFrame({"word":negative,"weight":[-1]*len(negative)}) 

posneg = positive.append(negative)


data_posneg = posneg.merge(word, left_on = 'word', right_on = 'word', 
                           how = 'right')
data_posneg = data_posneg.sort_values(by = ['index_content','word'])

data_posneg.tail(10)

notdict = pd.read_csv(path+"/否定词.txt")

# 构造新列，作为经过否定词修正后的情感值
data_posneg['amend_weight'] = data_posneg['weight']
data_posneg['id'] = np.arange(0, len(data_posneg))

# 只保留有情感值的词语
only_inclination = data_posneg.dropna().reset_index(drop=True)

index = only_inclination['id']


for i in np.arange(0, len(only_inclination)):
    # 提取第i个情感词所在的评论
    review = data_posneg[data_posneg['index_content'] == only_inclination['index_content'][i]]
    review.index = np.arange(0, len(review))
    # 第i个情感值在该文档的位置
    affective = only_inclination['index_word'][i]
    if affective == 1:
        ne = sum([i in notdict for i in review['word'][affective - 1]])%2
        if ne == 1:
            data_posneg['amend_weight'][index[i]] = -data_posneg['weight'][index[i]]          
    elif affective > 1:
        ne = sum([i in notdict for i in review['word'][[affective - 1, 
                  affective - 2]]])%2
        if ne == 1:
            data_posneg['amend_weight'][index[i]] = -data_posneg['weight'][index[i]]

            
# 更新只保留情感值的数据
only_inclination = only_inclination.dropna()

# 计算每条评论的情感值
value = only_inclination.groupby(['index_content'],
                                           as_index=False)['amend_weight'].sum()

# 去除情感值为0的评论
value = value[value['amend_weight'] != 0]

value['amend_level'] = ''
value['amend_level'][value['amend_weight'] > 0] = '好'
value['amend_level'][value['amend_weight'] < 0] = '差'

result = value.merge(word,left_on = 'index_content', 
                               right_on = 'index_content',
                               how = 'left')

# 提取正向和负向评论信息
ind_pos = list(value[value['amend_level'] == '好']['index_content'])
ind_neg = list(value[value['amend_level'] == '差']['index_content'])
posdata = word[[i in ind_pos for i in word['index_content']]]
negdata = word[[i in ind_neg for i in word['index_content']]]

爱彼迎民宿正向评论词云图：

import matplotlib.pyplot as plt
from wordcloud import WordCloud


# 正向评论词云图
freq_pos = posdata.groupby('word')['word'].count()
freq_pos = freq_pos.sort_values(ascending = False)
wordcloud = WordCloud(font_path="simsun.ttc",
                      max_words=100,
                      background_color='white')
pos_wordcloud = wordcloud.fit_words(freq_pos)

plt.subplots(figsize=(12,8))
plt.imshow(pos_wordcloud)
plt.axis('off') 
plt.show()

爱彼迎民宿负向评论词云图：

# 负向评论词云图
freq_neg = negdata.groupby(by = ['word'])['word'].count()
freq_neg = freq_neg.sort_values(ascending = False)
neg_wordcloud = wordcloud.fit_words(freq_neg)

plt.subplots(figsize=(12,8))
plt.imshow(neg_wordcloud)
plt.axis('off') 
plt.show()

获取正向、负向评论关键词并保存：

freq_pos.head(20)
freq_neg.head(20)
posdata.to_csv("./posdata.csv", index = False, encoding = 'utf-8')
negdata.to_csv("./negdata.csv", index = False, encoding = 'utf-8')

爱彼迎民宿正向评论关键词爱彼迎民宿负向评论关键词

3. 使用LDA主题分类模型进行数据分析

为了更好地分析影响积极评论和消极评论的因素，我将正向评论中的词语和负向评论中的词语提取为posdata和negdata，然后分别利用TF-IDF算法将词汇向量化，然后赋给字词各自的权重，使用LDA主题分类模型分别对正向评论中的词汇和负向评论中的词汇进行主题分析。

在进行了多次参数调优之后，我发现正向评论中LDA设为3个主题的效果较好，负向评论中LDA设为4个主题的效果较好，得到结果如下：

path = '停用词汇总.txt'
f = open(path,"r",encoding='utf-8').read()  #设置文件对象
stopwords=list(f)

#计算TF-IDF值
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer

n_features = 2000

tf_vectorizer = TfidfVectorizer(strip_accents = 'unicode',
                                max_features=n_features,
                                stop_words=stopwords,
                                max_df = 0.99,
                                min_df = 0.002) #去除文档内出现几率过大或过小的词汇
tf = tf_vectorizer.fit_transform(posdata['word'])

print(tf.shape)
print(tf)

#LDA主题分类 
from sklearn.decomposition import LatentDirichletAllocation

#设置主题数
n_topics = 3

lda = LatentDirichletAllocation(n_components=n_topics,
                                max_iter=100,
                                learning_method='online',
                                learning_offset=50,
                                random_state=0)
lda.fit(tf)

#显示主题数
print(lda.components_)
#几个主题就是几行 多少个关键词就是几列 
print(lda.components_.shape)                           

def print_top_words(model, tf_feature_names, n_top_words):
    for topic_idx,topic in enumerate(model.components_): 
        print('Topic #%d:' % topic_idx)
        print(' '.join([tf_feature_names[i] for i in topic.argsort()[:-n_top_words-1:-1]]))
        print("")

#每个主题输出前20个关键词
n_top_words = 20                                       
tf_feature_names = tf_vectorizer.get_feature_names()

print_top_words(lda, tf_feature_names, n_top_words)

import pyLDAvis
import pyLDAvis.gensim_models
red_vis_data = pyLDAvis.sklearn.prepare(lda,tf,tf_vectorizer)
pyLDAvis.display(red_vis_data)

正向积极评论LDA分类可视化结果

#计算TF-IDF值
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer

n_features = 2000


tf_vectorizer = TfidfVectorizer(strip_accents = 'unicode',
                                max_features=n_features,
                                stop_words=stopwords,
                                max_df = 0.99,
                                min_df = 0.002) #去除文档内出现几率过大或过小的词汇
tf = tf_vectorizer.fit_transform(negdata['word'])

#LDA主题分类
from sklearn.decomposition import LatentDirichletAllocation

#设置主题数
n_topics = 4

#Python 2.X: n_topics=n_topics
lda = LatentDirichletAllocation(n_components=n_topics,
                                max_iter=100,
                                learning_method='online',
                                learning_offset=50,
                                random_state=0)
lda.fit(tf)

#显示主题数
print(lda.components_)

print(lda.components_.shape)                         


def print_top_words(model, tf_feature_names, n_top_words):
    for topic_idx,topic in enumerate(model.components_):  
        print('Topic #%d:' % topic_idx)
        print(' '.join([tf_feature_names[i] for i in topic.argsort()[:-n_top_words-1:-1]]))
        print("")

#每个主题输出前20个关键词
n_top_words = 20                                       
tf_feature_names = tf_vectorizer.get_feature_names()

print_top_words(lda, tf_feature_names, n_top_words)

import pyLDAvis
import pyLDAvis.gensim_models
red_vis_data = pyLDAvis.sklearn.prepare(lda,tf,tf_vectorizer)
pyLDAvis.display(red_vis_data)

负向积极评论LDA分类可视化结果

4. 各城市评论数据比较

使用SnowNLP对9个地区的民宿评论分别打分，算出9个地区的平均分为：

爱彼迎民宿各地区情感均分

可以看到数据集中大部分的评论都是积极评论，各个地区的评论均分基本在0.8左右，其中成都的均分最高，为0.834，而广州的均分最低，为0.7864，我猜想这与城市的人文环境、城市设施以及用户的出行目的有关，成都、北京、重庆、南京、西安和杭州都有大量且著名的旅游景点，以旅行为出行目的的用户往往自身心情就会很好，所以更容易给出好评，而上海和广州作为现代化都市，以出差办公或是紧急事宜为出行目的的用户会相对较多，而在工作中的用户往往压力会更大，也就更容易给出差评，以上是我基于SnowNLP结果的初步推测，虽然各地区之间的均分相差并不大，但是由于数据量较大，所以这种0.05级别的均分差异也不能忽视。

为了进一步验证推论，防止是由于部分评论评分过低或过高造成差异，我将SnowNLP评分高于0.4的评论算为好评，将分数低于0.4的评论算为差评，观察每个地区的消极评论占比。

北京地区正向与负向评论数据占比情况上海地区正向与负向评论数据占比情况

重庆地区正向与负向评论数据占比情况广州地区正向与负向评论数据占比情况

杭州地区正向与负向评论数据占比情况南京地区正向与负向评论数据占比情况

成都地区正向与负向评论数据占比情况苏州地区正向与负向评论数据占比情况

西安地区正向与负向评论数据占比情况

通过这些饼图中的占比，我们可以看出，均分较低的省份消极评论确实会更多，所以评分中并不存在明显的分数极端化。

总结

通过爱彼迎民宿评论数据的分析结果可以看出，用户们喜欢民宿的原因主要有以下几点：

一、民宿地理位置好，交通便利或是位于景点周边，这主要是因为民宿基本位于居民区，周围往往会有地铁站、公交站等便民设施；

二、房间的装修风格和陈设符合用户审美，例如有的民宿包含投影仪，符合爱看电影的用户的爱好；

三、房间整洁干净，有温馨的氛围；四是房东热情贴心的服务。

而使民宿住户们留下差评的原因主要有以下几点：

一、民宿厕所不卫生或是房间有怪味；

二、民宿配套设施有不尽如人意的时候，比如洗澡没有热水、床单清洗不彻底等；

三、民宿具体位置不好找，对于带着大件行李的住户不友好；

四、民宿隔音效果差，小区环境不好，经常有噪音；

五、住户认为民宿性价比较低，不合心意。

你可能感兴趣的:(python,数据分析,jupyter)

如何用 Python 实现树结构不辉放弃 python 开发语言
一、树结构基础认知1.1树的四大特征层级关系：父子节点的从属关系唯一根节点：访问起点无循环：从根到叶的路径不形成环N叉分支：每个节点可有多个子节点1.2核心组件解析classTreeNode:def__init__(self,data):self.data=data#节点存储的数据self.children=[]#子节点容器（多叉树特性）defadd_child(self,node):self.c
Python 用户账户(让用户拥有自己的数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
Python 用户账户(让用户能够输入数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
安卓编译安装python_一文了解如何在安卓系统上安装Pydroid 3并进行编码 weixin_39916681 安卓编译安装python
由于Pydroid3集成开发环境(IDE)，因此可以用Python进行可移植的编码。Pydroid是Python3的极简解释器，可让您执行较小的项目并在Android设备上进行最少的编码。如果您还想在没有PC的任何地方学习Python编程，同时在Android上为Python复制PC平台，那么Pydroid3是一个不错的应用程序。无论您是Python编程的新手还是专家，让我们看看使用Pydroid
python为什么需要文本编辑器-推荐几款高效的Python文本编辑器| 高效的文本编辑器的特点是什么... weixin_39991305
我们都知道程序员花费大量的时间在编写、阅读和编辑代码上，因此一定要使用高效的文本编辑器才能够提高并很好的完成工作的效率和保证工作的质量。什么是高效的文本编辑器呢？除了自己用的得心应手外，小编认为还应该包含以下几个特点：·突出代码的结构，让你在编写代码时就能够发现常见的bug；·包含自动缩进功能；·显示代码长度的标志；·用于执行常见操作的快捷键；如果你是编程新手小白，小u非常建议你使用具备上述功能而
一文读懂Python列表（5）跟着杰哥学Python python
列表让你能够在一个地方存储成组的信息，其中可以只包含几个元素，也可以包含数百万个元素，列表是新手可直接使用的最强大的Python功能之一。一、列表是什么1.列表由按顺序排列的元素组成，用[]表示列表，用逗号分隔元素2.举例：bicycles=['trek','cannondale','redline','specialized']二、列表的索引1.第一个列表元素的索引为0，而不是12.举例：三、访
一文读懂Python异常（16）跟着杰哥学Python python
Python程序执行期间发生的错误叫做异常，如果你编写了处理异常的代码，程序将继续执行；如果未编写处理异常的代码，程序将停止，并返回一条traceback，其中包含异常的报告。通常使用try-except代码块来处理异常。一、try-except代码块1、如果try代码块的代码运行起来没问题，则跳过except代码块；如果try代码块的代码导致了错误，则运行except代码块。2、举例二、try-
一文读懂Python之random模块（31）跟着杰哥学Python python
random模块是Python的内置标准库，用于生成各类随机数，可以用作生成网站初始登录密码和随机验证码。一、random模块简介random模块可以生成随机数，包括随机整数、浮点数、随机元素等。二、random模块相关概念随机数：是指在一定范围内随机产生的数，每个数被选中的概率相等。随机数最重要的特性是其后产生的数与前面的数毫无关系，即随机性、不可预测性和不可重现性。三、random模块常用方法
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
应用-构建并优化 Python 的 Rust 扩展李星星BruceL 自动化测试 python rust 开发语言
目录构建并优化Python的Rust扩展如果你的Python代码运行速度不够快，你可以选择使用编译语言来编写更快的扩展。本文将重点介绍Rust，它具有以下优势：现代工具链，包括名为crates.io的包仓库和内置的构建工具（cargo）。出色的Python集成和工具支持。Rust的Python支持包是PyO3。对于打包，你可以使用setuptools-rust来与现有的setuptools项目集成
超详细Python教程——初识Python 月流霜 python 数据库服务器
初识Python温馨提示：2018年创建这个仓库的时候，关于Python语言基础这个部分的内容写得相对是比较粗糙，对粗学者可能不是那么友好。如果你正好是一名初学者，建议你移步到我的另一个仓库Python-for-Freshmen-2023，这个仓库对初学者更加友好，对应的内容，大家也可以在我的知乎专栏“从零开始学Python”中找到，点击进入传送门。Python简介Python的历史1989年圣诞
Python自制文本编辑器 Xiaoqing461 python 开发语言
Python自制文本编辑器。随便写的半成品fromtkinterimport*fromtkinterimportfiledialog,messageboxclassFindWindow:def__init__(self,parent):self.parent=parentself.find_window=Toplevel(parent)self.find_window.title("Find")s
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
python垃圾分类游戏_垃圾分类就要来了？教你使用Python轻松完成垃圾分类 weixin_39627390 python垃圾分类游戏
从7月1日起，上海市正式实施《上海市生活垃圾管理条例》。条例规定，个人混合投放垃圾今后可最高罚200元，单位混装混运，最高可罚至5万元，而且违规还将会列入征信，堪称“史上最严垃圾分类措施”。相信最近一段时间大家已经被上海的小伙伴们因为垃圾分类的困扰而刷屏了，就在大家还在一片“与我无瓜”中暗自庆幸时，现实给了我们一击：该来的总要来，谁都逃不过去。其实，在我国垃圾分类的举措要从2000年开始，但效果并
灰狼优化算法（Grey Wolf Optimization, GWO）及其 Python 代码追蜻蜓追累了算法 python github pycharm jupyter matlab numpy
灰狼优化算法（GreyWolfOptimization,GWO）是一种基于灰狼社会行为觅食过程而设计的优化算法。其基本原理是模拟灰狼群体中个体的协作和竞争行为，以迭代更新的方式寻找最优解。灰狼优化算法涉及三种灰狼的角色：alpha（α）、beta（β）和delta（δ），它们分别代表群体中的优势个体。算法包括初始化灰狼位置、计算适应度值、更新灰狼位置等步骤。以下是一个简单的Python示例代码，实
编译QT5.15.2 qtwebengine模块以支持mp4 m0_74822999 qt 开发语言
由于版权限制，Qt官方无法在其二进制包中提供某些解码器，这导致QtWebEngine无法支持一些常见的视频格式（如MP4）。为了解决这一问题，我们可以通过重新编译QtWebEngine来集成所需的解码器一、编译准备1.获取源码qtwebengine-everywhere-src-5.15.2.zip2.编译环境Python2.7.5:Python2.7.5Perl:StrawberryPerlfo
如何避免Bug跟踪系统混乱管理前沿运维人工智能大数据
流程规范化、工具集成化、沟通透明化。其中流程规范化通过明确每个环节的责任分工、标准化Bug报告和处理流程，有效减少混乱和重复劳动，确保Bug跟踪系统高效运转。企业通过数据分析发现，采用标准化流程后Bug处理效率可提升30%以上，这为软件质量控制提供了坚实保障。一、BUG跟踪系统的基本概念与重要性Bug跟踪系统是一种用于记录、管理和解决软件缺陷的工具和流程。它通过集中存储Bug报告、分类处理问题，并
Python多进程Logging ftpeak Python python linux 开发语言 logging
多个进程的logging向同一个.log文件写入是一套Python程序被多次启动时（多进程启动）无法回避的问题。一个进程的程序正在向.log文件写入的同时，另一个进行启动的程序也需要向同一个.log文件写入，会产生异常吗？答案是：会的！直接写入存在的问题如果多个进程直接使用Python的logging模块向同一个文件写入日志，可能会出现日志内容混乱、数据丢失等问题。这是因为多个进程同时访问和修改文
Tenacity（Python的坚韧重试库） ftpeak Python python 开发语言网络爬虫
概述Tenacity是一个基于Apache2.0协议的通用重试库，用Python编写，旨在简化向任何代码添加重试逻辑的过程。它起源于已停止维护的retrying库的分叉版本。Tenacity不兼容retrying的API，但新增了大量功能并修复了长期存在的错误。文档：Tenacity—Tenacitydocumentation主页：https://github.com/jd/tenacity核心功
Pyhton安装PyQT6 三口一个桃 python pyqt
Windows系统使用CMD命令安装，对于系统中有多个版本python的，在安装pyqt6/pyqt5时需要针对每个python版本单独安装。安装准备过程：①Win+R打开CMD命令行窗口②输入命令：python--version查看当前python版本是否是自己需要安装pyqt6/5的的版本，若是则执行第③步，若不是则执行下述操作：打开电脑环境变量设置(自行百度)--点击系统变量中的Path项-
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
WHAM 人体3d重建部署笔记 AI算法网奇深度学习宝典 3d 笔记
目录依赖项：mmpose的依赖项：demo脚本WHAM:ReconstructingWorld-groundedHumanswithAccurate3DMotion2024依赖项：pipinstallmmposemmpose的依赖项：mmcv>=2.0.0,=3.0.0,=0.4.0,<1.0.0demo脚本Youcantrywithoneexamplarvideo:pythondemo.py--
探索未来技术前沿：FastAPI火箭-boilerplate，打造高性能API的超级引擎！黎杉娜Torrent
探索未来技术前沿：FastAPI火箭-boilerplate，打造高性能API的超级引擎！fastapi-rocket-boilerplateFastAPIRocketBoilerplatetobuildanAPIbasedinPythonwithitsmostmoderntechnologies!项目地址:https://gitcode.com/gh_mirrors/fa/fastapi-roc
Python Flask教程 cunchi4221 python java web ajax vue ViewUI
WelcometoPythonFlasktutorial.Inpreviouslessonwehavelearntaboutpythonlambda.PythonflaskisanAPIthathelpsustobuildwebbasedapplicationinpython.Let’sgetstartedwithpythonflasktutorialforbeginnersnow.欢迎使用Pyt
python --桌面开发pyqt安装（mac 环境） Xiao_Qiang_ python
纪录下，在安装pyqt的时候花了些时间，现在纪录下参考http://www.noktec.be/python/how-to-install-pyqt4-on-osx步骤DownloadtheSIPpackage(snapshotforOSx)DownloadthePyQtpackage(snapshotforOSx)DownloadQtInstallQtInstallSIPInstallPyQta
python flask 使用教程快速搭建一个 Web 应用莫忘初心丶 python flask 前端
目录一、Flask简介二、Flask安装三、创建一个简单的Flask应用四、Flask路由与视图五、接收和处理用户输入六、模板引擎Jinja2七、Flask与数据库八、总结一、Flask简介Flask是一个轻量级的PythonWeb框架，旨在帮助开发者快速搭建Web应用。相比于Django等重量级框架，Flask更加简洁和灵活，非常适合用于小型Web项目的开发，甚至可以用于构建RESTfulAPI
深入理解Python闭包与递归：原理、应用与实践 Multiple-ji python 开发语言
目录闭包什么是闭包：闭包的基本结构：实现闭包的条件：1.嵌套函数2.内函数引用外部函数的变量3.外部函数返回内部函数4.外部函数已经执行完毕递归函数什么是递归函数：递归函数条件1.必须有个明确的结束条件———递归出口2.每进行更深一步的递归，问题规模相比上一次递归都要有所减少3.相邻两次重复之间有紧密联系分析一下这段代码1.函数定义：2.基准条件（BaseCase）3.递归条件（Recursive
【python】11. 输入输出 lmk565 python 开发语言
11.输入输出Python两种输出值的方式:表达式语句和print()函数。第三种方式是使用文件对象的write()方法，标准输出文件可以用sys.stdout引用。如果你希望输出的形式更加多样，可以使用str.format()函数来格式化输出值。如果你希望将输出的值转成字符串，可以使用repr()或str()函数来实现。str()：函数返回一个用户易读的表达形式。repr()：产生一个解释器易读
使用Python和Django构建支持多语言的博客网站程序员～小强 python django sqlite
随着互联网的发展,博客已经成为人们获取信息和分享想法的重要平台。但是不同国家和地区的用户语言各异,这给博客的国际化带来了挑战。本文将介绍如何使用Python和Django这两个强大的Web开发框架,来构建一个支持多语言的博客网站。Django框架概述Django是一个开源的Web应用框架,由Python写成。它鼓励快速开发和干净的设计。通过提供大量常用组件,Django可以更快地构建高质量的Web
python pip及常用国内镜像源 sunny05296 python python pip 开发语言
pip常用国内镜像源pip默认从国外的python下载会很慢，建议使用一些国内的镜像源，常用的国内镜像源如下：#清华镜像源https://pypi.tuna.tsinghua.edu.cn/simple#中科大镜像源https://pypi.mirrors.ustc.edu.cn/simple#阿里云镜像源https://mirrors.aliyun.com/pypi/simplepip安装组件时
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

基于出行住宿评论数据的情感分析研究（民宿篇，含python代码）

文章目录

研究背景

研究意义

一、数据集介绍

二、数据预处理

1.引入库

2. 合并生成总数据

3. 剔除无价值数据

三、爱彼迎民宿数据的数据分析

1. 爱彼迎数据分析具体步骤

1.1 分词并用SnowNLP进行初步分析

1.2 词性标注

四、情感数据分析和预测

1. LinearSVC模型预测情感

优化处理 向下采样

2. 自定义情感倾向分析模型

3. 使用LDA主题分类模型进行数据分析

4. 各城市评论数据比较

总结

你可能感兴趣的:(python,数据分析,jupyter)

优化处理向下采样