一只会疼人的猫

情感文本分析数据集处理和预测---K-lab平台预选赛

比赛网址：K-lab平台2019中国高校计算机大赛---大数据挑战赛

预选赛题

预选赛题——文本情感分类模型

本预选赛要求选手建立文本情感分类模型，选手用训练好的模型对测试集中的文本情感进行预测，判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测，达到或超过规定的分数线即通过预选赛。

比赛数据

数据样本格式：

NO	列名	类型	字段描述
1	ID	int	文本唯一标识
2	review	string	文本记录
3	label	string	文本的情感状态

其中，训练集的样本规模为6328，测试集的样本规模为2712。

提交结果

选手提交.csv的结果文件，文件名可以自定义，但文件内的字段需要对应。其中，ID表示文本唯一标识，pred表示预测该条文本的情感状态是否为「Positive」。

结果文件的内容示例：

ID	Pred
1	0.123456
2	0.654321
3	0.799212

代码分为五部分：

导入数据、清洗数据、观察数据、建立模型、预测数据；

导入数据

首先导入包：

import re
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import seaborn as sns
import string
import nltk

导入数据：

i = "this"
trainTrue = pd.read_csv('E:\kLab_File\\mase\\train.csv',engine = 'python')
train = trainTrue.copy()

testTrue = pd.read_csv('E:\kLab_File\mase\\test.csv')
test = testTrue.copy()

查看导入的数据：

print(train.head(10))

可以看到，数据包含三列，ID、review和label，review包含了我们需要清理的评论内容，label是根据review判断出改评论的态度
看了头部数据之后，我们大概可以开始清理数据了，清理大概可以从下面几个方面入手：

我们发现label中这一列只有positive和negative两种，我们可以进行数字化，方便以后进行信息的分析和计算。
@xxxx这个标签没有任何实际意义。
我们也考虑去掉标点符号，数字甚至特殊字符，他们也对区分不同的评论起不到任何作用。
大多数太短的词起不到什么作用，比如‘pdx’，‘his’，‘all’。所以我们也把这些词去掉。
执行完上述三步之后，我们就可以把每一条评论切分成独立的单词或者符号了，这在所有NLP任务中都是必须的一步。
在第四个数据中，有一个单词‘love’.与此同时，在余下的语料中我们可能会有更多的单词，例如loves，loving，lovable等等。这些词其实都是一个词。如果我们能把这些词都归到它们的根源上，也就是都转换成love，那么我们就可以大大降低不同单词的数量，而不会损失太多信息。

清洗数据

数据化label列，方便以后进行数据的分析

train['label'] = train['label'].replace(to_replace=['Positive', 'Negative'], value=[1, 0])

我们后面要用test进行预测，所以我们text也要进行相同的数据处理、数据清理。

删除@xxxx

下面是一个自定义的方法，用于正则匹配删除文本中不想要的内容。它需要两个参数，一个是原始文本，一个是正则规则。这个方法的返回值是原始字符串清除匹配内容后剩下的字符。在我们的实验中，我们将使用这个方法来去除@xxx标记


# 删除@  
combi =  train.copy()
def remove_pattern(input_txt,pattern):
    r = re.findall(pattern,input_txt)
    for i in r:
        input_txt = re.sub(i,'',input_txt)
    
    return input_txt

这里我推荐大家把训练集和测试集并在一起清洗，这样方便一点

combi = train.append(test, ignore_index=True)

当然博主没有并在一起处理，所以对数据的每一步操作，测试集做一次处理，训练集在做一次处理。

combi['review'] = np.vectorize(remove_pattern)(combi['review'],"@[\w]*")
test['review'] = np.vectorize(remove_pattern)(test['review'],"@[\w]*")

除标点符号，数字和特殊字符

combi['review'] = combi['review'].str.replace("[^a-zA-Z#]"," ")
test['review'] = test['review'].str.replace("[^a-zA-Z#]"," ")

空格删除

把评论的空格前缀都删除

combi['review'] = combi['review'].str.strip()

统计每列数据缺失值的分布情况

print(combi.isnull().sum())

我们发现数据中有6行拥有缺失值的，由于拥有缺失值的行数比较少，所以我们选择直接删除这六行；

删除缺失值行

combi.dropna(axis=0, how='any', thresh=None, subset=None, inplace=True)   #去除含有缺失值的一行

删除以后我们查看一下数据

print(combi.isnull().sum())

已经删除了缺失的6行

移除短单词

这里要注意到底多长的单词应该移除掉。我的选择是小于三的都去掉。例如hmm，oh，hi这样的都没啥用，删掉这些内容好一些

combi['review'] = combi['review'].apply(lambda x: ' '.join([w for w in x.split() if len(w)>3]).lower())
test['review'] = test['review'].apply(lambda x: ' '.join([w for w in x.split() if len(w)>3]).lower())

分词、符号化

tokenized_review = combi['review'].apply(lambda x: x.split())
tokenized_review_test =  test['review'].apply(lambda x: x.split())
print(tokenized_review.head())

提取词干

提取词干说的是基于规则从单词中去除后缀的过程。例如，play，player，played，plays，playing都是play的变种。

from nltk.stem.porter import *

stemmer =PorterStemmer()
tokenized_review = tokenized_review.apply(lambda x: [stemmer.stem(i) for i in x]) #stemming
tokenized_review_test = tokenized_review_test.apply(lambda x: [stemmer.stem(i) for i in x]) #stemming

print(tokenized_review.head())

分词复原

把符号化的词语重新拼回去，这里我们使用最笨的方法就是遍历拼写回去；

这里在自然语言处理库nltk没有改版时时可以只用nltk的MosesDetokenizer方法很容易做到，但是更改之后官网时把nltk中的MosesDetokenizer方法删除了的，好像是为了处理兼容性的问题。

tokenized_review = tokenized_review.apply(lambda x: ' '.join([w for w in x]))
tokenized_review_test = tokenized_review_test.apply(lambda x: ' '.join([w for w in x]))

print("head2",tokenized_review.head(10))
test.to_csv('E:\kLab_File\\mase\\testtest0.1.csv',index=False)

观察数据（其实这一步我们可以不用详细的观察，因为在此次数据处理中我们的数据都是经过脱敏的，单词非英语单词，所以句子一般读不懂。但是你也可以看一看）

数据集中最常见的单词有哪些？
数据集上表述积极和消极的常见词汇有哪些？
评论一般有多少主题标签？
我的数据集跟哪些趋势相关？
哪些趋势跟情绪相关？他们和情绪是吻合的吗？

使用词云来了解评论中最常用的词汇

现在，我想了解一下定义的情感在给定的数据集上是如何分布的。一种方法是画出词云来了解单词分布。
词云指的是一种用单词绘制的图像。出现频率越高的词在图案中越大，出现频率越低的词在图案中越小。
下面就来绘制基于我们的数据的词云图像。

总的词云：

#使用 词云 来了解评论中最常用的词汇
all_words = ' '.join([text for text in combi['review']])
from wordcloud import WordCloud
wordcloud = WordCloud(width=800, height=500, random_state=21, max_font_size=110).generate(all_words)

plt.figure(figsize=(10, 7))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis('off')
plt.show()

积极评论的词云：

# 积极数据
positive_words =' '.join([text for text in combi['review'][combi['label'] == 0]])

wordcloud = WordCloud(width=800, height=500, random_state=21, max_font_size=110).generate(positive_words)
plt.figure(figsize=(10, 7))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis('off')
plt.show()

消极评论的词云：

# 消极数据
negative_words = ' '.join([text for text in combi['review'][combi['label'] == 1]])

wordcloud = WordCloud(width=800, height=500,
random_state=21, max_font_size=110).generate(negative_words)
plt.figure(figsize=(10, 7))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis('off')
plt.show()

我们存下所有主题标签，并分成两类，一类是积极内容中的标签，一类是带有消极内容中的标签。

#love #hate 这种标签

写一个方法用来剥离标签

def hashtag_extract(x):
    hashtags = []
    # Loop over the words in the tweet
    for i in x:
        ht = re.findall(r"#(\w+)", i)
        hashtags.append(ht)

    return hashtags

用剥离标签的方法剥离标签并放到相应的数组中；

# extracting hashtags from non racist/sexist tweets
HT_positive = hashtag_extract(combi['review'][combi['label'] == 0])

# extracting hashtags from racist/sexist tweets
HT_negative = hashtag_extract(combi['review'][combi['label'] == 1])

# unnesting list
HT_positive = sum(HT_positive,[])
HT_negative = sum(HT_negative,[])

画出标签：

# 画积极标签
a = nltk.FreqDist(HT_positive)
d = pd.DataFrame({'Hashtag': list(a.keys()),'Count': list(a.values())})
# selecting top 10 most frequent hashtags     
d = d.nlargest(columns="Count", n = 10)     #前十
plt.figure(figsize=(16,5))
ax = sns.barplot(data=d, x= "Hashtag", y = "Count")
ax.set(ylabel = 'Count')
plt.show()

画出消极标签

# 画消极标签
b = nltk.FreqDist(HT_negative)
e = pd.DataFrame({'Hashtag': list(b.keys()),'Count': list(b.values())})
# selecting top 10 most frequent hashtags
e = e.nlargest(columns="Count", n = 10)   
plt.figure(figsize=(16,5))
ax = sns.barplot(data=e, x= "Hashtag", y = "Count")
ax.set(ylabel = 'Count')
plt.show()

建立模型

要分析清洗后的数据，就要把它们转换成特征。根据用途来说，文本特征可以使用很多种算法来转换。比如词袋模型（Bag-Of-Words），TF-IDF,word Embeddings之类的方法。
在本文中，我使用了Bag-Of-Words和TF-IDF两个方法。

词袋特征

Bag-Of-Words是一种数字化表达特征的方式。假设有一个语料集合C，其中有D篇文章（d1，d2，...dD），在C中有N个不重复的符号。那么这N个符号（即单词）构成一个列表，那么词袋模型的矩阵M的大小就是D*N.M中的每一行记录了一篇文章D(i)中对应符号的词频。

让我们用一个简单的例子来加强理解。假设我们只有两篇文章
D1: He is a lazy boy. She is also lazy.

D2: Smith is a lazy person.
构建包含所有去重单词的list
= [‘He’,’She’,’lazy’,’boy’,’Smith’,’person’]
那么，在这个语料C上，D=2，N=6
词袋模型的矩阵M的大小就是2*6

矩阵

现在，这个矩阵就可以作为特征矩阵来构建一个分类模型了。
使用sklearn的CountVectorizer方法可以轻松的构建词袋模型。

建立词袋模型

这里建议大家的磁带模型是用测试集数据和训练集数据建立的，可以增加后续的准确率。
设置参数max_features = 8200 ，只取词频前8200的词，当我去掉超过30%的无用词时，还剩下8200个。

我感觉词频越高，后面的准确度越高。所以这里打击根据自己的数据需求更改自己的max_features；

#构建词袋模型
from sklearn.feature_extraction.text import CountVectorizer
bow_vectorizer = CountVectorizer(max_df=0.30, max_features=8200, stop_words='english')

bow = bow_vectorizer.fit_transform(combi['review'])
bowtest = bow_vectorizer.fit_transform(test['review'])
print(test.describe())

print(bow.toarray())

根据词袋模型运用逻辑回归来构建模型

# 逻辑回归来构建模型

# 使用词袋模型特征集合构建模型
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import f1_score
train_bow = bow[:6331,:]
test_bow = bowtest[:2712,:]
print("这里",test_bow.toarray())

划分测试集合训练集,测试集占30%

xtrain_bow, xvalid_bow, ytrain, yvalid = train_test_split(train_bow, combi['label'], random_state=42, test_size=0.3)

逻辑回归

lreg = LogisticRegression()
lreg.fit(xtrain_bow, ytrain) 

prediction = lreg.predict_proba(xvalid_bow) # predicting on the validation set
prediction_int = prediction[:,1] >= 0.3
prediction_int = prediction_int.astype(np.int)
print("回归f",f1_score(yvalid, prediction_int)) # calculating f1 score

F1分数（F1 Score），是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。F1分数可以看作是模型准确率和召回率的一种加权平均，它的最大值是1，最小值是0。

这里可以通过调各种数据来提高模型的f1分数

预测数据

模型来预测测试集数据。

test_pred = lreg.predict_proba(test_bow)
print("这里P:",test_pred)

看一下传入的test数据经过模型预测的数据；

print(test_pred.size)
test_pred_int = test_pred[:,1]    //提取我们需要预测的test的label列
print(test_pred_int.size)    //看看进过模型预测后的长度是否有变化

print(pd.DataFrame(test,columns=["ID"]).size)     //看看原始test的数据列有多少

第二行和第三行要相同，不然会出现填写行数与预测行数不匹配的问题；

最后只剩下保存数据了

test['Pred'] = test_pred_int
submission = test[['ID','Pred']]
submission.to_csv('E:\kLab_File\\mase\\result.csv', index=False) # writing data to a CSV file

TF-IDF特征

这个方法也是基于词频的。但是它跟词袋模型还有一些区别，主要是它还考虑了一个单词在整个语料库上的情况而不是单一文章里的情况。
TF-IDF方法会对常用的单词做惩罚，降低它们的权重。同时对于某些在整个数据集上出现较少，但是在部分文章中表现较好的词给予了较高的权重。
来深入了解一下TF-IDF：

TF = 单词t在一个文档中出现的次数 / 文档中全部单词的数目
IDF = log(N/n)，N是全部文档数目，n是单词t出现的文档数目
TF-IDF = TF*IDF

这里我就不深入了。

sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
【高中数学/三角函数/判别式法求极值】已知：实数a,b满足a^2/4-b^2=1 求：3a^2+2ab的最小值普兰店拉马努金高中数学之三角函数高中数学三角函数判别式
【问题】已知：实数a,b满足a^2/4-b^2=1求：3a^2+2ab的最小值【来源】App"网易新闻"中up主“我服子佩”的数学视频专辑，据其称是北京市某年的竞赛题。【解答】由a^2/4-b^2=1，联想到secθ^2-tanθ^2=1故设a/2=1/cosθ,b=sinθ/cosθ将a=2/cosθ,b=sinθ/cosθ代入3a^2+2ab得f(θ)=(12+4sinθ)/(1-sinθ^2
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
平昌冬奥，人生竞赛不要给对手和裁判任何机会小猫_003e
如火如荼的平昌冬奥会拉下了帷幕，但是自从某年的伦敦奥运会之后，我们中国队自从好像就“最爱干犯规的事儿”。2月20日，短道速滑女子3000米接力赛，可以说是相当令人痛心了。比赛中，韩国队交接棒失误“扑街”，阻拦了加拿大队，带来的连锁反应也影响了中国队。中国队以微弱劣势落后韩国队，第二个冲线！韩国队这次失误犯规那么明显，应该唱费玉清的我送你离开千里之外。但···最终赛场上裁判宣布：韩国队冠军，中国队、
不跑马拉松的四个理由杨然谦
过去十年，马拉松受到了许多人的欢迎。光是2018年，就有456,700名美国人完成了马拉松，参与率较2008年增加了10%。人们认为参与这场42公里的竞赛以及对应的训练，会对心脏造成不利影响。例如造成动脉硬化以及炎症等。过度的跑步会让皮质醇(又叫压力激素)水平长期升高，导致体重增加、疲劳以及免疫力下降等。现在有许多人将马拉松爱好者视为“最高身体素质所有者”，他们有着精瘦的体格，较低的心率，承受着非
VLSI电路单元的自动布局：全局布局基础介绍 Jaaiko 数学建模算法开源图论 matlab
2024年华数杯全国大学生数学建模竞赛B题为：VLSI电路单元的自动布局。本题主要关注的是全局布局问题。学术界针对全局布局的评估模型和优化方法的研究历史悠久。本文借题顺势介绍全局布局的一些重点基础内容和相关工具/资料，以期为对EDA算法设计领域感兴趣、对数学建模感兴趣的人降低研究门槛。VLSI是超大规模集成电路的简称。完成一个VLSI设计的流程十分复杂，包含多种数据格式的转化，其中将逻辑网表转变为
扬长避短，重拾微课录制王焱_铁文
几年前刚开始有微课时我给别人做了不少，有一些还获得了省市级的奖励。但为自己做的却很少，仅有的几次也是为了就付检查，或是有人听课。后来微课逐渐淡出了“竞赛”的要求，做得也就少了，这次新网师“极简移动微课”的作业是录制1分钟以内的微课……我做的是小学绘图软件中“曲线工具的使用”一课的微课，做完了感觉挺好，忽然有个念头把信息课的操作都制成视频放网上供学生学习不是更好，尤其是现在疫情促成了线上教学，对丰富
【2023年】云计算金砖牛刀小试3 geekgold 云计算 linux 运维容器 kubernetes 云原生
A场次题目：OpenStack平台部署与运维业务场景：某企业拟使用OpenStack搭建一个企业云平台，用于部署各类企业应用对外对内服务。云平台可实现IT资源池化，弹性分配，集中管理，性能优化以及统一安全认证等。系统结构如下图：企业云平台的搭建使用竞赛平台提供的两台云服务器，配置如下表：设备名称主机名接口ip地址云服务器1controllereth0，eth1私网：192.168.100.10/2
【2023年】云计算金砖牛刀小试2 geekgold 云计算运维容器 jenkins kubernetes devops docker
A场次题目：Openstack平台部署与运维control172.17.31.10compute172.17.31.20compute任务1私有云平台环境初始化1.初始化操作系统使用提供的用户名密码，登录竞赛云平台。根据表1中的IP地址规划，设置各服务器节点的IP地址，确保网络正常通信，设置控制节点主机名为Controller，计算节点主机名为Compute，并修改hosts文件将IP地址映射为主
「中国奥数国家队夺冠」数学虐我千百遍，我待数学如初恋 d35156f6a0a9
宇宙之大，粒子之微，火箭之速，化工之巧，地球之变，生物之谜，日用之繁，无处不用数学。2019年国际数学奥林匹克竞赛结果在英国巴斯出炉，中国队时隔4年后重登冠军宝座，以227分的总成绩与美国队并列世界第一，中国队全体队员获得金牌。这是一份迟来，但却令人骄傲的成绩单。这里附上前20名国家与地区成绩及排名IMO官网中国队6名成员个人成绩作为国际最高水平的数学竞赛，IMO一向以题目出其不意，选拔过程以严苛
数学建模笔记——动态规划 liangbm3 数学建模笔记数学建模笔记动态规划 python 背包问题算法优化问题
数学建模笔记——动态规划动态规划1.模型原理2.典型例题2.1例1凑硬币2.2例2背包问题3.python代码实现3.1例13.2例2动态规划1.模型原理动态规划是运筹学的一个分支，通常用来解决多阶段决策过程最优化问题。动态规划的基本想法就是将原问题转换为一系列相互联系的子问题，然后通过逐层地推来求得最后的解。目前，动态规划常常出现在各类计算机算法竞赛或者程序员笔试面试中，在数学建模中出现的相对较
leetcode 1811 寻找面试候选人(postgresql) 奋斗哼哼 leetcode 面试 postgresql 数据库 sql
需求表:Contests±-------------±-----+|ColumnName|Type|±-------------±-----+|contest_id|int||gold_medal|int||silver_medal|int||bronze_medal|int|±-------------±-----+contest_id是该表的主键.该表包含LeetCode竞赛的ID和该场比赛中
A类竞赛-保研-打比赛-机器人及人工智能大赛土豆打工仔机器人人工智能考研
大赛简介中国机器人及人工智能大赛属于全国高校学科竞赛A类赛事，由中国人工智能学会、教育部高等学校计算机课程教学指导委员会联合主办，旨在引导和激励广大青年学生弘扬创新精神，搭建良好的科技创新赛事平台，助力人工智能、机器人产业发展，推动“人工智能+”“机器人+”新经济产业体系建设，积极推动广大学生参与机器人、人工智能科技创新实践，通过竞赛培养出一批爱创新、会动手、能协作、勇于拼搏的科技精英人才。大赛内
王莹|我的新老师《蓝田县灞源镇学生习作》乡土蓝田
我的新老师王莹我的新老师，是一位退伍军人，大概六十多岁。他的个子不高，长着一个国字脸，国字脸上镶嵌着一双炯炯有神的大眼睛，一个能说会道的嘴巴，黑黑的眉毛，鼻子大大的。在暑假培训课堂上，他讲述了他的故事：他在小学五年级就开始自学初中的内容，在自学的过程中，遇到了一个个难题，他都一个个解开了。果然，功夫不负有心人，蓝田县举办了一次数学竞赛，大约有300多个学生参加。当公布成绩时，他以82分取得了第一名
突破自己的枷锁人生如梦001
过往的经历正在将我们固化，包括我们的长相、穿着、性格、行为、能力等等，在别人的眼中都成为一个特定的样子。从而，我们应该说什么话做什么事都有了别人眼中特定的模式。比如某人是老师和同学眼中的标准好学生，生性沉稳，学习努力，成绩优秀，从不参与跟学习无关的事情。那么跟学习相关的事情竞赛啊讲解习题啊，大家肯定都会去找他，但是嬉笑打闹等娱乐活动想必不是他应该干的事情。再比如公司的一个优秀员工，他工作勤勤恳恳，
网络攻防WEB入门指南 youhao108 网络攻防 web 渗透测试网络安全网络攻防
网络攻防WEB入门指南（大佬绕路）文章目录前言学习网络攻防该如何入门前言我对网络攻防的理解，分为比赛和实战两个部分，两者所学习的知识虽有共通之处，但还是有很大区别，我也在向实战的状态转换，不过二者入门所要掌握的知识差别不大。下面主要从网络攻防竞赛角度，也就是知名的CTF夺旗赛，来谈谈网络攻防知识如何入门。学习网络攻防该如何入门常规CTF比赛主要分为线上做题，以及线下AWD攻防（AttackWith
CTF 竞赛密码学方向学习路径规划 David Max CTF 学习笔记密码学 ctf 信息安全
目录计算机科学基础计算机科学概念的引入、兴趣的引导开发环境的配置与常用工具的安装WattToolkit（Steam++）、机场代理Scoop（Windows用户可选）常用Python库SageMathLinux小工具yafuOpenSSLMarkdown编程基础Python其他编程语言、算法与数据结构（可选）数学基础离散数学与抽象代数复杂性分析密码学的正式学习兴趣的培养做题小技巧系统学习需要了解并
【墨客唐人】人生是一场漫长竞赛墨客唐人
你笑起来很好看心情再差，都不要迁怒他人，没有谁就该让着你，喜怒哀乐每天都会上演，控制好自己的脾气，别对身边的人动怒。你过得好不好，是你努力的结果，日子再穷，都不要对谁乞求，放低尊严换来的财富，不是幸福，只会让自己低人一等。没有人就该帮你，谁不是辛辛苦苦奋斗。这个世界，没有谁就该让着你，能让着你惯着你的只有你的父母。一次回首，也许就是一生的惦念，一生的守候；一个转身，也许就是一世的伤痛，一世的错过；
【全网最全】2024年第五届“华数杯”全国大学生数学建模竞赛完整思路解析+代码+论文 Tina表姐数学建模
我是Tina表姐，毕业于中国人民大学，对数学建模的热爱让我在这一领域深耕多年。我的建模思路已经帮助了百余位学习者和参赛者在数学建模的道路上取得了显著的进步和成就。现在，我将这份宝贵的经验和知识凝练成一份全面的解题思路与代码论文集合，专为本次赛题设计，旨在帮助您深入理解数学建模的每一个环节。2024年第五届“华数杯”全国大学生数学建模竞赛完整内容可以在文章末尾领取！下文包含：2024年第五届“华数杯
2024 年高教社杯全国大学生数学建模竞赛B题第一问详细解题思路（终版）柒墨轩数学建模 python
示例代码：fromscipy.statsimportnorm#定义参数p0=0.10#标称次品率alpha=0.05#95%信度下的显著性水平beta=0.10#90%信度下的显著性水平E=0.01#允许的误差范围#计算95%信度下的样本量Z_alpha_2=norm.ppf(1-alpha/2)n_95=((Z_alpha_2*(p0*(1-p0))**0.5)/E)**2#计算90%信度下的样
【笔试题汇总】华为春招笔试题题解 2024-3-20 PXM的算法星球大厂面试题华为面试数据结构算法
这里是paoxiaomo，一个现役ACMer，之后将会持续更新算法笔记系列以及笔试题题解系列本文章面向想打ICPC/蓝桥杯/天梯赛等程序设计竞赛，以及各个大厂笔试的选手感谢大家的订阅➕和喜欢有什么想看的算法专题可以私信博主（本文题面由清隆学长收集）01.K小姐的魔法药水问题描述K小姐是一位魔法师，她最近在研究一种神奇的魔法药水。这种药水由一系列魔法材料制成，每种材料都有一个正整数的魔法值。K小姐按
投票竞赛技巧大揭秘：如何快速增加票数，领先一步口碑信息传播者
在投票竞赛中，快速增加票数是每个参赛者都希望实现的目标。除了个人努力外，借助人工团队的帮助可以更高效地拉票。以下是一些技巧和策略，可以帮助你在投票竞赛中快速增加票数。组建人工团队：招募一些志愿者或朋友，组成一个人工团队，共同协作拉票。人工团队可以帮助你扩大影响力，提高曝光度，并且能够在短时间内快速增加票数。利用社交媒体：利用社交媒体平台，如微信、微博、QQ空间、Facebook等，发布投票链接和相
在人间品尝生活圣海乾坤
三年前，一阵爽朗的节奏，带我进入最好的高中。三年后，一次全市的摸底，带我品尝人间的忧愁。我曾经纸醉金迷，花天酒地，心中相信最终的奇迹。竞赛的滑铁卢打醒了我，让我知道，岁月蹉跎。我在人间品尝生活。我妄想亡羊补牢，绝地重生，为了继续那童心未泯的梦，但眼前斜阳残血，薄暮冥冥，我的努力卓有成效，但还是乌有。我确实变强了，也沧桑了，沉默了，但我还没承认，我失败了。济南市第一次高考模拟考试啊，你好！谢谢你否认
【数据获取与读取】JSON & CSV yogurt=b 数据分析 json python
数据分析流程获取数据-读取数据-评估数据-清洗数据-整理数据-分析数据-可视化数据公开数据集飞桨（百度旗下深度学习平台）数据集：https:/aistudio.baidu.com/aistudio/datasetoverview天池（阿里云旗下开发者竞赛平台）:https:/tianchiaiyun.com/dataset/和鲸社区（数据科学开源社区）数据集：htps://www.heywhale
2023-06-25 马亚豪246
最近一次旅行分享#文史新知竞赛####X8P5zOR9Olc1hvX##X8P5zOR9Olc1hvX##PAGE孔夫子说过，子不语怪力乱神，子路问死，未知生，子曰焉知死，敢问事鬼，子曰未能事人，焉能事鬼，礼运·大同与小康篇》原文如下：昔者，仲尼与于蜡宾事毕，出游于观之上，喟然而叹。仲尼之叹，盖叹鲁也。言偃在侧，曰：“君子何叹？”孔子曰：“大道之行也，与三代之英，丘未之逮也，而有志焉。”#你家吃甜
第九届中国大学生程序设计竞赛（秦皇岛）-（CCPC2023-Qinhuangdao F - 质数之谜(DP) szy10010 算法 c++动态规划
题意给定一个序列,修改最少数量的元素使得任意i属于[1,n-1],q[i]+q[i+1]都为质数,输出最小修改次数思路首先手玩的过程中可以发现,如果因为前面一个数字和自己相加不是质数然后我把自己变成了奇数,那么如果我后面一个数字是偶数可以发现自己肯定能找到另一个奇数使得和前面相加互质并且和后面相加也互质举个例子:假设为2810,我此时是8,我发现2+8不是质数把自己改为5,但是5+10不是质数,但
2024 年华数杯全国大学生数学建模竞赛题目A题：确保机械臂末端能够准确到达目标位置，最大限度降低能耗和外部干扰力对运动精度的影响。赛题思路代码解析（附结果展示和python代码） DISCrete_28 数学建模 python 开发语言
A题机器臂关节角路径的优化设计机器臂是一种由多个连杆和关节组成的自动化装置，广泛应用于工业生产、精密操作、危险环境作业和物流等领域。其主要作用包括提高生产效率、执行精密操作、适应恶劣环境以及优化物流流程。当前有关机器臂的研究重点包括运动学与动力学建模、关节角路径的优化设计以及路径规划等。这些研究旨在提升机器臂的性能和应用范围，确保其在各种复杂任务中的高效性和精确性。其中，关节角路径的优化设计尤为重
高教社杯数模竞赛特辑论文篇-2016年D题：风电场运行状况分析及优化研究（附MATLAB代码实现）格图素书大数据竞赛赛题解析 matlab 大数据开发语言
目录摘要1问题的提出1.1问题背景1.2问题重述2问题的分析2.1预备知识2.2.问题的分析3模型的假设与符号说明3.1模型的假设3.2符号说明4模型的建立与求解4.1问题一的模型建立与求解4.1.1风能资源评估4.1.2风能利用情况评估4.2问题二的模型建立与求解4.2.1定性分析4.2.2定量分析4.3问题三的模型建立与求解4.3.1任务分析4.3.2整数规划模型4.3.3模型的优化5误差的分
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR