探索者up

新闻分类作业

一、资料与方法

1.数据整理

2.加载数据

3.数据预处理

3.1文本数据

3.2缺失值处理

3.3重复值处理

3.4文本内容清洗

3.5分词

3.6停用词处理

4.数据可视化分析

4.1类别数量分布

4.2词汇统计

5文本向量化

5.1词袋模型

5.2TF-IDF

二、实验与结果

1.构建训练集与测试集

2.特征选择

2.1特征选择-方差分析

3.分类模型评估

4.逻辑回归

5.KNN

6.决策树

7.多层感知器

8.朴素贝叶斯

三、讨论

3.1讨论准确率

3.2讨论F1-score

3.2.1财经

3.2.2房产

3.2.3教育

3.2.4科技

3.2.5军事

3.2.6汽车

3.2.7体育

3.2.8综合体育最新

3.2.9游戏

3.2.10娱乐

3.2.11体育焦点

3.3整体讨论

实验环境：在anaconda中的jupyter notebook编写

摘要：

一、在资料与方法中，主要内容有数据整理、加载数据、文本预处理（缺失值处理、重复值处理、文本内容清洗、分词、停用词处理）、数据可视化。

二、在实验与结果中，主要内容有构建训练集与测试集、特征选择、分类模型评估、逻辑回归、KNN、决策树、多层感知器、朴素贝叶斯。

三、在讨论中，主要根据5中分类模型：逻辑回归、KNN、决策树、多层感知器、朴素贝叶斯，进行对比。其主要内容有，讨论准确率、在每个领域都列表对比F1-score，整体讨论。通过实验发现多层感知器在整个新闻文本分类中较好，朴素贝叶斯在我这个数据集中相对较差。

一、资料与方法

1.数据整理

原始数据以及整理好的数据，还有项目源代码，在链接中自取：

链接：https://pan.baidu.com/s/11JHzlWxddUsPVEZev-9Hrw
提取码：1234

原始数据中，共有9个sheet，分别为财经、房产、教育、科技、军事、汽车、体育、游戏、娱乐。第一步，新建一个excel表格，分别将这9个sheet数据复制到新建的new.xlsx表格中，这样可以将9个sheet数据，合并为一个sheet数据。第二步，将新建好的数据另存为csv格式。第三步，利用editplus编辑工具，将gbk格式的文本转化为utf-8格式。此时原始数据整理完毕。

2.加载数据

使用anaconda3环境下的jupyter notebook，需要安装jieba，wordcloud等库。

加载原始数据，并预览前5行，如下图所示，可以发现原始数据中共有14632个样本，有3列，分别为content,channelName,title。

代码如下：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os

plt.rcParams['font.family']='SimHei'
plt.rcParams['axes.unicode_minus']='False'
plt.rcParams['font.size']=15

#加载数据
news=pd.read_csv('./news.csv')
print(news.shape)
news.head()

结果：

3.数据预处理

3.1文本数据

结构化数据，是可以表示成多行多列的形式，并且，每行（列）都有着具体的含义。非结构化数据，无法合理地表示为多行多列的形式，即使那样表示，每行（列）也没有具体的含义。文本数据，是一种非结构化数据，其预处理的步骤与方式也会与结构化数据有所差异。文本数据预处理主要包含：

缺失值处理
重复值处理
文本内容清洗
分词
停用词处理

3.2缺失值处理

如果整个数据集中缺失值较少或者缺失值数量对于整个数据集来说可以忽略不计的情况下，那么可以直接删除含有缺失值的样本记录。

news.isnull().sum()

#缺失值处理
news.dropna(inplace=True)

news.isnull().sum()

print(news.shape)

可以发现content中共有98个缺失样本，相对于整个样本14632来说，显得微不足道，因此将缺失的98个样本删除。删除之后共有14534个样本。如下图所示。

3.3重复值处理

#重复值处理
print(news.duplicated().sum())
display(news[news.duplicated()])

结果发现共有1877个样本重复，按理来说应该删除这些样本，但是通过肉眼观察数据并未发生重复，只是前面几个字重复，因此对于重复值来说，不做任何处理。

3.4文本内容清洗

文本中存在对分析作用不大的标点符号与特殊字符，使用re库中正则匹配方法去除。

#文本内容清洗
import re
re_obj=re.compile(r"[!\"#$%&'()*+,-./:;<=>?@[\\\]{|}~——!\"<>，；：。？、￥（）【】《》‘’“”\s]+")
# re_obj=re.compile(r"[z0-9_.!+-=——,$%^，。？、~@#￥%……&*《》<>「」{}【】()/\\\[\]'\"]")
def clear(text):
    return re_obj.sub('',text)
news['content']=news['content'].apply(clear)
news.sample(5)

3.5分词

分词是将连续的文本，分割成语意合理的若干词汇序列，中文分词需要用jieba库中的方法实现分词功能。

#分词
def cut_word(text):
    return jieba.cut(text)
news['content']=news['content'].apply(cut_word)
news.sample(5)

3.6停用词处理

停用词，指的是在我们语句中大量出现，但却对语义分析没有帮助的词。对于这样的词汇，我们通常可以将其删除，这样的好处在于：可以降低存储空间消耗、可以减少计算时间消耗。对于哪些词属于停用词，已经有统计好的停用词列表，直接使用就好。在这里我是用的是百度的停用词表baidu_stopwords.txt。

#停用词处理
def get_stopword():
    s=set()
    with open('./stopwords.txt','r',encoding='UTF-8') as f:
        for line in f:
            s.add(line.strip())
    return s

def remove_stopword(words):
    return [word for word in words if word not in stopword]
stopword=get_stopword()
news['content']=news['content'].apply(remove_stopword)
news.sample(5)

定义函数remove_stopword()：遍历文本数据词汇，去掉存在于停用词表中的词汇。

4.数据可视化分析

4.1类别数量分布

统计新闻文本中每种channelName的数量。

#类别数量分布
t=news['channelName'].value_counts()
print(t)
t.plot(kind='bar')

结果发现：一共共有11中类别，和之前9个sheet相比，说明其中某个sheet里面具有多个类别。通过图可以发现属于财经的比较多，属于军事的较少。

4.2词汇统计

4.2.1统计在所有新闻中出现频数最多的15个词汇

#出现最多的前15个词
from itertools import chain
from collections import Counter

li_2d=news['content'].tolist()
li_1d=list(chain.from_iterable(li_2d))
print(f'总词汇量：{len(li_1d)}')
c=Counter(li_1d)
print(f'不重复词汇量：{len(c)}')
common=c.most_common(15)
print(common)

结果发现：

总词汇量：4895183

不重复词汇量：164074

出现最多的15个词汇，及其数量如下：

[('年', 33083), ('发展', 28876), ('中国', 28355), ('月', 28055), ('企业', 22364), ('中', 20457), ('新', 19456), ('上', 18020), ('市场', 16240), ('经济', 15899), ('增长', 14383), ('日', 14355), ('建设', 12536), ('都', 12521), ('更', 12433)]

4.2.2可视化

1）根据出现最多的15个词汇的频数做条形图。

d=dict(common)
plt.figure(figsize=(15,5))
plt.bar(d.keys(),d.values())

2）根据出现最多的15个词汇的频数做条形图。

total=len(li_1d)
percentage=[v*100/total for v in d.values()]
plt.figure(figsize=(15,5))
plt.bar(d.keys(),percentage)

4.2.3频数分布统计

plt.figure(figsize=(15,5))
t=pd.Series(c)
plt.hist(c.values(),bins=15,log=True)

5文本向量化

对文本数据进行建模，有两个问题需要解决：

模型进行的是数学运算，因此需要数值类型的数据，而文本不是数值类型数据。
模型需要结构化数据，而文本是非结构化数据。

将文本转换为数值特征向量的过程，称为文本向量化。将文本向量化可以分为如下步骤：

对文本分词，拆分成更容处理的单词。
将单词转换为数值类型，即使用合适的数值来表示每个单词。

文本是非结构化数据，在向量化过程中，需要将其转换为结构化数据。

5.1词袋模型

词袋模型，直观上理解，就是一个装满单词的袋子。实际上，词袋模型是一种能够将文本向量化的方式。在词袋模型中，每个文档为一个样本，每个不重复的单词为一个特征，单词在文档中出现的次数作为特征值。运词袋模型，我们也将文本数据转换为结构化数据。

默认情况下，CountVectorizer 只会对字符长度不小于2 的单词进行处理，如果单词长度小于2（单词仅有一个字符），则会忽略该单词。经过训练后，countvectorizer 就可以对未知文档（训练集外的文档）进行向量化。当然，向量化的特征仅为训练集中出现的单词特征，如果未知文档中的单词不在训练集中，则在词袋模型中无法体现。

5.2TF-IDF

通过CountVectorizer 类，我们能够将文档向量化处理。在向量化过程中，我们使每个文档中单词的频数作为对应待征的取值。这是合理的，因为，单词出现的次数越多，我们就认为该单词理应比出现次数少的单词更加重要。然而，这是相对的，有些单词，我们不能仅以当前文档中的频数来进行衡量，还要考虑其在语料库中，在其他文档中出现的次数。因为有些单词，确实是非常常见的，其在语料库所有的文档中，可能都会频繁出现，对于这样的单词，我们就应该降低其重要性。例如，在新闻联播中，”中国“、”发展“等单词，在语料库中出现的频率非常高，即使这些词在某篇文档中频繁出现，也不能说明这些词对当前文档是非常重要的，因为这些词并不含有特别有意义的信息。 TF-IDF 可以用来调整单词在文档中的权重，其由两部分组成：

TF (Term-Frequency) 词频，指一个单词在文档中出现的次数。
IDF (lnverse Document-Frequency)逆文档频率。

计算方式为:

使用TfidfTransformer进行TF-IDF转化，此外，scikit-learn同时提供了一个类TfidfVectorizer, 其可以直接将文档转换为TF-IDF值，也就是说，该类相当于集成了CountVectorizer 与TfidfTransformer两个类的功能，十分便利。

二、实验与结果

1.构建训练集与测试集

我们需要将每条新闻的词汇进行整理。目前，我们文本内容已经完成了分词处理，但词汇是以列表类型呈现的，为了方便后续的向量化操作（文本向量化需要传递空格分开的字符串数组类型），我们将每条新闻的词汇组合在一起，成为字符串类型，使用空格分隔。将chanelName转换为离散值，之后对样本数据进行切分，构建训练集与测试集。

如下图所示，我把content内容作为特征值，把channelName作为标签值，另外channelName中共有11种，分别是：财经，房产，教育，科技，军事，汽车，体育，综合体育最新，游戏，娱乐，体育焦点。并将其转化为离散值0,1,2,3,4,5,6,7,8,9,10分别代表。将数据集按3:1的比例划分为训练集和测试集，其中训练集样本有10900条，测试集有3634条。

news['channelName']=news['channelName'].map({'财经':0, '房产':1,'教育':2,'科技':3,'军事':4,'汽车':5,'体育':6,'综合体育最新':7,'游戏':8,'娱乐':9,'体育焦点':10})
news['channelName'].value_counts()

#构建训练集与测试集
from sklearn.model_selection import train_test_split
x=news['content']
y=news['channelName']
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.25,random_state=1)
print('训练集样本数：',y_train.shape[0],'测试集样本数：',y_test.shape[0])

2.特征选择

2.1特征选择-方差分析

到目前为止，数据集还是文本类型，我们需要对其进行向量化操作。这里，我们使用TfidfVectorizer类，在训练集上进行训练，然后分别对训练集与测试集实施转换。使用词袋模型向量化后，会产生过多的特征，这些特征会对存储与计算造成巨大的压力，同时，并非所有的特征都对建模有帮助，基于以上原因，在将数据送入模型之前，先进行特征选择。这里，使用方差分析(ANOVA) 来进行特征选择，选择与目标分类变量最相关的14000 个特征。方差分析用来分析两个或多个样本（来自不同总体）的均值是否相等，进而可以用来检验分类变量与连续变量之间是否相关。

from sklearn.feature_selection import SelectKBest
x_train_tran=x_train_tran.astype(np.float32)
x_test_tran=x_test_tran.astype(np.float32)
selector=SelectKBest(f_classif,k=min(14000,x_train_tran.shape[1]))
selector.fit(x_train_tran,y_train)
x_train_tran=selector.transform(x_train_tran)
x_test_tran=selector.transform(x_test_tran)
print(x_train_tran.shape,x_test_tran.shape)

3.分类模型评估

混淆矩阵：可以来评估模型分类的正确性。该矩阵是一个方阵，矩阵的数值来表示分类器预测的结果，包括真正例(True Positive ）假正例(FaIsePositive) 真负例(True Negative ）假负例(False Negative)。

分类模型的评估标准一般最常见使用的是准确率，即预测结果正确的百分比。

准确率是相对所有分类结果；精确率、召回率、F1-score是相对于某一个分类的预测评估标准。一般都是用准确率来作为评价指标，然而对于类别不均衡的任务来说，或者在任务中某一个类的准确率非常重要。如果再使用单纯的准确率肯定是不合理的，对任务来说没有意义。所以我们需要一个好的评价指标来。目前一般都是用精准率，召回率，F1-score来评价模型；

准确率（Accuracy）:预测结果正确的百分比 —— (TP+TN)/(TP+TN+FP+FN) 。

精确率(Precision)：预测结果为正例样本中真实为正例的比例（查的准）—— TP/(TP+FP) 。召回率(Recall)：真实为正例的样本中预测结果为正例的比例（查的全）—— TP/(TP+FN) 综合指标(F1-score)：综合评估准确率与召回率，反映了模型的稳健型 —— 2PrecisionRecall/(Precision+Recall)

4.逻辑回归

采用逻辑回归编写代码，如下：

#逻辑回归
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report

param =[{'penalty':['l1','l2'],'C':[0.1,1,10],'solver':['liblinear']},{'penalty':['elasticnet'],'C':[0.1,1,10],'solver':['saga'],'l1_ratio':[0.5]}]
gs=GridSearchCV(estimator=LogisticRegression(),param_grid=param,cv=2,scoring='f1',n_jobs=-1,verbose=10)
gs.fit(x_train_tran,y_train)
print(gs.best_params_)
y_hat=gs.best_estimator_.predict(x_test_tran)
labels=[0,1,2,3,4,5,6,7,8,9,10]
target_names=['财经', '房产','教育','科技','军事','汽车','体育','综合体育最新','游戏','娱乐','体育焦点']
print(classification_report(y_test,y_hat,labels=labels,target_names=target_names))

5.KNN

采用KNN算法编写代码如下：

#KNN
from sklearn.neighbors import KNeighborsClassifier

param={'n_neighbors':[5,7],'weights':['uniform','distance'],'p':[2]}

gs=GridSearchCV(estimator=KNeighborsClassifier(),param_grid=param,cv=2,scoring='f1',n_jobs=-1,verbose=10)
gs.fit(x_train_tran,y_train)
print(gs.best_params_)
y_hat=gs.best_estimator_.predict(x_test_tran)
labels=[0,1,2,3,4,5,6,7,8,9,10]
target_names=['财经', '房产','教育','科技','军事','汽车','体育','综合体育最新','游戏','娱乐','体育焦点']
print(classification_report(y_test,y_hat,labels=labels,target_names=target_names))

6.决策树

采用决策树编写代码如下：

#决策树
from sklearn.tree import DecisionTreeClassifier

param={'criterion':['gini','entropy'],'max_depth':[10,15]}

gs=GridSearchCV(estimator=DecisionTreeClassifier(),param_grid=param,cv=2,scoring='f1',n_jobs=-1,verbose=10)
gs.fit(x_train_tran,y_train)
print(gs.best_params_)
y_hat=gs.best_estimator_.predict(x_test_tran)
labels=[0,1,2,3,4,5,6,7,8,9,10]
target_names=['财经', '房产','教育','科技','军事','汽车','体育','综合体育最新','游戏','娱乐','体育焦点']
print(classification_report(y_test,y_hat,labels=labels,target_names=target_names))

7.多层感知器

采用多层感知器编写代码如下：

#多层感知器
from sklearn.neural_network import MLPClassifier

param={'hidden_layer_sizes':[(8,),(4,)],}

gs=GridSearchCV(estimator=MLPClassifier(),param_grid=param,cv=2,scoring='f1',n_jobs=-1,verbose=10)
gs.fit(x_train_tran,y_train)
print(gs.best_params_)
y_hat=gs.best_estimator_.predict(x_test_tran)
labels=[0,1,2,3,4,5,6,7,8,9,10]
target_names=['财经', '房产','教育','科技','军事','汽车','体育','综合体育最新','游戏','娱乐','体育焦点']
print(classification_report(y_test,y_hat,labels=labels,target_names=target_names))

其结果为：

8.朴素贝叶斯

采用朴素贝叶斯算法编写代码如下：

#朴素贝叶斯
from sklearn.naive_bayes import GaussianNB,BernoulliNB,MultinomialNB,ComplementNB
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import FunctionTransformer

steps=[('dense',FunctionTransformer(func=lambda x:x.toarray(),accept_sparse=True)),('model',None)]
pipe=Pipeline(steps=steps)
param={'model':[GaussianNB(),BernoulliNB(),MultinomialNB(),ComplementNB()]}

gs=GridSearchCV(estimator=pipe,param_grid=param,cv=2,scoring='f1',n_jobs=2,verbose=10)
gs.fit(x_train_tran,y_train)
print(gs.best_params_)
y_hat=gs.best_estimator_.predict(x_test_tran)
labels=[0,1,2,3,4,5,6,7,8,9,10]
target_names=['财经', '房产','教育','科技','军事','汽车','体育','综合体育最新','游戏','娱乐','体育焦点']
print(classification_report(y_test,y_hat,labels=labels,target_names=target_names))

其计算结果为：

三、讨论

以下是根据输出的评估模型报告进行讨论。

3.1讨论准确率

根据评估模型报告，把5份报告合并为一张表中，如下表所示。

算法	准确率（accuracy）
逻辑回归	0.74
KNN	0.85
决策树	0.86
多层感知器	0.94
朴素贝叶斯	0.55

讨论：由结果可知多层感知器在整个数据集中准确率较高，而朴素贝叶斯准确率较低，其中KNN算法与决策树则差不多。

3.2讨论F1-score

F1分数（F1-score）是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛，常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数，最大为1，最小为0。F1分数认为召回率和精确率同等重要，F1-score反映了模型的稳健型，因此在此讨论F1-score，而不再讨论精确率和召回率。

3.2.1财经

算法	F1-score
逻辑回归	0.82
KNN	0.90
决策树	0.89
多层感知器	0.95
朴素贝叶斯	0.44

有上表可知，多层感知器、决策树、KNN都分别达到90%以上，其中多层感知器用于财经分类问题上较好，达到了95%。

3.2.2房产

算法	F1-score
逻辑回归	0.00
KNN	0.39
决策树	0.21
多层感知器	0.92
朴素贝叶斯	0.64

有上表可知，多层感知器用于房产分类问题上较好，达到了92%。

3.2.3教育

算法	F1-score
逻辑回归	0.36
KNN	0.67
决策树	0.95
多层感知器	0.94
朴素贝叶斯	0.61

有上表可知，决策树和多层感知器都到了90%以上，其中决策树用于教育分类问题上较好，达到了95%。

3.2.4科技

算法	F1-score
逻辑回归	0.09
KNN	0.60
决策树	0.47
多层感知器	0.73
朴素贝叶斯	0.24

有上表可知，多层感知器用于科技分类问题上较好，达到了73%。

3.2.5军事

算法	F1-score
逻辑回归	0.00
KNN	0.20
决策树	0.00
多层感知器	0.98
朴素贝叶斯	0.83

有上表可知，多层感知器用于军事分类问题上较好，达到了98%。

3.2.6汽车

算法	F1-score
逻辑回归	0.41
KNN	0.69
决策树	0.58
多层感知器	0.82
朴素贝叶斯	0.41

有上表可知，多层感知器用于汽车分类问题上较好，达到了82%。

3.2.7体育

算法	F1-score
逻辑回归	0.00
KNN	0.08
决策树	0.88
多层感知器	0.98
朴素贝叶斯	0.56

有上表可知，多层感知器用于体育分类问题上较好，达到了98%。

3.2.8综合体育最新

算法	F1-score
逻辑回归	0.93
KNN	0.99
决策树	1.00
多层感知器	1.00
朴素贝叶斯	1.00

有上表可知，这个5个模型在分类上都比较好，达到了90%以上，其中决策树、多层感知器、朴素贝叶斯用于综合体育最新分类问题上较好，达到了100%。

3.2.9游戏

算法	F1-score
逻辑回归	0.78
KNN	0.91
决策树	0.96
多层感知器	0.99
朴素贝叶斯	0.97

有上表可知，除了逻辑回归外，其它4个模型在分类上都比较好，达到了90%以上，其中多层感知器用于游戏分类问题上较好，达到了99%。

3.2.10娱乐

算法	F1-score
逻辑回归	0.41
KNN	0.82
决策树	0.75
多层感知器	0.94
朴素贝叶斯	0.78

有上表可知，多层感知器用于娱乐分类问题上较好，达到了94%。

3.2.11体育焦点

算法	F1-score
逻辑回归	0.24
KNN	0.69
决策树	1.00
多层感知器	0.99
朴素贝叶斯	0.84

有上表可知，决策树、多层感知器都达到了90%以上，其中决策树用于体育焦点分类问题上较好，达到了100%。

3.3整体讨论

有上述表格中的数据可知，在整个新闻文本分类中多层感知机最好。最不好的是逻辑回归，在5个算法模型比较中偏低，在某些领域分类问题中不能分出。

注：这是自然语言处理的作业，数据集是老师发的，做个新闻分类，后期可以自己看看，做个记录

灵感来源于这个，参考它的，做的自己的。

python文本数据分析案例—新闻分类 - 知乎前言数据分析不只是对数值型数据的分析，对文本数据的分析也是十分常见的。大家常看到的新闻类APP，如：今日头条，UC头条等，通常都已按新闻类型分好类别，读者可根据自己的喜好查看相应的新闻内容。本案例从数据…https://zhuanlan.zhihu.com/p/134082749

你可能感兴趣的:(自然语言处理,新闻分类,机器学习,分类,机器学习,自然语言处理)

给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
解决stm32引脚如果选择输入模式雁过留声花欲落单片机嵌入式硬件
1.输入模式分类STM32的GPIO输入模式主要分为以下四种：浮空输入（FloatingInput/InputFloating）上拉输入（InputPull-Up）下拉输入（InputPull-Down）模拟输入（AnalogInput）2.各模式详解(1)浮空输入（FloatingInput）电路结构：引脚内部不连接上拉或下拉电阻，完全由外部电路决定电平状态。等效电路：引脚直接连接施密特触发器（
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
CBNet--一种新的目标检测的复合骨干网体系结构 weixin_45963617 深度学习系列
一、Introduction一般来说，在一个典型的基于CNN的目标检测器中，使用主干网络来提取检测对象的基本特征，该网络通常是为图像分类任务而设计的，并在ImageNet上预训练。毫无疑问，更强大的主干网可以带来更好的检测性能。尽管最先进的基于深度的大骨干网络的探测器取得了很好的结果，但仍有很大改进空间。此外，通过设计一个新的更强大的主干网络并在ImageNet上预训练来获取好的检测性能是十分昂贵
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
一文读懂什么是服务器小熊猫Q 服务器科普服务器运维
服务器基础介绍介绍服务器相关基础知识，如服务器分类、组成、机箱内部构造等，个人公众号：SRE杂谈，欢迎关注1、什么是服务器？服务器品牌有惠普、戴尔、浪潮、华为、华三、曙光等，各厂商服务器型号存在差异，惠普DL380G10、戴尔PowerEdgeR750、浪潮NF5280M5、华为2288HV5、曙光R6230HA一般用SN序列号和资产编号来对服务器进行标识，其中SN为唯一标识2、服务器演进2.1、
CSP-J备考冲刺必刷题（C++） | AcWing 1253 家谱热爱编程的通信人 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】Acwing：1253.家谱-AcWing题库
“三分钟”带你看懂批次管理!（一） wms系统
一、批次管理的定义与重要性1.批次管理的定义：批次管理是一种针对产品或物料的管理方法，它将同一生产周期或相同条件下生产、具有一致质量特征、生产信息和使用属性的产品组作为一个批次，进行分类、标识、追踪和管理。2.批次管理的重要性：提高可追溯性：精准追踪物料和产品的来源、去向及生命周期，在质量问题或召回需求出现时，能快速锁定问题批次，降低损失。增强质量控制：监控不同批次产品的质量指标，及时发现和分析质
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导阿正的梦工坊 Machine Learning Deep Learning 分类人工智能深度学习机器学习
下面是MSE不适合分类任务的解释，包含梯度推导。以及交叉熵的梯度推导。前文请移步笔者的另一篇博客：大模型训练为什么选择交叉熵损失（Cross-EntropyLoss）：均方误差（MSE）和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE（均方误差）的梯度特性，结合公式推导和分析，解释为什么在预测值接近0或1时梯度趋于0，以及这背后的含义。我会尽量保持清晰且严谨，适合高理论水平的
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估贫苦游商学习服务器网络计算机体系结构 ISA 指令集量化评估
【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估概论计算机体系结构简介计算机的分类并行体系结构指令集体系结构（ISA）分类存储器寻址寻址模式操作数大小指令ISA的编码程序的优化计算机体系结构量化评估存储器体系结构概论计算机体系结构与计算机组成原理之间的联系非常紧密，其研究范畴基本一致，计算机体系结构与计算机组成原理两者是相辅相成的。但是，计算机体系结构
【从零开始学习JAVA】异常体系介绍 Cools0613 从0开始学Java 学习
前言：本文我们将为大家介绍一下异常的整个体系，而我们学习异常，不是为了敲代码的时候不出异常，而是为了能够熟练的处理异常，如何解决代码中的异常。异常的两大分类：我们就以这张图作为线索来详细介绍一下Java中的异常：1.Exceptions（异常）在Java中，Exception（异常）是一种表示非致命错误或异常情况的类或接口。Exception通常是由应用程序引发的，可以被程序员捕获、处理或抛出。E
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
文章去除AI味的指令 wirepuller_king AI word技巧人工智能
去AI味指令-1Role:AI文章人性化优化专家Profile:author:wirepullerVersion:5.2.0Language:中文Description:专门优化AI生成文章,使其更接近人类自然写作风格的专家Background:你是一位精通自然语言处理和人类写作风格的专家。你的任务是将AI生成的文章转化为更自然、更有人情味的文章,去除机械化和公式化的痕迹,增加文章的可读性和亲和力
anythingLLM 使用教程惟贤箬溪穷玩Ai AIGC 人工智能
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言模型，它基于先进的深度学习架构构建，旨在为用户提供多样化的自然语言处理服务。其设计理念注重通用性和可扩展性，能够适应多种领域和任务，无论是文本生成、智能问答，还是翻译、摘要提取等，都能展现出出色的性能。与同类模型相比，anythingLLM具有训练数据丰富、模型优化程度高的优势，能够生成更符合逻辑、更具实用性的文本内容。
GitHub项目推荐--基于LLM的开源爬虫项目惟贤箬溪穷玩Ai github 爬虫
以下是一些基于大语言模型（LLM，LargeLanguageModel）的开源爬虫项目，它们结合了自然语言处理（NLP）技术与爬虫的功能，能在一定程度上提升爬取的智能化和精度。这些项目可以用于自动化抓取、内容提取、数据分析等任务。1.GPT-3WebScraper简介：这是一个基于OpenAIGPT-3模型的网页抓取工具，利用GPT-3的自然语言理解能力来生成有用的爬虫策略、处理网页内容并提取有价
大模型推理框架：从理论到实践的全面解析百度_开发者中心人工智能大模型自然语言处理
在数据驱动的时代，深度学习技术已经渗透到各个行业，从图像识别到自然语言处理，从推荐系统到智能客服，其应用无处不在。然而，深度学习模型的训练和推理过程往往涉及大量数据和复杂计算，传统的计算框架难以满足需求。因此，大模型推理框架应运而生，成为解决这一问题的关键。一、大模型推理框架基本概念大模型推理框架是一种基于深度学习技术的推理框架，它通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分
单页响应式图片懒加载HTML页面 Wiktok css javascript 前端
设计说明响应式设计：使用CSSGrid布局，根据屏幕宽度自动调整色块数量在不同设备上都有良好的显示效果懒加载：使用标签的loading="lazy"属性实现原生懒加载图片在滚动到视口附近时才会加载色块展示：使用随机生成的色块作为内容展示每个色块都有独特的颜色和编号色块有悬停效果和阴影效果分类展示：将色块分为自然风光、城市建筑和抽象艺术三类每类都有独立的标题和网格布局响应式懒加载页面*{margin
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
《java面向对象(5)》＜不含基本语法＞ java小白板 java 开发语言
本笔记基于黑马程序员java教程整理，仅供参考1.异常1.1异常分类1.1.1Error指系统级别的错误，程序员无法解决，不必理会1.1.2Exception（异常）分为两类：RuntimeException：运行时异常，编译时程序不会报错，运行时报错，如数组越界其他异常：编译时异常，编译时就会报错运行时异常：publicclassText{publicstaticvoidmain(String[
SSL证书申请,流程，分类 thinkhi9999 ssl http 爬虫
SSH与SSL应用方向不同，但基于技术都是一样的（公钥和私钥配对）SSL主要用在Browser和Server通信，比如HTTPS=HTTP+SSLSSH是由客户端和服务端的软件组成的，用于computer之间通信，比如我们通过SSH登录远端服务器。有两个不兼容的版本分别是：1.x和2.x。用SSH2.x的客户程序是不能连接到SSH1.x的服务程序上去的。OpenSSH2.x同时支持SSH1.x和2
探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
跟着黑马学MySQL基础篇笔记(1)-概述与SQL 小杜不吃糖 mysql 笔记 sql
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05.通用语法及分类DDL：数据定义语言，用来定义数据库对象（数据库，表，字段）DML：数据操作语言，用来对数据库表中的数据进行增删改DQL：数据查询语言，用来查询数据库中表的记录DCL：数据控制语
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发