pi31415926535x

[笔记]搜索引擎-实验报告-实验二

实验目的

掌握文本处理和分析的内容：

1. 掌握文本预处理的基本技术
1. 掌握倒排文档的实现
1. 掌握向量空间模型的实现
1. 掌握文本分类模型的实现

链接分析的内容:

1. 掌握 PageRank 算法的原理和实现

实验步骤

实验三文本处理与分析

一、文本预处理

1. 词汇切分

实现的正向减字最大匹配法代码如下：

import os

# 读取所有的字典中的词汇，并排序
dicts = []
with open("./dict_example.txt", "r", encoding="utf-8") as dicts_input:
    for word in dicts_input:
        dicts.append(word.split("\n")[0].strip())
dicts.sort(key=lambda i: len(i), reverse=True)
print(dicts)

# 输入句子
sentence = input("input sentence: ")
print(sentence)
word_cut_ans = []       # 分析结果
dicts_word_max_len = len(dicts[0])
sentence_len = len(sentence)
i = 0;
while(sentence_len > 0):
    s = sentence[0:]
    # s = sentence[0:dicts_word_max_len]
    s_len = len(s)
    while(s_len > 0):
        print("s[" + str(i) + "]: " + s)
        i += 1
        if(s in dicts):
            word_cut_ans.append(s)
            break
        elif(s_len == 1):
            word_cut_ans.append(s)
            break
        else:
            s_len -= 1
            s = s[0: s_len]
    sentence = sentence[s_len:]
    sentence_len -= s_len
print(word_cut_ans)

当测试用例为： 今天是中华人民共和国获得奥运会举办权的日子 时的输出为：

PS G:\Backup\CollegeProjectBackup\ExperimentalReport\搜 > python -u "g:\Backup\CollegeProjectBackup\ExperimentalReport\搜索引 
擎\实验二\实验三 文本处理与分析\一、 文本预处理\1. 词汇切分\word_cut.py"
['中华人民共和国', '人民共和国', '中华人民', '共和国', '奥运会', '举办权', '今天', '中华', '华人', '人民', '共和', '获得', '奥
运', '举办', '日子', '今', '天', '是', '中', '华', '人', '民', 
'共', '和', '国', '获', '得', '奥', '运', '会', '举', '办', '权
', '的', '日', '子']
input sentence: 今天是中华人民共和国获得奥运会举办权的日子  
今天是中华人民共和国获得奥运会举办权的日子
s[0]: 今天是中华人民共和国获得奥运会举办权的日子
s[1]: 今天是中华人民共和国获得奥运会举办权的日
s[2]: 今天是中华人民共和国获得奥运会举办权的
s[3]: 今天是中华人民共和国获得奥运会举办权
s[4]: 今天是中华人民共和国获得奥运会举办
s[5]: 今天是中华人民共和国获得奥运会举
s[6]: 今天是中华人民共和国获得奥运会
s[7]: 今天是中华人民共和国获得奥运
s[8]: 今天是中华人民共和国获得奥
s[9]: 今天是中华人民共和国获得
s[10]: 今天是中华人民共和国获
s[11]: 今天是中华人民共和国
s[12]: 今天是中华人民共和
s[13]: 今天是中华人民共
s[14]: 今天是中华人民
s[15]: 今天是中华人
s[16]: 今天是中华
s[17]: 今天是中
s[18]: 今天是
s[19]: 今天
s[20]: 是中华人民共和国获得奥运会举办权的日子
s[21]: 是中华人民共和国获得奥运会举办权的日
s[22]: 是中华人民共和国获得奥运会举办权的
s[23]: 是中华人民共和国获得奥运会举办权
s[24]: 是中华人民共和国获得奥运会举办
s[25]: 是中华人民共和国获得奥运会举
s[26]: 是中华人民共和国获得奥运会
s[27]: 是中华人民共和国获得奥运
s[28]: 是中华人民共和国获得奥
s[29]: 是中华人民共和国获得
s[30]: 是中华人民共和国获
s[31]: 是中华人民共和国
s[32]: 是中华人民共和
s[33]: 是中华人民共
s[34]: 是中华人民
s[35]: 是中华人
s[36]: 是中华
s[37]: 是中
s[38]: 是
s[39]: 中华人民共和国获得奥运会举办权的日子
s[40]: 中华人民共和国获得奥运会举办权的日
s[41]: 中华人民共和国获得奥运会举办权的
s[42]: 中华人民共和国获得奥运会举办权
s[43]: 中华人民共和国获得奥运会举办
s[44]: 中华人民共和国获得奥运会举
s[45]: 中华人民共和国获得奥运会
s[46]: 中华人民共和国获得奥运
s[47]: 中华人民共和国获得奥
s[48]: 中华人民共和国获得
s[49]: 中华人民共和国获
s[50]: 中华人民共和国
s[51]: 获得奥运会举办权的日子
s[52]: 获得奥运会举办权的日
s[53]: 获得奥运会举办权的
s[54]: 获得奥运会举办权
s[55]: 获得奥运会举办
s[56]: 获得奥运会举
s[57]: 获得奥运会
s[58]: 获得奥运
s[59]: 获得奥
s[60]: 获得
s[61]: 奥运会举办权的日子
s[62]: 奥运会举办权的日
s[63]: 奥运会举办权的
s[64]: 奥运会举办权
s[65]: 奥运会举办
s[66]: 奥运会举
s[67]: 奥运会
s[68]: 举办权的日子
s[69]: 举办权的日
s[70]: 举办权的
s[71]: 举办权
s[72]: 的日子
s[73]: 的日
s[74]: 的
s[75]: 日子
['今天', '是', '中华人民共和国', '获得', '奥运会', '举办权', ' 
的', '日子']

当每一次搜索模式串的长度为词汇中最长值和字符串最长值的最小值时，可以明显减小一些无意义的匹配过程，实现方法是将源代码中的注释解除即可：

PS G:\Backup\CollegeProjectBackup\ExperimentalReport\搜 > python -u "g:\Backup\CollegeProjectBackup\ExperimentalReport\搜索引 
擎\实验二\实验三 文本处理与分析\一、 文本预处理\1. 词汇切分\word_cut.py"
['中华人民共和国', '人民共和国', '中华人民', '共和国', '奥运会', '举办权', '今天', '中华', '华人', '人民', '共和', '获得', '奥
运', '举办', '日子', '今', '天', '是', '中', '华', '人', '民', 
'共', '和', '国', '获', '得', '奥', '运', '会', '举', '办', '权
', '的', '日', '子']
input sentence: 今天是中华人民共和国获得奥运会举办权的日子     
今天是中华人民共和国获得奥运会举办权的日子
s[0]: 今天是中华人民
s[1]: 今天是中华人
s[2]: 今天是中华
s[3]: 今天是中
s[4]: 今天是
s[5]: 今天
s[6]: 是中华人民共和
s[7]: 是中华人民共
s[8]: 是中华人民
s[9]: 是中华人
s[10]: 是中华
s[11]: 是中
s[12]: 是
s[13]: 中华人民共和国
s[14]: 获得奥运会举办
s[15]: 获得奥运会举
s[16]: 获得奥运会
s[17]: 获得奥运
s[18]: 获得奥
s[19]: 获得
s[20]: 奥运会举办权的
s[21]: 奥运会举办权
s[22]: 奥运会举办
s[23]: 奥运会举
s[24]: 奥运会
s[25]: 举办权的日子
s[26]: 举办权的日
s[27]: 举办权的
s[28]: 举办权
s[29]: 的日子
s[30]: 的日
s[31]: 的
s[32]: 日子
['今天', '是', '中华人民共和国', '获得', '奥运会', '举办权', ' 
的', '日子']

二、倒排文档的实现

对jieba的倒排文本代码添加停用词的实现，即+号所在行，停用词来源为：百度停用词

import jieba

def mapper(lineNum, list):
    dic = {}
    for item in list:
        key = ''.join([str(lineNum), ':', item])
        if key in dic:
            ll = dic.get(key)
            ll.append(1)
            dic[key] = ll
        else:
            dic[key] = [1]

    return dic

def reducer(dic):
    keys = dic.keys()
    rdic = {}
    for key in keys:
        lineNum, kk = key.split(":")
        ss = ''.join([lineNum, ':', str(dic.get(key))])
        if kk in rdic:
            ll = rdic[kk]
            ll.append(ss)
            rdic[kk] = ll
        else:
            rdic[kk] = [ss]

    return rdic

def combiner(dic):
    keys = dic.keys()
    tdic = {}
    for key in keys:
        valuelist = dic.get(key)
        count = 0
        for i in valuelist:
            count += i
        tdic[key] = count
    return tdic

+ stopwords = []
+ def remove_stopwords(word_list):
+     if(len(stopwords) == 0):
+         with open("./stopwords.txt", "r", encoding="utf-8") as word_input:
+             for word in word_input:
+                 stopwords.append(word.split("\n")[0].strip())
+     new_word_list = []
+     for word in word_list:
+         if(word in stopwords):
+             continue
+         new_word_list.append(word)
+     return new_word_list
    
def get_reverse_index(filepath):
    file = open(filepath, 'r', encoding="utf8")
    lineNum = 0
    rdic_p = {}
    while True:
        lineNum += 1
        line = file.readline()
        if line != '':
            print(lineNum, ' ', line)
        else:
            break
        # 先分词
        word_list = list(jieba.cut(line))
+         word_list = remove_stopwords(word_list)
        mdic = mapper(lineNum, word_list)
        cdic = combiner(mdic)
        print(cdic)
        rdic_p.update(cdic)

    rdic = reducer(rdic_p)
    print(rdic)
    return rdic


if __name__ == '__main__':
    # data 文档
    dic = get_reverse_index('./data.txt')
    while(1):
        search_word = input('Please input the word you want to search: ')
        if (search_word in dic):
            print(dic.get(search_word))
        else:
            print(-1)

三、向量空间模型的实现

四、文本分类的实现

SVM：

(research) G:\Backup\CollegeProjectBackup\ExperimentalReport\搜
索引擎\实验二\实验三 文本处理与分析\四、 文本分类的实现>python 
train_classifier.py
请输入训练集的的根目录：data\train
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\314159~1\AppData\Local\Temp\jieba.cache
Loading model cost 0.795 seconds.
Prefix dict has been built successfully.
训练完成！

(research) G:\Backup\CollegeProjectBackup\ExperimentalReport\搜
索引擎\实验二\实验三 文本处理与分析\四、 文本分类的实现>python 
 classify.py
请输入模型文件的目录：.
请输入包含训练集的根目录：data\train
请输入包含测试集的根目录：data\test
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\314159~1\AppData\Local\Temp\jieba.cache
Loading model cost 0.792 seconds.
Prefix dict has been built successfully.
[[12  1  7]
 [ 0 16  4]
 [ 0  1 19]]
              precision    recall  f1-score   support

     class 0       1.00      0.60      0.75        20
     class 1       0.89      0.80      0.84        20
     class 2       0.63      0.95      0.76        20

    accuracy                           0.78        60
   macro avg       0.84      0.78      0.78        60
weighted avg       0.84      0.78      0.78        60

正确率=0.7833333333333333
分类完成！

KNN：

训练代码如下，添加knn：

#训练分类器
import jieba,os
from gensim import corpora
from sklearn import svm
from sklearn import neighbors
from sklearn.feature_extraction.text import TfidfVectorizer
import joblib

#读取所有文本信息，生成文档列表
def load_data(trainsdir):
  documents=[]
  label=[]
  #读取每个子目录下的文本文件
  subdirs=os.walk(trainsdir)
  for d,s,fns in subdirs:
    for fn in fns:
        if fn[-3:]=='txt':
            #print(d+os.sep+fn)
            #根据文件编码指定编码方式:utf-8,gbk,ansi等
            f=open(d+os.sep+fn, "r",encoding="ansi")   
            filecontent=f.read()
            documents.append(filecontent)
            label.append(d[d.rindex("\\")+1:])   #子目录名称作为类别标签
  return documents,label

#预处理：分词、停用词过滤、词频过滤、特征选择
def preprocess(documents):
    stoplist=open('stopword.txt','r',encoding="utf-8").readlines()
    stoplist = set(w.strip() for w in stoplist)
    
    #分词、去停用词
    texts=[]
    for document in documents:
        doc=[]
        for w in list(jieba.cut(document,cut_all=True)):
            if len(w)>1 and w not in stoplist:
                doc.append(w)
        texts.append(doc)

    #生成词典
    dictionary=corpora.Dictionary(texts)
    dictionary.filter_extremes(no_below=3, no_above=1.0,keep_n=1000)
    return texts,dictionary


#训练svm分类器：构造TFIDF矩阵、SVM参数拟合
def train_svm(train_data, dictionary,train_tags):
    traindata=[]
    dlist=list(dictionary.values())
    
    for l in train_data:
       words=""
       for w in l:
         if w in dlist:
            words = words+w+" "
       traindata.append(words)
            
    v = TfidfVectorizer()
    tdata = v.fit_transform(traindata)

    svc = svm.SVC(kernel='rbf',gamma='auto')  
    svc.fit(tdata,train_tags)
    return svc


#训练knn分类器：构造TFIDF矩阵、knn参数拟合
def train_knn(train_data, dictionary, train_tags):
    traindata=[]
    dlist=list(dictionary.values())
    
    for l in train_data:
       words=""
       for w in l:
         if w in dlist:
            words = words+w+" "
       traindata.append(words)
            
    v = TfidfVectorizer()
    tdata = v.fit_transform(traindata)

    knn = neighbors.KNeighborsClassifier(n_neighbors=3, metric='euclidean')
    knn.fit(tdata, train_tags)
    return knn


if __name__ == '__main__':
    newsdir=input("请输入训练集的的根目录：")
    docs,label=load_data(newsdir)
    corpus, dictionary=preprocess(docs)
    
    # svm=train_svm(corpus,dictionary,label)
    knn = train_knn(corpus, dictionary, label)

    dictionary.save("classifier_knn.dict")
    # joblib.dump(svm, "svm.model")
    joblib.dump(knn, "knn.model")
    print("训练完成！")

测试分类代码如下：

#使用SVM进行分类测试
import jieba,os
from gensim import corpora
from sklearn import svm
from sklearn.feature_extraction.text import TfidfVectorizer
import joblib
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report

#训练svm分类器及词典
def loadmodel(modeldir):            
    svm = joblib.load("svm.model")
    dictionary = corpora.Dictionary.load('classifier.dict')
    return svm,dictionary

#训练svm分类器及词典
def loadmodel_knn(modeldir):            
    knn = joblib.load("knn.model")
    dictionary = corpora.Dictionary.load('classifier_knn.dict')
    return knn,dictionary

'''读取所有文本信息，生成文档列表.
   测试样本位于列表的前面，测试样本个数与label大小一致
   包含训练集，因IDF的计算与训练集有关
'''
def load_data(trainsdir,testdir):
  documents=[]
  label=[]

  #读取每个testdir子目录下的文本文件
  subdirs=os.walk(testdir)
  for d,s,fns in subdirs:
    for fn in fns:
        if fn[-3:]=='txt':
            #print(d+os.sep+fn)
            #根据文件编码指定编码方式:utf-8,gbk,ansi等
            f=open(d+os.sep+fn, "r",encoding="ansi")   
            filecontent=f.read()
            documents.append(filecontent)
            label.append(d[d.rindex("\\")+1:])   #子目录名称作为类别标签
            
  #读取每个trainsdir子目录下的文本文件
  subdirs=os.walk(trainsdir)
  for d,s,fns in subdirs:
    for fn in fns:
        if fn[-3:]=='txt':
            #print(d+os.sep+fn)
            #根据文件编码指定编码方式:utf-8,gbk,ansi等
            f=open(d+os.sep+fn, "r",encoding="ansi")   
            filecontent=f.read()
            documents.append(filecontent)
  return documents,label


#预处理：分词、特征词过滤，生成新的文档列表
def preprocess(documents,dictionary):
    stoplist=open('stopword.txt','r',encoding="utf-8").readlines()
    stoplist = set(w.strip() for w in stoplist)
    dclist=list(dictionary.values())
    
    #分词、去停用词
    texts=[]
    for document in documents:
        doc=[]
        for w in list(jieba.cut(document,cut_all=True)):
            if w in dclist:
                doc.append(w)
        texts.append(doc)
    return texts


#分类
def svm_classify(svm,dataset, dictionary, test_tags):
    data=[]
    testresult=[]
    dlist=list(dictionary.values())
    
    for l in dataset:
       words=""
       for w in l:
         if w in dlist:
            words = words+w+" "
       data.append(words)
            
    #把文档集（由空格隔开的词汇序列组成的文档）转换成为tfidf向量
    v = TfidfVectorizer()
    tdata = v.fit_transform(data)

    correct=0
    #获取测试样本（待分类的眼本），输出分类结果
    for i  in range(len(test_tags)):
        test_X=tdata[i]
        r=svm.predict(test_X) #此处test_X为特征集
        testresult.append(r[0])
        if r[0]==test_tags[i]:
            correct+=1

    #性能评估
    cm=confusion_matrix(test_tags,testresult)
    print(cm)
    target_names = ['class 0', 'class 1', 'class 2']
    print(classification_report(test_tags,testresult, target_names=target_names))
    print("正确率=" + str(correct/len(test_tags)))
    return


#knn分类
def knn_classify(knn,dataset, dictionary, test_tags):
    data=[]
    testresult=[]
    dlist=list(dictionary.values())
    
    for l in dataset:
       words=""
       for w in l:
         if w in dlist:
            words = words+w+" "
       data.append(words)
            
    #把文档集（由空格隔开的词汇序列组成的文档）转换成为tfidf向量
    v = TfidfVectorizer()
    tdata = v.fit_transform(data)

    correct=0
    #获取测试样本（待分类的眼本），输出分类结果
    for i  in range(len(test_tags)):
        test_X=tdata[i]
        # r=svm.predict(test_X) #此处test_X为特征集
        r=knn.predict(test_X) #此处test_X为特征集
        testresult.append(r[0])
        if r[0]==test_tags[i]:
            correct+=1

    #性能评估
    cm=confusion_matrix(test_tags,testresult)
    print(cm)
    target_names = ['class 0', 'class 1', 'class 2']
    print(classification_report(test_tags,testresult, target_names=target_names))
    print("正确率=" + str(correct/len(test_tags)))
    return

if __name__ == '__main__':
    modeldir=input("请输入模型文件的目录：")
    # svm,dictionary=loadmodel(modeldir)
    knn,dictionary=loadmodel(modeldir)

    trainsdir=input("请输入包含训练集的根目录：")
    testdir=input("请输入包含测试集的根目录：")
    documents,label=load_data(trainsdir,testdir);
    
    dataset=preprocess(documents,dictionary)
    # svm_classify(svm,dataset,dictionary,label)
    knn_classify(knn,dataset,dictionary,label)
    print("分类完成！")

(research) G:\Backup\CollegeProjectBackup\ExperimentalReport\搜
索引擎\实验二\实验三 文本处理与分析\四、 文本分类的实现>python 
 classify.py
请输入模型文件的目录：.
请输入包含训练集的根目录：data\train
请输入包含测试集的根目录：data\test
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\314159~1\AppData\Local\Temp\jieba.cache
Loading model cost 1.171 seconds.
Prefix dict has been built successfully.
[[12  1  7]
 [ 0 16  4]
 [ 0  1 19]]
              precision    recall  f1-score   support

     class 0       1.00      0.60      0.75        20
     class 1       0.89      0.80      0.84        20
     class 2       0.63      0.95      0.76        20

    accuracy                           0.78        60
   macro avg       0.84      0.78      0.78        60
weighted avg       0.84      0.78      0.78        60

正确率=0.7833333333333333
分类完成！

实验四链接分析

一、基于 PageRank 的链接分析

根据pagerank的计算公式： $PR_n(A)=(1-d)/N+d\times(\sum_{i=1}^{m}\frac{PR_{n-1}(T_i)}{C(T_i)}$ ，其中，： $PR_n(A)$ 是网页 A 的 PageRank 值， $PR_{n-1}(T_i)$ 是指网页 $T_i$ 存在指向 A 的链接，并且网页在上一次迭代时的 PageRank 值， $C(T_i)$ 是指网页 $T_i$ 的外链数量。d 是平滑因子，N 是页面总数。

如果将网页间的链接引用看作一个有向图，那么上述计算公式可以理解该次迭代的pagerand值为一堆的常数和 上一次PR值同图的出边数的相除结果并取有出边的做和运算即可 ，所以只需定义一个 有向图的临界矩阵E[n*n] 、 每个点的出边总数C[1*n] 以及一个 存储结果的PR[1*n] 即可完成迭代运算。每一次迭代的计算过程为： $\times (PR / C) \cdot E$ 。

代码如下：

import numpy as np

n, m = map(int, input("点数和边数: ").split())
print(n, m)

E = np.zeros((n, n))

for i in range(m):
    u, v = map(int, input("u->v: ").split())
    E[u - 1][v - 1] = 1

print(E)

C = np.sum(E, axis=1)
print(C)

PR = np.zeros((1, n))
print(PR)

it_num = int(input("迭代次数: "))
d = float(input("平滑因子: "))
const = (1 - d) / n

for i in range(it_num):
    PR = np.dot(PR / C, E) * d + const
    print(PR)

print("final res: " + str(PR))

20多次的迭代计算结果基本收敛：

PS G:\Backup\CollegeProjectBackup\ExperimentalReport\搜索引擎\ 
实验二> python -u "g:\Backup\CollegeProjectBackup\ExperimentalReport\搜索引擎\实验二\实验四 链接分析\一、 基于 PageRank 的链接
分析\pagerank.py"
点数和边数: 3 4
3 4
u->v: 1 2
u->v: 1 3
u->v: 2 3
u->v: 3 1
[[0. 1. 1.]
 [0. 0. 1.]
 [1. 0. 0.]]
[2. 1. 1.]
[[0. 0. 0.]]
迭代次数: 30
平滑因子: 0.5
[[0.16666667 0.16666667 0.16666667]]
[[0.25       0.20833333 0.29166667]]
[[0.3125     0.22916667 0.33333333]]
[[0.33333333 0.24479167 0.359375  ]]
[[0.34635417 0.25       0.37239583]]
[[0.35286458 0.25325521 0.37825521]]
[[0.35579427 0.25488281 0.38151042]]
[[0.35742188 0.25561523 0.38305664]]
[[0.35819499 0.25602214 0.38382975]]
[[0.35858154 0.25621541 0.38422648]]
[[0.35877991 0.25631205 0.38441976]]
[[0.35887655 0.25636164 0.38451767]]
[[0.3589255  0.2563858  0.38456662]]
[[0.35894998 0.25639804 0.38459094]]
[[0.35896214 0.25640416 0.38460318]]
[[0.35896826 0.2564072  0.38460928]]
[[0.35897131 0.25640873 0.38461233]]
[[0.35897283 0.25640949 0.38461386]]
[[0.3589736  0.25640987 0.38461462]]
[[0.35897398 0.25641007 0.384615  ]]
[[0.35897417 0.25641016 0.38461519]]
[[0.35897426 0.25641021 0.38461529]]
[[0.35897431 0.25641023 0.38461534]]
[[0.35897434 0.25641024 0.38461536]]
[[0.35897435 0.25641025 0.38461537]]
[[0.35897435 0.25641025 0.38461538]]
[[0.35897436 0.25641025 0.38461538]]
[[0.35897436 0.25641026 0.38461538]]
[[0.35897436 0.25641026 0.38461538]]
[[0.35897436 0.25641026 0.38461538]]
final res: [[0.35897436 0.25641026 0.38461538]]

HTML
github

飞猪优惠券哪里有领取?飞猪机票优惠券怎么领? 高省APP珊珊
飞猪优惠券的领取方式多样，以下是一些主要的领取途径和具体步骤：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，2000万用户信赖的四年老平台，稳定可靠。高省APP佣金更高，模式更好，终端用户不流失。高省是公认的返利最高的软件。金珊导师高省邀请码666123，注册送2皇冠会员，送万元推广大
文墨绘学：课堂教学秩序备课方法11 临东
为确保正常课堂教学秩序，提高课堂教学质量，特制定以下规定。一、学生上课应做到“三带三不带”（带笔、教科书、笔记本；不带手机、游戏机、食品），自觉遵守课堂纪律，行为不得影响课堂教学和他人学习。二、学生每次上课实行考勤，考勤结果和课堂表现与平时成绩挂钩，且占平时成绩50%。迟到或早退三次，按缺课一次计。三、学生缺课累计超过该门课程教学时数三分之一或缺交作业二分之一，取消该门课程考试资格，且必须重修。四
【详细解析！】Python语法基础小新在学习 python python 开发语言
python基础语法1.优先级：在运算代码的时候，我们优先级是先乘除后加减注意：1.1：在python中，2/3=0.666666而不是0；在python里面的相除就是数学意义上的相除1.2：某一个结果为1.666666666665，而不是667，是因为我们在编程里面是一般是没有四舍五入的概念的；这个结果我们在代码里面称之为浮点数.IEE745标准，在这套规则下，我们在内存中表示浮点数的时候，可能
【云笔记搭建】Visual Code + Github仓库 + Git GPNU_Log github git vscode 云端
0.前言文章目录0.前言1.需要的工具2.工具准备2.1VisualCode2.2Github仓库1.自行注册账号2.点击右上方新建仓库3.填写仓库信息4.获取仓库token2.3git的安装与使用3.笔记的使用及VisualCode插件的推荐3.1新建笔记文件夹3.2插件的推荐3.2.1.PicGo3.2.2markdownlint3.2.3MarkdownAllinone4.一些小技巧4.1改
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
上官芷凝——《故事课：说故事的人最有影响力》读书笔记09 上官芷凝
故事强力胶：相似物转场当你描述一个故事时，七个步骤可以随意组合，但是将两个不相关的情节联系在一起需要借助媒介，用电影中的专有名词就是“转场”。这个词汇我们并不陌生，因为在短视频火爆的时代，每个人都会使用手机去创作和编辑小视频，这时就会用到“转场”，这个功能会让视频与视频衔接得更完美！故事也是如此，情节的连贯和完整，少不了上好的润滑剂。作者在这一章节给出了几个详细的案例：1.《海的女儿》——美人鱼在
Python机器学习：从零基础到项目实战 Yuner2000 Python 机器学习人工智能
目录第一部分：思想与基石——万法归宗，筑基问道第1章：初探智慧之境——机器学习世界观1.1何为学习？从人类学习到机器智能1.2机器学习的“前世今生”：一部思想与技术的演进史1.3为何是Python？——数据科学的“通用语”1.4破除迷思：AI是“神”还是“器”？第2章：工欲善其事——Python环境与核心工具链2.1“乾坤在握”：Anaconda与JupyterNotebook的安装与配置2.2“
冬冬书单｜《理财就是理生活》读书笔记整理咨询师冬冬
每月学复盘，一起水滴石穿，日日精进。最近在看艾玛老师的书籍-《理财就是理生活》穷爸爸常说，”我可付不起”这种消极被动的陈述句，而富爸爸则会说，”我怎么才能付得起？”如果要改变月光的状态，坚定必须改变的决心是第一步，对形成正向现金流保持有强烈的愿望，并且相信自己能够改变，这样才能够打破习惯的禁锢。只要你真心想改，没有什么是改不了的。方法如下:一、降低频率平时我们购买生活必需品以外，其他的每一项享受都
web前端进阶之Javascript设计模式面向对象篇 jia林
前言：在此说明Javascript设计模式所讲内容和知识点来自双越老师（wangEditor富文本开源作者）的视频，内容通俗易懂，受益匪浅，结合自己的学习心得整理成笔记，与大家分享，愿在前端的道路上越走越远.....从“写好代码”到“设计代码”的过程，不仅是技术的提升，更是编程思维的提升，而这其中最关键的就是设计模式，是否理解并掌握设计模式，也是衡量程序员能力的标准之一。学习前提使用过jquery
搜索技巧_野猫学习笔记野猫行天下
自从进入互联网时代，学霸们就越来越霸不了了，因为现在学富五车的人根本干不过会找车的人，你再怎么学富五车，也干不过人家会网络搜索。因此，为了让大家能继续保持学霸的地位，我今天就来跟大家聊聊怎样找车——如何才能利用网络快、准、狠地解决自己的所有问题。01使用专业化、高效的网站什么叫专业化、高效的网站，以了解兰陵王为例，你可以在以下3个网站上搜索，很快就能全方位地了解他（学识力、颜值力、防御力、摧毁力，
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
快速排序Java代码简洁实现 SKY技术修炼指南算法
学习过数据结构的同学们都知道，快速排序算法是一种时间复杂度为O(nlogn)的排序算法，在各种排序算法中算是较为高效的方法，企业面试中也经常有手撕快排的环节。本文将阐述算法的基本思想，并用Java代码的形式实现快速排序代码。算法思想快速排序主要采用分治的基本思想，每次将一个位置上的数据归位，此时该数左边的所有数据都比该数小，右边所有的数据都比该数大，然后递归将已归位的数据左右两边再次进行快排，从而
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
动力节点Spring学习笔记-王鹤（一）IOC控制反转架构师指路
Spring框架学习笔记（一）IOC控制反转官方下载地址动力节点spring资料视频观看地址https://www.bilibili.com/video/BV1nz4y1d7uy一、IOC控制反转1.1概述控制反转（IoC，InversionofControl），是一个概念，是一种思想。指将传统上由程序代码直接操控的对象调用权交给容器，通过容器来实现对象的装配和管理。控制反转就是对对象控制权的转移
系统学习图像算法Day.9——OpenCV学习——形态学滤波敏而好学无止境 OpenCV学习图像算法
形态学滤波定义：在我们图像处理中的形态学，往往指的时数学形态学——是一门建立在格论和拓扑学基础上的图像分析学科。形态学基本操作：膨胀、腐蚀膨胀dilate介绍：膨胀就是求局部最大值的操作。从数学角度讲，膨胀就是讲图像与核进行卷积。核与图像卷积，即计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样会使图像中的高亮区域逐渐增长。函数调用举例：Matimage=imread("
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
【C语言笔记初级篇】第八章：简单调试快乐江湖 C语言基础教程 408王道考研计算机组成原理 c语言
目录（1）Debug和ReleaseA：什么是Debug和Release（2）Windows下的调试A：调试时，确保是DebugB：使用快捷键进行调试C：在调试时查看信息（1）Debug和ReleaseA：什么是Debug和Release第一：DebugDebug：通常称为调试版本，它包含着调试信息，没有做优化。所生产的可执行文件相较于Release版本也较大使用Debug，就会在工程下生成一个D
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
Ubuntu的apt、apt-get和snap闲聊（2025年3月28日）
为什么Ubuntu中有了APT、APT-GET还要加上Snap？在Ubuntu系统中，软件管理工具的多样性（如APT、APT-GET和Snap）常常让人疑惑：既然已经有了成熟的APT和APT-GET，为什么还要引入Snap？本文将从不同角度解析这一问题，探讨Snap的独特价值及其与传统工具的共存意义。这份笔记适用于Linux用户、开发者以及对软件生态感兴趣的读者，内容将随技术演进保持更新。QA：解
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
学习笔记-C语言：数组+字符串函数一只高傲的鹤 C语言学习笔记学习 c语言开发语言
一维数组1.定义数组：变量名称[元素数量]inta[34]floatb[30]C99之前:元素数量必须是编译时刻确定的字面量，示例如下#includeintmain(){intn,i;//元素n为变量printf("请输入字符串的个数：");scanf("%d",&n);chara[n+1];a[n]='\0';printf("请开始输入字符串：");getchar();for(i=0;iintm
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
01-C语言：第01天笔记 Star在努力 c语言笔记开发语言
C语言：第1天笔记内容提要C语言概述数据类型常量变量C语言概述计算机基础计算机的组成计算机组成计算机：能进行计算以及逻辑处理的设备硬件：组成计算机的物理部件。（内存条、CPU、硬盘…）开发中对于硬件的认知：硬件包括电子设备、单片机、集成电路和嵌入式系统。软件：计算机中运行的程序和数据。开发中对于软件的认知：软件分为系统软件（OS）、应用软件和编程工具（编译器）计算机的六大部件中央处理器（CPU）：
02-C语言：第02天笔记 Star在努力 c语言笔记开发语言
C语言：第02天笔记内容提要变量基本数据类型回顾数据类型基本类型：C语言内置整型短整型：short(2字节)基本整型：int(4字节)长整型：long（32位系统4字节/64位系统8字节）长长整型：longlong（8字节，C99新增）浮点型单精度型：float（4字节）双精度型：double(8字节)长双精度型：longdouble(如GCC通常是16字节，MSVC可能是8字节)，取决于编译器。
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

[笔记]搜索引擎-实验报告-实验二

实验目的

实验步骤

实验三 文本处理与分析

一、 文本预处理

1. 词汇切分

二、 倒排文档的实现

三、 向量空间模型的实现

四、 文本分类的实现

实验四 链接分析

一、 基于 PageRank 的链接分析

你可能感兴趣的:(笔记,搜索引擎,python,算法)