m0_37870649

gensim使用方法以及例子---分批处理得到的dict和corpus（重要，大批量文本处理）

转载：https://blog.csdn.net/u014595019/article/details/52218249

gensim是一个python的自然语言处理库，能够将文档根据TF-IDF, LDA, LSI 等模型转化成向量模式，以便进行进一步的处理。此外，gensim还实现了word2vec功能，能够将单词转化为词向量。关于词向量的知识可以看我之前的文章

关于gensim的使用方法，我是根据官网的资料来看的，思路也是跟着官网tutorial走的，英文好的或者感觉我写的不全面的可以去官网看

1. corpora 和 dictionary

1.1 基本概念和用法

corpora是gensim中的一个基本概念，是文档集的表现形式，也是后续进一步处理的基础。从本质上来说，corpora其实是一种格式或者说约定，其实就是一个二维矩阵。举个例子，现在有一个文档集，里面有两篇文档

hurry up
rise up

这两篇文档里总共出现了3个词，hurry, rise, up。如果将这3个词映射到数字，比如说hurry, rise, up 分别对应1,2,3，那么上述的文档集的一种表现形式可以是

1,0,1
0,1,1

这种方法只考虑了词频，且不考虑词语间的位置关系。因为第一个文档中的两个词分别编号1,3且都只出现了一次，所以第1个和第3个为1，第2个数为0。
当然了，在实际运行中，因为单词数量极多（上万甚至10万级别），而一篇文档的单词数是有限的，所以如果还是采用密集矩阵来表示的话，会造成极大的内存浪费，所以gensim内部是用稀疏矩阵的形式来表示的。
那么，如何将字符串形式的文档转化成上述形式呢？这里就要提到词典的概念（dictionary）。词典是所有文档中所有单词的集合，而且记录了各词的出现次数等信息。
在实际的操作中，对于字符串形式的文档，首先要将字符串分割成词语列表。比如”hurry up”要分割成[“hurry”,”up”]。对于中文来讲，分词就是一个很关键的问题，不过可以去找一些分词库来实现。我一般用的是jieba. 而对于英文来说，虽然分词方便，但是要注意词干提取和词形还原。
在将文档分割成词语之后，使用dictionary = corpora.Dictionary(texts)生成词典，并可以使用save函数将词典持久化。生成词典以后 corpus = [dictionary.doc2bow(text) for text in texts]档转化为向量形式。示例代码如下

from gensim import corpora
from collections import defaultdict
documents = ["Human machine interface for lab abc computer applications",
             "A survey of user opinion of computer system response time",
             "The EPS user interface management system",
             "System and human system engineering testing of EPS",
             "Relation of user perceived response time to error measurement",
             "The generation of random binary unordered trees",
             "The intersection graph of paths in trees",
             "Graph minors IV Widths of trees and well quasi ordering",
             "Graph minors A survey"]

# 去掉停用词
stoplist = set('for a of the and to in'.split())
texts = [[word for word in document.lower().split() if word not in stoplist]
         for document in documents]

# 去掉只出现一次的单词
frequency = defaultdict(int)
for text in texts:
    for token in text:
        frequency[token] += 1
texts = [[token for token in text if frequency[token] > 1]
         for text in texts]

dictionary = corpora.Dictionary(texts)   # 生成词典

# 将文档存入字典，字典有很多功能，比如
# diction.token2id 存放的是单词-id key-value对
# diction.dfs 存放的是单词的出现频率
dictionary.save('/tmp/deerwester.dict')  # store the dictionary, for future reference
corpus = [dictionary.doc2bow(text) for text in texts]
corpora.MmCorpus.serialize('/tmp/deerwester.mm', corpus)  # store to disk, for later use

注意最后的corpora.MmCorpus.serialize 将corpus持久化到磁盘中。相反，可以用

corpus = corpora.MmCorpus('/tmp/deerwester.mm')

来从磁盘中读取corpus。

除了MmCorpus以外，还有其他的格式，例如SvmLightCorpus, BleiCorpus, LowCorpus等等，用法类似。

1.2 dictionary的其他一些用法

dictionary还有其他的一些用法，现罗列一部分

dictionary.filter_n_most_frequent(N)
过滤掉出现频率最高的N个单词

dictionary.filter_extremes(no_below=5, no_above=0.5, keep_n=100000)
1.去掉出现次数低于no_below的
2.去掉出现次数高于no_above的。注意这个小数指的是百分数
3.在1和2的基础上，保留出现频率前keep_n的单词

dictionary.filter_tokens(bad_ids=None, good_ids=None)
有两种用法，一种是去掉bad_id对应的词，另一种是保留good_id对应的词而去掉其他词。注意这里bad_ids和good_ids都是列表形式

dictionary.compacity()
在执行完前面的过滤操作以后，可能会造成单词的序号之间有空隙，这时就可以使用该函数来对词典来进行重新排序，去掉这些空隙。

1.3 分批处理和分布式计算结果的汇总

dictionary和corpora的基本用法在上一节已经提过，但是当文本的规模很大时，也许会造成内存不足以容纳文本的情况，这就需要将所有文本分批处理，最后再将各批次计算得到的结果进行汇总。分布式计算时也有类似的需求。

这里假设在两个批次中，分别生成了dict1,corpus1以及dict2,corpus2.
第一步，首先将两个词典合并。当然，如果是先统一生成词典再分批生成词向量的话，可以跳过这一步，因为词典是一样的。
合并词典很简单

dict2_to_dict1 = dict1.merge_with(dict2)

要注意的是，得到的dict2_to_dict1并不是生成后的词典，而是dict2中的单词序号到这些词在合并后词典新序号的映射表。而dict1本身成为合并后的新词典。
第二部，合并corpus
如果之前跳过了第一步，即dict1就是dict2的话，可以直接进行合并。合并有两种方式，一种是

 merged_corpus = [x for x in corpus1] + [x for x in corpus2]

另外一种，则需使用内置的itertools类

merged_corpus = itertools.chain(corpus1, corpus2)
merged_corpus = [x for x in merged_corpus]

如果之前的词典也是分批生成的话，则需要对corpus2进行一定的处理

new_corpus2 = dict2_to_dict1[corpus2]
merged_corpus = itertools.chain(corpus1, new_corpus2)
merged_corpus = [x for x in merged_corpus]

这样，就把分批处理得到的dict和corpus都合并起来了。

2. models

在models中，可以对corpus进行进一步的处理，比如使用tf-idf模型，lsi模型，lda模型等，非常强大。
在按照之前的方法生成了corpus和dictionary以后，就可以生成模型了

tfidf_model = models.TfidfModel(corpus)

注意，目前只是生成了一个模型，但这是类似于生成器，并不是将对应的corpus转化后的结果。对tf-idf模型而言，里面存储有各个单词的词频，文频等信息。想要将文档转化成tf-idf模式表示的向量，还要使用如下命令

corpus_tfidf = tfidf_model[corpus]

对于lda和lsi模型，用法有所不同

lsi_model = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2)
corpus_lsi = lsi_model[corpus_tfidf]

可以看到，这里除了corpus以外，还多了num_topic的选项。这是指的潜在主题(topic)的数目，也等于转成lsi模型以后每个文档对应的向量长度。转化以后的向量在各项的值，即为该文档在该潜在主题的权重。因此lsi和lda的结果也可以看做该文档的文档向量，用于后续的分类，聚类等算法。值得注意的是，id2word是所有模型都有的选项，可以指定使用的词典。

由于这里num_topics=2 ，所以可以用作图的方式直观的显现出来

gensim使用方法以及例子---分批处理得到的dict和corpus（重要，大批量文本处理）_第1张图片

可以很清楚的看到，9个文档可以看成两类，分别是前5行和后4行。

这一部分的代码如下

import os
from gensim import corpora, models, similarities
from pprint import pprint
from matplotlib import pyplot as plt
import logging

# logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

def PrintDictionary(dictionary):
    token2id = dictionary.token2id
    dfs = dictionary.dfs
    token_info = {}
    for word in token2id:
        token_info[word] = dict(
            word = word,
            id = token2id[word],
            freq = dfs[token2id[word]]
        )
    token_items = token_info.values()
    token_items = sorted(token_items, key = lambda x:x['id'])
    print('The info of dictionary: ')
    pprint(token_items)
    print('--------------------------')

def Show2dCorpora(corpus):
    nodes = list(corpus)
    ax0 = [x[0][1] for x in nodes] # 绘制各个doc代表的点
    ax1 = [x[1][1] for x in nodes]
    # print(ax0)
    # print(ax1)
    plt.plot(ax0,ax1,'o')
    plt.show()

if (os.path.exists("/tmp/deerwester.dict")):
    dictionary = corpora.Dictionary.load('/tmp/deerwester.dict')
    corpus = corpora.MmCorpus('/tmp/deerwester.mm')
    print("Used files generated from first tutorial")
else:
    print("Please run first tutorial to generate data set")

PrintDictionary(dictionary)

# 尝试将corpus(bow形式) 转化成tf-idf形式
tfidf_model = models.TfidfModel(corpus) # step 1 -- initialize a model 将文档由按照词频表示 转变为按照tf-idf格式表示
doc_bow = [(0, 1), (1, 1),[4,3]]
doc_tfidf = tfidf_model[doc_bow]

# 将整个corpus转为tf-idf格式
corpus_tfidf = tfidf_model[corpus]
# pprint(list(corpus_tfidf))
# pprint(list(corpus))

## LSI模型 **************************************************
# 转化为lsi模型, 可用作聚类或分类
lsi_model = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2)
corpus_lsi = lsi_model[corpus_tfidf]
nodes = list(corpus_lsi)
# pprint(nodes)
lsi_model.print_topics(2) # 打印各topic的含义

# ax0 = [x[0][1] for x in nodes] # 绘制各个doc代表的点
# ax1 = [x[1][1] for x in nodes]
# print(ax0)
# print(ax1)
# plt.plot(ax0,ax1,'o')
# plt.show()

lsi_model.save('/tmp/model.lsi') # same for tfidf, lda, ...
lsi_model = models.LsiModel.load('/tmp/model.lsi')
#  *********************************************************

## LDA模型 **************************************************
lda_model = models.LdaModel(corpus_tfidf, id2word=dictionary, num_topics=2)
corpus_lda = lda_model[corpus_tfidf]
Show2dCorpora(corpus_lsi)
# nodes = list(corpus_lda)
# pprint(list(corpus_lda))

# 此外，还有Random Projections, Hierarchical Dirichlet Process等模型

3. similarities

这一部分主要负责计算文档间的相似度。与向量的相似度计算方式一样，采用余弦方法计算得到。一般来讲，使用lsi模型得到的向量进行计算效果比较好。

corpus_simi_matrix = similarities.MatrixSimilarity(corpus_lsi)
# 计算一个新的文本与既有文本的相关度
test_text = "Human computer interaction".split()
test_bow = dictionary.doc2bow(test_text)
test_tfidf = tfidf_model[test_bow]
test_lsi = lsi_model[test_tfidf]
test_simi = corpus_simi_matrix[test_lsi]
print(list(enumerate(test_simi)))

得到结果[(0, 0.99916452), (1, 0.99632162), (2, 0.9990505), (3, 0.99886364), (4, 0.99996823), (5, -0.058117405), (6, -0.021589279), (7, 0.013524055), (8, 0.25163394)]。可以看到显然属于第一类

代码调试及其相关LOG：

import os
from gensim import corpora, models, similarities
from pprint import pprint
from matplotlib import pyplot as plt
import logging


# logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

def PrintDictionary(dictionary):
    token2id = dictionary.token2id
    dfs = dictionary.dfs
    token_info = {}
    for word in token2id:
        token_info[word] = dict(
            word=word,
            id=token2id[word],
            freq=dfs[token2id[word]]
        )
    token_items = token_info.values()
    token_items = sorted(token_items, key=lambda x: x['id'])
    print('The info of dictionary: ')
    pprint(token_items)
    print('--------------------------')


def Show2dCorpora(corpus):
    nodes = list(corpus)
    print(nodes)
    ax0 = [x[0][1] for x in nodes]  # 绘制各个doc代表的点
    ax1 = [x[1][1] for x in nodes]
    print("-------------")
    print(ax0)
    print(ax1)
    print("--------------")
    plt.plot(ax0, ax1, 'o')
    plt.show()


if (os.path.exists("./deerwester.dict")):
    dictionary = corpora.Dictionary.load('./deerwester.dict')
    corpus = corpora.MmCorpus('./deerwester.mm')
    print("Used files generated from first tutorial")
else:
    print("Please run first tutorial to generate data set")

PrintDictionary(dictionary)

# 尝试将corpus(bow形式) 转化成tf-idf形式
tfidf_model = models.TfidfModel(corpus)  # step 1 -- initialize a model 将文档由按照词频表示 转变为按照tf-idf格式表示
doc_bow = [(0, 1), (1, 1), [4, 3]]
doc_tfidf = tfidf_model[doc_bow]

# 将整个corpus转为tf-idf格式
corpus_tfidf = tfidf_model[corpus]
pprint(list(corpus_tfidf))
print("11111111111111111")
pprint(list(corpus))
print("222222222222222222")

## LSI模型 **************************************************
# 转化为lsi模型, 可用作聚类或分类
lsi_model = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2)
corpus_lsi = lsi_model[corpus_tfidf]
nodes = list(corpus_lsi)
pprint(nodes)
print("3333333333333333333333333")
topic_list = lsi_model.print_topics(2)  # 打印各topic的含义
print(topic_list)
for topic in topic_list:
    print(topic)
ax0 = [x[0][1] for x in nodes] # 绘制各个doc代表的点
ax1 = [x[1][1] for x in nodes]
print(ax0)
print(ax1)
print("4444444444444444444444444444")
corpus_tfidf_test = tfidf_model[corpus[1]]
corpus_lsi_test = lsi_model[corpus_tfidf_test]
print(corpus_lsi_test)
for topic in corpus_lsi_test:
    print ("%s\t%f\n"%(lsi_model.print_topic(topic[0]), topic[1]))
print("================")

plt.plot(ax0,ax1,'o')
plt.show()

lsi_model.save('./model.lsi')  # same for tfidf, lda, ...
lsi_model = models.LsiModel.load('./model.lsi')
#  *********************************************************

## LDA模型 **************************************************
lda_model = models.LdaModel(corpus_tfidf, id2word=dictionary, num_topics=2)
print("00000000000000000000")
corpus_lda = lda_model[corpus_tfidf]
topic_list = lda_model.print_topics(2)  # 打印各topic的含义
print(topic_list)
for topic in topic_list:
    print(topic)
print("555555555555555555555")
print(corpus_lda)
Show2dCorpora(corpus_lda)
nodes = list(corpus_lda)
pprint(list(corpus_lda))
print("6666666666666666666666")
# 此外，还有Random Projections, Hierarchical Dirichlet Process等模型

corpus_simi_matrix = similarities.MatrixSimilarity(corpus_lsi)
# 计算一个新的文本与既有文本的相关度
test_text = "Human computer interaction".split()
test_bow = dictionary.doc2bow(test_text)
test_tfidf = tfidf_model[test_bow]
test_lsi = lsi_model[test_tfidf]
print(test_lsi)
#lsi_topic=lsi_model.print_topic(2)
#print(lsi_topic)
#for topic in test_lsi:
#print("%s\t%f\n"%(lsi_model.print_topic(topic[0]), topic[1]))
test_simi = corpus_simi_matrix[test_lsi]
print(list(enumerate(test_simi)))

相关调试LOG：

D:\program\anaconda3\python.exe D:/PYTHON/untitled/自然语言处理2.py
D:\program\anaconda3\lib\site-packages\gensim\utils.py:1197: UserWarning: detected Windows; aliasing chunkize to chunkize_serial
  warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")
Used files generated from first tutorial
The info of dictionary: 
[{'freq': 2, 'id': 0, 'word': 'computer'},
 {'freq': 2, 'id': 1, 'word': 'human'},
 {'freq': 2, 'id': 2, 'word': 'interface'},
 {'freq': 2, 'id': 3, 'word': 'response'},
 {'freq': 2, 'id': 4, 'word': 'survey'},
 {'freq': 3, 'id': 5, 'word': 'system'},
 {'freq': 2, 'id': 6, 'word': 'time'},
 {'freq': 3, 'id': 7, 'word': 'user'},
 {'freq': 2, 'id': 8, 'word': 'eps'},
 {'freq': 3, 'id': 9, 'word': 'trees'},
 {'freq': 3, 'id': 10, 'word': 'graph'},
 {'freq': 2, 'id': 11, 'word': 'minors'}]
--------------------------
[[(0, 0.57735026918962573), (1, 0.57735026918962573), (2, 0.57735026918962573)],
 [(0, 0.44424552527467476),
  (3, 0.44424552527467476),
  (4, 0.44424552527467476),
  (5, 0.32448702061385548),
  (6, 0.44424552527467476),
  (7, 0.32448702061385548)],
 [(2, 0.5710059809418182),
  (5, 0.41707573620227772),
  (7, 0.41707573620227772),
  (8, 0.5710059809418182)],
 [(1, 0.49182558987264147), (5, 0.71848116070837686), (8, 0.49182558987264147)],
 [(3, 0.62825804686700459), (6, 0.62825804686700459), (7, 0.45889394536615247)],
 [(9, 1.0)],
 [(9, 0.70710678118654746), (10, 0.70710678118654746)],
 [(9, 0.50804290089167492),
  (10, 0.50804290089167492),
  (11, 0.69554641952003704)],
 [(4, 0.62825804686700459),
  (10, 0.45889394536615247),
  (11, 0.62825804686700459)]]
11111111111111111
[[(0, 1.0), (1, 1.0), (2, 1.0)],
 [(0, 1.0), (3, 1.0), (4, 1.0), (5, 1.0), (6, 1.0), (7, 1.0)],
 [(2, 1.0), (5, 1.0), (7, 1.0), (8, 1.0)],
 [(1, 1.0), (5, 2.0), (8, 1.0)],
 [(3, 1.0), (6, 1.0), (7, 1.0)],
 [(9, 1.0)],
 [(9, 1.0), (10, 1.0)],
 [(9, 1.0), (10, 1.0), (11, 1.0)],
 [(4, 1.0), (10, 1.0), (11, 1.0)]]
222222222222222222
[[(0, 0.066007833960907314), (1, -0.52007033063618413)],
 [(0, 0.1966759285914309), (1, -0.76095631677000353)],
 [(0, 0.089926399724469613), (1, -0.7241860626752501)],
 [(0, 0.075858476521786469), (1, -0.63205515860034245)],
 [(0, 0.10150299184980571), (1, -0.57373084830029519)],
 [(0, 0.70321089393782976), (1, 0.1611518021402632)],
 [(0, 0.87747876731198193), (1, 0.16758906864660034)],
 [(0, 0.90986246868185705), (1, 0.14086553628719645)],
 [(0, 0.61658253505692895), (1, -0.053929075663889769)]]
3333333333333333333333333
[(0, '0.703*"trees" + 0.538*"graph" + 0.402*"minors" + 0.187*"survey" + 0.061*"system" + 0.060*"time" + 0.060*"response" + 0.058*"user" + 0.049*"computer" + 0.035*"interface"'), (1, '-0.460*"system" + -0.373*"user" + -0.332*"eps" + -0.328*"interface" + -0.320*"time" + -0.320*"response" + -0.293*"computer" + -0.280*"human" + -0.171*"survey" + 0.161*"trees"')]
(0, '0.703*"trees" + 0.538*"graph" + 0.402*"minors" + 0.187*"survey" + 0.061*"system" + 0.060*"time" + 0.060*"response" + 0.058*"user" + 0.049*"computer" + 0.035*"interface"')
(1, '-0.460*"system" + -0.373*"user" + -0.332*"eps" + -0.328*"interface" + -0.320*"time" + -0.320*"response" + -0.293*"computer" + -0.280*"human" + -0.171*"survey" + 0.161*"trees"')
[0.066007833960907314, 0.1966759285914309, 0.089926399724469613, 0.075858476521786469, 0.10150299184980571, 0.70321089393782976, 0.87747876731198193, 0.90986246868185705, 0.61658253505692895]
[-0.52007033063618413, -0.76095631677000353, -0.7241860626752501, -0.63205515860034245, -0.57373084830029519, 0.1611518021402632, 0.16758906864660034, 0.14086553628719645, -0.053929075663889769]
4444444444444444444444444444
[(0, 0.1966759285914309), (1, -0.76095631677000353)]
0.703*"trees" + 0.538*"graph" + 0.402*"minors" + 0.187*"survey" + 0.061*"system" + 0.060*"time" + 0.060*"response" + 0.058*"user" + 0.049*"computer" + 0.035*"interface"	0.196676

-0.460*"system" + -0.373*"user" + -0.332*"eps" + -0.328*"interface" + -0.320*"time" + -0.320*"response" + -0.293*"computer" + -0.280*"human" + -0.171*"survey" + 0.161*"trees"	-0.760956

================
00000000000000000000
[(0, '0.134*"trees" + 0.092*"graph" + 0.092*"time" + 0.091*"user" + 0.091*"system" + 0.087*"response" + 0.084*"minors" + 0.075*"eps" + 0.073*"survey" + 0.064*"human"'), (1, '0.106*"interface" + 0.104*"graph" + 0.097*"trees" + 0.089*"computer" + 0.089*"system" + 0.089*"human" + 0.085*"minors" + 0.078*"survey" + 0.075*"eps" + 0.068*"user"')]
(0, '0.134*"trees" + 0.092*"graph" + 0.092*"time" + 0.091*"user" + 0.091*"system" + 0.087*"response" + 0.084*"minors" + 0.075*"eps" + 0.073*"survey" + 0.064*"human"')
(1, '0.106*"interface" + 0.104*"graph" + 0.097*"trees" + 0.089*"computer" + 0.089*"system" + 0.089*"human" + 0.085*"minors" + 0.078*"survey" + 0.075*"eps" + 0.068*"user"')
555555555555555555555

[[(0, 0.22894093), (1, 0.7710591)], [(0, 0.75238353), (1, 0.24761641)], [(0, 0.39810401), (1, 0.60189599)], [(0, 0.43738121), (1, 0.56261885)], [(0, 0.77662122), (1, 0.22337879)], [(0, 0.67815393), (1, 0.32184607)], [(0, 0.65025276), (1, 0.34974718)], [(0, 0.65825796), (1, 0.34174204)], [(0, 0.48540857), (1, 0.5145914)]]
-------------
[0.22894093, 0.75238353, 0.39810401, 0.43738121, 0.77662122, 0.67815393, 0.65025276, 0.65825796, 0.48540857]
[0.7710591, 0.24761641, 0.60189599, 0.56261885, 0.22337879, 0.32184607, 0.34974718, 0.34174204, 0.5145914]
--------------
[[(0, 0.22891715), (1, 0.77108288)],
 [(0, 0.75243366), (1, 0.24756634)],
 [(0, 0.39799061), (1, 0.60200942)],
 [(0, 0.43746999), (1, 0.56253004)],
 [(0, 0.77666193), (1, 0.22333807)],
 [(0, 0.67812955), (1, 0.32187051)],
 [(0, 0.65015185), (1, 0.34984812)],
 [(0, 0.65844059), (1, 0.34155938)],
 [(0, 0.47775084), (1, 0.52224916)]]
6666666666666666666666
[(0, 0.04940858665897447), (1, -0.29287972243952237)]
[(0, 0.99916452), (1, 0.99632162), (2, 0.9990505), (3, 0.99886364), (4, 0.99996823), (5, -0.058117405), (6, -0.021589279), (7, 0.013524055), (8, 0.25163394)]

Process finished with exit code 0

Python机器学习舆情分析项目案例分享数澜悠客数字化转型 python 机器学习开发语言
数据收集与准备1.数据收集多样化数据源：从社交媒体平台（如微博、Twitter）、新闻网站、论坛等多渠道收集数据，以获取更全面的舆情信息。可以使用Python的requests库和网页解析库（如BeautifulSoup）进行网页数据爬取，使用Tweepy库获取Twitter数据。数据标注：对于监督学习，需要对收集到的数据进行标注，标记为积极、消极或中性等类别。可以使用人工标注的方式，也可以利用半
2月第五讲：深度剖析 Python 编程中的数据处理与机器学习应用 2501_90442144 python 机器学习开发语言
一、引言在当今数字化时代，编程已经成为推动各个领域发展的关键力量。Python作为一种高级编程语言，以其简洁、易读、功能强大等特点，在数据处理、机器学习、人工智能等众多领域得到了广泛的应用。本文将深入探讨Python在数据处理和机器学习方面的应用，通过实际案例展示其强大的功能和灵活性，帮助读者更好地理解和掌握Python编程在这些领域的应用技巧。二、Python基础概述2.1Python的特点与优
零基础入门机器学习 -- 第四章分类问题与逻辑回归山海青风 #机器学习机器学习分类逻辑回归 python 人工智能
4.1分类vs回归在机器学习中，任务通常分为两大类：回归（Regression）：用于预测连续数值，如房价、温度、工资等。例如：预测明天的气温（28.5°C）。预测一辆二手车的价格（30,000元）。分类（Classification）：用于预测离散类别，如垃圾邮件vs正常邮件。例如：判断一封邮件是否是垃圾邮件（“垃圾邮件”or“正常邮件”）。预测一个贷款申请是否会被批准（“批准”or“拒绝”）。
利用Blackbox AI让编程更轻松人工智能ai开发图像处理
引言随着人工智能技术的发展，AI已经成为工作中不可缺少的工具之一。俗话讲“术业有专攻”，对AI来说当然也是如此。由于训练集、调教等方面的差别，不同的AI适用的工作也不尽相同。在编程辅助方面，已经有一系列比较成熟的平台，但它们一方面价格昂贵，另一方面功能比较单一。Blackbox.ai是一个新出现的人工智能平台，它主要针对的是编程和机器学习方面的AI技术落地。和其他AI平台相比，它提供了简洁美观的界
Python中的决策树算法探索 Soft_Leader 算法 python 决策树
在Python中，决策树算法是一种常用的机器学习技术，用于分类和回归问题。下面我们将探索如何使用Python中的scikit-learn库来实现决策树算法，并简要介绍其基本概念和用法。1.安装必要的库如果你还没有安装scikit-learn库，你可以使用pip来安装它：bash复制代码pipinstall-Uscikit-learn2.导入必要的库和模块python复制代码fromsklearn.
多模态模型详解换个网名有点难深度学习人工智能计算机视觉
多模态模型是什么多模态模型是一种能够处理和理解多种数据类型（如文本、图像、音频、视频等）的机器学习模型，通过融合不同模态的信息来提升任务的性能。其核心在于利用不同模态之间的互补性，增强模型的鲁棒性和准确性。如何融合多个模型以下是多模态模型的融合方法及关键技术的详细解析：一、多模态模型的核心概念模态定义：单模态：单一类型的数据（如纯文本或纯图像）。多模态：多种类型数据的组合（如“图像+文本”“音频+
Pytorch学习之路（3） AAAx1anyu Pytorch学习之旅学习人工智能 pytorch 深度学习笔记
一.机器学习任务的整体流程1.数据预处理：数据格式统一、异常数据消除、必要数据转换，划分训练集、验证集、测试集2.选择模型3.设定损失函数、优化方法、对应的超参数4.用模型拟合训练集数据，在验证集/测试集上计算模型表现二.数据读入pytorch数据读入通过Dataset+DataLoader的方式完成，Dataset定义好数据的格式和数据变换形式，DataLoader用iterative的方式不断
【收藏不迷路】380种群智能优化算法-Matlab代码免费获取（截至2025.2.14） 88号技师智能优化算法算法 matlab 优化算法人工智能
群智能优化算法可以作为很好的工具来解决许多实际问题，如特征选择、图像分割、医学诊断，经济排放调度问题，植物病害识别，工程设计，PID优化控制，设备故障诊断，机器学习模型参数整定等等。在这个领域，有一个理论：没有免费午餐(NoFreeLunch，NFL)理论。它从逻辑上证明了不存在最适合解决所有优化问题的元启发式算法。换句话说，特定的元启发式可能在一组问题上显示出非常有希望的结果，但相同的算法可能在
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍 weixin_39778582 python 并行框架
前言加州大学伯克利分校实时智能安全执行实验室(RISELab)的研究人员已开发出了一种新的分布式框架，该框架旨在让基于Python的机器学习和深度学习工作负载能够实时执行，并具有类似消息传递接口(MPI)的性能和细粒度。这种框架名为Ray，看起来有望取代Spark，业界认为Spark对于一些现实的人工智能应用而言速度太慢了;过不了一年，Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
【一起看花书1.3】——第5章机器学习基础应有光基础知识机器学习人工智能深度学习
先验是“知识”，是合理的假设本文内容对应于原书的5.7-5.11共5小节内容，其中知识性、结论性的内容偏多，也加入了点个人见解。目录：5.7监督学习5.8无监督学习5.9随机梯度下降5.10构建机器学习算法5.11深度学习发展的动力5.7监督学习监督学习，本质上是复杂函数的拟合，即给定特征xxx,我们需要得到标签yyy，这不就是求一个函数的拟合嘛？线性回归是比较简单的，从高代、概率论就可以理解，甚
《探秘Hogwild!算法：无锁并行SGD的神奇之路》人工智能深度学习
在深度学习和机器学习的领域中，优化算法的效率和性能一直是研究的重点。Hogwild!算法作为一种能够实现无锁并行随机梯度下降（SGD）的创新方法，受到了广泛关注。下面就来深入探讨一下Hogwild!算法是如何实现这一壮举的。基础原理铺垫随机梯度下降（SGD）算法是基于梯度下降算法产生的常见优化算法。其目标是优化损失函数，通过对每一个超参数求偏导得到当前轮的梯度，然后向梯度的反方向更新，不断迭代以获
VSCode通过跳板机免密连接远程服务器的解决方案爱编程的喵喵 Python基础课程 vscode 服务器跳板机免密连接解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了VSCode通过跳板机免密连接远程服
股票自动化交易 reset2021 python
股票自动化交易是指通过编写程序自动执行股票买卖操作，以减少人为干预，提高交易效率和准确性。Python作为一种功能强大且易于上手的编程语言，广泛应用于金融领域，尤其是在量化交易和自动化交易中。本文将介绍如何使用Python实现一个简单的股票自动化交易系统。1.自动化交易的基本流程股票自动化交易通常包括以下几个步骤：数据获取：从交易所或第三方API获取实时股票数据。策略制定：基于技术指标或机器学习模
零基础入门机器学习 -- 第一章什么是机器学习？山海青风 #机器学习机器学习人工智能 python
1.1机器学习的定义机器学习（MachineLearning,ML）是让计算机从数据中学习，然后在没有明确编程的情况下进行预测或决策的技术。传统编程：程序员写出明确的规则，例如“如果温度低于0℃，显示‘结冰’”。机器学习：计算机分析历史天气数据，自行找出“低温→可能结冰”的规律，然后对新数据进行预测。机器学习的核心思想是：数据+算法=经验+预测能力。1.2机器学习vs传统编程特点传统编程机器学习规
机器学习数学基础：21.特征值与特征向量 @心都机器学习概率论人工智能
一、引言在现代科学与工程的众多领域中，线性代数扮演着举足轻重的角色。其中，特征值、特征向量以及相似对角化的概念和方法，不仅是线性代数理论体系的核心部分，更是解决实际问题的有力工具。无论是在物理学中描述系统的振动模式，还是在计算机科学里进行数据降维与图像处理，它们都发挥着关键作用。本教程将深入且全面地对这些内容展开讲解，旨在帮助读者透彻理解并熟练运用相关知识。二、基础知识准备（一）对角矩阵的高次幂计
物流数字化转型：报关单ocr api应用场景、报关单识别接口 OCR_API 接口 ocr
在全球化贸易日益频繁的今天，物流行业的效率和准确性对于企业的竞争力至关重要。翔云报关单OCR（光学字符识别）API助力物流企业实现数字化转型。报关单识别接口是一种通过图像处理和机器学习技术自动识别并提取报关单信息的技术解决方案。它能够快速准确地从纸质或电子版报关单中读取关键数据，如货物名称、数量、金额等，并将其转换为结构化的数字格式。这不仅大大提高了工作效率，还减少了人为错误的可能性。应用场景示例
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 E绵绵 Everything 人工智能科技机器学习大模型 python AIGC 应用
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
大模型稀疏动态架构 deepdata_cn 垂域模型语言模型
DeepSeek应用稀疏动态架构（SparseDynamicArchitecture）是其大模型技术的核心创新点。大模型稀疏动态架构是一种用于构建大规模人工智能模型的先进架构，整体提高了模型的效率、灵活性和性能。一、发展历程1.早期探索阶段起源基础：20世纪8090年代的早期机器学习主要集中在决策树、SVM、KNN等经典算法，模型规模小，依赖手工特征。之后在2006年GeoffreyHinton提
《深度解析：批量、随机和小批量梯度下降的区别与应用》人工智能深度学习
在机器学习和深度学习的领域中，梯度下降算法是优化模型参数的核心工具之一。而批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）是梯度下降算法的三种常见变体，它们在计算效率、收敛速度和准确性等方面各有特点。原理与计算方式批量梯度下降（BGD）：BGD在每次迭代时，都会使用整个训练数据集来计算损失函数的梯度，然后根据梯度更新模型参数。例如，若训练集中有1000个样本，那么每次迭代
【深度学习入门实战】基于Keras的手写数字识别实战（附完整可视化分析）机器学习司猫白深度学习深度学习 keras 人工智能机器学习 python
本人主页：机器学习司猫白ok，话不多说，我们进入正题吧项目概述本案例使用经典的MNIST手写数字数据集，通过Keras构建全连接神经网络，实现0-9数字的分类识别。文章将包含：关键概念图解完整实现代码训练过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
机器学习·逻辑回归 AAA顶置摸鱼 python 深度学习机器学习逻辑回归人工智能
前言逻辑回归虽然名称中有“回归”，但实际上用于分类问题。基于线性回归的模型，通过使用逻辑函数（如Sigmoid函数）将线性组合的结果映射到0到1之间的概率值，用于表示属于某个类别的可能性。一、逻辑回归vs线性回归特性逻辑回归线性回归任务类型分类（二分类为主）回归（预测连续值）输出范围(0,1)（概率值）(-∞,+∞)核心函数Sigmoid函数线性函数损失函数对数损失函数（交叉熵）均方误差（MSE）
Meta AI 最近推出了一款全新的机器学习框架ParetoQ，专门用于大型语言模型的4-bit 以下量化新加坡内哥谈技术人工智能语言模型自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/MetaAI最近推出了一款全新的机器学习框架——ParetoQ，专门用于大型语言模型的4
书籍-《机器学习数学基础》机器学习深度学习数学
书籍：MathematicsforMachineLearning作者：MarcPeterDeisenroth，A.AldoFaisal，ChengSoonOng出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习数学基础》01书籍介绍理解机器学习所需的基本数学工具包括线性代数、解析几何、矩阵分解、向量微积分、最优化、概率论和统计学。这
零基础入门机器学习 -- 第三章第一个机器学习模型——线性回归山海青风 #机器学习人工智能机器学习回归线性回归 python
3.1线性回归的概念在现实生活中，许多事情都遵循某种线性关系，比如：房价vs面积：房子的面积越大，价格通常越高。工资vs工作经验：工作经验越多，薪资往往更高。汽车油耗vs车速：在一定范围内，车速越快，油耗可能越高。线性回归（LinearRegression）是机器学习中最基础的算法之一，它用于研究两个变量之间的线性关系，即一个变量（自变量）如何影响另一个变量（因变量）。3.2线性回归的数学直觉线性
零基础入门机器学习 -- 第二章机器学习的基本流程山海青风 #机器学习机器学习 python 人工智能
1.机器学习的五个基本步骤在机器学习项目中，我们通常遵循以下步骤：收集数据：获取数据集，例如从文件、数据库或在线资源。清洗和预处理数据：处理缺失值、去除异常数据、转换数据格式等。选择合适的模型：不同任务适合不同模型，如分类使用逻辑回归、决策树等。训练模型：让模型从数据中学习模式并调整参数。评估模型：检查模型的准确率，以判断效果是否良好。本章会通过电影评分预测的示例，帮助你快速体验从数据到模型的基本
数学到底在哪里支撑着编程数学
在编程的世界里，数学并非只是一个学科，它实际上是支撑整个编程基础的支柱之一。数学不仅为编程提供了理论框架，它的各种理论和方法被用来提升代码效率、优化算法、设计系统架构、分析数据、以及确保程序的正确性。编程中的很多技术，从数据结构的选择到算法的设计、从性能优化到人工智能的构建，都离不开数学的支撑。在这篇文章中，我们将从多个方面深入探讨数学如何在编程中发挥作用，包括算法设计、数据结构优化、机器学习、图
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战 AI知识分享官人工智能 langchain 算法数据挖掘计算机视觉机器学习产品经理
大模型微调实战：精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战，人工智能视频课程-多模态大模型，微调技术训练营，大模型多场景实战，AI图像处理，AI量化投资，OPenCV视觉处理，机器学习，Pytorch深度学习，推荐系统，自动驾驶，训练私有大模型，LLM大语言模型，大模型多场景实战，Agent智能应用，AIGC实战落地，ChatGPT虚拟数字人，Djourney智
自然语言处理（NLP）入门：基础概念与应用场景 Ash Butterfield nlp 自然语言处理人工智能
什么是自然语言处理（NLP）？自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个重要分支，研究如何让计算机理解、生成、分析和与人类语言进行交互。换句话说，NLP是让机器像人一样“读、写、听、说”的技术，它结合了语言学、机器学习、计算机科学等多学科知识。NLP的核心目标是将非结构化的自然语言（如文本和语音）转化为结构化数据，使机器能够高效处理、分析和生
机器学习算法工程师笔试选择题（1） Ash Butterfield 机器学习算法人工智能
1.关于梯度下降的说法正确的是：A.梯度下降法可以确保找到全局最优解。B.随机梯度下降每次使用所有数据来更新参数。C.批量梯度下降（BatchGradientDescent）通常收敛更快。D.学习率过大会导致梯度下降过程震荡。答案：D（学习率过大会导致不稳定，可能震荡或无法收敛）2.在以下算法中，哪种算法属于无监督学习？A.逻辑回归B.K-近邻算法C.支持向量机D.K-均值聚类答案：D（K-均值聚
多模态大模型（LMMs）与大语言模型（LLMs）的比较大F的智能小课底层技术解析人工智能语言模型
前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。本文将从基础定义、输入数据、应用场景、训练过程这几方面讨论下两者的区别。基础定义LLMs(LargeLanguageModels,大型语言模型)-深度学习的应用之一，是基于深度学习的大规模机器学习模型，通常由数十亿到数万亿个参数构
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置