Healer0218

准确度的陷阱与混淆矩阵

import numpy as np

def confusion_matrix(y_true, y_predict):

'''

构建二分类的混淆矩阵，并将其返回

:param y_true: 真实类别，类型为ndarray

:param y_predict: 预测类别，类型为ndarray

:return: shape为(2, 2)的ndarray

'''

#********* Begin *********#

def TN(y_true, y_predict):

return np.sum((y_true == 0) & (y_predict == 0))

def FP(y_true, y_predict):

return np.sum((y_true == 0) & (y_predict == 1))

def FN(y_true, y_predict):

return np.sum((y_true == 1) & (y_predict == 0))

def TP(y_true, y_predict):

return np.sum((y_true == 1) & (y_predict == 1))

return np.array([

[TN(y_true, y_predict), FP(y_true, y_predict)],

[FN(y_true, y_predict), TP(y_true, y_predict)]

])

#********* End *********#

第7关：精准率与召回率

import numpy as np

def precision_score(y_true, y_predict):

'''

计算精准率并返回

:param y_true: 真实类别，类型为ndarray

:param y_predict: 预测类别，类型为ndarray

:return: 精准率，类型为float

'''

#********* Begin *********#

def TP(y_true, y_predict):

return np.sum((y_true ==1)&(y_predict == 1))

def FP(y_true,y_predict):

return np.sum((y_true ==0)&(y_predict==1))

tp =TP(y_true, y_predict)

fp =FP(y_true, y_predict)

try:

return tp /(tp+fp)

except:

return 0.0

#********* End *********#

def recall_score(y_true, y_predict):

'''

计算召回率并召回

:param y_true: 真实类别，类型为ndarray

:param y_predict: 预测类别，类型为ndarray

:return: 召回率，类型为float

'''

#********* Begin *********#

def FN(y_true, y_predict):

return np.sum((y_true ==1)&(y_predict == 0))

def TP(y_true,y_predict):

return np.sum((y_true ==1)&(y_predict==1))

fn =FN(y_true, y_predict)

tp =TP(y_true, y_predict)

try:

return tp /(tp+fn)

except:

return 0.0

#********* End *********#

第8关：F1 Score

import numpy as np

def f1_score(precision, recall):

'''

计算f1 score并返回

:param precision: 模型的精准率，类型为float

:param recall: 模型的召回率，类型为float

:return: 模型的f1 score，类型为float

'''

#********* Begin *********#

try:

return 2*precision*recall / (precision+recall)

except:

return 0.0

#********* End ***********#

第9关：ROC曲线与AUC

import numpy as np

def calAUC(prob, labels):

'''

计算AUC并返回

:param prob: 模型预测样本为Positive的概率列表，类型为ndarray

:param labels: 样本的真实类别列表，其中1表示Positive，0表示Negtive，类型为ndarray

:return: AUC，类型为float

'''

#********* Begin *********#

a= list(zip(prob,labels))

rank =[values2 for values1,values2 in sorted(a, key=lambda x:x[0])]

rankList=[i+1 for i in range(len(rank))if rank[i] ==1]

posNum =0

negNum =0

for i in range(len(labels)):

if(labels[i]==1):

posNum+=1

else:

negNum+=1

auc= (sum(rankList)-(posNum*(posNum+1))/2)/(posNum*negNum)

return auc

#********* End *********#

第10关：sklearn中的分类性能指标

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

def classification_performance(y_true, y_pred, y_prob):

'''

返回准确度、精准率、召回率、f1 Score和AUC

:param y_true:样本的真实类别，类型为`ndarray`

:param y_pred:模型预测出的类别，类型为`ndarray`

:param y_prob:模型预测样本为`Positive`的概率，类型为`ndarray`

:return:

'''

#********* Begin *********#

return accuracy_score(y_true, y_pred),precision_score(y_true, y_pred),recall_score(y_true, y_pred),f1_score(y_true, y_pred),roc_auc_score(y_true, y_prob)

#********* End *********#

第2关：线性回归的正规方程解

#encoding=utf8

import numpy as np

def mse_score(y_predict,y_test):

'''

input:y_predict(ndarray):预测值

y_test(ndarray):真实值

ouput:mse(float):mse损失函数值

'''

#********* Begin *********#

mse = np.mean((y_predict-y_test)**2)

#********* End *********#

return mse

class LinearRegression :

def __init__(self):

'''初始化线性回归模型'''

self.theta = None

def fit_normal(self,train_data,train_label):

'''

input:train_data(ndarray):训练样本

train_label(ndarray):训练标签

'''

#********* Begin *********#

x = np.hstack([np.ones((len(train_data),1)),train_data])

self.theta =np.linalg.inv(x.T.dot(x)).dot(x.T).dot(train_label)

#********* End *********#

return self.theta

def predict(self,test_data):

'''

input:test_data(ndarray):测试样本

'''

#********* Begin *********#

x = np.hstack([np.ones((len(test_data),1)),test_data])

return x.dot(self.theta)

#********* End *********#

第3关：衡量线性回归的性能指标

#encoding=utf8

import numpy as np

#mse

def mse_score(y_predict,y_test):

mse = np.mean((y_predict-y_test)**2)

return mse

#r2

def r2_score(y_predict,y_test):

'''

input:y_predict(ndarray):预测值

y_test(ndarray):真实值

output:r2(float):r2值

'''

#********* Begin *********#

r2 =1-mse_score(y_predict,y_test)/np.var(y_test)

#********* End *********#

return r2

class LinearRegression :

def __init__(self):

'''初始化线性回归模型'''

self.theta = None

def fit_normal(self,train_data,train_label):

'''

input:train_data(ndarray):训练样本

train_label(ndarray):训练标签

'''

#********* Begin *********#

x = np.hstack([np.ones((len(train_data),1)),train_data])

self.theta =np.linalg.inv(x.T.dot(x)).dot(x.T).dot(train_label)

#********* End *********#

return self

def predict(self,test_data):

'''

input:test_data(ndarray):测试样本

'''

#********* Begin *********#

x = np.hstack([np.ones((len(test_data),1)),test_data])

return x.dot(self.theta)

#********* End *********#

第4关：scikit-learn线性回归实践 - 波斯顿房价预测

#encoding=utf8

#********* Begin *********#

import pandas as pd

from sklearn.linear_model import LinearRegression

train_data = pd.read_csv('./step3/train_data.csv')

train_label = pd.read_csv('./step3/train_label.csv')

train_label = train_label['target']

test_data = pd.read_csv('./step3/test_data.csv')

lr = LinearRegression()

lr.fit(train_data,train_label)

predict = lr.predict(test_data)

df = pd.DataFrame({

'result':predict})

df.to_csv('./step3/result.csv', index=False)

#********* End *********#

第1关：实现kNN算法

#encoding=utf8

import numpy as np

class kNNClassifier(object):

def __init__(self, k):

'''

初始化函数

:param k:kNN算法中的k

'''

self.k = k

# 用来存放训练数据，类型为ndarray

self.train_feature = None

# 用来存放训练标签，类型为ndarray

self.train_label = None

def fit(self, feature, label):

'''

kNN算法的训练过程

:param feature: 训练集数据，类型为ndarray

:param label: 训练集标签，类型为ndarray

:return: 无返回

'''

#********* Begin *********#

self.train_feature = np.array(feature)

self.train_label = np.array(label)

#********* End *********#

def predict(self, feature):

'''

kNN算法的预测过程

:param feature: 测试集数据，类型为ndarray

:return: 预测结果，类型为ndarray或list

'''

#********* Begin *********#、

def _predict(test_data):

distances = [np.sqrt(np.sum((test_data - vec) ** 2)) for vec in self.train_feature]

nearest = np.argsort(distances)

topK = [self.train_label[i] for i in nearest[:self.k]]

votes = {}

result = None

max_count = 0

for label in topK:

if label in votes.keys():

votes[label] += 1

if votes[label] > max_count:

max_count = votes[label]

result = label

else:

votes[label] = 1

if votes[label] > max_count:

max_count = votes[label]

result = label

return result

predict_result = [_predict(test_data) for test_data in feature]

return predict_result

#********* End *********#

第2关：红酒分类

from sklearn.neighbors import KNeighborsClassifier

from sklearn.preprocessing import StandardScaler

def classification(train_feature, train_label, test_feature):

'''

对test_feature进行红酒分类

:param train_feature: 训练集数据，类型为ndarray

:param train_label: 训练集标签，类型为ndarray

:param test_feature: 测试集数据，类型为ndarray

:return: 测试集数据的分类结果

'''

#********* Begin *********#

scaler = StandardScaler()

train_feature = scaler.fit_transform(train_feature)

test_feature = scaler.transform(test_feature)

clf = KNeighborsClassifier()

clf.fit(train_feature, train_label)

return clf.predict(test_feature)

#********* End **********#

第3关：朴素贝叶斯分类算法流程

import numpy as np

class NaiveBayesClassifier(object):

def __init__(self):

'''

self.label_prob表示每种类别在数据中出现的概率

例如，{0:0.333, 1:0.667}表示数据中类别0出现的概率为0.333，类别1的概率为0.667

'''

self.label_prob = {}

'''

self.condition_prob表示每种类别确定的条件下各个特征出现的概率

例如训练数据集中的特征为 [[2, 1, 1],

[1, 2, 2],

[2, 2, 2],

[2, 1, 2],

[1, 2, 3]]

标签为[1, 0, 1, 0, 1]

那么当标签为0时第0列的值为1的概率为0.5，值为2的概率为0.5;

当标签为0时第1列的值为1的概率为0.5，值为2的概率为0.5;

当标签为0时第2列的值为1的概率为0，值为2的概率为1，值为3的概率为0;

当标签为1时第0列的值为1的概率为0.333，值为2的概率为0.666;

当标签为1时第1列的值为1的概率为0.333，值为2的概率为0.666;

当标签为1时第2列的值为1的概率为0.333，值为2的概率为0.333,值为3的概率为0.333;

因此self.label_prob的值如下：

{

0:{

1:0.5

2:0.5

}

1:{

1:0.5

2:0.5

}

2:{

1:0

2:1

3:0

}

{

0:{

1:0.333

2:0.666

}

1:{

1:0.333

2:0.666

}

2:{

1:0.333

2:0.333

3:0.333

}

'''

self.condition_prob = {}

def fit(self, feature, label):

'''

对模型进行训练，需要将各种概率分别保存在self.label_prob和self.condition_prob中

:param feature: 训练数据集所有特征组成的ndarray

:param label:训练数据集中所有标签组成的ndarray

:return: 无返回

'''

#********* Begin *********#

row_num = len(feature)

col_num = len(feature[0])

for c in label:

if c in self.label_prob:

self.label_prob[c] +=1

else:

self.label_prob[c]=1

for key in self.label_prob.keys():

self.label_prob[key]/=row_num

self.condition_prob[key] = {}

for i in range(col_num):

self.condition_prob[key][i] = {}

for k in np.unique(feature[:,i],axis=0):

self.condition_prob[key][i][k]=0

for i in range(len(feature)):

for j in range(len(feature[i])):

# if feature[i][j] in self.condition_prob[label[i]]:

if feature[i][j] in self.condition_prob[label[i]]:

self.condition_prob[label[i]][j][feature[i][j]] +=1

# self.condition_prob[label[i][j][feature[i][j]] +=1

else:

self.condition_prob[label[i]][j][feature[i][j]] =1

for label_key in self.condition_prob.keys():

for k in self.condition_prob[label_key].keys():

total =0

for v in self.condition_prob[label_key][k].values():

total +=v

for kk in self.condition_prob[label_key][k].keys():

self.condition_prob[label_key][k][kk] /=total

#********* End *********#

def predict(self, feature):

'''

对数据进行预测，返回预测结果

:param feature:测试数据集所有特征组成的ndarray

:return:

'''

# ********* Begin *********#

result = []

for i,f in enumerate(feature):

prob = np.zeros(len(self.label_prob.keys()))

ii = 0

for label,label_prob in self.label_prob.items():

prob[ii] = label_prob

for j in range(len(feature[0])):

prob[ii] *=self.condition_prob[label][j][f[j]]

ii+=1

result.append(list(self.label_prob.keys())[np.argmax(prob)])

return np.array(result)

#********* End *********#

第4关：拉普拉斯平滑

import numpy as np

class NaiveBayesClassifier(object):

def __init__(self):

'''

self.label_prob表示每种类别在数据中出现的概率

例如，{0:0.333, 1:0.667}表示数据中类别0出现的概率为0.333，类别1的概率为0.667

'''

self.label_prob = {}

'''

self.condition_prob表示每种类别确定的条件下各个特征出现的概率

例如训练数据集中的特征为 [[2, 1, 1],

[1, 2, 2],

[2, 2, 2],

[2, 1, 2],

[1, 2, 3]]

标签为[1, 0, 1, 0, 1]

那么当标签为0时第0列的值为1的概率为0.5，值为2的概率为0.5;

当标签为0时第1列的值为1的概率为0.5，值为2的概率为0.5;

当标签为0时第2列的值为1的概率为0，值为2的概率为1，值为3的概率为0;

当标签为1时第0列的值为1的概率为0.333，值为2的概率为0.666;

当标签为1时第1列的值为1的概率为0.333，值为2的概率为0.666;

当标签为1时第2列的值为1的概率为0.333，值为2的概率为0.333,值为3的概率为0.333;

因此self.label_prob的值如下：

{

0:{

1:0.5

2:0.5

}

1:{

1:0.5

2:0.5

}

2:{

1:0

2:1

3:0

}

{

0:{

1:0.333

2:0.666

}

1:{

1:0.333

2:0.666

}

2:{

1:0.333

2:0.333

3:0.333

}

'''

self.condition_prob = {}

def fit(self, feature, label):

'''

对模型进行训练，需要将各种概率分别保存在self.label_prob和self.condition_prob中

:param feature: 训练数据集所有特征组成的ndarray

:param label:训练数据集中所有标签组成的ndarray

:return: 无返回

'''

#********* Begin *********#

row_num = len(feature)

col_num = len(feature[0])

unique_label_count = len(set(label))

for c in label:

if c in self.label_prob:

self.label_prob[c] +=1

else:

self.label_prob[c] =1

for key in self.label_prob.keys():

self.label_prob[key] +=1

self.label_prob[key] /=(unique_label_count+row_num)

self.condition_prob[key] = {}

for i in range(col_num):

self.condition_prob[key][i] = {}

for k in np.unique(feature[:,i],axis=0):

self.condition_prob[key][i][k] = 1

for i in range(len(feature)):

for j in range(len(feature[i])):

if feature[i][j] in self.condition_prob[label[i]]:

self.condition_prob[label[i]][j][feature[i][j]] +=1

for label_key in self.condition_prob.keys():

for k in self.condition_prob[label_key].keys():

total = len(self.condition_prob[label_key].keys())

for v in self.condition_prob[label_key][k].values():

total +=v

for kk in self.condition_prob[label_key][key].keys():

self.condition_prob[label_key][k][kk] /=total

#********* End *********#

def predict(self, feature):

'''

对数据进行预测，返回预测结果

:param feature:测试数据集所有特征组成的ndarray

:return:

'''

result = []

# 对每条测试数据都进行预测

for i, f in enumerate(feature):

# 可能的类别的概率

prob = np.zeros(len(self.label_prob.keys()))

ii = 0

for label, label_prob in self.label_prob.items():

# 计算概率

prob[ii] = label_prob

for j in range(len(feature[0])):

prob[ii] *= self.condition_prob[label][j][f[j]]

ii += 1

# 取概率最大的类别作为结果

result.append(list(self.label_prob.keys())[np.argmax(prob)])

return np.array(result)

第5关：新闻文本主题分类

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn.feature_extraction.text import TfidfTransformer

def news_predict(train_sample, train_label, test_sample):

'''

训练模型并进行预测，返回预测结果

:param train_sample:原始训练集中的新闻文本，类型为ndarray

:param train_label:训练集中新闻文本对应的主题标签，类型为ndarray

:param test_sample:原始测试集中的新闻文本，类型为ndarray

:return 预测结果，类型为ndarray

'''

#********* Begin *********#

vec = CountVectorizer()

train_sample = vec.fit_transform(train_sample)

test_sample = vec.transform(test_sample)

tfidf = TfidfTransformer()

train_sample = tfidf.fit_transform(train_sample)

test_sample = tfidf.transform(test_sample)

mnb = MultinomialNB(alpha = 0.01)

mnb.fit(train_sample,train_label)

predict = mnb.predict(test_sample)

return predict

#********* End *********#

第2关：Adaboost算法

# encoding=utf8

import numpy as np

from sklearn.tree import DecisionTreeClassifier

from sklearn.ensemble import AdaBoostClassifier

# adaboost算法

class AdaBoost:

'''

input:n_estimators(int):迭代轮数

learning_rate(float):弱分类器权重缩减系数

'''

def __init__(self, n_estimators=50, learning_rate=1.0):

self.clf_num = n_estimators

self.learning_rate = learning_rate

def init_args(self, datasets, labels):

self.X = datasets

self.Y = labels

self.M, self.N = datasets.shape

# 弱分类器数目和集合

self.clf_sets = []

# 初始化weights

self.weights = [1.0 / self.M] * self.M

# G(x)系数 alpha

self.alpha = []

# ********* Begin *********#

def _G(self, features, labels, weights):

'''

input:features(ndarray):数据特征

labels(ndarray):数据标签

weights(ndarray):样本权重系数

'''

e = 0

for i in range(weights.shape[0]):

if (labels[i] == self.G(self.X[i], self.clif_sets, self.alpha)):

e += weights[i]

return e

# 计算alpha

def _alpha(self, error):

return 0.5 * np.log((1 - error) / error)

# 规范化因子

def _Z(self, weights, a, clf):

return np.sum(weights * np.exp(-a * self.Y * self.G(self.X, clf, self.alpha)))

# 权值更新

def _w(self, a, clf, Z):

w = np.zeros(self.weights.shape)

for i in range(self.M):

w[i] = weights[i] * np.exp(-a * self.Y[i] * G(x, clf, self.alpha)) / Z

self.weights = w

# G(x)的线性组合

def G(self, x, v, direct):

result = 0

x = x.reshape(1, -1)

for i in range(len(v)):

result += v[i].predict(x) * direct[i]

return result

def fit(self, X, y):

'''

X(ndarray):训练数据

y(ndarray):训练标签

'''

# 计算G(x)系数a

self.init_args(X, y)

'''

for i in range(100):

classifier = DecisionTreeClassifier(max_depth=3)

classifier.fit(X, y)

self.clf_sets.append(classifier)

e = 0

for i in range(len(self.weights)):

temp = -1

if classifier.predict(X[i].reshape(1,-1))>0:

temp = 1

if(self.Y[i] == temp):

e += self.weights[i]

a = self._alpha(e)

self.alpha.append(a)

z = self._Z(self.weights, a, self.clf_sets)

self._w(a, self.clf_sets, z)

'''

# 记录分类器

# 规范化因子

# 权值更新

def predict(self, data):

'''

input:data(ndarray):单个样本

output:预测为正样本返回+1，负样本返回-1

'''

ada = AdaBoostClassifier(n_estimators=100, learning_rate=0.1)

ada.fit(self.X, self.Y)

data = data.reshape(1, -1)

predict = ada.predict(data)

return predict[0]

# ********* End *********#

第3关：sklearn中的Adaboost

#encoding=utf8

from sklearn.tree import DecisionTreeClassifier

from sklearn.ensemble import AdaBoostClassifier

def ada_classifier(train_data,train_label,test_data):

'''

input:train_data(ndarray):训练数据

train_label(ndarray):训练标签

test_data(ndarray):测试标签

output:predict(ndarray):预测结果

'''

#********* Begin *********#

ada=AdaBoostClassifier(n_estimators=100,learning_rate=1.0)

ada.fit(train_data,train_label)

predict = ada.predict(test_data)

#********* End *********#

return predict

第2关：线性支持向量机

#encoding=utf8

from sklearn.svm import LinearSVC

def linearsvc_predict(train_data,train_label,test_data):

'''

input:train_data(ndarray):训练数据

train_label(ndarray):训练标签

output:predict(ndarray):测试集预测标签

'''

#********* Begin *********#

clf = LinearSVC(dual=False)

clf.fit(train_data,train_label)

predict = clf.predict(test_data)

#********* End *********#

return predict

第3关：非线性支持向量机

#encoding=utf8

from sklearn.svm import SVC

def svc_predict(train_data,train_label,test_data,kernel):

'''

input:train_data(ndarray):训练数据

train_label(ndarray):训练标签

kernel(str):使用核函数类型:

'linear':线性核函数

'poly':多项式核函数

'rbf':径像核函数/高斯核

output:predict(ndarray):测试集预测标签

'''

#********* Begin *********#

clf =SVC(kernel=kernel)

clf.fit(train_data,train_label)

predict = clf.predict(test_data)

#********* End *********#

return predict

第4关：序列最小优化算法

#encoding=utf8

import numpy as np

class smo:

def __init__(self, max_iter=100, kernel='linear'):

'''

input:max_iter(int):最大训练轮数

kernel(str):核函数，等于'linear'表示线性，等于'poly'表示多项式

'''

self.max_iter = max_iter

self._kernel = kernel

#初始化模型

def init_args(self, features, labels):

self.m, self.n = features.shape

self.X = features

self.Y = labels

self.b = 0.0

# 将Ei保存在一个列表里

self.alpha = np.ones(self.m)

self.E = [self._E(i) for i in range(self.m)]

# 错误惩罚参数

self.C = 1.0

#********* Begin *********#

#kkt条件

def _KKT(self, i):

y_g = self._g(i)*self.Y[i]

if self.alpha[i] == 0:

return y_g >= 1

elif 0 < self.alpha[i] < self.C:

return y_g == 1

else:

return y_g <= 1

# g(x)预测值，输入xi（X[i]）

def _g(self, i):

r = self.b

for j in range(self.m):

r += self.alpha[j]*self.Y[j]*self.kernel(self.X[i], self.X[j])

return r

# 核函数,多项式添加二次项即可

def kernel(self, x1, x2):

if self._kernel == 'linear':

return sum([x1[k]*x2[k] for k in range(self.n)])

elif self._kernel == 'poly':

return (sum([x1[k]*x2[k] for k in range(self.n)]) + 1)**2

return 0

# E（x）为g(x)对输入x的预测值和y的差

def _E(self, i):

return self._g(i) - self.Y[i]

#初始alpha

def _init_alpha(self):

# 外层循环首先遍历所有满足0

index_list = [i for i in range(self.m) if 0 < self.alpha[i] < self.C]

# 否则遍历整个训练集

non_satisfy_list = [i for i in range(self.m) if i not in index_list]

index_list.extend(non_satisfy_list)

for i in index_list:

if self._KKT(i):

continue

E1 = self.E[i]

# 如果E2是+，选择最小的；如果E2是负的，选择最大的

if E1 >= 0:

j = min(range(self.m), key=lambda x: self.E[x])

else:

j = max(range(self.m), key=lambda x: self.E[x])

return i, j

#选择alpha参数

def _compare(self, _alpha, L, H):

if _alpha > H:

return H

elif _alpha < L:

return L

else:

return _alpha

#训练

def fit(self, features, labels):

'''

input:features(ndarray):特征

label(ndarray):标签

'''

self.init_args(features, labels)

for t in range(self.max_iter):

i1, i2 = self._init_alpha()

# 边界

if self.Y[i1] == self.Y[i2]:

L = max(0, self.alpha[i1]+self.alpha[i2]-self.C)

H = min(self.C, self.alpha[i1]+self.alpha[i2])

else:

L = max(0, self.alpha[i2]-self.alpha[i1])

H = min(self.C, self.C+self.alpha[i2]-self.alpha[i1])

E1 = self.E[i1]

E2 = self.E[i2]

# eta=K11+K22-2K12

eta = self.kernel(self.X[i1], self.X[i1]) + self.kernel(self.X[i2], self.X[i2]) - 2*self.kernel(self.X[i1], self.X[i2])

if eta <= 0:

continue

alpha2_new_unc = self.alpha[i2] + self.Y[i2] * (E2 - E1) / eta

alpha2_new = self._compare(alpha2_new_unc, L, H)

alpha1_new = self.alpha[i1] + self.Y[i1] * self.Y[i2] * (self.alpha[i2] - alpha2_new)

b1_new = -E1 - self.Y[i1] * self.kernel(self.X[i1], self.X[i1]) * (alpha1_new-self.alpha[i1]) - self.Y[i2] * self.kernel(self.X[i2], self.X[i1]) * (alpha2_new-self.alpha[i2])+ self.b

b2_new = -E2 - self.Y[i1] * self.kernel(self.X[i1], self.X[i2]) * (alpha1_new-self.alpha[i1]) - self.Y[i2] * self.kernel(self.X[i2], self.X[i2]) * (alpha2_new-self.alpha[i2])+ self.b

if 0 < alpha1_new < self.C:

b_new = b1_new

elif 0 < alpha2_new < self.C:

b_new = b2_new

else:

# 选择中点

b_new = (b1_new + b2_new) / 2

# 更新参数

self.alpha[i1] = alpha1_new

self.alpha[i2] = alpha2_new

self.b = b_new

self.E[i1] = self._E(i1)

self.E[i2] = self._E(i2)

def predict(self, data):

'''

input:data(ndarray):单个样本

output:预测为正样本返回+1，负样本返回-1

'''

r = self.b

for i in range(self.m):

r += self.alpha[i] * self.Y[i] * self.kernel(data, self.X[i])

return 1 if r > 0 else -1

#********* End *********#

第5关：支持向量回归

#encoding=utf8

from sklearn.svm import SVR

def svr_predict(train_data,train_label,test_data):

'''

input:train_data(ndarray):训练数据

train_label(ndarray):训练标签

output:predict(ndarray):测试集预测标签

'''

#********* Begin *********#

svr = SVR(kernel='rbf',C=100,gamma= 0.001,epsilon=0.1)

svr.fit(train_data,train_label)

predict = svr.predict(test_data)

#********* End *********#

return predict

第2关：决策树算法原理

#encoding=utf8

import numpy as np

def mse_score(y_predict,y_test):

'''

input:y_predict(ndarray):预测值

y_test(ndarray):真实值

ouput:mse(float):mse损失函数值

'''

#********* Begin *********#

mse = np.mean((y_predict-y_test)**2)

#********* End *********#

return mse

class LinearRegression :

def __init__(self):

'''初始化线性回归模型'''

self.theta = None

def fit_normal(self,train_data,train_label):

'''

input:train_data(ndarray):训练样本

train_label(ndarray):训练标签

'''

#********* Begin *********#

x = np.hstack([np.ones((len(train_data),1)),train_data])

self.theta =np.linalg.inv(x.T.dot(x)).dot(x.T).dot(train_label)

#********* End *********#

return self.theta

def predict(self,test_data):

'''

input:test_data(ndarray):测试样本

'''

#********* Begin *********#

x = np.hstack([np.ones((len(test_data),1)),test_data])

return x.dot(self.theta)

#********* End *********#

第3关：动手实现ID3决策树

import numpy as np

# 计算熵

def calcInfoEntropy(label):

'''

input:

label(narray):样本标签

output:

InfoEntropy(float):熵

'''

label_set = set(label)

InfoEntropy = 0

for l in label_set:

count = 0

for j in range(len(label)):

if label[j] == l:

count += 1

# 计算标签在数据集中出现的概率

p = count / len(label)

# 计算熵

InfoEntropy -= p * np.log2(p)

return InfoEntropy

#计算条件熵

def calcHDA(feature,label,index,value):

'''

input:

feature(ndarray):样本特征

label(ndarray):样本标签

index(int):需要使用的特征列索引

value(int):index所表示的特征列中需要考察的特征值

output:

HDA(float):信息熵

'''

count = 0

# sub_feature和sub_label表示根据特征列和特征值分割出的子数据集中的特征和标签

sub_feature = []

sub_label = []

for i in range(len(feature)):

if feature[i][index] == value:

count += 1

sub_feature.append(feature[i])

sub_label.append(label[i])

pHA = count / len(feature)

e = calcInfoEntropy(sub_label)

HDA = pHA * e

return HDA

#计算信息增益

def calcInfoGain(feature, label, index):

'''

input:

feature(ndarry):测试用例中字典里的feature

label(ndarray):测试用例中字典里的label

index(int):测试用例中字典里的index，即feature部分特征列的索引。该索引指的是feature中第几个特征，如index:0表示使用第一个特征来计算信息增益。

output:

InfoGain(float):信息增益

'''

base_e = calcInfoEntropy(label)

f = np.array(feature)

# 得到指定特征列的值的集合

f_set = set(f[:, index])

sum_HDA = 0

# 计算条件熵

for value in f_set:

sum_HDA += calcHDA(feature, label, index, value)

# 计算信息增益

InfoGain = base_e - sum_HDA

return InfoGain

# 获得信息增益最高的特征

def getBestFeature(feature, label):

'''

input:

feature(ndarray):样本特征

label(ndarray):样本标签

output:

best_feature(int):信息增益最高的特征

'''

#*********Begin*********#

max_infogain = 0

best_feature = 0

for i in range(len(feature[0])):

infogain = calcInfoGain(feature, label, i)

if infogain > max_infogain:

max_infogain = infogain

best_feature = i

#*********End*********#

return best_feature

#创建决策树

def createTree(feature, label):

'''

input:

feature(ndarray):训练样本特征

label(ndarray):训练样本标签

output:

tree(dict):决策树模型

'''

#*********Begin*********#

# 样本里都是同一个label没必要继续分叉了

if len(set(label)) == 1:

return label[0]

# 样本中只有一个特征或者所有样本的特征都一样的话就看哪个label的票数高

if len(feature[0]) == 1 or len(np.unique(feature, axis=0)) == 1:

vote = {}

for l in label:

if l in vote.keys():

vote[l] += 1

else:

vote[l] = 1

max_count = 0

vote_label = None

for k, v in vote.items():

if v > max_count:

max_count = v

vote_label = k

return vote_label

# 根据信息增益拿到特征的索引

best_feature = getBestFeature(feature, label)

tree = {best_feature: {}}

f = np.array(feature)

# 拿到bestfeature的所有特征值

f_set = set(f[:, best_feature])

# 构建对应特征值的子样本集sub_feature, sub_label

for v in f_set:

sub_feature = []

sub_label = []

for i in range(len(feature)):

if feature[i][best_feature] == v:

sub_feature.append(feature[i])

sub_label.append(label[i])

# 递归构建决策树

tree[best_feature][v] = createTree(sub_feature, sub_label)

#*********End*********#

return tree

#决策树分类

def dt_clf(train_feature,train_label,test_feature):

'''

input:

train_feature(ndarray):训练样本特征

train_label(ndarray):训练样本标签

test_feature(ndarray):测试样本特征

output:

predict(ndarray):测试样本预测标签

'''

#*********Begin*********#

result = []

tree = createTree(train_feature,train_label)

def classify(tree, feature):

if not isinstance(tree, dict):

return tree

t_index, t_value = list(tree.items())[0]

f_value = feature[t_index]

if isinstance(t_value, dict):

classLabel = classify(tree[t_index][f_value], feature)

return classLabel

else:

return t_value

for feature in test_feature:

result.append(classify(tree, feature))

predict = np.array(result)

#*********End*********#

return predict

你可能感兴趣的:(矩阵,线性代数,深度学习)

**ResNet-SE + MFCC** 训练框架，包括 **数据加载、训练流程**，以及 **混淆矩阵** 可视化示例大霸王龙系统分析业务矩阵 python 线性代数人工智能机器学习深度学习
1.依赖库安装如果你还没安装相关库，请先执行：pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集，其文件结构如下：dataset/│──train/│├──class_0/││├──audio_0.wav││├──audio_1.wav│├──class_1/││├──audio_0
1llama源码学习·model.py[3]ROPE旋转位置编码(1)原理小杜不吃糖学习
零：(导学)Transformer位置编码（1）为什么需要位置编码位置编码描述序列中实体的位置信息，为每个位置分配唯一的表示。Transformer使用智能位置编码方案，其中每个位置/索引都映射到一个向量。因此，位置编码层的输出是一个矩阵，其中矩阵的每一行表示序列的编码对象与其位置信息的总和（2）Transformer中的位置编码假设有一个长度为LLL的输入序列，并要求位置kkk为该序列中的对象，
小狐狸AI数字人源码独立SAAS部署全开源+搭建环境教程 kaui52066 kaui52066精品源码人工智能 uni-app 前端小程序 php 小狐狸AI数字人数字人源码
一.系统介绍小狐狸AI数字人分身系统源码独立部署支持PC端、小程序端、H5端，一键克隆真人形象+声音核心功能亮点：1:1真人级克隆技术声音克隆：上传3分钟音频，AI深度学习声纹特征，复刻语气、情感、方言形象克隆：通过照片/视频建模，生成动态3D数字人，表情自然，动作流畅智能口型同步引擎AI算法精准匹配唇形与语音，实现口型同步0门槛SAAS化操作无需专业设备，网页端一键生成数字人视频海量模板库：电商
【PyTorch】PyTorch 中改变张量形状的几种方法 shengchao0920 pytorch 人工智能 python
PyTorch中改变张量形状的几种方法在深度学习领域，PyTorch是一个广泛使用的框架，它提供了丰富的API来处理张量（tensor）。在模型开发过程中，我们经常需要改变张量的形状以满足特定的需求。本文将介绍在PyTorch中改变张量形状的几种方法，并给出推荐的使用场景。比如：我们想合并一个张量的最后两个维度。一、方法1.使用reshape方法reshape方法可以改变张量的形状而不改变其数据。
PyTorch 中的维度操作详解萝卜小白 pytorch 人工智能 python
在PyTorch中，维度（dimension）是描述张量形状的一种方式。维度操作是PyTorch中非常重要的功能，常用于调整张量的形状以适配各种计算需求。以下是常见的维度操作及其示例。1.维度的概念回顾一个二维张量（矩阵）的形状是(行数,列数)。一个三维张量的形状是(深度,行数,列数)。维度的索引从0开始，最外层是axis=0，向内依次递增。2.维度的操作(1)求和（Sum）sum(dim)的作用
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
强化学习-Chapter2-贝尔曼方程 Rsbs 算法机器学习概率论
强化学习-Chapter2-贝尔曼方程贝尔曼方程推导继续展开贝尔曼方程的矩阵形式状态值的求解动作价值函数与状态价值函数的关系贝尔曼方程推导Vπ(s)=E[Gt∣St=s]=E[rt+1+(γrt+2+…)∣St=s]=E[rt+1+γGt+1∣St=s]=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(Rs→s′a+γE[Gt+1∣St+1=s′])=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(R
深度学习-服务器训练SparseDrive过程记录 weixin_40826634 深度学习服务器人工智能
1、cuda安装1.1卸载安装失败的cuda参考：https://blog.csdn.net/weixin_40826634/article/details/127493809注意：因为/usr/local/cuda-xx.x/bin/下没有卸载脚本，很可能是apt安装的，所以通过执行下面的命令删除：apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
模型量化 (Model Quantization) 算法 (Model Quantization Algorithms) （initial）大模型科普算法人工智能量化
1模型量化的必要性：降低模型大小、加速推理、减少资源消耗随着深度学习模型的日益复杂和庞大，其在资源受限的设备（如移动端、嵌入式设备）上的部署面临着巨大的挑战。即使在服务器端，部署大型模型也会带来高昂的计算成本和能源消耗。模型量化(ModelQuantization)作为一种关键的模型压缩和加速技术应运而生。其核心思想是将模型中的浮点数（通常是FP32或FP16）表示的权重和激活值转换为低精度整数（
百度快速收录2025最新科普 SEORoal 百度
跨境物流的智能突围战宁波某RCEP跨境物流平台接入214维特征矩阵后：✅'智能清关系统’72小时冲进TOP3✅'东盟电子报关’长尾词覆盖量暴涨4.2倍✅日均有效询盘突破300+技术三板斧：标题智能提取引擎（支持38种语义变异）动态阻抗参数混淆（误差≤0.15μΩ）实时工商特征同步（每2小时更新）2025生存指南：采用神经网络语义映射（NLP准确率98.2%）部署质量监控系统（误差率≤0.15%）加
百度快速收录2025秒收方法实战解析 SEO黑猫百度
医疗门户网站48小时收录奇迹2023年底，某三甲医院官网改版后遭遇收录难题。通过我们部署的蜘蛛池智能调度系统，配合标题关键词矩阵布局（含’标题内提取’技术），成功实现48小时内全站收录。核心操作步骤：页面指纹构建采用动态TDK模板（例：『科室{科室}科室{病症}_${年份}最新诊疗方案』）植入地域长尾词（如’北京医保报销政策’）蜘蛛池配置方案#智能蜘蛛路由算法示例defschedule_spide
《探秘人工智能与鸿蒙系统集成开发的硬件基石》程序猿阿伟人工智能 harmonyos 华为
在科技飞速发展的当下，人工智能与鸿蒙系统的集成开发开辟了创新的前沿领域。这一融合不仅代表着技术的演进，更预示着智能设备生态的全新变革。而在这场技术盛宴的背后，坚实的硬件配置是确保开发顺利进行的关键，它就像一座大厦的基石，决定了上层建筑的高度和稳定性。处理器：运算核心的澎湃动力处理器作为硬件系统的核心，在人工智能与鸿蒙系统集成开发中扮演着至关重要的角色。对于模型训练任务，尤其是深度学习模型，其复杂的
超详细的Numpy基础教程！！！不会爬虫的闲鱼 numpy 数据分析 python
Numpy是一个开源的Python库，用于支持大型多维数组和矩阵运算，同时提供了大量的数学函数库。它是科学计算中非常重要的工具。Numpy在数据科学中非常重要，因为它提供了高效的数组处理能力和广泛的数学函数库，这对于处理大规模数据集、进行科学计算和机器学习等任务至关重要。一、安装与设置如何安装Numpypipinstallnumpy验证安装的方法importnumpyprint(numpy.__v
Web三要素：HTML之ARIA可访问性(3) 双囍菜菜前端随记前端 html 服务器 ARIA
ARIA：为Web构建数字盲道的技术革命文章目录ARIA：为Web构建数字盲道的技术革命一、屏幕背后的黑暗世界：一个被忽视的用户群体1.1触目惊心的现实案例1.2法律合规的达摩克利斯之剑二、ARIA技术体系的三重维度2.1角色（Roles）：定义元素身份常用角色分类2.2属性（Properties）：描述元素特征关键属性矩阵2.3状态（States）：反映动态变化状态同步机制三、ARIA实战：构建
嵌入式AI必备技能2-模型的压缩与加速奥德彪123 嵌入式AI 人工智能嵌入式
嵌入式AI必备技能2-模型的压缩与加速引言随着嵌入式AI设备的广泛应用，模型的计算效率和存储需求成为核心挑战。由于嵌入式系统通常资源受限，传统的深度学习模型往往难以直接部署。因此，模型压缩和加速技术应运而生，旨在减少计算量、降低存储需求，同时尽可能保持模型的准确性。本文介绍几种常见的模型压缩与加速方法，包括剪枝、低秩分解、量化、权值共享、知识蒸馏等，并探讨如何综合应用这些技术来优化AI模型。1.常
LeetCode第85题_最大矩形 @蓝莓果粒茶算法 leetcode 算法职场和发展数据结构 c++python unity
LeetCode第85题：最大矩形题目描述给定一个仅包含0和1的二维二进制矩阵，找出只包含1的最大矩形，并返回其面积。难度困难问题链接最大矩形示例示例1:输入：matrix=[["1","0","1","0","0"],["1","0","1","1","1"],["1","1","1","1","1"],["1","0","0","1","0"]]输出：6解释：最大矩形如上图所示。示例2:输入：
通用开关与矩阵开关卡及多路复用开关的对比北京阿尔泰科技厂家矩阵自动化科技远程工作集成测试网络
1、通用开关是指由单个继电器构成的一类开关体系结构。用户可以将这些继电器互连，形成标准开关结构，如MUX或矩阵，应用到自己的体系结构，或者简单地用于切换单个信号线的通断。当用于创建更大的标准开关结构时，这种方法的缺点就是成本相对较高，或者性能较低，主要是因为连接器较高的引脚使用率，加上需要将继电器与连接器都要连接在一起，从而也导致密度很低。然而，这也使得他们非常灵活，特别是当使用外部互连系统，如大
NVIDIA显卡型号有哪些？怎么知道自己电脑的型号？可靠的豆包蟹同志杂烩积累经验分享
NVIDIA显卡型号显卡分N卡和A卡，这个N卡指的是英伟达（NVIDIA），A卡之前是ATI（后来被AMD收购），现在的A卡指的就是AMD显卡。如果是为了玩游戏或者是学深度学习，选显卡肯定是要选N卡，因为A卡对于游戏优化的没有N卡好。（1）图中的GTX表示是英伟达的一个系列名称，全称叫GeForceGTX，GTX定位高端显卡系列，从低到高排名：GS/GT/GTS/GTX/RTX/Ultra，从20
英伟达系列显卡大解析B100、H200、L40S、A100 2301_78234743 java
家里有了变故。。。快手数分秋招一面面经我发现算法岗也不很难进啊(深度学习)算法想转数开…Java零基础校招学习路线突击版（吐血整理）等的花都谢了的华子最后给开了22k，武汉，应该是14a。不过在这几个月里我坚定了搞几年快钱回家和np朋友因骂了hr，boos被封了哈哈哈在央企想被开除需要做什么？2024小米分布式存储研发急招华为2012被毁意向我发现算法岗也不很难进啊(深度学习)在央企想被开除需要做
解数独（leetcode 37 JohnFF leetcode 算法职场和发展
leetcode系列文章目录一、核心操作二、外层配合操作三、核心模式代码总结使用二维递归，不管在哪一层都对矩阵进行全部遍历一、核心操作建立判断是否有效函数，对ij位置是否能放入k进行判断，由于此时还没有放置k，则可以直接对行列进行遍历，但是对于每一个小九宫格的遍历需要使用先除再乘的方式就可以将其重置为小九宫格的起始位置，再对其进行行列遍历即可建立二维回溯函数，从每一行开始遍历，再遍历每一行的每一列
eBest AI Hub全场景接入Deepseek eBest数字化转型方案人工智能
一、技术赋能，智创未来Deepseek的强大基因将为eBest产品注入新的活力即时智能响应：融合海量行业智慧与互联网搜索精华，提供秒级智能建议；多模态理解能力：突破界限，无缝融合文本、代码与图像理解，精准解析用户的需求；进化式深度学习：不断学习，持续进化，为用户提供日益完善、超越期待的服务体验。二、全场景赋能，体验再次跃升1.智能报表-数据洞察，指尖掌控升级后的智能报表功能，能够根据查询和检
Prompt工程：大模型沟通指南（人工智能到大模型） Harry技术 AI prompt 人工智能
文章目录人工智能到大模型机器学习深度学习大模型Prompt工程：大模型沟通的桥梁在人工智能的广袤领域中，大模型无疑是最为璀璨的明珠之一。它仿佛是一座连接人类与人工智能的桥梁，让我们能够更加深入地探索和利用人工智能的强大能力。而要实现与大模型的高效沟通，Prompt工程扮演着至关重要的角色。让我们一起走进Prompt工程的奇妙世界，探寻大模型沟通的奥秘。人工智能到大模型“人工智能是一种模拟人类智能的
CCF CSP 第30次（2023.05）（2_矩阵运算_C++）（暴力破解）(矩阵相乘) Dream it possible！ CCF CSP认证矩阵 c++算法
CCFCSP第30次（2023.05）（2_矩阵运算_C++）题目背景：题目描述：输入格式：输出格式：样例输入样例输出：样例解释：子任务：提示：解题思路：思路一（暴力破解）：代码实现代码实现：部分代码解读时间限制：5.0s空间限制：512.0MB题目背景：Softmax(Q×KT/√d)×V是Transformer中注意力模块的核心算式，其中Q、K和V均是n行d列的矩阵，KT表示矩阵K的转置，×表
大模型生成人物关系思维导图的实战教程 herosunly 大模型生成人物关系生成思维导图实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了大模型生成人物关系思维导图的实战教程，希望对使用大语言模型的同学们有所帮
MATLAB 操作指南（结尾附实操案例） vvvae1234 信息可视化
一、MATLAB简介MATLAB（矩阵实验室）是一个高级技术计算语言和交互环境，它主要用于数值计算、数据分析、算法开发和可视化。MATLAB的核心功能是矩阵运算，它能够处理向量和矩阵为中心的数学问题，方便用户进行算法的开发和数据可视化。主要特点高效的数值计算：MATLAB内置了许多用于数学和工程计算的函数，用户可以轻松地进行数值运算。可视化功能：MATLAB提供了丰富的工具，用于生成各种类型的图形
矩阵转置（信息学奥赛一本通-1126） Doopny@ 信息学奥赛一本通算法
【题目描述】输入一个n行m列的矩阵A，输出它的转置AT。【输入】第一行包含两个整数n和m，表示矩阵A的行数和列数(1usingnamespacestd;constintN=1e2+10;intnums[N][N];intmain(){intn,m;cin>>n>>m;for(inti=1;i>nums[i][j];}}for(inti=1;i<=m;i++){for(intj=1;j<=n;j++
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
数据挖掘技术介绍柒柒钏数据挖掘数据挖掘人工智能
数据挖掘技术介绍分类聚类关联规则挖掘预测异常检测特征选择与降维文本挖掘序列模式挖掘深度学习集成学习数据挖掘（DataMining）是一种从大量数据中提取有用信息和模式的技术，旨在从数据中发现隐藏的规律、趋势或关系，从而为决策提供支持。分类定义：是一种监督学习方法，用于将数据分为不同的类别。功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
图神经网络学习笔记—高级小批量处理（专题十四） AI专题精讲图神经网络入门到精通人工智能
小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。在图像或语言领域，这一过程通常通过将每个样本缩放或填充为相同大小的形状来实现，然后将样本在一个额外的维度中分组。该维度的长度等于小批量中分组的样本数量，通常称为batch_size。由于图是能够容纳任意数量节点或边的最通用的数据结
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1