weixin_54475711

机器学习强化(决策树和随机森林)

一、鸢尾花数据的决策树分类及树深度与过拟合关系

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
from sklearn import tree
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
import pydotplus


# 花萼长度、花萼宽度，花瓣长度，花瓣宽度
iris_feature_E = 'sepal length', 'sepal width', 'petal length', 'petal width'
iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度'
iris_class = 'Iris-setosa', 'Iris-versicolor', 'Iris-virginica'


if __name__ == "__main__":
    mpl.rcParams['font.sans-serif'] = [u'SimHei']
    mpl.rcParams['axes.unicode_minus'] = False

    data = pd.read_csv('iris.data', header=None)
    # 重新设置列名称、属性
    columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'type']
    data.rename(columns=dict(zip(np.arange(5), columns)), inplace=True)
    data['type'] = pd.Categorical(data['type']).codes
    print(data.head(5))
    # # 划分数据(特征值和目标值)
    # x = data.loc[:, columns[:-1]]
    # y = data['type']


    x, y = np.split(data.values, (4,), axis=1)
    # print 'x = \n', x
    # print 'y = \n', y
    # 仅使用前两列特征
    x = x[:, :2]

    # path = 'iris.data'  # 数据文件路径
    # data = pd.read_csv(path, header=None)
    # x = data[range(4)]
    # y = pd.Categorical(data[4]).codes
    # # 为了可视化，仅使用前两列特征
    #x = x.iloc[:, :2]
    x_train, x_test, y_train, y_test = train_test_split(x, y, train_size=0.7, random_state=1)
    print (y_test.shape)

    # 决策树参数估计
    # min_samples_split = 10：如果该结点包含的样本数目大于10，则(有可能)对其分支
    # min_samples_leaf = 10：若将某结点分支后，得到的每个子结点样本数目都大于10，则完成分支；否则，不进行分支
    model = DecisionTreeClassifier(criterion='gini')
    model.fit(x_train, y_train)
    y_test_hat = model.predict(x_test)      # 测试数据

    # 保存
    # dot -Tpng my.dot -o my.png
    # 1、输出
    # with open('iris.dot', 'w') as f:
    #     tree.export_graphviz(model, out_file=f)
    # 2、给定文件名
    # tree.export_graphviz(model, out_file='iris1.dot')
    # 3、输出为pdf格式
    # dot_data = tree.export_graphviz(model, out_file=None, feature_names=iris_feature_E, class_names=iris_class,
    #                                 filled=True, rounded=True, special_characters=True)
    # graph = pydotplus.graph_from_dot_data(dot_data)
    # #graph.write_pdf('iris.pdf')
    # f = open('iris.png', 'wb')
    # f.write(graph.create_png())
    # f.close()

    # 画图
    N, M = 50, 50  # 横纵各采样多少个值
    x1_min, x2_min = x.min(),x.min()
    x1_max, x2_max = x.max(),x.max()
    t1 = np.linspace(x1_min, x1_max, N)
    t2 = np.linspace(x2_min, x2_max, M)
    x1, x2 = np.meshgrid(t1, t2)  # 生成网格采样点
    x_show = np.stack((x1.flat, x2.flat), axis=1)  # 测试点
    print (x_show.shape)

    # # 无意义，只是为了凑另外两个维度
    # # 打开该注释前，确保注释掉x = x[:, :2]
    # x3 = np.ones(x1.size) * np.average(x[:, 2])
    # x4 = np.ones(x1.size) * np.average(x[:, 3])
    # x_test = np.stack((x1.flat, x2.flat, x3, x4), axis=1)  # 测试点

    cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
    cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
    y_show_hat = model.predict(x_show)  # 预测值
    print (y_show_hat.shape)
    print (y_show_hat)
    y_show_hat = y_show_hat.reshape(x1.shape)  # 使之与输入的形状相同
    print (y_show_hat)
    plt.figure(facecolor='w')
    plt.pcolormesh(x1, x2, y_show_hat, cmap=cm_light)  # 预测值的显示

    # #plt.scatter(x_test[0], x_test[1], y_show_hat, edgecolors='k', s=150,  cmap=cm_dark, marker='*')  # 测试数据
    #plt.scatter(x[0], x[1], c=y.ravel(), s=40, cmap=cm_dark)  # 全部数据
    plt.scatter(x[:, 0], x[:, 1], c=np.squeeze(y), edgecolors='k', s=50, cmap=cm_dark)  # 样本的显示
    plt.xlabel(iris_feature[0], fontsize=15)
    plt.ylabel(iris_feature[1], fontsize=15)
    plt.xlim(x1_min, x1_max)
    plt.ylim(x2_min, x2_max)
    plt.grid(True)
    plt.title(u'鸢尾花数据的决策树分类', fontsize=17)
    plt.show()

    # 训练集上的预测结果
    y_test = y_test.reshape(-1)
    print (y_test_hat)
    print (y_test)
    result = (y_test_hat == y_test)   # True则预测正确，False则预测错误
    acc = np.mean(result)
    print ('准确度: %.2f%%' % (100 * acc))

    # 过拟合：错误率
    depth = np.arange(1, 15)
    err_list = []
    for d in depth:
        clf = DecisionTreeClassifier(criterion='entropy', max_depth=d)
        clf.fit(x_train, y_train)
        y_test_hat = clf.predict(x_test)  # 测试数据
        result = (y_test_hat == y_test)  # True则预测正确，False则预测错误
        if d == 1:
            print (result)
        err = 1 - np.mean(result)
        err_list.append(err)
        # print d, ' 准确度: %.2f%%' % (100 * err)
        print (d, ' 错误率: %.2f%%' % (100 * err))
    plt.figure(facecolor='w')
    plt.plot(depth, err_list, 'ro-', lw=2)
    plt.xlabel(u'决策树深度', fontsize=15)
    plt.ylabel(u'错误率', fontsize=15)
    plt.title(u'决策树深度与过拟合', fontsize=17)
    plt.grid(True)
    plt.show()

二、决策树对鸢尾花数据的两特征组合的分类结果

import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeClassifier


# 'sepal length', 'sepal width', 'petal length', 'petal width'
iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度'

if __name__ == "__main__":
    mpl.rcParams['font.sans-serif'] = [u'SimHei']  # 黑体 FangSong/KaiTi
    mpl.rcParams['axes.unicode_minus'] = False

    data = pd.read_csv('iris.data', header=None)
    # # 重新设置列名称、属性
    # columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'type']
    # data.rename(columns=dict(zip(np.arange(5), columns)), inplace=True)
    # data['type'] = pd.Categorical(data['type']).codes
    # print(data.head(5))
    # # # 划分数据(特征值和目标值)
    # # x = data.loc[:, columns[:-1]]
    # # y = data['type']
    #
    # x, y = np.split(data.values, (4,), axis=1)
    # path = '..\\8.Regression\\iris.data'  # 数据文件路径
    # data = pd.read_csv(path, header=None)
    x_prime = data[range(4)]
    y = pd.Categorical(data[4]).codes

    feature_pairs = [[0, 1], [0, 2], [0, 3], [1, 2], [1, 3], [2, 3]]
    plt.figure(figsize=(10, 9), facecolor='#FFFFFF')
    for i, pair in enumerate(feature_pairs):
        # 准备数据
        x = x_prime[pair]

        # 决策树学习
        clf = DecisionTreeClassifier(criterion='entropy', min_samples_leaf=3)
        clf.fit(x, y)

        # 画图
        N, M = 500, 500  # 横纵各采样多少个值
        x1_min, x2_min = x.min()
        x1_max, x2_max = x.max()
        t1 = np.linspace(x1_min, x1_max, N)
        t2 = np.linspace(x2_min, x2_max, M)
        x1, x2 = np.meshgrid(t1, t2)  # 生成网格采样点
        x_test = np.stack((x1.flat, x2.flat), axis=1)  # 测试点

        # 训练集上的预测结果
        y_hat = clf.predict(x)
        y = y.reshape(-1)
        c = np.count_nonzero(y_hat == y)    # 统计预测正确的个数
        print ('特征：  ', iris_feature[pair[0]], ' + ', iris_feature[pair[1]],)
        print ('\t预测正确数目：', c,)
        print ('\t准确率: %.2f%%' % (100 * float(c) / float(len(y))))

        # 显示
        cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
        cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
        y_hat = clf.predict(x_test)  # 预测值
        y_hat = y_hat.reshape(x1.shape)  # 使之与输入的形状相同
        plt.subplot(2, 3, i+1)
        plt.pcolormesh(x1, x2, y_hat, cmap=cm_light)  # 预测值
        plt.scatter(x[pair[0]], x[pair[1]], c=y, edgecolors='k', cmap=cm_dark)  # 样本
        plt.xlabel(iris_feature[pair[0]], fontsize=14)
        plt.ylabel(iris_feature[pair[1]], fontsize=14)
        plt.xlim(x1_min, x1_max)
        plt.ylim(x2_min, x2_max)
        plt.grid()
    plt.suptitle(u'决策树对鸢尾花数据的两特征组合的分类结果', fontsize=18)
    plt.tight_layout(2)
    plt.subplots_adjust(top=0.92)
    plt.show()

三、随机森林对鸢尾花数据的两特征组合的分类结果

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
from sklearn.ensemble import RandomForestClassifier


def iris_type(s):
    it = {'Iris-setosa': 0, 'Iris-versicolor': 1, 'Iris-virginica': 2}
    return it[s]

# 'sepal length', 'sepal width', 'petal length', 'petal width'
iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度'

if __name__ == "__main__":
    mpl.rcParams['font.sans-serif'] = [u'SimHei']  # 黑体 FangSong/KaiTi
    mpl.rcParams['axes.unicode_minus'] = False

    # path = '..\\8.Regression\\iris.data'  # 数据文件路径
    # data = pd.read_csv(path, header=None)
    data = pd.read_csv('iris.data', header=None)
    x_prime = data[range(4)]
    y = pd.Categorical(data[4]).codes

    feature_pairs = [[0, 1], [0, 2], [0, 3], [1, 2], [1, 3], [2, 3]]
    plt.figure(figsize=(10, 9), facecolor='#FFFFFF')
    for i, pair in enumerate(feature_pairs):
        # 准备数据
        x = x_prime[pair]

        # 随机森林
        clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=8)
        clf.fit(x, y.ravel())

        # 画图
        N, M = 50, 50  # 横纵各采样多少个值
        x1_min, x2_min = x.min()
        x1_max, x2_max = x.max()
        t1 = np.linspace(x1_min, x1_max, N)
        t2 = np.linspace(x2_min, x2_max, M)
        x1, x2 = np.meshgrid(t1, t2)  # 生成网格采样点
        x_test = np.stack((x1.flat, x2.flat), axis=1)  # 测试点

        # 训练集上的预测结果
        y_hat = clf.predict(x)
        y = y.reshape(-1)
        c = np.count_nonzero(y_hat == y)    # 统计预测正确的个数
        print ('特征：  ', iris_feature[pair[0]], ' + ', iris_feature[pair[1]],)
        print ('\t预测正确数目：', c,)
        print ('\t准确率: %.2f%%' % (100 * float(c) / float(len(y))))

        # 显示
        cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
        cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
        y_hat = clf.predict(x_test)  # 预测值
        y_hat = y_hat.reshape(x1.shape)  # 使之与输入的形状相同
        plt.subplot(2, 3, i+1)
        plt.pcolormesh(x1, x2, y_hat, cmap=cm_light)  # 预测值
        plt.scatter(x[pair[0]], x[pair[1]], c=y, edgecolors='k', cmap=cm_dark)  # 样本
        plt.xlabel(iris_feature[pair[0]], fontsize=14)
        plt.ylabel(iris_feature[pair[1]], fontsize=14)
        plt.xlim(x1_min, x1_max)
        plt.ylim(x2_min, x2_max)
        plt.grid()
    plt.tight_layout(2.5)
    plt.subplots_adjust(top=0.92)
    plt.suptitle(u'随机森林对鸢尾花数据的两特征组合的分类结果', fontsize=18)
    plt.show()

四、Bagging
定义：从样本中重采样(有放回)选出n个样本
在所有属性上，对这n个样本建立分类器(ID3、C4.5、CART、SVM、Logistic回归等)
重复以上两步m次，即获得了m个分类器
将数据放在这m个分类器上，最后根据这m个分类器的投票结果，决定数据属于哪一类。

import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
from sklearn.linear_model import RidgeCV
from sklearn.ensemble import BaggingRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures


def f(x):
    return 0.5*np.exp(-(x+3) **2) + np.exp(-x**2) + 0.5*np.exp(-(x-3) ** 2)


if __name__ == "__main__":
    np.random.seed(0)
    N = 200
    x = np.random.rand(N) * 10 - 5  # [-5,5)
    x = np.sort(x)
    y = f(x) + 0.05*np.random.randn(N)
    x.shape = -1, 1

    degree = 6
    ridge = RidgeCV(alphas=np.logspace(-3, 2, 20), fit_intercept=False)
    ridged = Pipeline([('poly', PolynomialFeatures(degree=degree)), ('Ridge', ridge)])
    bagging_ridged = BaggingRegressor(ridged, n_estimators=100, max_samples=0.2)
    dtr = DecisionTreeRegressor(max_depth=5)
    regs = [
        ('DecisionTree Regressor', dtr),
        ('Ridge Regressor(%d Degree)' % degree, ridged),
        ('Bagging Ridge(%d Degree)' % degree, bagging_ridged),
        ('Bagging DecisionTree Regressor', BaggingRegressor(dtr, n_estimators=100, max_samples=0.2))]
    x_test = np.linspace(1.1*x.min(), 1.1*x.max(), 1000)
    mpl.rcParams['font.sans-serif'] = [u'SimHei']
    mpl.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(12, 8), facecolor='w')
    plt.plot(x, y, 'ro', label=u'训练数据')
    plt.plot(x_test, f(x_test), color='k', lw=3.5, label=u'真实值')
    clrs = 'bmyg'
    for i, (name, reg) in enumerate(regs):
        reg.fit(x, y)
        y_test = reg.predict(x_test.reshape(-1, 1))
        plt.plot(x_test, y_test.ravel(), color=clrs[i], lw=i+1, label=name, zorder=6-i)
    plt.legend(loc='upper left')
    plt.xlabel('X', fontsize=15)
    plt.ylabel('Y', fontsize=15)
    plt.title(u'回归曲线拟合', fontsize=21)
    plt.ylim((-0.2, 1.2))
    plt.tight_layout(2)
    plt.grid(True)
    plt.show()

五、决策树用于拟合

import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor


if __name__ == "__main__":
    N = 100
    x = np.random.rand(N) * 6 - 3     # [-3,3)
    x.sort()
    y = np.sin(x) + np.random.randn(N) * 0.05
    print (y)
    x = x.reshape(-1, 1)  # 转置后，得到N个样本，每个样本都是1维的
    print (x)

    dt = DecisionTreeRegressor(criterion='mse', max_depth=9)
    dt.fit(x, y)
    x_test = np.linspace(-3, 3, 50).reshape(-1, 1)
    y_hat = dt.predict(x_test)
    plt.plot(x, y, 'r*', ms=10, label='Actual')
    plt.plot(x_test, y_hat, 'g-', linewidth=2, label='Predict')
    plt.legend(loc='upper left')
    plt.grid()
    plt.show()

    # 比较决策树的深度影响
    depth = [2, 4, 6, 8, 10]
    clr = 'rgbmy'
    dtr = DecisionTreeRegressor(criterion='mse')
    plt.plot(x, y, 'ko', ms=6, label='Actual')
    x_test = np.linspace(-3, 3, 50).reshape(-1, 1)
    for d, c in zip(depth, clr):
        dtr.set_params(max_depth=d)
        dtr.fit(x, y)
        y_hat = dtr.predict(x_test)
        plt.plot(x_test, y_hat, '-', color=c, linewidth=2, label='Depth=%d' % d)
    plt.legend(loc='upper left')
    plt.grid(b=True)
    plt.show()

六、多输出的决策树回归
定义：以多个输出(下例为两个)作为轴建立图像，查看预测值与实际值的差别不大；

import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor


if __name__ == "__main__":
    N = 400
    x = np.random.rand(N) * 8 - 4     # [-4,4)
    x.sort()
    print (x)
    print ('====================')
    # y1 = np.sin(x) + 3 + np.random.randn(N) * 0.1
    # y2 = np.cos(0.3*x) + np.random.randn(N) * 0.01
    # y1 = np.sin(x) + np.random.randn(N) * 0.05
    # y2 = np.cos(x) + np.random.randn(N) * 0.1
    y1 = 16 * np.sin(x) ** 3 + np.random.randn(N)
    y2 = 13 * np.cos(x) - 5 * np.cos(2*x) - 2 * np.cos(3*x) - np.cos(4*x) + 0.1* np.random.randn(N)
    np.set_printoptions(suppress=True)
    print (y1)
    print (y2)
    y = np.vstack((y1, y2)).T
    print (y)
    print ('Data = \n', np.vstack((x, y1, y2)).T)
    print ('=================')
    x = x.reshape(-1, 1)  # 转置后，得到N个样本，每个样本都是1维的

    deep = 8
    reg = DecisionTreeRegressor(criterion='mse', max_depth=deep)
    dt = reg.fit(x, y)

    x_test = np.linspace(-4, 4, num=1000).reshape(-1, 1)
    print (x_test)
    y_hat = dt.predict(x_test)
    print (y_hat)
    plt.scatter(y[:, 0], y[:, 1], c='r', marker='s', s=60, label='Actual')
    plt.scatter(y_hat[:, 0], y_hat[:, 1], c='g', marker='o', edgecolors='g', s=30, label='Depth=%d' % deep, alpha=0.6)
    plt.legend(loc='upper left')
    plt.xlabel('y1')
    plt.ylabel('y2')
    plt.grid()
    plt.show()

大学生想勤工俭学，如何找兼职？听听过来人的经验氧惠好物
初入大学的你，是否渴望在业余时间通过兼职工作积累经验、赚取零花钱呢?对于刚入学的大学新生来说，学校周边有着丰富的兼职机会等待着你去探索。那么，如何才能顺利找到靠谱的学校周边兼职工作呢?让我们一起来了解吧。以下是一些靠谱的找兼职渠道和适合大学新生的工作类型：找兼职渠道：-学校官方渠道：-学校的勤工俭学岗位，如图书馆管理员、行政办公室助理等。可以关注学校官网的招聘信息或咨询学校的学生工作处、勤工俭学办
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
微信视频号红心可以买嘛，一百个多少钱神州网络公司
微信视频号红心可以买嘛，一百个多少钱视频号点赞大拇指通常是30元100个，价格会有所波动，如果大量通常在200-300之间。对于视频号来说大拇指是收藏，而爱心是点赞。是不是和抖音略有不同。一、微信视频号小爱心意义在微信视频号里面，小红心就是点赞，而那个大拇指则表示收藏。大多数考核都是基于爱心考核的，重要程度高些。用户点击小红心就表示对这个作品的赞同，因此，如果作品的小红心数量很多，就代表这个作品很
PyCharm 高效入门指南：从安装到进阶，解锁 Python 开发全流程
作为Python开发者的利器，PyCharm的安装与配置是开启高效编程之旅的第一步。面对Community和Professional两个版本，该如何选择呢？Community版是免费开源的，适合初学者和简单项目开发，包含基础的Python开发功能；而Professional版虽收费，但功能更强大，支持Web开发、数据库连接等高级功能，适合专业开发者和复杂项目。1.安装与配置下载与安装下载PyCha
嵌入式硬件篇---继电器 Atticus-Orion 嵌入式硬件篇嵌入式硬件继电器
继电器是一种通过小电流控制大电流的电磁开关，广泛应用于自动化控制、电力系统和电子设备中。以下从工作原理、应用场景和电路特点三个方面详细介绍：一、工作原理继电器本质是电磁控制的机械式开关，核心部件包括：线圈（Coil）：通电时产生磁场。铁芯（IronCore）：增强磁场强度。衔铁（Armature）：受磁场吸引动作的金属部件。触点（Contacts）：由衔铁控制通断的开关。工作过程：线圈不通电：衔铁
嵌入式知识篇---机械臂的运动学结算（简单2自由度） Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇人工智能机械臂解算
机械臂的“解算”本质是运动学解算，核心是解决“关节角度”和“末端位置”的互转问题。下面用最通俗的方式解释，并结合2自由度平面机械臂（结构最简单，适合入门）给出Python和ESP32代码，以及参数细节。一、机械臂运动学解算的通俗原理想象你有一条“简化的手臂”：只有大臂和小臂两个关节（类似人类的上臂和前臂），只能在桌面（X-Y平面）内运动。正解：知道“大臂转30°，小臂转60°”，算出“手掌”的位置
Spring Cloud学习：如何实现Gateway 服务网关限流杨荧 spring cloud 学习 gateway
目录一、SpringCloud介绍二、什么是服务网关三、Gateway的优势和应用场景四、如何实现Gateway服务网关限流一、SpringCloud介绍SpringCloud是一个基于SpringBoot的微服务架构开发工具集，它整合了多种微服务解决方案，为开发者提供了一站式的微服务开发体验。SpringCloud的核心组件包括服务发现、配置管理、消息传递、负载均衡、断路器等，这些组件可以帮助开
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
麦吉丽加盟条件及费用广州时尚王子
麦吉丽加盟条件主要包括以下几点:1.创业热情与决心:对化妆品行业充满热情，并具备强烈的创业意愿，愿意与麦吉丽共同开拓市场，创造美丽事业。2.资金实力与财务规划:需要具备一定的资金实力，包括加盟费、店面租金、装修费、进货费等，建议加盟前做好充分的财务规划和资金准备。3.合法经营与商业信誉:具备合法经营资格，并有良好的商业信誉，共同打造诚信、规范的商业环境。4.店面选址与面积要求:选择在人流量大、消费
5商学习笔记爱英思谭523
【Jocelyn1月25日习得小结:】1.知识划重点(R):快速学习：如何用20小时，快速学习？2.我的理解(I):润总这个快速学习，跟李笑来老师的最小必要知识很类似，都是通过快速掌握入门的知识，完成从0到1的跨越。时间越快，掌握大概知识越多进门就越快。3.我的相关经验或经历(A1):复述其实是帮助自己去理解概念的绝佳方式。自己带课这几年，对于教材中的概念从浅入深的学习和理解，跟我面对无数个不一样
国庆假期结束，你的微梦想清单实现了没？ Hi菜篮
2019.10.1-2019.10.7国庆假期复盘1.我为年度目标做了那些事情？✅到公司集体观看祖国70周年阅兵仪式✅带女儿、公婆看电影《我和我的祖国》✅跟老公一起看了《中国机长》✅回看综艺《偶像来了》✅读完《我决定活得有趣，并输出行动清单》✅输出文章《你，是焦虑养育者吗？》✅理财课3节✅公众号文章排版✅9月复盘，2019年目标回顾和调整✅一家人到九里峰山游玩，小家三口到飞龙岛玩；吃了一顿火锅✅晚
和孩子交上朋友苹子的天空
对于逆反心理较强的孩子，作为班主任的我们不应对他们恶语相加，更不能把他们冷落在偏僻的角落，而应该走进孩子的内心，与他做心灵的沟通。陶行知先生认为，“师爱最高境界不是母爱也不是父爱，而是朋友之爱、同志之爱。”一个有智慧的班主任，当孩子出现逆反的心理问题时，可以从他们的兴趣爱好入手，亲近他们，和他们一起玩耍、嬉戏，和孩子交上朋友，使师生能够真正在心灵与心灵之间架起信任的桥梁。随着年龄的增长和年级的增高
保护黄河流域，合理种植作物 7c769bedc29d
7月11日，青岛农业大学化学与药学院推进黄河流域生态环境保护社会实践团在东营开展社会实践活动，活动开展至今已5天，今日主题为关于黄河流域作物品种的调研。团队成员收集相关信息了解到，黄河滩地抗盐碱的作物有：油葵、苜蓿。普通作物：白薯、西瓜、棉花等。山东省是传统的农业大省，是我国粮食和北方水果的主要产地。山东省季风气候显著，旱雨季分明，且雨热同期，因此适合种植小麦，花生，玉米，棉花等。随着工业经济和现
《宫斗：嫡女虎又娇，权臣折了腰》姜瑶、谢昀免费阅读，宫斗：嫡女虎又娇，权臣折了腰小说免费阅读全章节无弹窗_笔趣阁霸道推书3
小说简介：春天的大宴上，皇后突然给中书令谢昀和太傅家的宝贝闺女来了个“惊喜”赐婚。大家都知道，权臣和太傅在朝廷里头那是冤家对头，见面就掐，斗了多少年了。皇后娘娘这一手，简直比戏文还精彩，京城里的人们都议论纷纷，说皇后娘娘这招儿真是高！可她却没想到，这两人偏偏擦出了火花……书名：《宫斗：嫡女虎又娇，权臣折了腰》主角配角：姜瑶、谢昀推荐指数：✩✩✩✩✩———小说内容试读———“你尝尝这个牛乳糕，超级好
服务化架构、SOA 与微服务：关系、演进与实战落地全解析要阿尔卑斯吗. 架构微服务云原生
在分布式系统架构面试中，面试官常常会问到一个核心问题：“你能说说服务化架构、SOA和微服务之间到底是什么关系吗？有什么区别？”这并不是一个单纯的理论问题，而是对开发者系统认知和实践经验的综合考察。今天，我们将系统梳理这个话题，结合架构演进历史、核心设计理念、技术实现路径及落地经验，帮助大家理清服务化架构的发展脉络，走好系统设计之路。一、什么是服务化架构？它与SOA、微服务是什么关系？首先需要明确一
一次XSS漏洞引发的用户信息泄露 —— 在线教育平台真实案例剖析与防御实践
一、引子：一个“学习感言”输入框引发的安全事故在一次大型在线教育平台的开发中，笔者曾亲身经历过一起严重的安全事故。事故的起点很微不足道：一个允许用户提交“学习感言”的输入框。然而，由于缺乏安全意识和输入输出处理的规范，这个字段成为攻击者入侵的跳板，最终导致大量用户信息泄露、信任危机和平台业务受损。这个案例虽然已过去多年，但其中反映的安全盲点依然广泛存在于当前的互联网项目中，特别是在中小团队、快速上
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
全面解析阿里巴巴 Seata：微服务架构下的分布式事务解决方案(AT模式) 要阿尔卑斯吗. 架构微服务分布式
在微服务架构盛行的今天，系统被拆解成多个独立服务，每个服务对应独立的数据库。这种“服务自治”的设计虽然提高了系统可维护性和扩展性，却带来了新的难题——分布式事务一致性问题。为了保障跨服务、跨库操作的原子性，阿里巴巴开源了一个优秀的解决方案：Seata（SimpleExtensibleAutonomousTransactionArchitecture）。本文将从背景动因、整体架构、核心原理、事务模型
LLM OCR vs 传统 OCR：解锁文档处理的未来
光学字符识别（OCR）技术早已是数字化文档的得力助手，但你有没有想过，传统OCR和新兴的LLMOCR究竟有何不同？传统OCR就像一台老式打印机，虽然能干活，但在复杂场景下常常“卡壳”。而LLMOCR则像一个聪明的助手，不仅能识别文字，还能读懂文档的“灵魂”。今天，我们就来聊聊这两者的区别，并看看LLMOCR如何为文档处理带来新可能。传统OCR：可靠但有限的老将传统OCR就像一位勤劳的抄写员，擅长把
177+小燕子+为什么不让你钻牛角尖？ Sailing333
生活中有很多人是喜欢钻牛角尖的。但是这样很容易形成认知偏误，从而带来更加灾难性的后果。是不是很可怕呢？所以今天我要与大家分享的是吴伯凡老师的《认知论》。一、书中自有颜如玉。我们受到的教育告诉我们：因和果是可以分开的。可以先看到一个“果”，然后去追溯“因”。但事实未必是这样。在追溯“原因”的时候，我们很容易犯两个错误：对因素的变量认知不完备。很多的因素可能会逃出我们的认知范围，形成我们的盲点；真正的
微电网系列之规划和运行控制云纳星辰怀自在微电网规划微电网运行控制
个人主页：云纳星辰怀自在座右铭：“所谓坚持，就是觉得还有希望！”微电网规划设计与经济运行微电网规划需紧密结合运行策略，基于当地资源优化配置分布式发电单元并设计网络结构，以实现可靠、安全、经济、环保的目标；其运行则依赖能量管理系统，通过灵活调度分布式电源、储能和负荷来实现动态优化分配，最终达成经济高效、绿色优质的供电。微电网规划设计的核心目标与内容目标：实现可靠性、安全性、经济性和环境友好性的多目标
元宵节对话 Brena
要睡了，捂着眼睛开始跳舞1.地点我：你是哪的？宝：北京的；我：姥姥呢？宝：老西的；我：奶奶呢？宝：东北的；2.谁家？宝：爸爸家是我家；我：妈妈是你家吗？宝：是；3.过年爸爸：你回哪过年？姥姥家还是奶奶家？宝：我家..4.拉勾宝：和爸爸拉勾，看1遍；都没搞清楚啥状况..拉完了勾了，我们才反应过来，拉勾看电视只看一遍。逗的我和她爸都乐了..5.拿毛巾玩拿毛巾摇狗狗玩具，摇完一甩毛巾，狗狗掉了，逗的我门
软件工程：软件开发之需求分析云纳星辰怀自在软件工程软件工程需求分析 ASPICE 功能安全软件需求分析原则软件需求分析属性需求开发策略模板
物有本末，事有终始。知所先后，则近道矣。对软件开发而言，软件需求乃重中之重。必先之事重千钧，不可或缺如日辰。汽车行业由于有方法论和各种标准约束，对软件开发有严苛的要求。ASPICE指导如何审核软件开发，虽然没有明确定义如何去开发，但是ASPICE的Guideline和Essential文件中给出很多参考。本文则详细阐述如何编写软件需求，同时介绍软件需求的必要属性。本文用SRS(SoftwareRe
培育先锋还是先锋培育花石冈
培育先锋还是先锋培育2019年的春节刚过，偶尔还能听到此起彼伏的鞭炮声时。二七区先锋路小学项目启动了，踏着阳春的雪，走进那片拆迁堆砌的废墟和共享单车的“坟场”时，我们已经算不上是先锋的“先锋”了。二七教体局党委书记南中洋已经在更早些时候到过这片区域，谋划和安排了它的地表清零工作。实际上，往前追溯三十年，1989年，一所由马寨乡镇企业捐建的小学也刚刚投入使用。我就是这所学校的首届毕业生，这所学校取名
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
睡眠不足的危害 Ly1102
1.影响大脑的创造性思维科研人员研究认为，人的大脑要思维清晰、反应灵敏，必须要有充足的睡眠，如果长期睡眠不足，大脑得不到充分的休息，就会影响大脑的创造性思维和处理事物的能力。2.影响青少年的生长发育青少年的生长发育除了遗传、营养、锻炼等因素外，还与生长素的分泌有一定关系。生长素是下丘脑分泌和一种激素，它能促进骨骼、肌肉、脏器的发育。由于生长素的分泌与睡眠密切相关，即在人熟睡后有一个大的分泌高峰，随
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
至亲人-离去红玫瑰与蚊子血
今天得知昨日下午姑父的去世，眼泪还是会留下来。尽管姑父这位亲人似乎是算不得什么至亲，但是在得知姑父去世的消息还是落泪了。毕竟曾经一起度过那么多岁月的大年，在一起吃年夜饭，谈论生活。记得在我刚考上村官的时候，姑父称赞我，刚毕业就可以自食其力找到一份还不错的工作。在我记忆中的姑父，非常潮流，思想特别的开放民主，和一些家长还是很有区别的。姑父是因为肺癌➕脑瘤扩散走的，自查出病情以来，在姑姑的悉心照料下，
如何清除 npm 缓存 BIBI2049 前端开发 Windows npm 缓存前端 node.js
清除npm缓存：利弊分析与操作指南在使用Node.js和npm进行项目开发时，我们经常会与npminstall命令打交道。这个过程中，npm会在本地建立一个缓存机制，用以存储已下载的包，从而显著提升后续安装的速度。然而，有时这个缓存也可能成为问题的根源。本文将探讨清除npm缓存的利弊，并提供清晰的操作指引。清除npm缓存的好处清除npm缓存主要能带来以下几点好处：解决依赖安装失败问题：当缓存中的包
对人造子宫的忧虑——会不会出现异形？怒火女子工坊
这个担忧，完全没有必要。人造子宫只是肉体子宫的替代品。打个比方，孵化器是给养殖场孵化鸡蛋的。和母鸡自己孵鸡蛋相比，它只是更方便而已，它并不能把鸡蛋变成鸭蛋、鹅蛋、鸵鸟蛋。同样的，人造子宫也不会改变人类幼体形状。是否异形，要看囊胚，那是基因生物学家的事儿，和人造子宫没有关系。科学家真能搞出异形来，在女性的肉体子宫里不能培育吗？人造子宫和异形不仅没有因果关系，也没有一点相关性。
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

机器学习强化(决策树和随机森林)

你可能感兴趣的:(机器学习强化(决策树和随机森林))