Blijiojiodibuliduo

MNIST手写数字识别：分类应用入门

MNIST手写数字识别数据集

MNIST 数据集来自美国国家标准与技术研究所，National Institute of Standards and Technology（NIST）
数据集由来自250个不同人手写的数字构成，其中50%是高中学生，50%来自人口普查局的工作人员
训练集：55000；验证集：5000；测试集：10000

MNIST 数据集可在 http://yann.lecun.com/exdb/mnist/ 获取
TensorFlow提供了数据集读取方法

import tensorflow as tf
import tensorflow.examples.tutorials.mnist.input_data as input_data

# 该路径为保存该数据集的路径
mnist = input_data.read_data_sets("/Users/liuqi/Desktop/data/MNIST_data/", one_hot=True)

了解MINIST手写数字识别数据集

print("训练集train的数量:", mnist.train.num_examples, " 验证集validation的数量:", mnist.validation.num_examples, 
      " 测试集test的数量:", mnist.test.num_examples)
# 输出：训练集train的数量: 55000  验证集validation的数量: 5000  测试集test的数量: 10000

print("train images shape:", mnist.train.images.shape, " labels shape:", mnist.train.labels.shape)
# 输出：train images shape: (55000, 784)  labels shape: (55000, 10)
# 为什么是784 28*28的灰度图  为什么是10 10分类 代表10个阿拉伯数字

# 第一张图片大小
len(mnist.train.images[0])

# 第一张图片形状
mnist.train.images[0].shape
# 使第一张图片变成28*28的形状
mnist.train.images[0].reshape(28, 28)

可视化image

# 图像显示
import matplotlib.pyplot as plt
def plot_image(image):
    plt.imshow(image.reshape(28, 28), cmap='binary')
    plt.show()
plot_image(mnist.train.images[0])

标签数据和独热编码

如何设置独热编码

# one-hot为True时表示独热编码 为False时表示非独热编码
mnist = input_data.read_data_sets("/Users/liuqi/Desktop/data/MNIST_data/", one_hot=True)

# one-hot编码
mnist.train.labels[1]
# 输出：array([0., 0., 0., 1., 0., 0., 0., 0., 0., 0.])

# 如果使用非独热编码读取标签值
mnist_no_one_hot = input_data.read_data_sets("/Users/liuqi/Desktop/data/MNIST_data/", one_hot=False)
print(mnist_no_one_hot.train.labels[0:10])

# 输出结果：[7 3 4 6 1 8 1 0 9 8]

独热编码

一种稀疏向量，其中：
- 一个元素设为1，所以其他元素均为0
独热编码常用于表示拥有无限个可能值的字符串或标识符

为什么要使用独热编码

将离散特征的取值扩展到了欧式空间，离散特征的某个取值就对应欧式空间的某个点
机器学习算法中，特征之间距离的计算或相似度的常用计算方法都是基于欧式距离空间的
将离散特征型使用one-hot编码，会让特征之间的距离计算更加合理

独热编码如何取值

# one-hot编码
mnist.train.labels[1]
# 结果：array([0., 0., 0., 1., 0., 0., 0., 0., 0., 0.])

# 读出独热编码指代的具体的值
# argmax返回的是最大数的索引
import numpy as np
np.argmax(mnist.train.labels[1])
# 结果：3

数据集的划分

构建和训练机器学习模型是希望对新的数据做出良好的预测
如何去保证训练的实效，可以去应对以前从未见过的数据呢？
- 一种方法是将数据集分为两个子集：
  - 训练集 - 用于训练模型的子集
  - 测试集 - 用于测试模型的子集
- 通常，在测试集上表现是否良好是衡量能否在新数据集上表现良好的有用指标，但前提是：测试集足够大；不会反复使用相同的测试集来作假

拆分成两个数据集

将单个数据拆分为一个训练集和一个测试集
确保测试集满足以下几个条件：
- 规模足够大，可产生具有统计意义的结果
- 能代表整个数据集，测试集的特征应该和训练集的特征相同

工作流程图

存在的问题

思考：

使用测试集和训练集来推动模型开发迭代的流程
在每次迭代时，都会对训练数据进行训练并评估测试数据，并以基于测试数据的评估结果为指导来选择和更改各种模型超参数。例如学习率和特征。这种方法是否存在问题？
多次重复执行该流程可能导致模型不知不觉地拟合了特定测试集的特征，从而导致过拟合

新的数据划分

通过将数据集划分为三个子集，可以大幅降低过拟合的发生几率
新的数据的划分：训练集、验证集、测试集
使用验证集评估测试集的效果
在模型“通过”验证集之后，使用测试集再次检查评估结果

新的工作流程

逻辑回归(二分类）

许多问题的预测结果是一个在连续空间的数值，比如房价预测问题，可以用线性模型来描述： $Y = x_1 * w_1 + x_2 * w_2 +...+ x_n * w_n + b$
但是也有很多场景需要输出的是概率估算值，例如：

分局邮件内容判断是垃圾邮件的可能性
根据医学影像判断肿瘤是恶性的可能性

这时需要将预测输出值控制在[0, 1]区间内，二元分类问题的目标是正确预测两个可能的标签中的一个，逻辑回归可以用于处理这类问题

Sigmoid函数

逻辑回归模型如何确保输出值始终落在0-1之间
Sigmoid函数（S型函数）生成的输出值正好具有这些特性，其定义如下： $\frac{1}{1 + e^{-z}}$
定义域为全体实数，值域在[0, 1]之间
z值在0点对应的结果为0.5
Sigmoid函数连续可微分

特定样本的逻辑回归的输出

$z = x_1*w_1 + x_2*w_2 + ...+ x_n*w_n + b$
$\frac{1}{1 + e^{-z}}$

逻辑回归中的损失函数

前面线性回归的损失函数是平方损失，如果逻辑回归的损失函数也定义为平方损失，那么：
$\frac{1}{n}\sum_{i=1}^{n}{(\varphi(z_i) - y_i)^2}$

其中：

$i 代表第 i 个样本点$
$\varphi = \frac{1}{1 + e^{-(z)}}$
$z_i = x_i * w + b$
$\varphi(z_i)表示对第i个样本的预测值$
$y_i表示第i个样本的标签值，即真实值$

将Sigmoid函数带入上述函数，非凸函数，有多个极小值，如果采用梯度下降的方法，会容易导致陷入局部最优解中

因此在二元逻辑回归中，损失函数通常不采用平方损失，一般采用对数损失函数，其定义如下：
$-\sum_{(x,y)\in D}{y\ln(y') + (1-y)\ln(1 - y')}$

其中：

$y)\in D是标签样本的数据集$
$y 是有标签样本中的标签，取值必须是 0 或者 1$
$y^{'} 是对于特征集 x 的预测值（介于 0 和 1 之间）$

多元回归

Softmax思想

逻辑回归可生成介于0和1之间的小数
例如，某电子邮件分类起的逻辑回归输出值为0.8，表明电子邮价是垃圾邮件的概率为80%，不是垃圾邮件的概率为20%，很明显，一封电子邮件是垃圾邮件或非垃圾邮件的概率之和为1
Softmax将这一想法延伸到多类别领域
在多类问题中，softmax会为每个类别分配一个用小数表示的概率，这些用小数表示的概率相加之和必须是1.0

Softmax示例

神经网络的Softmax层

Softmax举例

多元分类中的损失函数–交叉熵损失函数

交叉熵是一个信息论中的概念，它原来是用来估算平均编码长度的。给定两个概率分布p和q，通过q来表示p的交叉熵为
$-\sum_{x}{p(x)logq(x)}$
交叉熵刻画的是两个概率分布之间的距离，p代表正确答案，q代表的是预测值，交叉熵越小，两个概率的分布越接近

定义交叉熵损失函数

交叉熵损失函数定义为：
$-\sum_{i = 1}^{n}y_ilogy_i'$

其中： $y_i为标签值（即真实值），y_i'为预测值$
损失函数定义的代码：

loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred), reduction_indices = 1))

分类模型的构建与实践

载入数据

import tensorflow as tf
import tensorflow.examples.tutorials.mnist.input_data as input_data

mnist = input_data.read_data_sets("/Users/liuqi/Desktop/data/MNIST_data/", one_hot=True)

构建模型

# 定义占位符x, y
# mnist中每张图片共有28*28=784个像素点
x = tf.placeholder(tf.float32, [None, 784], name = "X")

# 0-9 一共有10个数字
y = tf.placeholder(tf.float32, [None, 10], name = "Y")


# 在本案例中，以正态分布的随机数初始化权重W，以常数0初始化偏置b
# 定义变量w, b, w为784*10的数组，784表示有784个特征  10表示10分类
w = tf.Variable(tf.random_normal([784, 10]), name = "W")
b = tf.Variable(tf.zeros([10]), name = "b")


# 用单个神经元构建神经网络
forward = tf.matmul(x, w) + b

# Softmax分类
# 当我们处理多分类任务时，通常需要使用softMax regression模型，softmax regression会对每一类别估算出一个概率
pred = tf.nn.softmax(forward)

设置训练参数

# 训练轮数
train_epochs = 50
# 单批次训练样本数（批次大小，即一批训练的样本数）
batch_size = 100
# 一轮样本训练有多少批次
total_batch = int(mnist.train.num_examples/batch_size)
# 显示粒度
display_step = 1
# 学习率
learning_rate = 0.01

定义损失函数

# 定义交叉熵损失函数 pred为预测值  y为标签值
loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred), reduction_indices = 1))

选择优化器

# 梯度下降优化器
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_function)

定义准确率

# 检查预测类别tf.argmax(tf.argmax(pred, 1),)与实际类别tf.argmax(y, 1)的匹配情况
# tf.argmax()如果第二个参数指定为1，则是第二维（列）的元素取值，即同行的每一列的最大值
correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
# 准确率，将布尔值转化为浮点数，并计算平均值
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

声明会话，变量初始化

sess = tf.Session()
ini = tf.global_variables_initializer()
sess.run(ini)

模型训练

# 开始训练
# 训练轮次
for epoch in range(train_epochs):
    # 每一轮分total_batch批次进行训练
    for batch in range(total_batch):
        xs,ys = mnist.train.next_batch(batch_size)
        sess.run(optimizer, feed_dict={x:xs, y:ys})
    
    # 经过一轮训练后，通过梯度下降方法找到使得失函数最小的Wi和b
    # 使用验证集的数据通过该模型计算误差和准确率， 验证集没有分批
    loss,acc = sess.run([loss_function, accuracy], feed_dict={x:mnist.validation.images, y:mnist.validation.labels})
    
    # 打印训练过程中的详细信息
    if (epoch+1) % display_step == 0:
        print("Train Epoch:", '%02d' %(epoch + 1), "Loss=", "{:.9f}".format(loss), "Accuracy=", "{:.4f}".format(acc))

评估模型

accu_test = sess.run(accuracy, feed_dict={x:mnist.test.images, y:mnist.test.labels})
print("Test Accuracy:", accu_test)

模型应用与可视化

import matplotlib.pyplot as plt
import numpy as np

# images:图像列表  labels：标签列表  prediction：预测值列表  index：从第index个开始显示  num = 10表示一次显示10幅图 
def plot_images_labels_prediction(images, labels, prediction, index, num = 10):
    
    # 获取当前图表
    fig = plt.gcf()
    
    # 1英尺等于2.54cm
    fig.set_size_inches(10, 12)
    # 最多显示25张图片
    if num > 25:
        num = 25
    for i in range(0, num):
        # 获取当前要处理的子图
        ax = plt.subplot(5, 5, i+1)

        # 显示第index个图像
        ax.imshow(np.reshape(images[index], (28, 28)), cmap = 'binary')
        
        # 构建该图上要显示的title
        title = "label=" + str(np.argmax(labels[index]))
        if len(prediction) > 0:
            title += ", predict=" + str(prediction[index])
            
        # 显示图上的title信息
        ax.set_title(title, fontsize = 10)
        
        # 不显示坐标轴
        ax.set_xticks([])
        ax.set_yticks([])
        index += 1
    plt.show()

plot_images_labels_prediction(mnist.test.images, mnist.test.labels, prediction_result, 0, 25)

可视化结果

参考视频：深度学习应用开发TensorFlow实践

一元线性回归模型与最小二乘法 liuzx32
监督学习中，如果预测的变量是离散的，我们称其为分类（如决策树，支持向量机等），如果预测的变量是连续的，我们称其为回归。回归分析中，如果只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。对于二维空间线性是一条直线；对于三维空间线性是一个平面，对于多维空间线
数字化转型之需求分解数字化转型魔法师经验分享
前言上一章我们讲了什么是需求？从多个维度进行了分析，方便大家理解。这一张我们要讲如何完善需求，那怎么完善需求呢？该从哪些方面处理呢？今天进入分享环节。一、如何完善需求1、需求分类需求有多个维度，上一章给大家讲了有时间维度、功能性维度，其实还有复杂性维度、和重要性维度等。因为要方便大家理解，所以上一章节就只讲了时间和功能性两个方面，复杂性和重要性是抽象的不易于理解。那么知道这些需求分类有什么用呢？如
评估遥感云雾浓度的无参化指标（适用于其它合成雾的场景）夏天是冰红茶去雾与加雾 opencv 计算机视觉人工智能
前言本文总结了四种用于评估图像雾浓度的无参考指标：FADE、densityD、AuthESI和JSFD。FADE通过MATLAB实现，能较好反映雾气浓度但计算耗时；densityD基于TensorFlow，对天空场景较为敏感；AuthESI主要用于评估合成雾真实性，不适用于浓度评估；JSFD结合HSV空间S值、白点比例和暗通道特征，准确性较高但计算时间长。实验表明，FADE和JSFD以及densi
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解文章目录基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解1.RELM原理2.分类问题求解3.基于探路者算法优化的RELM4.实验结果5.Matlab代码1.RELM原理极限学习机(ELM)具有训练速度快、泛化性能好的优点。极限学习机的结构是一种典型的单隐层前馈神经网络(SLFN)。极限学习机的结构见图RELM算法：若NNN
基于探路者算法优化的核极限学习机(KELM)分类算法智能算法研学社（Jack旭）智能优化算法应用机器学习 #核极限学习机（KELM）算法分类数据挖掘
基于探路者算法优化的核极限学习机(KELM)分类算法文章目录基于探路者算法优化的核极限学习机(KELM)分类算法1.KELM理论基础2.分类问题3.基于探路者算法优化的KELM4.测试结果5.Matlab代码摘要：本文利用探路者算法对核极限学习机(KELM)进行优化，并用于分类1.KELM理论基础核极限学习机（KernelBasedExtremeLearningMachine，KELM）是基于极限
在不知所措的时候，我们需要一点哲学威Sir漫话
1为什么要学习哲学我们生活在多元复杂的世界里，科技的便捷渗透在生活中的每个角落，我们沉浸在其中，并深深的认为，这就是我们一直追寻的幸福生活并应该一直追寻着继续前行。从小都习惯于通过教科书认识世界，坐在教室里面被千篇一律的知识塑造着对这个世界的认知。长大了，我们一样没有逃脱被认知的命运，一部部被精心编排好的电影电视剧帮助我们抒发着感情，所谓的导演和编剧操控着我们的喜怒哀乐。杨同学在她文章里对于感情的
# TF Eager Execution 阅读笔记 tsiic
TFEagerExecution阅读笔记@[TensonFlow]看了半天不知道Eager是啥，这哪能看下去。所以Google了一下，在知乎发现如下解释：......就开启了Eager模式，这时，TensorFlow会从原先的声明式（declarative）编程形式变成命令式（imperative）编程形式。当写下语句"c=tf.matmul(a,b)"后（以及其他任何tf开头的函数），就会直接执
传感器基础：传感器的基本原理_3.传感器的分类与应用 kkchenkx 信号仿真2 信号处理
3.传感器的分类与应用在上一节中，我们讨论了传感器的基本原理和工作方式。本节将详细介绍传感器的分类及其在不同领域的应用。传感器可以根据不同的标准进行分类，例如工作原理、输出信号类型、测量对象等。了解传感器的分类有助于我们更好地选择和应用适合特定需求的传感器。3.1传感器的分类3.1.1按工作原理分类3.1.1.1电阻式传感器电阻式传感器通过测量电阻的变化来检测物理量的变化。常见的电阻式传感器包括应
力扣题目算法分类【持续更新】 Gene_INNOCENT 比赛题解各类重要算法讲解力扣算法分类
基础算法二分704.二分查找-简单-整数二分34.在排序数组中查找元素的第一个和最后一个位置-中等69.x的平方根-简单-浮点二分287.寻找重复数-中等-二分答案410.分割数组的最大值-困难-二分答案4.寻找两个正序数组的中位数-困难
坚定文化自信凝聚发展力量拧巴大叔
一个民族的复兴需要强大的物质力量，也需要强大的精神力量。历史和现实充分证明，真正有前途、有力量的民族，必然有辉煌的文化，必然对自身文化充满信心。中华民族是世界上唯一一个在5000年历史发展过程当中，文化一直保持了延续发展的状态，成为世界上唯一没有中断的古老文明。当今社会文化思潮纷杂多元，更需要我们坚定文化自信，从“根”和“魂”的高度认识把握中华优秀传统文化，推动中华优秀传统文化的创造性转化和创新性
Python零基础入门：魔法方法详解
一、什么是魔法方法？魔法方法（MagicMethods）是Python中一种特殊的方法，它们以双下划线(__)开头和结尾（如__init__、__str__等）。魔法方法允许你定义类在特定情况下的行为，例如初始化、字符串表示、运算符重载等。二、常见的魔法方法分类1.构造和初始化__new__(cls,[...]):创建实例时调用的第一个方法__init__(self,[...]):实例初始化方法_
NiFi Processors概述一个老冯
为了能够创建一个高效的NiFi数据数据流程，我们需要了解有哪些Processor类型可以使用。每个新的NiFi版本Processor数量都会增加，当前NiFi版本为1.12.1,内置了288个类型的Proccessor，这些Processor提供从多个不同系统接收数据、路由、转换、处理、拆分和聚合数据以及将数据分发到多个系统的功能。按照功能分类：image.png.procesor分类说明1.1数
神经网络常见激活函数 13-Softplus函数亲持红叶神经网络常见激活函数神经网络人工智能深度学习
文章目录Softplus函数+导函数函数和导函数图像优缺点PyTorch中的Softplus函数TensorFlow中的Softplus函数Softplus函数+导函数Softplus函数Softplus⁡(x)=ln⁡(1+e x)\begin{aligned}\operatorname{Softplus}(x)&=\ln\bigl(1+e^{\,x}\bigr)\end{aligned}Sof
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
React 英语打地鼠游戏——一个寓教于乐的英语学习游戏伍哥的传说前端源码分享 react.js 游戏学习
英语打地鼠游戏一个寓教于乐的英语学习游戏，通过经典的打地鼠玩法帮助用户学习英语单词。✨项目特色游戏化学习经典打地鼠玩法：6个洞穴，听英文选单词即时反馈：答对/答错立即语音提示计分系统：每答对一题得10分，激发学习动力60秒限时：紧张刺激的游戏节奏多媒体体验双语语音播报：英文单词标准发音+中文反馈流畅动画效果：基于Anime.js的精美动画响应式设计：支持手机、平板、电脑多端适配丰富词库多主题分类：
2020.12.15 周二早评缠论悟道
#财经##股票##缠论股票投资#2020.12.15周二早评上证指数30F回调走势中。5F下跌中枢构建中，关键区间3384~3387，如遇阻力不能突破，将迎接新一轮下跌！今日操作：1.高开：第一压力位3387，第二压力3403，第三压力位3428。2.低开：第一支撑位3344，第二支撑位3291，第三支撑位3202。完全分类：1.1F反弹回到3357，发生中枢扩展，形成5F下跌中枢，随后将跌破33
数字滤波器原理及应用借助matlab,数字滤波器原理及应用（借助Matlab）陈慈龙数字滤波器原理及应用借助matlab
第l章数字信号处理引言1．1引言1．2数字信号处理起源1．3信号域1．4信号分类1．5DStP：一个学科第2章采样原理2．1引言2．2第l章数字信号处理引言1．1引言1．2数字信号处理起源1．3信号域1．4信号分类1．5DStP：一个学科第2章采样原理2．1引言2．2香农采样原理2．3信号重构2．4香农插值2．5采样方法2．6多通道采样2．7MATLAB音频选项第3章混叠3．1引言3．2混叠3．3
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
C++ 程序设计考量表君鼎 C++c++开发语言
C++程序设计考量表1.类设计主要考量具体问题设计决策影响职责类的职责是否单一？是否有违反单一职责原则的可能性？决定是否需要拆分类或合并相关职责继承关系是否需要继承？是公有继承（is-a关系）还是组合（has-a关系）？影响是否使用基类、抽象类或多态封装性哪些成员需要暴露？哪些需要隐藏？决定public/private/protected访问权限对象生命周期是否需要自定义构造函数/析构函数？是否需
【机器学习【9】】评估算法：数据集划分与算法泛化能力评估 roman_日积跬步-终至千里 #机器学习机器学习
文章目录一、数据集划分：训练集与评估集二、K折交叉验证：提升评估可靠性1.基本原理1.1.K折交叉验证基本原理1.2.逻辑回归算法与L22.基于K折交叉验证L2算法三、弃一交叉验证（Leave-One-Out）1、基本原理2、代码实现四、ShuffleSplit交叉验证1、基本原理2、为什么能降低方差3、代码测试五、选择建议在机器学习中，评估算法的核心目标是衡量模型在“未知数据”上的表现，而不是仅
录像与录像装置的区别 3_a228
录像是用光学、电磁等方法把图像记录下来,也指记录下来的图像录像设备。录像装置是指供记录电视图像及伴音，能存储电视节目视频信号，并且过后可把它们重新送到电视发射机或直接送到电视机中的磁带记录器。分磁性录像机、电视屏幕录像机和电子束录像机等类型。《大卫》1.录像装置（videoinstallation）是20世纪晚期艺术的一个多元界面。它糅合了艺术与科技、私人空间与公共场所、主观视觉与机器的非透明表面
rce漏洞测试
目录什么是RCE？漏洞介绍漏洞分类远程命令执行29关30关31关32~36关37关38关39关40关41关42关43关44关45关46~49关总结什么是RCE？漏洞介绍RCE漏洞，可以让攻击者直接向后台服务器远程注入操作系统命令或者代码，从而控制后台系统。RCE主要指远程代码执行和远程命令执行，CTFHub中将文件包含漏洞也看作RCE漏洞。漏洞分类远程命令执行远程代码执行文件包含漏洞实际上，RCE
xss的利用 m0_73832254 xss 前端
目录一、XSS的原理和分类二、常见的XSS标签和属性三、Xss漏洞分类1.反射性xss反射性XSS典型攻击场景基于URL参数的反射性XSS基于表单参数的反射性XSS利用HTML标签属性的反射性XSS2.存储型XSS存储型XSS的高频攻击场景社交平台评论区论坛发帖与私信系统电商平台商品描述3.基于DOM的XSS攻击原理剖析DOM型XSS典型攻击场景与案例基于URL参数的DOM型XSS基于localS
爬虫实战案例（两个） AI 嗯啦爬虫
该博客展示两个简单的爬虫实战案例，一个是从人民邮电出版社上爬取其中一个分类的全部图书信息，另一个是在苏宁易购上爬取某个商品的好评和差评，用两个简单的案例讲解爬虫在实际情况下的运作流程一、获取图书信息需求：统计人民邯电出版社官网中与关键词“python”有关的全部图书，包含图书名、价格、作者名等信息，并将获取的信息写入“Excel图书汇总，txt”文件中。流程：配置浏览器并打开目标网站搜索"Pyth
2021-08-26 鲸屿品创
创新打造品牌全案策划—鲸屿品创鲸屿品创是一家新锐品牌策划设计服务机构，致力于企业品牌策划，企业品牌设计，以及企业营销战略咨询等多维度综合服务；以全方位的品牌营销策略，帮助新品牌迅速成长创造品牌新境界帮助新老品牌激发活力，开辟营销新局面；综合多角度、多方位、多层次、多渠道、多元化、多方式的营销模式是建立在数字化基础上，依托于互联网，地面配置整体配合的营销方式以灵活、实时满足等多个方面满足品牌营销策划
第二次总结（xss、js原型链）
1XSS漏洞文章目录1XSS漏洞1.1XSS的原理1.2XSS漏洞分类1.1.1反射性xss特点常见场景1.1.2DOM型XSS**特点**常见场景1.1.3存储型XSS**特点**常见场景1.3XSS漏洞的黑盒测试1.4XSS漏洞的白盒测试2XSS练习2.1反射型Level1Level2总结2.2DOM型level1DOM型xss思路：2.3存储型level1存储型xss思路：2.4利用编码绕过
视角与分类戴老师成长记录仪
今天的文章可能会比较抽象，和你一起来探讨人看问题的视角、以及人看问题的分类。先来回顾一下，我们之前和大家分享的，有关人的大脑方面的知识，我们人类的大脑的一个非常重要的特性，就是利用大脑的已经知道的东西来判断未知的东西。一旦我们看到生活中、工作中的一个事物，我的大脑的海绵体就会不断在我们的大脑中搜索有没有这样的信息，若是有的话，就是自动的调出这方面的信息，进行比对、类比，然后采取一些相应的策略。这是
Linux 命令：uname hweiyu00 Linux命令 linux 运维服务器
Linuxuname命令详细教程uname（UnixName）是Linux系统中用于获取系统基本信息的基础命令。它能快速展示操作系统、内核、主机名等关键信息，是系统诊断和环境确认的常用工具。资料已经分类整理好：https://pan.quark.cn/s/26d73f7dd8a7一、基本语法uname[选项]核心功能：默认只显示操作系统名称（如Linux）。通过选项可获取更详细的系统信息。二、常用
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多