落春只在无意间

深度学习篇之tensorflow(2) ---图像识别

tensorflow处理图像识别

图像识别
- 图像识别的关键点及特点
卷积神经网络原理
- 视觉生物学研究
- 神经网络优势
- 卷积层
- 池化层
- 正则化层
卷积神经网络实例
- 样本数据读取
- - urlretrieve（）方法
  - python tarfile模块
- 构建卷积神经网络模型
- - 构建卷积层
  - 构建池化层
  - 完整代码
- 实战完成代码

图像识别

研究图像识别离不开两样东西：第一，大量的样本数据；第二，好的算法。从某种意义上来说，数据比算法更重要，算法只是决定了图像识别的准确率，但如果没有样本数据，图像识别就无从谈起了。

图像识别的关键点及特点

图像识别的关键：特征和特征之间的相对位置。
1. 首先是特征，我们记住一个事物首先记住的应该是它的关键特征，然后将这些关键特征与我们所知道的事物关联起来，从而完成对事物的识别。
2. 其次是特征之间的相对位置、比如一个男人，他的右脸有一个刀疤，我们可能会用“右脸上有个刀疤”的特征来描述，在这里“有个刀疤”是一个特征信息，“右脸”就是这个特征的相对位置。
  所以，特征及特征之间的相对位置就是图像识别的关键信息。
图像识别的特点：可以归纳为三个不变性和一个模糊性。三个不变性指的是平移不变性、旋转不变性和缩放不变性，一个模糊性指的是特征之间的相对位置是不精确的，如一个人脸的图片，如果双眼之间的距离缩短了一些，我们还是能精确的识别出来的。
1. 平移不变性：当原始的图片平移到另一个位置之后我们还是能精确的识别出来的，但是对于图像识别算法来说，这个是需要关注的难点。
2. 缩放不变性：经过等比例的缩放，我们人眼还是能很容易地识别出来。但是，对于计算机来说，缩放前后的图片，对应的像素数值已经发生了巨大的变化，所以这也是图像识别算法需要解决的难点之一。
3. 选择不变性：不是所有的图形都具有旋转不变性。比如数字9，选择180度之后，变成了6.

卷积神经网络原理

事实上，计算机视觉受到了视觉系统的视觉信息处理研究的启发，我们对感觉系统信号处理过程的认识，启发了人们将视野(或感受野)、物体特征识别、尺度特性转换的特点应用在图像识别中。

卷积核又叫过滤器。卷积核的叫法来源于机器学习中的“核函数” ；过滤器的叫法来源于信号处理中的“滤波器”，过滤器的叫法在TensorFlow中广泛使用。

视觉生物学研究

在1959年,神经科学家David Hunter Hubel与合作者Torsten N. Wiesel进行了一项研究,展示了视觉系统是如何将来自外界的视觉信号传递到视皮层，并通过一系列处理过程(本质上就是特征提取)，包括边界检测、运动检测、立体深度检测和颜色检测，最后在大脑中构建一幅视觉图像的。
研究发现，不同神经元对不同的空间方位(视野或感受野)的敏感程度不同，同时还发现不同神经元对亮光带和暗光带的反应模式也不相同，有些神经元对亮光敏感、有些神经元对暗光敏感。David Hunter Hubel与Torsten N. Wiesel将这些神经元称为“简单细胞”,将初级视皮层里其他的神经元称为“复杂细胞”。

而我们卷积神经网络就是收到视觉处理过程中不同的神经元对不同的空间范围敏感的启发，放弃全连接神经网络的连接方式，采用一个神经元只与输入图像的部分区域连接的方式。

这种方式极大程度减少了神经元的数量，并且能够让神经元更好地发现局部的特征。

神经网络优势

下图为全连接神经网络与卷积神经网络连接方式的对比

我们假设输入图形是1000 * 1000个像素，隐藏层的神经元是10000个，那个全连接神经网络一共需要 $1000*1000*3*10000=3*10^{10}$ 个参数。看一下卷积神经网络，我们的每一个神经元与输入图像中的10*10的区域相连，那么需要的参数数量仅为 $3*10^{8}$

而在实际中，卷积神经网络采用权值共享的方式来进一步降低参数的数量。由于每个神经元都是与一个1010的区域相连，每个神经元都有1010个参数，那么我们如果将第一个神经元的1010个参数共享给其他神经元，那么不论隐藏层有多少个神经元，整个卷积神经网络只有1010个参数。

但是这样会有一个问题，我们只有10*10的过滤器，那么只能提取一个特征。因为如果我们要提取多个特征，我们可以通过增加过滤器的方式来实现，不同的过滤器用于提取不同的特征。假设有100个过滤器，那么参数的总数也不超过 $100*10*10=10^4$ 个，相比较与全连接参数的个数大大降低了。

卷积层

这里提到的将参数共享给其他神经元，首先一个神经元就是很多个上一层的神经元输出分别×weight再整体加上偏置b的一次运算，进过激活函数得到输出的这样一个过程。我们只是共享其中的weight，但是由于每一个神经元对应的局域不同，所在最后卷积之后的结果不完全一致的。

右上边描述我们就可以知道，如果一个图像我们总计实行了36次卷积操作，那么该卷积层神经网络中有36个神经元。

池化层

通常情况下，卷积层之后会紧跟着一个池化层，常用的池化操作有Max Pooling（最大值池化法）和Average Pooling（平均值池化法），较常用的是最大池化。

池化操作之后，特征图谱只会在宽度和高度上变小，在深度上不会改变。
需要池化的原因：

池化的操作的过程是输入的特征图谱的宽度、高度变小，本质上是一个下采样的过程，这个过程舍弃了大量的信息。我们知道，只有舍弃的信息是“噪声”，才会有助于提高模型的识别准确率，否则池化操作只会导致模型识别的准确率降低。那么我们是如果丢弃这个“噪声”信息的呢？卷积的目的是提取特征，特征之外的这些非零信息其实是噪声，池化操作通过取最大值的办法，将池化区域的数个像素只保留一个像素，减少了哪些不重要（卷积点积的结果数值较小的区域）数值的干扰，达到减少“噪声”的目的。

正则化层

有的卷积神经网络中，在池化层之后、全连接层之前会有一个正则化层，正则化层试图模拟在生物脑神经中观察到的抑制现象。但是现在已经不流行了，因为实践发现，正则化层对模型的贡献率是非常小的。

卷积神经网络实例

以识别CIFAR-10数据集中的图像为例。大体步骤为先对样本数据和测试数据进行读取，之后构建卷积神经网络模型，最后调研样本数据读取函数，将数据注入构建好的模型，完成模型的训练和评估。

样本数据读取

urlretrieve（）方法

python3中urllib.request模块提供的urlretrieve()函数。urlretrieve()方法直接将远程数据下载到本地。

urlretrieve(url, filename=None, reporthook=None, data=None)

参数url：下载链接地址
参数filename：指定了保存本地路径（如果参数未指定，urllib会生成一个临时文件保存数据。）
参数reporthook：是一个回调函数，当连接上服务器、以及相应的数据块传输完毕时会触发该回调，我们可以利用这个回调函数来显示当前的下载进度。
参数data：指post导服务器的数据，该方法返回一个包含两个元素的(filename, headers) 元组，filename 表示保存到本地的路径，header表示服务器的响应头

进度条显示结果如下：

python tarfile模块

tarfile模块的主要作用是用来加压缩和解压缩文件，其压缩文件的类型可以是

.tar | .tar.gz | .tgz | .tar.bz2 等

加压:

 tar = tarfile.open("/tmp/test.tar.gz","w:gz")
for root,dir,files in os.walk("/home/red/桌面/test"):
	    for file in files:
            apath = os.path.join(root,file)
			tar.add(apath)
tar.close

解压：

  tar = tarfile.open("/tmp/test.tar.gz","r")
	for ti in tar:
		tar.extract(ti,"/")
tar.close()

完整代码：

def read_cifar10_data(path=None):
    """
    读取Cifar-10的训练数据和测试数据。
    :param path: 保存Cifar-10的本地文件目录。
    :Returns: 训练集的图片、训练集标签、测试集图片、测试集标签。
    """
    # Cifar-10的官方下载网址，需要下载binary version文件
    url = 'https://www.cs.toronto.edu/~kriz/'
    tar = 'cifar-10-binary.tar.gz'
    files = ['cifar-10-batches-bin/data_batch_1.bin',
             'cifar-10-batches-bin/data_batch_2.bin',
             'cifar-10-batches-bin/data_batch_3.bin',
             'cifar-10-batches-bin/data_batch_4.bin',
             'cifar-10-batches-bin/data_batch_5.bin',
             'cifar-10-batches-bin/test_batch.bin']

    # 如果没有指定本地文件目录，那么，设置目录为"~/data/cifar10"
    if path is None:
        path = os.path.join(os.path.expanduser('~'), 'data', 'cifar10')

    # 确保相关目录、及其子目录存在
    os.makedirs(path, exist_ok=True)

    # 如果本地文件不存在，那么，从网络上下载Cifar-10数据
    tar_file = os.path.join(path, tar)
    if not os.path.exists(tar_file):
        print("\n文件{}不存在，尝试从网络下载。".format(tar_file))
        # 从网上下载图片数据，并且，保存到本地文件
        img_url = os.path.join(url, tar)
        # 本地文件名称
        img_path = os.path.join(path, tar)
        print("开始下载: {}, 时间：{}".format(
            img_url, time.strftime('%Y-%m-%d %H:%M:%S')))
        # 文件下载进度条，

        def _progress(count, block_size, total_size):
            # 下载完成进度（百分比）
            percentage = float(count * block_size) / float(total_size) * 100.0
            # 下载进度条总共有50个方块组成（已完成的部分用'█'，未完成的用'.'）
            # 根据count的奇偶性，决定最后一个方块是否出现，实现闪烁的效果
            done = int(percentage / 2.0)
            done += (count & 1)
            # 显示进度条，其中'\r'表示在同一行显示（不换行）
            sys.stdout.write('\r[{}{}] 进度：{:.2f} count:{:2d}'.format
                             ('█' * done, '.' * (50 - done), percentage, count))
            sys.stdout.flush()
        # 从网络下载tar文件，并且，回调显示进度条的函数
        urllib.request.urlretrieve(img_url, img_path, _progress)
        print("保存到：{}".format(img_path))
        # 打印一个空行，将下载日志与数据读取日志分隔开
        print("")

    # 从tar.gz文件中读取训练数据和测试数据
    with tarfile.open(tar_file) as tar_object:
        # 每个文件包含10,000个彩色图像和10,000个标签
        # 每个图像的宽度、高度、深度（色彩通道），分别是32、32、3
        fsize = 10000 * (32 * 32 * 3) + 10000

        # 共有6个数据文件（5个训练数据文件、1个测试数据文件）
        buffer = np.zeros(fsize * 6, np.uint8)

        # 从tar.gz文件中读取数据文件的对象
        # -- tar.gz文件中还包含REDME和其他的非数据晚饭吗
        members = [file for file in tar_object if file.name in files]

        # 对数据文件按照名称排序
        # -- 确保按顺序装载数据文件
        # -- 确保测试数据最后加载
        members.sort(key=lambda member: member.name)

        # 从tar.gz文件中读取数据文件的的内容（解压）
        # 读取文件开始，增加空行隔开日志，更清晰
        print()
        for i, member in enumerate(members):
            # 得到tar.gz中的数据文件对象
            f = tar_object.extractfile(member)
            print("正在读取 {} 中的数据……".format(member.name))
            # 从数据文件对象中读取数据到缓冲区，按照字节读取
            buffer[i * fsize:(i + 1) *
                   fsize] = np.frombuffer(f.read(), np.ubyte)
        # 读取文件结束，增加空行隔开日志
        print()

    # 解析缓冲区数据
    # -- 样本数据是按数据块存储的，每个数据块有3073个字节长
    # -- 每个数据块的第一个字节是标签
    # -- 紧接着的3072个字节的图像数据（32 * 32 * 3 = 3,072）

    # 将每个数据块的第一个字节取出来，形成标签列表
    # 从第0个字节开始，将每隔3073个字节的数据取出来形成标签
    # 对应的字节索引为0×3073, 1×3073, 2×3073, 3×3073, 4×3073……
    labels = buffer[::3073]

    # 将标签数据删除，之后，剩下的全部是图像数据
    pixels = np.delete(buffer, np.arange(0, buffer.size, 3073))
    # 对图像数据进行归一化处理（除以255）
    images = pixels.reshape(-1, 3072).astype(np.float32)

    # 将样本数据切分成训练数据和测试数据
    # 第0个至第50,000个用作训练数据，从第50,000个开始的用作测试数据（共10,000个）
    train_images, test_images = images[:50000], images[50000:]
    train_labels, test_labels = labels[:50000], labels[50000:]

    return train_images, train_labels.astype(np.int32), \
        test_images, test_labels.astype(np.int32)

构建卷积神经网络模型

构建卷积神经网络模型也可以分成三个步骤：第一，关键函数。生成卷积层、池化层的关键函数；第二，规划卷积神经网络架构，包括各个神经网络层的排列方式，卷积层的过滤器的尺寸、步长、个数及激活函数，池化层的池化过滤器的尺寸、步长，全连接层的神经元个数等；第三，按照规划的卷积神经网络架构，完成卷积神经网络的构建。

构建卷积层

生成卷积层的函数如下：

tf. layers. conv2d(
inputs,
filters.
kernel_size,
strides=(1,1),
padding=‘valid’,
data_format=’ channels_last’,
dilation_rate=(1,1),
activation=None,
use_bias= True,
kernel_initializer= None,
bias_initializer= tf. zeros_initializer( ),
kernel_regularizer= None,
bias_regularizer= None,
activity_regularizer= None,
kernel_constraint= None,
bias_constraint= None,
trainable=True,
name=None,
reuse=None
)

input:卷积层的输入张量
filters: 过滤器的个数。过滤器个数 = 此卷积层输出张量（数据长方体）的深度。
kernel_size：过滤器的尺寸，用于指定过滤器的宽度和高度，可以是一个包含两个数字的一维列表，也可以是一个数字。如果是一个数字，则是一个方阵
strides: 滑动步长。
padding: 填充方式。
data_format：输入张量的维度排列方式。
dilation_rate: 过滤器沿空间的各个维度的扩张率。
activation: 激活函数。如果设置为None，采用线性激活函数。
use_bias：是否增加偏置项。

实例

 # 第一个卷积层,直接接受输入层（输入的原始图像数据）
    # 过滤器个数Filter_count = 32, 过滤器大小 Filter_size: 5×5
    # 请注意：过滤器的深度总是与输入张量的深度保持一致，本例中Filter_depth = 3
    # 填充方式"same", 表示按照卷积之后图像保持原状来填充。另外一种填充方式"valid"
    # 过滤器的激活函数采用tf.nn.relu的方式
    # 本层的输出是形状为32×32×64的数据长方体
    conv1 = tf.layers.conv2d(
        inputs=input_layer,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

    # 第一个池化层，接收conv1的输出作为本层的输入
    # 采用最大化池化方法， 池化过滤器尺寸 3×3， 步长为2，这样实现重叠池化
    # 在这种情况下，填充的层数必然是单层，因为输出的数据长方体的尺寸必须满足公式：
    # Output_size = ceil(input_size / stride)

    # 第二个卷积层和池化层，从第一个池化层接受输入
    # 过滤器个数64个，尺寸5×5, 填充方式为保持图像不变，激活函数relu
    # 本层输出的数据长方体是16×16×64
    conv2 = tf.layers.conv2d(
        inputs=pool1,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

构建池化层

生成池化层的函数如下：

tf.layers.max_pooling2d(
inputs,
pool_size,
strides,
padding=‘valid’,
data_format = ‘channels_last’,
name=None
)

实例

    # 本层输出的数据长方体为16×16×64
    pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[
                                    3, 3], strides=2, padding='SAME')

    # 第二个池化层，从第二个卷积层接收输入
    # 本层输出的数据长方体是8×8×64
    pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[
                                    3, 3], strides=2, padding='SAME')

完整代码

def cifar10_model(features, labels, mode):
    """    创建CIFAR10图像识别模型
    :param features: 输入的特征列表，这里只有一个输入特征张量"x"，代表输入的图像
    :param labels: 输出的特征列表，这里是图像所述的类别
    :param mode: 模式，是训练状态还是评估状态
    """

    # （1） 定义输入张量
    # 输入层张量，[batch_size, height, weight, depth]
    # batch_size等于-1代表重整为实际输入的训练数据个数
    # CIFAR10的图像格式为[height, weight, depth] = [32, 32, 3]
    input_layer = tf.reshape(features["x"], [-1, 32, 32, 3])

    # （2） 构建模型（卷积神经网络）
    # 第一个卷积层,直接接受输入层（输入的原始图像数据）
    # 过滤器个数Filter_count = 32, 过滤器大小 Filter_size: 5×5
    # 请注意：过滤器的深度总是与输入张量的深度保持一致，本例中Filter_depth = 3
    # 填充方式"same", 表示按照卷积之后图像保持原状来填充。另外一种填充方式"valid"
    # 过滤器的激活函数采用tf.nn.relu的方式
    # 本层的输出是形状为32×32×64的数据长方体
    conv1 = tf.layers.conv2d(
        inputs=input_layer,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

    # 第一个池化层，接收conv1的输出作为本层的输入
    # 采用最大化池化方法， 池化过滤器尺寸 3×3， 步长为2，这样实现重叠池化
    # 在这种情况下，填充的层数必然是单层，因为输出的数据长方体的尺寸必须满足公式：
    # Output_size = ceil(input_size / stride)
    # 本层输出的数据长方体为16×16×64
    pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[
                                    3, 3], strides=2, padding='SAME')

    # 第二个卷积层和池化层，从第一个池化层接受输入
    # 过滤器个数64个，尺寸5×5, 填充方式为保持图像不变，激活函数relu
    # 本层输出的数据长方体是16×16×64
    conv2 = tf.layers.conv2d(
        inputs=pool1,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

    # 第二个池化层，从第二个卷积层接收输入
    # 本层输出的数据长方体是8×8×64
    pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[
                                    3, 3], strides=2, padding='SAME')

    # 将第二个池化层的输出展平，以方便与后面的全连接层连接
    pool2_flat = tf.reshape(pool2, [-1, 8 * 8 * 64])

    # 全连接层，接受第二个池化层展平后的结果作为输入
    # 共有1024个神经元、激活函数tf.nn.relu
    dense = tf.layers.dense(
        inputs=pool2_flat, units=1024, activation=tf.nn.relu)

    # Dropout层，提高模型的健壮性
    dropout = tf.layers.dropout(
        inputs=dense, rate=0.1, training=(mode == tf.estimator.ModeKeys.TRAIN))

    # 输出层，
    logits = tf.layers.dense(inputs=dropout, units=10)

    predictions = {
        # (为 PREDICT 和 EVAL 模式)生成预测值
        "classes": tf.argmax(input=logits, axis=1),
        # 将 `softmax_tensor` 添加至计算图。用于 PREDICT 模式下的 `logging_hook`.
        "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
    }

    # 如果是评估（测试）模式，那么，执行预测分析
    if mode == tf.estimator.ModeKeys.PREDICT:
        return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

    # 计算损失（可用于`训练`和`评价`中）
    loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

    # （3）完成模型训练
    # 配置训练操作（用于 TRAIN 模式）
    if mode == tf.estimator.ModeKeys.TRAIN:
        optimizer = tf.train.AdamOptimizer(learning_rate=1e-4)
        train_op = optimizer.minimize(
            loss=loss,
            global_step=tf.train.get_global_step())
        return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)

    # 添加评价指标（用于评估）
    eval_metric_ops = {
        "accuracy": tf.metrics.accuracy(
            labels=labels, predictions=predictions["classes"])}
    return tf.estimator.EstimatorSpec(
        mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)

实战完成代码

#!/usr/local/bin/python3
# -*- coding: UTF-8 -*-

# 导入依赖模块
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import numpy as np
import tensorflow as tf
import os
import tarfile
import urllib.request
import time
import sys

tf.logging.set_verbosity(tf.logging.INFO)


def read_cifar10_data(path=None):
    """
    读取Cifar-10的训练数据和测试数据。
    :param path: 保存Cifar-10的本地文件目录。
    :Returns: 训练集的图片、训练集标签、测试集图片、测试集标签。
    """
    # Cifar-10的官方下载网址，需要下载binary version文件
    url = 'https://www.cs.toronto.edu/~kriz/'
    tar = 'cifar-10-binary.tar.gz'
    files = ['cifar-10-batches-bin/data_batch_1.bin',
             'cifar-10-batches-bin/data_batch_2.bin',
             'cifar-10-batches-bin/data_batch_3.bin',
             'cifar-10-batches-bin/data_batch_4.bin',
             'cifar-10-batches-bin/data_batch_5.bin',
             'cifar-10-batches-bin/test_batch.bin']

    # 如果没有指定本地文件目录，那么，设置目录为"~/data/cifar10"
    if path is None:
        path = os.path.join(os.path.expanduser('~'), 'data', 'cifar10')

    # 确保相关目录、及其子目录存在
    os.makedirs(path, exist_ok=True)

    # 如果本地文件不存在，那么，从网络上下载Cifar-10数据
    tar_file = os.path.join(path, tar)
    if not os.path.exists(tar_file):
        print("\n文件{}不存在，尝试从网络下载。".format(tar_file))
        # 从网上下载图片数据，并且，保存到本地文件
        img_url = os.path.join(url, tar)
        # 本地文件名称
        img_path = os.path.join(path, tar)
        print("开始下载: {}, 时间：{}".format(
            img_url, time.strftime('%Y-%m-%d %H:%M:%S')))
        # 文件下载进度条，

        def _progress(count, block_size, total_size):
            # 下载完成进度（百分比）
            percentage = float(count * block_size) / float(total_size) * 100.0
            # 下载进度条总共有50个方块组成（已完成的部分用'█'，未完成的用'.'）
            # 根据count的奇偶性，决定最后一个方块是否出现，实现闪烁的效果
            done = int(percentage / 2.0)
            done += (count & 1)
            # 显示进度条，其中'\r'表示在同一行显示（不换行）
            sys.stdout.write('\r[{}{}] 进度：{:.2f} count:{:2d}'.format
                             ('█' * done, '.' * (50 - done), percentage, count))
            sys.stdout.flush()
        # 从网络下载tar文件，并且，回调显示进度条的函数
        urllib.request.urlretrieve(img_url, img_path, _progress)
        print("保存到：{}".format(img_path))
        # 打印一个空行，将下载日志与数据读取日志分隔开
        print("")

    # 从tar.gz文件中读取训练数据和测试数据
    with tarfile.open(tar_file) as tar_object:
        # 每个文件包含10,000个彩色图像和10,000个标签
        # 每个图像的宽度、高度、深度（色彩通道），分别是32、32、3
        fsize = 10000 * (32 * 32 * 3) + 10000

        # 共有6个数据文件（5个训练数据文件、1个测试数据文件）
        buffer = np.zeros(fsize * 6, np.uint8)

        # 从tar.gz文件中读取数据文件的对象
        # -- tar.gz文件中还包含REDME和其他的非数据晚饭吗
        members = [file for file in tar_object if file.name in files]

        # 对数据文件按照名称排序
        # -- 确保按顺序装载数据文件
        # -- 确保测试数据最后加载
        members.sort(key=lambda member: member.name)

        # 从tar.gz文件中读取数据文件的的内容（解压）
        # 读取文件开始，增加空行隔开日志，更清晰
        print()
        for i, member in enumerate(members):
            # 得到tar.gz中的数据文件对象
            f = tar_object.extractfile(member)
            print("正在读取 {} 中的数据……".format(member.name))
            # 从数据文件对象中读取数据到缓冲区，按照字节读取
            buffer[i * fsize:(i + 1) *
                   fsize] = np.frombuffer(f.read(), np.ubyte)
        # 读取文件结束，增加空行隔开日志
        print()

    # 解析缓冲区数据
    # -- 样本数据是按数据块存储的，每个数据块有3073个字节长
    # -- 每个数据块的第一个字节是标签
    # -- 紧接着的3072个字节的图像数据（32 * 32 * 3 = 3,072）

    # 将每个数据块的第一个字节取出来，形成标签列表
    # 从第0个字节开始，将每隔3073个字节的数据取出来形成标签
    # 对应的字节索引为0×3073, 1×3073, 2×3073, 3×3073, 4×3073……
    labels = buffer[::3073]

    # 将标签数据删除，之后，剩下的全部是图像数据
    pixels = np.delete(buffer, np.arange(0, buffer.size, 3073))
    # 对图像数据进行归一化处理（除以255）
    images = pixels.reshape(-1, 3072).astype(np.float32)

    # 将样本数据切分成训练数据和测试数据
    # 第0个至第50,000个用作训练数据，从第50,000个开始的用作测试数据（共10,000个）
    train_images, test_images = images[:50000], images[50000:]
    train_labels, test_labels = labels[:50000], labels[50000:]

    return train_images, train_labels.astype(np.int32), \
        test_images, test_labels.astype(np.int32)


def cifar10_model(features, labels, mode):
    """    创建CIFAR10图像识别模型
    :param features: 输入的特征列表，这里只有一个输入特征张量"x"，代表输入的图像
    :param labels: 输出的特征列表，这里是图像所述的类别
    :param mode: 模式，是训练状态还是评估状态
    """

    # （1） 定义输入张量
    # 输入层张量，[batch_size, height, weight, depth]
    # batch_size等于-1代表重整为实际输入的训练数据个数
    # CIFAR10的图像格式为[height, weight, depth] = [32, 32, 3]
    input_layer = tf.reshape(features["x"], [-1, 32, 32, 3])

    # （2） 构建模型（卷积神经网络）
    # 第一个卷积层,直接接受输入层（输入的原始图像数据）
    # 过滤器个数Filter_count = 32, 过滤器大小 Filter_size: 5×5
    # 请注意：过滤器的深度总是与输入张量的深度保持一致，本例中Filter_depth = 3
    # 填充方式"same", 表示按照卷积之后图像保持原状来填充。另外一种填充方式"valid"
    # 过滤器的激活函数采用tf.nn.relu的方式
    # 本层的输出是形状为32×32×64的数据长方体
    conv1 = tf.layers.conv2d(
        inputs=input_layer,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

    # 第一个池化层，接收conv1的输出作为本层的输入
    # 采用最大化池化方法， 池化过滤器尺寸 3×3， 步长为2，这样实现重叠池化
    # 在这种情况下，填充的层数必然是单层，因为输出的数据长方体的尺寸必须满足公式：
    # Output_size = ceil(input_size / stride)
    # 本层输出的数据长方体为16×16×64
    pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[
                                    3, 3], strides=2, padding='SAME')

    # 第二个卷积层和池化层，从第一个池化层接受输入
    # 过滤器个数64个，尺寸5×5, 填充方式为保持图像不变，激活函数relu
    # 本层输出的数据长方体是16×16×64
    conv2 = tf.layers.conv2d(
        inputs=pool1,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)

    # 第二个池化层，从第二个卷积层接收输入
    # 本层输出的数据长方体是8×8×64
    pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[
                                    3, 3], strides=2, padding='SAME')

    # 将第二个池化层的输出展平，以方便与后面的全连接层连接
    pool2_flat = tf.reshape(pool2, [-1, 8 * 8 * 64])

    # 全连接层，接受第二个池化层展平后的结果作为输入
    # 共有1024个神经元、激活函数tf.nn.relu
    dense = tf.layers.dense(
        inputs=pool2_flat, units=1024, activation=tf.nn.relu)

    # Dropout层，提高模型的健壮性
    dropout = tf.layers.dropout(
        inputs=dense, rate=0.1, training=(mode == tf.estimator.ModeKeys.TRAIN))

    # 输出层，
    logits = tf.layers.dense(inputs=dropout, units=10)

    predictions = {
        # (为 PREDICT 和 EVAL 模式)生成预测值
        "classes": tf.argmax(input=logits, axis=1),
        # 将 `softmax_tensor` 添加至计算图。用于 PREDICT 模式下的 `logging_hook`.
        "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
    }

    # 如果是评估（测试）模式，那么，执行预测分析
    if mode == tf.estimator.ModeKeys.PREDICT:
        return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

    # 计算损失（可用于`训练`和`评价`中）
    loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

    # （3）完成模型训练
    # 配置训练操作（用于 TRAIN 模式）
    if mode == tf.estimator.ModeKeys.TRAIN:
        optimizer = tf.train.AdamOptimizer(learning_rate=1e-4)
        train_op = optimizer.minimize(
            loss=loss,
            global_step=tf.train.get_global_step())
        return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)

    # 添加评价指标（用于评估）
    eval_metric_ops = {
        "accuracy": tf.metrics.accuracy(
            labels=labels, predictions=predictions["classes"])}
    return tf.estimator.EstimatorSpec(
        mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)


def cifar10_train():
    """
    模型入口函数。读取训练数据完成模型训练和评估
    """
    # 创建一个卷积神经网络（CNN）的Estimator
    cifar10_classifier = tf.estimator.Estimator(
        model_fn=cifar10_model, model_dir="./tmp/cifar10_convnet_model")

    train_imgs, train_labels, test_imgs, test_labels = read_cifar10_data(
        "./data/")
    # 模型训练的数据输入函数
    train_input_fn = tf.estimator.inputs.numpy_input_fn(
        x={"x": train_imgs},
        y=train_labels,
        batch_size=100,
        num_epochs=None,
        shuffle=True)
    # 开始CIFAR10的模型训练
    cifar10_classifier.train(
        input_fn=train_input_fn,
        steps=20000)

    # 评估模型并输出结果
    eval_input_fn = tf.estimator.inputs.numpy_input_fn(
        x={"x": test_imgs},
        y=test_labels,
        num_epochs=1,
        shuffle=False)
    eval_results = cifar10_classifier.evaluate(input_fn=eval_input_fn)
    print("\n识别准确率: {:.2f}%\n".format(eval_results['accuracy'] * 100.0))


# 执行测试文件
cifar10_train()

你可能感兴趣的:(人工智能,深度学习,tensorflow,人工智能)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
使用tensorflow的多项式回归的例子（二） lishaoan77 tensorflow tensorflow 回归人工智能多项式回归
例2importtensorflowastfimportnumpyasnpimportmatplotlib.pyplotaspltplt.style.use('default')#importtensorflow.contrib.eagerastfe#fromgoogle.colabimportfiles#tf.enable_eager_execution()x=np.arange(0,5,0.1
使用tensorflow的线性回归的例子（七） lishaoan77 tensorflow tensorflow 线性回归人工智能
L1与L2损失这个脚本展示如何用TensorFlow求解线性回归。在算法的收敛性中，理解损失函数的影响是很重要的。这里我们展示L1和L2损失函数是如何影响线性回归的收敛性的。我们使用iris数据集,但是我们将改变损失函数和学习速率来看收敛性的改变。importmatplotlib.pyplotaspltimportnumpyasnpimporttensorflowastffromsklearnim
使用tensorflow的线性回归的例子（十二） lishaoan77 tensorflow tensorflow 线性回归人工智能戴明回归
DemingRegression这里展示如何用TensorFlow求解线性戴明回归。=+y=Ax+b我们用iris数据集,特别是:y=SepalLength且x=PetalWidth。戴明回归Demingregression也称为totalleastsquares,其中我们最小化从预测线到实际点(x,y)的最短的距离。最小二乘线性回归最小化与预测线的垂直距离，戴明回归最小化与预测线的总的距离，这种
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe