ChinaAI小童鞋

PaddlePaddle, TensorFlow, MXNet, Caffe2 , PyTorch五大深度学习框架2017-10评测

前言

本文将是2017下半年以来，最新也是最全的一个深度学习框架评测。这里的评测并不是简单的使用评测，我们将用这五个框架共同完成一个深度学习任务，从框架使用的易用性、训练的速度、数据预处理的繁琐程度，以及显存占用大小等几个方面来进行全方位的测评，除此之外，我们还将给出一个非常客观，非常全面的使用建议。最后提醒大家本篇文章不仅仅是一个评测，你甚至可以作为五大框架的入门教程。

0. 五大框架概览

在评测之前，让我们先对这五大框架进行一个全方位的概览，以及他们目前所处的发展地位。首先在这五大框架中，很多人肯定会问，为什么没有Keras？为什么没有CNTK？在这里我说明一点，本篇文章偏向于工业化级别的应用评测，主要评测主流框架，当然不是说Keras和CNTK就不主流了，文章没有任何利益相关的东西，只不过是Keras本身就拥有多种框架作为后端，因此与它的后端框架对比也就没有任何意义，Keras毫无疑问是速度最慢的。而CNTK由于笔者对Windows无感因此也就没有在评测范围之内(CNTK也是一个优秀的框架，当然也跨平台，感兴趣者可以去踩踩坑)。

TensorFlow可以说是目前发展来说最活跃的，TensorFlow目前已经有72.3k个star，MXNet是11.5k，Caffe2是5.9K, 当然caffe2要推出的稍晚一些，MXNet的官方GitHub repo也是后来又转到Apache的孵化项目中。但是从GitHub受关注度来看，无疑TensorFlow和MXNet是更被看好的。

即使我不做这篇测评，很多人也知道这些框架目前为止有一些这样的评价：

TensorFlow API比较繁杂，使用上手困难，乱七八糟的东西很多，但是生态丰富，很多深度学习模型多有TF的实现，有Google大佬加持；
MXNet 占用内存小，速度快，非常小巧玲珑，有着天生的开源基因，完全靠社区推动的框架；
Caffe2 是面向工业级应用的框架，但是推出较晚，而且主打Python2(execuse me? 2017年了还主打Python2？), 我不由自主的黑一下，从安装部署角度来说用户体验不是非常友好；
PyTorch 是Facebook面向学术界推出的一个框架，使用非常简单，搭建神经网络就像Keras和matlab一样，但是我又不得不黑一下，每次还得判断一下是GPU还是CPU？(execuse me? 真的应了那句话，我踩过了tf的坑才知道tf的好)；
PaddlePadddle 百度开源的一个框架，国内也有很多人用，我的感受是，非常符合中国人的使用习惯，但是在API的实用性上还有待进一步加强，我曾经写过一篇博客入门PaddlePaddle，不得不说，PaddlePaddle的中文文档写的非常清楚，上手比较简单PaddlePaddle三行代码从入门到精通;

以上评价是以前的评价，夹杂着一丝个人使用感受，最后说一下他们各自目前的好的动向：

TensorFlow models这个模型库更新非常快，以前的一些图片分类，目标检测，图片生成文字，生成对抗网络都有现成的深度学习应用的例子，包括现在更新的基于知识图谱的问答项目，神经网络编程机器人等项目，这些官方生态对于一个框架来说非常有用，这无疑是tf的一个长处
MXNet早在几个月前就推出了Gluon这个接口，说白了就是一个Keras，包装了一个更加方便使用的API，但是目前来说还只能实现一些简单的网络的构建，复杂的还是得用原生的API，这里有一个教程链接Gluon资料，除此之外，MXNet也有一个实例仓库，其中有一些有意思的项目比如语音识别，但是感觉实现的非常不友好，代码几乎凌乱不堪；
Caffe2 Caffe2相对于前面两者来说可以说非常弱了，没有丝毫亮点，说好的一个C++高速工业级框架的呢？除了吹牛逼忽悠大众能搞些有用的官方使用文档或者教程出来吗？不好多说什么。
PyTorch就一笔带过了，偏向于学术快速实现，要工业级应用，比如做个模型跑到服务器上或者安卓手机上或者嵌入式上应该搞不来；
PaddlePaddle 现在做的还不错，我强调一句，Paddle是唯一一个不配置任何第三方库，克隆直接make就能成功的框架, 被caffe编译虐过的人应该对此深有感触。

说了这么多，相信大家对目前的框架有了一个大致的了解，那么接下来我们就用其中几个框架来完成分类图片这么一个任务吧，这里面将包含图片如何导入模型, 如何写网络，整个训练的Pipeline等内容。

我们此次评测的任务是图片分类，大家尝试任何一个框架只需要新建一个文件夹，比如mxnet_classifier, 把数据扔到 data 里即可，我们侧重评测数据预处理的复杂程度，和网络编写的复杂程度。

图片下载地址images.tar , annotations.tar. 解压之后得到：

paddle_test

└── data

├── annotation .tar

└── images .tar

解压之后Images下面每一个文件夹是一个类别的狗，其实分类任务我们只要这个就可以了。

1. MXNet

首先上场的，用MXNet吧。建议大家看一下上面我贴出的Gluon李沐大神写的PPT，包含了Gluon和其他框架的区别，以及MXNet在多GPU上训练的优势。

没有安装的安装一下：

sudo pip3 install mxnet

sudo pip3 install mxnet-cu80

sudo pip3 install mxnet-cu80mkl

分别是CPU乞丐版，GPU土豪版，GPU加CPU加速至尊豪华版。安装完了你应该clone一下mxnet的源代码，从tools里面找到im2rec.py这个工具，我们做图片，不管是检测还是分割还是分类，都按照mxnet的逻辑把图片转成二进制的rec格式吧。

我们现在有了Images文件夹，用im2rec.py处理参数这样写：

python3 im2rec . py standford_dogs Images/ - - list true - - recursive true - - train - ratio 0 . 8 - - test - ratio 0 . 2

这一步会生成两个文件：

standford_dogs_train.lst
standford_dogs_test.lst

standford_dogs 是前缀， —list true表示生成列表，recursive用户这种每一个文件夹代表一类的情况，最后在standford_dogs_train.lst 里面的一行是这样的：

5008 27.000000 n 02092339-Weimaraner/n020 92339_2885.jpg

5092 27.000000 n 02092339-Weimaraner/n020 92339_6548.jpg

第一个数字是图片的总数目的index，第二个应该是类别的index但是这个.0000有点不可思议。好了，有了这个lst文件我们继续用im2rec来生成rec二进制数据吧, 这一步非常简单了，直接load上面的prefix和Images这个图片根目录即可：

python3 im2rec .py standford_dogs Images/

mxnet会依次生成train和test的rec文件：

OK, mxnet做数据集也不是非常的麻烦，这个过程如果满分五分的话我给4分，pytorch如果不考虑性能的话应该是最直接的，直接从文件夹导入，但是rec格式更快。生成之后总共有了2.8G的文件。

好了，数据准备了，直接写一个网络开始训练罗？我要写一个vgg怎么办？我要看论文吗？我要从第一层开始看网络结构吗？我要换ResNet怎么办？要换Inception怎么办？没有关系！mxnet 官方example包含了大多数这些网络结构！！

├── alexnet .py

├── googlenet .py

├── inception-bn .py

├── inception-resnet-v2 .py

├── inception-v3 .py

├── inception-v4 .py

├── lenet .py

├── mlp .py

├── mobilenet .py

├── resnet-v1 .py

├── resnet .py

├── resnext .py

└── vgg.py

更重要的是，我们看看alexnet的代码：

import mxnet as mx

import numpy as np

def get_symbol(num_classes, dtype='float32', **kwargs):

input_data = mx.sym.Variable( name="data")

if dtype == 'float16':

input_data = mx.sym.Cast( data=input_data, dtype=np.float16)

# stage 1

conv1 = mx.sym.Convolution( name='conv1',

data=input_data, kernel=(11, 11), stride=(4, 4), num_filter=96)

relu1 = mx.sym.Activation( data=conv1, act_type="relu")

lrn1 = mx.sym.LRN( data=relu1, alpha=0.0001, beta=0.75, knorm=2, nsize=5)

pool1 = mx.sym.Pooling(

data=lrn1, pool_type="max", kernel=(3, 3), stride=(2,2))

# stage 2

conv2 = mx.sym.Convolution( name='conv2',

data=pool1, kernel=(5, 5), pad=(2, 2), num_filter=256)

relu2 = mx.sym.Activation( data=conv2, act_type="relu")

lrn2 = mx.sym.LRN( data=relu2, alpha=0.0001, beta=0.75, knorm=2, nsize=5)

pool2 = mx.sym.Pooling( data=lrn2, kernel=(3, 3), stride=(2, 2), pool_type="max")

# stage 3

conv3 = mx.sym.Convolution( name='conv3',

data=pool2, kernel=(3, 3), pad=(1, 1), num_filter=384)

relu3 = mx.sym.Activation( data=conv3, act_type="relu")

conv4 = mx.sym.Convolution( name='conv4',

data=relu3, kernel=(3, 3), pad=(1, 1), num_filter=384)

relu4 = mx.sym.Activation( data=conv4, act_type="relu")

conv5 = mx.sym.Convolution( name='conv5',

data=relu4, kernel=(3, 3), pad=(1, 1), num_filter=256)

relu5 = mx.sym.Activation( data=conv5, act_type="relu")

pool3 = mx.sym.Pooling( data=relu5, kernel=(3, 3), stride=(2, 2), pool_type="max")

# stage 4

flatten = mx.sym.Flatten( data=pool3)

fc1 = mx.sym.FullyConnected( name='fc1', data=flatten, num_hidden=4096)

relu6 = mx.sym.Activation( data=fc1, act_type="relu")

dropout1 = mx.sym.Dropout( data=relu6, p=0.5)

# stage 5

fc2 = mx.sym.FullyConnected( name='fc2', data=dropout1, num_hidden=4096)

relu7 = mx.sym.Activation( data=fc2, act_type="relu")

dropout2 = mx.sym.Dropout( data=relu7, p=0.5)

# stage 6

fc3 = mx.sym.FullyConnected( name='fc3', data=dropout2, num_hidden=num_classes)

if dtype == 'float16':

fc3 = mx.sym.Cast( data=fc3, dtype=np.float32)

softmax = mx.sym.SoftmaxOutput( data=fc3, name='softmax')

return softmax

非常非常非常简洁！！！！，只是一个函数，唯一不同的就是类别的数目不同，最后函数根据类别不同返回一个softmax的loss。

最后我们看看怎么把数据导入，然后训练的！！！

"""

train pipe line in mxnet

"""

import mxnet as mx

from symbols.vgg import get_vgg

def train():

num_classes = 120

batch_size = 64

# shape not have to be it exactly are

data_shape = ( 3, 64, 64)

num_epoch = 50

prefix = 'standford_dogs_model'

train_iter = mx.io.ImageRecordIter(

path_imgrec= "data/standford_dogs_train.rec",

data_shape=data_shape,

batch_size=batch_size,

)

val_iter = mx.io.ImageRecordIter(

path_imgrec= "data/standford_dogs_test.rec",

data_shape=data_shape,

batch_size=batch_size,

)

model = mx.model.FeedForward(

# set mx.gpu(0, 1) for multiple gpu

ctx=mx.cpu(),

symbol=get_vgg(num_classes=num_classes),

num_epoch=num_epoch,

learning_rate= 0.01,

)

model.fit(

X=train_iter,

eval_data=val_iter,

# every 10 iteration log info

batch_end_callback=mx.callback.Speedometer(batch_size, 10),

epoch_end_callback=mx.callback.do_checkpoint(prefix=prefix)

)

if __name__ == '__main__':

train()

尼玛，简直简单到想哭。大家注意这里get_vgg就是直接从官方的example/image-classification里面拿的，我们训练一个vgg看看。运行之后发现网络已经跑起来了：

温馨提示一下，MXNet貌似已经摒弃了上面的写法，上面的写法和PyTorch一样，是一种生成式的写法，Model和Module的区别就是，后者更加Tensor化，也就是图化，运行之前先把GPU占领一下再说。

OK， MXNet的坑已经踩完了。我来总结一下MXNet不为人知的几点：

这是一个良心框架。可以看出它的开发者再用心的追求速度和易用性，否则也不会推出Gluon这个接口了，这个接口就是让普通开发者更加易用，同时追求速度；
MXNet是唯一一个比较中立的框架，你要知道，Google推出TensorFlow可是有小九九的，其内部至少有几套速度更快的纯C写的版本，否则TensorFlow怎么那么慢？不拉开差距怎么来的KPI？怎么让全球开发者为Google服务？(不是Google员工也是不是Google敌对员工，逃…)
MXNet的未来潜力很大，我最近在研究MXNet构建复杂的网络，比如Cycle-GAN，比如Seq2Seq的实现，但是不得不承认，这方面TensorFlow更加强大…

2. PaddlePaddle

为什么第二个评测用PaddlePaddle？第一，它最近表现很好，但是知道人很少，秉着为开发者引路的原则，增加以下曝光度，其实说实话，很多人不知道PaddlePaddle已经升级到了v2的Python API，而且内部还引入很多Go语言的代码，我没有仔细看这些代码是用来干啥的，但是很显然，PaddlePaddle在追求速度。

对Paddle的评测我这里列举以下Paddle的几个亮点的地方：

相对来说更易用的API，所谓相对是因为，它还是有一些冗杂的地方；
占用内存小，速度快，Paddle在百度内部应该也服务了相当多的项目，因此工业应用不成问题;
中文支持，不想国外的框架，PaddlePaddle还是有着相当多的中文文档的；
PaddlePaddle在自然语言处理上有很多现成的历程，比如情感分类，甚至是语音识别都有Demo；
PaddlePaddle支持多机多卡训练，也算是集大成者。

关于PaddlePaddle使用的Pipeline异步到我之前写的一个文章传送门。

3. TensorFlow

关于tf，还真的是爱恨交加，从刚入手到现在，他的API的繁杂性以及训练的繁琐几乎让人望而却步，不过好在它有一个非常强大的生态。我们来看看TensorFlow做分类任务应该怎么做。

首先，毫无疑问，最好的方法是把图片放到tfrecord这个文件类型中去。但是如何生成tfrecord是个蛋疼的问题，在这里我申明一点，tfrecord和MXNet的rec文件不同：

tfrecod是将文件以键值对的形式存放起来了，每个记录就是一个example，而MXNet存储需要先建立一个lst，然后从lst转成二进制文件。好吧其实也差不多，不过你应该能理解我说的意思。

我们看一下一个用来将图片转为tfrecord的代码：

from __future__ import absolute_import

from __future__ import division

from __future__ import print_function

from datetime import datetime

import os

import random

import sys

import threading

import numpy as np

import tensorflow as tf

class TFRecordsGenerator(object):

"""

this class is using for tf_records generations in image classification use

For usages:

All images must contains in different folders, TFRecordsGenerator will traverse

all folders and find different classes.

"""

def __init__(self,

name,

images_dir,

classes_file_path,

tf_records_save_dir,

num_shards= 4,

num_threads= 4):

self.name = name

self.classes_file_path = classes_file_path

self.images_dir = images_dir

self.tf_records_saved_dir = tf_records_save_dir

self.num_shards = num_shards

self.num_threads = num_threads

@staticmethod

def _int64_feature(value):

if not isinstance(value, list):

value = [value]

return tf.train.Feature(int64_list=tf.train.Int64List(value=value))

@staticmethod

def _bytes_feature(value):

return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))

def _convert_to_example(self, filename, image_buffer, label, text, height, width):

"""

Example for image classification

:param filename:

:param image_buffer:

:param label:

:param text:

:param height:

:param width:

:return:

"""

color_space = 'RGB'

channels = 3

image_format = 'JPEG'

example = tf.train.Example(features=tf.train.Features(feature={

'image/height': self._int64_feature(height),

'image/width': self._int64_feature(width),

'image/color_space': self._bytes_feature(tf.compat.as_bytes(color_space)),

'image/channels': self._int64_feature(channels),

'image/class/label': self._int64_feature(label),

'image/class/text': self._bytes_feature(tf.compat.as_bytes(text)),

'image/format': self._bytes_feature(tf.compat.as_bytes(image_format)),

'image/filename': self._bytes_feature(tf.compat.as_bytes(os.path.basename(filename))),

'image/encoded': self._bytes_feature(tf.compat.as_bytes(image_buffer))}))

return example

class ImageCoder(object):

def __init__(self):

self._sess = tf.Session()

self._png_data = tf.placeholder(dtype=tf.string)

image = tf.image.decode_png(self._png_data, channels= 3)

self._png_to_jpeg = tf.image.encode_jpeg(image, format= 'rgb', quality= 100)

self._decode_jpeg_data = tf.placeholder(dtype=tf.string)

self._decode_jpeg = tf.image.decode_jpeg(self._decode_jpeg_data, channels= 3)

def png_to_jpeg(self, image_data):

return self._sess.run(self._png_to_jpeg,

feed_dict={self._png_data: image_data})

def decode_jpeg(self, image_data):

image = self._sess.run(self._decode_jpeg,

feed_dict={self._decode_jpeg_data: image_data})

assert len(image.shape) == 3

assert image.shape[ 2] == 3

return image

@staticmethod

def _is_png(filename):

return '.png' in filename

def _process_image(self, filename, coder):

with tf.gfile.FastGFile(filename, 'r') as f:

image_data = f.read()

if self._is_png(filename):

print( 'Converting PNG to JPEG for %s' % filename)

image_data = coder.png_to_jpeg(image_data)

image = coder.decode_jpeg(image_data)

assert len(image.shape) == 3

height = image.shape[ 0]

width = image.shape[ 1]

assert image.shape[ 2] == 3

return image_data, height, width

def _process_image_files_batch(self, coder, thread_index, ranges, name, file_names,

texts, labels, num_shards):

num_threads = len(ranges)

assert not num_shards % num_threads

num_shards_per_batch = int(num_shards / num_threads)

shard_ranges = np.linspace(ranges[thread_index][ 0],

ranges[thread_index][ 1],

num_shards_per_batch + 1).astype(int)

num_files_in_thread = ranges[thread_index][ 1] - ranges[thread_index][ 0]

counter = 0

for s in range(num_shards_per_batch):

shard = thread_index * num_shards_per_batch + s

output_filename = '%s-%.5d-of-%.5d.tfrecord' % (name, shard, num_shards)

output_file = os.path.join(self.tf_records_saved_dir, output_filename)

writer = tf.python_io.TFRecordWriter(output_file)

shard_counter = 0

files_in_shard = np.arange(shard_ranges[s], shard_ranges[s + 1], dtype=int)

for i in files_in_shard:

filename = file_names[i]

label = labels[i]

text = texts[i]

image_buffer, height, width = self._process_image(filename, coder)

example = self._convert_to_example(filename, image_buffer, label,

text, height, width)

writer.write(example.SerializeToString())

shard_counter += 1

counter += 1

if not counter % 1000:

print( '%s [thread %d]: Processed %d of %d images in thread batch.' %

(datetime.now(), thread_index, counter, num_files_in_thread))

sys.stdout.flush()

writer.close()

print( '%s [thread %d]: Wrote %d images to %s' %

(datetime.now(), thread_index, shard_counter, output_file))

sys.stdout.flush()

shard_counter = 0

print( '%s [thread %d]: Wrote %d images to %d shards.' %

(datetime.now(), thread_index, counter, num_files_in_thread))

sys.stdout.flush()

def _process_image_files(self, file_names, texts, labels):

assert len(file_names) == len(texts)

assert len(file_names) == len(labels)

spacing = np.linspace( 0, len(file_names), self.num_threads + 1).astype(np.int)

ranges = []

for i in range(len(spacing) - 1):

ranges.append([spacing[i], spacing[i + 1]])

print( 'Launching %d threads for spacings: %s' % (self.num_threads, ranges))

sys.stdout.flush()

coord = tf.train.Coordinator()

coder = self.ImageCoder()

threads = []

for thread_index in range(len(ranges)):

args = (coder, thread_index, ranges, self.name, file_names,

texts, labels, self.num_shards)

t = threading.Thread(target=self._process_image_files_batch, args=args)

t.start()

threads.append(t)

coord.join(threads)

print( '%s: Finished writing all %d images in data set.' %

(datetime.now(), len(file_names)))

sys.stdout.flush()

def _find_image_files(self):

print( 'Determining list of input files and labels from %s.' % self.images_dir)

unique_labels = [l.strip() for l in tf.gfile.FastGFile(

self.classes_file_path, 'r').readlines()]

labels = []

file_names = []

texts = []

label_index = 1

for text in unique_labels:

jpeg_file_path = '%s/%s/*' % (self.images_dir, text)

matching_files = tf.gfile.Glob(jpeg_file_path)

labels.extend([label_index] * len(matching_files))

texts.extend([text] * len(matching_files))

file_names.extend(matching_files)

if not label_index % 100:

print( 'Finished finding files in %d of %d classes.' % (

label_index, len(labels)))

label_index += 1

shuffled_index = list(range(len(file_names)))

random.seed( 12345)

random.shuffle(shuffled_index)

file_names = [file_names[i] for i in shuffled_index]

texts = [texts[i] for i in shuffled_index]

labels = [labels[i] for i in shuffled_index]

print( 'Found %d JPEG files across %d labels inside %s.' %

(len(file_names), len(unique_labels), self.images_dir))

print( '[INFO] Attempting logging out file_names list: {}'.format( '\n'.join(file_names)))

return file_names, texts, labels

def generate(self):

assert not self.num_shards % self.num_threads, (

'Please make the FLAGS.num_threads commensurate with FLAGS.train_shards')

print( 'Saving results to %s' % self.tf_records_saved_dir)

file_names, texts, labels = self._find_image_files()

self._process_image_files(file_names, texts, labels)

print( 'All Done! Solved {} images. tf_records file saved into {}.'.format(len(file_names), os.path.abspath(

self.tf_records_saved_dir)))

这是我包装的一个类，只要传入路径调用generate就可以生成tfrecord文件。看到这里估计你已经哭了，尼玛这么复杂?!!!!????

好吧，暂且不管这个具体咋么实现的，再来看看数据怎么load进模型的吧：

import tensorflow as tf

import logging

import numpy as np

import os

import time

from datasets.tiny5.tiny5 import Tiny5

from models.alexnet import AlexNet

from models.vgg import VGGNet

from models.fanet import FaNet

logging.basicConfig(level=logging.DEBUG,

format= '%(asctime)s %(filename)s line:%(lineno)d %(levelname)s %(message)s',

datefmt= '%a, %d %b %Y %H:%M:%S')

tf.app.flags.DEFINE_string( 'checkpoints_dir', './checkpoints/tiny5/', 'checkpoints save path.')

tf.app.flags.DEFINE_string( 'model_prefix', 'tiny5-alex-net', 'model save prefix.')

tf.app.flags.DEFINE_boolean( 'is_restore', False, 'to restore from previous or not.')

tf.app.flags.DEFINE_integer( 'target_width', 256, 'target width for resize.')

tf.app.flags.DEFINE_integer( 'target_height', 256, 'target height for resize.')

tf.app.flags.DEFINE_integer( 'batch_size', 24, 'batch size for train.')

FLAGS = tf.app.flags.FLAGS

def running(is_train=True):

if not os.path.exists(FLAGS.checkpoints_dir):

os.makedirs(FLAGS.checkpoints_dir)

tiny5 = Tiny5(

images_dir= './datasets/tiny5/images',

classes_file_path= './datasets/tiny5/tiny5_classes.txt',

target_height=FLAGS.target_height,

target_width=FLAGS.target_width,

batch_size=FLAGS.batch_size

)

images, labels = tiny5.batch_inputs()

print(images)

# model = AlexNet(num_classes=5)

# model = VGGNet(num_classes=5)

model = FaNet(num_classes= 5)

config = tf.ConfigProto()

config.gpu_options.allow_growth = True

saver = tf.train.Saver(max_to_keep= 2)

init_op = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())

with tf.Session() as sess:

coord = tf.train.Coordinator()

threads = tf.train.start_queue_runners(sess=sess, coord=coord)

sess.run(init_op)

start_epoch = 0

checkpoint = tf.train.latest_checkpoint(FLAGS.checkpoints_dir)

if FLAGS.is_restore:

if checkpoint:

saver.restore(sess, checkpoint)

logging.info( "restore from the checkpoint {0}".format(checkpoint))

start_epoch += int(checkpoint.split( '-')[ -1])

if is_train:

step = 0

logging.info( 'training start...')

try:

while not coord.should_stop():

feed_dict = model.make_train_inputs(images, labels)

_, loss, step = sess.run(

[model.train_op, model.loss, model.global_step], feed_dict=feed_dict

)

logging.info( 'epoch {}, loss {}'.format(step, loss))

except tf.errors.OutOfRangeError:

logging.info( 'optimization done! enjoy color net.')

saver.save(sess, os.path.join(FLAGS.checkpoints_dir, FLAGS.checkpoints_prefix), global_step=step)

except KeyboardInterrupt:

logging.info( 'interrupt manually, try saving checkpoint for now...')

saver.save(sess, os.path.join(FLAGS.checkpoints_dir, FLAGS.model_prefix), global_step=step)

logging.info( 'last epoch were saved, next time will start from epoch {}.'.format(step))

finally:

coord.request_stop()

coord.join(threads)

else:

logging.info( 'start inference...')

inference_image_path = './images/1.png'

input_image = tiny5.single_image_input(inference_image_path)

feed_dict = model.make_inference_inputs(input_image)

outputs = sess.run([model.inference_outputs(n_top= 2)], feed_dict=feed_dict)

print(outputs)

def main(args):

running(args)

if __name__ == '__main__':

tf.app.run()

这个训练的代码，大概的训练步骤分为：

使用tf.ConfigProto()来生成一个config，设置gpu自动生长，同时设置一个saver，这个saver就是最大保存的数目；
设置初始化的变量op，设置一个tf.Train.Coordinator()来作为训练协调者，初始化图；
for循环所有的epoch，在每次循环里面catch一下tf.errors.OutOfRangeError表示一个batch训练完了，catch一下KeyBoardInterrupt；
最后是保存模型

大家可以感受一下TensorFlow一整套流程下来的复杂程度。这里面还没有写我的网络，没有写我的数据DataLoader，整个代码在我的GitHub仓库可以找到原始代码，传送门, 如果你觉得那个项目过于陈旧可以跟进我的一些最新的项目，我近期在TensorFlow上做的工作有：

用Google最新nmt模型训练聊天机器人；
使用GAN做Cylce-GAN生成；
使用KnowledgeDatabase和知识图谱做问答系统；
目标检测和分割等常规性工作

4. PyTorch

PyTorch如果做图片预测我就不详细讲了，很多人说PyTorch很简单，但是我并没有觉得简单到哪里去，我总结一下PyTorch目前来说一些优点吧。

立即式编程，也就是运行立马出结果，不同于TensorFlow的图式，你必须把所有程序写完之后才知道结果什么；
安装也比较方便，但是跨平台部署就比较麻烦了，这也和PyTorch的定位有关，当然PyTorch刚推出来的时候有几篇官方教程写的不错，主要是RNN文本生成，Seq2Seq翻译的实现，有兴趣的同学可以看一下，但是都是非常简单的实现，跟TensorFlow的官方例子差距蛮大；
只是构建网络比较简单，但是具体训练的PipeLine还是有点麻烦，尤其是我每次变量还得指定是CPU还是GPU，每次load模型的时候还得load是CPU还是GPU，个人感觉略麻烦；

PyTorch推出来的时候很火，现在貌似熄火了….

5. Caffe2

caffe2 不得不提一下，caffe的进化版本？？？？caffe用着还好，c++调接口还蛮方便，例子也很多，caffe2为毛主打python，还python2？？？不过这也跟caffe2定位于工业使用有关，但是总体来说有这么几点：

感觉没有多少社区，虽然caffe非常多公司用，但是那毕竟是第一代版本，一般公司用用还行，容易与时代脱节；
caffe2也没有多少亮点，官方的教程我是没有看到什么实质性的东西，后期也没有更多的example；
好像C++接口也不是非常友好，至少在例子上很少….一个框架推出来，不教人去用那推出来有啥意思？

总结

我写文章喜欢一目了然，文章结构大致对比了5种框架的优缺点，那么我直接给使用者一些建议，防止大家采坑：

如果你是深度学习老鸟，你应该选择TensorFlow，但是我不得不告诉你TensorFlow在1.2版本推出来的API，在1.4版本很有可能就大改了…..
如果你是深度学习菜鸟，你应该选择MXNet或者PaddlePaddle，很多人会说，我曹，为什么不用Keras？？好吧，Keras当然也可以用，但是不建议一直用，还是得熟悉一下稍微底层一些的框架；
如果你是….如果你是小学生？高中生或者初中生，你可以用一下PaddlePaddle，因为你英文可能不太好。

如果你想跟进我的更多TensorFlow项目欢迎在Github寻找我的联系方式，加入QQ群交流。

This article was original written by Jin Tian, welcome re-post, first come with https://jinfagang.github.io . but please keep this copyright info, thanks, any question could be asked via wechat: jintianiloveu

你可能感兴趣的:(行业,编程工具,PaddlePaddle,Tensorflow,人工智能)

密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
Cursor44.11 无限续杯攻略：持续畅享 AI 编程利器不会算法的小灰人工智能编辑器 vscode AI编程经验分享
一、引言在当今数字化快速发展的时代，高效的编程工具对于开发者来说如同珍宝。Cursor作为一款基于VSCode二次开发的强大AI编程编辑器，凭借其内置的多种AI大模型，如GPT-4、GPT-4o、Claude-3.5以及近期热门的DeepSeek满血版R1，为开发者提供了前所未有的编程体验。它能够快速生成代码、精准修复错误、智能优化逻辑等，极大地提升了编程效率。然而，新用户注册Cursor虽可获得
程序员晋升架构师实战指南甘苦人生职业规划职场和发展
以下是为程序员量身定制的晋升架构师实战指南，结合行业案例与可落地路径，助你完成技术跃迁：一、晋升路径拆解（从Code到Architecture）程序员→高级工程师核心任务：独立完成模块开发（需求分析+方案设计+编码实现）技术重点：掌握1-2门核心语言（如Java/Go）、熟悉主流框架（SpringCloud/Dubbo）案例：主导用户中心模块开发，通过缓存优化将接口响应时间从800ms降至150m
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
如何使用LABVIEW调用BarTender的子程序：Bartender API调用测试，LABVIEW高效调用BarTender子程序的Bartender API实践 QZtcYmIYnDal labview 程序人生
BartenderAPI的调用本测试是LABVIEW怎么调用BarTender的子程序，可供调用。ID:89200597584724364行走的CdBartenderAPI的调用在软件开发领域，集成不同系统或工具的功能已经成为常见的需求。而在某些特定的行业或领域，如标签打印和条码管理，BarTender是一款备受欢迎的软件。BarTender作为一种强大的标签和条码设计与打印解决方案，能够满足各种
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
加快推进工业互联网，图扑“智”绘发展新蓝图智慧园区数字孪生 3d 网络人工智能物联网前端
当前，智能制造已成为我国实现从制造大国走向制造强国的战略目标，在迈向“钢铁强国”的征程上，“智慧”正成为钢铁产业的鲜明特征。图扑软件-构建先进2D和3D可视化所需要的一切方大九钢公司围绕钢铁企业管理模式变革的需求，借力能源绿色低碳转型的契机，以信息技术广泛应用为主导，大力推进“智能制造”，“淬炼”智慧钢铁。并与图扑软件合作，率先将5G、可视化、GIS相关技术引入钢铁行业。打造基于5G+云平台的智慧
石油储运生产 2D 可视化，组态应用赋能工业智慧发展智慧园区智慧城市 big data 人工智能大数据物联网网络
当前，国际油价低位徘徊导致各国石油化工行业投资大幅缩减，石油化工建设行业竞争环境日趋严峻，施工企业的利润空间也被不断压缩。内外交困的环境下，促使企业采取更有效的管理手段来提高效率和降低成本。石油工业大数据具有无限潜力与价值，将大数据与数据挖掘技术应用其中，不仅可以提升石油行业工业化水平，而且对其智慧化发展起到强有力的推动作用。图扑软件-构建先进2D和3D可视化所需要的一切图扑软件采用自主研发的HT
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
2D 可视赋能智慧水务绿色集约化发展智慧园区物联网 big data 人工智能
随着国家对环境保护治理程度的日益重视，各地政府积极响应国家政策，在共同聚焦生态文明建设下，急速催生了水务行业数字化转型。如今“供排污”一体化管理系统成为行业发展的重要趋势，提高水务精细作业、集中管控、数据透明成为刚需。Hightopo应用自主研发的HT产品，搭建了以厦门区域为载体的2D智慧水务可视化解决方案。界面摒弃了以往传统的地图模式，采用更加简洁的六边形色块拼接出湖泊水库等地形，河流分支则运用
ESP32-C6助力设备互联互通，Wi-Fi6无线通信方案，物联网交互联动深圳启明云端科技 WiFi6 ESP32-C6 乐鑫物联网无线方案
在物联网飞速发展的今天，连接技术的革新成为推动行业进步的关键力量。Wi-Fi6技术的出现，犹如一颗璀璨的新星，为物联网设备带来了前所未有的高效与低耗体验。乐鑫推出的ESP32-C6作为首款支持Wi-Fi6的SoC，集成了2.4GHzWi-Fi6、Bluetooth5(LE)和802.15.4协议，这一组合使其具备了行业领先的射频性能。其支持的上行、下行正交频分多址（OFDMA）接入和下行多用户多输
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
【最新】TensorFlow、cuDNN、CUDA三者之间的最新版本对应及下载地址江上_酒开发环境及工具配置 TensorFlow CUDA cuDNN
TensorFlow、cuDNN、CUDA对应关系官网查询地址CUDA下载地址cuDNN下载地址VersionPythonversionCompilerBuildtoolscuDNNCUDAtensorflow_gpu-2.9.03.7-3.10MSVC2019Bazel5.0.08.111.2tensorflow_gpu-2.8.03.7-3.10MSVC2019Bazel4.2.18.111.
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
2025年入职/转行网络安全，该如何规划？网络安全职业规划教网络安全的毛老师 web安全安全网络运维云计算
网络安全是一个日益增长的行业，对于打算进入或转行进入该领域的人来说，制定一个清晰且系统的职业规划非常重要。2025年，网络安全领域将继续发展并面临新的挑战，包括不断变化的技术、法规要求以及日益复杂的威胁环境。以下是一个关于网络安全职业规划的详细指南，涵盖了从入门到高级岗位的成长路径、技能要求、资源获取等方面的内容。第一部分：网络安全行业概述1.1网络安全的现状与未来网络安全已经成为全球企业和政府的
2025年入职/转行网络安全，该如何规划？网络安全职业规划教网络安全的毛老师 web安全安全网络安全渗透测试漏洞挖掘
网络安全是一个日益增长的行业，对于打算进入或转行进入该领域的人来说，制定一个清晰且系统的职业规划非常重要。2025年，网络安全领域将继续发展并面临新的挑战，包括不断变化的技术、法规要求以及日益复杂的威胁环境。以下是一个关于网络安全职业规划的详细指南，涵盖了从入门到高级岗位的成长路径、技能要求、资源获取等方面的内容。第一部分：网络安全行业概述1.1网络安全的现状与未来网络安全已经成为全球企业和政府的
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
【005安卓开发方案调研】之Flutter+Dart技术开发安卓 ThinkPet 移动app开发 android flutter dart 跨平台
基于2025年国内移动开发环境现状，结合多份行业分析报告和技术文档，对Flutter+Dart开发安卓应用的技术成熟度和生态适配性分析如下：一、技术成熟度评估1.跨平台能力达到生产级标准Flutter的Skia自渲染引擎和Dart的AOT/JIT双编译模式，实现了90%以上的原生性能表现，在电商、社交、工具类应用中已无明显性能瓶颈。实测数据显示，列表滚动帧率稳定在55-60FPS，与原生开发差距小
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
租赁APP开发的全攻略和市场潜力分析红点聊租赁其他
内容概要在当今快节奏的生活中，租赁APP似乎成为了我们日常生活的“新宠”。它不仅为个人提供了便利，也为商家开辟了一片广阔的蓝海。要想在这一领域取得成功，首先得做好市场调研。了解用户需求、竞争对手和市场动态是必不可少的。接下来是核心功能设计，我们需要考虑如何让用户更方便地找到、租赁商品，同时优化用户体验，让每一位潜在用户都能心甘情愿地停留与互动。为了更直观地理解市场，我们可以参考以下表格：行业增长率
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod