IEEE_FELLOW

tensorflow学习笔记之使用tensorflow进行MNIST分类（2）

接着上一篇：http://blog.csdn.net/IEEE_FELLOW/article/details/53012351

本文参考Yann LeCun的LeNet5经典架构，稍加ps得到下面适用于本手写识别的cnn结构，构造一个两层卷积神经网络，神经网络的结构如下图所示：

输入-卷积-pooling-卷积-pooling-全连接层-Dropout-Softmax输出

第一层卷积利用5*5的patch，32个卷积核，可以计算出32个特征。然后进行maxpooling。第二层卷积利用5*5的patch，64个卷积核，可以计算出64个特征。然后进行max pooling。卷积核的个数是我们自己设定，可以增加卷积核数目提高分类精度，但是那样会增加更大参数，提高计算成本。

这样输入是分辨率为28*28的图片。利用5*5的patch进行卷积。我们的卷积使用1步长（stride size），0填充模块（zero padded），这样得到的输出和输入是同一个大小。经过第一层卷积之后，卷积特征大小为28*28。然后通过ReLU函数激活。我们的pooling用简单传统的2x2大小的模板做max pooling，这样pooling后得到14*14大小的特征。经过第二层卷积后，卷积特征大小为14*14，然后通过ReLU函数激活，再经过pooling后得到特征大小为7*7。

现在，图片尺寸减小到7x7，我们加入一个有1024个神经元的全连接层，用于处理整个图片。我们把池化层输出的张量展开成一些向量，乘上权重矩阵，加上偏置，然后对其使用ReLU。

为了避免过拟合，在全连接层输出接上dropout层。Dropout层在训练时屏蔽一半的神经元。

tensorflow学习笔记之使用tensorflow进行MNIST分类（2）_第2张图片

DropOut Network

最后输出端为一个Softmax层用于分类。

以上是本教程的模型整体结构，下面将依次讲解该模型的tensorflow实现流程。

1 程序说明

1.1 加载MNIST数据集

用下面的代码将下载后的数据导入到你的项目里面，也可以直接复制粘贴到你的代码文件里面：

1.	from tensorflow.examples.tutorials.mnist import input_data  
2.	mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

这里，mnist是一个轻量级的类。它以Numpy数组的形式存储着训练、校验和测试数据集。

1.2 运行TensorFlow的InteractiveSession

Tensorflow依赖于一个高效的C++后端来进行计算。与后端的这个连接叫做session。一般而言，使用TensorFlow 程序的流程是先创建一个图，然后在session中启动它。

这里，我们使用更加方便的InteractiveSession类。通过它，你可以更加灵活地构建你的代码。它能让你在运行图的时候，插入一些计算图，这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利，比如使用IPython。如果你没有使用InteractiveSession，那么你需要在启动session之前构建整个计算图，然后启动该计算图。

1.	import tensorflow as tf  
2.	sess = tf.InteractiveSession()

1.3 构建Softmax 回归模型

占位符

我们通过为输入图像和目标输出类别创建节点，来开始构建计算图。

1.	x = tf.placeholder("float", shape=[None, 784])  
2.	y_ = tf.placeholder("float", shape=[None, 10])

这里的x和y并不是特定的值，相反，他们都只是一个占位符，可以在TensorFlow运行某一计算时根据该占位符输入具体的值。

输入图片x是一个2维的浮点数张量。这里，分配给它的shape为[None, 784]，其中784是一张展平的MNIST图片的维度。None表示其值大小不定，在这里作为第一个维度值，用以指代batch的大小，意即x的数量不定。输出类别值y_也是一个2维张量，其中每一行为一个10维的one-hot向量,用于代表对应某一MNIST图片的类别。

虽然placeholder的shape参数是可选的，但有了它，TensorFlow能够自动捕捉因数据维度不一致导致的错误。

1.4 权重初始化

变量

我们现在为模型定义权重W和偏置b。可以将它们当作额外的输入量，但是TensorFlow有一个更好的处理方式：变量。一个变量代表着TensorFlow计算图中的一个值，能够在计算过程中使用，甚至进行修改。在机器学习的应用过程中，模型参数一般用Variable来表示。

我们在调用tf.Variable的时候传入初始值。

为了创建这个模型，我们需要创建大量的权重和偏置项。这个模型中的权重在初始化时应该加入少量的噪声来打破对称性以及避免0梯度。由于我们使用的是ReLU神经元，因此比较好的做法是用一个较小的正数来初始化偏置项，以避免神经元节点输出恒为0的问题（deadneurons）。为了不在建立模型的时候反复做初始化操作，我们定义两个函数用于初始化。

1.	def weight_variable(shape):  
2.	  initial = tf.truncated_normal(shape, stddev=0.1)  
3.	  return tf.Variable(initial)  
4.	  
5.	def bias_variable(shape):  
6.	  initial = tf.constant(0.1, shape=shape)  
7.	  return tf.Variable(initial)

变量需要通过seesion初始化后，才能在session中使用。这一初始化步骤为，为初始值指定具体值（本例当中是全为零），并将其分配给每个变量,可以一次性为所有变量完成此操作。

1.	sess.run(tf.initialize_all_variables())

1.5 卷积和Pooling

TensorFlow在卷积和Pooling上有很强的灵活性。我们怎么处理边界？步长应该设多大？在这个实例里，我们的卷积使用1步长（stride size），0填充模块（zero padded），保证输出和输入是同一个大小。我们的pooling用简单传统的2x2大小的模板做maxpooling。为了代码更简洁，我们把这部分抽象成一个函数。

1.	def conv2d(x, W):  
2.	  return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')  
3.	  
4.	def max_pool_2x2(x):  
5.	  return tf.nn.max_pool(x, ksize=[1, 2, 2, 1],  
6.	                        strides=[1, 2, 2, 1], padding='SAME')

1.6 第一层卷积

现在我们可以开始实现第一层了。它由一个卷积接一个max pooling完成。卷积在每个5x5的patch中算出32个特征。卷积的权重张量形状是[5, 5, 1, 32]，前两个维度是patch的大小，接着是输入的通道数目，最后是输出的通道数目。而对于每一个输出通道都有一个对应的偏置量。

1.	W_conv1 = weight_variable([5, 5, 1, 32])  
2.	b_conv1 = bias_variable([32])

为了用这一层，我们把x变成一个4d向量，其第2、第3维对应图片的宽、高，最后一维代表图片的颜色通道数(因为是灰度图所以这里的通道数为1，如果是rgb彩色图，则为3)。

1.	x_image = tf.reshape(x, [-1,28,28,1])

我们把x_image和权值向量进行卷积，加上偏置项，然后应用ReLU激活函数，最后进行maxpooling。

1.	h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)  
2.	h_pool1 = max_pool_2x2(h_conv1)

1.7 第二层卷积

为了构建一个更深的网络，我们会把几个类似的层堆叠起来。第二层中，每个5x5的patch会得到64个特征。

1.	W_conv2 = weight_variable([5, 5, 32, 64])  
2.	b_conv2 = bias_variable([64])  
3.	  
4.	h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)  
5.	h_pool2 = max_pool_2x2(h_conv2)

1.8 全连接层（fully-connectedlayer）

现在，图片尺寸减小到7x7，我们加入一个有1024个神经元的全连接层，用于处理整个图片。我们把池化层输出的张量reshape成一些向量，乘上权重矩阵，加上偏置，然后对其使用ReLU。

1.	W_fc1 = weight_variable([7 * 7 * 64, 1024])  
2.	b_fc1 = bias_variable([1024])  
3.	  
4.	h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])  
5.	h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

1.9 Dropout

为了减少过拟合，我们在输出层之前加入dropout。我们用一个placeholder来代表一个神经元的输出在dropout中保持不变的概率。这样我们可以在训练过程中启用dropout，在测试过程中关闭dropout。 TensorFlow的tf.nn.dropout操作除了可以屏蔽神经元的输出外，还会自动处理神经元输出值的scale。所以用dropout的时候可以不用考虑scale。

1.	keep_prob = tf.placeholder("float")  
2.	h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

对于本教程所搭建的小型卷积网络，实际上有没有dropout层性能几乎相同。dropout通常能够很好的减少过拟合，特别适用于训练非常大型的神经网络。

1.10 输出层

最后，我们添加一个softmax层，就像前面的单层softmax regression一样。

1.	W_fc2 = weight_variable([1024, 10])  
2.	b_fc2 = bias_variable([10])  
3.	  
4.	y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

1.11 训练和评估模型

为了进行训练和评估，我们用更加复杂的ADAM进行优化，在feed_dict中加入额外的参数keep_prob来控制dropout比例。然后每100次迭代输出一次日志。

1.	cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))  
2.	train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)  
3.	correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))  
4.	accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  
5.	sess.run(tf.initialize_all_variables())  
6.	for i in range(20000):  
7.	  batch = mnist.train.next_batch(50)  
8.	  if i%100 == 0:  
9.	    train_accuracy = accuracy.eval(feed_dict={  
10.	        x:batch[0], y_: batch[1], keep_prob: 1.0})  
11.	    print "step %d, training accuracy %g"%(i, train_accuracy)  
12.	  train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})  
13.	  
14.	print "test accuracy %g"%accuracy.eval(feed_dict={  
15.	    x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0})

注意15行因为测试样本太大，可能会出现内存溢出：

tensorflow学习笔记之使用tensorflow进行MNIST分类（2）_第3张图片

那么将测试集进行划分成batch，然后进行测试：

1.	for i in xrange(10):  
2.	    testSet = mnist.test.next_batch(1000)  
3.	    print("test accuracy %g"%accuracy.eval(feed_dict={ x: testSet[0], y_: testSet[1], keep_prob: 1.0}))  
4.	  
5.	#print "test accuracy %g" % accuracy.eval(feed_dict={x:mnist.test.images, y_:mnist.test.labels, keep_prob:1.0})

上述流程，在最终测试集上的准确率大概是99.22%。

tensorflow学习笔记之使用tensorflow进行MNIST分类（2）_第4张图片

参考资料：

http://download.tensorflow.org/paper/whitepaper2015.pdf

https://www.tensorflow.org/versions/r0.11/get_started/basic_usage.html#basic-usage、

附上完整代码：

MLP_CNN.py

1.	# load MNIST data  
2.	import input_data  
3.	mnist = input_data.read_data_sets("MNIST_data", one_hot=True)  
4.	  
5.	# start tensorflow interactiveSession  
6.	import tensorflow as tf  
7.	sess = tf.InteractiveSession()  
8.	  
9.	# weight initialization  
10.	def weight_variable(shape):  
11.	    initial = tf.truncated_normal(shape, stddev=0.1)  
12.	    return tf.Variable(initial)  
13.	  
14.	def bias_variable(shape):  
15.	    initial = tf.constant(0.1, shape = shape)  
16.	    return tf.Variable(initial)  
17.	  
18.	# convolution  
19.	def conv2d(x, W):  
20.	    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')  
21.	# pooling  
22.	def max_pool_2x2(x):  
23.	    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')  
24.	  
25.	# Create the model  
26.	# placeholder  
27.	x = tf.placeholder("float", [None, 784])  
28.	y_ = tf.placeholder("float", [None, 10])  
29.	  
30.	# first convolutinal layer  
31.	w_conv1 = weight_variable([5, 5, 1, 32])  
32.	b_conv1 = bias_variable([32])  
33.	  
34.	x_image = tf.reshape(x, [-1, 28, 28, 1])  
35.	  
36.	h_conv1 = tf.nn.relu(conv2d(x_image, w_conv1) + b_conv1)  
37.	h_pool1 = max_pool_2x2(h_conv1)  
38.	  
39.	# second convolutional layer  
40.	w_conv2 = weight_variable([5, 5, 32, 64])  
41.	b_conv2 = bias_variable([64])  
42.	  
43.	h_conv2 = tf.nn.relu(conv2d(h_pool1, w_conv2) + b_conv2)  
44.	h_pool2 = max_pool_2x2(h_conv2)  
45.	  
46.	# densely connected layer  
47.	w_fc1 = weight_variable([7*7*64, 1024])  
48.	b_fc1 = bias_variable([1024])  
49.	  
50.	h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])  
51.	h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, w_fc1) + b_fc1)  
52.	  
53.	# dropout  
54.	keep_prob = tf.placeholder("float")  
55.	h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)  
56.	  
57.	# readout layer  
58.	w_fc2 = weight_variable([1024, 10])  
59.	b_fc2 = bias_variable([10])  
60.	  
61.	y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, w_fc2) + b_fc2)  
62.	  
63.	# train and evaluate the model  
64.	cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(y_conv, y_))  
65.	train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)  
66.	correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))  
67.	accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))  
68.	sess.run(tf.initialize_all_variables())  
69.	for i in range(20000):  
70.	  batch = mnist.train.next_batch(50)  
71.	  if i%100 == 0:  
72.	    train_accuracy = accuracy.eval(feed_dict={  
73.	        x:batch[0], y_: batch[1], keep_prob: 1.0})  
74.	    print("step %d, training accuracy %g"%(i, train_accuracy))  
75.	  train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})  
76.	for i in xrange(10):  
77.	    testSet = mnist.test.next_batch(1000)  
78.	    print("test accuracy %g"%accuracy.eval(feed_dict={ x: testSet[0], y_: testSet[1], keep_prob: 1.0}))  
79.	  
80.	#print "test accuracy %g" % accuracy.eval(feed_dict={x:mnist.test.images, y_:mnist.test.labels, keep_prob:1.0})

input_data.py

# Copyright 2015 Google Inc. All Rights Reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
# ==============================================================================
"""Functions for downloading and reading MNIST data."""
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import gzip
import os
import tensorflow.python.platform
import numpy
from six.moves import urllib
from six.moves import xrange  # pylint: disable=redefined-builtin
import tensorflow as tf
SOURCE_URL = 'http://yann.lecun.com/exdb/mnist/'
def maybe_download(filename, work_directory):
  """Download the data from Yann's website, unless it's already here."""
  if not os.path.exists(work_directory):
    os.mkdir(work_directory)
  filepath = os.path.join(work_directory, filename)
  if not os.path.exists(filepath):
    filepath, _ = urllib.request.urlretrieve(SOURCE_URL + filename, filepath)
    statinfo = os.stat(filepath)
    print('Successfully downloaded', filename, statinfo.st_size, 'bytes.')
  return filepath
def _read32(bytestream):
  dt = numpy.dtype(numpy.uint32).newbyteorder('>')
  return numpy.frombuffer(bytestream.read(4), dtype=dt)[0]
def extract_images(filename):
  """Extract the images into a 4D uint8 numpy array [index, y, x, depth]."""
  print('Extracting', filename)
  with gzip.open(filename) as bytestream:
    magic = _read32(bytestream)
    if magic != 2051:
      raise ValueError(
          'Invalid magic number %d in MNIST image file: %s' %
          (magic, filename))
    num_images = _read32(bytestream)
    rows = _read32(bytestream)
    cols = _read32(bytestream)
    buf = bytestream.read(rows * cols * num_images)
    data = numpy.frombuffer(buf, dtype=numpy.uint8)
    data = data.reshape(num_images, rows, cols, 1)
    return data
def dense_to_one_hot(labels_dense, num_classes=10):
  """Convert class labels from scalars to one-hot vectors."""
  num_labels = labels_dense.shape[0]
  index_offset = numpy.arange(num_labels) * num_classes
  labels_one_hot = numpy.zeros((num_labels, num_classes))
  labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1
  return labels_one_hot
def extract_labels(filename, one_hot=False):
  """Extract the labels into a 1D uint8 numpy array [index]."""
  print('Extracting', filename)
  with gzip.open(filename) as bytestream:
    magic = _read32(bytestream)
    if magic != 2049:
      raise ValueError(
          'Invalid magic number %d in MNIST label file: %s' %
          (magic, filename))
    num_items = _read32(bytestream)
    buf = bytestream.read(num_items)
    labels = numpy.frombuffer(buf, dtype=numpy.uint8)
    if one_hot:
      return dense_to_one_hot(labels)
    return labels
class DataSet(object):
  def __init__(self, images, labels, fake_data=False, one_hot=False,
               dtype=tf.float32):
    """Construct a DataSet.
    one_hot arg is used only if fake_data is true.  `dtype` can be either
    `uint8` to leave the input as `[0, 255]`, or `float32` to rescale into
    `[0, 1]`.
    """
    dtype = tf.as_dtype(dtype).base_dtype
    if dtype not in (tf.uint8, tf.float32):
      raise TypeError('Invalid image dtype %r, expected uint8 or float32' %
                      dtype)
    if fake_data:
      self._num_examples = 10000
      self.one_hot = one_hot
    else:
      assert images.shape[0] == labels.shape[0], (
          'images.shape: %s labels.shape: %s' % (images.shape,
                                                 labels.shape))
      self._num_examples = images.shape[0]
      # Convert shape from [num examples, rows, columns, depth]
      # to [num examples, rows*columns] (assuming depth == 1)
      assert images.shape[3] == 1
      images = images.reshape(images.shape[0],
                              images.shape[1] * images.shape[2])
      if dtype == tf.float32:
        # Convert from [0, 255] -> [0.0, 1.0].
        images = images.astype(numpy.float32)
        images = numpy.multiply(images, 1.0 / 255.0)
    self._images = images
    self._labels = labels
    self._epochs_completed = 0
    self._index_in_epoch = 0
  @property
  def images(self):
    return self._images
  @property
  def labels(self):
    return self._labels
  @property
  def num_examples(self):
    return self._num_examples
  @property
  def epochs_completed(self):
    return self._epochs_completed
  def next_batch(self, batch_size, fake_data=False):
    """Return the next `batch_size` examples from this data set."""
    if fake_data:
      fake_image = [1] * 784
      if self.one_hot:
        fake_label = [1] + [0] * 9
      else:
        fake_label = 0
      return [fake_image for _ in xrange(batch_size)], [
          fake_label for _ in xrange(batch_size)]
    start = self._index_in_epoch
    self._index_in_epoch += batch_size
    if self._index_in_epoch > self._num_examples:
      # Finished epoch
      self._epochs_completed += 1
      # Shuffle the data
      perm = numpy.arange(self._num_examples)
      numpy.random.shuffle(perm)
      self._images = self._images[perm]
      self._labels = self._labels[perm]
      # Start next epoch
      start = 0
      self._index_in_epoch = batch_size
      assert batch_size <= self._num_examples
    end = self._index_in_epoch
    return self._images[start:end], self._labels[start:end]
def read_data_sets(train_dir, fake_data=False, one_hot=False, dtype=tf.float32):
  class DataSets(object):
    pass
  data_sets = DataSets()
  if fake_data:
    def fake():
      return DataSet([], [], fake_data=True, one_hot=one_hot, dtype=dtype)
    data_sets.train = fake()
    data_sets.validation = fake()
    data_sets.test = fake()
    return data_sets
  TRAIN_IMAGES = 'train-images-idx3-ubyte.gz'
  TRAIN_LABELS = 'train-labels-idx1-ubyte.gz'
  TEST_IMAGES = 't10k-images-idx3-ubyte.gz'
  TEST_LABELS = 't10k-labels-idx1-ubyte.gz'
  VALIDATION_SIZE = 5000
  local_file = maybe_download(TRAIN_IMAGES, train_dir)
  train_images = extract_images(local_file)
  local_file = maybe_download(TRAIN_LABELS, train_dir)
  train_labels = extract_labels(local_file, one_hot=one_hot)
  local_file = maybe_download(TEST_IMAGES, train_dir)
  test_images = extract_images(local_file)
  local_file = maybe_download(TEST_LABELS, train_dir)
  test_labels = extract_labels(local_file, one_hot=one_hot)
  validation_images = train_images[:VALIDATION_SIZE]
  validation_labels = train_labels[:VALIDATION_SIZE]
  train_images = train_images[VALIDATION_SIZE:]
  train_labels = train_labels[VALIDATION_SIZE:]
  data_sets.train = DataSet(train_images, train_labels, dtype=dtype)
  data_sets.validation = DataSet(validation_images, validation_labels,
                                 dtype=dtype)
  data_sets.test = DataSet(test_images, test_labels, dtype=dtype)
  return data_sets

如何修复 VirtualBox 中缺少的依赖项 Python Core / win32api mister-big 开发语言
本文将帮助您修复“缺少依赖项PythonCore/win32api”错误。最近，用户在安装OracleVMVirtualBox7.0以在Windows11或10上创建虚拟机时经常遇到问题。一、为什么VirtualBox需要PythonCore/win32api？简而言之，PythonCore/win32api专为Python程序而设计。它就像一组工具，让Python与Windows系统通信。您还可
无网络entos7报错ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found更新glibc 夏离网络
最近在尝试使用sklearn的升级版cuml，因为是一台没有连接互联网的gpu机器，所以构建cuml环境过程很坎坷，需要各种将各种whl包在线下载后上传到服务器中。当我终于解决完包的互相依赖问题后，在importcuml时候遇到一个错误：ImportError:/lib64/libm.so.6:version`GLIBC_2.27’notfound(requiredby/anaconda3/env
H5幸运刮刮乐抽奖源码免公众号+直运营破碎的天堂鸟源码下载抽奖源码
H5幸运刮刮乐抽奖源码免公众号+直运营环境nginx1.18mysql5.6php7.2php安装扩展fileinfo删除所有禁用函数操作完成后重启php创建一个站点点击根目录上传源码并解压源码解压完成回到网站设置伪静态laravel5运行目录public创建一个数据库并导入数据库源码下载：https://download.csdn.net/download/m0_61505785/9048437
使用 UML 设计 XML 模式 langzhufeng uml xml extension schema string encoding
使用UML设计XML模式统一建模语言（UnifiedModelingLanguage,UML）是一种业界标准，当以面向对象的方法构建软件系统时，用它来对业务概念建模。就信息和命令的传输方面而言，近来XML已经愈发成为实现这些系统的关键因素。XML模式用于定义和限制被交换XML的本质，因此它成为了人们注意的焦点。本文讨论了UML在设计XML模式方面的用法，并为使用UML框架创建XML词汇表提供了一种
AI Agent代理框架与直接 API 调用的选择、构建块、工作流与代理的模式 AI Echoes 人工智能
建立有效的代理代理与工作流的概念什么是代理？代理可以有多种定义。一部分客户将其视为能够独立运行、利用多种工具完成复杂任务的全自主系统；而另一部分客户则认为代理是按照预定义工作流程执行任务的系统。我们将这两种实现统称为“代理系统”，但在架构上做出区分：工作流是指通过预定义代码路径协调LLM与工具的组合；代理则是让LLM自主决定流程和工具使用，保持对任务执行过程的动态控制。何时使用代理？在使用LLM构
RAG技术的PDF智能问答系统 AI Echoes 深度学习
关键要点系统基于RAG（检索增强生成）技术，允许用户上传PDF并进行智能问答。使用Ollama的deepseek-r1模型和FAISS向量数据库，支持普通对话和基于PDF的问答模式。提供简洁的Web界面，支持文件拖拽上传和多轮对话。研究表明，系统适合处理PDF内容查询，但性能可能因PDF复杂性而异。系统概述这个PDF智能问答系统是一个基于RAG技术的工具，旨在帮助用户通过上传PDF文件进行智能交互
什么是代理？ AI Echoes 大数据运维
构建有效的代理什么是代理？"代理"的定义多样：完全自主的系统（长期独立运行，使用工具完成复杂任务）遵循预定义工作流的规范性实现在Anthropic的架构体系中：工作流：通过预定义代码路径编排LLM和工具代理：动态自主决策流程和工具使用的系统何时（不）使用代理基本原则：优先选择最简单的解决方案仅在必要时增加复杂性权衡考量：代理系统以延迟/成本换取任务性能明确定义任务→工作流（可预测性）灵活决策需求→
Linux基础指令详解：掌握Linux系统的必备技能扣得A艾 linux 服务器运维
Linux基础指令详解：掌握Linux系统的必备技能一、Linux基础指令概述二、基础指令详解1.**ls**2.**cd**3.**pwd**4.**mkdir**5.**rmdir**6.**rm**7.**cp**8.**mv**9.**cat**10.**more**和**less**11.**chmod**12.**chown**13.**df**14.**du**15.**ps**16
带隙基准电路设计仿真/自己备忘 Rinze！
电路结构如图所示，放大器采用二级米勒补偿运算放大器https://blog.csdn.net/Czy1377004611/article/details/118551567?spm=1001.2014.3001.5501所用工艺为1830工艺基本原理是PTAT电流产生电路的PTAT电流在电阻R2上的压降与三极管Q3的BE结电压叠加形成VREF。1.确定工作电流和R1搭建如图仿真电路图，设置idc=
C++中map和set的详解漏洞猎人001 c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
从放弃的AI浏览器到通用Agent：完整复盘 Manus的诞生过程 AIBigModel 人工智能
4个月前，Monica的肖弘提过一个困惑，「团队擅长从0到1，抓机会的能力很强，一旦开始1到N，状态就没有那么好」。在他过往的经历中，创业项目大都获得了相对稳定、可观的营收，上一家公司也被成功收购。2023年，他的新公司「蝴蝶效应」更是以一款浏览器插件Monica.im，在百模大战的AI叙事中错位竞争，成为增长最快、产品体验极佳的AI应用之一。看上去，他是一路很顺的创业者。做到这些事情，也才32岁
Centos安装GPU驱动,使用100元显卡玩转deepseek white.tie centos linux 运维
步骤1:安装NVIDIA驱动程序1.1安装显卡驱动编译工具yuminstallgccmakekernel-devel1.2安装显卡驱动依赖包yuminstallvulkan-loader1.3下载驱动安装https://www.nvidia.cn/drivers/details/220730/chmodu+xNVIDIA-Linux-x86_64-550.54.15.run./NVIDIA-Lin
Audacity的安装和使用迷茫&&前行 ctf工具 Audacity ctf
安装下载地址：官方网站：Audacity软件开源免费，但部分功能可能需要额外插件。一.介绍Audacity是一款免费、开源的音频编辑软件，适用于Windows、macOS、Linux等操作系统。它支持多轨编辑、录音、音频效果处理、格式转换等功能，适合音乐制作、播客编辑、音频修复等场景。主要功能：录音：支持麦克风、线路输入等多种音源。编辑：提供剪切、复制、粘贴、删除等基本操作，支持多轨编辑。效果处理
十分钟学会微调大语言模型喝不喝奶茶丫语言模型人工智能自然语言处理大模型大模型应用 AI大模型微调
在之前的文章中，我分享了一些使用大语言模型开发应用的方法，也介绍了几个开源大语言模型的部署方式，有同学给我留言说想知道怎么训练自己的大语言模型，让它更贴合自己的业务场景。完整的大语言模型训练成本比较高昂，不是我们业余玩家能搞的，如果我们只是想在某个业务场景或者垂直的方面加强大模型的能力，可以进行微调训练。本文就来介绍一种大语言模型微调的方法，使用的工具是我最近在用的TextGenerationWe
Python之项目课稍微认真一点 python 数据库开发语言
1.项目准备1.1.项目创建此处省略一万字...1.2.项目目标创建数据库movie并设置编码格式，并完成t_user（用户信息表）、t_movie（电影信息表）的创建任务；完成用户登录功能，登录成功之后跳转到电影主界面；完成电影排行榜和关键字电影查询功能；完成电影信息图表统计（选作）1.3.项目结构dao |--__init__.py |--movie_dao.py #电影dao层接口类 |
Python的模块使用稍微认真一点 python 经验分享笔记
1.模块和包1.1.模块简而言之，在python中，一个文件（以“.py”为后缀名的文件）就叫做一个模块，每一个模块在python里都被看做是一个独立的文件。模块可以被项目中的其他模块、一些脚本甚至是交互式的解析器所使用，它可以被其他程序引用，从而使用该模块里的函数等功能，使用Python中的标准库也是采用这种方法。导入模块的三种方式：方式一：import模块名#导入整个demo模块importd
大语言模型微调和大语言模型应用的区别？ AI Echoes 人工智能深度学习机器学习
大语言模型微调和大语言模型应用的区别？1.定义与目标微调（Fine-tuning）目标：调整预训练模型（如GPT、LLaMA、PaLM）的参数，使其适应特定任务或领域。核心：通过额外的训练（使用特定数据集）优化模型的性能，提升其在特定场景下的效果。例如：将通用模型微调为法律咨询、医疗诊断或金融分析的专业模型。应用（Application）目标：直接使用预训练或微调后的模型解决实际问题，无需修改模型
XMI（XML Metadata Interchange）和XML之间的关系 huaqianzkh 架构理解与实践 xml
XMI（XMLMetadataInterchange）和XML之间的关系可以从以下几个方面进行阐述：一、定义与背景XML：XML（eXtensibleMarkupLanguage）是一种标记语言，被设计用来传输和存储数据。它是一种自描述的语言，即标签（tags）是由用户定义的，因此XML文档的结构和内容可以由创建者自行决定。XMI：XMI（XMLMetadataInterchange）是由OMG（
Python的界面案例稍微认真一点 python 开发语言笔记经验分享
1.Tk图形用户界面(GUI)Tkinter是使用python进行窗口视窗设计的模块。Tkinter模块(“Tk接口”)是Python的标准TkGUI工具包的接口。作为python特定的GUI界面，是一个图像的窗口，tkinter是python自带的，可以编辑的GUI界面，用来入门，熟悉窗口视窗的使用，非常有必要。提供tk支持的模块包括：模块说明tkinterTK主模块tkinter.colorc
Java网络编程：TCP的socket编程想作会飞的鱼 Java网络编程网络编程 socket java tcp
一、Java中的网络编程协议相当于相互通信的程序间达成的一种约定，它规定了分组报文的结构、交换方式、包含的意义以及怎样对报文所包含的信息进行解析，TCP/IP协议族有IP协议、TCP协议和UDP协议。现在TCP/IP协议族中的主要socket类型为流套接字（使用TCP协议）和数据报套接字（使用UDP协议）。TCP协议提供面向连接的服务，通过它建立的是可靠地连接。Java为TCP协议提供了两个类：S
每日一练—C++专项练习 7.24 weixin_42095973
1、已知：类A中一个成员函数说明如下：voidSet(A&a);其中，A&的含义是（）A、指向类A的指针为aB、将a的地址赋值给变量SetC、a是类A对象的引用，用来作函数Set()的参数D、变量A与a按位与作为Set()的参数选择C。2、下面哪个语句无法通过编译?A、if(x>y);B、if(x=y)&&(x!=0)x+=y;C、if(x!=y)scanf("%d",&x);elsescanf(
JAVA简单实现国密双向认证 [email protected] JAVA 安全相关 java 开发语言国密
要实现国密双向认证的数据发送，需要使用支持国密算法的Java库，并且确保HTTP客户端能够处理SSL/TLS连接时的客户端证书验证。在这个例子中，使用Java标准库结合BouncyCastle作为提供国密算法的支持。下面是一个简化的示例，展示如何使用Java实现国密双向认证的数据发送。请注意，实际开发中可能需要更多的错误处理和配置细节。首先，确保你已经添加了BouncyCastle作为安全提供者，
python中打开麦克风 ai python 开发语言
在Python中打开麦克风，可以使用PyAudio库。首入PyAudio库。pipinstallPyAudio然后，使用以下代码打开麦克风：importpyaudiop=pyaudio.PyAudio()stream=p.open(format=pyaudio.paInt16,channels=1,rate=16000,input=True,frames_per_buffer=1024)其中，fo
前端流式输出实现详解：从原理到实践代码剑客588 前端
前端流式输出实现详解：从原理到实践前言一、流式输出核心原理1.1什么是流式输出？1.2技术优势对比1.3关键技术支撑二、原生JavaScript实现方案2.1使用FetchAPI流式处理关键点解析：2.2处理SSE（Server-SentEvents）三、主流框架实现示例3.1React实现方案3.2Vue实现方案四、高级优化策略4.1性能优化4.2用户体验增强4.3安全注意事项五、实际应用案例5
CORS解决跨域as been blocked by CORS policy: Response to preflight request doesn‘t pass access control ch humannoid python java 开发语言
CORS解决跨域asbeenblockedbyCORSpolicy:Responsetopreflightrequestdoesn’tpassaccesscontrolcheck:No‘Access-Control-Allow-Origin’headerispresentontherequestedresource.解决跨域的方法：1、JSONP通过script标签的src属性进行跨域请求，如果服
全网最全luckysheet协同编辑导出功能，包含单元格样式、超链接、数据验证、条件格式、图片导出、批注、数据透视图等等复杂功能的导出熙熙鬼 vue.js javascript 前端
前言：最近公司准备研究使用luckySheet，为了开源节流，在开掉了前端大佬的情况下，这苦差事儿落在了我这个前端菜鸟身上。无奈，只能打开luckysheet官网，仔细研读文档，并照着敲了个在线协同的demo。本以为这事儿算是结束，谁知，公司来了新需求，要做导入导出功能，又是一番查找资料后，决定先做导出，哈哈哈，别问为什么，问就是因为导出相关的文档丰富，可操作性强。废话结束，进入正题：1.在官网找
SpringBoot使用@Slf4j注解实现日志输出 pan_junbiao Spring Boot 我の原创 spring boot java spring
日志框架的使用，系列文章：《SpringBoot使用Logback日志框架与综合实例》《SpringBoot使用@Slf4j注解实现日志输出》《Log4j2日志记录框架的使用教程与简单实例》《SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志》《SpringBoot使用AspectJ的@Around注解实现AOP全局记录接口：请求日志、响应日志、异常日志》@Sl
Spring Boot中@Valid 与 @Validated 注解的详解 misschen888 spring boot 后端 java
SpringBoot中@Valid与@Validated注解的详解引言@Valid注解功能介绍使用场景代码样例@Validated注解功能介绍使用场景代码样例@Valid与@Validated的区别结论引言在SpringBoot应用中，参数校验是确保数据完整性和一致性的重要手段。@Valid和@Validated注解是SpringBoot中用于参数校验的两个核心注解。本文将详细介绍这两个注解的用法
Python中用SpeechRecognition库和 vosk模型来识别语音老菜鸟YDZ 菜鸟学python python 开发语言语音识别人工智能 xcode
Python中的SpeechRecognition库是一个比较好用的语音识别模块，提供了将语音识别成文字的方法，支持中文识别。一、SpeechRecognition库的安装使用pip命令安装即可：pipinstallSpeechRecognition当安装不成功时，可以强制：pipinstall--force-SpeechRecognition二、SpeechRecognition库的导入：i
WinForm基础知识1-20 观无 microsoft
1.如何在WinForms中实现异步编程？答案：使用async/await或BackgroundWorker实现异步操作，避免阻塞UI线程。示例：privateasyncvoidbtnDownload_Click(objectsender,EventArgse){btnDownload.Enabled=false;stringresult=awaitDownloadDataAsync("https
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要