weixin_44140703

深度学习和tensorflow学习总结---复习自用，大家看到不对的地方多多留言，互相交流

深度学习（DeepLearing）

深度学习不需要人工提取特征-----模型的可解释性
与机器学习区别：
- 机器学习需要手动提取特征，需要大量领域专业知识。
- 深度学习，通过训练大量数据自动得出模型，不需要人工提取特征环节。
  - 适合图像、语音、自然语言处理领域
应用场景：
- 物体识别
- 场景识别
- 人脸识别
- 人脸身份认证
- 自然语言处理
- 文本识别
- 语音识别
加法运算：
- 定义常量：tf.constant(常量值)
- 定义变量：tf.Variable(initial_value= ,trainable= )
  - initial_value:初始值
  - trainable:是否被训练
  - 变量需要显示初始化，才能运行值
    - ```
    a = tf.Variable(tf.random_normal([2, 2], mean=0.0, stddev=1.0), name="a", trainable=True)
    # 添加一个初始化变量的OP
    init_op = tf.global_variables_initializer()
    with tf.Session() as sess:
        # 运行初始化变量的OP
        sess.run(init_op)
        print(sess.run(a))
```
- 定义占位符： tf.placeholder(detype=, shape=[None, 列数])
  
  行数None表示数据的数量，列数表示特征数量。
- 加法运算：tf.add(tensor_a, tensor_b) # 张量a和张量b相加
tensorflow程序：两部分
- 构建图阶段：数据与操作的执行步骤被描述成一个图
- 执行图阶段：使用会话执行构建好的图中的操作
图：将计算表示为指令间依赖关系的一种表示法
- 默认图：不需要定义
  - 程序中张量、op操作、sess.graph都处在一个图里。
  - 获取默认图：tf.get_default_graph（）
- 自定义新图：tf.Graph()
  - tf.Graph()，如果要在这张图中创建OP，典型用法是使用tf.Graph.as_default()上下文管理器
  - 有一个新内存地址
  - 会话中需要传入新图，如果不传，只在默认图中找。
会话：跨一个或者多个本地或远程设备运行数据流图的机制。
- with tf.Session() as sess:
  
  pass
可视化：两步
- 1 写入序列化文件
  - tf.summary.FileWriter(logdir, graph=sess.graph)
- 2 启动Tensorboard
  - tensorboard --logdir=’./graph_demo/’
  - 直接把网址复制粘贴
  - 127.0.0.1:6006 也可以打开
命名：定义常量，变量，直接指定name=‘aaa’
- a = tf.constant(3.0, name=“a”)
占位符：
- tf.placeholder(detype=, shape=)
- 要和feed_dict() 配合使用
- 可以根据传入的数据而改变，具有变量的特性
- 占位——shape=[m,n] 传入的数据必须要匹配形状。
会话
- 开启会话：
  - tf.Session(): 用于完整的程序中
  - tf.InteractiveSession: 用于交互式上下文中的TensorFlow，例如shell。
    - 这时候，使用tensor.eval() 和Opration.run()代替Session.run()
    - tensor.eval() 取张量的值
张量
- 属性
  - dtype 张量的类型
  - shape 形状（阶）
- 创建随机张量
  - tf.random_normal() 产生正态分布的值
    - mean 平均数 stddev 标准差
  - tf.truncated_normal() 产生正态分布值，截取2个标准差范围，95%
- 一般张量
  - tf.zeros() 所有元素为0的张量
  - tf.ones() 所有元素为1的张量
  - tf.constant(value, shape)
- 张量的阶
  - 0阶–一个数字
  - 1阶–一维向量
  - 2阶–矩阵
- 张量的变化
  - 类型改变
    - tf.cast(tensor, detype=)
  - 形状改变
    - tf.set_shape() 不能跨阶，只能改变一次
    - tf.reshape() 元素个数相等即可改变
变量OP
- 创建变量：tf.Variable(initial_value= ,trainable= )
  - initial_value:初始值
  - trainable:是否被训练
  - 重点 *** 变量需要显示初始化，才能运行值
    - ```
    a = tf.Variable(tf.random_normal([2, 2], mean=0.0, stddev=1.0), name="a", trainable=True)
    # 添加一个初始化变量的OP
    init_op = tf.global_variables_initializer()   # 必须写
    with tf.Session() as sess:
        # 运行初始化变量的OP
        sess.run(init_op)      # 必须写
        print(sess.run(a))
```
- tensor.assign() 赋值功能
  - 赋值后，前面的tensor也被赋值了
- tensor.assign_add() 加法+赋值
  - 赋值后，前面的tensor也被赋值了
- 命名空间
  - tf.variable_scope(‘space_name’):
    - 作用：添加一个空间名，结构清晰，隔离变量，方便可视化
  - 共享变量
    - 添加resue=tf.AUTO_RESUE，相同名字的变量，可以共存了
辅助功能：
- 保存模型，加载模型
  - saver = tf.train.Saver()
  - 保存模型（在for循环中—需要保存最新的参数，所以要在循环中）
    - saver.save(sess，dir) 注：dir表示路径
  - 加载模型（在会话中，for循环之前），加载模型之前判断checkpoint是否存在
    - if os.path.exists(’./xianxing_save/checkpoint’):
      
      saver.restore(sess, ‘./xianxing_save/’)
- 可视化：
  - 收集变量：
  - tf.summary.scalar(name=’’, tensor)
    - 收集单值变量(损失函数准确率)
    - name 变量名字 tensor 值
  - tf.summary.histogram(name=’’, tensor)
    - 收集高维度的变量参数
  - tf.summary.image(name=’’, tensor)
    - 收集输入的图片张量能显示图片
  - 合并：tf.summary.merge_all()
  - 添加—在tf.Session里面写
    - FileWriter.addz_summary(logdir="./summary", graph=sess.graph)
  - ```
  在模型训练的for循环中
  summary = sess.run(merge)
  file_writer.add_summary(summary, i)
```
线性回归
- 首先拿到数据集（一定要有标签）
  - 已有的数据集
  - 创造的数据集
- 确定模型的损失函数
  - 平方差损失 tf.square(), tf.reduce_mean()
- 确定训练算法
  - 梯度下降法
- 训练起来
  - sess.run()
  - 打印训练中的信息，画图
- 用到的函数：
  - tf.matmul(x, w) 矩阵运算
  - tf.square() 平方
  - tf.reduce_mean() 均值
  - tf.train.GradientDescentOptimizer(learning_rate) 梯度下降优化
  - learning_rate 学习率一般为0-0.01
  - minimizer(loss) 使loss最低

神经网络（NN）

文件读取流程
- 第一步：构造文件队列名
  - tf.train.string_input_producer(sring_tensor, shuffle=True)
    - sring_tensor 含有文件名+路径的1阶张量
    - num_epoches 过几遍数据默认无限数据
    - return 文件队列
- 第二步：读取和解码
  - 阅读器默认每次只读取一个样本：文本文件默认一次读取一行图片文件默认一次读取一张图片二进制文件一次读取指定字节数(最好是一个样本的字节数) TFRecords默认一次读取一个exampl
  - tf.TextLineReader() 阅读文本文件逗号分割值（scv）格式，默认按行读取
  - tf.WholeFileReader() 用于读取图片文件
    - 例子
      - reader = tf.TextLineReader() key, value = reader.read(file_queue)
  - tf.FixedLengthRecordReader(record_bytes) 读取二进制文件
    - record_bytes 整型，指定每次读取的字节数
  - tf.TFRecordReader() 读取TFRecords文件
  - 解码
  - tf.decode_csv() 解码文本文件内容
  - tf.image.decode_jpeg(contents)
    - 将JPEG编码的图像解码为uint8张量
    - return： uint8张量 3d 形状 [height, width, channels]
  - tf.image.decode_png(contents)
    - 将PNG编码的图像解码为uint8张量
    - return： uint8张量 3d 形状 [height, width, channels]
  - tf.decode_raw() 解码二进制文件内容
    - 与tf.FixedLengthRecordReader搭配使用，二进制读取为uint8类型
  - 解码阶段，默认所有内容都解码为tf.uint8类型，之后可用tf.cast() 转换为其他类型
- 第三步：批处理
  - tf.train.batch(tensors，batch_size, num_threads=1,capacity=32, name=None)
    - 读取指定大小（个数）的张量
    - tensors 可以是包含张量的列表批处理的内容放到列表中
    - batch_size 从队列中读取的批处理大小
    - num_threads 进入队列的线程数
    - capacity 整数，队列中元素的最大数量
    - return： tensors
多线程运行
- tf.train.Coordinator() 创建线程协调器
  - 线程协调员，对线程进行管理和协调
  - request_stop() 请求停止
  - should_stop() 询问是否结束
  - join(threads=None, stop_grace_period_secs=120) 回收线程
- tf.train.start_queue_runners(sess=None, coord=None) 开启子线程读取数据
  - 收集图中所有的队列线程，默认同时启动线程
  - sess 所在会话
  - coord 线程协调器
  - return 返回所有线程
- 实例：
  - ```
  coord = tf.train.Coordinator() # 创建线程协调器
  threads = tf.train_squeue_runners(sess=sess, coord=coord)  # 开启子线程去读取数据
  # 获取数据样本去训练
  coord.request_stop()  # 关闭子线程
  coord.join(threads)   # 回收
```
图片数据读取
- 基础知识
- 1. 图片三要素：高宽通道数
  2. 张量形状
    - 单张图片 [height, width, channel]
    - 多张图片 [batch, height, width, channel]
    - tensorflow默认的图片张量顺序是HWC，即[height, width, channel],所以图片处理时，的都要转化成这个顺序
  3. 改变图片特征：
    - tf.image.resize_images(images，size) 注意，参数只能传2维
      - images： 4-D 形状 [batch, height, width, channels] 或3-D形状的张量[height, width, channels] 的图片数据
      - size： 1-D int32张量 [new_height, new_width] 图像新尺寸
      - 返回4D格式或3D格式图片
  4. 改变数据格式：
    - tf.cast(tensor,tf.float32)
- 流程
  1. 构造文件名队列
    
    file_queue = tf.train.sting_input_producer(file_list)
  2. 构造一个图片读取器，读取队列中的数据
    
    reader = tf.WholeFileReader()
    
    key, value = reader.read(file_queue)
  3. 解码
    1. image = tf.image.decode_jpeg(value)
  4. 调整图片大小
    1. 统一尺寸,size = [height, width], size 只能传2个参数，不能传channel：
      
      re_image = tf.image.resize_images(image, [200, 200])
    2. 调整张量形状到tensorflow默认形状：
      
      re_image.set_shape([200, 200, 3])
  5. 批处理
    
    image_batch = tf.train.batch([re_image], batch_size=10, num_threads=1, capacity=32)
二进制文件读取（和图片读取有个对比）
- 基础知识
- tf.FixedLengthRecodReader(length) 注意长度参数
- 解析数据：tf.decode_raw(value, tf.unit8)
- 切片：tf.slice(tensor, [start], [number])
  - start:起始下标 number：切片数据的个数
- tf.transpose(tensor, [a, b, c])
  - tensor：数据 a,b,c：是待处理的下标
- 流程
  1. 构造文件队列名
    
    file_queue = tf.train.string_input_producer(file_list)
  2. 构造读取器，读取队列数据
    
    reader = tf.FixdLengthRecordReader(self.total_length)
    
    key, value = reader.read(file_queue)
  3. 解码
    
    decode_value = tf.decode_raw(value, tf.uint8)
  4. 解析数据
    
    lable = tf.slice(decode_value, [0], [self.lable_length])
    
    image = tf.slice(decode_value, [self.lable_length], [self.image_length])
    
    label = tf.cast(lable, tf.int32)
  5. 形状转换
    
    re_image = tf.reshape(image, [self.channel, self.height, self.width])
    
    re_image = tf.transpose(re_image, [1, 2, 0])
  6. 批处理
    
    label_batch, image_batch = tf.train.batch([lable, re_image], batch_size=20, num_threads=1, capacity=32)
TFRecords 文件写入与读取
- 基础知识
  1. TFRecords是一种二进制文件，结构类似于字典嵌套，能更好的利用内存，不需要单独的标签文件
  2. 分为两部分：
    
    构建协议(写入），协议解析（读取）
  3. 结构如下
    - tf.train.Example 协议内存块(protocol buffer)(协议内存块包含了字段 Features)
    - Features包含了一个Feature字段
    - Feature中包含要写入的数据、并指明数据类型。
      - 这是一个样本的结构，批数据需要循环存入这样的结构
```
example = tf.train.Example(features=tf.train.Features(feature={

		"image": tf.train.Feature(bytes_list=tf.train.BytesList(value=[image])),

		"label": tf.train.Feature(int64_list=tf.train.Int64List(value=[label])),

		}))
```
  4. API
    1. tf.train.Example(features=None)
      
      写入tfrecords文件
      
      features: tf.train.Features类型的特征实例
      
      return：example格式协议块
    2. tf.train.Features(Feature=None)
      
      构建每个样本的信息键值对
      
      feature: 字典数据，key为要保存的名字,value为tf.train.Feature实例
      
      return：Features类型
    3. tf.train.Feature(options)
      
      options:例如
      
      bytes_list = train.BytesList(value=[Bytes])
      
      int64_list = tf.train.Int64List(value=[Value])
      
      支持存入的类型如下:
      
      tf.train.Int64List(value=[Value])
      
      tf.train.BytesList(value=[Value])
      
      tf.train.FloatList(value=[Value])
    4. 构造存储实例：
      
      tf.python_io.TFRecordWriter(path)
      
      写入tfrecords文件
      
      path:TFRecords文件路径
      
      return:写文件
      
      方法（method）
      
      write（record）:向文件中写入一个example
      
      close（）：关闭文件写入器
- 流程
  1. TFRecords文件写入
    1. 构造tfrecords存储实例
      
      with tf.python_io.TFRecordWriter(’./cifar.tfrecords’) as writer:
    2. 循环将每个样本写入到文件中
```
#构造tfrecords存储实例
with tf.python_io.TFRecordWriter('./cifar.tfrecords') as writer:
	#循环将每个样本写入到文件中
	for i in range(10):
        # 准备特征值，特征值必须是bytes类型 调用tostring()函数
        label_i = label[i].eval()[0]
        image_i = image[i].eval().tostring()
        
        # 构造协议块
        example = tf.train.Example(features=tf.train.Features(feature={
                    'image':tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_i])),
                    'label':tf.train.Feature(int64_list=tf.train.Int64List(value=[label_i])),
                }))
        
        # 写入文件中
        writer.write(example.SerializerToString())
		 
   
```
  2. TFRecords文件读取
    1. 创建文件队列
      
      file_queue = tf.train.string_input_producer([’./cifar.tfrecords’])
    2. 创建读取器，读取队列内容
      
      reader = tf.TFRecordReader()
      
      key, value = reader.read(file_queue)
    3. 解析协议
      
      feature = tf.parse_single_example(value, features={
      
      “image”: tf.FixedLenFeature([], tf.string),
      
      “label”:tf.FixedLenFeature([], tf.int64),
      
      })
      
      label = feature[‘label’]
      
      image = feature[‘image’]
    4. 解码
      
      decode_image = tf.dacode_raw(image, tf.uint8)
    5. 调整图片大小
      
      re_image = tf.reshape(decode_image, [self.heigth, self.width, self.channel])
    6. 改变数据类型
      
      label_cast = tf.cast(label, tf.float32)
      
      image_cast = tf.cast(re_image, tf.float32)
    7. 批处理
      
      label_batch, image_batch = tf.train.batch([label_cast, image_cast], batch_size=10, num_threads=1, capacity=32)
神经网络基础
- 人工神经网络（Artificial Neural Network）ANN 简称神经网络（NN）
- 结构：输入层隐藏层输出层
- 特点：
  - 每个连接都有个权值，
  - 同一层神经网络之间没有连接
  - 最后的输出结果对应的层称之为全连接层
- 感知机：（PLA：Perceptron Learning Algprithm）
  - 模拟大脑神经网络处理数据的过程。
  - 最基础的分类模型，类似于逻辑回归，感知机激活函数是sign，而逻辑回归激活函数是sigmoid
    -
- softmax回归
  - 作用：将神经网络输出转换成概率结果
- 交叉熵损失
  - 目标值（真实值）用one-hot编码，能与概率值一一对应
  - - y^是真实值，由于是one-hot编码，真实值只能是0或者1
    - y 是softmax算出的值
    - i是输出节点的编号
  - 损失函数大小：对所有样本的损失求和，取平均值
- softmax、交叉熵损失API
  - tf.nn.softmax_cross_entropy_with_logits(labels=None,logits=None,name=None)
    - 计算交叉熵损失
    - labels 标签值（真实值）
    - logits 样本加权之后的值
    - return 返回损失值列表
- tf.reduce_mean(input_tensor)
  - 计算张量的平均值
- 线性神经网络的局限性
  - 表达能力有限—需要添加非线性因素–激活函数
- 神经网络的黑盒性质
  - 深度和神经元个数没有精确值
  - 结果没有可解释性
- 改善网络的基本套路
  - 更深的网络
  - 更多的神经元
  - 加入非线性因素添加激活函数
- 谷歌的Inception 谷歌的图像识别模型
  - Inception-v2, v3, v4
    - 谷歌公开的通用图像识别模型
    - 继承谷歌已非常完美的网络
- DNN 深度神经网络
- tensorflow.examples.tutorials.mnist.input_data() 获取Mnist数据
- tf.matmul(a,b,name=None) 实现全连接层计算
- tf.train.GrandientDescentOptimizer(learning_rate).minimize(loss) 实现梯度下降优化

卷积神经网络(CNN)

区别：在原来多层网络的基础上加入了更加有效的特征学习部分，具体操作是在原来的全连接层前加入了卷积层与池化层
结构：
- 输入层
- 隐藏层：
  - 卷积层：提取原始特征（通过平移）
  - 激活层：增加非线性因素
  - 池化层：减少学习参数，降低学习复杂度（最大池化和平均池化）
- 全连接层（输出层）：进行损失计算并输出结果
卷积层的4要素
- 卷积核的个数
- 卷积核的大小 1*1 3*3 5*5
- 卷积核的步长
- 卷积核的零填充 padding
卷积的运算：不是矩阵运算，一对一点乘
- tf.nn.conv2d(input, filter, strides=, padding=)
  - 作用：计算input数据和filter张量的卷积
  - input 输入的张量，维度[batch,heigth,width,channel]
  - filter：指定过滤器（卷积核）的权重数量 [filter_height, filter_width, in_channels, out_channels]
  - strides：步长 [1, stride, stride, 1]
  - padding：“SAME” 零填充
激活函数—添加非线性因素
- Relu： Relu = max(0,x) 小于0 取0，大于零取原值
  - 优点
    - 解决梯度爆炸问题，
    - 计算速度快
  - API
    - tf.nn.relu(features, name=None)
      - features: 上一步的结果
      - return：结果
池化层（Polling)—过滤不重要特征，减少参数数量。
- 一般是2*2
- 取最大值（-----常用）或平均值
- API：tf.max_pool(value,ksize=,strides=,padding=,name=None)
  - value：上一层传入数据的形状 [batch, height, width, channels]
  - channel：filter个数
  - ksize：池化窗口大小 [1, ksize, ksize, 1] 前后的1表示对原始图片的宽、高不做处理
  - strides：步长 [1,strides,strides,1] 前后的1表示对卷积核和通道数不做处理
  - padding：“SAME”， “VALID”，使用的填充算法的类型，默认使用“SAME”
代码实现：
- 强调：y_predict 是从神经网络计算出来的
- 网络优化：
  1. 更好的算法：AdamOptimizer()
  2. 批量归一化 Batch Normalization 简称BN
    
    使用方法：
    1. 导入：from tensorflow.contrib.layers.python.layers import batch_norm
    2. x_bn1 = batch_norm(x_pool1,decay =0.9, updates_collections=None, is_training = True)
    3. 原理：
  3. 初始化参数的时候，更小的 stddev=0.001 b的初始值可以是固定值
  4. 应用 Dropout() keep_prob=0.5
    1. 每次只有0.5的概率连接权重有效
    2. 作用是防止或者减轻过拟合
    3. train的时候才是dropout起作用的时候,train和test的时候不应该让dropout起作用
    4. 代码:
      
      y_output = tf.nn.dropout(y_predict, keep_prob=0.5)
  5. 在GPU运行：
```
with tf.device('/gpu'): # 设置在GPU上跑，所有代码写在with下面
	with tf.Session(config=tf.ConfigProto(allow_soft_placement=True)) as sess:
# tf.Session()中添加config=tf.ConfigProto(allow_soft_placement=True），当运行在出现不允许在GPU运行的时候，可以切换到CPU运行
```
验证码的识别思路
- 处理标签文件
  - 将字母数字化，并且one-hot
- 处理图片文件
  - 流程和手写数字一样
    - 构建队列文件
    - 读取文件并解码 + 调整张量大小
    - 批处理
- 定义一个映射函数
  - 找到批处理的图片和标签的对应关系
- 网络的构建
- 定义运算图 + 开启会话 + 训练 + 测试
- tf.train.parse_single_example()
  - TFRecords文件的读取，和写入example模块对应

知识点

此处目标值有多个标签，属于多分类问题，使用sigmoid交叉熵：
- sigmoid交叉熵适合计算每个类别独立且不互相排斥的离散分类任务中的损失值，适用于多分类。
- sotfmax交叉熵适合于计算类别相互排斥的离散分类任务的损失值，每个输出对应一个类别，适用于单分类，softmaxz交叉熵损失在迭代过程中，会使概率最大的值概率更大，其他值概率减小，不适合多分类。
sigmoid交叉熵损失函数
- y为标签值，y—为输入sigmoid之前的logits值（预测值）
- tf.nn.sigmoid_cross_entropy_with_logits(labels=None,logits=None,name=None)
  
  labels:真实值，one-hot 编码形式，和logits一样的形状
  
  logits：输出层的加权计算结果，即预测值
one-hot编码：

tf.one_hot(indices,depth,axis,name=None)

indices:需要编码的张量

depth：one-hot编码的深度，这个例子里是26

axis：填充的维度，默认是-1
提取最大值：

tf.argmax(y_predict, 2)
- 返回某个 tensor 对象在某一维上的其数据最大值所在的索引值
- 第一个参数是张量；第二个参数是提取的维度的下标

tf.reduce_all(input_tensor, axis = None, keep_dims = False,name = None, reduction_indices = None)

计算张量在维度上的逻辑和
input_tensor：要减少的布尔张量.
axis：要减小的维度,如果为None(默认),则减少所有维度.必须在范围[-rank(input_tensor), rank(input_tensor))内.
keep_dims：如果为 true,则保留长度为1的缩小维度.
name：操作的名称(可选).
reduction_indices：轴的已弃用名称.

例子：

x = tf.constant([[True,  True], [False, False]])
tf.reduce_all(x)  # False
tf.reduce_all(x, 0)  # [False, False]
tf.reduce_all(x, 1)  # [True, False]

In [5]: tf.equal([1,2,3,4], [1,2,3,4]).eval()
Out[5]: array([ True,  True,  True,  True])

In [9]: tf.reduce_all([[ True,  True,  True,  True],[True, True, True,True]], axis=1).eval()
Out[9]: array([ True,  True])

In [10]: tf.reduce_all([[ True,  True,  True,  True],[True, True, True,False]], axis=1).eval()
Out[10]: array([ True, False])

取ask 码：

ord（a）

pandas中索引的使用

定义一个pandas的DataFrame对像

import pandas as pd
data = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]},index=["a","b","c"])
data

    A   B   C
a   1   4   7
b   2   5   8
c   3   6   9

# .loc[],中括号里面是先行后列，以逗号分割，行和列分别是行标签和列标签，比如我要得到数字5，那么就就是
data.loc["b","B"]   # 5
data.loc["a","B"]   # 4
data.loc['b':'c','B':'C']  # 5，8，6，9 选择一个区域

OS函数使用

# -*- coding:utf-8 -*-
"""
@author:lei 
"""
import os
 
#os.path.join() 将分离的部分合成一个整体
filename=os.path.join('/home/ubuntu/python_coding','split_func')
print filename
#输出为：/home/ubuntu/python_coding/split_func
 
#os.path.splitext()将文件名和扩展名分开
fname,fename=os.path.splitext('/home/ubuntu/python_coding/split_func/split_function.py')
print 'fname is:',fname
print 'fename is:',fename
#输出为：
# fname is:/home/ubuntu/python_coding/split_func/split_function
#fename is:.py
 
#os.path.split（）返回文件的路径和文件名
dirname,filename=os.path.split('/home/ubuntu/python_coding/split_func/split_function.py')
print dirname
print filename
#输出为：
# /home/ubuntu/python_coding/split_func
#split_function.py
 
#split（）函数
#string.split(str="", num=string.count(str))[n]
#str - - 分隔符，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等。
#num - - 分割次数。
#[n] - - 选取的第n个分片
string = "hello.world.python"
print string.split('.')#输出为：['hello', 'world', 'python']
print(string.split('.',1))#输出为：['hello', 'world.python']
print(string.split('.',1)[0])#输出为：hello
print(string.split('.',1)[1])#输出为：world.python
string2="helloandend"
print(string2.split("<",2)[2].split(">")[0])#输出为：c++


os.path.basename()
返回path最后的文件名。如果path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素。
>>> os.path.basename('c:\test.csv')
'test.csv'

CNN卷积神经网络实现验证码识别代码，详细备注，供自己复习。

import tensorflow as tf
import numpy as np
import os
import pandas as pd
from tensorflow.contrib.layers.python.layers import batch_norm

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

with tf.device('/gpu'): # 设置在GPU上跑
    class VerificationCode(object):
        def __init__(self):
            pass

        def parse_label(self):
            # 解析标签文件
            vc_data = pd.read_csv('./Genpics/labels.csv', names=['file_num', 'char_code'], index_col ='file_num')
            # pandas 自动认为第一行是列明，会自动添加一列索引，导致错位，所以，要自己给两列数据命名，自己设置索引
            # print(csv_data)
            vc_code = vc_data['char_code'] # 取这一列数据
            letter_list =[]
            for line in vc_code:
                letters = []
                for c in line:
                    diff = ord(c) - ord('A')
                    letters.append(diff)
                letter_list.append(letters)
            vc_data['verification_code'] = letter_list # 在数据中加一列-对应的ascll码 映射
            return vc_data


        def picture_read(self):
            # 读取图片文件
            filenames = os.listdir('./GenPics/')
            file_list = ['./GenPics/' + name for name in filenames if name[-3:]=='jpg']

            file_queue = tf.train.string_input_producer(file_list)
            # 读取器
            reader = tf.WholeFileReader()
            key, value = reader.read(file_queue)
            # 解码并调整:解码出来形状是(?,?,?) 所以需要变形
            image = tf.image.decode_jpeg(value)
            image.set_shape([20, 80, 3])

            filename_batch, image_batch = tf.train.batch([key, image], batch_size=20, num_threads=2, capacity=32)
            return filename_batch, image_batch

        def file_to_label(self, filenames, label_data):
            """由图片名获取标签"""
            labels = []
            for name in filenames:
                index, _ = os.path.splitext(os.path.basename(name))
                code = label_data.loc[int(index), 'verification_code']  # 通过索引找某一列的对应数据
                labels.append(code)

            return np.array(labels)

        def init_weights(self, shape):
            return tf.Variable(initial_value=tf.random_normal(shape = shape, mean=0.0, stddev=0.001))

        def cnn_model(self, x):
            # [None, 20, 80, 3]
            # 定义第一层卷积网络 卷积核 5*5 步长1 padding=‘SAME’  64个
            # 池化层 窗口大小 ksize 2*2 步长2  padding=‘SAME’
            with tf.variable_scope('conv1'):
                conv1_w = self.init_weights([5, 5, 3, 64])
                conv1_b = self.init_weights([64])

                x_conv1 = tf.nn.conv2d(x, conv1_w, strides=[1,1,1,1], padding='SAME') + conv1_b
                # [None, 20, 80, 64]
                x_bn1 = batch_norm(x_conv1, decay=0.9, updates_collections=None, is_training=True)
                # 添加bn层，做批量标准化
                x_relu1 = tf.nn.relu(x_bn1)
                # [None, 20, 80, 64]
                x_pool1 = tf.nn.max_pool(x_relu1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
                # [None, 10, 40, 64]


            with tf.variable_scope('conv2'):
                conv2_w = self.init_weights([3, 3, 64, 128])
                conv2_b = self.init_weights([128])

                x_conv2 = tf.nn.conv2d(x_pool1, conv2_w, strides = [1,1,1,1], padding='SAME') + conv2_b
                # [None, 10, 40, 128]
                x_bn2 = batch_norm(x_conv2, decay=0.9, updates_collections=None, is_training=True)
                x_relu2 = tf.nn.relu(x_bn2)
                # [None, 10, 40, 128]
                x_pool2 = tf.nn.max_pool(x_relu2, ksize = [1,2,2,1], strides = [1,2,2,1], padding='SAME')
                # [None, 5, 20, 128]


            with tf.variable_scope('full_connection'):
                # 全连接层需要矩阵运算，需要2-D张量
                x_fc = tf.reshape(x_pool2, [-1, 5*20*128])

                fc_w = self.init_weights([5*20*128, 4*26])
                fc_b = self.init_weights([4*26])

                y_predict = tf.matmul(x_fc, fc_w) + fc_b
            return y_predict



        def run(self):
            filename_batch, image_batch = self.picture_read()
            # 定义占位符
            with tf.variable_scope('placeholder'):
                x = tf.placeholder(dtype = tf.float32, shape = [None, 20, 80, 3])
                y_true = tf.placeholder(dtype = tf.float32, shape = [None, 4*26])

                y_predict = self.cnn_model(x)

            with tf.variable_scope('loss'):
                loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels = y_true, logits = y_predict))
            with tf.variable_scope('optimizer'):
                train_operation = tf.train.AdamOptimizer(0.0001).minimize(loss)
            with tf.variable_scope('accuracy'):
                equal_list = tf.reduce_all(                                           # tf.reduce_all --> [-1, 1] 在4 的维度比较，生成 [n个, [True]形式的数据 ]
                    tf.equal(tf.argmax(tf.reshape(y_true, [-1, 4, 26]), axis =2),     # tf.equal --> [-1, 4] 在4 的维度比较,生成 [n个, [True,  True,  True,  True]形式的数据]
                             tf.argmax(tf.reshape(y_predict, [-1, 4, 26]),axis =2)),  # tf.argmax(tf.reshape(y_true, [-1, 4, 26]), axis =2) --> [-1, 4]  从26的维度提取最大值
                    axis=1
                )
                # tf.equal后，得到的是这种形式的数据 array([ True,  True,  True,  True])
                # tf.reduce_all() 计算张量在维度上的逻辑和
                # In [9]: tf.reduce_all([[ True,  True,  True,  True],[True, True, True,True]], axis=1).eval()
                # Out[9]: array([ True,  True])
                # In [10]: tf.reduce_all([[ True,  True,  True,  True],[True, True, True,False]], axis=1).eval( )
                # Out[10]: array([ True, False])
                accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))
            saver = tf.train.Saver()

            with tf.Session(config=tf.ConfigProto(allow_soft_placement=True)) as sess:
                sess.run(tf.global_variables_initializer())

                if os.path.exists('./CNNyanzhengma_save/checkpoint'):
                    saver.restore(sess, './CNNyanzhengma_save/')


                coo = tf.train.Coordinator()
                threads = tf.train.start_queue_runners(sess = sess, coord = coo)
                label_data = self.parse_label()

                for epoch in range(1000):
                    filenames, images = sess.run([filename_batch, image_batch])
                    labels = self.file_to_label(filenames, label_data)

                    y_one_hot = tf.reshape(tf.one_hot(labels, 26), [-1, 4*26]).eval()

                    train_epoch, loss_epoch, accuracy_epoch = sess.run([train_operation, loss, accuracy], feed_dict = {
                        x:images, y_true:y_one_hot
                    })
                    if (epoch + 1) % 50 == 0:
                        print('round=%d, loss=%f, accuracy=%f' % (epoch+1, loss_epoch,accuracy_epoch))
                    if accuracy_epoch > 0.9:
                        saver.save(sess, './CNNyanzhengma_save/')

                coo.request_stop()
                coo.join(threads)


    if __name__ == '__main__':

        vc = VerificationCode()
        vc.run()

你可能感兴趣的:(学习总结,深度学习,CNN,机器学习,学习总结,复习自用)

java面试问题大全及答案大全小白教程 java面试题 java 面试开发语言 java面试题 java面试问题大全 java面试题带答案 Java经典面试题
文章目录前言java面试题-Java基础java面试题-JVM知识java面试题-多线程与并发java面试题-主流框架java面试题-数据库相关java面试题-分布式与微服务java面试题-网络知识前言该文档围绕Java技术栈展开，全面涵盖了基础、JVM、多线程与并发、主流框架、数据库、分布式、网络等核心知识领域，以面试题及参考答案的形式呈现，为Java开发者提供了系统复习与深入理解的资料。有需要
神经网络ＶＳ决策树 Persistence is gold 神经网络决策树人工智能
神经网络（NeuralNetworks）和决策树（DecisionTrees）是两种不同的机器学习算法，各自具有独特的优点和适用场景。以下是它们的详细比较：神经网络优点:强大的学习能力:神经网络，尤其是深度神经网络，能够自动学习数据中的复杂特征，可以处理高维和非线性的问题。适用性广泛:神经网络适用于分类、回归、图像处理、语音识别、自然语言处理等多种任务。多层结构:通过增加隐藏层，神经网络可以逐层提
【免费收藏】清华大学DeepSeek使用手册合集 600页完整版周师姐 AI写作学习人工智能 pdf
DeepSeek资料链接：https://pan.quark.cn/s/c927326f70c5在人工智能席卷全球的当下，DeepSeek作为前沿深度学习技术，正推动着全面AI时代的到来。今日，特别为大家推荐《DeepSeek：从入门到精通》，本书由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心编写。它深度解析DeepSeek的技术核心，详尽阐释其应用场景与操作方法，尤
深度神经网络——决策树的实现与剪枝知来者逆人工智能 dnn 决策树人工智能神经网络深度学习机器学习
概述决策树是一种有用的机器学习算法，用于回归和分类任务。“决策树”这个名字来源于这样一个事实：算法不断地将数据集划分为越来越小的部分，直到数据被划分为单个实例，然后对实例进行分类。如果您要可视化算法的结果，类别的划分方式将类似于一棵树和许多叶子。这是决策树的快速定义，但让我们深入了解决策树的工作原理。更好地了解决策树的运作方式及其用例，将帮助您了解何时在机器学习项目中使用它们。决策树的结构决策树的
YOLOv12改进之A2(区域注意力) 清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法
注意力回顾注意力机制作为深度学习领域的核心技术，已广泛应用于自然语言处理和计算机视觉等多个领域。在YOLOv12改进之A2中，注意力机制扮演着关键角色。已有研究成果包括：Transformer架构：引入了自注意力机制，有效捕捉输入序列中的长距离依赖关系。CBAM模块：提出了通道和空间注意力的结合，显著提升了图像分类和目标检测的性能。SENet：引入了通道注意力机制，通过自适应学习特征通道的重要性，
【Gaussian Model】高斯分布模型 HP-Succinum 机器学习机器学习算法人工智能
目录高斯分布模型用于异常检测（GaussianModelforAnomalyDetection）1.高斯分布简介2.高斯分布模型用于异常检测(1)训练阶段：估计数据分布(2)检测阶段：计算概率判断异常点3.示例代码4.高斯分布异常检测的优缺点优点缺点5.适用场景6.结论高斯分布模型用于异常检测（GaussianModelforAnomalyDetection）在数据分析和机器学习任务中，异常检测（
深入浅出地理解-随机森林与XGBoost模型 HP-Succinum 机器学习随机森林集成学习机器学习
目录一、决策树的不足与集成学习的优势1.1决策树的缺点1.2集成学习：通过集成多个模型提升稳定性二、随机森林：通过多棵决策树减少方差2.1随机森林的基本原理2.2随机森林的优势2.3随机森林的参数调整三、XGBoost：高效且强大的Boosting方法3.1Boosting的基本原理3.2XGBoost的优化3.3XGBoost的优点四、随机森林与XGBoost的对比五、总结在机器学习的实战中，决
芯科科技通过全新并发多协议SoC重新定义智能家居连接电子科技圈 Silicon Labs 智能家居边缘计算 mcu 物联网 iot 人工智能机器学习
MG26系列SoC现已全面供货，为开发人员提供最高性能和人工智能/机器学习功能致力于以安全、智能无线连接技术，建立更互联世界的全球领导厂商SiliconLabs（亦称“芯科科技”，NASDAQ：SLAB），日前宣布其MG26系列无线片上系统（SoC）现已通过芯科科技及其分销合作伙伴全面供货。作为业界迄今为止最先进、高性能的Matter和并发多协议解决方案，MG26SoC的闪存和RAM容量是芯科科技
【Python编程】Python交互式应用框架巅峰对决 —— Streamlit vs Gradio 木亦汐丫 Python编程 Streamlit Gradio Jupyter Hugging Face Pandas PyTorch TensorFlow
Streamlit和Gradio都是非常受欢迎的Python交互式应用框架,但在构建Python交互式Web应用时该如何选择？它们各有独特的设计理念和适用场景，以下是基于功能特性、开发效率和应用场景的对比分析：一、核心定位与功能对比特性GradioStreamlit核心目标快速部署机器学习模型交互界面构建数据科学和复杂交互应用输入/输出支持支持文本、图像、音频、视频等基础组件支持更丰富的交互组件（
Grok 3能否打破大模型的魔咒？ TGITCIC AI-大模型的落地之道 grok grok3 大模型小模型 scaling law 开源大模型
新模型旧魔咒Grok3的问世，仿佛是科技界的一声惊雷。面对老掉牙的大模型法则，大家不禁要问：这到底意味着什么？以前，一提深度学习就能引出一场血雨腥风，现如今却有人说“没钱也能玩”。这风浪可真是一波未平一波又起。也许这就是科技的魅力：一统江湖的法则瞬间瓦解。缩小与提升大模型不再是唯一的解决方案，大家发现，原来小模型也可以撬动市场。不过，面对如何提升模型的智商，各路英雄却依然不得不面对两个选择：大力度
深度学习_第二轮 Humingway 深度学习深度学习人工智能
损失函数对偏置和权重求导，x、y作为常量确实，当进行模型训练时，(x)和(y)分别代表输入特征和对应的输出值，它们以数据点对的形式存在，一个数据集中通常包含多对这样的数据。每一对((x_i),(y_i))代表了数据集中的一个样本。在计算损失函数的梯度（即关于权重的偏导数）时，需要考虑整个数据集中的所有样本。对于每个样本((x_i),(y_i))，我们计算其对损失函数的贡献，并通过求和或平均这些贡献
对深度学习中的基本概念—梯度的理解 Humingway 深度学习深度学习人工智能
本文讨论一下对“梯度”的理解。“梯度”是深度学习中基本又非常核心的概念，没有它就没有人工智能的今天。然而，即使抛开令人眼花缭乱的术语（比如sgd、ada、moment、adam）不谈，即使最简单的“梯度”本身，也值得讨论一下。1.提出问题该如何理解梯度？让我们结合具体的例子来体会一下。2.定义例子首先，我们定义一个简单的例子，来模拟一下深度学习的学习过程。已知：有一个正确的数据对（或者叫样本），(
机器学习平台系列（一） - 初探 Jupyter Notebook 认证机制窝窝和牛牛机器学习平台 Python Jupyter Notebook JupyterHub 安全多租户
最近准备调研下JupyterNotebook的单用户安全机制（认证）以及如何实现多租户，以便集成到公司的云平台，进而作为基于大数据平台的机器学习平台的一部分。1.问题分析数据分析以及算法团队的同学使用JupyterNotebook进行数据分析和建模等工作，其工作流程如下所示：业务部门以组为单位申请一台物理服务器搭建Python环境，启动JupyterNotebook，每个同学创建自己的工程，进行代
《机器学习实战：从数据清洗到云端部署的可视化进阶指南（三）》庸俗今天不摸鱼机器学习人工智能 python
▍前言：阶段核心突破当前已完成模型开发与优化升级核心任务，成功将理论模型转化为工业级解决方案。本阶段基于前期标准化数据，实现从基础模型构建到高性能算法迭代的跨越式发展。▍章节回顾：攻坚与优化成果3.模型开发阶段算法实现：逻辑回归：搭建分类基线（LogisticRegression，准确率基准）支持向量机：对比线性核与RBF核性能差异（F1-score提升12%）K近邻：动态优化邻居数（k=5时验证
《基于WebGPU的下一代科学可视化——告别WebGL性能桎梏》 Eqwaak00 matplotlib webgl 微服务架构云原生分布式
引言：科学可视化的算力革命当WebGL在2011年首次亮相时，它开启了浏览器端3D渲染的新纪元。然而面对当今十亿级粒子模拟、实时物理仿真和深度学习可视化需求，WebGL的架构瓶颈日益凸显。WebGPU作为下一代Web图形标准，通过显存直存、多线程渲染和计算着色器三大革新，将科学可视化性能提升至10倍以上。本文将深入解析如何利用WebGPU突破大规模数据渲染的极限。一、WebGPU核心架构解析1.1
自动驾驶---Perception之大模型应用智能汽车人自动驾驶人工智能机器学习
1背景自动驾驶感知（Perception）模块在自动驾驶系统中扮演着至关重要的角色，它负责收集、处理并理解车辆周围的环境信息。随着深度学习技术的快速发展，大模型也逐渐在自动驾驶感知模块中得到了广泛应用。本篇博客主要介绍大模型在感知模块的应用。前面也介绍过如下几篇Perception相关的文章，有兴趣的读者可以了解相关内容：《自动驾驶---Perception之IPM图和BEV图》《自动驾驶---P
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
2025全球机器学习技术大会即将召开：汇聚全球AI顶尖专家，共话未来技术趋势量子位
由CSDN与Boolan联合主办的「2025全球机器学习技术大会」（MLSummit2025）将于4月18日至19日在上海虹桥西郊庄园丽笙大酒店隆重举行。本次大会汇聚全球AI领域的顶级学者、行业领袖和技术专家，共同探讨大模型技术演进、智能体、代码大模型、多模态技术等前沿话题，为参会者提供全方位的技术解读与行业洞察。大会亮点：顶级嘉宾阵容，前沿议题聚焦本次大会的主会环节将邀请多位全球AI领域的重量级
详解：Grok中文版 _Grok 3 国内中文版本在线使用人工智能
GrokAI是由XAI公司推出的一款尖端人工智能系统。作为该公司核心技术之一，GrokAI专注于推动人工智能在各行各业的实际应用，尤其在数据分析、自然语言处理（NLP）、自动化决策、机器学习等领域表现出色。Grok的最大亮点在于其强大的数据处理能力。它能够高效地从大量复杂数据中提取有价值的信息，并做出精准预测。借助深度学习与强化学习等先进技术，GrokAI具备自我学习的能力，可以通过不断的训练来优
【好书推荐7】《机器学习平台架构实战》是Yu欸粉丝福利机器学习架构人工智能 aws k8s docker
【好书推荐7】《机器学习平台架构实战》写在最前面《机器学习平台架构实战》编辑推荐内容简介作者简介目录前言本书读者内容介绍充分利用本书下载示例代码文件下载彩色图像本书约定你好呀！我是是Yu欸2024每日百字篆刻时光，感谢你的陪伴与支持~欢迎一起踏上探险之旅，挖掘无限可能，共同成长！写在最前面感谢大家的陪伴和支持，2024年争取每周二开展粉丝福利送书活动，欢迎关注~第7波福利感谢清华出版社的大力支持本
基于OpenCV的Java人脸识别系统设计与实现小呀白呀兔 java spring boot
基于OpenCV的Java人脸识别系统设计与实现1.引言随着计算机视觉技术的发展，人脸识别在安全监控、身份验证等领域得到了广泛应用。本文将详细介绍如何使用OpenCV库和Java语言构建一个简单的人脸识别系统。该系统能够从图像中检测人脸，并通过深度学习模型提取特征进行比对，最终输出相似度评分及置信度等级。2.环境搭建为了确保项目顺利运行，请按照以下步骤配置开发环境：安装JDK：确保已安装JavaD
软考计算机网络,软考-计算机网络总复习 Vicey Wang 软考计算机网络
计算机网络复习知识点1、计算机网络的定义描述计算机网络，是指将地理位置不同的具有独立功能的多台计算机及其外部设备，通过通信线路连接起来，在网络操作系统，网络管理软件及网络通信协议的管理和协调下，实现资源共享和信息传递的计算机系统2、OSI参考模型的分层(7层各自的功能)(1)物理层(PhysicalLayer)物理层是OSI参考模型的最低层，它利用传输介质为数据链路层提供物理连接。它主要关心的是通
Python 机器学习基础之模型评估与改进【评估指标与评分】的简单说明仙魁XAN Python 机器学习基础+实战案例 python 机器学习模型评估与改进评估指标与评分召回率
Python机器学习基础之模型评估与改进【评估指标与评分】的简单说明目录Python机器学习基础之模型评估与改进【评估指标与评分】的简单说明一、简单介绍二、评估指标与评分1、牢记最终目标2、二分类指标1）错误类型2）不平衡数据集3）混淆矩阵4）考虑不确定性5）准确率-召回率曲线6）受试者工作特征（ROC）与AUC3、多分类指标4、回归指标5、在模型选择中使用评估指标附录一、参考文献一、简单介绍Py
智能教育：DeepSeek在个性化学习中的创新应用与代码实现 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 #深度学习学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。本文将结合代码实现，深入探讨DeepSeek在个性化学习中的应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算
大白话聊聊“深度学习”和“大模型” 程序员鬼鬼深度学习人工智能 AI编程 AIGC chatgpt ai
1950年图灵发表论文《计算机器与智能》（ComputingMachineryandIntelligence），提出了“机器智能”（MachineIntelligent）的概念，并且提出了著名的“图灵测试”的方法来判断机器是否有智能。1956年，达特茅斯会议，“人工智能”（ArtificialIntelligent）概念被首次提出，人工智能作为一个学科开始被研究。科学家梦想着未来可以用复杂物理结构
Java面试常见问题总结 m0_74824823 面试学习路线阿里巴巴 java 面试开发语言
每次面试都要有充分的复习准备，每次面试完，一定要学会总结，不会的查缺补漏。总结一下面试经常遇到的问题。1：项目介绍，介绍项目主要业务模块及功能，介绍自己负责的模块，项目中遇到过最大的挑战是什么？怎么解决的？2：重载和重写的区别？3：项目中用到过反射吗？如果用过，结合项目项目具体说说。4：项目中异常怎么处理的？5：集合List、Set、Map三者的区别及联系？6：HashMap的底层原理，如何解决H
基于hive的电信离线用户的行为分析系统赵谨言论文经验分享毕业设计
标题:基于hive的电信离线用户的行为分析系统内容:1.摘要随着电信行业的快速发展，用户行为数据呈现出海量、复杂的特点。为了深入了解用户行为模式，提升电信服务质量和精准营销能力，本研究旨在构建基于Hive的电信离线用户行为分析系统。通过收集电信用户的通话记录、上网行为、短信使用等多源数据，利用Hive数据仓库工具进行数据存储和处理，采用数据挖掘和机器学习算法对用户行为进行分析。实验结果表明，该系统
【精华推荐】AI大模型学习必逛的十大顶级网站大模型入门学习人工智能学习大模型入门 llama 大模型教程大模型学习大模型
随着人工智能技术的快速发展，AI大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。对于希望深入学习AI大模型的开发者和研究者来说，找到合适的学习资源至关重要。本文将为大家推荐十大必备网站，帮助你更好地理解和应用AI大模型。1.CourseraCoursera是一个在线学习平台，提供各类AI和机器学习课程，包括斯坦福大学的机器学习课程和深度学习专项课程。通过视频讲解
【大模型学习】第八章深入理解机器学习技术细节好多渔鱼好多 AI大模型机器学习 AI 大模型人工智能
目录引言一、监督学习（SupervisedLearning）1.定义与工作原理2.常见任务3.应用场景示例：房价预测二、无监督学习（UnsupervisedLearning）1.定义与工作原理2.常见任务3.应用场景示例：客户细分三、强化学习（ReinforcementLearning）1.定义与工作原理2.常见应用场景3.应用场景示例：游戏AI四、集成学习（EnsembleLearning）1.
深度学习分类回归（衣帽数据集）何仙鸟深度学习分类回归
一、步骤1加载数据集fashion_minst2搭建classNeuralNetwork模型3设置损失函数，优化器4编写评估函数5编写训练函数6开始训练7绘制损失，准确率曲线二、代码导包，打印版本号：importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportsklearnimport
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/pwd@192.168.0.5:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

深度学习和tensorflow学习总结---复习自用，大家看到不对的地方多多留言，互相交流

深度学习（DeepLearing）

线性回归

神经网络（NN）

图片数据读取

基础知识

流程

二进制文件读取（和图片读取有个对比）

基础知识

流程

TFRecords 文件写入与读取

基础知识

流程

TFRecords文件写入

TFRecords文件读取

神经网络基础

softmax回归

交叉熵损失

线性神经网络的局限性

卷积神经网络(CNN)

验证码的识别思路

知识点

pandas中索引的使用

定义一个pandas的DataFrame对像

CNN卷积神经网络实现验证码识别代码，详细备注，供自己复习。

你可能感兴趣的:(学习总结,深度学习,CNN,机器学习,学习总结,复习自用)