GISer_Lin

AlexNet结构及 pytorch、tensorflow、keras、paddle实现ImageNet识别

背景

AlexNet网络是 Hinton及其学生Alex Krizhevsky在ImageNet ILSVRC-2012竞赛中在 ILSVRC-2010数据上的的冠军网络，论文 "ImageNet Classifification with Deep Convolutional Neural Networks"，该网络在大规模对象识别上取得的成功也掀起了深度学习的热潮。

AlexNet亮点：使用ReLU作为激活函数，提出LRN机制，Dropout随机失活，重叠Pooling，CUDA并行训练及数据增强

网络结构

原文中使用了3维卷积核，卷积核维度增加

原作者使用双GPU进行并行参数训练，将特征图从通道数层面进行分离，故以下通道数是上图的并行通道数之和

input layer:224*224*3 images

conv1 layer:11*11*3(3维卷积核)* 96, 4 conv kernels 55*55*96 ouput ( (224 + 0 - 11) / 4 +1 = 54.25 )

pool1 layer:3*3, 2 overlap maxpool 27*27*96 output ( (55 - 3) / 2 + 1 = 27 )

conv2 layer:5*5*48* 256 conv kernels(2pad) 27*27*256 output ( 27 + 2*2 - 5 + 1 = 27 )

pool2 layer:3*3, 2 overlap maxpool 13*13*256 output ( (27 - 3) / 2 + 1 =13 )

conv3 layer:3*3*256* 384 conv kernels(1pad) 13*13*384 output ( 13 + 1*2 - 3 + 1 = 13 )

conv4 layer:3*3*192* 384 conv kernels(1pad) 13*13*384 output ( 13 + 1*2 - 3 + 1 = 13 )

conv5 layer:3*3*192* 256 conv kernels(1pad) 13*13*256 output ( 13 + 1*2 - 3 + 1 = 13 )

pool3 layer:3*3, 2 overlap maxpool 6*6*256 output ( (13 - 3) / 2 + 1 =6 )

fc1 layer: 4096 output( 13*13*256 --> 4096 )

fc2 layer: 4096 output( 4096 --> 4096 )

fc3 layer: 1000 output( 4096 --> 1000 )

代码：

pytorch实现

tensorflow实现

keras实现

paddle实现

注：

以上代码在alexnet的基础上，实现了：

1）调用框架api读取数据集

2）进行train、val的流程

3）在train时可以输出各层shape

4）保存最优loss模型，并在结束时输出最优loss及对应epoch

5）在训练结束后查看loss、acc变化曲线

源网络使用224作为输入，这里使用227作为输入；源网络使用3维卷积，这里仍使用2维卷积

源数据：ImageNet LSVRC-2010，1000类，120万张训练图片、5万测试、15万验证

mini-imagenet数据：来自：https://blog.csdn.net/weixin_41803874/article/details/92068250

实验数据：从mini-imagenet随机选取10类，每类随机选取100张图片，共1000张图片作为数据集

（实验数据在resnet18(pretrained=True)条件下进行迁移学习，训练2epoch可以val达到0.9准确率，在resnet18(pretrained=False)条件下训练，100epoch val acc始终处于0.35acc，无法收敛（尝试调整学习率无果），大致说明数据可以收敛但从零训练效果差；在实现的alexnet代码中，pytorch版本在val acc达到0.30左右后开始减小停止收敛，tensorflow、keras版本无法收敛，paddle版本可以收敛到0.60左右）

文件结构：创建my_utils.py文件存放通用函数

从mini-imagenet中提取10*100数据（非必要）

# -*- coding: utf-8 -*- 
# @Time : 2020/1/21 15:20 
# @Author : Zhao HL
# @File : data_process.py
import os,random,shutil
import numpy as np
import pandas as pd

#region 类名转换文档
cls_dict_path = r'D:\__Download\百度\caffe_ilsvrc12\synset_words.txt'
# endregion

#region mimi 数据集文档及信息
# csv_path = r'D:\__Download\百度\mini-imagenet\test.csv'
# csv_path = r'D:\__Download\百度\mini-imagenet\train.csv'
csv_path = r'D:\__Download\百度\mini-imagenet\val.csv'
src_data_path = r'D:\__Download\百度\mini-imagenet\images'
'''
train.csv contain 38400 records, 64 classes 
test.csv contain 12000 records, 20 classes 
val.csv contain 9600 records, 16 classes 
'''
# endregion
# region 目标文件
dst_data_path = r'D:\__Download\百度\my_imagenet'
dst_csv_path = r'D:\__Download\百度\my_imagenet.csv'
# endregion

def get_csvInfo():
    df = pd.read_csv(csv_path)
    total_num = len(df)
    class_num = len(df['label'].unique())
    print('{} contain {} records, {} classes '.format(os.path.basename(csv_path),total_num,class_num))

def Extract_Image():
    # 从val文件中选取10个类，每个类选取100样本
    df = pd.read_csv(csv_path)
    cls = df['label'].unique()
    dst_cls = random.sample(list(cls),10)
    df_list = []
    for cls in dst_cls:
        print('cls {} :'.format(cls))
        df_cls = df[df['label']==cls]
        dst_df_cls = df_cls.sample(100)
        df_list.append(dst_df_cls)
    dst_df = pd.concat(df_list,ignore_index=True)

    for i,filename in enumerate(dst_df['filename']):
        src_path = os.path.join(src_data_path,filename)
        dst_path = os.path.join(dst_data_path,filename)
        shutil.copy(src_path,dst_path)
        print(i,filename)
    dst_df.to_csv(dst_csv_path)


if __name__ == '__main__':
    pass
    # get_csvInfo()
    Extract_Image()

JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 alxw4616@msn.com * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

AlexNet结构 及 pytorch、tensorflow、keras、paddle实现ImageNet识别

背景

网络结构

代码：

注：

你可能感兴趣的:(DL-Code)

AlexNet结构及 pytorch、tensorflow、keras、paddle实现ImageNet识别