lsh呵呵

天池：零样本目标识别新手笔记

2018之江杯全球人工智能大赛-零样本图像目标识别

简单数据分析

jupyter：github地址

数据预处理

将label_list和class_wordembeddings合并，处理后结果如标签\t特征。
sample_processing.py

import pandas as pd

dir = "d:/ZSL_ImageGame/DatasetA_train_20180813/"


def words_embed():
    """
    处理label_list和class_wordembeddings,文本特征
    :return: data/word_embeddings.csv
    """
    train_labels = pd.read_csv(dir + "label_list.txt", sep='\t', header=None)
    print(train_labels.head())

    train_words = pd.read_csv(dir +"class_wordembeddings.txt", sep=' ', header=None)
    print(train_words.head())

    res = pd.merge(train_labels, train_words, left_on=1, right_on=0)

    res = res.drop([1, '1_x', '0_y'], axis=1)
    print(res.head())
    res.to_csv('output/word_embeddings.csv', index=None, header=None, sep='\t')

def traindata():
    """
    连接数据
    :return:
    """
    train = pd.read_csv(dir + 'train.txt', header=None, sep='\t')
    train_attr = pd.read_csv(dir + "attributes_per_class.txt", sep='\t', header=None)
    train_words=pd.read_csv('output/word_embeddings.csv',sep='\t',header=None)

    print(train.head())
    print(train_attr.head())
    print(train_words.head())
    # res.to_csv('output/traindata.csv',index=None,header=None,sep='\t')

if __name__ == '__main__':
    # words_embed()
    traindata()

选取训练集和验证集

有关表明，submit.txt存放着验证数据。如下代码，其标签ZJL160打错成了ZJL178，当然178还打着178。submit.txt含有标签160~200，所有样本都可在train.txt找到。

False Label	True Label
178	160
178	178

import numpy as np
import pandas as pd

src="d:/ZSL_ImageGame/DatasetA_train_20180813/"
valid=pd.read_csv(src+"submit.txt",header=None,sep="\t")
train=pd.read_csv(src+'train.txt',header=None,sep='\t')

print(valid.head())
print(valid.shape)
"""
                                       0       1
0  9f1d3113f1fcb573596ca99ecb712364.jpeg  ZJL178
1  9f73904f7a72fa7285b80f2ae8286066.jpeg  ZJL178
2  619bf8d90e1fa19a7f2966bd38b27ccd.jpeg  ZJL178
3  6773ca5a1a615fc0d67f836e0772ff46.jpeg  ZJL178
4  e1badc8feb1e4d4a6e44eb382d13bc24.jpeg  ZJL178
(8291, 2)
"""

print(train.head())
print(train.shape)
"""
                                       0     1
0  a6394b0f513290f4651cc46792e5ac86.jpeg  ZJL1
1  2fb89ef2ace869d3eb3bdd3afe184e1c.jpeg  ZJL1
2  eda9f3bef2bd8da038f6acbc8355fc25.jpeg  ZJL1
3  7d93ef45972154aae150b4f9980a79c0.jpeg  ZJL1
4  fb901b4f9a8e396c1d0155bccc5e5671.jpeg  ZJL1
(38221, 2)
"""
print(sorted([int(str(i)[3:]) for i in set(train.iloc[:,1].values)]))
"""
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 135, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 149, 150, 151, 152, 153, 154, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200]

"""

mer=pd.merge(valid,train,left_on=0,right_on=0)
print(mer.head())
print(mer.shape)
"""
                                       0     1_x     1_y
0  9f1d3113f1fcb573596ca99ecb712364.jpeg  ZJL178  ZJL160
1  9f73904f7a72fa7285b80f2ae8286066.jpeg  ZJL178  ZJL160
2  619bf8d90e1fa19a7f2966bd38b27ccd.jpeg  ZJL178  ZJL160
3  6773ca5a1a615fc0d67f836e0772ff46.jpeg  ZJL178  ZJL160
4  e1badc8feb1e4d4a6e44eb382d13bc24.jpeg  ZJL178  ZJL160
(8291, 3)
"""

# ## 标签ZJL160的打错成了ZJL178
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.metrics import cohen_kappa_score
true_label=mer.iloc[:,1].values
res=mer.iloc[:,2].values

print()
print(classification_report(true_label,res))
print("kappa: ",cohen_kappa_score(true_label,res))
mat = confusion_matrix(true_label,res)
sns.heatmap(mat,annot=True,square=True,fmt="d")
plt.show()

此处可以删除错打成ZJL178的标签或者将错打的改成168，如下为删除代码：

mer=mer[~((mer.iloc[:,1]=="ZJL178") &(mer.iloc[:,2]=="ZJL160"))]

这样，submit.txt就从8291变成了8094，然后在从训练集删除验证集的部分。通过submit.txt和train.txt merge上看，submit的样本全部来自train.txt（其中的160~200）。干脆简单的，直接从train.txt中选取ZJLXX~ZJLXX作为验证，其他作为训练。

import numpy as np
import pandas as pd

src="d:/ZSL_ImageGame/DatasetA_train_20180813/"
train=pd.read_csv(src+'train.txt',header=None,sep='\t')
# print(train.head())
print("train.txt数量",train.shape)

s= ["ZJL"+str(i) for i in range(196,201)]
# print(s)

zsl_validate=train[train.iloc[:,1].isin(s)].sample(frac=1,random_state=2018)
# print(validate.head())
print("零样本测试集",zsl_validate.shape)

traindata=train[~train.iloc[:,1].isin(s)].sample(frac=1,random_state=2018)
# print("",traindata.shape)

train_img=traindata.iloc[:-1000,:]
print("图片训练集",train_img.shape)
validate_img=traindata.iloc[-1000:,:]
print("图片验证集",validate_img.shape)



zsl_validate.to_csv("../data/zsl_validate.csv", sep="\t", header=None, index=None)
train_img.to_csv("../data/train_img.csv", sep="\t", header=None, index=None)
validate_img.to_csv("../data/validate_img.csv", sep="\t", header=None, index=None)

train.txt数量 (38221, 2)
零样本测试集 (1016, 2)
图片训练集 (36205, 2)
图片验证集 (1000, 2)

实验部分

整体思路如下，KNN使用1近邻：

实验中我使用train.txt中的2000条数据作为验证集，其他作为训练集来训练CNN模型，分别使用VGG16,Xception,自定义模型微调和重训练；发现验证集的精度0.2多，训练集能达到0.9以上，据说训练样本打的标记不够好。也就是说，图片特征这一步就出现问题了 \wulian \mudenggoudai ，

映射使用的是神经网络（据说使用岭回归较好），线上精度较差。

此处仅贴出批量数据训练的flow（个人认为有轻微参考价值）。

import keras
import pandas as pd
import numpy as np
import cv2
from keras_preprocessing.image import ImageDataGenerator

train_attr = pd.read_csv("d:/ZSL_ImageGame/DatasetA_train_20180813/attributes_per_class.txt", sep='\t', header=None)
train_words = pd.read_csv(r"data/word_embeddings.csv", sep='\t', header=None)
labelkeys = sorted(set(train_attr.iloc[:, 0].values.tolist()))

datagen = ImageDataGenerator(rescale=1./255,rotation_range=20,width_shift_range=0.2,height_shift_range=0.2,
                                 shear_range=0.2,zoom_range=0.5,horizontal_flip=True,fill_mode='nearest')

class DataPiple:

    def __init__(self,target,imgsize=64,impro=False):
        """

        :param target:
        :param impro: 是否数据增强
        """

        self.target = pd.read_csv(target, header=None, sep='\t').sample(frac=1,random_state=2018)
        self.fea_size=len(self.target)
        self.impro=impro
        self.imgsize=imgsize

    def readOne(self,pos):
        t=self.target.iloc[pos,:]
        im = cv2.imread("d:/ZSL_ImageGame/DatasetA_train_20180813/train/" + t[0])
        im = cv2.resize(im, dsize=(self.imgsize, self.imgsize))
        attr=train_attr[train_attr[0]==t[1]].values[0,1:]
        word=train_words[train_words[0]==t[1]].values[0,1:]
        label=np.zeros(shape=(len(labelkeys)),dtype=np.uint8)
        label[labelkeys.index(t[1])]=1
        return im,attr,word,label


    def readFeather(self,pos,size):
        ims=[]
        attrs=[]
        words=[]
        labels=[]

        for i in range(pos,min(pos+size,self.fea_size)):
            im,attr,word,label=self.readOne(i)
            ims.append(im)
            attrs.append(attr)
            words.append(word)
            labels.append(label)
        ims=np.array(ims)
        # 做数据增强
        if self.impro == True:
            ims=datagen.flow(ims,batch_size=len(ims),shuffle=False).__next__()
        else:
            ims=ims/255.0
        ims = np.array(ims)
        attrs=np.array(attrs)
        words=np.array(words)
        labels=np.array(labels)

        return ims,attrs,words,labels


    def create_inputs(self,size=64):

        while True:
            for i in range(0,self.fea_size,size):
                ims, attrs, words,labels=self.readFeather(i,size)
                # print(ims.shape)
                # print(attrs.shape)
                # print(words.shape)
                yield ims, labels

if __name__ == '__main__':
    # print(labelkeys)

    dp=DataPiple(target=r"D:\ZSL_ImageGame\DatasetA_train_20180813\train.txt",impro=True)
    s=dp.create_inputs(64)
    r,p=s.__next__()

    print(len(r),r.shape,p.shape)

    import matplotlib.pyplot as plt

    plt.imshow(r[2])
    plt.show()

    # print(labelkeys)

其他代码放在Github上。第一次参加此种比赛，无论设备（训练真的慢，……，训练差不多我就终止程序了）还是水平，发现真是cai奥，还是学好基础再来闲逛。此记，用以缅怀。

Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

天池：零样本目标识别新手笔记

简单数据分析

数据预处理

选取训练集和验证集

实验部分

你可能感兴趣的:(python与人工睿智,机器学习入门与放弃)