木尧大兄弟

【Kaggle实战】泰坦尼克号生存人数预测（从零到提交到Kaggle再到模型的保存与恢复）

数据地址：https://www.kaggle.com/c/titanic/data

版本说明：python 3.6 + tensorflow 1.9

项目结构图：

【data】

1.train.csv 训练集

2.test.csv 测试集（不含预测结果）

3.gender_...csv 测试集的预测结果

【data_process.py 数据预处理人工选择特征】

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np


def trainDataProcess(filepath):
    """
    训练数据预处理
    :param filepath: 
    :return: data_train, data_target
    """
    # 读训练集
    data = pd.read_csv(filepath)

    # 人工选特征 已去掉无用特征
    data = data[
        ['Survived',  # 是否获救（0/1）
         'Pclass',  # 客舱等级(1/2/3)
         'Sex',  # 性别
         'Age',  # 年龄
         'SibSp',  # 船上兄妹对象数
         'Parch',  # 船上爹妈儿女数
         'Fare',  # 船票价格
         'Cabin',  # 客舱号
         'Embarked'  # 登船口
         ]
    ]

    # 空白值(NA/NaN)的处理 以及String类型字段的数值化
    data['Age'] = data['Age'].fillna(data['Age'].mean())  # Age：空白值填入平均年龄
    data['Cabin'] = pd.factorize(data.Cabin)[0]  # Cabin：元组第0项为数值化的值
    data.fillna(0, inplace=True)  # 其他的空白值统统填0
    data['Sex'] = [1 if x == 'male' else 0 for x in data.Sex]

    # Pclass：避免出现 "2等票=1等票*2" 的线性关系 对三个票等级进行one-hot编码 加三个新字段 并删掉原字段
    data['p1'] = np.array(data['Pclass'] == 1).astype(np.int32)  # p1：0(非1等座) 1(是1等座)
    data['p2'] = np.array(data['Pclass'] == 2).astype(np.int32)  # p2：0(非2等座) 1(是2等座)
    data['p3'] = np.array(data['Pclass'] == 3).astype(np.int32)  # p3：0(非3等座) 1(是3等座)
    del data['Pclass']
    # Embarked：处理方法同上
    data['e1'] = np.array(data['Embarked'] == 'S').astype(np.int32)
    data['e2'] = np.array(data['Embarked'] == 'C').astype(np.int32)
    data['e3'] = np.array(data['Embarked'] == 'Q').astype(np.int32)
    del data['Embarked']

    # print(data[['p1','Cabin']])  # 去数据用双中括号

    # 预处理后的数据字段
    data_train = data[
        [
         'p1','p2','p3',  # 客舱等级(1/2/3)
         'Sex',  # 性别
         'Age',  # 年龄
         'SibSp',  # 船上兄妹对象数
         'Parch',  # 船上爹妈儿女数
         'Fare',  # 船票价格
         'Cabin',  # 客舱号
         'e1','e2','e3'  # 登船口
         ]
    ]  # 输入：891*12

    data_target = data['Survived'].values.reshape(len(data),1)  # 输出891*1 (列向量)
    return data_train,data_target


def testDataProcess(filepath):
    """
    测试数据预处理
    :param filepath: 
    :return: data_test
    """
    # 读训练集
    data = pd.read_csv(filepath)

    # 人工选特征 已去掉无用特征
    data = data[
        [
         'Pclass',  # 客舱等级(1/2/3)
         'Sex',  # 性别
         'Age',  # 年龄
         'SibSp',  # 船上兄妹对象数
         'Parch',  # 船上爹妈儿女数
         'Fare',  # 船票价格
         'Cabin',  # 客舱号
         'Embarked'  # 登船口
         ]
    ]

    # 空白值(NA/NaN)的处理 以及String类型字段的数值化
    data['Age'] = data['Age'].fillna(data['Age'].mean())  # Age：空白值填入平均年龄
    data['Cabin'] = pd.factorize(data.Cabin)[0]  # Cabin：元组第0项为数值化的值
    data.fillna(0, inplace=True)  # 其他的空白值统统填0
    data['Sex'] = [1 if x == 'male' else 0 for x in data.Sex]

    # Pclass：避免出现 "2等票=1等票*2" 的线性关系 对三个票等级进行one-hot编码 加三个新字段 并删掉原字段
    data['p1'] = np.array(data['Pclass'] == 1).astype(np.int32)  # p1：0(非1等座) 1(是1等座)
    data['p2'] = np.array(data['Pclass'] == 2).astype(np.int32)  # p2：0(非2等座) 1(是2等座)
    data['p3'] = np.array(data['Pclass'] == 3).astype(np.int32)  # p3：0(非3等座) 1(是3等座)
    del data['Pclass']
    # Embarked：处理方法同上
    data['e1'] = np.array(data['Embarked'] == 'S').astype(np.int32)
    data['e2'] = np.array(data['Embarked'] == 'C').astype(np.int32)
    data['e3'] = np.array(data['Embarked'] == 'Q').astype(np.int32)
    del data['Embarked']

    # 预处理后的数据字段
    data_test = data[
        [
         'p1','p2','p3',  # 客舱等级(1/2/3)
         'Sex',  # 性别
         'Age',  # 年龄
         'SibSp',  # 船上兄妹对象数
         'Parch',  # 船上爹妈儿女数
         'Fare',  # 船票价格
         'Cabin',  # 客舱号
         'e1','e2','e3'  # 登船口
         ]
    ]  # 输入：891*12

    return data_test

【network.py 构建训练网络】

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import tensorflow as tf
import numpy as np


def network(data_train, data_target, data_test, test_lable):
    """
    构建网络
    :param data_train: 
    :param data_target: 
    :param data_test: 
    :param test_lable: 
    :return: 
    """

    x = tf.placeholder("float", shape=[None,12])  # 行数不定(可能分批放入) 故None
    y = tf.placeholder("float", shape=[None,1])

    weight = tf.Variable(tf.random_normal(shape=[12,1]),name='weight')  # 每行输入12值 输出1值
    bias = tf.Variable(tf.random_normal(shape=[1]),name='bias')

    output = tf.matmul(x,weight)+bias  # output = XW+b
    pred = tf.cast(tf.sigmoid(output) > 0.5,
                   tf.float32)  # 转成0/1

    # 注意：logits取output 因为sigmoid_cross_entropy_with_logits里面要算sigmoid
    loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=y,  # 目标值
                                                                  logits=output))  # 计算值

    train_step = tf.train.GradientDescentOptimizer(0.0003).minimize(loss)

    accuracy = tf.reduce_mean(tf.cast(tf.equal(pred,y),
                                      tf.float32))

    sess = tf.Session()
    sess.run(tf.global_variables_initializer())  # 变量初始化
    loss_train = []  # 存每1000步的loss
    train_acc = []  # 存每1000步的训练集准确率
    test_acc = []  # 存每1000步的测试集准确率

    for epoch in range(25000):
        # 为防止过拟合,对训练顺序（数据索引）随机排序
        index = np.random.permutation(len(data_target))
        data_train = data_train.iloc[index]
        data_target = data_target[index]

        for batch in range(len(data_target)//100+1):  # batch = 0~9
            batch_xs = data_train[batch * 100:batch * 100 + 100]  # 每批取100个数据
            batch_ys = data_target[batch * 100:batch * 100 + 100]
            sess.run(train_step, feed_dict={x:batch_xs,
                                            y:batch_ys})

        # 每隔1000步 算一次训练loss和acc 和测试acc
        if epoch % 1000 == 0:
            loss_temp = sess.run(loss, feed_dict={x:batch_xs,
                                                  y:batch_ys})
            train_acc_temp = sess.run(accuracy, feed_dict={x:batch_xs,
                                                           y:batch_ys})
            test_acc_temp = sess.run(accuracy, feed_dict={x:data_test,
                                                          y:test_lable})
            loss_train.append(loss_temp)
            train_acc.append(train_acc_temp)
            test_acc.append(test_acc_temp)
            print('The epoch ',epoch,
                  ' loss = ',loss_temp,
                  ' train_acc = ',train_acc_temp,
                  ' test_acc = ',test_acc_temp,
                  '\n', end='')

    return loss_train, train_acc, test_acc

【run.py 运行训练并绘制运行结果】

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from Tatanic.data_process import trainDataProcess,testDataProcess
from Tatanic.network import network


if __name__ == '__main__':

    # 训练集的输入、输出
    data_train, data_target = trainDataProcess('data/train.csv')

    # 测试集的输入、期望输出
    data_test = testDataProcess('data/test.csv')
    test_lable = pd.read_csv('data/gender_submission.csv')
    test_lable = np.reshape(test_lable.Survived.values.astype(np.float32),
                            newshape=(len(test_lable),1))  # 481*1
    # 训练
    loss_train, train_acc, test_acc = network(data_train=data_train,
                                              data_target=data_target,
                                              data_test=data_test,
                                              test_lable=test_lable)

    # 绘图
    plt.figure(1)
    plt.plot(loss_train, 'k-', label='train_loss')
    plt.legend()
    plt.title('Titanic death prediction - loss')

    plt.figure(2)
    plt.plot(train_acc, 'b-', label='train_acc')
    plt.plot(test_acc, 'r--', label='test_acc')
    plt.title('Titanic death prediction -acc')
    plt.legend()
    plt.show()

【运行结果及分析】

train_acc波动大，是因为电脑比较菜，batch选择的太小（100）。

【提交结果】

1.格式：提交格式是和gender_submission.csv同样的格式

2.提交：

提交成功~~虽然排名有点往后，但也算是走了一遍流程了~

【模型保存恢复】

1.模型保存

...(这里是变量们的定义)

saver = tf.train.Saver()

...(模型训练过程)


saver.save(sess, "tmp/model.ckpt")

2.模型恢复

restore。

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import tensorflow as tf
import numpy as np

if __name__ == '__main__':
    x = tf.placeholder("float", shape=[None,12])
    weight = tf.Variable(tf.random_normal(shape=[12,1]),name='weight')
    bias = tf.Variable(tf.random_normal(shape=[1]),name='bias')

    output = tf.matmul(x, weight) + bias
    pred = tf.cast(tf.sigmoid(output) > 0.5,tf.float32)  # 转成0/1

    saver = tf.train.Saver()
    sess = tf.Session()
    sess.run(tf.global_variables_initializer())  # 变量初始化
    saver.restore(sess, "tmp/model.ckpt")

    """
        'p1','p2','p3',  # 客舱等级(1/2/3)
        'Sex',  # 性别
        'Age',  # 年龄
        'SibSp',  # 船上兄妹对象数
        'Parch',  # 船上爹妈儿女数
        'Fare',  # 船票价格
        'Cabin',  # 客舱号
        'e1','e2','e3'  # 登船口
    """
    # 测试一个来自18岁的头等舱小姐姐
    x_test = np.array([0,0,1,0,18,0,0,8,0,1,0,0]).reshape(1,12)
    print(sess.run(weight))
    print(sess.run(output, feed_dict={x: x_test}))
    print(sess.run(pred, feed_dict={x: x_test}))
    sess.close()

测试结果：

年轻（18岁）又有钱（头等舱）的小姐姐，当然要活下来了！

技术杂记之：vi使用入门码农星球
对于Linux的初次使用者来说，进入Linux非图形界面后，不知道怎么创建文本（甚至于在图形界面，也找不到创建文本的菜单）。其实，每一个Linux的发行版本，都包含了一个最简单、也是最基础的文本编辑器：vi（VisualInterface）。其实，想要创建文本文件，很简单，只要在终端中输入：vimyfile.txt就可以了。注意了，包括想要创建java文件，也可以这样的。要使用vi，得从vi的三个
技术杂记之：在阿里云centos7上部署JDK MYSQL TOMCAT 码农星球
今日小编闲来无事，乘着公司新项目即将上线之际，在阿里云上整了一台centos作为测试机。原本以为一个小时搞定，结果还是花了一点小小时间。不管怎么说，记录下来，给各位小白当成课后甜点吧。价格先上价格，809.4RMB。这个价格也就是一顿大餐的事情，BUT，作为程序员的你，未来的一年这台机器都是属于你的了哦。当然，配置低是低了点，但是好歹它是一台具备公网地址，功能齐全的centos7啊。总之，你想怎么
【深度学习系列】PaddlePaddle之手写数字识别 Charlotte77
本文同步于知乎专栏-技术杂记与博客园上周在搜索关于深度学习分布式运行方式的资料时，无意间搜到了paddlepaddle，发现这个框架的分布式训练方案做的还挺不错的，想跟大家分享一下。不过呢，这块内容太复杂了，所以就简单的介绍一下paddlepaddle的第一个“helloword”程序----mnist手写数字识别。下一次再介绍用PaddlePaddle做分布式训练的方案。其实之前也写过一篇用CN
技术杂记 Scathon
本博客记录一些在开发和学习过程中一些技术点的备忘。============================================================wget使用代理加快下载速度如果下载的资源是http协议的，执行如下命令：wget资源地址-euse_proxy=yes-ehttp_proxy=127.0.0.1:1088如果下载的资源是https协议的，命令要稍微麻烦一些，执
C++中Delete时堆错误（Heap Corruption）的原因 zypuestc
C++中Delete时堆错误（HeapCorruption）的原因作者：Usher发布于：2012-8-2919:36Wednesday分类：技术杂记最近这三四天一直在跟一个bug做斗争：程序在运行过程中死掉，Output窗口显示：1.Windowshastriggeredabreakpointin***，Thismaybeduetoacorruptionoftheheap...2.Accessv
技术杂记【JSONArray 按指定字段排序，升序和倒序】半岛码农技术杂记 Java
第一种Randomrandom=newRandom();JSONArrayresult=newJSONArray();for(inti=0;i{Integervalue=((JSONObject)obj).getIntValue("value");returnvalue;}));System.out.println("排序后(升序):"+result.toJSONString());result.
Java技术杂记挖坑填坑循环 java
本文是临时记录在本子上Java技术的初步整理,一来举一反三,二来练习双拼打字.发现双拼方案里的自然码挺好用的.搜狗双拼方案对单韵母的字采用”o+韵母”,比如”安oj”,“二or”等.自然码则是”安an”,“二er”,符合传统拼音思维.但是,自然码美中不足的是”昂ang”为了兼容双拼2个键出字的规则,强行将a作声母,原本是”ang”的”H”键改为”ng”作韵母.目录:代码规范硬编码其他问题JavaE
技术杂记之：在阿里云centos7上部署JDK MYSQL TOMCAT 码农星球撸码J JAVA
今日小编闲来无事，乘着公司新项目即将上线之际，在阿里云上整了一台centos作为测试机。原本以为一个小时搞定，结果还是花了一点小小时间。不管怎么说，记录下来，给各位小白当成课后甜点吧。价格先上价格，809.4RMB。这个价格也就是一顿大餐的事情，BUT，作为程序员的你，未来的一年这台机器都是属于你的了哦。当然，配置低是低了点，但是好歹它是一台具备公网地址，功能齐全的centos7啊。总之，你想怎么
技术杂记之：vi使用入门码农星球撸码J JAVA
对于Linux的初次使用者来说，进入Linux非图形界面后，不知道怎么创建文本（甚至于在图形界面，也找不到创建文本的菜单）。其实，每一个Linux的发行版本，都包含了一个最简单、也是最基础的文本编辑器：vi（VisualInterface）。其实，想要创建文本文件，很简单，只要在终端中输入：vimyfile.txt就可以了。注意了，包括想要创建java文件，也可以这样的。要使用vi，得从vi的三个
MySQL 的卸载、安装、配置字符编码及远程连接 waka
参考文章：ubuntu下安装mysql及卸载mysql方法-FZH的技术杂记录-博客园0彻底删除mysql，如果需要的话sudoapt-getautoremove--purgemysql-server-*sudoapt-getremovemysql-serversudoapt-getautoremovemysql-serversudoapt-getremovemysql-common(非常重要)清
【技术杂记】如何正确的理解CAP和BASE理论？ SnailMann 技术设计 BASE CAP
如何正确的理解CAP和BASE理论？我个人觉得这篇文章的开头，讲的非常的不错，可以从这里入手从分布式一致性谈到CAP理论、BASE理论CAP理论什么是CAP理论？CAPACID中C与CAP定理中C的区别?CAP理论的三选二的艰难抉择强一致性，弱一致性，最终一致性CA，AP，CP的实践者CAP小结BASE理论BASE理论BASEBASE与ACIDBASE小结CAP理论什么是CAP理论CAP原理是现代
技术杂记【kafka的安装（单机）】半岛码农技术杂记
一、环境配置kafka版本2.11Kafka官网下载地址JDK版本：1.8Zookeeper二、操作过程1、下载Kafka并解压下载:wgethttp://mirrors.hust.edu.cn/apache/kafka/1.1.0/kafka_2.11-1.1.0.tgz解压：tarzxvfkafka_2.11-1.1.0.tgz2、Kafka目录介绍/bin操作kafka的可执行脚本，还包含w
技术杂记 bestscw
阅读更多统计redis连接数echo'clientlist'|/apps/svr/redis/bin/redis-cli-h127.0.0.1-p6379|awk'{print$1}'|awk-F'[=,:]''{print$2}'|sort-n|uniq-c|sort-nrnginx日志分割脚本#!/bin/bash#Thisscriptrunat00:00#TheNginxlogspathlo
Java技术杂记 caib1109 java
本文是临时记录在本子上Java技术的初步整理,一来举一反三,二来练习双拼打字.发现双拼方案里的自然码挺好用的.搜狗双拼方案对单韵母的字采用”o+韵母”,比如”安oj”,“二or”等.自然码则是”安an”,“二er”,符合传统拼音思维.但是,自然码美中不足的是”昂ang”为了兼容双拼2个键出字的规则,强行将a作声母,原本是”ang”的”H”键改为”ng”作韵母.你必须了解的5条关于成员内部类的事my
技术杂记-改造具有监控功能的数据库连接池阿里Druid，支持simple-jndi，kettle 马进举
kettle内置的jndi管理是simple-jndi，功能确实比较简单，我需要监控kettle性能，druid确实是很不错的选择，但没有提供对应的支持，我改进了druid源码，实现了simple-jndi的接口，就可以在simple-jndi/jdbc.properties中配置druid数据源了，通过druid可以得到很多监控数据。具体druid的使用请参考官方教程：https://githu
技术杂记-日期时间字符串解析识别马进举
日期时间的格式可谓千奇百怪，做数据汇集相关项目时就会需要识别各种日期时间格式（因为数据来源广泛不可控），然后转换为标准格式或Date类型。我之前看到同事的一个时间解析方法，当时觉得已经很不错了，后来网上搜索发现这个方法在搜索结果中多次出现，来源就不清楚。我是因项目需要更精确的识别日期时间字符串，于是我慢慢改进原来的方法，以下就是改进后的方法，java语言实现，只要看懂逻辑，应该很容易翻译成其他语言
技术杂记 2015-12-19 alucardzhou
先写杂记Google员工们在进入创业世界的时候需要知道的事情适用于来自福利好的大公司的螺丝钉式的员工。要学会中午自己出去外面买饭吃；要摒弃“只要代码写出来就肯定有至少几千万人用”的思想；勇于让不完美的代码进入代码库；学会做没技术含量的事情。https://medium.com/@andybons/what-xooglers-should-know-when-entering-the-startup
项目技术杂记:20150605 fzyz_sb
1.JS代码的整理表单验证使用插件:validform.min.js封装函数: FuncValidform(id)//验证角色表单 functionFuncValidform(modalName){ $("#"+modalName+"form").Validform({ ajaxPost:true, tiptype:function(msg,o,cssctl){ if(!o.obj.is("for
DirectShow笔记——graphedt.exe崩溃的问题 yaorongzhen123
DirectShow笔记——graphedt.exe崩溃的问题作者：Usher 发布于：2012-12-1510:53Saturday分类：技术杂记在使用graphedt.exe的时候，经常会遇到在insertfilter时，点击directshowfilters后graphedt.exe突然崩溃的问题。之前我的解决方法都是把系统里面装的所有解码器和播放器全部卸载，但是昨天发现这样做之后gr
分词技术杂记 zimohuakai sun
1."切分标志字串"预处理方法是一个毫无必要的技术,它增加了一遍扫描"切分标志词典"的时空复杂性，却并没有提高分词精度，因为所谓的切分标志其实都已经隐含在词典之中，是对词典功能的重复。实际上"切分标志"也没有标记歧义字段的任何信息。2.词性分词一体化：存在词的兼类问题和规则集的确定问题。3.未登录词的介入会引起新的切分歧义，从而使分词系统所面临的形势更加复杂化。SunM.S.andShenD.Y.
H3C技术杂谈 wangpeng1980520 职场 h3c 休闲技术杂记
H3C技术杂记H3C5800系列交换机支持两种类型的无线板卡：LSWM1WCM10(S58大容量无线板卡).LSWM1WCM20(S58低容量无线板卡)H3C7500，7500E系列支持无线业务板，H3C7500系列业务配置时，需要配置交换机对应槽位的端口聚合，而S75E，S95，S95E无线板卡，则不需要配置交换
WIN技术杂记-小技巧 forever1209 技术职场 Win 休闲
IIS默认的存储路径是%systemroot%system32inetsrvmetaback。且备份只能本机使用；==============================================================“快速启动”栏中的“显示桌面”按钮不同于一般的快捷方式。如果不小心删除了“显示桌面”按钮，那么按照一般的方法是不能够恢复的。要恢复“快速启动”栏中的“显示桌面”按
WIN技术杂记-小技巧 forever1209 职场技术 WIN 技术杂记
IIS默认的存储路径是%systemroot%system32inetsrvmetaback。且备份只能本机使用；==============================================================“快速启动”栏中的“显示桌面”按钮不同于一般的快捷方式。如果不小心删除了“显示桌面”按钮，那么按照一般的方法是不能够恢复的。要恢复“快速启动”栏中的“显示桌面”按
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

【Kaggle实战】泰坦尼克号生存人数预测（从零到提交到Kaggle再到模型的保存与恢复）

你可能感兴趣的:(技术杂记)