解决pytorch rnn 变长输入序列的问题

pytorch实现变长输入的rnn分类

输入数据是长度不固定的序列数据，主要讲解两个部分

1、Data.DataLoader的collate_fn用法，以及按batch进行padding数据

2、pack_padded_sequence和pad_packed_sequence来处理变长序列

collate_fn

Dataloader的collate_fn参数，定义数据处理和合并成batch的方式。

由于pack_padded_sequence用到的tensor必须按照长度从大到小排过序的，所以在Collate_fn中，需要完成两件事，一是把当前batch的样本按照当前batch最大长度进行padding，二是将padding后的数据从大到小进行排序。

def pad_tensor(vec, pad):
    """
    args:
        vec - tensor to pad
        pad - the size to pad to
    return:
        a new tensor padded to 'pad'
    """
    return torch.cat([vec, torch.zeros(pad - len(vec), dtype=torch.float)], dim=0).data.numpy()
class Collate:
    """
    a variant of callate_fn that pads according to the longest sequence in
    a batch of sequences
    """
    def __init__(self):
        pass
    def _collate(self, batch):
        """
        args:
            batch - list of (tensor, label)
        reutrn:
            xs - a tensor of all examples in 'batch' before padding like:
                '''
                [tensor([1,2,3,4]),
                 tensor([1,2]),
                 tensor([1,2,3,4,5])]
                '''
            ys - a LongTensor of all labels in batch like:
                '''
                [1,0,1]
                '''
        """
        xs = [torch.FloatTensor(v[0]) for v in batch]
        ys = torch.LongTensor([v[1] for v in batch])
        # 获得每个样本的序列长度
        seq_lengths = torch.LongTensor([v for v in map(len, xs)])
        max_len = max([len(v) for v in xs])
        # 每个样本都padding到当前batch的最大长度
        xs = torch.FloatTensor([pad_tensor(v, max_len) for v in xs])
        # 把xs和ys按照序列长度从大到小排序
        seq_lengths, perm_idx = seq_lengths.sort(0, descending=True)
        xs = xs[perm_idx]
        ys = ys[perm_idx]
        return xs, seq_lengths, ys
    def __call__(self, batch):
        return self._collate(batch)

定义完collate类以后，在DataLoader中直接使用

train_data = Data.DataLoader(dataset=train_dataset, batch_size=32, num_workers=0, collate_fn=Collate())

torch.nn.utils.rnn.pack_padded_sequence()

pack_padded_sequence将一个填充过的变长序列压紧。输入参数包括

input（Variable）- 被填充过后的变长序列组成的batch data

lengths (list[int]) - 变长序列的原始序列长度

batch_first (bool,optional) - 如果是True,input的形状应该是(batch_size,seq_len,input_size)

返回值：一个PackedSequence对象，可以直接作为rnn，lstm，gru的传入数据。

用法：

from torch.nn.utils.rnn import pack_padded_sequence, pad_packed_sequence
# x是填充过后的batch数据，seq_lengths是每个样本的序列长度
packed_input = pack_padded_sequence(x, seq_lengths, batch_first=True)

RNN模型

定义了一个单向的LSTM模型，因为处理的是变长序列，forward函数传入的值是一个PackedSequence对象，返回值也是一个PackedSequence对象

class Model(nn.Module):
    def __init__(self, in_size, hid_size, n_layer, drop=0.1, bi=False):
        super(Model, self).__init__()
        self.lstm = nn.LSTM(input_size=in_size,
                            hidden_size=hid_size,
                            num_layers=n_layer,
                            batch_first=True,
                            dropout=drop,
                            bidirectional=bi)
        # 分类类别数目为2
        self.fc = nn.Linear(in_features=hid_size, out_features=2)
    def forward(self, x):
        '''
        :param x: 变长序列时，x是一个PackedSequence对象
        :return: PackedSequence对象
        '''
        # lstm_out: tensor of shape (batch, seq_len, num_directions * hidden_size)
        lstm_out, _ = self.lstm(x)  
        
        return lstm_out
model = Model()
lstm_out = model(packed_input)

torch.nn.utils.rnn.pad_packed_sequence()

这个操作和pack_padded_sequence()是相反的，把压紧的序列再填充回来。因为前面提到的LSTM模型传入和返回的都是PackedSequence对象，所以我们如果想要把返回的PackedSequence对象转换回Tensor，就需要用到pad_packed_sequence函数。

参数说明：

sequence (PackedSequence) – 将要被填充的 batch

batch_first (bool, optional) – 如果为True，返回的数据的形状为(batch_size,seq_len,input_size)

返回值: 一个tuple，包含被填充后的序列，和batch中序列的长度列表。

用法：

# 此处lstm_out是一个PackedSequence对象
output, _ = pad_packed_sequence(lstm_out)

返回的output是一个形状为(batch_size,seq_len,input_size)的tensor。

总结

1、pytorch在自定义dataset时，可以在DataLoader的collate_fn参数中定义对数据的变换，操作以及合成batch的方式。

2、处理变长rnn问题时，通过pack_padded_sequence()将填充的batch数据转换成PackedSequence对象，直接传入rnn模型中。通过pad_packed_sequence()来将rnn模型输出的PackedSequence对象转换回相应的Tensor。

补充：pytorch实现不定长输入的RNN / LSTM / GRU

情景描述

As we all know，RNN循环神经网络（及其改进模型LSTM、GRU）可以处理序列的顺序信息，如人类自然语言。但是在实际场景中，我们常常向模型输入一个批次（batch）的数据，这个批次中的每个序列往往不是等长的。

pytorch提供的模型（nn.RNN,nn.LSTM,nn.GRU）是支持可变长序列的处理的，但条件是传入的数据必须按序列长度排序。本文针对以下两种场景提出解决方法。

1、每个样本只有一个序列：(seq,label)，其中seq是一个长度不定的序列。则使用pytorch训练时，我们将按列把一个批次的数据输入网络，seq这一列的形状就是(batch_size, seq_len)，经过编码层（如word2vec）之后的形状是(batch_size, seq_len, emb_size)。

2、情况1的拓展：每个样本有两个（或多个）序列，如(seq1, seq2, label)。这种样本形式在问答系统、推荐系统多见。

通用解决方案

定义ImprovedRnn类。与nn.RNN,nn.LSTM,nn.GRU相比，除了此两点【①forward函数多一个参数lengths表示每个seq的长度】【②初始化函数(__init__)第一个参数module必须指定三者之一】外，使用方法完全相同。

import torch
from torch import nn
class ImprovedRnn(nn.Module):
    def __init__(self, module, *args, **kwargs):
        assert module in (nn.RNN, nn.LSTM, nn.GRU)
        super().__init__()
        self.module = module(*args, **kwargs)
    def forward(self, input, lengths):  # input shape(batch_size, seq_len, input_size)
        if not hasattr(self, '_flattened'):
            self.module.flatten_parameters()
            setattr(self, '_flattened', True)
        max_len = input.shape[1]
        # enforce_sorted=False则自动按lengths排序，并且返回值package.unsorted_indices可用于恢复原顺序
        package = nn.utils.rnn.pack_padded_sequence(input, lengths.cpu(), batch_first=self.module.batch_first, enforce_sorted=False)
        result, hidden = self.module(package)
        # total_length参数一般不需要，因为lengths列表中一般含最大值。但分布式训练时是将一个batch切分了，故一定要有！
        result, lens = nn.utils.rnn.pad_packed_sequence(result, batch_first=self.module.batch_first, total_length=max_len)
        return result[package.unsorted_indices], hidden  # output shape(batch_size, seq_len, rnn_hidden_size)

使用示例：

class TestNet(nn.Module):
    def __init__(self, word_emb, gru_in, gru_out):
        super().__init__()
        self.encode = nn.Embedding.from_pretrained(torch.Tensor(word_emb))
        self.rnn = ImprovedRnn(nn.RNN, input_size=gru_in, hidden_size=gru_out,
		        				batch_first=True, bidirectional=True)
    def forward(self, seq1, seq1_lengths, seq2, seq2_lengths):
        seq1_emb = self.encode(seq1)
        seq2_emb = self.encode(seq2)
        rnn1, hn = self.rnn(seq1_emb, seq1_lengths)
        rnn2, hn = self.rnn(seq2_emb, seq2_lengths)
        """
        此处略去rnn1和rnn2的后续计算，当前网络最后计算结果记为prediction
        """
        return prediction

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

开心上学的第二天离嚣净心
今天是儿子上幼儿园的第二天，看到老师发的小视频，发现儿子根本不在状态，目光游离，老师说或者跳，在他眼里，似乎都和他无关，只是呆呆地，木木地，在做着自己的事情……不过好歹，自己愿意去上学了，觉得幼儿园有小朋友，有玩具，挺好的，想起前半年让他上学时情景，第一天在他毫不知情或者说一不留神的情况下，我和他爸都悄悄溜走了，回来后，又都不放心，多次询问老师情况，老师说哭了几次，心里有点不忍……第二天，想着要不
初见：冬天开的猫印象繁星月影
跟随着八月的雨的足迹，邂逅了一只优秀博学的猫。于辛丑年甲午月壬辰日晚，与友冬天开的猫初见，缘于友八月的雨文理解是一门艺术中的评论。由于这段对话，我也很好奇啊，于是我也去见识见识这脑洞大开想象力丰富的人儿，悄悄的关注一下，向优秀的友学习，打算悄悄的去膜拜友的文。猫姐姐，在这看不出年龄距离，看大家都这样称呼，感觉比较亲切。之前猫的签名“你好，我这有些故事”，正好我也是喜欢看故事的人，喜欢听故事。后来签
使用Python实现的Excel像素画
简介：本项目主要使用python语言，将图片转为Excel，图片中的每一个像素转化为Excel中的每一个单元格。主要使用pillow和xlsxwriter这两个模块。项目使用一个python文件即可。一：项目功能和流程介绍项目的主要功能：就是将一张人脸图像，画在Excel表格上，图片的每一个像素点对应Excel的一个格子，俗称像素画。流程：创建Excel表，并设置行高和列宽打开图片遍历图片每一个像
【Lua】闭包可能会导致的变量问题
先思考下面这个问题：localfunctioncounter()localcount=0returnfunction()count=count+1returncountendendlocala=counter()localb=counter()print(a())-->?print(a())-->?print(b())-->?print(a())-->?输出结果：print(a())-->1pri
20190305【每日阅读】宁向东管理学课007讲：认知不协调｜改变他人态度的秘诀素SU然
2019年3月5日周二早安天气：7℃-11℃悦读开启美好的一天宁向东的管理学课007讲：认知不协调｜改变他人态度的秘诀不一定靠改变认知才能改变行为其实先改变行为，也可以反过来改变认知。
“去接受一些你不了解的东西，去争取，去相信自己可以改变一些事情。” 紫贝0可儿
《一个人的朝圣》是英国资深剧作家乔伊斯.蕾秋的小说处女作，该书曾荣获2012年英国最佳小说新人奖。这是讲主人公哈罗德千里跋涉的故事。书中的主人公哈罗德.弗莱，六十岁，在酿酒厂干了四十年销售代表后默默退休，没有升迁，既无朋友，也无敌人，退休时公司甚至连欢送会都没开。他跟妻子住在英国的乡间，生活平淡无奇，夫妻疏离，日复一日，一封来自二十年未见的老友奎妮的来信打破了所有的平静，奎妮因为癌症不久将离人世。
@57号 D9 自省日 Magic_Sheryl
重大成就：申请成功去到公司总部成功经验：1.找到信任的合作搭档，JC和KX的执行和策划，参演同事们的给力；2.坚持，熬到第五个深夜已经到达极限，但JC依然坚持与我一起，不断鼓励我，以实际行动支持我；3.有梦想，敢于承认和抓住机会，敢于说：对！我渴望去！4.平时的人际积累，大家选你，很大一部分来源于看到每一个日常的你是怎样的，所以珍视每一件小事；5.每临大事必有静气。失败事件：转分拨中心，订单出现潜
mpiigaze的安装过程一匆匆整棹还 python
mpiigaze链接mpiigaze应该不是作者本人写的，而是社区工作者的杰作，对原论文Appearance-BasedGazeEstimationintheWild的代码进行的一些复现1.创建conda环境2.问题Buildingwheelsforcollectedpackages:dlibBuildingwheelfordlib(pyproject.toml)...errorerror:sub
如何变穷 olissa
不知道大家有没有听说过股神巴菲特有一个合作几十年的好搭档，非常有名也是我的偶像之一，他叫查理芒格，《穷查理宝典》是我的床头书，大家有兴趣也可以买来看看。他的投资理念影响了很多人，他曾经讲过两个非常有名的小故事。一个就是叫做关于乡下人的故事，他说如果我知道我在哪里死去，我一定不会再去那个地方。第二个故事是说，如果我想帮助某个国家，比喻印度，我应该怎么帮助他呢，我会先考虑什么办法会杀了它、害它。而我只
“还未结婚，就已当妈”——二胎政策放开后，衍生的矛盾微光片断
愿我的故事细水长流，敬你的孤独择日而终。关注微光，看尽人生百态姐弟俩的年龄差，竟然有17岁昨天看到出了一个让人哭笑不得的热搜，姐姐看管太严，以致于弟弟哭着向派出所求助。原来，在5月9日山东济宁，一名10岁的小男孩哭着走进派出所，想让民警送自己回家，哭得止也止不住，只是不停重复“不愿再住姐姐家”。在民警打算联系家人的时候，刚好有个神色慌张的女子来到派出所，原来这位27岁的女子就是小男孩的姐姐。小男孩
春天的期盼1 sky信仰之名
“喂！死陈雨，不打死你老娘就不姓夏！”夏蓝瞪大了眼睛，追着陈雨一顿揍。“喂喂喂，打人不打脸啊！”陈雨哭丧着一张脸说“我的face啊！你知不知道，我的这张face可是全天下Numberone，打伤你赔得起吗？”夏蓝对着他的腿猛踢，说：“你给我说清楚了，我家TFBOYS哪里丑？说！”陈雨招架不住夏蓝的“洪荒之力”，说：“行行行，TFBOYS最帅了，帅到爆，帅到无法无天了行吧？”“这还差不多。”夏蓝拍拍
全面掌握PDF编辑：使用Foxit PDF Editor 22.1.1102 IBEANI
本文还有配套的精品资源，点击获取简介：FoxitPDFEditor22.1.1102是一款专业的PDF编辑工具，专为编辑、修改和创建PDF文档而设计。拥有直观的用户界面，使得用户即使技术不熟练也能轻松上手。它提供文本编辑、图像处理、页面管理、注释与标记、表单填写与创建、安全设置、批注工具、合并与分割、转换功能和OCR识别等核心功能。软件还支持自定义工具栏，提高工作效率。为保障数据安全和个人隐私，用
《离婚后，我被小狼狗老公宠上天》叶澜（言情txt小说）全文免费阅读九月文楼
《离婚后，我被小狼狗老公宠上天》叶澜（言情txt小说）全文免费阅读主角：叶澜简介：亲眼见到自己老公搂着别的女人进酒店是什么滋味？以前的叶澜会很自信地说，这种事情是绝不会出现在她和陈宁远之间的。关注微信公众号【寒风书楼】去回个书号【97】，即可阅读【离婚后，我被小狼狗老公宠上天】小说全文！亲眼见到自己老公搂着别的女人进酒店是什么滋味？以前的叶澜会很自信地说，这种事情是绝不会出现在她和陈宁远之间的。可
双休日兼职有哪些好推荐？(周末兼职推荐) 幸运副业
双休日兼职有哪些好推荐？(周末兼职推荐)随着工作生活的压力增加，越来越多的人开始寻找双休日兼职的机会，既能增加收入，又不影响正常工作。本文将为您介绍一些双休日兼职的好推荐，并在文章末尾简要介绍一款便捷的兼职平台——多职猫兼职平台。推荐一篇找兼职必看的免费教程：《手机兼职，300-500/天，一单一结，大量要人》在这里可以找到各种句子摘抄兼职，视频编辑员兼职，手机截图兼职等适合大家的岗位。1.服务行
想家里的唠唠叨叨了小城聆听夜雨
上一次在家和父母一起过年是2013年吧，想来是有点太久远了，都快忘记了过年的味道了，但是永远忘不了了一家人凑在一起吃饭的场景，很怀念父亲把肉的肥的部分他自己吃，把瘦的部分夹给我吃的样子，我不爱吃肥的部分，父亲一直记在心里。记得有一次过年我做的红烧鱼味道太浓了，以至于没了鱼的鲜香味，父亲尝了一口，给我讲了个一个道理，他说：“孩子，做人做事都是一个道理，就拿你做的这盘红烧鱼来说吧，鱼本质鲜美，即便是你
日精进109天金八力韩英雪
敬爱的老师，智慧的班主任，亲爱的跃友们：大家好！我是来自山峰教外教育的韩英雪，今天是我的日精进行动第109天，给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1、比学习:教育的人口功能:一，减少人口数量，控制人口增长。二，改善人口素质提高人口质量。三是人口结构趋向合理化。四有利于人口迁移。社会政治经济制度对教育的影响和制约，决定教育的领导权，决定受教育权决定教育目的
k8s包管理器helm_K8S集群 Helm 包管理 weixin_39872893 k8s包管理器helm
Helm是一个Kubernetes的包管理工具，就像Linux下的包管理器，如yum/apt等，可以很方便的将之前打包好的yaml文件部署到kubernetes上。k8s之前部署要写很多的yaml文件，大型应用部署起来比较麻烦，于是helm就出现了。Helm有两个重要概念：helm：一个命令行客户端工具，主要用于Kubernetes应用chart的创建、打包、发布和管理。Chart：应用描述，一系
日有所思：开控辍保学会议有感（NO.323,周一，晴）田园花开
今天下午有个紧急套会在德润小学召开，会议的主题是城区“义务教育控辍保学联席会暨责任督学聘任仪式”。教育局局长和新任的常务区长先后作了发言，从他们的发言中我大致了解了城区控辍保学工作情况和存在问题。控辍保学是一项艰巨而又光荣的任务，特别是我区两镇的老师，经常假期也不休息，走家串户，反反复复做工作可能才能把这些辍学的孩子重新请回教室。如果每一个学生都是因为家贫而辍学的，都能像希望工程标志“大眼睛”苏明
中原焦点团队焦点解决网初18中20张红勋坚持分享第528天约练第202次2021年7月24日读书打卡第428天啊哈d9387b66a3dc
今天是六月十五中元节，相公说中午家人都去公公那边吃饭，去就去呗，只是孩子们要下午才能回来。相公一大早去买菜，我也睡不着了，干脆起来约练，正好有个有个来访者的位置，赶紧加入。没有及时沟通，个人站在和人的思路预想着自己的旅行，所以很有情绪。都有情绪，你怼我，我再怼回去，一次比一次严重，结果是更深的伤害。“总是怎么怎么样……”这句话似曾相识，孩子说这个的时候我很生气，实际上不知不觉中我也说了很多次。有情
2020年不一样的春节王小根
2020年鼠年春节，注定会让人记忆深刻，它是我陪伴父母时间最长的春节，它是我陪伴妻子孩子时间最长的春节，它是全家人呆在一起时间最长的春节。它是不需要拜年的春节，它是妻子最想要的春节，它是花钱最少的春节。只因2019-ncov病毒引起的肺炎快速传染，需要家人不出门、少出门。希望尽早结束疫情，同胞们身体健康，祖国继续繁荣昌盛！
这不是我想要的生活——创业失败的那些故事姗爷SG
写这些文字的时候是属于事业的低潮期，白手起家，创立自己的媒体，到媒体下的第三产业建立，在很多人眼里，我是能力超强的大姐大，而实际上，我只想把我的失败讲给你听，只希望和我一样有梦想的人，错过那些失败...比我成功...珊爷的创业故事...明天五分钟写给自己，也写给比我成功的你.
python高并发web框架_Python3中tornado高并发框架 weixin_39788969 python高并发web框架
1.单线程tornado.web：基础web框架模块tornado.ioloop：核心IO循环模块，高效的基础。封装了:1.asyncio协程，异步处理2.epoll模型：水平触发（状态改变就询问，select(),poll()），边缘触发（一直询问，epoll()）3.poll模型：I/O多路复用技术4.BSD（UNIX操作系统中的一个分支的总称）的kqueue（kueue是在UNIX上比较高效
孩子好心情2丶0
刚刚看了宝妈的短文《你想让孩子成为什么样的人，你就先成为什么样子的人》心深感动，影响最深的一段就是保持微笑，生活是一面镜子，你笑他就笑你哭他就哭........图片发自App儿子百日冲刺这几天完全没有进入状态，手机不离身，每天上QQ聊天，还玩游戏，最可恶的事今天偷偷地烫头发了……在以前我肯定会大发雷霆，可是我一直在自我控制自己，心里默念不生气，少说话，我只是弱弱的问了他一句：“你觉得你今天的事做的
基于python的文字识别系统_基于Python的图片文本识别系统的研究 weixin_39683368 基于python的文字识别系统
龙源期刊网http://www.qikan.com.cn基于Python的图片文本识别系统的研究作者：韩琳来源：《科学与财富》2019年第20期近年来随着计算机技术的不断发展，OpticalCharacterRecognition（光学字符识别，简称“OCR”）应用的领域更加的广泛，而图片文字识别就是其中重要的一个。目前图片文字识别的准确率并没有达到100%，这也成为了图片文字识别发展领域的一大瓶
复古1.76三职业传奇手游有哪些好玩怀旧1.76版本三职业传奇手游排行榜2023 会飞滴鱼儿
现在的传奇手游可谓五花八门，不管是动漫风，还是古风，现代等等...，基本都可以搜罗出大量的游戏，不过对于传奇大家既喜欢，也惧怕，因为无论怎么说喜欢传奇的都是8090这一代的玩家，传奇在那个年代就是游戏产业的标杆，不过随着近些年制作传奇手游的门槛变低之后，越来越多的传奇冒头出来，也导致越来越氪金，平民玩家都大喊“玩不起”！不过这两年出现了很多传奇内部号的事件，也导致很多传奇玩家惧怕和渴望毕竟这类账号
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
离开手机第一天鲜栗子
2019年3月28日晴这是完整的第一天手机被搁置于两三米远无法知晓人们的笑颜衬的壹玖年的春天如何绚烂这个第一天的远离有一点孤单在向世界宣言我只关注着自己内在深奥的世界无限空窘填充进去的无数关联竟然从未注满平实和浅显越来越无界限的天和地嘲笑我被桎梏于小寸屏幕之趣里接下来无以计数的时间我无奈的我开启陌生的旅程又是探险若真的就此消失记得在你手边用笔写下自己都不认识的祝愿
萤火之光 xiaohui806
"能做事的做事，能发声的发声，有一分热，发一分光，就像萤火一般，也可以在黑暗里发一点光，不必等候炬火。"今日看到鲁迅先生的这段文字，回想过去的岁月，谁是照亮我前行的光芒？我又能成为照亮谁的萤火之光？年复一年，日复一日，什么才是生命中最该做好的事？图片发自App
centos linux lvm分区,linux CentOS/redhat 6.5 LVM分区使用详解文韬菌 centos linux lvm分区
1,介绍LVM是逻辑盘卷管理(LogicalVolumeManager)的简称，它是Linux环境下对磁盘分区进行管理的一种机制，LVM是建立在硬盘和分区之上的一个逻辑层，来提高磁盘分LVM区管理的灵活性。前面谈到，LVM是在磁盘分区和文件系统之间添加的一个逻辑层，来为文件系统屏蔽下层磁盘分区布局，提供一个抽象的盘卷，在盘卷上建立文件系统。物理卷(physicalvolume)物理卷就是指硬盘分区
Spring源码之扫描器(AnnotatedBeanDefinitionReader和ClassPathBeanDefinitionScanner)(三) 夜半听风醉 Spring源码专题
前言Spring容器加载Bean定义信息的两个扫描器:AnnotatedBeanDefinitionReader和ClassPathBeanDefinitionScanner*从命名来看，前者是读取注解声明的bean的定义信息;后者是读取xml声明的bean的定义信息本文将详细介绍这两个扫描器的初始化过程1.准备工作1.初始化一个spring容器对象2.断点调试，跟踪查看扫描器的初始化过程2.源码
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他