Aixoum

Bootstrap重采样实战

0x00 What is Bootstrap
0x01 Why Bootstrap
0x02 Show Code
0x03 Key Notes
0x04 Reference

0x00 What is Bootstrap

友情提示（因为是实战嘛，直译就是自己实现，引用几乎没有介绍就是应付凑章节的可跳）。首先统计学中的Bootstrap就是一种获得样本的抽样方法。Bootstrap的一般的抽样方式就是“有放回地全抽”。一次性全量获取数据来训练模型或抽样那么我们就只能得到一个模型或一个分布结果。但是多次“有放回地全抽“那么就可以得到多个模型和分布结果。这样多个模型结果可以更好的实现评估，削弱过拟合的影响。多个分布结果可以帮助我们观察样本本身的分布是否均匀。

0x01 Why Bootstrap

其实Why上面也已经说到了，为了对所有采样结果有更丰富的认知。机器学习上为了对单一训练数据集生成更多模型更好获得可泛化的模型。稍微多说说在机器学习上的影响。在集成学习（Ensemble learning）的范畴里 Bootstrap直接派生出了Bagging模型。其它方法或多或少都涉及重采样，只是在重新获取满足什么标准的数据上做文章。Boosting思想的核心虽然并非重采样，根据模型结果再次采样运算也是不可或缺。Stacking则是应用了不同采样集合和不同模型的排列组合。而Adaboost这种集成学习法已经在神经网络的梯度下降过程中有了广泛应用。

0x02 Show Code

逼逼那么多，毕竟是实战，代码才是重点。注释都在里面了。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 18 14:52:49 2019

@author: aixoum
"""
import time
import os
import sys
import itertools

# package path
sys.path.append("/")

import pandas
import random
from collections import Counter


# a function to help use get the in group and out group index out of realidx
def myboot(df, iter_num, iter_group_num):
    # const_iter_num = iter_num
    in_month_list = []
    out_month_list = []
    
    print("start bootstrap sample iteration-------------------------------------")
    while iter_num > 0:
        # get random group idexes according to iter_group_num
        # month index number double group number
        group_idx = random.sample(range(0,df.shape[0]//2), iter_group_num)
        month_idx = df[df.realidx.isin(group_idx)].index.tolist()
       
       
        # select in_group month indexes from random group idexes
        idx = 0
        walk = random.randint(0,1)
        in_month_idx = []
        
        # use a window to traverse the list
        for i in range(len(month_idx)//2):
            in_month_idx.append(month_idx[idx+walk])
            walk = random.randint(0,1)
            idx += 2
            
        assert len(in_month_idx) == iter_group_num
        
        # select out_group month indexes from random group idexes
        out_month_idx = list(set(month_idx).difference(set(in_month_idx)))
        
        # list to receive all idex
        in_month_list.extend(in_month_idx)
        out_month_list.extend(out_month_idx)
        
        # print("now it is round: %s" % str(const_iter_num-iter_num + 1))
        iter_num -= 1
    
    print("end iteration")
        
    return in_month_list, out_month_list



def calculate(index_list,df,filed_list,sample_num):
    def mean_count(index_count_map, df, filed, sample_num):
        sum_up = 0
        for k in index_count_map:
            sum_up += df[filed][k]*index_count_map[k]
        
        mean_num = sum_up/sample_num
        return mean_num
    
    def median_count(index_count_map, df, filed, sample_num):
        new_map = {}
        
        for k in index_count_map:
            new_map[df[filed][k]]=index_count_map[k]
            
        sort_map=dict(sorted(new_map.items(),key=lambda x:x[0]))
        median_idx = sample_num//2
        
        index_count = 0
        idx = 0
        for k in sort_map.keys():
            index_count += sort_map[k]
            idx += 1
            median_num_left = k
            
            if index_count >= median_idx:
                break
            
        median_num_right = list(sort_map.keys())[idx]
        return (median_num_left + median_num_right)/2
    
    def std_count(index_count_map, df, filed, sample_num, mean):
        new_map = {}
        
        for k in index_count_map:
            new_map[df[filed][k]]=index_count_map[k]
        
        variance = 0
        for num in new_map:
            variance += (num - mean) ** 2 *new_map[num]
        
        variance /= sample_num
        std = variance ** 0.5
        return std
    
    index_count_map = Counter(index_list)

    res_mean = 0
    res_median = 0
    res_std = 0

    for field in field_list:
        res_mean += mean_count(index_count_map, df, field,sample_num)
        res_median += median_count(index_count_map, df, field, sample_num)
        res_std = std_count(index_count_map, df, field, sample_num, res_median)
    
    
    return res_mean, res_median, res_std

if __name__ == "__main__":
    start=time.time()
    print("start to run program ==============================================")
    # change the path to your own directory
    
    os.chdir("/")
    path = sys.argv[3]
    df = pandas.read_excel(path)
    
    # display the head of the data
    # df.head()
    # shape of data
    print("load data %s" % path)

    print("the shape of data is %s * %s" % (str(df.shape[0]),str(df.shape[1])))
    
    print("recreate index for the data")
    # create new index
    real_idx = [[i]*2 for i in range(df.shape[0]//2)]
    real_idx = [i for y in real_idx for i in y]
    df["realidx"] = real_idx
    field_list = list(df.columns)

    # get iteration and combinations
    field_list_combs = [ itertools.combinations(field_list,i) for i in range(1, len(field_list))]
    field_list_combs = [list(i) for y in field_list_combs for i in y]
    # idx_set = list(set(df.realidx))
    
    """
    @params:
        df:DataFrame the data file
        sys.argv[1]:String iteration number
        sys.argv[2]:String sample number
    """
    iter_num = int(sys.argv[1])
    iter_group_num = int(sys.argv[2])
    in_month_list, out_month_list = myboot(df, iter_num, iter_group_num)
    all_list = df.index.tolist()
    sample_num = iter_num * iter_group_num

    with open("res.csv", "a") as f:
        # this is csv head
        f.write("filed_combinations\tin_group_mean\tin_group_median\tin_group_std\t")
        f.write("out_group_mean\tout_group_median\tout_group_std\t")
        f.write("all_group_mean\tall_group_median\tall_group_std\t\n")

        while field_list_combs != []:
            field_list = field_list_combs.pop()
            in_mean, in_median, in_std = calculate(in_month_list,df,field_list,sample_num) 
            out_mean, out_median, out_std = calculate(out_month_list,df,field_list,sample_num)
            mean, median, std = calculate(all_list,df,field_list,df.shape[0])
            
            print("for field %s------------------------------------------------" % " ".join(field_list))
            print("for in_group samples:")
            print("the mean is %s\nthe median is %s\nthe std is %s\n" % (str(in_mean), str(in_median), str(in_std)))
            print("for out_group samples:")
            print("the mean is %s\nthe median is %s\nthe std is %s\n" % (str(out_mean), str(out_median), str(out_std)))
            print("for all samples:")
            print("the mean is %s\nthe median is %s\nthe std is %s\n" % (str(mean), str(median), str(std)))
            
            f.write(" ".join(field_list)+"\t")

            f.write(str(in_mean)+"\t")
            f.write(str(in_median)+"\t")
            f.write(str(in_std)+"\t")

            f.write(str(out_mean)+"\t")
            f.write(str(out_median)+"\t")
            f.write(str(out_std)+"\t")

            
            f.write(str(mean)+"\t")
            f.write(str(median)+"\t")
            f.write(str(std)+"\n")

        end=time.time()
    
    print('======================================running time: %s seconds'%(end-start))

0x03 Key Notes

分组列
这个Bootstrap的需求方（匿名）要求每次都是从分好组的数据里先选分组，选分组是用Bootstrap的。然后再选出的分组中抽一半入“in_group"另一半’'out_group"。但是原始表execel里面是把同为一组的索引都合一起了，完全不能用。又因为每组已经排好序，每组里面2条样本，所以我手动生成了新索引。第二行比较迷，是为了压平嵌套的，从右到左逻辑。也就是说4条数据会有2个索引，两组数据{0,1},{2,3}。

    real_idx = [[i]*2 for i in range(df.shape[0]//2)]
    real_idx = [i for y in real_idx for i in y]
    df["realidx"] = real_idx

列的排列组合
需求方还要求最终所求均值，中位数，方差来自所有列组合后的结果。比如有列A，列B，列C。要算6种情况(A),(B),©,(AC),(BA),(BC),(ABC)的求均值，中位数，方差。由于数据都做完了正则归一，这样是可行的。比如(A,B)。A=[1,3,4],B=[2,3,4]那么就要把A和B Stack起来成为(A,B)=[1,3,4,2,3,4]求均值，中位数，方差。为了实现这个只能先抽取列名排列组合。依旧是python看起来很骚的嵌套。这个建议想用的话在程序入口加入boolean选择。field_list_combs = field_list就是仅有全列都参与运算的正常操作。

 field_list = list(df.columns)
 # get iteration and combinations
 field_list_combs = [ itertools.combinations(field_list,i) for i in range(1, len(field_list))]
 field_list_combs = [list(i) for y in field_list_combs for i in y]

采样
直接使用random包就可以做到有放回的重采样，获取相应数量的样本。但是要做到相对高效得对于样本根据分组再次随机分组，就要使用一些方法。这里我采取了一种动态窗口平移（随口说的）覆盖所有可能性区间，对每个组获得‘in_group“ 和“out_group“值的方法。简单说就是先对外在分组排序A,B,C，这个我的原数据已经做好了。每组两个值。

Expression1：List1 = {A:[0,1],B:[0,1],C[0,1]}

再加上局部索引对应的原始索引[0,1,2,3,4,5]就是。

Expression2：List2 = {A:[[0[0] 1[2]],B:[0[2],1[3]],C[0[4],1[5]]}

切换成为二维数组就是下面这样A,B.C对应0,1,2。所以要实现的话肯定就是双指针啦。

Expression3：List3 = [[0,1][2,3][4,5]]

[0,1,2,3]中第一个索引值0对应就是

List3[0][0]

原始索引我需要从做到右位移三次扫描覆盖所有的分组。每次位移在当下可能性区间[0,1]中取一个值然后移动到下一个区间。回到Expression1再break down。假设Idex 数组是我们回收索引值的数组。

运算开始
->>>Start
->>>>>>>>位置A:可能性区间[0,1] 随机取0
->>>>>>>>>>>Index[0] = List3[0][0] = 0
->>>>>>>>>>>>>>>位置B:可能性区间[0,1] 随机取0
->>>>>>>>>>>>>>>>>>>>> Index[1] = List3[0][0] = 2
->>>>>>>>>>>>>>>>>>>>>>>>>>位置C:可能性区间[0,1]随机取1
->>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> Index[2] = List3[0][1] = 6

那么ingroup局部索引就是[0,0,1]
对应全局索引就是[0,2,6]
在实现的过程中是需要一个指针进行全局位置标识另一个进行局部位置标示的。但是从上面拿个随手写的运行图可以看出时间和空间成本都压缩的比较低。全局位置标识是idx，步长是2位移，因为客户就是2个样本一组。walk决定[0,1]随机数, 也就是局部位置标示。

# select in_group month indexes from random group idexes
idx = 0
walk = random.randint(0,1)
in_month_idx = []

# use a window to traverse the list
for i in range(len(month_idx)//2):
	in_month_idx.append(month_idx[idx+walk])
	walk = random.randint(0,1)
	idx += 2

计算
为了做迭代提高效率啥的没有使用numpy接口做运算。而且前面bootstrap采样只采int64的索引，也更节省空间。并且接口可以适应一列或者多列的结果。重复值多的时候转成new_map字典记录会对内存友好很多。

def median_count(index_count_map, df, filed, sample_num):
        new_map = {}
        
        for k in index_count_map:
            new_map[df[filed][k]]=index_count_map[k]
            
        sort_map=dict(sorted(new_map.items(),key=lambda x:x[0]))
        median_idx = sample_num//2
        
        index_count = 0
        idx = 0
        for k in sort_map.keys():
            index_count += sort_map[k]
            idx += 1
            median_num_left = k
            
            if index_count >= median_idx:
                break
            
        median_num_right = list(sort_map.keys())[idx]
        return (median_num_left + median_num_right)/2

0x04 Reference

空缺，真的没有比这更干的货了。这篇文章里面的内容和代码除了词语和关键字是引用，其余都是风干。代码是帮别人写的，不知道会不会查重。使用请标注。

【技巧分享】开发环境配置Python、R、Stata A线上仓库 python 开发语言
自用，看心情更新~版本更新2024-03-131.0版本2024-09-25FIX:1.conda命令ADD：1.python调用r命令2.r系统配置2025-01-22更新VSCode调用Statado文件目录版本更新Python环境配置Cheatsheet基础配置可选：环境配置：conda命令包管理R环境配置基础配置R命令Python调用Method1:`rpy2`Stata环境配置基础配置P
python实现成语接龙 Camellia 泡泡笔记 python
first_idiom='万事如意'end_str=first_idiom[-1]new_li=[first_idiom]li=['发愤图强','笑容满面','意气风发','强颜欢笑']forindexinrange(len(li)):foriinli:ifend_str==i[0]:new_li.append(i)li.remove(i)end_str=i[-1]breakprint(new_l
探索TriCore架构：AURIX芯片的强大内核裴辰垚Simone
探索TriCore架构：AURIX芯片的强大内核g_tricore_architecture项目地址:https://gitcode.com/gh_mirrors/gt/g_tricore_architecture项目介绍TriCore架构是英飞凌（Infineon）公司开发的一种高性能、低功耗的嵌入式处理器架构，广泛应用于汽车电子、工业控制和消费电子等领域。AURIX系列芯片是基于TriCore
涛哥聊Python | borb，一个好用的 Python 库，处理 PDF 文件好帮手！双木的木 python拓展学习 python库 python 开发语言机器学习 pdf 人工智能深度学习
本文来源公众号“涛哥聊Python”，仅用于学术分享，侵权删，干货满满。原文链接：borb，一个好用的Python库！大家好，今天为大家分享一个好用的Python库-borb。Github地址：https://github.com/jorisschellekens/borbPythonBorb是一个用于处理PDF文件的Python库，它提供了丰富的功能和工具，使得PDF文件的创建、修改和解析变得更
python—计算学生成绩等级 2111339 彭传月 python
一、打开软件新建窗口输入代码#计算学生成绩等级is_continue='y'whileis_continue=='Y'oris_continue=='y':score=eval(input('请输入学生的成绩：'))ifscore>=90:print('A')elifscore>=80:print('B')elifscore>=70:print('C')elifscore>=60:print('D
CPU占用率飙升至100%：是攻击还是正常现象？群联云防护小杜安全问题汇总 ddos 安全 waf 服务器 cpu 占用被攻击
在运维和开发的日常工作中，CPU占用率突然飙升至100%往往是一个令人紧张的信号。这可能意味着服务器正在遭受攻击，但也可能是由于某些正常的、但资源密集型的任务或进程造成的。本文将探讨如何识别和应对服务器的异常CPU占用情况，并通过Python脚本示例，提供一种监控和诊断CPU占用率的方法。一、CPU占用率100%：攻击or正常？1.1攻击迹象持续性高占用：如果CPU占用率长时间保持在100%，且没
Python 成绩等级判定 Camellia 泡泡 python 笔记
score=int(input("请输入学生成绩:"))if90<=score<=100:grade="A"elif75<=score<=90:grade="B"elif60<=score<=75:grade="C"elifscore<60:grade="D"print("本次考试，等级为:",grade)运行结果：
【Python】PDFMiner.six：高效处理PDF文档的Python工具技术无疆 Python python pdf 开发语言 python3.11 人工智能数据挖掘机器学习
PDF是一种广泛使用的文件格式，特别适用于呈现固定布局的文档。然而，提取PDF文件中的文本和信息并不总是那么简单。幸好有许多Python库可以帮助我们，其中，PDFMiner.six是一个功能强大、专门用于PDF文档解析的库。⭕️宇宙起点什么是PDFMiner.six？主要功能安装PDFMiner.six♨️核心功能和代码示例1.提取PDF文档的纯文本2.从多个页面提取文本3.提取PDF中的表格内
25道Python练手题（附详细答案），赶紧收藏！_python题库字节全栈_rJF python 开发语言
importrandomasrdnumber=rd.randint(0,100)foriinrange(10):choice=int(input("请输入你要猜测的数字："))ifchoice>number:print("你猜大了")elifchoice0and5*x+3*y+z/3==100:count+=1print("="*60)print(f'第{count}种买法，公鸡买了{x}只，母鸡
python爱心代码高级 youyouxiong python 开发语言
在Python中，我们可以使用各种方法来绘制一个“爱心”形状。以下是一个使用turtle模块绘制爱心的高级示例。这个示例将使用更复杂的数学公式和图形操作来绘制一个更精致的爱心形状。importturtleimportmath#设置初始状态window=turtle.Screen()window.bgcolor("black")#设置背景色为黑色love=turtle.Turtle()love.sp
python画一个爱心戴子雯 python绘画 python
大家好这是我的地一篇博客，我要写一个关于python的文章我要用python写一个爱心。不说别的，先看效果效果如下：话不多说，上代码，在这之前要下载python下载这事咱们放在最后现在上代码！！！！！！！！！！！！！！importturtleastt.pensize(2)#笔大小2像素t.pencolor("red")#颜色为红色t.left
brew 安装pip_pip brew wget 安装 weixin_32612253 brew 安装pip
终端播放器安装教程从简书上看到一篇,终端实现网易云音乐的文章,并给出了一个github链接.心里有些痒痒,想看看是什么样子,于是尝试安装.安装过程中有些坎坷,记录以便以后查阅.程序实现是用Python写的.安装使用方式仅仅给了三行命令.安装$pipinstallnetease-musicbox$brewinstallmpg123使用$musicbox下载了源码后,不知道该如何安装.三行命令也是莫名
python实现绘制爱心函数（绘制过程） halo0416 python 开发语言
首先，确保已经安装了matplotlib库和numpy库。如果没有安装，可以通过pip来安装：pipinstallmatplotlibpipinstallnumpy了解心形函数公式：x(t)=y(t)=13cos⁡(t)−5cos⁡(2t)−2cos⁡(3t)−cos⁡(4t)定义函数：defheart_shape(t):x=16*np.sin(t)**3y=13*np.cos(t)-5*np.c
python 绘图（爱心） @小H python 开发语言
#-*-coding:utf-8-*-fromturtleimport*defcurvemove():foriinrange(200):right(1)forward(1)color('red','pink')begin_fill()left(140)forward(111.65)curvemove()left(120)curvemove()forward(111.65)end_fill()don
Mulvus向量库数据插入失败排查 Sirius Wu milvus
Mulvus是一个开源的向量数据库，要判断数据是否成功插入以及在插入失败时进行排查，可以参考以下方法：确认数据是否成功插入1.API返回结果在使用Mulvus提供的API插入数据时，API会返回相应的结果信息。以PythonSDK为例，插入数据的代码通常如下：frompymilvusimportconnections,Collection,FieldSchema,CollectionSchema,
使用 Python 绘制爱心图形（高级版）徐浪老师徐浪老师大讲堂 python 开发语言
以下是一段使用Python绘制高级“爱心”图案的代码，结合数学公式生成精美的爱心形状，并附加一些交互式的效果，比如渐变颜色或动态展示：动态渐变爱心importnumpyasnpimportmatplotlib.pyplotaspltimportmatplotlib.animationasanimation#设置爱心的数学公式defheart_shape(t):x=16*np.sin(t)**3y=
2025计算机毕设全流程实战指南：Java/Python+协同过滤+小程序开发避坑手册启点毕设课程设计 java python 大四论文指南查重降重技巧毕业设计 spring
技术框架的选择是项目开发的关键起点，直接影响开发效率和最终成果质量。然而，许多开发者在选择技术框架时面临困难：现有知识储备不足以支撑复杂项目需求，团队经验有限，框架选择缺乏前瞻性常导致后期问题。尽管技术框架的选择过程充满挑战，但合适的框架能为项目开发和维护奠定基础，而不当的选择则可能带来持续的技术债务和开发困扰。所以，建议对项目技术框架把握不好的同学，最好是找自己的研究生学长或者老师详细的把关机技
pycharm中使用anaconda部署python环境_pycharm部署配置anaconda环境教程 weixin_39796652
本篇文章小编给大家分享一下pycharm部署配置anaconda环境教程，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。pycharm部署anaconda环境Pycharm：python编辑器，社区版本Anaconda：开源的python发行版本(专注于数据分析的python版本)，包含大量的科学包环境基本指令(准备工作)：conda--version查看anaconda
python poetry添加某个git仓库的某个分支 waketzheng git
命令行不太清楚怎么弄，但可以通过编辑pyproject.toml实现实例：pypika-tortoise={git="https://github.com/henadzit/pypika-tortoise",branch="do-not-use-builder"}参考：WIPDonotcopypypikaquerybyhenadzit·PullRequest#1851·tortoise/torto
The following modules are *disabled* in configure script:_sqlite3 waketzheng python
Unabletoupgradepast3.6.9-#24byRosuav-PythonHelp-DiscussionsonPython.orgsudoaptinstalllibsqlite3-devcdPython-3.13.1./configure--enable-optimizations--enable-loadable-sqlite-extensionsmakesudomakealtins
CentOS7 python安装Ta-lib 0.6.x【talib不能直接安装，必须先安装ta_lib之c++库才可以】 weixin_43343144 服务器运维
正常流程：CentOS7python安装Ta-lib【talib不能直接安装，必须先安装ta_lib之c++库才可以】_centos7安装ta-lib-CSDN博客不同的版本参考如下！参考官方文档：ta-lib·PyPI务必下载匹配版本的【ta-lib-0.6.4-src.tar.gz】才可以正常安装$wgethttps://github.com/ta-lib/ta-lib/releases/do
【Kivy App】Pyjnius是什么？ Botiway 移动APP Kivy python
Pyjnius是一个Python库，用于在Python中访问Java类和方法，特别适用于在Kivy或其它Python应用中调用AndroidAPI。以下是Pyjnius的详细介绍、安装和使用方法：1.Pyjnius是什么？Pyjnius是一个Python-to-Java的桥接工具，允许Python代码直接调用Java类和方法。它基于JavaNativeInterface(JNI)，主要用于以下场景
代码训练day7哈希表2 徵686 散列表数据结构
1.四数相加IIleetcode454哈希表判断是否存在classSolution{//四数相加ii统计个数publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMapmap=newHashMapmagazine.length())returnfalse;//java字符串长度s.length()for(cha
基于Python PYQT5 的相机定时采集图像程序，GUI打包独立运行夏时summer time python qt 数码相机相机
基于PythonPYQT5编写相机定时采集图像及手动采集版本介绍Python3.6pyqt55.15.4pyqt5-tools5.15.4.3.2另外就是常用的cv2和numpy包fromPyQt5importQtCore,QtGui,QtWidgetsfromPyQt5importQtCore,QtGui,QtWidgetsimportcv2importnumpyasnpfromdatetime
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
C++在线OJ负载均衡项目平凡的小y c++开发语言
1.演示项目项目源码链接：2.项目所用技术和开发环境所用技术C++STL标准库Boost准标准库(字符串切割)cpp-httplib第三方开源网络库ctemplate第三方开源前端网页渲染库jsoncpp第三方开源序列化、反序列化库负载均衡设计MySQLCconnectAce前端在线编辑器html/css/js/jquery/ajax开发环境Ubuntu云服务器vscodeMysqlWorkben
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Mac下载python并安装小小酥*
下载pythonPython官网：https://www.python.org/进入官网后点击download，选择MacOSX版本2.安装MAC系统一般都自带有Python2.x版本的环境，你也可以在链接https://www.python.org/downloads/mac-osx/上下载最新版安装。3.设置环境变量程序和可执行文件可以在许多目录，而这些路径很可能不在操作系统提供可执行文件的搜
Python使用minIO上传下载身似山河挺脊梁 python
前提VSCode+Python3.9minIO有Python的例子1.python生成临时文件2.写入一些数据3.上传到minIO4.获取分享出连接5.发出通知#创建一个客户端minioClient=Minio(endpoint='xx',access_key='xx',secret_key='xx',secure=False)#生成文件名current_datetime=datetime.dat
深入理解Python上下文管理器 ……-…… python 开发语言
1.什么是上下文管理器？2.with语句的魔法3.创建上下文管理器的两种方式3.1基于类的实现3.2使用contextlib模块4.异常处理1.什么是上下文管理器？上下文管理器（ContextManager）是Python中用于精确分配和释放资源的机制。它通过__enter__()和__exit__()两个魔术方法实现了上下文管理协议，确保即使在代码执行出错的情况下，资源也能被正确清理。#经典文件
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

Bootstrap重采样实战