Charles Zhai

MapReduce Input Split（输入分/切片）详解--比较容易理解

转自：https://blog.csdn.net/Dr_Guo/article/details/51150278

看了很多博客，感觉没有一个说的很清楚，所以我来整理一下。

先看一下这个图

输入分片（Input Split）：在进行map计算之前，mapreduce会根据输入文件计算输入分片（input split），每个输入分片（input split）针对一个map任务，输入分片（input split）存储的并非数据本身，而是一个分片长度和一个记录数据的位置的数组。

Hadoop 2.x默认的block大小是128MB，Hadoop 1.x默认的block大小是64MB，可以在hdfs-site.xml中设置dfs.block.size，注意单位是byte。

分片大小范围可以在mapred-site.xml中设置，mapred.min.split.size mapred.max.split.size，minSplitSize大小默认为1B，maxSplitSize大小默认为Long.MAX_VALUE = 9223372036854775807

那么分片到底是多大呢？

minSize=max{minSplitSize,mapred.min.split.size}

maxSize=mapred.max.split.size

splitSize=max{minSize,min{maxSize,blockSize}}

我们再来看一下源码

所以在我们没有设置分片的范围的时候，分片大小是由block块大小决定的，和它的大小一样。比如把一个258MB的文件上传到HDFS上，假设block块大小是128MB，那么它就会被分成三个block块，与之对应产生三个split，所以最终会产生三个map task。我又发现了另一个问题，第三个block块里存的文件大小只有2MB，而它的block块大小是128MB，那它实际占用Linux file system的多大空间？

答案是实际的文件大小，而非一个块的大小。

有大神已经验证这个答案了：http://blog.csdn.net/samhacker/article/details/23089157

1、往hdfs里面添加新文件前，hadoop在linux上面所占的空间为 464 MB：

2、往hdfs里面添加大小为2673375 byte(大概2.5 MB)的文件：

2673375 derby.jar

3、此时，hadoop在linux上面所占的空间为 467 MB——增加了一个实际文件大小(2.5 MB)的空间，而非一个block size(128 MB)：

4、使用hadoop dfs -stat查看文件信息：

这里就很清楚地反映出：文件的实际大小(file size)是2673375 byte，但它的block size是128 MB。

5、通过NameNode的web console来查看文件信息:

结果是一样的：文件的实际大小(file size)是2673375 byte，但它的block size是128 MB。

6、不过使用‘hadoop fsck’查看文件信息，看出了一些不一样的内容—— ‘1（avg.block size 2673375 B）’:

值得注意的是，结果中有一个 ‘1（avg.block size 2673375 B）’的字样。这里的 'block size' 并不是指平常说的文件块大小(Block Size)—— 后者是一个元数据的概念，相反它反映的是文件的实际大小(file size)。以下是Hadoop Community的专家给我的回复：

“The fsck is showing you an "average blocksize", not the block size metadata attribute of the file like stat shows. In this specific case, the average is just the length of your file, which is lesser than one whole block.”

最后一个问题是：如果hdfs占用Linux file system的磁盘空间按实际文件大小算，那么这个”块大小“有必要存在吗？

其实块大小还是必要的，一个显而易见的作用就是当文件通过append操作不断增长的过程中，可以通过来block size决定何时split文件。以下是Hadoop Community的专家给我的回复：

“The block size is a meta attribute. If you append tothe file later, it still needs to know when to split further - so it keeps that value as a mere metadata it can use to advise itself on write boundaries.”

补充：我还查到这样一段话

原文地址：http://blog.csdn.net/lylcore/article/details/9136555

一个split的大小是由goalSize, minSize, blockSize这三个值决定的。computeSplitSize的逻辑是，先从goalSize和blockSize两个值中选出最小的那个（比如一般不设置map数，这时blockSize为当前文件的块size，而goalSize是文件大小除以用户设置的map数得到的，如果没设置的话，默认是1）。

hadooop提供了一个设置map个数的参数mapred.map.tasks，我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数，并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值，最终map的个数，还取决于其他的因素。

为了方便介绍，先来看几个名词：

block_size : hdfs的文件块大小，默认为64M，可以通过参数dfs.block.size设置

total_size : 输入文件整体的大小

input_file_num : 输入文件的个数

（1）默认map个数

如果不进行任何设置，默认的map个数是和blcok_size相关的。

default_num = total_size / block_size;

（2）期望大小

可以通过参数 mapred.map.tasks来设置程序员期望的map个数，但是这个个数只有在大于default_num的时候，才会生效。

goal_num = mapred.map.tasks;

（3）设置处理的文件大小

可以通过mapred.min.split.size 设置每个task处理的文件大小，但是这个大小只有在大于 block_size的时候才会生效。

split_size = max( mapred.min.split.size, block_size );

split_num = total_size / split_size;

（4）计算的map个数

compute_map_num = min(split_num, max(default_num, goal_num))

除了这些配置以外，mapreduce还要遵循一些原则。 mapreduce的每一个map处理的数据是不能跨越文件的，也就是说min_map_num >= input_file_num。所以，最终的map个数应该为：

final_map_num = max(compute_map_num, input_file_num)

经过以上的分析，在设置map个数的时候，可以简单的总结为以下几点：

（1）如果想增加map个数，则设置mapred.map.tasks 为一个较大的值。

（2）如果想减小map个数，则设置mapred.min.split.size 为一个较大的值。

（3）如果输入中有很多小文件，依然想减少map个数，则需要将小文件merger为大文件，然后使用准则2。

目前您尚未登录，请登录或注册后进行评论

DirectX5.0最新游戏编程指南 DirectDraw教程篇一、配置DirectX SDK

DirectX5.0最新游戏编程指南DirectDraw教程篇 DirectX是为Visual C++的用户准备的，因此要编制DirectDraw游戏程序，最好对VC要有一定的了解。不愿意使用...

holyfire
2001-04-16 09:37:00
3342

Hadoop-2.4.1源码分析--MapReduce作业切片(Split)过程

在上一篇文章《Hadoop源码分析--MapReduce作业(job)提交源码跟踪》中，我介绍了Job的提交过程源码，介绍的最后一个方法是submitJobInternal(Jobjob, Clus...

u010010428
2016-05-21 16:43:51
2308

MapReduce Input Split(输入分/切片)详解 - CSDN博客

输入分片(Input Split):在进行map计算之前,mapreduce会根据输入文件计算输入分片...比如把一个258MB的文件上传到HDFS上,假设block块大小是128MB,那么它就会被分成...

2018-4-9

解析如何读取文件形成InputSplit - CSDN博客

InputFormat 并没有实现RecordReader ,只是实现了文件的分片FileSplit。...2.x默认的block大小是128MB,Hadoop 1.x默认的block大小是64MB,可以在hdfs-...

2018-4-14

Hadoop InputFormat定制时必须知道的原理---如何划分split，split如何调度，如何读取

在执行一个Job的时候，Hadoop会将输入数据划分成N个Split，然后启动相应的N个Map程序来分别处理它们。数据如何划分？Split如何调度（如何决定处理Split的Map程序应该运行在哪台...

chenhuijie666
2014-05-21 15:55:31
1242

Hadoop中 MapReduce中InputSplit的分析 - CSDN博客

public InputSplit[] getSplits(JobConf job, int numSplits) throwsIOException { //获取文件列表的状态,底层通过HDFS客户端的//DistributedFileSystem.getFileStatus...

2018-4-17

Hadoop InputFormat定制时必须知道的原理---如何划分sp..._CSDN博客

在第3步中,JobClient向HDFS提交的资源就包含了InputSplit,这就是数据划分的结果。也就是说,数据划分是在JobClient上完成的。在这里,JobClient会使用指定的InputForm...

2018-3-23

hadoop 文件分块，block与split关系

soony_007
2013-10-09 19:57:36
3997

hadoop的分块有两部分，其中第一部分更为人熟知一点。第一部分就是数据的划分（即把File划分成Block），这个是物理上真真实实的进行了划分，数据文件上传到HDFS里的时候，需要划分成一...

hadoop block split 区别

baolibin528
2015-03-16 15:16:31
695

Hadoop权威指南（第三版）P31 Hadoop divides the input to a MapReduce job into fixed-size pieces called inpu...

Hadoop源码解析之: TextInputFormat如何处理跨split的行 - CSDN博客

我们知道hadoop将数据给到map进行处理前会使用InputFormat对数据进行两方面的预处理: 对输入数据进行切分,生成一组split,一个split会分发给一个mapper进行处理。针对...

2018-4-5

MapReduce中InputFormat和InputSplit解读 - CSDN博客

(job)要操作的数据保存在文件系统HDFS上,InputFormat接口定义的方法就是如何读取... InputSplit是Hadoop定义的用来传送给每个单独的map的...

hadoop@bigdate-VirtualBox:/mnt/shared$ tar -xzvf hadoop-2.10.2.tar.gz tar (child): hadoop-2.10.2.tar 北辰Charih 大数据挖掘 hadoop 大数据分布式
在virtualbox的ubuntu虚拟机上使用共享文件夹安装hadoop大数据软件在在virtualbox的ubuntu虚拟机上设置共享文件夹步骤：1.设置共享文件夹自行设定共享文件夹路径以及名称，记得勾选自动挂载（A），运行虚拟机的时候才会自动加载该文件夹。小提示：我按和下面连接的教程差不多的步骤安装配置VM虚拟机Ubuntu系统https://blog.csdn.net/duchenlong
【Vmware】vmware脚本一键启动/关闭虚拟机集群 qq_24699905 vmware虚拟机使用运维
一.安装vmwareworkstationpro17（确保windows宿主机环境变量中存在可执行程序路径）参考：windows10安装VMwareWorkstation17Pro二.编写bat脚本启动虚拟机集群.batmodeconcols=20lines=10vmrun-Twsstart"D:\ProgramFiles(x86)\VMware\VOS\bigdate00\bg00.vmx"no
SparkSQL抽取Mysql全量数据到Hive动态分区表中月亮给我抄代码 hive mysql spark scala 大数据
部分概念内容：hive学习(七)------创建动态分区_BigDate_小学生的博客-CSDN博客进阶篇：spark增量抽取MySQL中的数据存入hive动态分区表（2）_月亮给我抄代码的博客-CSDN博客前言：我这里把hive-site.xml文件放在了resource目录中，相关配置及依赖在后面。不要用中文值作为静态分区或动态分区字段！！！packagemy_projectimportorg
阿里云dataworks中业务流程中问题（odps2）大数据小理大数据大数据异常处理数据库 sql dataworks 阿里云 maxcomputer
bigdate形式的数据在odps的2.0版本中无法隐式转换，应将一个参数改为false如下setprojectodps.sql.type.system.odps2=false;上面的语句应该与insert…table表名select…一起使用例如setprojectodps.sql.type.system.odps2=false;INSERTOVERWRITETABLEyhxxgxSELECTy
SparkStreaming--输入源（本地文件） wangfutai91 SparkStreaming
//输入源objectWordCountHDFSSource{defmain(args:Array[String]):Unit={System.setProperty("hadoop.home.dir","E:\\software\\bigdate\\hadoop-2.6.0-cdh5.15.0\\hadoop-2.6.0-cdh5.15.0")valconf=newSparkConf();con
linux基础命令学习第一天 Firtslei
互联网+ABCA----->AI（ArtificialIntelligence）人工智能B----->BIgDate大数据C----->CloudComputing云计算服务器就是一个电脑超级大的内存超级大的硬盘5操作系统（微软苹果IBMGOOGLE惠普）Window（微内核）(win32,win95,win98,winme,win2000,winxp,winvista,win7,win8,win
#BigDate_01--hadoop的安装 dreamer11712 bigdate
环境：VMware虚拟机----centOS71).下载jdk并在Linux目录下tar开$>tar-xzvfjdk-xxx-linux-x64.tar.gz2).将tar开的文件移到对应目录(这里自己创建了/soft)，并创建符号链接$>mv~/downloads/jdk-xxx/soft/$>ln-s/soft/jdk-1.8.0_65/soft/jdk3).进入bin目录测试是否安装成功$>
欺骗与被欺骗，大数据时代给世人真相初人未勒
若至今仍停留在过去思维模式，那很善意的告诉你，这个时代你已经脱节！今天想与大家分享的是：时代发展相关的两个重要概念“信用”和“数据”BigDate信用：是指依附在人之间、单位之间和商品交易之间形成的一种相互信任的生产关系和社会关系。——人无信不立，国无信则衰数据：是指对客观事件进行记录并可以鉴别的符号，是对客观事物性质、状态以及相互关系等进行记录的物理符号或这些物理符号的组合，同时数据拥有三大特征
第6章 HBase API操作（二）---数据封装与数据迁移江湖侠客 HBase
上篇：第6章HBaseAPI操作（二）1、数据的封装使用多线程的线程安全对数据进行封装首先，创建一个工具类：HbaseUtil（操作工具类）具体代码实现：packagestudey.bigdate.util;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;impo
linux 获取磁盘信息, 添加硬盘, 分区孙小二wuk
title:linux获取磁盘信息,添加硬盘,分区date:2018-02-1120:50:48categories:[Linux]tags:[Linux,notes,BigDate,LinuxCommand]磁盘分区Linux系统默认所有文件都在/dev目录下satasasscsiide常用接口类型fdisk-l查看系统所有硬盘的分区情况系统一共有几块硬盘每个硬盘的分区情况(硬盘空间是否有空余)
Linux 初识孙小二wuk
title:Linux初识date:2018-02-0920:42:38categories:[coding]tags:[Linux,notes,BigDate]前言Linux还是要系统的掌握下,重新跟着学习资料系统的整理下笔记Linux实际为大神LinusTorvalds开发的并开源发行于GPL下的unix类的系统内核官网http://www.kernel.orgLinux是开源的,由志愿者贡献
linux 连接工具孙小二wuk
title:linux连接工具date:2018-02-1000:10:55categories:[coding]tags:[Linux,notes,BigDate,env,software]前言linux基本都是远程操作,根据需求,有不同常用工具toolsshell,bash,sshsecureCRTXshell(用这个的人比较多)cmder(我用多一些)其实都差不多,都是命令行工具而已连接ss
linux 基本命令孙小二wuk
title:linux基本命令date:2018-02-1000:35:22categories:[coding]tags:[Linux,notes,BigDate,env,software]前言我觉得,我应该跳一下进度了有点太初级了连接操作ifconfig=ipa查看ip,内网ip之类image.pngsshusername@ipaddress连接image.pngclear清屏目录操作目录结构
PHPMailer function set_magic_quotes_runtime() is deprecated r_martian PHP PHP技术分享
测试代码$mailer=newMailer();$mailer->FromName='BigDataTechTeam';$mailer->Subject="【报警提醒】广告主[{$adv_id}]充值异常";$body="广告主:{$adv_id}";$mailer->MsgHTML($body);$mailer->AddAddress('[email protected]');
拼命Girl_Hadoop笔记（一）：大数据概念、Hadoop框架概述拼命菇凉 hadoop Hadoop 概述大数据
要了解Hadoop首先我们要知道大数据的概念是什么？1.大数据概念（1）大数据是什么官方理解：大数据（BigDate）：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。自己理解：数据量大、数据种类多样、要求实时性强。也就是一种规模非常大的，在分析、管理、存储和获取等方面都超出了传统
pvuv的代码开发及提交spark程序jar包运行读取数据源并将结果写入MySQL中浮云6363 spark
目录PvUvToMysql类ConnectionUtils类jdbc.properties文件在IDEA中打jar包的两种方式IDEA打jar包IDEA中maven方式打jar包提交spark程序jar包运行参数解释本地模式运行集群上运行yarn上运行PvUvToMysql类packagecom.fuyun.bigdate.sparkimportjava.sql.{Connection,Prepa
例：Hbase+Map Reduce解决word count 科大勒布朗大数据
Hbase+MapReduce解决wordcountMapper类packagecn.bigdate01.hadoop.mr.wordcount;importjava.io.IOException;importorg.apache.commons.lang.StringUtils;importorg.apache.hadoop.io.LongWritable;importorg.apache.ha
linux 虚拟机安装孙小二wuk
title:linux虚拟机安装date:2018-02-0921:41:46categories:[coding]tags:[Linux,notes,BigDate,env]步骤bios开启虚拟化选项安装vmimage.pngimage.pngios镜像CentOs646.9(资料是6.4的,考虑到一致性,打算找6.4,可不好找,7的话怕有不同,耽误时间)Linux虚拟机操作系统安装买了一个12
【知识积累】BigDate介绍 Date
BigData技术综述BigData是近来的一个技术热点，但从名字就能判断它并不是什么新词。毕竟，大是一个相对概念。历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题。被誉为数据仓库之父的BillInmon早在20世纪90年代就经常将BigData挂在嘴边了。然而，BigData作为一个专有名词成为热点，主要应归功于近年来互联网、云计算、移动和物联网的
java 比较日期大小 William0219 java 日期比较
//比较两个字符串日期相差的天数 //1秒=1000毫秒 public int compDate(String bigDate,String smallDate){ int day = 0; SimpleDateFormat sdf = new SimpleDateFormat("yyyy-mm-dd"); try { //将"yyyy-mm-dd"字符串格式的日期转换
mysql存储过程--返回两个时间的最大最小值 sunhj000java java mysql
返回较大值 create function bigdate(first date, last date ) returns date begin declare datetemp date; set datetemp = last; if first > last then set datetemp = first; end if; return dat
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C