hao707822882

hadoop中的文件接口类-- SequenceFile

SequenceFile文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(Flat File)。目前，也有不少人在该文件的基础之上提出了一些HDFS中小文件存储的解决方案，他们的基本思路就是将小文件进行合并成一个大文件，同时对这些小文件的位置信息构建索引。不过，这类解决方案还涉及到Hadoop的另一种文件格式——MapFile文件。SequenceFile文件并不保证其存储的key-value数据是按照key的某个顺序存储的，同时不支持append操作。

在SequenceFile文件中，每一个key-value被看做是一条记录(Record)，因此基于Record的压缩策略，SequenceFile文件可支持三种压缩类型(SequenceFile.CompressionType):

NONE: 对records不进行压缩;

RECORD: 仅压缩每一个record中的value值;

BLOCK: 将一个block中的所有records压缩在一起;

那么，基于这三种压缩类型，Hadoop提供了对应的三种类型的Writer:

SequenceFile.Writer 写入时不压缩任何的key-value对(Record);

[java]  view plain copy 
     
    
 public static class Writer implements java.io.Closeable {  
   
 ...  
    //初始化Writer  
    void init(Path name, Configuration conf, FSDataOutputStream out, Class keyClass, Class valClass, boolean compress, CompressionCodec codec, Metadata metadata) throws IOException {  
       this.conf = conf;  
       this.out = out;  
       this.keyClass = keyClass;  
       this.valClass = valClass;  
       this.compress = compress;  
       this.codec = codec;  
       this.metadata = metadata;  
         
       //创建非压缩的对象序列化器  
       SerializationFactory serializationFactory = new SerializationFactory(conf);  
       this.keySerializer = serializationFactory.getSerializer(keyClass);  
       this.keySerializer.open(buffer);  
       this.uncompressedValSerializer = serializationFactory.getSerializer(valClass);  
       this.uncompressedValSerializer.open(buffer);  
         
       //创建可压缩的对象序列化器  
       if (this.codec != null) {  
         ReflectionUtils.setConf(this.codec, this.conf);  
         this.compressor = CodecPool.getCompressor(this.codec);  
         this.deflateFilter = this.codec.createOutputStream(buffer, compressor);  
         this.deflateOut = new DataOutputStream(new BufferedOutputStream(deflateFilter));  
         this.compressedValSerializer = serializationFactory.getSerializer(valClass);  
         this.compressedValSerializer.open(deflateOut);  
       }  
     }  
       
   
   //添加一条记录(key-value,对象值需要序列化)  
   public synchronized void append(Object key, Object val) throws IOException {  
       if (key.getClass() != keyClass)  
         throw new IOException("wrong key class: "+key.getClass().getName() +" is not "+keyClass);  
         
       if (val.getClass() != valClass)  
         throw new IOException("wrong value class: "+val.getClass().getName() +" is not "+valClass);  
   
       buffer.reset();  
   
       //序列化key(将key转化为二进制数组)，并写入缓存buffer中  
       keySerializer.serialize(key);  
       int keyLength = buffer.getLength();  
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed: " + key);  
   
       //compress在初始化是被置为false   
       if (compress) {  
         deflateFilter.resetState();  
         compressedValSerializer.serialize(val);  
         deflateOut.flush();  
         deflateFilter.finish();  
       } else {  
         //序列化value值(不压缩)，并将其写入缓存buffer中  
         uncompressedValSerializer.serialize(val);  
       }  
   
       //将这条记录写入文件流  
       checkAndWriteSync();                                // sync  
       out.writeInt(buffer.getLength());                   // total record length  
       out.writeInt(keyLength);                            // key portion length  
       out.write(buffer.getData(), 0, buffer.getLength()); // data  
     }  
   
     //添加一条记录(key-value,二进制值)  
     public synchronized void appendRaw(byte[] keyData, int keyOffset, int keyLength, ValueBytes val) throws IOException {  
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed: " + keyLength);  
   
       int valLength = val.getSize();  
   
       checkAndWriteSync();  
         
       //直接将key-value写入文件流  
       out.writeInt(keyLength+valLength);          // total record length  
       out.writeInt(keyLength);                    // key portion length  
       out.write(keyData, keyOffset, keyLength);   // key  
       val.writeUncompressedBytes(out);            // value  
     }  
   
 ...  
   
 }  

SequenceFile.RecordCompressWriter写入时只压缩key-value对(Record)中的value;

[java]  view plain copy 
     
    
 static class RecordCompressWriter extends Writer {  
 ...  
   
    public synchronized void append(Object key, Object val) throws IOException {  
       if (key.getClass() != keyClass)  
         throw new IOException("wrong key class: "+key.getClass().getName() +" is not "+keyClass);  
         
       if (val.getClass() != valClass)  
         throw new IOException("wrong value class: "+val.getClass().getName() +" is not "+valClass);  
   
       buffer.reset();  
   
       //序列化key(将key转化为二进制数组)，并写入缓存buffer中  
       keySerializer.serialize(key);  
       int keyLength = buffer.getLength();  
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed: " + key);  
   
       //序列化value值(不压缩)，并将其写入缓存buffer中  
       deflateFilter.resetState();  
       compressedValSerializer.serialize(val);  
       deflateOut.flush();  
       deflateFilter.finish();  
   
       //将这条记录写入文件流  
       checkAndWriteSync();                                // sync  
       out.writeInt(buffer.getLength());                   // total record length  
       out.writeInt(keyLength);                            // key portion length  
       out.write(buffer.getData(), 0, buffer.getLength()); // data  
     }  
   
     /** 添加一条记录(key-value,二进制值,value已压缩) */  
     public synchronized void appendRaw(byte[] keyData, int keyOffset,  
         int keyLength, ValueBytes val) throws IOException {  
   
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed: " + keyLength);  
   
       int valLength = val.getSize();  
         
       checkAndWriteSync();                        // sync  
       out.writeInt(keyLength+valLength);          // total record length  
       out.writeInt(keyLength);                    // key portion length  
       out.write(keyData, keyOffset, keyLength);   // 'key' data  
       val.writeCompressedBytes(out);              // 'value' data  
     }  
       
   } // RecordCompressionWriter  
   
   
 ...  
 }  

SequenceFile.BlockCompressWriter 写入时将一批key-value对(Record)压缩成一个Block;

[java]  view plain copy 
     
    
 static class BlockCompressWriter extends Writer {  
 ...  
   
    void init(int compressionBlockSize) throws IOException {  
       this.compressionBlockSize = compressionBlockSize;  
       keySerializer.close();  
       keySerializer.open(keyBuffer);  
       uncompressedValSerializer.close();  
       uncompressedValSerializer.open(valBuffer);  
     }  
       
     /** Workhorse to check and write out compressed data/lengths */  
     private synchronized void writeBuffer(DataOutputBuffer uncompressedDataBuffer) throws IOException {  
       deflateFilter.resetState();  
       buffer.reset();  
       deflateOut.write(uncompressedDataBuffer.getData(), 0, uncompressedDataBuffer.getLength());  
       deflateOut.flush();  
       deflateFilter.finish();  
         
       WritableUtils.writeVInt(out, buffer.getLength());  
       out.write(buffer.getData(), 0, buffer.getLength());  
     }  
       
     /** Compress and flush contents to dfs */  
     public synchronized void sync() throws IOException {  
       if (noBufferedRecords > 0) {  
         super.sync();  
           
         // No. of records  
         WritableUtils.writeVInt(out, noBufferedRecords);  
           
         // Write 'keys' and lengths  
         writeBuffer(keyLenBuffer);  
         writeBuffer(keyBuffer);  
           
         // Write 'values' and lengths  
         writeBuffer(valLenBuffer);  
         writeBuffer(valBuffer);  
           
         // Flush the file-stream  
         out.flush();  
           
         // Reset internal states  
         keyLenBuffer.reset();  
         keyBuffer.reset();  
         valLenBuffer.reset();  
         valBuffer.reset();  
         noBufferedRecords = 0;  
       }  
         
     }  
   
   
    //添加一条记录(key-value,对象值需要序列化)  
    public synchronized void append(Object key, Object val) throws IOException {  
       if (key.getClass() != keyClass)  
         throw new IOException("wrong key class: "+key+" is not "+keyClass);  
         
       if (val.getClass() != valClass)  
         throw new IOException("wrong value class: "+val+" is not "+valClass);  
   
       //序列化key(将key转化为二进制数组)(未压缩)，并写入缓存keyBuffer中  
       int oldKeyLength = keyBuffer.getLength();  
       keySerializer.serialize(key);  
       int keyLength = keyBuffer.getLength() - oldKeyLength;  
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed: " + key);  
       WritableUtils.writeVInt(keyLenBuffer, keyLength);  
   
       //序列化value(将value转化为二进制数组)(未压缩)，并写入缓存valBuffer中  
       int oldValLength = valBuffer.getLength();  
       uncompressedValSerializer.serialize(val);  
       int valLength = valBuffer.getLength() - oldValLength;  
       WritableUtils.writeVInt(valLenBuffer, valLength);  
         
       // Added another key/value pair  
       ++noBufferedRecords;  
         
       // Compress and flush?  
       int currentBlockSize = keyBuffer.getLength() + valBuffer.getLength();  
       //block已满，可将整个block进行压缩并写入文件流  
       if (currentBlockSize >= compressionBlockSize) {  
         sync();  
       }  
     }  
       
     /**添加一条记录(key-value,二进制值,value已压缩). */  
     public synchronized void appendRaw(byte[] keyData, int keyOffset, int keyLength, ValueBytes val) throws IOException {  
         
       if (keyLength < 0)  
         throw new IOException("negative length keys not allowed");  
   
       int valLength = val.getSize();  
         
       // Save key/value data in relevant buffers  
       WritableUtils.writeVInt(keyLenBuffer, keyLength);  
       keyBuffer.write(keyData, keyOffset, keyLength);  
       WritableUtils.writeVInt(valLenBuffer, valLength);  
       val.writeUncompressedBytes(valBuffer);  
   
       // Added another key/value pair  
       ++noBufferedRecords;  
   
       // Compress and flush?  
       int currentBlockSize = keyBuffer.getLength() + valBuffer.getLength();   
       if (currentBlockSize >= compressionBlockSize) {  
         sync();  
       }  
     }  
       
   } // RecordCompressionWriter  
   
   
 ...  
 }  

源码中，block的大小compressionBlockSize默认值为1000000，也可通过配置参数io.seqfile.compress.blocksize来指定。

根据三种压缩算法，共有三种类型的SequenceFile文件格式：

1). Uncompressed SequenceFile

2). Record-Compressed SequenceFile

3). Block-Compressed SequenceFile

Spark RDD分区数和分区器 maplea2012 spark 大数据 hadoop
一、分区数如何决定1、数据源RDD数据源RDD的分区数由数据源的读取器决定,比如sc.textFile产生的rdd,分区数由TextInputFormat.getInputSplits()方法决定,具体源码追踪及解析如下:valrdd1=sc.textFile("data/tbPerson.txt")①Ctrl+B进入textFiletextFile底层其实就是通过hadoopFile去读文件②C
Spark core通过textFile读取Hdfs文件blockSize如何设置？客舟听雨2 spark hdfs 大数据
一、概述其实Sparkcore无论是读取hdfs还是读取本地文件都会以hadoopfile的形式进行读取，不同点在于读取本地文件时可以通过在resources文件中放入hdfs-site.xml文件设置fs.local.block.size参数来控制blocksize大小，而读取hdfs文件时，blocksize是通过获取此文件在hdfs存储的实际块大小，另外虽然blocksize和具体分区数有关
【Spark】Job触发流程原理果果小姚
1.通过例子分析下：vallines=sc.textFile()首先，hadoopFile()方法的调用，会创建一个HadoopRDD，其中的元素是（key，value）pair，key是HDFS或文本文件的每一行的offset，value就是文本行。然后对HadoopRDD调用map()方法，会剔除key，只保留value，然后会获得一个MapPartitionRDD，MapPartitionR
常用文件处理方法大闪电啊
GBK格式内容转码vallogRdd=sc.hadoopFile(logPath,classOf[TextInputFormat],classOf[LongWritable],classOf[Text]).map(p=>newString(p._2.getBytes,0,p._2.getLength,"GBK"))获取文件路径或文件名hadoopmr中使用如下方式InputSplitinputSp
Spark读取数据(GBK)乱码解决孤单的阿怪
//可以使用以下方式读取text文件数据JavaRDDrdd=sc.hadoopFile("PSP_MCC_CB.TXT",TextInputFormat.class,LongWritable.class,Text.class).map(newFunction,String>(){@OverridepublicStringcall(Tuple2tuple)throwsException{retur
Spark源码-spark算子-1-构建RDD的算子 zdaiqing 源码 Spark 大数据 spark 大数据 scala
构建RDD的算子1.概述2.RDD创建方式2.1.根据驱动程序中现有并行化集合创建RDD2.1.1.parallelize方式创建RDD2.2.根据外部存储系统中的数据集创建RDD2.2.1.textFile-根据本地文本文件创建RDD2.2.1.1.hadoopFile-根据文件创建hadoopRDD2.2.2.wholeTextFiles-根据文件目录创建RDD2.2.3.sequenceFi
spark源码----Spark任务划分、调度、执行没有合适的昵称 spark
从RDD的创建开始讲起把它当做入口,然后点进去主要关注hadoopFile,进去会发现new了一个HadoopRDD以上其实就是一个RDD的构建过程又比如我们看flatMap,它一样会去构建一个新的RDD,把之前的RDD给传进去了又比如我们看map,它一样会去构建一个新的RDD,把之前的RDD给传进去了在换一个算子reduceByKey,点进去,包含一个默认的分区器然后再点进去,combineBy
12.spark sql之读写数据 java大数据编程
简介 SparkSQL支持多种结构化数据源，轻松从各种数据源中读取Row对象。这些数据源包括Parquet、JSON、Hive表及关系型数据库等。当只使用一部分字段时，SparkSQL可以智能地只扫描这些字段，而不会像hadoopFile方法一样简单粗暴地扫描全部数据。Parquet Parquet是一种流行的列式存储格式，可以高效地存储具有嵌套字段的记录。Parquet自动保存原始数据的
Hadoop Streaming 实战： grep yfk hadoop Hadoop Streaming实战
streaming支持shell命令的使用。但是，需要注意的是，对于多个命令，不能使用形如cat;grep之类的多命令，而需要使用脚本，后面将具体介绍。下面示例用grep检索巨量数据：1.待检索的数据放入hdfs$hadoopfs-putlocalfile/user/hadoop/hadoopfile使用方法：hadoopfs-put...从本地文件系统中复制单个或多个源路径到目标文件系统。也支持
单机测试python编写的mapper时出现/usr/bin/python3^M: bad interpreter: No such file or directory 学战到底大数据 hadoop python
在单机测试python编写的mapper时出现hadoop@ub1401:~/hadoop/hadoopfile$catkeywords-blank-1.txt|./PictureDownloadMapper.pybash:./PictureDownloadMapper.py:/usr/bin/python3^M:badinterpreter:Nosuchfileordirectory经查有可能是
textFile chbxw #spark
1.1、textFile,实际调用hadoopFile/***ReadatextfilefromHDFS,alocalfilesystem(availableonallnodes),orany*Hadoop-supportedfilesystemURI,andreturnitasanRDDofStrings.*/deftextFile(path:String,minPartitions:Int=d
Name node is in safe mode. weixin_30257433
刚才启动hadoop，然后执行rm-r命令，出现这个问题，标记为红色的部分意思是namenode是安全节点，[master@hadoopfile]$hadoopfs-rm-r/input/*17/04/0109:41:03INFOfs.TrashPolicyDefault:Namenodetrashconfiguration:Deletioninterval=0minutes,Emptierint
hadoop hdfs dfs 命令讲解 xu-ning hadoop
hdfsdfs命令appendToFileUsage:hdfsdfs-appendToFile...追加一个或者多个文件到hdfs制定文件中.也可以从命令行读取输入.·hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile·hdfsdfs-appendToFilelocalfile1localfile2/user/hadoop/hadoopfile
Spark SQL数据的读取和存储似梦似意境 #Spark
SparkSQL支持很多种结构化数据源，可以让你跳过复杂的读取过程，轻松从各种数据源中读取到Row对象。这些数据源包括Hive表、JSON和Parquet文件。此外，当你使用SQL查询这些数据源中的数据并且只用到了一部分字段时，SparkSQL可以智能地只扫描这些用到的字段，而不是像SparkContext.hadoopFile中那样简单粗暴地扫描全部数据。除这些数据源之外，你也可以在程序中通过指
Spark:DAGScheduler原理剖析与源码分析焦焦^_^ Spark
Job触发流程原理与源码解析wordcount案例解析，来分析SparkJob的触发流程代码：varlinesRDD=sc.textFile('hdfs://')SparkContext中textFile方法/***hadoopFile方法调用会创建一个HadoopRDD，其中的元素pair是（key,value）*key是hdfs或者文本文件的每一行的offset,value就是文本行*然后，调
Hadoop -- hdfs dfs命令详解随风奔跑之水 Hadoop
hdfsdfs命令1、appendToFile##追加一个或者多个文件到hdfs制定文件中.也可以从命令行读取输入.Usage: hdfs dfs -appendToFile ... · hdfs dfs -appendToFile localfile /user/hadoop/hadoopfile· hdfs dfs -appendToFile localfile1 localfile2 /u
hadoop hdfs dfs 命令讲解舒琪 linux
hdfsdfs命令appendToFileUsage:hdfsdfs-appendToFile...追加一个或者多个文件到hdfs制定文件中.也可以从命令行读取输入.·hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile·hdfsdfs-appendToFilelocalfile1localfile2/user/hadoop/hadoopfile
sqoop入门 chenlan1927
Sqoop产生背景1）RDBMS==》Hadoopfile==》loadhiveshell==》file==》hdfsmapreduce：inputformatoutputformat2）Hadoop==》RDBMSMapReduce：TextInputFormaatDBoutputFormat存在的问题1）MR麻烦2）效率低：新的业务线写一个MR==》抽取一个框架如果要实现一个数据迁移的框架；1
==Spark系列(九)DAGScheduler工作原理葡萄喃喃呓语
Spark系列(九)DAGScheduler工作原理-会飞的纸盒-博客园http://www.cnblogs.com/jianyuan/p/Spark%E7%B3%BB%E5%88%97%E4%B9%8BDAGScheduler%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86.html1、textFile方法的实现内部先通过hadoopFile创建HadoopRDD(key
Spark璇诲啓GBK鏂囦欢杩欎釜璇ュ彨浠�涔堝憿
Spark璇诲彇GBK鏂囦欢sc.hadoopFile(path,classOf[TextInputFormat],classOf[LongWritable],classOf[Text],1).map(p=>newString(p._2.getBytes,0,p._2.getLength,"GBK"))Spark鍐橤BK鏂囦欢valresult:RDD[(NullWritable,Text)]=t
Spark学习之数据读取与保存总结(二) |旧市拾荒|
8、Hadoop输入输出格式除了Spark封装的格式之外，也可以与任何Hadoop支持的格式交互。Spark支持新旧两套Hadoop文件API，提供了很大的灵活性。要使用新版的HadoopAPI读入一个文件，需要告诉Spark一些东西。newAPIHadoopFile接收一个路径以及三个类。第一个类是“格式”类，代表输入格式。相似的函数hadoopFile()则用于使用旧的API实现的Hadoop
12.spark sql之读写数据菲立思教育 SparkSQL Parquet JSON
简介 SparkSQL支持多种结构化数据源，轻松从各种数据源中读取Row对象。这些数据源包括Parquet、JSON、Hive表及关系型数据库等。当只使用一部分字段时，SparkSQL可以智能地只扫描这些字段，而不会像hadoopFile方法一样简单粗暴地扫描全部数据。Parquet Parquet是一种流行的列式存储格式，可以高效地存储具有嵌套字段的记录。Parquet自动保存原始数据的
sqoop 基础 wjl7813 Sqoop
Sqoop产生背景1)RDBMS==>Hadoopfile==>loadhiveshell==>file==>HDFSMapReduce:DBInputFormatTextOutputFormat2)Hadoop==>RDBMSMapReduce:TextInputFormatDBOutputFormat存在的问题1)MR麻烦2)效率低：新的业务线写一个MR==>抽取一个框架1)RDBMS层面的:
记录我的hadoop学习历程2--运行 wordcount dark_guo hadoop
首先启动sh/usr/local/hadoop/sbin/start-all.sh导入数据到hdfs（当前位置为hadoop根目录）1、创建数据仓库目录./bin/hadoopdfs-mkdir-p/user/guoyakui/hadoopfile即：./bin/hadoopdfs-mkdir-p/user/用户名/自定义文件夹2、拷贝数据到数据仓库./bin/hadoopdfs-copyFrom
HDFS常用命令 iteye_13851 大数据
bin/hdfsdfs命令appendToFileUsage:hdfsdfs-appendToFile...追加一个或者多个文件到hdfs制定文件中.也可以从命令行读取输入.·hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile·hdfsdfs-appendToFilelocalfile1localfile2/user/hadoop/hadoop
Hadoop Streaming 实战： bash脚本尧山少侠
streaming支持使用脚本作为map、reduce程序。以下介绍一个实现分布式的计算所有文件的总行数的程序 1.待检索的数据放入hdfs $hadoopfs-putlocalfile/user/hadoop/hadoopfile 2.编写map、reduce脚本,记得给脚本加可执行权限。 mapper.sh #!/bin/sh wc–l red
hadoop hdfs dfs 命令讲解大数据的未来大数据
hdfsdfs命令appendToFileUsage:hdfsdfs-appendToFile...追加一个或者多个文件到hdfs制定文件中.也可以从命令行读取输入.·hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile·hdfsdfs-appendToFilelocalfile1localfile2/user/hadoop/hadoopfile
hadoop streaming用法注意 emili 框架 hadoop shell jar 脚本任务
grep： hadoopstreaming-input/user/hadoop/hadoopfile-output/user/hadoop/result-mapper"grephello"-jobconfmapre.job.name="grep-test"-jobconfstream.non.zero.exit.is.failure=false-jobconfmapred.reduce.tas
Hadoop Streaming 实战： bash脚本 yfkiss hadoop 脚本 bash input 任务
streaming支持使用脚本作为map、reduce程序。以下介绍一个实现分布式的计算所有文件的总行数的程序 1.待检索的数据放入hdfs $hadoopfs-putlocalfile/user/hadoop/hadoopfile 2.编写map、reduce脚本,记得给脚本加可执行权限。 mapper.sh #!/bin/shwc–l reduc
Hadoop Streaming 实战： grep yfkiss 框架 hadoop shell 脚本任务
streaming支持shell命令的使用。但是，需要注意的是，对于多个命令，不能使用形如cat;grep之类的多命令，而需要使用脚本，后面将具体介绍。下面示例用grep检索巨量数据： 1.待检索的数据放入hdfs $hadoopfs-putlocalfile/user/hadoop/hadoopfile 使用方法：hadoopfs-put... 从本地文件系
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

hadoop中的文件接口类-- SequenceFile

你可能感兴趣的:(hadoopFile)