tankles

Hadoop学习笔记

前段时间，学习了一下Hadoop MapReduce，这里进行简单的总结，主要来自于《Hadoop In Action》。

后续将按照Hadoop处理的顺序整理一些笔记，主要包括：

（1）Hadoop预定义数据类型；

（2）Hadoop InputFormat；

（3）Hadoop Mapper；

（4）Hadoop Partitioner（洗牌）；

（5）Hadoop Reducer；

（6）Hadoop OutputFormt；

（7）Hadoop Driver (驱动程序)；

（8）Hadoop Combiner；

（9）Hadoop Pipes；

（10）Hadoop Streaming；

（11）Aggregate；

其它更高级应用，如数据连接等请自行参阅相关书籍，《Hadoop In Action》、《Hadoop 权威指南》等。

一、Hadoop数据类型

Hadoop预定义了一些类用于实现WritableComparable，主要包括面向基本类型的封装类：

       BooleanWritable 标准布尔变量的封装
       ByteWritable      单字节数的封装
       DoubleWritable   双字节数的封装
       FloatWritable      浮点数的封装
       IntWritable         整数的封装
       LongWritable       Long的封装
       Text             使用UTF8格式的文本封装
       NullWritable        无键值时的占位符

       键和值可以自定义数据类型，Hadoop提供了Writable和WritableComparable接口，Writable实现的是序列化功能，WritableComparable实现了序列化和比较的功能。Hadoop要求键必须实现WritableComparatable<T>接口，值必须至少实现Writable接口。实现Writable接口的类可以是值，不能作为键，而实现WritableComparable<T>接口的类既可以是值也可以是键。

       下面实现一个类，用于表示一个网络的边界，比如代表两个城市之间的航线。Edge类实现了Writable接口的readFields和write方法，它们与java中的DataInput和DataOutput类实现内容的串行化，而Comparable接口实现的是compareTo方法。
   public class Edge implements WritableComparable<Edge>
   {
       private String departureNode ;
       private String arrivalNode ;
       public String getDepartureNode(){ return departureNode; }
       public String getArrivalNode() { return arrivalNode ; }

       @override
       public void readFields(DataInput in) throws IOException
       {
           departureNode = in.readUTF() ;
           arrivalNode = in.readUTF() ;
       }
       @override
       public void write(DataOutput out) throws IOException
       {
           out.writeUTF(departureNode) ;
           out.writeUTF(arrivalNode) ;
       }
       @override
       public int compareTo(Edge 0)
       {
           return (departureNode.compareTo(o.depatrueNode)!=0) ? departureNode.compareTo(o.departureNode): arrivalNode.compareTo(o.arrivalNode) ;
       }
   }

通常使用Hadoop，预定义类型基本满足需要，通过Hadoop数据类型的学习，我们可以自定义数据类型，从而根据需求进行扩充。

二、InputFormat

    Hadoop分割与读取输入文件的方式被定义为InputFormat接口的一个实现中，TextInputFormat是InputFormat的默认实现。
   Hadoop预定义的一些InputFormat类：
       TextInputFormat       在文本文件中的每行一个记录，key为一行的字节偏移，值为一行的内容。ey: LongWritable, Value:Text
       KeyValueTextInputFormat   文本文件中每行是一个记录，以每行的第一个分隔符为界，分隔符前的为键，分割符后的为值，分隔符由key.value.separator.in.input.line中设定，默认为'\t'
       SequenceFileInputFormat<K, V>   用于读取序列文件的InputFormat，键值类型有用户定义，序列文件为hadoop专用的压缩二进制格式，专用于一个MapReduce作业和其它MapReduce作业之间传送数据
       NLineInputFormat   与TextInputFormat相同，但每个分片一定有N行，N由mapred.line.input.format.linespermap中设定，默认为1，key: LongWritable, Value:Text

   MapReduce输入格式由 conf.setInputFormat(KeyValueTextInputFormat.class) ; 设定。


2. 生成一个定制的InputFormat --- InputSplit和RecordReader
   如果Hadoop提供的InputFormat类不能满足需要，则必须编写自定义的InputFormat类，InputFormat主要完成2件事情：
   1）确定所有用于输入数据的文件，并将之分割为输入分片，每个map任务分配一个分片；
   2）提供一个RecordReader对象，循环提取给定分片中的记录，并解析每个记录为预定义类型的键和值；

   public interface InputFormat<K, V>
   {
       InputSplit[] getSplits(JobConf job, int numSplits) throws IOException;
       RecordReader<K, V> getRecordReader(InputSplit split, JobConf job, Reporter reporter) throws IOException;
   }

   FileInputFormat类实现了InputFormat中的getSplits方法，保留getRecordReader抽象让子类实现，所以在创建InputFormat子类时，最好从负责文件分割的FileInputFormat类中继承，其中有一个isSplitable(FileSystem fs, Path filename)方法，检查是否将给定文件分片，默认返回true，正如压缩文件，如果不对文件进行拆分，则返回false。
   使用FileInputFormat时，只需要关注RecordReader，它负责把一个输入分片解析为一条一条的记录，转变成键值对。

   public interface RecordReader<K, V>
   {
       bool next(K key, V value) throws IOException ;
       K createKey() ;
       V createValue() ;
       long getPos() throws IOException ;
       public void close() throws IOException ;
       float getProgress() throws IOException ;
   }
   预定义的RecordReader有：
       LineRecordReader用于TextInputFormat中每次读取一行，以字节偏移作为键，行的内容作为值。
       KeyValueRecordReader用于KeyValueTextInputFormat

   自定义的RecordReader痛处基于现有实现，并把大多数操作放在next（）函数中。

   public class TimeUrlTextInputFormat extends FileInputFormat<Text, URLWritable>
   {
       public RecordReader<Text, URLWritable> getRecordReader(InputSplit input, JobConf job, Reporter reporter) throws IOException
       {
           return new TimeUrlLineRecordReader(job, (FileSplit)input) ;
       }
   }

   public class URLWritable implements Writable
   {
       protected URL url ;
       public URLWritable(){}
       public URLWritable(URL url){ this.url = url;}
       public void write(DataOutput out) throws IOException
       {
           out.writeUTF(url.toString()) ;
       }
       public void readFields(DataInput in) throws IOException
       {
           url = new URL(in.readUTF()) ;
       }
       public void set(String s) throws MalformadURLException
       {
           url = new URL(s) ;
       }
   }
   class TimeUrlLineRecordReader implements RecordReader<Text, URLWritable>
   {
       private KeyValueLineRecordReader lineReader ;
       private Text lineKey, lineValue ;
       public TimeUrlLineRecordReader(JobConf job, FileSplit split) throws IOException
       {
           lineReader = new KeyValueLineRecordReader(job, split) ;
           lineKey = lineReader.createKey() ;
           lineValue = lineReader.createValue() ;
       }
       public boolean next(Text key, URLWritable value) throws IOException
       {
           if(!lineReader.next(lineKey, lineValue))
           {
               return false ;
           }
           key.set(lineKey) ;
           value.set(lineValue.toString()) ;
           reurn true ;
       }
       public Text createKey()
       {
           return new Text("") ;
       }
       public URLWritable createValue()
       {
           return new URLWritable() ;
       }
       public long getPos() throws IOException
       {
           return lineReader.getPos() ;
       }
       public float getProgress() throws IOExcepton
       {
           reutrn lineReader.getProgress() ;
       }
       public void close() throws IOException
       {
           lineReader.close();
       }
   }

三、Mapper

一个类要作为Mapper，需要继承MapReduceBase基类并实现Mapper接口。

MapReduceBase基类主要提供以下2个函数接口：

            void configure(JobConf job): 函数提取XML配置文件或者应用程序主类中的参数，在数据处理前调用该函数。
            void close(): 作为map任务结束前的最后一个操作，完成守卫工作，如关闭数据库或文件等。
        Mapper接口负责数据处理节点，形式为Mapper<K1, V1, K2, V2>的Java泛型，Mapper只有一个方法map，用于处理一个单独的键值对。
      void map(K1 key, V1 value, OutputCollector<K2, V2> output, Reporter reporter) throws IOException
        该函数处理一个给定的键值对（K1，V1），生成一个键值对（K2,V2）列表（可能为空）；OutputCollector接收这个映射的输出，Reporter提供对mapper相关信息的记录，行程任务进度。
        Hadoop提供的一些预定义的mapper实现：
   IdentityMapper<K, V>   实现Mapper<K, V, K, V>，将输入直接映射到输出
   InverseMapper<K, V>       实现Mapper<K, V, V, K>，反转键值对
           RegexMapper<K>        实现Mapper<K, Text, Text, LongWritable>，为每个常规表达式的匹配生成一个(match, 1)对
      TokenCountMapper<K>   实现Mapper<K, Text, Text, LongWritable>,当输入的值为分词时，生成一个（token，1）键值对。

单词统计的Map程序如下（Reduce程序见Reducer）：
public class WordCount extends Configured implements Tool
{
   public static class MapClass extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable>
   {
       private final static IntWritable one = new IntWritable(1) ;
       private Text word = new Text() ;
       public void map(LongWritable key, Text value,
                  OutputCollector<Text, IntWritable> output,
                  Reporter reporter) throws IOException
       {
           String line = value.toString() ;
           StringTokenizer itr = new StringTokenizer(line) ;
           while(itr.hasMoreTokens())
           {
               word.set(itr.nextToken()) ;
               output.collect(word, one) ;
           }
       }

}

四、Partitioner

      当使用多个Reducer时，需要将Mapper产生的键值对进行散列来确定发送到哪个Reducer，Hadoop通过HashPartitioner类根据Mapper键强制执行这个策略，所以有时HashPartitioner不能满足需求。例如：使用Edge类分析航班信息决定从各个机场离港的乘客数目，我们希望具有相同离港地的所有Edge送往相同的Reducer，所以将产生错误的统计。这里只要对Edge类的departureNode成员进行散列就可以了。
      一个定制的partitioner只需要实现configure()和getPartition()两个函数，前者将Hadoop对作业的配置应用在partitioner上，后者返回一个介于0和reduce任务数之间的整数，指向键值对将要发送的reducer。
   public class EdgePartitioner implements Partitioner<Edge, Writable>
   {
       @override
       public int getPartition(Edge key, Writable value, int numPartitions)
       {
           return key.getDepartureNode().hashCode() % numPartitions ;
       }
       @override
       public void configure(JobConf conf)
       {
       }
   }

五、Reducer

1、Reducer
   Reducer也必须从MapReduceBase基类扩展，实现Reducer接口中的reduce函数
   void reduce(K2 key,
               Iterator<V2> values,
               OutputCollector<K3, V3> output,
               Reporter reporter) throws IOException

   Hadoop将mapper输出的键值对根据键进行排序，并将相同的键值归并，然后调用reduce函数，并通过迭代进行处理。   OutputCollector接收reduce阶段的输出，并写入输出文件，Reporter可提供对reducer的相关信息的记录，行程任务进度。
   Hadoop提供的预定义Reducer：
   IdentityReducer<K, V>   实现Reducer<K, V, K, V>，将输入直接映射到输出
   LongSumReducer<K>        实现Reducer<K, LongWritable, K, LongWritable>,计算与给定键对应的所有值的和。

单词统计MapReduce程序如下：

   public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable>
   {
       public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException
       {
           int sum = 0 ;
           while(values.hasNext())
           {
               sum += vlaues.next().get() ;
           }
           output.collect(key, new IntWritable(sum)) ;
       }

   }
}

六、OutputFormat

    MapReduce输出数据到文件时，使用的是OutputFormat类，每个reducer仅需将它的输出写到自己的文件中，输出无需分片；RecordWriter对象将输出结果格式化写入文件中。
   Hadoop提供几个标准的OutputFormat实现，通常都是从FileOutputFormat中继承来的，可以通过JobConf中的setOutputFormat定制OutputFormat。默认为TextOutputFormat。
       TextOutputFormat<K, V> 将每个记录写为一行，键和值以字符串的形式写入，并以制表符'\t'分隔，在mapred.textoutputformat.separator中设置，与KeyValueTextInputFormat相对应。
       SequenceFileOutputFormat<K, V> 以Hadoop专有序列文件格式写入键值对，与SequenceFileInputFormat配合使用。

七、Driver

    Hadoop提供GenericOptionsParser支持作业配置参数通过运行时指定，Hadoop框架提供了ToolRunner、Tool和Configured来简化标准配置参数选项的读取。

   public class MyDriver extends Configured implements Tool
   {
       public int run(String[] args) throws Exception
       {
           Configuration conf = getConf() ;
           JobConf job = new JobConf(conf, MyDriver.class) ;
           Path in = new Path(args[10]) ;
           Path out = new Path(args[1]) ;
           FileInputFormat.setInputPaths(job, in) ;
           FileOutputFormat.setOutputPath(job, out) ;

           job.setJobName("MyDriver") ;
           job.setMapperClass(MapperClass.class) ;
           job.setReduerClass(ReducerClass.class) ;

           job.setInputFormat(KeyValueTextInputFormat.class) ;
           job.setOutputFormat(TextOutputFormat.class) ;
           job.setOutputKeyClass(Text.class) ;
           job.setOutputValueClass(Text.class) ;

           job.set("key.value.separtor.in.input.line", ",") ;
           JobClient.runJob(job) ;

           return 0 ;
       }
       public static void main(String[] args) throws Exception
       {
           int res = ToolRunner.run(new Configuration(), new MyDriver, args) ;
           System.exit(res) ;
       }
   }

   run方法中，实例化、配置并传递一个JobConf对象命名的作业给JobClient.runJob()以启动MapReduce作业（JobClient类与JobTracker通信，使作业在集群上启动执行）。JobConf对象保持作业运行需要的全部配置参数。

八、Combiner

    Combiner在数据的转换上必须与Reducer等价，如果去掉combiner，reduer的输出应该相同。对于分配型操作，如：最大值，通常Combiner和Reduer相同，单对于其他操作，如平均值，需要定制combiner，下面提供了一个计算平均值的MapReduce程序及Combiner。

   Combiner必须实现Reducer接口，在Combiner的reduce方法中实现了合并操作。

   计算平均值的Combiner：
   public static class CombinerClass extends MapReduceBase implements Reducer<Text, Text, Text, Text>
   {
       public void reduce(Text key, Iterator<Text> values, OutputCollector<Text, Text> output, Reporter reporter) throws IOException
       {
           double sum = 0;
           int count = 0 ;
           while(values.hasNext())
           {
               String[] fieldds = values.next().toString().split(",") ;
               sum += Double.parseDouble(fields[0]) ;
               count += Integer.parseInt(fields[1]) ;
           }
           output.collect(key, new Text(sum+","+count)) ;
       }
   }
   在Driver中设置JobConf的Combiner类，
   job.setCombinerClass(CombierClass.class) ;

   MapReduce框架使用它的次数可以是0、1或者多次。Combiner未必会提供性能，需要监控作业的行为来判断。



   ///计算平均值的MapReduce程序////////////////////////////////////
   public static class MapperClass extends MapReduceBase implements Mapper<LongWritable, Text, Text, Text>
   {
       public void map(LongWritable key, Text value, OuputCollector<Text, Text> output, Reporter reporter) throws IOException
       {
           String[] fields = value.toString().split(",", -20) ;
           String country = fields[4] ;
           String numClaims = fields[8] ;
           if(numClaims.length()>0 && !numClaims.startWith("\"))
           {
               output.collect(new Text(country), new Text(numClaims+",1")) ;
           }
       }
   }

   public static class ReduerClass extends MapReduceBase implements Reduer<Text, Text, Text, DoubleWritable>
   {
       public void reduce(Text key, Iterator<Text> values, OutputCollector<Text, DoubleWritable> output, Repoter reporter) throws IOException
       {
           double sum = 0 ;
           int count = 0 ;
           while(values.hasNext())
           {
               String[] fields = values.next().toString().split(",") ;
               sum += Double.parseDouble(fields[0]) ;
               count += Integer.parseInt(fields[1]) ;
           }
           output.collect(key, new DoubleWritable(sum/count)) ;
       }
   }

九、Pipes

    Hadoop Pipes是Hadoop MapReduce的C++接口的代称，使用套接字(socket)作为tasktracker与c++版本的map函数或reduce函数的进程之间的通道。
   通过扩展HadoopPipe说命名空间中定义的Mapper和Reducer两个类，我们定义了map和reduce函数，其中使用了上下文对象(MapContext、ReduceContext和构造函数中使用了TaskContext)，来读取输入和写如输出及通过JobConf来访问作业的配置信息等。
   C++接口中的键和值都按照字节缓冲，采用了stl::string表示。Had哦哦品Pipes::runTask函数连接到java父进程，并在mapper和reducer之间传送数据，runtask函数出入一个Factory参数，由此新建mapper和reducer实例，也可以用重载模板factory设置combiner、partitioner、recored reader和record writer。

   下面为《Hadoop权威指南》中的最高气温的C++ MapReduce程序：
   #include <algorithm>
   #include <limits>
   #include <stdint.h>
   #include <string>

   #include "hadoop/Pipes.hp"
   #include "hadoop/TemplateFactory.hh"
   #include "hadoop/StringUtils.hh"

   using namespace std ;

   class MaxTemperatureMapper : public HadoopPipes::Mapper
   {
       public:
           MaxTemperatureMapper(HadoopPipes::TaskContext& context)
           {
           }
           void map(HadoopPipes::MapContext& context)
           {
               string line = context.getInputValue() ;
               string year = line.substr(15, 4) ;
               string airTemperature = line.substr(87, 5) ;
               string quality = line.substr(92, 1) ;
               if (airTemperature != "+9999" && (q == "0" || q == "1" || q == "4" || q == "5" || q == "9")
               {
                   context.emit(year, airTemperature) ;
               }
           }
   } ;
   class MaxTemperatureReducer : public HadoopPipes::Reducer
   {
   public:
       MaxTemperatureReducer(HadoopPipes::TaskContext& context)
       {
       }
       void reduce(HadoopPipes::ReduceContext& context)
       {
           int maxValue = INT_MIN ;
           while(context.nextValue())
           {
               maxValue = std::max(maxValue, HadoopUtils::toInt(context.getInputValue()) ;
           }
           context.emit(context.getInputKey(), HadoopUtils::toString(maxValue)) ;

       }
   };

   int main(int argc, char** argv)
   {
       return HadoopPipes::runTask(HadoopPipes::TemplateFactor<MaxTemperatureMapper, MaxTemperatureReducer>()) ;
   }

   使用Makefile编译运行程序：
   Makefile文件如下：
   CC = g++
   CPPFLAGS = -m32 -I$(HADOOP_INSTALL)/c++/$(PLATFORM)/include
   max_temperature : max_temperature.cpp
       $(CC) $(CPPFLAGS) $< -Wall -L$(HADOOP_INSTALL)/c++/$(PLATFORM)/lib -lhadooppipes -lhadooputils -lpthread -g -O2 -o $@
   # end of makefile



   PLATFORM 指定了操作系统、体系结构和数据模型（32bits or 64bits），在32位Linux系统的机器编译运行如下：
   % export PLATFORM=Linux-i386-32
   % make # 编译出max_temperature可执行文件

   Pipes不能在Standalone方式下运行，因为它依赖于Hadoop的分布式缓存机制，该机制只有在HDFS运行时才有效。

   % hadoop fs -put max_temperature bin/max_temperature # 将可执行文件复制到HDFS
   # 使用hadoop pipes命令运行，-program参数标明在HDFS中的可执行文件的URI
   % hadoop pipes \
       -D hadoop.pipes.java.recordreader=true \
       -D hadoop/pipes.java.recordwriter=ture \
       -input sample.txt \
       -output output \
       -program bin/max_temperature

十、Streamming

    Hadoop Streaming使用Unix标准输入/输出作为Hadoop和应用程序之间的接口，所以能够使用任何编程语言通过stdin/stdout来编写MapReduce程序。
   map函数通过标准输入读取数据，并将结果写到标准输出，map函数输出的键/值对是以一个制表符('\t')分割的行；
   reduce函数从标准输入读取，通过制表符('\t')分割的键/值对，该输入已由Hadoop框架根据键排过序，最后将结果写入标准输出。
   streaming方式的脚本很容易在linux shell下执行。

   下面是python使用hadoop streaming的MapReduce程序：
   #!/usr/bin/env python
   # python map函数

   import re, sys
   for line in sys.stdin:
       val = line.strip()
       (year, temp, quality) = (val[15:19], val[87:92], val[92:93])
       if ( temp != "+9999" and re.match("[01459]", quality)):
           print "%s\t%s" % (year, temp)


   #!/usr/bin/env python
   # python reduce函数
   import sys
   (last_key, max_val) = (None, 0)
   for line in sys.stdin:
       (key, val) = line.strip().split('\t')
       if last_key and last_key != key:
           print "%s\t%s" % (last_key, max_val)
           (last_key, max_val) = (key, int(val)
       else:
           (last_key, max_val) = (key, max(max_val, int(val))

   if last_key:
       print "%s\t%s" % (last_key, max_val)

   在shell上运行python程序：
   % cat sample.txt | max_temperature_map.py | sort | max_temperature_reduce.py

   在Hadoop上运行python程序：
   % hadoop jar $HADOOP_INSTALL/contrib/streaming/hadoop-streaming-1.0.1.jar \
       -input input   \
       -output output \
       -mapper max_temperature_map.py \
       -reducer max_temperature_reduce.py \
       -file max_temperature_map.py
       -file max_temperature_reduce.py

   # -file选项将脚本程序传输到集群上。

十一、通过Aggregate包使用Streaming

    Hadoop包括一个称谓Aggregate的软件包，它让数据集的汇总统计更为简单，尤其在使用Streaming时。Streaming中Aggregate包作为reduer来做聚集统计，只需要提供一个mapper处理记录，并以特定格式输出，mapper输出的每行格式如下：
   function: key \t value
   function为一个聚合函数的名称（Aggregate包中预定义的函数），紧邻一个冒号和一个以制表符分隔的键值对。
   ValueHistogram的输出格式稍有不同：
       ValueHistogram: key \t value \t count
   count默认为1，可以不输出

   Aggregate包支持的值聚合器函数：
       DoubleValueSum:   一个double值序列的求和
       LongValueSum:   一个long值序列的求和
       LongValueMax：   求一个long值序列的最大值
       LongValueMin:       求一个long值序列的最小值
       StringValueMax:   求一个String序列的字母序最大值
       StringValueMin:   求一个String序列的字母序最小值
       UniqValueCount:   为每个键求但一值的个数
       ValueHistogram:   求每个值的个数、最小值、中值、最大值、平均值和标准方差。


   AttributeCount.py:
   #!/usr/bin/env python
   import sys
   index = int(sys.argv[1])
   for line in sys.stdin:
       fields = line.split(",")
       print "LongValueSum:" + fields[index] + "\t" + "1"

   hadoop jar hadoop-streaming.jar
       -input input
       -output output
       -file AttributeCount.py
       -mapper 'AttributeCount.py 1'
       -reducer aggregate           # 这里指定为aggregate

   例子：
       1）Top K记录
           写程序使得MapReduce作业输出排序的前K个记录
       2）网络流量测量
           获取一个web服务器日志文件，使用Aggregate软件包写一个Streaming程序计算该站点每个小时的流量
       3）两个稀疏矩阵的内乘
           一个向量是一列值，给点2个向量，X=[x1, x2, ...]和Y=[y1, y2, ...]，它们内乘为Z=x1*y1+x2*y2+ ...，当X和Y中很多值为0时，通常表现为稀疏形式：
           1, 0.46
           9, 0.21
           17, 0.93
                 .
                 .
                .
           第一列为向量索引，第二列为值，其它项全部为0.
           写一个Streaming作业来计算2个稀疏向量的内乘，可以在MapReduce作业之后增加一个后处理的步骤完成计算。

       4）时序处理

   《参见Hadoop实战中文版》中第4章结尾联系实例。

        5）统计web日志中小时网络流量--streaming程序

    网络流量测量----获取一个web服务器的日志文件，并使用Aggregate软件包写一个Streaming程序来计算该站点每小时的流量

   分析：因为是使用Aggregate软件包的Streaming程序，所以只有Mapper，且Reducer采用的Aggregate的DoubleValueSum（或LongValueSum），Mapper输出格式为：
       DoubleValueSum：date \t net_traffic
   其中key为日期date（year-month-day-hour），value为一条记录的流量信息

总结：此文根据Hadoop的处理流程顺序大致介绍了几个操作，对Hadoop MapReduce程序的编写和数据分析处理有了基本的了解。

你可能感兴趣的:(mapreduce,hadoop,String,Class,作业,output)

代码随想录算法训练营第 16 天（树4）| 513.找树左下角的值、112. 路径总和i ii、106.从中序与后序遍历序列构造二叉树去薯条搞点码头代码随想录算法
一、#513.找树左下角的值关键思路：这个题使用层序遍历（迭代法）更容易一些解法一：递归法先求出深度最大的一层，然后找这一层最左边的节点此题用前序后序中序都可以，因为没有对根节点有操作，只要保证先是左再是右就行classSolution{intmaxDepth=-1;//记录最大深度intres=0;//记录最大深度的值publicintfindBottomLeftValue(TreeNodero
`std::make_shared` 无法直接用于单例模式，因为它需要访问构造函数，而构造函数通常是私有的课堂随想 QT 单例模式 c++
std::make_shared在创建对象时会调用构造函数，而在单例模式下，构造函数通常是私有的，因此不能直接通过std::make_shared来创建对象。为什么std::make_shared不适用于单例模式？在单例模式中，我们希望确保一个类只有一个实例，并且通常会将构造函数设为私有或删除，以防止外部直接创建对象。例如：classSingleton{private:Singleton()=de
unity dotween 颜色大小位置透明度的改变南极冰魄 Dotween
usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;usingUnityEngine.UI;usingDG.Tweening;//点击按钮，UI动画publicclassColorMove:MonoBehaviour{publicImageban;//图片privateboolisTrue=true;//
hive数据类型 qzWsong hive
数字类型TINYINT(1字节整数)SMALLINT(2字节整数)INT/INTEGER(4字节整数)BIGINT(8字节整数)FLOAT(4字节浮点数)DOUBLE(8字节双精度浮点数)示例：createtablet_test(astring,bint,cbigint,dfloat,edouble,ftinyint,gsmallint)时间类型TIMESTAMP(时间戳)(包含年月日时分秒毫秒的
Flink之kafka消息解析器2 怎么才能努力学习啊 flink kafka 大数据
概要昨天的话题，FlinkSource消费kafka数据自定义反序列化，获取自己想要的数据和类型实现过程publicclassTestWithMetadataDeserializationSchemaimplementsKafkaRecordDeserializationSchema{第一步：自定义实现这个接口，这里的泛型一般的都是自定义类@Overridepublicvoiddeserializ
Java 23新特性：Class-File API leonidZhao java 开发语言
JEP466:Class-FileAPI(SecondPreview)JEP466:Class-FileAPI，该特性为第二次预览，在Java22中首次预览，并将在Java24中成为正式特性。目前已经存在一些工具可以处理类文件，例如ASM，BCEL，Javassist。该特性不是为了解决效率或代码分析问题，也不是CoreReflectionAPI的扩展。该特性的出现只是为了提供一个标准的类文件处理
AtCoder备赛刷题 ABC 363 | Avoid Palindrome 2 热爱编程的通信人 c++算法
学习C++从娃娃抓起！记录下AtCoder（日本算法竞技网站）备赛学习过程中的题目，记录每一个瞬间。附上汇总贴：AtCoder备赛刷题|汇总【ProblemStatement】YouaregivenastringSSSoflengthNNNconsistingonlyoflowercaseEnglishletters.给定一个长度为NNN的字符串SSS，仅由小写英文字母组成。Findthenumb
探秘BFKit-Swift：开发加速神器纪亚钧
探秘BFKit-Swift：开发加速神器BFKit-SwiftBFKit-Swiftisacollectionofusefulclasses,structsandextensionstodevelopAppsfaster.项目地址:https://gitcode.com/gh_mirrors/bf/BFKit-Swift在快速发展的移动应用领域，效率与质量是开发者永恒的追求。今天，让我们一起走进B
【大数据入门核心技术-Hive】（十六）hive表加载csv格式数据或者json格式数据 forest_long 大数据技术入门到21天通关大数据 hive hadoop 开发语言后端数据仓库
一、环境准备hive安装部署参考：【大数据入门核心技术-Hive】（三）Hive3.1.2非高可用集群搭建【大数据入门核心技术-Hive】（四）Hive3.1.2高可用集群搭建二、hive加载Json格式数据1、数据准备vistu.json[{"id":111,"name":"name111"},{"id":222,"name":"name22"}]上传到hdfshadoopfs-putstu.j
【JAVA】我和我的第一个“对象”相遇 2401_89791130 java 开发语言
表达式1必须是一个布尔表达式如果表达式1为真，那么执行表达式2，否则执行表达式3自我检验根据以下代码思考打印的结果是什么？publicclassTestDemo2{publicstaticvoidmain(String[]args){booleanflg=true==true?true:true==false?false:false;System.out.println(flg);booleanf
【Java 学习】Java抽象类详解：从理论到实践，带你迈向面向对象的深度思考！ Code哈哈笑 Java拾光之旅 java 学习开发语言
欢迎讨论：如对文章内容有疑问或见解，欢迎在评论区留言，我需要您的帮助！点赞、收藏与分享：如果这篇文章对您有所帮助，请不吝点赞、收藏或分享，谢谢您的支持！传播技术之美：期待您将这篇文章推荐给更多对需要学习Java语言、低代码开发感兴趣的朋友，让我们共同学习、成长！1.什么是抽象类？举一个Animal类、Cat类和Dog类的例子：classAnimal{publicvoideat(){System.o
vue视频流播放,支持多种视频格式，如rmvb、mkv BigData-0 vue.js 前端 javascript
先将视频转码为tsffmpeg-iC:\test\3.rmvb-codec:copy-start_number0-hls_time10-hls_list_size0-fhlsC:\test\a\output.m3u8后端配置接口importorg.springframework.core.io.Resource;importorg.springframework.core.io.UrlResour
【面试笔记】过河问题｜图论｜羊｜狼｜农夫｜BFS unity
题干要从A岸出发到B岸，A岸有M只羊、N只狼和1个农夫，船每一趟可载X只动物。有农夫看着、或则羊的数量大于狼，羊就不会被吃。请返回任一躺数最少方案。题解题目可转化为：在一个有向无路长的图中，在不知道各个节点之间如何连接的基础上，找到两个节点之间的最短路径。数据结构publicclassPack{publicintsheep;//羊的数量publicintwolf;//狼的数量publicintfa
SAP API开发方法大全
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
使用基于 WebRTC 的 JavaScript API 在浏览器环境里调用本机摄像头
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
typescript（四）ts中函数的参数和返回值的类型定义 web18296061989 前端 html javascript 前端 vue.js
前面我们讲到过ts的静态类型定义中的函数类型定义，先来回顾下：constfnA:()=>string=()=>{return'1'}constfnB:()=>number=()=>6constfnC:()=>boolean=()=>true拓展下：在接口中如何定义函数类型呢？接口后期会讲interfaceIfn{(one:number,two:number):number}letfniA:Ifnf
map转换成JSON的方法 web18296061989 java java 后端
第一种alibabafalstjson：1.Map转JSONMapmap=newHashMap();map.put("a","a");map.put("b","123");JSONObjectjson=newJSONObject(map);2.map转stringMapmap=newHashMapmap=(Map)json;5.String转JSONStringstr="{"username":"
Flutter：APP底部tabbar搭建 sunly_ Flutter flutter javascript 开发语言
main.dartimport'package:flutter/material.dart';import'package:weixin_demo/root_page.dart';voidmain(){runApp(constApp());}classAppextendsStatelessWidget{constApp({super.key});@overrideWidgetbuild(Build
Flutter 封装AppBar Spy97 Flutter flutter
在微信中，有4项：聊天、联系人、发现、我的其中前3项的appbar相同“我的”一项没有appbar，所以要对其进行封装import'package:flutter/material.dart';_popupMenuItem(Stringtitle,IconDataicon){returnPopupMenuItem(child:Row(children:[Padding(child:Icon(ico
B - 区间选点（贪心算法） e青青青
区间选点题意：数轴上有n个闭区间[a_i,b_i]。取尽量少的点，使得每个区间内都至少有一个点（不同区间内含的点可以是同一个输入输出：Input第一行1个整数N（N<=100），第2~N+1行，每行两个整数a,b（a,b<=100）Output一个整数，代表选点的数目解题思路：由于要选尽量少的点满足所有区间，所以重点是要判断有没有重叠部分。自定义结构体node记录区间的两个端点，用cmp函数将所有
uniapp H5+锁定和解除锁定屏幕方向及关闭应用启动界面及页面刷新流氓也是种气质 _Cookie uni-app H5+HTML5+重力感应
锁定屏幕方向plus.screen.lockOrientation(Stringorientation);说明：锁定屏幕方向后屏幕只能按锁定的屏幕方向显示，关闭当前页面后仍然有效。可再次调用此方法修改屏幕锁定方向或调用unlockOrientation()方法恢复到应用的默认值。plus.screen.lockOrientation('landscape-primary');锁定屏幕方向可取以下值
uniapp下拉菜单 h_6543210 uni-app 前端
一、示例图1.状态为多选，选中后显示已选择的数量，如下图：2.排序为单选，显示当前选中的名称，如下图：二、状态、排序相关代码部分代码使用了的uView组件Icon图标|uView2.0-全面兼容nvue的uni-app生态框架-uni-appUI框架0)?'yes-title':'no-title'">状态0"class="sumStyle">{{this.selectStateArr.lengt
Java中的常用方法 zhlantian java常用方法 java Java JAVA
第一章字符串1、获取字符串的长度：length()2、判断字符串的前缀或后缀与已知字符串是否相同前缀startsWith(Strings)、后缀endsWith(Strings)3、比较两个字符串：equals(Strings)4、把字符串转化为相应的数值int型Integer.parseInt(字符串)、long型Long.parseLong(字符串)float型Folat.valueOf(字符
java常用方法大全 yangyou55 java java
Java常用方法大全字符串1、获取字符串的长度length()2、判断字符串的前缀或后缀与已知字符串是否相同前缀startsWith(Strings)后缀endsWith(Strings)3、比较两个字符串equals(Strings)4、把字符串转化为相应的数值int型Integer.parseInt(字符串)long型Long.parseLong(字符串)float型Folat.valueOf
【MySQL】在MySQL中STR_TO_DATE()以及其他用于日期和时间的转换 m0_74825260 面试学习路线阿里巴巴 mysql android 数据库
1.在MySQL中STR_TO_DATE()在MySQL中，STR_TO_DATE()函数用于将字符串转换为日期格式。这个函数非常有用，当你需要将文本数据转换为可由MySQL日期和时间函数处理的格式时。1.1语法STR_TO_DATE()函数的基本语法如下：STR_TO_DATE(date_string,format_string)date_string：要转换的字符串。format_string
微信小程序开发，底部选择器使用浩宇软件开发微信小程序开发入门微信小程序小程序
文章目录1.官方文档使用指南2.功能描述3.具体代码逻辑实现4.运行效果图5.关于作者其它项目视频教程介绍1.官方文档使用指南使用指南：https://developers.weixin.qq.com/miniprogram/dev/component/picker.html2.功能描述从底部弹起的滚动选择器通用属性属性类型默认值必填说明最低版本header-textstring否选择器的标题，仅
Java中常用的方法()持续更新 yjlchn 笔记 Java笔记 java
第一章字符串1、获取字符串的长度：length()2、判断字符串的前缀或后缀与已知字符串是否相同前缀startsWith(Strings)、后缀endsWith(Strings)3、比较两个字符串：equals(Strings)4、把字符串转化为相应的数值int型Integer.parseInt(字符串)、long型Long.parseLong(字符串)float型Folat.valueOf(字符
Java学习，集合添加不同类型元素五味香 java 学习开发语言 python android kotlin golang
Java集合（Collections）框架，提供了一系列接口和类，用于存储和操作对象集合。大多数集合类（如ArrayList,HashSet,HashMap等）都是类型化的，它们只能存储特定类型的对象。有一些方法，可以在集合中“存储”不同类型的元素。示例：importjava.util.ArrayList;importjava.util.List;publicclassHeterogeneousC
Java学习，遍历HashTable键值五味香 java jvm 开发语言学习 python android kotlin
JavaHashTable是一个同步的键值对集合，适用于多线程环境。尽管HashTable不如HashMap常用，在需要线程安全场景，HashTable仍然有用。示例：importjava.util.Enumeration;importjava.util.Hashtable;publicclassHashTableExample{publicstaticvoidmain(String[]args)
C#中get和set方法踹断瘸子那条好腿. c#java 开发语言
在C#中，get和set是属性（Property）的访问器（Accessor）。它们用于控制对属性的读取和写入操作。当您定义一个属性时，可以使用get和set关键字定义属性的访问器。以下是属性的基本结构，包括get和set访问器：publicclassMyClass{ privateintmyField;//私有字段 //属性 publicintMyProperty { get {
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那