sparkjvm

HDFS benchmark 基准测试

一. Hadoop基准测试

Hadoop自带了几个基准测试，被打包在几个jar包中。本文主要是cloudera版本测试
[hsu@server01 ~]$ ls /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop* | egrep "examples|test"
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples-2.5.0-mr1-cdh5.2.0.jar
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test-2.5.0-mr1-cdh5.2.0.jar
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar

(1)、Hadoop Test
当不带参数调用hadoop-test-0.20.2-cdh3u3.jar时，会列出所有的测试程序：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar
An example program must be given as the first argument.
Valid program names are:
DFSCIOTest: Distributed i/o benchmark of libhdfs.
DistributedFSCheck: Distributed checkup of the file system consistency.
MRReliabilityTest: A program that tests the reliability of the MR framework by injecting faults/failures
TestDFSIO: Distributed i/o benchmark.
dfsthroughput: measure hdfs throughput
filebench: Benchmark SequenceFile(Input|Output)Format (block,record compressed and uncompressed), Text(Input|Output)Format (compressed and uncompressed)
loadgen: Generic map/reduce load generator
mapredtest: A map/reduce test check.
minicluster: Single process HDFS and MR cluster.
mrbench: A map/reduce benchmark that can create many small jobs
nnbench: A benchmark that stresses the namenode.
testarrayfile: A test for flat files of binary key/value pairs.
testbigmapoutput: A map/reduce program that works on a very big non-splittable file and does identity map/reduce
testfilesystem: A test for FileSystem read/write.
testmapredsort: A map/reduce program that validates the map-reduce framework's sort.
testrpc: A test for rpc.
testsequencefile: A test for flat files of binary key value pairs.
testsequencefileinputformat: A test for sequence file input format.
testsetfile: A test for flat files of binary key/value pairs.
testtextinputformat: A test for text input format.
threadedmapbench: A map/reduce benchmark that compares the performance of maps with multiple spills over maps with 1 spill

这些程序从多个角度对Hadoop进行测试，TestDFSIO、mrbench和nnbench是三个广泛被使用的测试。

(2) TestDFSIO write

TestDFSIO用于测试HDFS的IO性能，使用一个MapReduce作业来并发地执行读写操作，每个map任务用于读或写每个文件，map的输出用于收集与处理文件相关的统计信息，reduce用于累积统计信息，并产生summary。TestDFSIO的用法如下：
TestDFSIO
Usage: TestDFSIO [genericOptions] -read | -write | -append | -clean [-nrFiles N] [-fileSize Size[B|KB|MB|GB|TB]] [-resFile resultFileName] [-bufferSize Bytes] [-rootDir]

以下的例子将往HDFS中写入10个1000MB的文件：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar TestDFSIO -write -nrFiles 10 -fileSize 1000
15/01/13 15:14:17 INFO fs.TestDFSIO: TestDFSIO.1.7
15/01/13 15:14:17 INFO fs.TestDFSIO: nrFiles = 10
15/01/13 15:14:17 INFO fs.TestDFSIO: nrBytes (MB) = 1000.0
15/01/13 15:14:17 INFO fs.TestDFSIO: bufferSize = 1000000
15/01/13 15:14:17 INFO fs.TestDFSIO: baseDir = /benchmarks/TestDFSIO
15/01/13 15:14:18 INFO fs.TestDFSIO: creating control file: 1048576000 bytes, 10 files
15/01/13 15:14:19 INFO fs.TestDFSIO: created control files for: 10 files
15/01/13 15:15:23 INFO fs.TestDFSIO: ----- TestDFSIO ----- : write
15/01/13 15:15:23 INFO fs.TestDFSIO: Date & time: Tue Jan 13 15:15:23 CST 2015
15/01/13 15:15:23 INFO fs.TestDFSIO: Number of files: 10
15/01/13 15:15:23 INFO fs.TestDFSIO: Total MBytes processed: 10000.0
15/01/13 15:15:23 INFO fs.TestDFSIO: Throughput mb/sec: 29.67623230554649
15/01/13 15:15:23 INFO fs.TestDFSIO: Average IO rate mb/sec: 29.899526596069336
15/01/13 15:15:23 INFO fs.TestDFSIO: IO rate std deviation: 2.6268824639446526
15/01/13 15:15:23 INFO fs.TestDFSIO: Test exec time sec: 64.203
15/01/13 15:15:23 INFO fs.TestDFSIO:

(3) TestDFSIO read
以下的例子将从HDFS中读取10个1000MB的文件：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar TestDFSIO -read -nrFiles 10 -fileSize 1000
15/01/13 15:42:35 INFO fs.TestDFSIO: TestDFSIO.1.7
15/01/13 15:42:35 INFO fs.TestDFSIO: nrFiles = 10
15/01/13 15:42:35 INFO fs.TestDFSIO: nrBytes (MB) = 1000.0
15/01/13 15:42:35 INFO fs.TestDFSIO: bufferSize = 1000000
15/01/13 15:42:35 INFO fs.TestDFSIO: baseDir = /benchmarks/TestDFSIO
15/01/13 15:42:36 INFO fs.TestDFSIO: creating control file: 1048576000 bytes, 10 files
15/01/13 15:42:37 INFO fs.TestDFSIO: created control files for: 10 files

(4) 清空测试数据
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar TestDFSIO -clean
15/01/13 15:46:51 INFO fs.TestDFSIO: TestDFSIO.1.7
15/01/13 15:46:51 INFO fs.TestDFSIO: nrFiles = 1
15/01/13 15:46:51 INFO fs.TestDFSIO: nrBytes (MB) = 1.0
15/01/13 15:46:51 INFO fs.TestDFSIO: bufferSize = 1000000
15/01/13 15:46:51 INFO fs.TestDFSIO: baseDir = /benchmarks/TestDFSIO
15/01/13 15:46:52 INFO fs.TestDFSIO: Cleaning up test files

(4) nnbench测试
nnbench用于测试NameNode的负载，它会生成很多与HDFS相关的请求，给NameNode施加较大的压力。这个测试能在HDFS上模拟创建、读取、重命名和删除文件等操作。nnbench的用法如下：

以下例子使用12个mapper和6个reducer来创建1000个文件：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar nnbench -operation create_write -maps 12 -reduces 6 -blockSize 1 -bytesToWrite 0 -numberOfFiles 1000 -replicationFactorPerFile 3 -readFileAfterOpen true -baseDir /benchmarks/NNBench-`hostname -s`
NameNode Benchmark 0.4
15/01/13 15:53:33 INFO hdfs.NNBench: Test Inputs:
15/01/13 15:53:33 INFO hdfs.NNBench: Test Operation: create_write
15/01/13 15:53:33 INFO hdfs.NNBench: Start time: 2015-01-13 15:55:33,585
15/01/13 15:53:33 INFO hdfs.NNBench: Number of maps: 12
15/01/13 15:53:33 INFO hdfs.NNBench: Number of reduces: 6
15/01/13 15:53:33 INFO hdfs.NNBench: Block Size: 1
15/01/13 15:53:33 INFO hdfs.NNBench: Bytes to write: 0
15/01/13 15:53:33 INFO hdfs.NNBench: Bytes per checksum: 1
15/01/13 15:53:33 INFO hdfs.NNBench: Number of files: 1000
15/01/13 15:53:33 INFO hdfs.NNBench: Replication factor: 3
15/01/13 15:53:33 INFO hdfs.NNBench: Base dir: /benchmarks/NNBench-server01
15/01/13 15:53:33 INFO hdfs.NNBench: Read file after open: true
15/01/13 15:53:34 INFO hdfs.NNBench: Deleting data directory
15/01/13 15:53:34 INFO hdfs.NNBench: Creating 12 control files

15/01/13 15:56:06 INFO hdfs.NNBench: -------------- NNBench -------------- :
15/01/13 15:56:06 INFO hdfs.NNBench: Version: NameNode Benchmark 0.4
15/01/13 15:56:06 INFO hdfs.NNBench: Date & time: 2015-01-13 15:56:06,539
15/01/13 15:56:06 INFO hdfs.NNBench:
15/01/13 15:56:06 INFO hdfs.NNBench: Test Operation: create_write
15/01/13 15:56:06 INFO hdfs.NNBench: Start time: 2015-01-13 15:55:33,585
15/01/13 15:56:06 INFO hdfs.NNBench: Maps to run: 12
15/01/13 15:56:06 INFO hdfs.NNBench: Reduces to run: 6
15/01/13 15:56:06 INFO hdfs.NNBench: Block Size (bytes): 1
15/01/13 15:56:06 INFO hdfs.NNBench: Bytes to write: 0
15/01/13 15:56:06 INFO hdfs.NNBench: Bytes per checksum: 1
15/01/13 15:56:06 INFO hdfs.NNBench: Number of files: 1000
15/01/13 15:56:06 INFO hdfs.NNBench: Replication factor: 3
15/01/13 15:56:06 INFO hdfs.NNBench: Successful file operations: 0
15/01/13 15:56:06 INFO hdfs.NNBench:
15/01/13 15:56:06 INFO hdfs.NNBench: # maps that missed the barrier: 0
15/01/13 15:56:06 INFO hdfs.NNBench: # exceptions: 0
15/01/13 15:56:06 INFO hdfs.NNBench:
15/01/13 15:56:06 INFO hdfs.NNBench: TPS: Create/Write/Close: 0
15/01/13 15:56:06 INFO hdfs.NNBench: Avg exec time (ms): Create/Write/Close: 0.0
15/01/13 15:56:06 INFO hdfs.NNBench: Avg Lat (ms): Create/Write: NaN
15/01/13 15:56:06 INFO hdfs.NNBench: Avg Lat (ms): Close: NaN
15/01/13 15:56:06 INFO hdfs.NNBench:
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: AL Total #1: 0
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: AL Total #2: 0
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: TPS Total (ms): 0
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: Longest Map Time (ms): 0.0
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: Late maps: 0
15/01/13 15:56:06 INFO hdfs.NNBench: RAW DATA: # of exceptions: 0
15/01/13 15:56:06 INFO hdfs.NNBench:

(5) mrbench测试
mrbench会多次重复执行一个小作业，用于检查在机群上小作业的运行是否可重复以及运行是否高效。mrbench的用法如下：
MRBenchmark.1.7
Usage: mrbench [-baseDir ] [-jar ] [-numRuns ] [-maps ] [-reduces ] [-inputLines ] [-inputType ] [-verbose]

以下例子会运行一个小作业50次：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-test.jar mrbench -numRuns 50
MRBenchmark.0.0.2
15/01/13 16:17:19 INFO mapred.MRBench: creating control file: 1 numLines, ASCENDING sortOrder
15/01/13 16:17:20 INFO mapred.MRBench: created control file: /benchmarks/MRBench/mr_input/input_331064064.txt
15/01/13 16:17:20 INFO mapred.MRBench: Running job 0: input=hdfs://server01:8020/benchmarks/MRBench/mr_input output=hdfs://server01:8020/benchmarks/MRBench/mr_output/output_556018847

DataLines Maps Reduces AvgTime (milliseconds)
1 2 1 26748
以上结果表示平均作业完成时间是26秒。

(6) Hadoop Examples
除了上文提到的测试，Hadoop还自带了一些例子，比如WordCount和TeraSort，这些例子在hadoop-examples*.jar中。
[hsu@server01 ~]$ ls /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples*
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples-2.5.0-mr1-cdh5.2.0.jar
/opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar

执行以下命令会列出所有的示例程序：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar
An example program must be given as the first argument.
Valid program names are:
aggregatewordcount: An Aggregate based map/reduce program that counts the words in the input files.
aggregatewordhist: An Aggregate based map/reduce program that computes the histogram of the words in the input files.
bbp: A map/reduce program that uses Bailey-Borwein-Plouffe to compute exact digits of Pi.
dbcount: An example job that count the pageview counts from a database.
distbbp: A map/reduce program that uses a BBP-type formula to compute exact bits of Pi.
grep: A map/reduce program that counts the matches of a regex in the input.
join: A job that effects a join over sorted, equally partitioned datasets
multifilewc: A job that counts words from several files.
pentomino: A map/reduce tile laying program to find solutions to pentomino problems.
pi: A map/reduce program that estimates Pi using a quasi-Monte Carlo method.
randomtextwriter: A map/reduce program that writes 10GB of random textual data per node.
randomwriter: A map/reduce program that writes 10GB of random data per node.
secondarysort: An example defining a secondary sort to the reduce.
sort: A map/reduce program that sorts the data written by the random writer.
sudoku: A sudoku solver.
teragen: Generate data for the terasort
terasort: Run the terasort
teravalidate: Checking results of terasort
wordcount: A map/reduce program that counts the words in the input files.
wordmean: A map/reduce program that counts the average length of the words in the input files.
wordmedian: A map/reduce program that counts the median length of the words in the input files.
wordstandarddeviation: A map/reduce program that counts the standard deviation of the length of the words in the input files.

(7) TeraSort

一个完整的TeraSort测试需要按以下三步执行：
1、用TeraGen生成随机数据
2、对输入数据运行TeraSort
3、用TeraValidate验证排好序的输出数据
并不需要在每次测试时都生成输入数据，生成一次数据之后，每次测试可以跳过第一步。

TeraGen的用法如下：

$ hadoop jar hadoop-*examples*.jar teragen
以下命令运行TeraGen生成10GB的输入数据，并输出到目录/examples/terasort-input：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar teragen 100000000 /examples/terasort-input
15/01/13 16:57:34 INFO client.RMProxy: Connecting to ResourceManager at server01/135.33.5.53:8032
15/01/13 16:57:35 INFO terasort.TeraSort: Generating 100000000 using 2
15/01/13 16:57:35 INFO mapreduce.JobSubmitter: number of splits:2
15/01/13 16:59:07 INFO mapreduce.Job: Job job_1420542591388_0105 completed successfully
15/01/13 16:59:08 INFO mapreduce.Job: Counters: 31
File System Counters
FILE: Number of bytes read=0
FILE: Number of bytes written=211922
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=170
HDFS: Number of bytes written=10000000000
HDFS: Number of read operations=8
HDFS: Number of large read operations=0
HDFS: Number of write operations=4
Job Counters
Launched map tasks=2
Other local map tasks=2
Total time spent by all maps in occupied slots (ms)=150416
Total time spent by all reduces in occupied slots (ms)=0
Total time spent by all map tasks (ms)=150416
Total vcore-seconds taken by all map tasks=150416
Total megabyte-seconds taken by all map tasks=154025984
Map-Reduce Framework
Map input records=100000000
Map output records=100000000
Input split bytes=170
Spilled Records=0
Failed Shuffles=0
Merged Map outputs=0
GC time elapsed (ms)=1230
CPU time spent (ms)=175090
Physical memory (bytes) snapshot=504807424
Virtual memory (bytes) snapshot=3230924800
Total committed heap usage (bytes)=1363148800
org.apache.hadoop.examples.terasort.TeraGen$Counters
CHECKSUM=214760662691937609
File Input Format Counters
Bytes Read=0
File Output Format Counters
Bytes Written=10000000000
TeraGen产生的数据每行的格式如下：
<10 bytes key><10 bytes rowid><78 bytes filler>\r\n
其中：

1、key是一些随机字符，每个字符的ASCII码取值范围为[32, 126]
2、rowid是一个整数，右对齐
3、filler由7组字符组成，每组有10个字符（最后一组8个），字符从’A'到’Z'依次取值

以下命令运行TeraSort对数据进行排序，并将结果输出到目录/examples/terasort-output：
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar terasort /examples/terasort-input /examples/terasort-output
15/01/13 17:08:08 INFO terasort.TeraSort: starting
15/01/13 17:08:10 INFO input.FileInputFormat: Total input paths to process : 2
Spent 187ms computing base-splits.
Spent 3ms computing TeraScheduler splits.
Computing input splits took 192ms
Sampling 10 splits of 76
Making 144 from 100000 sampled records
Computing parititions took 596ms
Spent 791ms computing partitions.terasort /examples/terasort-input /examples/terasort-output
15/01/13 17:09:13 INFO mapreduce.Job: Counters: 50
File System Counters
FILE: Number of bytes read=4461968618
FILE: Number of bytes written=8889668662
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=10000010260
HDFS: Number of bytes written=10000000000
HDFS: Number of read operations=660
HDFS: Number of large read operations=0
HDFS: Number of write operations=288
Job Counters
Launched map tasks=76
Launched reduce tasks=144
Data-local map tasks=75
Rack-local map tasks=1
Total time spent by all maps in occupied slots (ms)=933160
Total time spent by all reduces in occupied slots (ms)=1227475
Total time spent by all map tasks (ms)=933160
Total time spent by all reduce tasks (ms)=1227475
Total vcore-seconds taken by all map tasks=933160
Total vcore-seconds taken by all reduce tasks=1227475
Total megabyte-seconds taken by all map tasks=955555840
Total megabyte-seconds taken by all reduce tasks=1256934400
Map-Reduce Framework
Map input records=100000000
Map output records=100000000
Map output bytes=10200000000
Map output materialized bytes=4403942936
Input split bytes=10260
Combine input records=0
Combine output records=0
Reduce input groups=100000000
Reduce shuffle bytes=4403942936
Reduce input records=100000000
Reduce output records=100000000
Spilled Records=200000000
Shuffled Maps =10944
Failed Shuffles=0
Merged Map outputs=10944
GC time elapsed (ms)=45169
CPU time spent (ms)=2021010
Physical memory (bytes) snapshot=95792517120
Virtual memory (bytes) snapshot=357225058304
Total committed heap usage (bytes)=174283816960
Shuffle Errors
BAD_ID=0
CONNECTION=0
IO_ERROR=0
WRONG_LENGTH=0
WRONG_MAP=0
WRONG_REDUCE=0
File Input Format Counters
Bytes Read=10000000000
File Output Format Counters
Bytes Written=10000000000
15/01/13 17:09:13 INFO terasort.TeraSort: done

(8) terasort-validate 验证是否有序

以下命令运行TeraValidate来验证TeraSort输出的数据是否有序，如果检测到问题，将乱序的key输出到目录/examples/terasort-validate
[hsu@server01 ~]$ sudo hadoop jar /opt/cloudera/parcels/CDH-5.2.0-1.cdh5.2.0.p0.36/lib/hadoop-0.20-mapreduce/hadoop-examples.jar teravalidate /examples/terasort-output /examples/terasort-validate
15/01/13 17:17:37 INFO client.RMProxy: Connecting to ResourceManager at server01/135.33.5.53:8032
15/01/13 17:17:38 INFO input.FileInputFormat: Total input paths to process : 144
Spent 93ms computing base-splits.
Spent 3ms computing TeraScheduler splits.
15/01/13 17:17:38 INFO mapreduce.JobSubmitter: number of splits:144
15/01/13 17:17:38 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1420542591388_0107
15/01/13 17:17:38 INFO impl.YarnClientImpl: Submitted application application_1420542591388_0107teravalidate /examples/terasort-output /examples/terasort-validate
15/01/13 17:18:12 INFO mapreduce.Job: Job job_1420542591388_0107 completed successfully
15/01/13 17:18:12 INFO mapreduce.Job: Counters: 50
File System Counters
FILE: Number of bytes read=6963
FILE: Number of bytes written=15445453
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=10000019584
HDFS: Number of bytes written=25
HDFS: Number of read operations=435
HDFS: Number of large read operations=0
HDFS: Number of write operations=2
Job Counters
Launched map tasks=144
Launched reduce tasks=1
Data-local map tasks=142
Rack-local map tasks=2
Total time spent by all maps in occupied slots (ms)=685624
Total time spent by all reduces in occupied slots (ms)=3384
Total time spent by all map tasks (ms)=685624
Total time spent by all reduce tasks (ms)=3384
Total vcore-seconds taken by all map tasks=685624
Total vcore-seconds taken by all reduce tasks=3384
Total megabyte-seconds taken by all map tasks=702078976
Total megabyte-seconds taken by all reduce tasks=3465216
Map-Reduce Framework
Map input records=100000000
Map output records=432
Map output bytes=11664
Map output materialized bytes=13830
Input split bytes=19584
Combine input records=0
Combine output records=0
Reduce input groups=289
Reduce shuffle bytes=13830
Reduce input records=432
Reduce output records=1
Spilled Records=864
Shuffled Maps =144
Failed Shuffles=0
Merged Map outputs=144
GC time elapsed (ms)=4014
CPU time spent (ms)=334280
Physical memory (bytes) snapshot=85470654464
Virtual memory (bytes) snapshot=234019295232
Total committed heap usage (bytes)=114868879360
Shuffle Errors
BAD_ID=0
CONNECTION=0
IO_ERROR=0
WRONG_LENGTH=0
WRONG_MAP=0
WRONG_REDUCE=0
File Input Format Counters
Bytes Read=10000000000
File Output Format Counters
Bytes Written=25

[hsu@server01 ~]$ hadoop fs -cat /examples/terasort-validate/* checksum 2fafbaf537afd49
结论：检测通过

(10) 总结
在提交任务目录下会生成两个文件
[hsu@server01 ~]$ LANG=en
[hsu@server01 ~]$ ll
total 16
-rw-r--r-- 1 root root 1142 Jan 13 15:56 NNBench_results.log
-rw-r--r-- 1 root root 903 Jan 13 15:43 TestDFSIO_results.log

约对176838144行数据进行排序刚好1分钟时间，部分数据：
0000000: 00 00 00 a7 0d 2a a8 02 da da 00 11 30 30 30 30 .....*......0000

0000010: 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 0000000000000000

Action 数据量(G) HiveTime(s) ImpalaTime(s) Hive结论 Imapla结论

Count(*) 39.8 386.804 192.75 通过警告阈值(内存)
join(2) 39.8*2 413.651 525.48 通过警告阈值(内存)

结论：

1、对于大数据量impala并不占优势，而且还可能节点impalad节点崩溃，impala非常吃内存，parquet也非常吃内存！

2、hive运行会出现大量IO操作，往往impala运行不下来的任务hive能够运行。

3、impala对sql支持度以及对hive一些分析函数特殊数据格式支持仍然有待新版本。

go语言进阶-并发 dounine
title:go语言进阶-并发date:2020-09-0119:58:370.前言优雅的并发编程范式，完善的并发支持，出色的并发性能是Go语言区别于其他语言的一大特色。接下来，我们将从原理到应用，深入了解go并发。1.并发与并行这些经典概念，对于学过操作系统的同学或许并不陌生。并发：多个代码片段（进程、线程）轮流在一个物理处理器（单核CPU）上执行，通过快速的上下文切换，营造一种同时执行的假象，
Python+requests+pytest接口自动化测试框架的搭建天才测试猿 python 自动化测试软件测试测试用例职场和发展 pytest 测试工具
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快框架的设计思路首先要明确进行接口自动化需要的步骤，如下图所示：然后逐步拆解需要完成的工作：1）了解分析需求：了解接口要实现的功能2）数据准备：根据开发文档确定接口的基本情况，知晓接口的url、请求方式、入参等信息，然后根据业务逻辑以及入参来预期接口的输出需要有一个配置文件来存储接口的一些基本信息；需要有一个方法能读取配置文件；需要有一个e
如何优雅解决缓存与数据库的数据一致性问题？亲爱的非洲野猪缓存 kafka 分布式 java lock
在高并发系统中，缓存是提升性能的“利器”，但随之而来的“缓存与数据库数据不一致”问题，却常常让开发者头疼。比如用户刚更新了资料，刷新页面却还是旧数据；或者订单状态明明已支付，缓存却显示未付款——这类问题不仅影响用户体验，严重时甚至会引发业务故障。今天就来聊聊如何从“更新策略”“异常处理”“实战方案”三个维度，搭建一套可靠的缓存一致性管控体系。一、核心更新策略：根据业务选对“姿势”缓存与数据库的同步
Elasticsearch 聚合查询源码解读与架构方法论北漂老男人 Elasticsearch elasticsearch 架构大数据搜索引擎全文检索
Elasticsearch聚合查询源码解读与架构方法论01.引言Elasticsearch的聚合查询（Aggregation）是大规模分布式数据分析的核心能力。理解其源码结构与设计方法论，不仅有助于高效使用聚合，也能为自定义扩展、性能优化、集群运维等提供理论与实践基础。本文将从源码结构、核心模块、关键实现、行级注释与方法论出发，系统剖析聚合查询的底层原理。02.源码结构与核心模块2.1聚合相关源码
零基础学习性能测试第一章：核心性能指标-吞吐量QPS/TPS 试着性能测试学习性能测试零基础性能指标 QPS TPS
目录零基础学习性能测试：第一章-核心性能指标：吞吐量(QPS/TPS)一、吞吐量核心概念解析1.吞吐量定义与分类2.核心区别与关系二、吞吐量关键价值与工作应用1.吞吐量的业务意义2.实际工作场景应用三、吞吐量测试实战指南1.测试工具选择2.JMeter吞吐量测试全流程3.关键配置参数四、吞吐量瓶颈分析与优化1.瓶颈定位四步法2.常见瓶颈及解决方案3.优化案例：电商系统吞吐量提升五、工作应用模板与工
零基础学习性能测试第一章：核心性能指标-响应时间试着性能测试学习性能测试零基础性能指标响应时间
目录核心学习理念：聚焦实战、理解本质、快速应用**第一阶段：理解响应时间的本质(1-2小时)第二阶段：学习如何测量响应时间(动手实践，2-4小时)第三阶段：将响应时间应用到实际工作(核心目标)第四阶段：快速应用的关键技巧与注意事项总结与行动清单(今天就能开始做！)零基础学习性能测试的核心指标——响应时间，并能快速应用到工作中，这个目标很明确！下面我将为你设计一个结构化的学习路径，从概念到实践，让你
零基础学习性能测试第一章：性能需求分析试着性能测试学习数据库服务器性能测试零基础需求分析
目录**核心学习理念****模块1：理解性能需求分析的价值（1小时）****1.1为什么必须做需求分析？****1.2性能需求四要素**（附企业级模板）**模块2：四步挖掘性能需求（实战核心）****步骤1：识别关键业务场景（2小时）****步骤2：量化业务负载（3小时）****步骤3：定义性能指标（2小时）****步骤4：明确环境与数据要求（1小时）****模块3：输出需求文档（企业级模板）**
零基础学习性能测试第三章：执行性能测试试着性能测试学习性能测试零基础
以下是针对零基础学习性能测试的第三章：执行性能测试的详细学习内容设计，聚焦实战操作与快速应用，助你高效上手：第三章核心目标：学会独立执行完整性能测试，产出有效结果关键原则：标准化流程>工具操作>数据解读>风险规避学习模块1：测试前准备——决定成败的关键（占40%精力）1.1环境搭建标准化为什么重要：环境差异会导致结果失真（最常见失败原因）操作清单：硬件：确保测试服务器配置（CPU/内存/磁盘）≥生
零基础学习性能测试第一章-性能测试和功能测试的区别试着性能测试学习功能测试性能测试零基础
目录零基础学习性能测试：性能测试与功能测试的核心区别一、核心概念对比（本质区别）1.测试目标差异2.测试方法对比3.工作流程差异二、实际工作场景应用指南1.何时使用功能测试？（适用场景）2.何时使用性能测试？（关键场景）3.协同应用模式三、工具链对比与实践1.工具选择矩阵2.工具使用对比（以用户登录为例）3.报告输出差异四、工作场景决策树决策指南：五、协同工作最佳实践1.项目各阶段配合2.协作工作
DeepSeek 助力 Vue3 开发：打造丝滑的日历(Calendar)，日历_宠物护理示例（CalendarView01_26）宝码香车 #DeepSeek 前端 vue.js ecmascript javascript deepseek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的日历(Calendar)，日历_宠物护理示例（CalendarView01_26）前言本文简介：本文页面效果组件代码代码测试测试代码正常跑通，附其他基本代码编写路由\src\router\index
DeepSeek 助力 Vue3 开发：打造丝滑的日历(Calendar)，日历_植物浇水示例（CalendarView01_25）宝码香车 #DeepSeek 前端 vue ecmascript javascript DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的日历(Calendar)，日历_植物浇水示例（CalendarView01_25）前言本文简介：本文页面效果组件代码代码测试测试代码正常跑通，附其他基本代码编写路由\src\router\index
DeepSeek 助力 Vue3 开发：打造丝滑的日历(Calendar)，日历_学习计划日历示例（CalendarView01_20）宝码香车前端 vue ecmascript javascript DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的日历(Calendar)，日历_学习计划日历示例（CalendarView01_20）前言本文简介：本文页面效果组件代码代码测试测试代码正常跑通，附其他基本代码编写路由\src\router\ind
从代码到终端部署：Prompt如何颠覆传统DevOps流程 LCG元工具运维 prompt devops 运维
文章目录基于Prompt工程的DevOps架构重构实践一、架构演进与技术对比1.1架构演进路径1.2核心流程对比二、核心实现方案2.1Prompt解析引擎实现（Python）2.2Kubernetes集成部署（YAML模板）三、生产部署实践3.1安全增强方案3.2性能优化数据四、技术前瞻与演进4.1未来三年技术路线图五、完整技术图谱六、核心代码实现（TypeScript前端）七、部署验证测试基于P
解锁Prompt+DevOps新姿势：终端系统重塑的三大核心策略
文章目录引言：Prompt驱动的DevOps范式迁移核心策略一：智能决策流水线构建横向架构对比纵向实现流程Python实现示例核心策略二：自适应终端部署体系TypeScript客户端实现YAML部署配置模板核心策略三：智能运维闭环构建安全审计实现方案性能对比分析技术前瞻性分析附录：完整技术图谱技术架构部署验证引言：Prompt驱动的DevOps范式迁移在云原生与AI工程化交汇的今天，Prompt技
系统架构设计师教程第二章计算机系统基础知识-2.9 系统性能 AncleLeen 软考-系统架构设计师-学习路线系统架构软考-系统架构师
系统架构设计师教程第二章计算机系统基础知识-2.9系统性能2.9.1.性能指标2.9.1.1计算机的性能指标2.9.1.2路由器的性能指标（了解即可）2.9.1.3交换机的性能指标（了解即可）2.9.1.4网络的性能指标2.9.1.5操作系统的性能指标2.9.1.6数据库管理系统的性能指标2.9.1.7Web服务器的性能指标2.9.2.性能计算2.9.3.性能设计2.9.3.1性能调整2.9.3.
零基础学习性能测试第一章：核心性能指标-并发量试着性能测试学习性能测试零基础性能指标并发量
目录零基础学习性能测试：第一章-核心性能指标：并发量一、并发量核心概念解析1.并发量定义与分类2.并发量关键特性二、并发量测试的核心价值1.业务意义三角模型2.实际工作场景应用三、并发量测试实战指南1.测试工具配置要点2.并发测试四步流程3.JMeter并发测试实操四、并发瓶颈分析与优化1.并发瓶颈定位矩阵2.常见并发问题解决方案3.电商系统并发优化案例五、工作应用模板与工具1.并发测试报告模板2
DeepSeek 助力 Vue3 开发：打造丝滑的日历(Calendar)，日历_睡眠记录日历示例（CalendarView01_30）宝码香车 #DeepSeek 前端 vue.js ecmascript javascript deepseek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的日历(Calendar)，日历_睡眠记录日历示例（CalendarView01_30）前言本文简介：本文页面效果组件代码代码测试测试代码正常跑通，附其他基本代码编写路由\src\router\ind
把这套小学生心理自助工具箱搬回家，遇见更好的自己沈小鱼_ec56
作为80后的我，还记得我们高一时，我校作为试点示范学校，新设立一门心理课，引得兄弟学校的小伙伴羡慕不已。我也在高中时代，完成了自己盲目做心理测试，到阅读老师推荐的心理书的转变。做了妈妈之后，我进行了心理咨询师的进修，发现这门学科，必须从娃娃抓起。非常庆幸的是，现在整个社会都非常注重孩子的心理问题，一年级就为孩子开设了心理课，每学期都会有若干个专项心理讲座，并给每位学生配备了心理导师。生理的疾病肉眼
2021年2月3日，周三，天气晴，杭州6~17° 是朱朱呀
今天3号了，一般公司就两种情况：一：年底了，很多事情都差不多落实、处理完了，只剩下一些需要处理的个别事情。二：年底了，赶项目赶项目，抓紧上线，忙忙忙我所在单位属于第一种，我男票单位属于第二种，年前这几天程序要抓紧写好，能早点测试就早点测试，每天上班时间都没有时间摸鱼的那种。和我形成了鲜明的对比，我这个周应该算是比较清闲的。我还有一个问题，我和我男票都在杭州上班，非浙江户口、单位也在杭州缴纳了社保，
mysql.createPool(db)_nodejs解决mysql和连接池(pool)自动断开问题会咕咕咕的小夫爷
最近在做一个个人项目，数据库尝试使用了mongodb、sqlite和mysql。分享一下关于mysql的连接池用法。项目部署于appfog，项目中我使用连接池链接数据库，本地测试一切正常。上线以后，经过几次请求两个数据接口总是报503。一直不明就里，今天经过一番排查终于顺利解决了。1.mysql链接普通模式varmysql=require('mysql'),env={host:'localhost
SpringCloud-Nginx+Zuul实现网关集群（八）粉蒸妹 SpringCloud
配置并启动nginxnginx中配置zuul网关服务器的轮询机制测试在网关过滤器中打印出端口号启动端口号为8081和8082的zuul网关服务器访问接口，查看控制台打印，以轮询结果分别在8081和8082的服务器中调用
排序算法—交换排序（冒泡、快速）（动图演示）每天都要进步1 排序算法排序算法算法
目录十大排序算法分类编辑冒泡排序算法步骤：动图演示：性能分析：代码实现（Java）：快速排序（挖坑法）算法步骤：动图演示：性能分析：代码实现（Java）：十大排序算法分类本篇分享十大排序算法中的需要进行交换操作的冒泡排序与快速排序,其余算法也有介绍噢（努力赶进度中，后续会添加上）冒泡排序冒泡排序是一种非常直观的排序算法，遍历数组，每次比较两个元素，如果后者比前者小则交换位置，重复的进行直至没有再需
linux + 宝塔面板部署 django网站启动方式:uwsgi 和gunicorn如何选择 ?
启动方式:uwsgi和gunicorn如何选择?项目uWSGIGunicorn协议uWSGI协议（可用HTTP/socket）HTTP协议启动方式命令或.ini配置文件命令参数或systemd配置兼容框架支持WSGI、uWSGI、FastCGI等仅支持WSGI性能高性能、极可调高性能、默认参数也够用配置复杂度❌比较复杂✅配置简单社区活跃⭐停滞不前，主作者不活跃⭐⭐活跃，现代化持续维护热部署支持✅支
14.3 FFT与PEFT终极对决：1%参数实现3倍速训练，显存暴降80%！少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力人工智能机器学习大数据语言模型 chatgpt llama
以微调权重比例分类：FFTvsPEFT深度解析在大模型微调领域，参数调整比例直接决定训练效率与模型性能的平衡。本小节将深入解析全参数微调（FullFine-Tuning,FFT）与参数高效微调（Parameter-EfficientFine-Tuning,PEFT）的核心差异，并通过具体技术方案对比和实战代码示例揭示其工程应用场景。一、FFT与PEFT技术对比矩阵
揭开SQL Server和PostgreSQL填充因子的神秘面纱 Alex-Hua postgresql oracle 数据库
揭开SQLServer和PostgreSQL填充因子的神秘面纱理解SQLServer和PostgreSQL中的填充因子在调优数据库性能时，一些小设置往往能带来显著的差异。填充因子就是其中一个经常讨论的设置。SQLServer和PostgreSQL都支持这一概念，但它们的处理方式有所不同。如果你在管理这两种系统中的数据库，了解填充因子的工作原理可以帮助你避免因索引页拆分、索引碎片以及不必要的磁盘I/
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
【开源项目】实测 Google 开源的 AI MCP 数据库网关：10行代码隔离风险，连接池自动复用
1.引言这两天试了谷歌新开的MCPToolboxforDatabases，它用不到10行代码就能让AI助手（比如LangChain智能体）安全地操作数据库。作为一个常年和数据库连接池、凭证泄露搏斗的开发者，这东西确实解决了我的痛点——把数据库访问抽象成“工具”，通过集中管控的MCPServer隔离风险，还自带性能优化。下面分享实测体验和避坑指南。2.正文2.1核心逻辑：为什么需要MCP？传统AI代
docker镜像加速源配置，目前可用镜像源列举(10月10日更新最新可用)
1.前提背景：这里列举一下目前暂且可用的镜像源，滑到最下方查看最新9月19日更新(9月18日测试阿里云的个人镜像服务可以正常使用，建议使用阿里云的个人镜像服务)9月24日测试阿里云个人镜像服务挂掉，互联网寒冬了属于10月8日正式上班后，扒了下外网的论坛，发现有个开发者自己搭建了个服务器，速度还不错，为爱发电的，如果感觉好的话可以去这个开发者的官网赞助一下，支持下这个开发者。（不是广告哈）10月10
F5推出后量子密码学解决方案，助力企业应对新一代安全威胁 CSDN资讯密码学安全量子计算
近日，全球领先的应用交付和API安全解决方案提供商F5(NASDAQ:FFIV)宣布推出全新综合性后量子密码学（PQC）就绪解决方案，助力客户应对量子计算带来的网络安全范式变革。该解决方案现已无缝集成至F5应用交付与安全平台（F5ApplicationDeliveryandSecurityPlatform），为企业提供保障应用和API安全所需工具的同时，保持卓越的性能与可扩展性。随着量子时代的到来
美国VPS服务器Linux内核参数调优的实践与验证 cpsvps 服务器 linux 运维
美国vps服务器Linux内核参数调优的实践与验证在云计算和虚拟化技术日益普及的今天，美国VPS服务器因其稳定的网络环境和优越的性价比，成为众多企业和开发者的首选。Linux内核参数的默认配置往往无法充分发挥VPS的性能潜力。本文将深入探讨美国VPS服务器上Linux内核参数的调优实践，通过系统化的测试验证方法，帮助用户实现服务器性能的显著提升。美国VPS服务器Linux内核参数调优的实践与验证一
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

HDFS benchmark 基准测试

你可能感兴趣的:(Cloudera,性能,测试,cloudera,hadoop)