defang0693

大数据常见错误解决方案（转载）

原文链接： http://www.cnblogs.com/cstzhou/p/6437270.html

1、用./bin/spark-shell启动spark时遇到异常：java.net.BindException: Can't assign requested address: Service 'sparkDriver' failed after 16 retries!

解决方法：add export SPARK_LOCAL_IP="127.0.0.1" to spark-env.sh

2、java Kafka producer error:ERROR kafka.utils.Utils$ - fetching topic metadata for topics [Set(words_topic)] from broker [ArrayBuffer(id:0,host: xxxxxx,port:9092)] failed

解决方法：Set 'advertised.host.name' on server.properties of Kafka broker to server's realIP(same to producer's 'metadata.broker.list' property)

3、java.net.NoRouteToHostException: No route to host

解决方法：zookeeper的IP要配对

4、Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer) java.net.UnknownHostException: linux-pic4.site:

解决方法：add your hostname to /etc/hosts: 127.0.0.1 localhost linux-pic4.site

5、org.apache.spark.SparkException: A master URL must be set in your configuration

解决方法：SparkConf sparkConf = new SparkConf().setAppName("JavaDirectKafkaWordCount").setMaster("local");

6、Failed to locate the winutils binary in the hadoop binary path

解决方法:先安装好hadoop

7、启动spark时： Failed to get database default, returning NoSuchObjectException

解决方法：1)Copy winutils.exe from here(https://github.com/steveloughran/winutils/tree/master/hadoop-2.6.0/bin) to some folder say, C:\Hadoop\bin. Set HADOOP_HOME to C:\Hadoop.2）Open admin command prompt. Run C:\Hadoop\bin\winutils.exe chmod 777 /tmp/hive

8、org.apache.spark.SparkException: Only one SparkContext may be running in this JVM (see SPARK-2243). To ignore this error, set spark.driver.allowMultipleContexts = true.

解决方法：Use this constructor JavaStreamingContext(sparkContext: JavaSparkContext, batchDuration: Duration) 替代 new JavaStreamingContext(sparkConf, Durations.seconds(5));

9、Reconnect due to socket error: java.nio.channels.ClosedChannelException

解决方法：kafka服务器broker ip写对

10、java.lang.IllegalArgumentException: requirement failed: No output operations registered, so nothing to execute

解决方法：tranformation最后一步产生的那个RDD必须有相应Action操作，例如massages.print()等

11、经验：spark中数据写入ElasticSearch的操作必须在action中以RDD为单位执行

12、 Problem binding to [0.0.0.0:50010] java.net.BindException: Address already in use;

解决方法：master和slave配置成同一个IP导致的，要配成不同IP

13、CALL TO LOCALHOST/127.0.0.1:9000

解决方法：host配置正确，/etc/sysconfig/network /etc/hosts /etc/sysconfig/network-scripts/ifcfg-eth0

13、打开namenode:50070页面，Datanode Infomation只显示一个节点

解决方法：SSH配置错误导致，主机名一定要严格匹配，重新配置ssh免密码登录

14、经验：搭建集群时要首先配置好主机名，并重启机器让配置的主机名生效

15、INFO hdfs.DFSClient: Exception in createBlockOutputStream java.net.NoRouteToHostException: No route to host

解决方法：如果主从节点能相互ping通，那就关掉防火墙 service iptables stop

16、经验：不要随意格式化HDFS，这会带来数据版本不一致等诸多问题，格式化前要清空数据文件夹

17、namenode1: ssh: connect to host namenode1 port 22: Connection refused

解决方法：sshd被关闭或没安装导致，which sshd检查是否安装，若已经安装，则sshd restart，并ssh 本机hostname，检查是否连接成功

18、Log aggregation has not completed or is not enabled.

解决方法：在yarn-site.xml中增加相应配置，以支持日志聚合

19、failed to launch org.apache.spark.deploy.history.History Server full log in

解决方法：正确配置spark-defaults.xml,spark-en.sh中SPARK_HISTORY_OPTS属性

20、Exception in thread "main" org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application master.

解决方法：yarn-lient模式出现的异常，暂时无解

21、hadoop的文件不能下载以及YARN中Tracking UI不能访问历史日志

解决方法：windows系统不能解析域名所致，把hosts文件hostname复制到windows的hosts中

22、经验：HDFS文件路径写法为：hdfs://master:9000/文件路径，这里的master是namenode的hostname,9000是hdfs端口号。

23、Yarn JobHistory Error: Failed redirect for container

解决方法：将 http://:19888/jobhistory/logs 配置到yarn-site.xml中，重启yarn和JobHistoryServer

24、通过hadoop UI访问hdfs文件夹时，出现提示 Permission denied: user=dr.who

解决方法：namonode节点终端执行：hdfs dfs -chmod -R 755 /

25、经验：Spark的Driver只有在Action时才会收到结果
26、经验：Spark需要全局聚合变量时应当使用累加器（Accumulator）
27、经验：Kafka以topic与consumer group划分关系，一个topic的消息会被订阅它的消费者组全部消费，如果希望某个consumer使用topic的全部消息，可将该组只设一个消费者，每个组的消费者数目不能大于topic的partition总数，否则多出的consumer将无消可费

28、java.lang.NoSuchMethodError: com.google.common.util.concurrent.MoreExecutors.directExecutor()Ljava/util/concurrent/Executor;

解决方法：统一ES版本，尽量避免直接在spark中创建ES client

29、eturned Bad Request(400) - failed to parse;Compressor detection can only be called on some xcontent bytes or compressed xcontent bytes; Bailing out..

解决方法：写入ES的数据格式纠正

30、java.util.concurrent.TimeoutException: Cannot receive any reply in 120 seconds

解决方法：确保所有节点之间能够免密码登录

31、集群模式下，spark无法向elasticsearch写入数据

解决方法：采用这种写入方式（带上es配置的Map参数）results.foreachRDD(javaRDD -> {JavaEsSpark.saveToEs(javaRDD, esSchema, cfg);return null;});

32、经验：所有自定义类要实现serializable接口，否则在集群中无法生效
33、经验：resources资源文件读取要在Spark Driver端进行，以局部变量方式传给闭包函数

34、通过nio读取资源文件时，java.nio.file.FileSystemNotFoundException at com.sun.nio.zipfs.ZipFileSystemProvider.getFileSystem(ZipFileSystemProvider.java:171)

解决方法：打成jar包后URI发生变化所致，形如jar:file:/C:/path/to/my/project.jar!/my-folder，要采用以下解析方式，

final Map env = new HashMap<>();
final String[] array = uri.toString().split("!");
final FileSystem fs = FileSystems.newFileSystem(URI.create(array[0]), env);
final Path path = fs.getPath(array[1]);
35、经验：DStream流转化只产生临时流对象，如果要继续使用，需要一个引用指向该临时流对象
36、经验：提交到yarn cluster的作业不能直接print到控制台，要用log4j输出到日志文件中

37、java.io.NotSerializableException: org.apache.log4j.Logger

解决方法：序列化类中不能包含不可序列化对象，you have to prevent logger instance from default serializabtion process, either make it transient or static. Making it static final is preferred option due to many reason because if you make it transient than after deserialization logger instance will be null and any logger.debug() call will result in NullPointerException in Java because neither constructor not instance initializer block is called during deserialization. By making it static and final you ensure that its thread-safe and all instance of Customer class can share same logger instance, By the way this error is also one of the reason Why Logger should be declared static and final in Java program.

38、log4j:WARN Unsupported encoding

解决方法：1.把UTF改成小写utf-8 2.设置编码那行有空格

39、MapperParsingException[Malformed content, must start with an object

解决方法：采用接口JavaEsSpark.saveJsonToEs，因为saveToEs只能处理对象不能处理字符串

40、 ERROR ApplicationMaster: SparkContext did not initialize after waiting for 100000 ms. Please check earlier log output for errors. Failing the application

解决方法：资源不能分配过大,或者没有把.setMaster("local[*]")去掉

41、WARN Session 0x0 for server null, unexpected error, closing socket connection and attempting reconnect (org.apache.zookeeper.ClientCnxn)

解决方法：配置文件broker编号要写对，命令中的IP写真实IP

42、 User class threw exception: org.apache.spark.SparkException: org.apache.spark.SparkException: Couldn't find leaders for Set([mywaf,7], [mywaf,1])

解决方法：正确配置kafka，并重新创建topic

43、在ES界面发现有节点shard分片不显示

解决方法：该节点磁盘容量不足，清理磁盘增加容量

44、The method updateStateByKey(Function2,Optional,Optional>, int) in the type JavaPairDStream is not applicable for the arguments (Function2,Optional,Optional>, int)

解决方法：Spark use com.google.common.base.Optional not jdk default package java.util.Optional

45、NativeCrc32.nativeComputeChunkedSumsByteArray

解决方法：配置eclipse的hadoop-home，bin和system32文件夹中加入64位的2.6版本的hadoop.dll

46、经验：Spark Streaming包含三种计算模式：nonstate 、stateful 、window

47、Yarn的RM单点故障

解决方法：通过三节点zookeeper集群和yarn-site.xml配置文件完成Yarn HA

48、经验：kafka可通过配置文件使用自带的zookeeper集群

49、经验：Spark一切操作归根结底是对RDD的操作

50、如何保证kafka消息队列的强有序

解决方法：把需要强有序的topic只设置一个partition

51、linux批量多机互信

解决方法：pub秘钥配成一个

52、org.apache.spark.SparkException: Failed to get broadcast_790_piece0 of broadcast_790

解决方法：去除spark-defaults.conf中spark.cleaner.ttl配置

53、Yarn HA环境下，通过web访问history日志被跳转到8088而无法显示

解决方法：恢复Yarn Http默认端口8088

54、but got no response. Marking as slave lost

解决方法：使用yarn client提交作业遇到这种情况，暂时无解

55、Using config: /work/poa/zookeeper-3.4.6/bin/../conf/zoo.cfg Error contacting service. It is probably not running.

解决方法：配置文件不正确，例如hostname不匹配等

56、经验：部署Spark任务，不用拷贝整个架包，只需拷贝被修改的文件，然后在目标服务器上编译打包。

57、Spark setAppName doesn't appear in Hadoop running applications UI

解决方法：set it in the command line for spark-submit "--name BetterName"

58、如何监控Sprak Streaming作业是否挂掉

解决方法：通过监控Driver端口或者根据yarn指令写Linux定时脚本监控

59、kafka内外网问题

解决方法：kafka机器双网卡，配置文件server.properties中advertised.host.name不要写IP，用域名形式，外网的生产者和内网的消费者各自解析成自己所需的IP。

60、经验：kafka的log.dirs不要设置成/tmp下的目录，貌似tmp目录有文件数和磁盘容量限制

61、kafka搬机器后，在新的集群，topic被自动创建，且只有一台broker负载

解决方法：server.properties中加上delete.topic.enable=true和auto.create.topics.enable=false，删除旧的topic，重新创建topic，重启kafka

62、安装sbt，运行sbt命令卡在Getting org.scala-sbt sbt 0.13.6 ...

解决方法：sbt takes some time to download its jars when it is run first time，不要退出，直至sbt处理完

63、经验：ES的分片类似kafka的partition

64、kafka出现OOM异常

解决方法：进入kafka broker启动脚本中，在export KAFKA_HEAP_OPTS="-Xmx24G -Xms1G"调大JVM堆内存参数

65、linux服务器磁盘爆满，检查超过指定大小的文件

解决方法：find / -type f -size +10G

66、spark-direct kafka streaming限速

解决方法：spark.streaming.kafka.maxRatePerPartition，配置每秒每个kafka分区读取速率

67、org.elasticsearch.hadoop.rest.EsHadoopInvalidRequest: Found unrecoverable error returned Not Found(404) - [EngineClosedException CurrentState[CLOSED]

解决方法：在kopf插件中对该索引先close再open即可。造成原因可能是Index创建时有shard坏掉。

68、Job aborted due to stage failure: Task not serializable:

解决方法：Serializable the class;Declare the instance only within the lambda function passed in map;Make the NotSerializable object as a static and create it once per machine;Call rdd.forEachPartition and create the NotSerializable object in there

69、Pipeline write will fail on this Pipeline because it contains a stage which does not implement Writable

解决方法：this cannot be done as of Spark 1.6,需升级spark版本

70、IDEA从git导入scala项目，通篇提示变量never used

解决方法：将src文件夹mark directory as sources root

71、Run configuration in IntelliJ result in "Cannot start compilation: the output path is not specified for module "xxx". Specify the output path in Configure Project.

解决方法：In the default intellij options, "Make" was checked as "Before Launch". Unchecking it fixed the issue.

72、UDFRegistration$$anonfun$register$26$$anonfun$apply$2 cannot be cast to scala.Function1

解决方法：聚合函数不能用UDF，而应该定义UDAF

73、SPARK SQL replacement for mysql GROUP_CONCAT aggregate function

解决方法：自定义UDAF

74、在intellij idea的maven项目中，无法New scala文件

解决方法：pom.xml加入scala-tools插件相关配置，下载并更新

75、Error:scala: Error: org.jetbrains.jps.incremental.scala.remote.ServerException

解决方法：修改pom.xml配置文件，把scala换到最新版本

76、HADOOP 磁盘满的各节点平衡

解决方法：运行指令hdfs balancer -Threshold 3 或者运行 start-balancer.sh 脚本格式：$Hadoop_home/bin/start-balancer.sh -threshold，参数3是比例参数，表示3%，也就是平各个DataNode直接磁盘使用率偏差在3%以内

77、经验：sparkSQL UDAF中update函数的第二个参数 input: Row 对应的并非DataFrame的行，而是被inputSchema投影了的行

78、Error: No TypeTag available for String sqlContext.udf.register()

解决方法：scala版本不一致，统一所有scala版本

79、How to add a constant column in a Spark DataFrame?

解决方法：The second argument for DataFrame.withColumn should be a Column so you have to use a literal: df.withColumn('new_column', lit(10))

80、Error:scalac:Error:object VolatileDoubleRef does not have a member create

解决方法：scala版本不一致，统一开发环境和系统的scala版本

81、java.lang.NoSuchMethodError: scala.collection.immutable.HashSet$.empty()Lscala/collection/immutable/HashSet

解决方法：统一scala和spark的scala版本

82、maven项目打包去除不要的依赖，防止目标jar容量过大

解决方法：在中加入provided标明该依赖不放进目标jar,并用maven shaded方式打包

83、maven打包scala和java的混合项目

解决方法：使用指令 mvn clean scala:compile compile package

84、sparkSQL的udf无法注册UDAF聚合函数

解决方法：把UDAF自定义类的object关键字改成class声明

85、经验：运行时删除hadoop数据目录会导致依赖HDFS的JOB失效

86、[IllegalArgumentException[Document contains at least one immense term in field=XXX

解决方法：在ES中创建索引时对长文本字段要分词

87、maven shade打包资源文件没有打进去

解决方法：把resources文件夹放到src/main/下面，与scala或java文件夹并排

88、经验：spark Graph根据边集合构建图，顶点集合只是指定图中哪些顶点有效

89、ES写query用到正则匹配时，Determinizing automaton would result in more than 10000 states.

解决方法：正则表达式的字符串太长，复杂度过高，正则匹配要精练，不要枚举式匹配

90、java.lang.StackOverflowError at org.apache.spark.sql.catalyst.trees.CurrentOrigin$.withOrigin(TreeNode.scala:53)

解决方法：sql语句的where条件过长，字符串栈溢出

91、org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle 0

解决方法：加大executor内存，减少executor个数，加大executor并发度

92、ExecutorLostFailure (executor 3 exited caused by one of the running tasks) Reason: Container killed by YARN for exceeding memory limits. 61.0 GB of 61 GB physical memory used

解决方法：移除RDD缓存操作，增加该JOB的spark.storage.memoryFraction系数值，增加该job的spark.yarn.executor.memoryOverhead值

93、EsRejectedExecutionException[rejected execution (queue capacity 1000) on org.elasticsearch.search.action.SearchServiceTransportAction

解决方法:减少spark并发数，降低对ES的并发读取

94、经验：单个spark任务的excutor核数不宜设置过高，否则会导致其他JOB延迟

95、经验：数据倾斜只发生在shuffle过程，可能触发shuffle操作的算子有：distinct groupByKey reduceByKey aggregateByKey join cogroup repartition等

96、如何定位spark的数据倾斜

解决方法：在Spark Web UI看一下当前stage各个task分配的数据量以及执行时间，根据stage划分原理定位代码中shuffle类算子

97、如何解决spark数据倾斜

解决方法：1）过滤少数导致倾斜的key（仅限于抛弃的Key对作业影响很小），2）提高shuffle操作并行度（提升效果有限），3）两阶段聚合（局部聚合+全局聚合），先对相同的key加前缀变成多个key，局部shuffle后再去掉前缀，再次进行全局shuffle（仅适用于聚合类的shuffle操作，效果明显，对于join类的shuffle操作无效），4）将reduce join转为map join，将小表进行广播，对大表map操作，遍历小表数据（仅适用于大小表或RDD情况），5）使用随机前缀和扩容RDD进行join，对其中一个RDD每条数据打上n以内的随机前缀，用flatMap算子对另一个RDD进行n倍扩容并扩容后的每条数据依次打上0~n的前缀，最后将两个改造key后的RDD进行join（能大幅缓解join类型数据倾斜，需要消耗巨额内存）

98、经验：shuffle write就是在一个stage结束计算之后，为了下一个stage可以执行shuffle类的算子，而将每个task处理的数据按key进行分类，将相同key都写入同一个磁盘文件中，而每一个磁盘文件都只属于下游stage的一个task，在将数据写入磁盘之前，会先将数据写入内存缓存中，下一个stage的task有多少个，当前stage的每个task就要创建多少份磁盘文件。

99、java.util.regex.PatternSyntaxException: Dangling meta character '?' near index 0

解决方法：元字符记得转义

100、spark弹性资源分配

解决方法：配置spark shuffle service,打开spark.dynamicAllocation.enabled

101、经验：kafka的comsumer groupID对于spark direct streaming无效

102、启动hadoop yarn,发现只启动了ResourceManager，没有启动NodeManager

解决方法：yarn-site.xml配置有问题，检查并规范各项配置

103、如何查看hadoop系统日志

解决方法：Hadoop 2.x中YARN系统的服务日志包括ResourceManager日志和各个NodeManager日志，它们的日志位置如下：ResourceManager日志存放位置是Hadoop安装目录下的logs目录下的yarn-*-resourcemanager-*.log，NodeManager日志存放位置是各个NodeManager节点上hadoop安装目录下的logs目录下的yarn-*-nodemanager-*.log

104、经验：小于128M的小文件都会占据一个128M的BLOCK，合并或者删除小文件节省磁盘空间

105、how to remove Non DFS Used

解决方法：1）清除hadoop数据目录中用户缓存文件：cd /data/hadoop/storage/tmp/nm-local-dir/usercache;du -h;rm -rf `find -type f -size +10M`; 2）清理Linux文件系统中的垃圾数据

106、经验：Non DFS Used指的是非HDFS的所有文件

107、linux profile配置文件隔离

解决方法：cd /etc/profile.d;在这里新建相应配置脚本

108、The reference to entity "autoReconnect" must end with the ';' delimiter

解决方法：把&替换成&

109、Service hiveserver not found

解决方法：Try to run bin/hive --service hiveserver2 instead of hive --service hiveserver for this version of apache hive

110、Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create spark client.)'

解决方法：不要预编译的spark，重新编译spark，并保证与hive pom中的版本一致

111、java.lang.NoSuchFieldError: SPARK_RPC_SERVER_ADDRESS at org.apache.hive.spark.client.rpc.RpcConfiguration.(RpcConfiguration.java:45)

解决方法：hive spark版本要匹配，同时必须是没有-phive参数编译的spark

112、javax.jdo.JDOFatalInternalException: Error creating transactional connection factory

解决方法：把mysql connector加入hive的lib中

113、org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create spark client FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.spark.SparkTask

解决方法：原因有多种，去hive.log查看日志进一步定位问题

114、Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream

解决方法：编译spark用了hadoop-provided参数，导致缺少hadoop相关包

115、linux 输入错误命令按删除键显示^H

解决方法：执行指令 stty erase ^H

116、经验：通过hive源文件pom.xml查看适配的spark版本，只要打版本保持一致就行，例如spark1.6.0和1.6.2都能匹配

117、经验：打开Hive命令行客户端，观察输出日志是否有打印“SLF4J: Found binding in [jar:file:/work/poa/hive-2.1.0-bin/lib/spark-assembly-1.6.2-hadoop2.6.0.jar!/org/slf4j/impl/StaticLoggerBinder.class]”来判断hive有没有绑定spark

118、启动yarn，发现只启动了部分Nodemanager

解决方法：未启动的节点缺少yarn相关包，要保持所有节点jar包一致

119、Error: Could not find or load main class org.apache.hive.beeline.BeeLine

解决方法：重新编译Hive，并带上参数-Phive-thriftserver

120、经验：编译spark，hive on spark就不要加-Phive参数，若需sparkSQL支持hive语法则要加-Phive参数

121、User class threw exception: org.apache.spark.sql.AnalysisException: path hdfs://XXXXXX already exists.;

解决方法：df.write.format("parquet").mode("append").save("path.parquet")

122、check the manual that corresponds to your MySQL server version for the right syntax to use near 'OPTION SQL_SELECT_LIMIT=DEFAULT' at line 1

解决方法：用新版mysql-connector

123、org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): User: root is not allowed to impersonate

解决方法：vim core-site.xml,hadoop.proxyuser.root.hosts,value = *,hadoop.proxyuser.root.groups,value = *，restart yarn

124、java.lang.NoSuchMethodError: org.apache.parquet.schema.Types$MessageTypeBuilder.addFields([Lorg/apache/parquet/schema/Type;)Lorg/apache/parquet/schema/Types$BaseGroupBuilder;

解决方法：版本冲突所致，统一hive和spark中parquet组件版本

125、经验：可以通过hive-site.xml修改spark.executor.instances、spark.executor.cores、spark.executor.memory等配置来优化hive on spark执行性能，不过最好配成动态资源分配。

126、WARN SparkContext: Dynamic Allocation and num executors both set, thus dynamic allocation disabled.

解决方法：如果要使用动态资源分配，就不要设置执行器个数

127、Invalid configuration property node.environment: is malformed (for class io.airlift.node.NodeConfig.environment)

解决方法：the node.environment property (in the node.properties file) is set but fails to match the following regular expression: [a-z0-9][_a-z0-9]*. 重新规范命名

128、com.facebook.presto.server.PrestoServerNo factory for connector hive-XXXXXX

解决方法：在hive.properties中 connector.name写错了，应该为指定的版本，以便于presto使用对应的适配器，修改为：connector.name=hive-hadoop2

129、org.apache.spark.SparkException: Task failed while writing rows Caused by: org.elasticsearch.hadoop.rest.EsHadoopInvalidRequest: null

解决方法：ES负载过高，修复ES

130、经验：如果maven下载很慢，很可能是被天朝的GFW墙了，可以在maven安装目录的setting.conf配置文件mirrors标签下加入国内镜像抵制**党的网络封锁，例如：

nexus-aliyun

Nexus aliyun

http://maven.aliyun.com/nexus/content/groups/public

131、RROR ApplicationMaster: Uncaught exception: java.lang.SecurityException: Invalid signature file digest for Manifest main attributes

解决方法：pom.xml文件中标签下加入

META-INF/*.SF

META-INF/*.DSA

META-INF/*.RSA

132、scala.MatchError: Buffer(10.113.80.29, None) (of class scala.collection.convert.Wrappers$JListWrapper)

解决方法：清除ES中跟scala数据类型不兼容的脏数据

133、HDFS误删文件如何恢复解决方法：core-site文件中加入

fs.trash.interval

2880

HDFS垃圾箱设置，可以恢复误删除，配置的值为分钟数，0为禁用

恢复文件执行 hdfs dfs -mv /user/root/.Trash/Current/误删文件 /原路径

134、改了linux定时脚本里边部分任务顺序，导致有些任务未执行，而有些重复执行

解决方法：Linux脚本修改后实时生效，务必在脚本全部执行完再修改，以免产生副作用

135、经验：spark两个分区方法coalesce和repartition，前者窄依赖，分区后数据不均匀，后者宽依赖，引发shuffle操作，分区后数据均匀

136、org.apache.spark.SparkException: Task failed while writing rows scala.MatchError: Buffer(10.113.80.29, None) (of class scala.collection.convert.Wrappers$JListWrapper)

解决方法：ES数据在sparksql类型转化时不兼容，可通过EsSpark.esJsonRDD以字符串形式取ES数据，再把rdd转换成dataframe

137、Container exited with a non-zero exit code 143 Killed by external signal

解决方法：分配的资源不够，加大内存或者调整代码，尽量避免类似JsonObject这样的大对象过度消耗内存，或者Include below properties in yarn-site.xml and restart VM,

yarn.nodemanager.vmem-check-enabled

false

Whether virtual memory limits will be enforced for containers

yarn.nodemanager.vmem-pmem-ratio

Ratio between virtual memory to physical memory when setting memory limits for containers

138、对已有jar手动生成maven依赖

解决方法：mvn install:install-file -Dfile=spark-assembly-1.6.2-hadoop2.6.0.jar -DgroupId=org.apache.repack -DartifactId=spark-assembly-1.6.2-hadoop2.6.0 -Dversion=2.6 -Dpackaging=jar

139、FAILED: SemanticException [Error 10006]: Line 1:122 Partition not found ''2016-08-01''

解决方法：hive版本太新，hive自身bug，把hive版本从2.1.0降到1.2.1

140、ParseException line 1:17 mismatched input 'hdfs' expecting StringLiteral near 'inpath' in load statement

解决方法：去掉以hdfs开头的IP端口号前缀，直接写HDFS中的绝对路径，并用单引号括起来

141、[ERROR] Terminal initialization failed; falling back to unsupported java.lang.IncompatibleClassChangeError: Found class jline.Terminal, but interface was expected解决方案：export HADOOP_USER_CLASSPATH_FIRST=true

142、crontab中启动的shell脚本不能正常运行，但是使用手动执行没有问题

解决方法：在脚本第一行写上source /etc/profile,因为cront进程不会自动加载用户目录下的.profile文件

143、SparkListenerBus has already stopped! Dropping event SparkListenerStageCompleted

解决方法：集群资源不够，确保真实剩余内存大于spark job申请的内存

144、PrestoException: ROW comparison not supported for fields with null elements

解决方法：把 !=null 换成 is not null

145、启动presto服务器，部分节点启动不成功

解决方法：JVM所分配的内存，必须小于真实剩余内存

146、经验：presto进程一旦启动，JVM server会一直占用内存

147、Error injecting constructor, java.lang.IllegalArgumentException: query.max-memory-per-node set to 20GB, but only 10213706957B of useable heap available

解决方法：Presto will claim 0.40 * max heap size for the system pool, so your query.max-memory-per-node must not exceed this. You can increase the heap or decrease query.max-memory-per-node.

148、failed: Encountered too many errors talking to a worker node. The node may have crashed or be under too much load. failed java.util.concurrent.CancellationException: Task was cancelled

解决方法：such exceptions caused by timeout limits，延长等待时间，在work节点config配置中set exchange.http-client.request-timeout=50s

149、大数据ETL可视化有哪些主流方案

解决方法：可以考虑的技术栈有ELK(elasticsearch+logstash+kibana)或者HPA(hive+presto+airpal)

150、经验：presto集群没必要采用on yarn模式，因为hadoop依赖HDFS，如果部分机器磁盘很小，HADOOP会很尴尬，而presto是纯内存计算，不依赖磁盘，独立安装可以跨越多个集群，可以说有内存的地方就可以有presto

转载于:https://www.cnblogs.com/cstzhou/p/6437270.html

你可能感兴趣的:(大数据常见错误解决方案（转载）)

CURL一文通 calmtho curl 网络
文章目录1.什么是curl2.curl可以发送什么请求3.常见curl发http相关请求怎么写4.curl带上的参数分别有什么，可以怎么用5.进阶用法6.常见错误以及学习指导建议1.什么是curl是利用URL语法在命令行下工作的开源文件传输工具。尤其被广泛应用的在linux系统下。2.curl可以发送什么请求由定义可知道，curl主要应用于网络传输，它支持常用的多种请求，如http,https,f
android 自定义分辨率,Moonlight Android端自定义分辨率，解决黑边问题 weixin_39661589 android 自定义分辨率
更新：使用原版moonlight修改特殊分辨率需要root权限，没有root权限可尝试此版本的moonlight选择当前设备分辨率。再次更新：moonlight9.8版本以上已经支持设置为当前设备分辨率。问题描述本人手机分辨率是2340×1080，在使用moonlight串流时分辨率选择1080p，发现有黑边，此时串流的分辨率为1920×1080。解决方案第一步，调整主机分辨率可以看到，主机实际显
利用NFC增强用户体验：HarmonyOS Next的NFC应用指南 SameX-4869 ux harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在智能设备的交互领域，NFC（NearFieldCommunication，近场通信）技术以其便捷、快速的特点，为用户带来了诸多便利。HarmonyO
单体架构、微服务组件与解决方案 Forever Nore 分布式 SpringCloud 架构微服务面试
资料：微服务、MQ资料链接:https://pan.baidu.com/s/1nzCJ-hNw854uFJQf6jWobg提取码:yyds单体架构微服务拆分与改进将单体项目拆分成微服务项目1、拆分原则
IPC Kit基础入门：理解HarmonyOS的进程间通信架构 SameX-4869 harmonyos 架构华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在HarmonyOS应用开发中，进程间通信（IPC）是构建复杂应用架构的关键要素。IPCKit为开发者提供了强大的进程间通信能力，使不同进程之间能够高
融合网络实训室初步建设方案设想武汉唯众智创网络融合网络实训室融合网络融合网络实验室网络融合实训室网络融合实验室
一、引言在数字化浪潮席卷全球的当下，网络技术已然成为推动社会发展和经济增长的关键力量。从日常的生活购物到企业的运营管理，从便捷的社交沟通到前沿的科研探索，网络技术无处不在，深刻地改变着人们的生活与工作方式。随着5G、物联网、云计算、大数据等新兴技术的迅猛发展，网络技术领域对于专业人才的需求呈现出爆发式增长。据权威机构预测，未来几年，网络技术相关岗位的人才缺口将持续扩大。这些岗位不仅要求从业者具备扎
嵌入式SDIO 总线面试题及参考答案大模型大数据攻城狮 fpga开发嵌入式面经 SPI USB接口 SD总线 SDIO总线牛客网
目录SDIO总线与SD总线的核心区别是什么？(附框架图）简述SDIO总线物理接口的组成及其功能（CLK、CMD、DAT0-DAT3）。SDIO总线支持的最大数据传输位宽是多少？如何配置？解释SDIO总线中的主从模式架构及通信流程。SDIO卡的功能类型有哪些（如Wi-Fi、蓝牙、GPS）？SDIO总线时钟信号（CLK）的作用及典型频率范围SDIO协议中的OCR寄存器作用是什么？如何通过CMD5获取卡
深度合成算法备案十大雷区拆解 AI产品备案人工智能算法语言模型 ai
最近后台收到了很多小伙伴的私信，基本上都是在问算法备案被打回了；哪部分的材料有什么问题；不清楚驳回原因等等。今天结合大家最关心的问题，为大家详细剖析一下备案过程中常见的十大难题及解决方法。一、备案主体性质界定不明不少企业在备案过程中往往难以明确自身是否属于备案主体范围，尤其是涉及技术提供与应用服务的交叉领域，无法判断自身是否属于“具有舆论属性或者社会动员能力”主体。解决方案：仔细研读相关政策法规，
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
Ubuntu安装docker-compose-plugin报错“无法定位软件包”终极解决方案川星弦 ubuntu docker linux
摘要：本文针对Ubuntu系统中安装docker-compose-plugin时出现的E:无法定位软件包错误，提供两种解决方案——官方源修复与国内镜像源替换法，并附赠镜像加速配置技巧。一、问题背景在Ubuntu系统通过aptinstall安装Docker生态工具时，常因软件源配置问题导致以下报错：E:无法定位软件包docker-compose-plugin此问题多由Docker官方软件源未正确添加
Spring Boot 多级缓存实战：基于 Redis+Redisson 构建高并发解决方案 Isaac_Gao 缓存 spring boot redis
SpringBoot多级缓存实战：基于Redis+Redisson构建高并发解决方案本文适合人群：中高级Java开发工程师、系统架构师、对高并发场景优化感兴趣的技术人员一、为什么需要多级缓存？在百万级并发的电商系统中，我们曾遇到这样的性能瓶颈：本地缓存导致各节点数据不一致单纯依赖Redis造成带宽瓶颈缓存雪崩导致DB被打挂多级缓存架构通过结合本地缓存与分布式缓存的优势，实现了：热点数据纳秒级访问分
学校打算用十万购买一台服务器，大家有什么推荐吗？ m0_59732961 云服务器阿里云
上云吧！上云是趋势，先po几条有的没的：北京市国税局与阿里云达成战略合作共同推进“智慧税务”建设...阿里云为12306提供技术支持...浙江启动“十万企业上云”计划...为什么要上云：1、自购服务器很可能会遇到技术壁垒，面对技术问题没有成熟的解决方案；2、运维成本低，几乎没什么运维成本；3、云服务器三副本可靠性高，自己买一台服务器还要考虑到容灾的问题吧；4、灵活扩展在线升降配，不会造成资源浪费冗
【从零开始学习计算机科学】软件工程（五）软件设计贫苦游商学习软件工程软件开发软件设计敏捷开发极限编程软件需求
【从零开始学习计算机科学】软件工程（五）软件设计软件设计概述良好的设计具有三大特性设计主要包含的方面设计中的一些概念设计的方法与策略体系结构设计体系结构设计的基本问题：体系结构的设计模式体系结构设计的过程构建级设计面向对象构件设计用户接口设计用户接口设计原则：用户接口分析的目标：设计的评审软件设计概述软件的分析偏重于问题域，描述软件要做什么，而设计则偏重于解决方案，描述软件究竟要如何做。设计创建了
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？北京华人开创公司北斗卫星授时 NTP时间同步 GPS对时装置 NTP 时间同步服务器网络时间服务器 NTP时间服务器网络系统时钟同步
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？京准电钟分享：医院网络内NTP时间同步服务器作用是什么？时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消息、事件、节点、数据等具备正确的逻辑性、协调性以及可追溯性。大数据产生与处理系统是各种计算设备集群的，计算设备将统一、同步的标准时间用于记
Linux系统下装R包又慢又容易报错？ NameError_sfj 鸡毛蒜皮 linux r语言
短话短说：Linux安装默认从源码安装，因此在终端中使用Rconsole装包时会从源码重新编译，这个过程十分耗时，且很容易出错。解决方案有二：1）使用Rstudio/Rstudio-server，因为Rstudio支持预编译安装，直接下载安装编译好的R包，省时省力；2）使用包管理工具，如conda，通过condainstall直接安装R包的预编译版本短话长说版本：打开Linux终端、键入R进入Rc
电力时间同步系统，京准电钟电子助力增效北京华人开创公司时钟系统卫星同步时钟北斗卫星授时时钟同步时间同步北斗卫星授时授时服务器 NTP时间服务器卫星时钟服务器
电力时间同步系统，京准电钟电子助力增效电力时间同步系统，京准电钟电子助力增效电力时间同步系统是保障电网稳定运行的关键技术，其核心在于为全网的设备提供统一、高精度的时间基准。以下从技术方案、系统设计要点及挑战与解决方案等方面进行详细阐述：一、主要技术方案卫星同步技术GPS/北斗授时：通过接收卫星信号（如GPS或北斗）获取高精度时间源，精度可达微秒级（1μs），适用于故障录波、继电保护等场景。北斗系统
204页数字化转型：集团企业信息化规划方案公众号：智慧方案文库精选解决方案（附下载）大数据 database
建立统一共享的信息平台，集团总部能实时监控下属单位的库存、产量、成本、资金流等关键信息，有效利用大数据技术平台为管理层提供全面、及时、准确的决策信息支持。n推动生产、销售、新业务领域的自动化、数字化、网络化、信息化、集成化，为今后打造智能制造、智慧农业奠定坚实基础；n推进IT基础设施建设与提升，采用全新的架构设计理念，建成组件化、集中化、服务化、协同化的统一云平台，提供高质量、可重用的平台服务，营
【Vue3+Vite指南】全局引入SCSS文件后出现Undefined mixin？一招解决命名空间陷阱！积水成江前端 scss 前端 html5 vue.js
【Vue3+Vite全局引入SCSS指南】解决Undefinedmixin错误的完整方案本文目录前置准备：安装SCSS环境问题现象与错误分析根本原因：Sass模块化的命名空间三大解决方案详解方案1:显式命名空间调用方案2:全局暴露命名空间方案3:主文件聚合导出操作验证步骤扩展：@use与@import对比最佳实践与避坑指南常见问题FAQ️前置准备：安装SCSS环境{#-前置准备}步骤1：安装Sas
数字化建设经营管理平台解决方案（34页PPT）（文末有下载方式）极客11 大数据人工智能物联网
数字化建设经营管理平台解决方案详细解读详细资料请看本解读文章的最后内容。在当今数字化浪潮中，企业经营管理平台的构建已成为提升企业核心竞争力的关键。本文将对《数字化建设经营管理平台解决方案》进行详细解读，深入剖析其核心理念、业务场景、平台建设方案及核心功能，帮助企业更好地理解并应用这一解决方案。一、企业经营管理平台建设的理念企业经营管理平台的建设理念围绕“三驾马车”展开，即战略规划与决策、执行反馈和
Windows 下 MySQL 命令行操作全指南：端口修改、服务管理与实用技巧 mysql后端命令行
引言MySQL作为最流行的关系型数据库之一，在Windows环境下的配置与管理是开发者必备技能。本文将以命令行操作为核心，详解如何通过命令修改MySQL端口号、启停服务、自定义服务名等实用操作，并结合常见问题解决方案，帮助用户快速掌握MySQL在Windows中的高效管理方法。一、MySQL服务启停1.通过命令行启停启动MySQL服务：netstartmysql8#根据实际服务名调整（如mysql
FFMPEG实现音频重采样 QQ_1695710968 音频重采样 FFMPEG PCM
技术在于交流、沟通，转载请注明出处并保持作品的完整性。原文：https://blog.csdn.net/hiwubihe/article/details/81259134[音频编解码系列文章]音频编解码基础FFMPEG实现音频重采样FFMPEG实现PCM编码(采用封装格式实现)FFMPEG实现PCM编码(不采用封装格式实现)FAAC库实现PCM编码FAAD库实现RAW格式AAC解码FAAD库实现R
【产品经理】设计一流产品九步法程矢 Axure原型设计 axure
转载自：老二牛车教育»【产品经理】设计一流产品九步法百度高管舒迅（@舒迅）曾经带领百度贴吧创造出一年内用户注册量增长10倍、浏览量3倍增长的奇迹，作为一名在中国互联网摸爬滚打超过12年的老兵，在和百度内部同事的相互磨砺中，总结出了极其丰富而是用的产品设计经验。他在这篇文章中介绍的九条方法不仅值得每一个PM的认真学习，同样也值得每一个有志于打造出一流产品的互联网创业者和从业者的揣摩。本文描述的产品设
C++设计模式-原型模式：从基本介绍，内部原理、应用场景、使用方法，常见问题和解决方案进行深度解析牵牛老人 C++专栏 c++设计模式原型模式
一、基本介绍：理解"克隆"的设计哲学1.1什么是原型模式原型模式（PrototypePattern）是一种创建型设计模式，其核心思想是通过复制现有对象来创建新对象，而非传统的新建实例方式。如同生物学的细胞分裂机制，原型对象作为"母体"，通过自我复制产生完全相同的新个体。该模式在C++中通常借助拷贝构造函数或克隆接口实现，特别适用于以下场景：对象初始化成本高昂（如需要读取大文件）；系统需要动态生成多
计算机毕设论文灵魂模块：系统架构图设计终极指南（附资料）计算机毕业设计小帅课程设计毕业设计 java 系统架构
【关注我，毕业设计不迷茫】|6年辅导经验|帮助1200+学子顺利毕业大家好，我是程序员小帅，一名专注于计算机毕业设计全流程辅导的技术博主。专注JavaWeb,我深耕毕设领域6年，累计输出1200+原创项目案例，辅导成功率接近100%。如果你正在为选题、代码、论文或答辩发愁，这里能给你最落地的解决方案！为什么架构图是毕设的灵魂？1️⃣展示系统思维：用一张图说清技术选型逻辑2️⃣设计说明书：开发前必须
何时选择Linux而不是RTOS 硬核科技硬件开发 linux arm开发运维人工智能单片机嵌入式硬件硬件工程
嵌入式系统的开发，常常涉及到实时性、效率、资源管理等多方面的要求。在许多实时性要求高、资源受限的系统中，RTOS（实时操作系统）凭借其低延迟和高效的资源管理特性，成为主流的选择。然而，随着嵌入式系统功能的复杂化和应用领域的扩展，尤其是在消费类电子和商用领域，RTOS的局限性逐渐显现，嵌入式Linux系统逐渐成为一种更合适的解决方案。1.多任务与多进程的复杂管理RTOS的任务调度机制在轻量级嵌入式系
【C语言开源库】lw_oopc：轻量级的C语言面向对象编程框架机载软件与适航 C语言 C/C++开源库 c语言
文章目录轻量级的面向对象C语言编程框架LW_OOPC介绍摘要s为什么要用面向对象?为什么不直接使用C++?LW_OOPC是什么?LW_OOPC宏介绍问题描述解决方案方案的可扩展性如何?LW_OOPC最佳实践LW_OOPC的优点LW_OOPC的缺点总结幕后花絮参考资料轻量级的面向对象C语言编程框架LW_OOPC介绍轻量级的面向对象C语言编程框架LW_OOPC介绍摘要s本文介绍一种轻量级的面向对象的C
VSCODE中open函数读取不了相对路径怎么办青岑浪 vscode ide python
在VScode中使用f=open(txt,'r')读取文件时报错：Nosuchfileordirectory记录一下我的解决过程和看到的好文章，供大家参考搜索到一个博主的解决方案Vscode的相对路径读取问题及处理_解决vscode相对路径-CSDN博客，在目录的.vscode文件夹中，修改launch.json文件，添加一行代码："cwd":"${fileDirname}",就可以一劳永逸的解决
在连通无向图中寻找欧拉回路（Eulerian Circuit）醉心编码 c/c++技术类编程基础算法欧拉回路
在连通无向图中寻找欧拉回路（EulerianCircuit）问题描述解决方案概述算法步骤伪代码C代码示例如何在迷宫中找出一条路示例：在简单迷宫中应用欧拉回路结论问题描述给定一个连通无向图$G=(V,E)$，我们需要找到一条路径，该路径正向和反向通过$E$中的每条边恰好一次，即该路径通过每条边两次，但方向相反。这样的路径被称为欧拉回路（EulerianCircuit）。解决方案概述欧拉回路存在的充分
DeepSeek：技术教育领域的AI变革者——从理论到实践的全面解析量子纠缠BUG DeepSeek DeepSeek部署 AI 人工智能 python
一、技术教育为何需要DeepSeek？在数字化转型的浪潮下，技术教育面临着知识更新快、实践门槛高、个性化需求强三大核心挑战。传统的教学模式难以满足开发者快速掌握前沿技术、构建复杂系统能力的需求。DeepSeek作为国产开源大模型的代表，凭借其推理能力、多模态支持与低成本部署的特性，正在为技术教育带来突破性解决方案。二、DeepSeek赋能技术教育的核心技术优势1.推理能力驱动深度学习思维链（CoT
Next：ReferenceError: document is not defined dingcho 前端前端 javascript 开发语言
next配置路由报错nextReferenceError:documentisnotdefined，这个解决方案import{BrowserRouterasRouter,Routes,Route}from'react-router-dom';原使用react-router-dom修改为(建议)import{useRouter}from'next/router';如果使用react-router-d
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源