哥伦布112

Spark Streaming 运行日志、任务监控 Web UI 、Kafka 、Listener 邮件短信通知

任务监控
一、 Spark Web UI

对于 Spark Streaming 任务的监控可以直观的通过 Spark Web UI ，该页面包括 Input Rate, Scheduling Delay、Processing Time 等，但是这种方法运维成本较高，需要人工不间断的巡视。

这其中包括接受的记录数量，每一个batch内处理的记录数，处理时间，以及总共消耗的时间。

在上述参数之中最重要的两个参数分别是Porcessing Time 以及 Scheduling Delay

Porcessing Time 用来统计每个batch内处理数据所消费的时间

Scheduling Delay 用来统计在等待被处理所消费的时间

如果PT比SD大，或者SD持续上升，这就表明此系统不能对产生的数据实时响应，换句话来说就是，出现了处理时延，每个batch time 内的处理速度小于数据的产生速度。

在这种情况下，读者需要想法减少数据的处理速度，即需要提升处理效率。

spark streaming应用程序，放到线上后，怎么监测spark streaming程序的阻塞状态，运行情况，虽然spark 提供了spark webUI去查看，但是作为开发人员总不能天天去看spark webUI页面吧，去官网看，貌似可以通过请求spark 自带的jetty 服务器可以获取相关检测统计信息,

http://host:8088/proxy/application_1517299288666_7058/streaming/
返回的数据是要html页面，可以通过正则去解析需要的信息；但是这样子很不方便，

2.命令行版

yarn application -list

所有状态：ALL,NEW,NEW_SAVING,SUBMITTED,ACCEPTED,RUNNING,FINISHED,FAILED,KILLED多个用","分隔；
yarn application -list -appStates RUNNING

yarn logs -applicationId application_1517538889175_2550 > logs.txt
通过vim进行查看logs.txt文件

-status 列出某个application 的状态
yarn application -status application_1526100291229_206393

yarn application -kill application_1526100291229_206393

yarn node -list 查看节点清单，显示数据节点Data Node列表

yarn queue -status 队列名称

yarn top 查看集群资源使用信息
Spark 的日志
基本上每个程序都要有日志记录的功能，日志的记录最重要的用处就是监控程序的运行状态和错误查找。如果程序没有写日志，那程序就像瞎子一样，瞎跑，你都不知道为什么数据不对，为什么程序报错，程序运行成功还是失败。

在流式计算Sparkstreaming中，日志的记录是非常重要的；因为流式计算是需要7*24小时一直运行的，你不记日志你根本不知道程序运行成功还是错误（当然你可以通过spark的history来查看），但是sparkstreaming的日志它只记录程序的内部错误，并不会记录你程序的计算逻辑错误（所以会导致你整个程序计算结果都不对了都不知道）。

SparkStreming的日志是比较特别的，特别之处在于，它的日志只有在运行完成之后才能被load到本地查看的，不然它的日志是一直在hdfs上的。因为sparkstreaming程序永远不停机，就算你开启hadoop的log聚合也没用，只有当sparkstreaming程序停掉，hadoop的log聚合才能把所有的log收集到一个目录里面，所以其他的非sparkstreaming程序，比如MR,Spark 运行完后，如果开启log聚合，hadoop会负责把运行在各个节点上的log给统一收集到HDFS上。

spark on yarn应用在运行时和完成后日志的存放位置是不同的，一般运行时是存放在各个运行节点，完成后会归集到hdfs。

当这个application正常或者由于某种原因异常结束后，yarn默认会将所有日志归集到hdfs上，所以yarn也提供了一个查询已结束application日志的方法，即

spark on yarn模式，如果你的hadoop集群有100台，那么意味着你的sparkstreaming的log有可能会随机分布在100台中，你想查看log必须登录上每台机器上，一个个查看，如果通过Hadoop的8088页面查看，你也得打开可能几十个页面才能看到所有的log，那么问题来了？

能不能将这个job运行所有的log统一收集到某一个目录里面呢？如果收集到一起的话排查log就非常方便了。

那么，如果我们需要一个这样的功能：需要一个监控程序来监控Spark的运行情况，并且一旦程序出问题要马上发邮件到自己的邮箱，然后自己重启程序。

二、SparkStreaming的log4j日志记录
为什么我们要写日志
解决的思路
1、简单的思路：把SparkStreaming的运行模式选为yarn-client模式，那么程序的driver就会是在固定的机子上，你可以选择把日志都写在这台机子上，然后在这台机子上写一个脚本来监控这个日志文件(tail -f 文件路径）;你可以一直看到你日志的写出情况。

当遇到一个error日志的时候你就可以选择处理方法。这个方法的缺点是：如果程序以yarn-client模式运行的话，而且写脚本。

2、复杂一点的思路：使用log4j收集日志，然后异步发送至kafka里面，供下层消费，这个方法的好处就是，程序和日志解耦。程序只管写他的日志，也不管写什么机子，只要给他一个brokerlist。日志也都记录在kafka，你可以写一个简单的java程序来监控它。spark照样可以使用yarn-cluster模式。

收集kafka里面的日志进入es即可，出现任何异常都可以非常快和方便的在es中排查问题，效率大大提升。

参考一：spark streaming 通过log4j 统一输出日志到kafka https://blog.csdn.net/mamls/article/details/78888356

参考二：log4j收集日志然后异步发送至kafka

如何收集SparkSteaming运行日志实时进入kafka中 https://qindongliang.iteye.com/blog/2354381

Spark log4j 日志配置详解 https://blog.csdn.net/ZMC921/article/details/80238392

使用自定义的log4j配置

通常一个集群会有很多个的spark任务，每个任务都会记日志，如果都使用spark默认的日志配置文件，那将会很难控制和维护。所以需要使用自定义的log4j配置。

在默认情况下，Spark应用程序的日志级别是INFO的，我们可以自定义Spark应用程序的日志输出级别，可以到$SPARK_HOME/conf/log4j.properties（spark安装目录下面的log4j文件）文件里面进行修改，（也可指定到某一目录）

log4j.rootLogger=WARN,console,kafka

#log4j.logger.com.demo.kafka=DEBUG,kafka
# appender kafka
log4j.appender.kafka=kafka.producer.KafkaLog4jAppender
log4j.appender.kafka.topic=kp_diag_log
# multiple brokers are separated by comma ",".
log4j.appender.kafka.brokerList=192.168.201.6:9092,192.168.201.7:9092,192.168.201.8:9092
log4j.appender.kafka.compressionType=none
log4j.appender.kafka.syncSend=false
log4j.appender.kafka.layout=org.apache.log4j.PatternLayout
#log4j.appender.kafka.layout.ConversionPattern=%d [%-5p] [%t] - [%l] %m%n
log4j.appender.kafka.layout.ConversionPattern=[%d] [%p] [%t] %m%n

# appender console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.out
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=[%d] [%p] [%t] %m%n
#log4j.appender.console.layout.ConversionPattern=%d [%-5p] [%t] - [%l] %m%n
自定义的log4j配置。参数将自定义的配置文件上传到应用程序的文件列表中。自己写一个log4j.properties然后在运行程序的时候指定用这个配置文件就好了

你自己写一个log4j.properties然后在运行程序的时候指定用这个配置文件就好了。yarn的运行有两种模式，两种的指定方式不一样这样Spark应用程序在运行的时候会打出WARN级别的日志，然后在提交Spark应用程序的时候使用--files参数指定上面的log4j.properties文件路径即可使用这个配置打印应用程序的日志。

#yarn-client：
–conf “spark.driver.extraJavaOptions=-Dlog4j.configuration=file:///data/test/log4j-spark.properties”

# --files 参数将自定义的配置文件上传到应用程序的文件列表中
--driver-java-options "-Dlog4j.configuration=log4j-driver.properties"
--conf spark.executor.extraJavaOptions="-Dlog4j.configuration=log4j-executor.properties"
--files /home/hadoop/spark-workspace/log4j-driver.properties,/home/hadoop/spark-workspace/log4j-executor.properties

#yarn-cluster：
–files /data/lmq/test/log4j-spark.properties
–conf “spark.driver.extraJavaOptions=-Dlog4j.configuration=log4j-spark.properties”
–conf “spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j-spark.properties”

#不使用 --files 参数上传文件，直接使用文件。
--driver-java-options "-Dlog4j.configuration=file:/home/hadoop/spark-workspace/log4j-driver.properties "
--conf spark.executor.extraJavaOptions="-Dlog4j.configuration=file:/home/hadoop/spark-workspace/log4j-executor.properties"
原文：https://blog.csdn.net/a1043498776/article/details/56836989

最后看下提交脚本：https://blog.csdn.net/u010454030/article/details/54646898

jars=`echo /home/spark/x_spark_job/streaming_lib/*jar | sed 's/ /,/g'`

echo $jars

#nohup /opt/bigdata/spark/bin/spark-submit --class com.bigdata.xuele.streaming.SparkStreamingKmd --master yarn    --deploy-mode cluster --executor-cores 3 --driver-memory 4g   --executor-memory 4g --num-executors 10 --conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=logback.xml"   --jars $jars    kpdiag-stream-1.0.0-SNAPSHOT.jar &> streaming.log &

nohup /opt/bigdata/spark/bin/spark-submit    --class com.bigdata.xuele.streaming.SparkStreamingKmd --master yarn --deploy-mode cluster \
--files "/home/spark/x_spark_job/log4j.properties" \
--executor-cores 3   --driver-memory 3g   --executor-memory 3g --num-executors 12    --jars $jars \
--conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=log4j.properties"   \
--driver-class-path /opt/bigdata/jars/spark/kafka-log4j-appender-0.9.0.0.jar:/opt/bigdata/jars/spark/kafka_2.11-0.8.2.1.jar:/opt/bigdata/jars/spark/metrics-core-2.2.0.jar:/opt/bigdata/jars/spark/kafka-clients-0.8.2.1.jar \
--driver-library-path /opt/bigdata/jars/spark/kafka-log4j-appender-0.9.0.0.jar:/opt/bigdata/jars/spark/kafka_2.11-0.8.2.1.jar:/opt/bigdata/jars/spark/metrics-core-2.2.0.jar:/opt/bigdata/jars/spark/kafka-clients-0.8.2.1.jar \
--conf spark.executor.extraClassPath=/opt/bigdata/jars/spark/kafka_2.11-0.8.2.1.jar:/opt/bigdata/jars/spark/metrics-core-2.2.0.jar:/opt/bigdata/jars/spark/kafka-clients-0.8.2.1.jar   \
--conf spark.executor.extraLibraryPath=/opt/bigdata/jars/spark/kafka_2.11-0.8.2.1.jar:/opt/bigdata/jars/spark/metrics-core-2.2.0.jar:/opt/bigdata/jars/spark/kafka-clients-0.8.2.1.jar \
kpdiag-stream-1.0.0-SNAPSHOT.jar &> kp.log &
log4j日志设置error级别以上  https://blog.csdn.net/IBLiplus/article/details/82503366 至此，我们的log就统一收集成功了，后续我们可以把log从kafka用sparkstreaming执行筛选WARN+ERROR级别的日志信息导入到es或者hbase中，就可以任意分析和查询了。
这里需要注意一点，sparkstreaming运行时候，系统本身也有大量的log，如果把这个系统log也收集到kafka里面本身的量是非常大的，而且好多信息不重要，其实我们只需要关注业务重点log即可，主要是WARN+ERROR级别的，调试的时候可以把info级别打开，代码里重点关注的log都放在warn级别，异常什么的放在ERROR即可，这样排查问题时候也容易而且了避免了大量log的产生从应用本身性能的影响。

提交任务后，在kafka的节点上执行消费者命令就能看到对应的log输出：

kafka-console-consumer --zookeeper 192.168.201.5:2181 --topic kp_diag_log
收集到的log内容如下：

[2018-01-21 16:37:03,154] [WARN] [Driver] Support for Java 7 is deprecated as of Spark 2.0.0
[2018-01-21 16:37:19,714] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,738] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,739] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,738] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,739] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,740] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,738] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,739] [WARN] [Executor task launch worker-2] 非客观题跳过：类型：0
[2018-01-21 16:37:19,842] [WARN] [Executor task launch worker-0] 题目id：b07e88feff464659ab5a351bf1e68ee0在redis不存在

三、基于 Flume+Kafka+Spark Streaming 实现实时监控输出日志的报警系统
https://blog.csdn.net/linge1995/article/details/81326146

运用场景：
我们机器上每天或者定期都要跑很多任务，很多时候任务出现错误不能及时发现，导致发现的时候任务已经挂了很久了。

解决方法：
基于 Flume+Kafka+Spark Streaming 的框架对这些任务的输出日志进行实时监控，当检测到日志出现Error的信息就发送邮件给项目的负责人。

1、Flume
Flume是用来收集、汇聚并且传输日志数据Kafka去。可以设置多个sources对应多个任务的日志，到一个kafka sinks。配置文件如下：

#define agent
agent_log.sources = s1 s2
agent_log.channels = c1
agent_log.sinks = k1

#define sources.s1
agent_log.sources.s1.type=exec
agent_log.sources.s1.command=tail -F /data/log1.log

#define sources.s2
agent_log.sources.s2.type=exec
agent_log.sources.s2.command=tail -F /data/log2.log

#定义拦截器
agent_log.sources.s1.interceptors = i1
agent_log.sources.s1.interceptors.i1.type = static
agent_log.sources.s1.interceptors.i1.preserveExisting = false
agent_log.sources.s1.interceptors.i1.key = projectName
agent_log.sources.s1.interceptors.i1.value= project1

agent_log.sources.s2.interceptors = i2
agent_log.sources.s2.interceptors.i2.type = static
agent_log.sources.s2.interceptors.i2.preserveExisting = false
agent_log.sources.s2.interceptors.i2.key = projectName
agent_log.sources.s2.interceptors.i2.value= project2

#define channels
agent_log.channels.c1.type = memory
agent_log.channels.c1.capacity = 1000
agent_log.channels.c1.transactionCapacity = 1000

#define sinks
#设置Kafka接收器
agent_log.sinks.k1.type= org.apache.flume.sink.kafka.KafkaSink
#设置Kafka的broker地址和端口号
agent_log.sinks.k1.brokerList=cdh1:9092,cdh2:9092,cdh3:9092
#设置Kafka的Topic
agent_log.sinks.k1.topic=result_log
#包含header
agent_log.sinks.k1.useFlumeEventFormat = true
#设置序列化方式
agent_log.sinks.k1.serializer.class=kafka.serializer.StringEncoder
agent_log.sinks.k1.partitioner.class=org.apache.flume.plugins.SinglePartition
agent_log.sinks.k1.partition.key=1
agent_log.sinks.k1.request.required.acks=0
agent_log.sinks.k1.max.message.size=1000000
agent_log.sinks.k1.agent_log.type=sync
agent_log.sinks.k1.custom.encoding=UTF-8

# bind the sources and sinks to the channels
agent_log.sources.s1.channels=c1
agent_log.sources.s2.channels=c1
agent_log.sinks.k1.channel=c1
执行flume-ng命令启动flume：

flume-ng agent -c /etc/flume-ng/conf -f result_log.conf -n agent_log
2、Kafka
Kafka是一个消息系统，可以缓冲消息。Flume收集的日志传送到Kafka消息队列中（Flume作为生产者），然后就可以被Spark Streaming消费了，而且可以保证不丢失数据。

#创建result_log主题
kafka-topics --zookeeper cdh1:2181,cdh1:2181,cdh3:2181 --create --topic result_log --partitions 3 --replication-factor 1

#测试-查看kafka主题列表，观察result_log是否创建成功
kafka-topics --list --zookeeper cdh1:2181,cdh1:2181,cdh3:2181

#测试-启动一个消费者测试flume传输日志到kafka这一环节是否正常运行
kafka-console-consumer --bootstrap-server cdh1:9092,cdh1:9092,cdh3:9092 --topic result_log
3、Spark Streaming
我们用Zookeeper来管理spark streaming 消费者的offset。调用

KafkaUtils.createDirectStream[String, String](ssc, PreferConsistent, Subscribe[String, String](topics, kafkaParams, newOffset))
与kafka建立连接，返回InputDStream，获取数据流，

stream.foreachRDD(rdd => {

//处理程序

})
发送邮件的功能配置org.apache.commons.mail这个包的 HtmlEmail 这个类，调用 HtmlEmail.send 发送邮件。

编写一个start.sh脚本启动 Spark Streaming 程序，最后 sh start.sh 启动脚本。

#!/bin/bash
export HADOOP_USER_NAME=hdfs
spark2-submit \
--master yarn \
--deploy-mode client \
--executor-cores 3 \
--num-executors 10 \
--driver-memory 2g \
--executor-memory 1G \
--conf spark.default.parallelism=30 \
--conf spark.storage.memoryFraction=0.5 \
--conf spark.shuffle.memoryFraction=0.3 \
--conf spark.reducer.maxSizeInFlight=128m \
--driver-class-path mysql-connector-java-5.1.38.jar \
--jars mysql-connector-java-5.1.38.jar,qqwry-java-0.7.0.jar,fastjson-1.2.47.jar,spark-streaming-kafka-10_2.11-2.2.0.jar,hive-hbase-handler-1.1.0-cdh5.13.0.jar,commons-email-1.5.jar,commons-email-1.5-sources.jar,mail-1.4.7.jar \
--class com.lin.monitorlog.mianer.Handler \
monitorLog.jar
以上介绍日志的监控，当Spark任务spark streaming 发生阻塞的时候，可以发送邮件
二、SparkListener与StreamingListener
spark 提供了一系列整个任务生命周期中各个阶段变化的事件监听机制通过这一机制可以在任务的各个阶段做一些自定义的各种动作， SparkListener与StreamingListener（StreamingListener是对SparkStream进行监控）便是这些阶段的事件监听接口类通过实现这个类中的各种方法便可实现自定义的事件处理动作。

对spark任务的各种事件做相应的操作，嵌入回调代码。

比如：你可以在sparkListener中的onApplicationStart方法中做driver端的第三方框架的连接池初始化（连接仅限driver端使用）以及其他变量的初始化，并放置到公共对象中，driver端直接就可以使用。且在onApplicaionComple方法中做连接的释放工作，以及变量的收集持久化操作，以次达到隐藏变量初始化的操作，做成公共jar包供其它人使用。

又如：你可以在StreamingListener的onbatchStart操作中获取kafka读取的offset位置以及读取数据条数，在onBatchCompl方法中将这些offset信息保存到mysql/zk中，达到优雅隐藏容错代码的目的。同样可以做成公共jar共其他项目使用。

性能分析

在使用过程中，大家可能比较关系另外一个问题：指标收集，会对流式计算性能产生多大的影响？

答案就是，在指标收集这一块，对于流式计算或者spark core产生的影响会很小。因为即使你不收集SparkUI也会收集，这些指标一样会生成。只是对于driver端的开销会稍微变大，如果在流式计算场景可能需要你调大driver端的cpu和内存

SparkListener
使用方法：
sparkListener是一个接口，我们使用时需要自定义监控类实现sparkListener接口中的各种抽象方法，SparkListener 下各个事件对应的函数名非常直白，即如字面所表达意思。想对哪个阶段的事件做一些自定义的动作，变继承SparkListener实现对应的函数即可，这些方法会帮助我监控spark运行时各个阶段的数据量，从而我们可以获得这些数据量，具体的抽象方法下面一一介绍。

SparkListener的抽象方法：

abstract class SparkListener extends SparkListenerInterface {
  //阶段完成时触发的事件
  override def onStageCompleted(stageCompleted: SparkListenerStageCompleted): Unit   = { }
  //阶段提交时触发的事件
  override def onStageSubmitted(stageSubmitted: SparkListenerStageSubmitted): Unit   = { }
  //任务启动时触发的事件
  override def onTaskStart(taskStart: SparkListenerTaskStart): Unit = { }
  //下载任务结果的事件
  override def onTaskGettingResult(taskGettingResult: SparkListenerTaskGettingResult): Unit = { }
  //任务结束的事件
  override def onTaskEnd(taskEnd: SparkListenerTaskEnd): Unit = { }
  //job启动的事件
  override def onJobStart(jobStart: SparkListenerJobStart): Unit = { }
  //job结束的事件
  override def onJobEnd(jobEnd: SparkListenerJobEnd): Unit = { }
  //环境变量被更新的事件
  override def onEnvironmentUpdate(environmentUpdate:SparkListenerEnvironmentUpdate): Unit = { }
  //块管理被添加的事件
  override def onBlockManagerAdded(blockManagerAdded:
  SparkListenerBlockManagerAdded): Unit = { }
  override def onBlockManagerRemoved( blockManagerRemoved: SparkListenerBlockManagerRemoved): Unit = { }
  //取消rdd缓存的事件
  override def onUnpersistRDD(unpersistRDD: SparkListenerUnpersistRDD): Unit = { }
  //app启动的事件
  override def onApplicationStart(applicationStart: SparkListenerApplicationStart):  Unit = { }
  //app结束的事件 [以下各事件也如同函数名所表达各个阶段被触发的事件不在一一标注]
  override def onApplicationEnd(applicationEnd: SparkListenerApplicationEnd): Unit  = { }
  override def onExecutorMetricsUpdate( executorMetricsUpdate: SparkListenerExecutorMetricsUpdate): Unit = { }
  override def onExecutorAdded(executorAdded: SparkListenerExecutorAdded): Unit = {  }
  override def onExecutorRemoved(executorRemoved: SparkListenerExecutorRemoved):  Unit = { }
  override def onExecutorBlacklisted( executorBlacklisted: SparkListenerExecutorBlacklisted): Unit = { }
  override def onExecutorUnblacklisted( executorUnblacklisted: SparkListenerExecutorUnblacklisted): Unit = { }
  override def onNodeBlacklisted( nodeBlacklisted: SparkListenerNodeBlacklisted): Unit = { }
  override def onNodeUnblacklisted( nodeUnblacklisted: SparkListenerNodeUnblacklisted): Unit = { }
  override def onBlockUpdated(blockUpdated: SparkListenerBlockUpdated): Unit = { }
  override def onOtherEvent(event: SparkListenerEvent): Unit = { }
}
StreamingListener
     StreamingListener 是一个特质，是针对spark streaming的各个阶段的事件监听机制在用法上跟SparkListener很类似，但是有些细节区别。使用时和sparkListner一样，需要监听spark streaming中各个阶段的事件只需实现这个特质中对应的事件函数即可。

trait StreamingListener {
  /** streaming 启动的事件 */
  def onStreamingStarted(streamingStarted: StreamingListenerStreamingStarted) { }
  /** 接收启动事件 */
  def onReceiverStarted(receiverStarted: StreamingListenerReceiverStarted) { }
  /** Called when a receiver has reported an error */
  def onReceiverError(receiverError: StreamingListenerReceiverError) { }
  /** Called when a receiver has been stopped */
  def onReceiverStopped(receiverStopped: StreamingListenerReceiverStopped) { }
  /** Called when a batch of jobs has been submitted for processing. */
  /** 每个批次提交的事件 */
  def onBatchSubmitted(batchSubmitted: StreamingListenerBatchSubmitted) { }
  /** 每个批次启动的事件 */
  def onBatchStarted(batchStarted: StreamingListenerBatchStarted) { }
  /** 每个批次完成的事件 */
  def onBatchCompleted(batchCompleted: StreamingListenerBatchCompleted) { }
  /** Called when processing of a job of a batch has started. */
  def onOutputOperationStarted(outputOperationStarted: StreamingListenerOutputOperationStarted) { }
  /** Called when processing of a job of a batch has completed. */
  def onOutputOperationCompleted(outputOperationCompleted: StreamingListenerOutputOperationCompleted) { }
}
自定义Listener 并注册（伪代码如下）：代码https://blog.csdn.net/u010990043/article/details/83537110

val spark:SparkSession=null
val ssc:StreamingContext=null

/*注册streamingListnener*/
ssc.addStreamingListener(new MyStreamingListener)
/*注册sparkListener*/
spark.sparkContext.addSparkListener(new MySparkListener)

/*自定义streamingListener*/
class MyStreamingListener extends StreamingListener{
//TODO 重载内置方法
}

/*自定义SparkListnener*/
class MySparkListener extends SparkListener {
//TODO 重载内置方法
}
案例一
实时监控spark Streaming运行时的延迟时间，每个批次处理的条数，然后将这些实时数据插入到influxDB数据进行实时展示。

/**
* 自定义spark监控类实现获得延迟和批次条数的方法
*/
class JobListener(appId: String) extends StreamingListener {
override def onBatchCompleted(batchCompleted: StreamingListenerBatchCompleted):
Unit = {
//调度延迟，单位：毫秒
val actualSchedulingDelay: Long = batchCompleted.batchInfo.schedulingDelay.get
//处理记录数
val numRecords: Long = batchCompleted.batchInfo.numRecords
val processingDelay = batchCompleted.batchInfo.processingDelay.get
JobListener.insert(appId, actualSchedulingDelay, numRecords, processingDelay)

//实时监控spark Streaming运行时的执行时间: 调度延时，然后将这些实时数据输出日志。
val batchInfo = batchCompleted.batchInfo
val execTime = batchInfo.processingDelay.getOrElse(0L)
val schedulingTime = batchInfo.schedulingDelay.getOrElse(0L)
logInfo(s"执行时间: $execTime 调度延时 : $schedulingTime")
}
}

object JobListener {
private val config: Config = ConfigFactory.load()

val resourceAsStream: InputStream = classOf[SendMail].getClassLoader.getResourceAsStream("conf.properties")
val prop = new Properties
prop.load(resourceAsStream)

val influxDbUtil = new InfluxDbUtil(prop.getProperty("influx_db.url"),
prop.getProperty("influx_db.user"), prop.getProperty("influx_db.pwd"),
prop.getProperty("influx_db.database"))
//val influxDbUtil = new InfluxDbUtil(config.getString("influx_db.url"),
config.getString("influx_db.user"), config.getString("influx_db.pwd"),
config.getString("influx_db.database"))
influxDbUtil.setInfluxDB(influxDbUtil.getInfluxDB)
influxDbUtil.setMeasurement(prop.getProperty("influx_db.measurement"))
influxDbUtil.setDatabase(influxDbUtil.getDatabase)

def insert(appIdName: String, actualSchedulingDelay: Long, numRecords: Long,
processingDelay: Long): Unit = {
//标签
val tagMap = new util.HashMap[String, String]
//字段
val fieldMap = new util.HashMap[String, String]
tagMap.put("app_id", appIdName)
fieldMap.put("delay", actualSchedulingDelay.toString)
fieldMap.put("num_records", numRecords.toString)
fieldMap.put("processing_delay", processingDelay.toString)

influxDbUtil.insert(influxDbUtil.getMeasurement,tagMap,fieldMap)
}
}
示例代码应用

//streamingListener不需要在配置中设置，可以直接添加到streamingContext中
object My{
def main(args : Array[String]) : Unit = {
val sparkConf = new SparkConf()
val ssc = new StreamingContext(sparkConf,Seconds(20))
ssc.addStreamingListener(new JobListener(ssc))
....
}
}

案例二、当发生阻塞的时候，可以发送邮件，以下实现比较简单
class BJJListener(private val appName:String, private val duration: Int) extends StreamingListener{

private val logger = LoggerFactory.getLogger("BJJListener")

override def onReceiverStarted(receiverStarted: StreamingListenerReceiverStarted): Unit = {
super.onReceiverStarted(receiverStarted)
}

override def onReceiverError(receiverError: StreamingListenerReceiverError): Unit = super.onReceiverError(receiverError)

override def onReceiverStopped(receiverStopped: StreamingListenerReceiverStopped): Unit = super.onReceiverStopped(receiverStopped)

override def onBatchSubmitted(batchSubmitted: StreamingListenerBatchSubmitted): Unit = {
super.onBatchSubmitted(batchSubmitted)
val batchInfo = batchSubmitted.batchInfo
val batchTime = batchInfo.batchTime
logger.info("BJJListener batchTime : ", batchTime)
}

override def onBatchStarted(batchStarted: StreamingListenerBatchStarted): Unit = {
val batchInfo = batchStarted.batchInfo
val processingStartTime = batchInfo.processingStartTime
logger.info("BJJListener processingStartTime : ", processingStartTime)
}

override def onBatchCompleted(batchCompleted: StreamingListenerBatchCompleted): Unit = {
val batchInfo = batchCompleted.batchInfo
val processingStartTime = batchCompleted.batchInfo.processingStartTime

val processingEndTime = batchInfo.processingEndTime
val processingDelay = batchInfo.processingDelay
val totalDelay = batchInfo.totalDelay

if(totalDelay.get >= 6 * duration * 1000 && totalDelay.get >= 10 * duration * 1000){
val monitorTitle = s"spark streaming $appName 程序阻塞异常警告"
val monitorContent = s"BJJListener : processingStartTime -> ${processingStartTime.get}, processingEndTime -> ${processingEndTime.get} , " +
s"processingDelay -> ${processingDelay.get} , totalDelay -> ${totalDelay.get}, 请及时检查！"
val monitorContent = s"BJJListener :
processingStartTime -> ${processingStartTime.get},
processingEndTime -> ${processingEndTime.get} ,
processingDelay -> ${processingDelay.get} ,
totalDelay -> ${totalDelay.get},
请及时检查！"

EmailSender.sendMail(monitorTitle, monitorContent)
}
logger.info("BJJListener processingEndTime : ", processingEndTime)
logger.info("BJJListener processingDelay : ", processingDelay)
logger.info("BJJListener totalDelay : ", totalDelay)
}

override def onOutputOperationStarted(outputOperationStarted: StreamingListenerOutputOperationStarted): Unit =
super.onOutputOperationStarted(outputOperationStarted)

override def onOutputOperationCompleted(outputOperationCompleted: StreamingListenerOutputOperationCompleted): Unit =
super.onOutputOperationCompleted(outputOperationCompleted)

}
public class EmailSender {

private static boolean sendTextMail(EmailSendInfo mailInfo) {
boolean sendStatus = false;//发送状态
// 判断是否需要身份认证
EmailAuthenticator authenticator = null;
Properties pro = mailInfo.getProperties();
if (mailInfo.isValidate()) {
// 如果需要身份认证，则创建一个密码验证器
authenticator = new EmailAuthenticator(mailInfo.getUserName(), mailInfo.getPassword());
}
// 根据邮件会话属性和密码验证器构造一个发送邮件的session
Session sendMailSession = Session.getInstance(pro, authenticator);
//【调试时使用】开启Session的debug模式
sendMailSession.setDebug(true);
try {
// 根据session创建一个邮件消息
MimeMessage mailMessage = new MimeMessage(sendMailSession);
// 创建邮件发送者地址
Address from = new InternetAddress(mailInfo.getFromAddress());
// 设置邮件消息的发送者
mailMessage.setFrom(from);
// 创建邮件的接收者地址，并设置到邮件消息中
Address to = new InternetAddress(mailInfo.getToAddress());
mailMessage.setRecipient(Message.RecipientType.TO,to);
// 设置邮件消息的主题
mailMessage.setSubject(mailInfo.getSubject(), "UTF-8");
// 设置邮件消息发送的时间
mailMessage.setSentDate(new Date());
// 设置邮件消息的主要内容
String mailContent = mailInfo.getContent();
mailMessage.setText(mailContent, "UTF-8");

// 发送邮件
Transport.send(mailMessage);
sendStatus = true;
} catch (MessagingException ex) {
ex.printStackTrace();
}
return sendStatus;
}

public static void sendMail(String monitorTitle, String monitorContent){
String fromaddr = "[email protected]";
String toaddr = "[email protected]";
String port = "25";
String host = "smtp.exmail.qq.com";
String userName = "[email protected]";
String password = "12345678";

EmailSendInfo mailInfo = new EmailSendInfo();
mailInfo.setMailServerHost(host);
mailInfo.setValidate(true);
mailInfo.setUserName(userName);
mailInfo.setPassword(password);
mailInfo.setFromAddress(fromaddr);
mailInfo.setToAddress(toaddr);
mailInfo.setSubject(monitorTitle);
mailInfo.setContent(monitorContent);
//发送文体格式邮件
EmailSender.sendTextMail(mailInfo);
}
}
spark streaming程序测试的例子：

object test {
def main(args: Array[String]): Unit = {

System.setProperty("hadoop.home.dir", "D:\\mcyarn\\hadoop-common-2.2.0-bin-master")
Logger.getLogger("org.apache.spark").setLevel(Level.ERROR)
Logger.getLogger("org.eclipse.jetty.server").setLevel(Level.OFF)
val appName = "spark Steaming test"
val conf = new SparkConf().setMaster("local[2]").setAppName("test")
val sc = new SparkContext(conf)
val ssc = new StreamingContext(sc, Seconds(10))

val brokerList = "localhost:9092"
val zookeeperConnect = "localhost:2181"
val groupId = "baasdf20180302"
val newsTopic = "test"

val kafkaParams = Map("metadata.broker.list" -> brokerList, "group.id" -> groupId,
"zookeeper.connect"->zookeeperConnect,
"auto.offset.reset" -> kafka.api.OffsetRequest.LargestTimeString)

val kafkaStream = KafkaUtils.createDirectStream[String,String,StringDecoder, StringDecoder](ssc, kafkaParams,
topics = Set(newsTopic)).map(_._1)

kafkaStream.foreachRDD(rdd=>{
if(!rdd.isEmpty()){
val rdds = rdd.union(rdd).union(rdd).union(rdd)
val transform = rdds.map(news=>{
if(news!=null){
val split = NlpAnalysis.parse(news).toStringWithOutNature(" ")
split
}else{
null
}
})

val wordCount = transform.map(word=>(word, 1)).reduceByKey(_+_)
wordCount.foreach(println)
println(rdd.count())
}
})
// 通过可插拔的方式添加自己实现的listener
ssc.addStreamingListener(new BJJListener(appName, 10))
ssc.start()
ssc.awaitTermination()
}
}

3、除此之外你还可以自己写 Python 脚本在 yarn 管理界面解析该应用的 ApplicationMaster 的地址，之后再通过 Spark Streaming 的 UI 去获取相关参数。

解决spark streaming长时间运行日志不断增长问题
采用设置log4j.properties的方法

https://blog.csdn.net/jsjsjs1789/article/details/82902060#spark_streaming_log__7

你可能感兴趣的:(custom)

封装一个有最小化的dialog组件嘉琪001 javascript 前端 css
{{title}}最小化关闭温馨提示：当您开启医学白板并最小化界面时，离会前先关闭白板（观看者无需操作）。{{title}}import{ElMessageBox}from'element-plus'import{defineComponent,ref,watch}from'vue'exportdefaultdefineComponent({name:'CustomDialog',props:{v
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
MyBatis-Plus 使用wrapper自定义SQL
MyBatis-Plus使用wrapper自定义SQL，以下是单表查询。官方文档官方的例子：//mapper接口@Select("select*frommysql_data${ew.customSqlSegment}")ListgetAll(@Param(Constants.WRAPPER)Wrapperwrapper);//xmlListgetAll(Wrapperew);SELECT*FROM
MyBatis-Plus 中使用 Wrapper 自定义 SQL
在MyBatis-Plus中使用Wrapper自定义SQL可以灵活组合条件并复用条件逻辑，通过${ew.customSqlSegment}占位符注入Wrapper生成的SQL片段。以下是详细步骤和示例：核心步骤Mapper接口定义方法使用@Param("ew")注解声明Wrapper参数，在SQL中通过${ew.customSqlSegment}引用条件。XML或注解编写SQL在SQL中嵌入${e
python把竖着的变成横着的数_python – Reportlab：如何切换纵向和横向？ weixin_39524703
我正在使用reportlab从动态数据自动生成pdf报告.由于内容有时太大,无法以纵向显示,所以我正在为大量内容切换到景观.以下是我的报告生成工作原理：主功能：doc=DocTemplate(...)//DoctemplateisacustomedBaseDocTemplateclassarray=[]some_data="Hereissomedatadisplayedinportrait"arr
vue3 + element-plus el-table表格二次封装，支持复选框，排序，分页。前端vue.js
一、customTable.vue组件{{(currentPage-1)*pageSize+scope.$index+1}}{{btn.text}}import{ref,onMounted}from"vue";letloading=defineModel("loading");constemits=defineEmits(["selection-change","sort-change"]);co
小狼毫输入法只有一个候选词时直接上屏脚本 yivifu 办公软件小狼毫输入法雾凇唯一候选词直接上屏
昨天将小狼毫输入法雾凇拼音输入方案的辅码由部件拆字/拼音输入方案修改为五笔画输入方案后，发现输入时即使只剩下一个候选词了，仍然需要按空格键或者数字键1才能完成候选词上屏的动作，尽管网上有文章说打开auto_select:true选项即可实现只有一个候选词时自动上屏，但在我安装的0.17.3版本上实测，这个选项只能够完成字典里没有重码时的自动上屏，例如在custom_phrase_double.tx
idea 性能优化
1、cpu占用很高，导致经常卡顿排查：通过IDEAActivityMonitor，可以发现是JITcompiler占用的cpu较高。解决：help->EditCustomVMOptions，增加如下参数。重启IDEA。-XX:TieredStopAtLevel=1或者-XX:Tier4MinInvocationThreshold=100000-XX:Tier4InvocationThreshold
[ruby on rails] ActiveJob中 discard_on，retry_on和 rescue_from的应用微信-yangfansky ruby on rails 前端 javascript
job中discard_on，retry_on和rescue_from的应用#frozen_string_literal:trueclassOrdersRefundJob
MOD函数索引实战：解决百万级数据分批处理性能瓶颈数据库mysql
MOD函数索引实战：解决百万级数据分批处理性能瓶颈问题背景GreatSQL的MOD函数，大家应该都不陌生，使用MOD函数创建函数索引，是不是很少有人这么用呀，下面听我讲讲使用MOD函数创建函数索引的故事吧。故事的引子呢，是有这么一个使用场景，为了忽略客户真实的业务，对涉及的表只保留了别名。SELECTg.*FROMgJOINaONg.customer_id=a.customer_idJOINdON
r语言改变数据框列名_数据决定离线强化学习将如何改变我们的语言习惯杨_明 python 大数据人工智能 java 机器学习
r语言改变数据框列名重点(Tophighlight)Aridesharingcompanycollectsadatasetofpricinganddiscountdecisionswithcorrespondingchangesincustomeranddriverbehavior,inordertooptimizeadynamicpricingstrategy.Anonlinevendorrec
C#企业级API版本控制实战：构建可扩展的微服务架构墨夶 C#学习资料架构 c#微服务
第一章：企业级API版本控制的生死时速1.1版本控制的三重门//版本控制决策树publicenumVersionControlStrategy{[Description("URI路径版本控制")]UriPath=1,[Description("自定义HTTP头版本控制")]CustomHeader=2,[Description("Accept媒体类型版本控制")]MediaType=3}publi
SpringCloud Gateway 全局异常处理小脑斧学技术 SpringCloud java gateway 微服务
在全局过滤器中可以处理网络异常请求，但是当设置Gateway请求超时时间，超时后的异常全局过滤器中处理不了。定义CustomWebExceptionHandler类importcom.alibaba.csp.sentinel.slots.block.BlockException;importcom.tigerkin.util.ApiResult;importorg.slf4j.Logger;imp
drawRect 触发时机
在iOS开发中，**UIView**的**drawRect:**方法（或其底层**CALayer**的绘制）的触发时机是由系统控制的，开发者不能直接调用这些方法。以下是触发视图绘制的完整机制：一、核心触发时机1.视图首次显示当视图被添加到视图层级时：[self.viewaddSubview:customView];//触发首次绘制2.显式标记需要重绘调用以下方法强制重绘：//标记整个视图需要重绘[
微信聊天记录监听与转发工具明天过后0122 高效办公微信
以下是基于您需求撰写的《微信聊天记录监听与转发工具需求分析开发文档》：微信聊天记录监听与转发工具需求分析开发文档一、项目概述1.1目标开发基于wxauto的自动化工具，实现：实时监听指定微信聊天窗口（群组/个人）捕获并处理新消息按指定策略转发至目标用户"元宝"确保操作间隔符合10秒限制1.2技术栈核心框架：Python3.8+微信自动化：wxauto_custom(基于wxauto的定制版本)并发
11.2.0.4 awr快照无法正常生成
某日检查数据库性能，发现数据库awr快照没有正常生成咨询supportsr执行如下脚本DearCustomer,1.Pleaseprovidethebelowscriptoutputoninstance3:conn/assysdbasetpages1000setnum20altersessionsetnls_date_format='yyyy-mm-ddhh24:mi:ss';altersessi
docker安装单机nacos、rocketmq、reids、xxl-job、minio、elasticsearch、kibana、gogs、nginx、mongo 丶会武术的流氓丶 docker rocketmq redis elasticsearch
目录在右侧中部启动容器报错直接删除那个name后边的就可以安装nacos首先需要拉取对应的镜像文件：dockerpullnacos/nacos-server挂载目录：mkdir-p/mydata/nacos/logs/#新建logs目录mkdir-p/mydata/nacos/init.d/vim/mydata/nacos/init.d/custom.properties#修改配置文件修改cust
Flutter 进阶：实现带圆角的 CircularProgressIndicator Zender Han Flutter知识学习指南 flutter
在Flutter中，我们经常使用CircularProgressIndicator来展示加载进度。但是你是否注意到：它的进度端始终是“平头”的（直角）？这在一些UI设计中并不美观，特别是想实现类似Apple健身环那样“前端圆清澈”效果时，就需要一个带圆角的圆形进度条。方法一：使用CustomPaint自绘圆角进度Flutter的Canvas提供了绘制弧形和给进度端点设置样式的能力，我们只需设置Pa
OneCode FormField 基础表单字段功能说明低代码老李低代码软件行业领域设计低代码人工智能 java spring
一、基础表单组件组件名称功能说明CustomFormComponent基础表单布局组件，负责表单数据的加载、绑定、校验和提交，支持自定义布局和事件处理CustomMFormComponent主从表单组件，支持主子表数据结构，实现主表与子表数据的联动加载、保存和校验TableFormComponent表格表单组件，基于数据库表元数据动态生成表单，支持字段权限控制和动态列显示FormLayoutMod
Qt Creator自定义控件开发流程君鼎 C++qt c++
QtCreator自定义控件开发流程在Qt5.9Creator中开发自定义控件的完整流程如下，分为设计、实现、集成和测试四个阶段：1.创建自定义控件类(1)新建类文件右键项目→添加新文件→C++Class基类选择QWidget或现有控件（如QPushButton）命名类名（如CustomSlider），勾选“IncludeQWidget”生成头文件（customslider.h）和源文件（cust
Qt6之qml自定义控件开发流程指南君鼎 C++qt qml
Qt6之qml自定义控件开发流程指南️一、基础控件创建定义QML文件在工程中新建QML文件（如CustomButton.qml），文件名首字母大写。使用基础组件（如Rectangle、Text）构建控件逻辑，通过property暴露可配置属性：//CustomButton.qmlimportQtQuick2.15importQtQuick.Controls2.15Rectangle{id:root
C++的Qt实现自定义曲线图
此处主要是贴了曲线类，可以自行进行修改。里面具有部分变量得从外部传参数。下面是.h文件：#pragmaonce#include#include#include#include#include"typedefine.h"classCustomChartView:publicQChartView{Q_OBJECTpublic:explicitCustomChartView(QWidget*parent
uniapp 拦截器满楼、前端 uni-app vue.js
exportdefault{config:{baseURL:'https://xxx.xxx.com',header:{},dataType:'json',//#ifndefMP-ALIPAY||APP-PLUSresponseType:'text',//#endif//注：如果局部custom与全局custom有同名属性，则后面的属性会覆盖前面的属性，相当于Object.assign(全局，局部
Apache Seata ＜ 2.3.0 raft反序列化漏洞墨菲安全 Apache Seata 反序列化漏洞 CVE-2025-32897
【高危】ApacheSeata<2.3.0raft反序列化漏洞漏洞描述ApacheSeata(incubating)是一款开源的分布式事务解决方案，用于在微服务架构下提供高性能和简单易用的分布式事务服务。受影响版本中，SeataServer的Raft模块的CustomDeserializer直接通过Class.forName()加载用户可控的类名，未做安全校验，攻击者可借此利用服务端已有的恶意链实
【iSAQB软件架构】C4模型
C4模型是一种分层架构可视化框架，由SimonBrown提出，用于清晰描述软件系统的静态结构。它通过四级抽象层逐步展开细节，有效平衡全面性与可读性，已成为现代软件架构文档的核心工具。以下是其核心分层及实践指南：C4模型四层结构详解1.系统上下文图（SystemContext）目标：界定系统边界，明确外部依赖元素：✅核心系统（1个）✅用户角色（如Customer,Admin）✅外部系统（支付网关、身
Leetcode 1672. Richest Customer Wealth 小白菜又菜 Leetcode 解题报告 leetcode 算法职场和发展
ProblemYouaregivenanmxnintegergridaccountswhereaccounts[i][j]istheamountofmoneytheithcustomerhasinthejthbank.Returnthewealththattherichestcustomerhas.Acustomer’swealthistheamountofmoneytheyhaveinallth
httpclient4.5 访问使用自签名证书的https网站报错问题的解决 cszsc httpclient https 自签名证书
使用下面的getHttpClient()方法代替HttpClients.createDefault()即可。（可以不是static）privatestaticCloseableHttpClientgetHttpClient(){try{SSLContextsslContext=SSLContexts.custom().loadTrustMaterial(TrustSelfSignedStrateg
yolov11细节图有人给我介绍对象吗 AI论文写作 YOLO python 开发语言
C3kclassC3k(C3):"""C3kisaCSPbottleneckmodulewithcustomizablekernelsizesforfeatureextractioninneuralnetworks."""def__init__(self,c1,c2,n=
IntelliJ IDEA 加速优化指南中国lanwp intellij-idea java ide
IntelliJIDEA加速优化指南IntelliJIDEA是一款功能强大的IDE，但随着项目规模增大和长期使用，可能会出现性能下降的情况。以下是一些有效的加速优化方法：1.基础配置优化内存分配调整修改idea.vmoptions文件(位置：Help>EditCustomVMOptions)-Xms2048m-Xmx4096m-XX:ReservedCodeCacheSize=1024m根据机器配
Qt：QCustomPlot库的QCPAxis 十秒耿直拆包选手 C and C++Qt and Pyside QCustomPlot up qt QCustomPlot c++
在QCustomPlot中，QCPAxis是图表坐标系的核心组件，负责管理坐标轴的所有视觉和功能特性。它提供了丰富的定制选项，使开发者能够创建高度专业化的数据可视化图表。核心功能概述功能类别关键特性相关方法基本结构坐标轴位置、方向axisType(),setVisible()范围控制数据范围设置setRange(),setRangeReversed()刻度系统主/副刻度、格式setTicker()
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

Spark Streaming 运行日志 、 任务监控 Web UI 、Kafka 、Listener 邮件短信通知

你可能感兴趣的:(custom)

Spark Streaming 运行日志、任务监控 Web UI 、Kafka 、Listener 邮件短信通知