这个程序猿可太秀了

Spark消费Kafka的两种方式

目录

- 介绍
- Receiver方式
- - code
  - 原理
  - 如何保证数据不丢失
  - - 但是会导致数据重复问题
  - 优点
  - 缺点
- Direct(No Receiver)方式
- - code
  - 特点
  - 优点
  - 缺点

介绍

kafka版本，kafka0.8支持Receiver和Direct
Kafka版本大于等于0.10.0，且Spark版本大于等于Spark 2.3.0，应使用spark-streaming-kafka-0-10，
Kafka 0.9版本之前，consumer默认将offset保存在Zookeeper中，从0.9版本开始，consumer默认将offset保存在Kafka一个内置的topic中，该topic为__consumer_offsets

这个版本好像不支持Receiver方式

     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-streaming_2.11</artifactId>
         <version>2.2.2</version>
     </dependency>

     <!--spark-streaming-kafka-plugin-->
     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-streaming-kafka-0-8_2.11</artifactId>
         <version>2.2.2</version>
     </dependency>

Receiver方式

code

 // 1、Kafka配置
 // 配置zookeeper集群、消费者组
 val kafkaParams = Map(
   "zookeeper.connect" -> "localhost:2181",
   "group.id" -> groupID)

 // 2、topic_name与numThreads的映射
 // topic有几个partition,就写几个numThreads。
 // 每个partition对应一个单独线程从kafka取数据到Spark Streaming
 val topics = Map(topicName -> numThreads)

 // 3、ReceiverInputDStream
 // 注意:应先import kafka.serializer.StringDecoder再import org.apache.spark.streaming._
 val kafkaStream= KafkaUtils.createStream[String, String, StringDecoder, StringDecoder](
   ssc,
   kafkaParams,
   topics,
   StorageLevel.MEMORY_AND_DISK_SER_2)

原理

Spark Streaming启动时，会在Executor中同时启动Receiver异步线程用于从Kafka持续获取数据，数据保存在Executor中，Executor挂了会导致数据丢失

Spark Streaming启动时，会在Executor中同时启动Receiver异步线程用于从Kafka持续获取数据

获取的数据先持久化在Receiver中(存储方式由StorageLevel决定，一般是内存+磁盘)

当Batch Job触发后，这些数据会被转移到剩下的Executor中被处理

处理完毕后，Receiver会自动更新Zookeeper中的Offset
这个是以前记笔记写的，我现在感觉这个需要验证，到底是什么时候提交的offset

如何保证数据不丢失

接受数据不会立即更更新offset，而是等到持久化结束后更新offset

但是，如何节点挂了，持久化到内存的数据就丢失了

生产下，为保证数据完全不丢失，一般需要启用WAL(Write Ahead Log)预写日志机制,需要配置WAL,spark.streaming.receiver.writeAheadLog.enable，将Receiver收到的数据再备份一份到更可靠的系统如HDFS分布式文件中，以冗余的数据来换取数据不丢失

虽然WAL可以确保数据不丢失，它并不能对所有的数据源保证exactly-once语义，这就是数据重复问题

但是会导致数据重复问题

虽然WAL可以确保数据不丢失，它并不能对所有的数据源保证exactly-once语义

接收器接收到输入数据，并把它存储到WAL中
接收器在更新Zookeeper中Kafka的偏移量之前突然挂掉了
Spark Streaming假设输入数据已成功收到（因为它已经写入到WAL中）
然而Kafka认为数据被没有被消费，因为相应的偏移量并没有在Zookeeper中更新
那些被保存到WAL中但未被处理的数据被重新读取
一旦从WAL中读取所有的数据之后，接收器开始从Kafka中消费数据
因为接收器是采用Kafka的High-Level Consumer API实现的，它开始从Zookeeper当前记录的偏移量开始读取数据，但是因为接收器挂掉的时候偏移量并没有更新到Zookeeper中，所有有一些数据被处理了2次

优点

Receiver底层实现中使用了Kafka高级消费者API,因此,不需要自己管理Offset,只需指定Zookeeper和消费者组GroupID,系统便会自行管理

缺点

启用WAL机制虽然可以防止数据丢失，但是浪费存储空间也影响效率，因为数据实际上被复制了两份，Kafka自己本身就有高可靠的机制会对数据复制一份，而这里又会复制一份到WAL中
采用MEMORY_AND_DISK_SER降低对内存的要求。但是在一定程度上影响计算的速度
会出现重复消费问题
需要使用单独的Receiver线程来异步获取Kafka数据。
需要专门的Receivers来读取Kafka数据且不参与计算，浪费Executor
由于receiver也是属于Executor的一部分，那么为了提高吞吐量，提高Receiver的内存。但是在每次batch计算中，参与计算的batch并不会使用到这么多的内存，导致资源严重浪费
Receiver和计算的Executor的异步的，那么遇到网络等因素原因，导致计算出现延迟，实时任务一直在增加，而Receiver则在一直接收数据，但是计算不过来，导致数据堆积

Direct(No Receiver)方式

code

 // 1、Kafka配置
 // auto.offset.reset=latest 无提交的offset时,从最新的开始消费
 // enable.auto.commit=false 禁用后台自动提交offset,自己手动管理
 val kafkaParams = Map[String, Object](
   "bootstrap.servers" -> "localhost:9092",
   "key.deserializer" -> classOf[StringDeserializer],
   "value.deserializer" -> classOf[StringDeserializer],
   "auto.offset.reset" -> "latest",
   "enable.auto.commit" -> (false: java.lang.Boolean),
   "group.id" -> groupID)

 // 2、DirectKafkaInputDStream
 // LocationStrategies:本地策略。为提升性能,可指定Kafka Topic Partition的消费者所在的Executor。
 // LocationStrategies.PreferConsistent:一致性策略。一般情况下用这个策略就OK。将分区尽可能分配给所有可用Executor。
 // LocationStrategies.PreferBrokers:特殊情况,如果Executor和Kafka Broker在同一主机,则可使用此策略。
 // LocationStrategies.PreferFixed:特殊情况,当Kafka Topic Partition负荷倾斜,可用此策略,手动指定Executor来消费特定的Partition.
 // ConsumerStrategies:消费策略。
 // ConsumerStrategies.Subscribe/SubscribePattern:可订阅一类Topic,且当新Topic加入时，会自动订阅。一般情况下，用这个就OK。
 // ConsumerStrategies.Assign:可指定要消费的Topic-Partition,以及从指定Offset开始消费。
 val kafkaStream=KafkaUtils.createDirectStream[String,String](
   ssc,
   LocationStrategies.PreferConsistent,
   ConsumerStrategies.Subscribe[String,String](List(topicName),kafkaParams)
 )

特点

为了解决由WAL引入的性能损失，并且保证 exactly-once 语义，不需要使用单独的Receiver线程从Kafka获取数据
使用Kafka简单消费者API,不需要ZooKeeper参与，直接从Kafka Broker获取数据
当action真正触发时才会去kafka里接数据,需要计算时再读取数据
为保证整个应用安全性， Offset管理一般需要借助外部存储实现。如Mysql、HBase等

优点

不需要单独的Receiver线程从Kafka获取数据，所有的Executor都参与计算。所以相同的资源申请，Direct方式能够支持更大的业务
Receiver方式持续不断接收数据，业务量大时需要提高内存，但是Executor计算用不到这么多内存，Direct方式节省了这部分内存，只需要考虑批量计算所需要的内存即可，实际应用中我们可以把原先的10G降至现在的2-4G左右。
当action真正触发时才会去kafka里接数据,需要计算时再读取数据，实时任务堆积时，不会导致数据堆积
Spark Streaming会创建和Kafka Topic Partition一样多的RDD Partition,而且是一对一的映射关系，这样,就可以并行读取，大大提高了性能
Spark Streaming自己就负责追踪消费的offset，并保存在checkpoint中。Spark自己一定是同步的，因此可以保证数据是消费一次且仅消费一次
不需要开启WAL机制，只要Kafka中作了数据的复制，那么就可以通过Kafka的副本进行恢复

缺点

提高开发成本。Direct需要用户采用checkpoint或者第三方存储来维护offsets，而不像Receiver-based那样，通过ZooKeeper来维护Offsets，此提高了用户的开发成本
提高监控成本，没有监控可视化。Receiver-based方式指定topic指定consumer的消费情况均能通过ZooKeeper来监控，而Direct则没有这种便利，如果做到监控并可视化，则需要投入人力开发。

你可能感兴趣的:(#,spark,#,kafka,spark内核,kafka,spark)

链表中插入新的节点李解49 freeRTOS从0到1 链表数据结构单片机
/*节点结构体定义*/structxLIST_ITEM{TickType_txItemValue;/*辅助值，用于帮助节点做顺序排列*/structxLIST_ITEM*pxNext;/*指向链表下一个节点*/structxLIST_ITEM*pxPrevious;/*指向链表前一个节点*/void*pvOwner;/*指向拥有该节点的内核对象，通常是TCB*/void*pvContainer;/
OpenKyLin开源操作系统——银河麒麟
openKylin操作系统是由openKylin社区主导开发的一款根社区桌面操作系统，适用于X86、ARM、RISC-V等主流架构的台式电脑、笔记本电脑、平板和嵌⼊式设备。在内核、基础库、应用软件等方面均采用领先的版本，是麒麟商业版本的技术上游，与商业版本路线一致、协同发展。同时，openKylin社区版还将融合各类创新技术应用，汇聚行业力量，共同推动Linux行业创新发展！版本特性openKyl
opc server 开发心得 carelg server service input output tags mfc
这段时间公司项目上需要把数据通过OPCSERVER开放接口，在网上及CSDN上SEARCH了好久，感觉CSDN上的资料还是比较专业的，但也有做广告的,我摸索了一周时间，有点心得，并用在工程上，一下是一周体会;一：WINTECH的开发包WINTECH网站上可下载开发包，WTOPCSVR.DLL有VBVCVC#的例程，但是DEMODLL,可运行30分钟，比较容易上手，但对开发者来说不能从内核上了解OP
国产化关系型数据库都有哪些？哪些数据库使用的频次最高？信创天地数据库开发语言 java 大数据网络安全运维开发
以下是国产化关系型数据库的主要产品及其在信创项目中的应用频次分析，结合技术特性、行业适配性和市场占有率综合评估：一、主流国产关系型数据库列表1.传统集中式数据库数据库名称厂商技术路线核心特点达梦DM武汉达梦自研内核（兼容Oracle）高兼容Oracle，政务/金融领域占有率第一人大金仓KingBase人大金仓PostgreSQL分支优化军工背景，党政机关标配GaussDB华为自研（兼容Postgr
Linux系统管理：服务器运维与安全防护教IT的小王A 服务器运维 linux web安全安全网络
Linux系统管理：服务器运维与安全防护Linux系统管理：服务器运维与安全防护一、Linux系统管理基础系统架构与组成是一种自由和开放源代码的类UNIX操作系统，它是基于POSIX和UNIX的多用户、多任务操作系统。Linux的核心是Linux内核，其基本组成部分包括Shell、文件系统、系统库等。常用Linux命令文件与目录管理在Linux系统中，文件和目录的管理是非常重要的，例如用户常用的l
Kafka 消息队列 ikun· kafka 分布式
一、消息队列1.什么是消息队列消息(Message)是指在应用间传送的数据。消息可以非常简单，比如只包含文本字符串，也可以更复杂，可能包含嵌入对象。消息队列(MessageQueue)是一种应用间的通信方式，消息发送后可以立即返回，由消息系统来确保消息的可靠传递。消息发布者只管把消息发布到MQ中而不用管谁来取，消息使用者只管从MQ中取消息而不管是谁发布的。这样发布者和使用者都不用知道对方的存在。2
NT内核函数原型 C+V代码搬运工 C/C++运维网络 linux
NT内核函数原型加粗样式NtLoadDriver服务控制管理器加载设备驱动.NtUnloadDriver服务控制管理器支持卸载指定的驱动程序.NtRegisterNewDevice加载新驱动文件.NtQueryIntervalProfile返回数据.NtSetIntervalProfile指定采样间隔.NtStartProfile开始取样.NtStopProfile停止采样.NtSystemDeb
Jupyter常见操作（持续更新） Morning的呀 jupyter
Jupyter常见操作（持续更新）本文主要整理一些常见的或者比较简单的Jupyter操作，尽量保证一次性整理出来，方便需要但是忘记的情况下可以直接查，希望能当字典。1.查看Jupyter内核jupyterkernelspeclist2.使用指定内核condaactivate+“内核名称”例:condaactivated2l-env3.启动Jupyterjupyternotebook
linux操作系统的软件架构分析 sunflower_w linux 运维服务器
一、linux操作系统的层次结构1.内核的主要功能1）进程管理2）内存管理3）文件系统4）进程间通信、I/O系统、网络通信协议等2.系统程序1）系统接口函数库，比如libc2)shell程序3）编译器、编辑器等基础设施3.最关键的部分1）CPU管理：进程的抽象，以及借助中断机制进行的进程管理与调度2）内存：进行地址空间的抽象,以及物理内存的分配与进程地址空间的映射3）文件：一切皆文件。通过文件系统
Linux 内核配置核心文件config与流程 sunflower_w linux 运维服务器
一、Linux内核配置核心文件与流程总览1.核心文件关系图二、核心文件详解1.Kconfig：配置选项定义文件作用：定义内核所有可配置选项（菜单、依赖关系、默认值），是配置系统的“语法规则”。位置：内核源码各子目录（如arch/arm64/Kconfig、drivers/net/Kconfig），形成层次化菜单结构。核心语法：KconfigconfigNETWORKINGbool"Networki
基于arm的linux系统调用分析 hello_zfy 学习笔记 arm linux 面试
1系统调用的作用linux内核中设置了一组用于实现各种系统功能的子程序，称为系统调用，最简单的如read，write,open等等。用户可以通过系统调用命令在自己的应用程序上调用他们，从某种角度来看，系统调用和普通函数调用非常相似。区别在于系统调用由操作系统核心提供，运行在内核态，而普通函数调用由函数库或用户自己提供，运行于用户态。实际上，很多已经被我们习以为常的C语言标准函数，在linux平台上
大数据ETL工具比较：Sqoop vs Flume vs Kafka AI天才研究院 AI人工智能与大数据大数据 etl sqoop ai
大数据ETL工具比较：SqoopvsFlumevsKafka关键词：大数据ETL、Sqoop、Flume、Kafka、数据迁移、日志采集、消息队列摘要：在大数据生态中，ETL（抽取-转换-加载）是数据价值挖掘的关键环节。不同业务场景对数据传输的实时性、可靠性、数据类型有差异化需求，催生了Sqoop、Flume、Kafka等特色鲜明的ETL工具。本文从核心架构、工作原理、性能指标、实战案例四个维度，
鸿蒙OH南向开发小型系统内核（LiteOS-A）【扩展组件】下 yx525623 鸿蒙开发 openharmony 鸿蒙南向鸿蒙开发 harmonyos openharmony 鸿蒙南向嵌入式硬件
轻量级进程间通信基本概念LiteIPC是OpenHarmonyLiteOS-A内核提供的一种新型IPC（Inter-ProcessCommunication，即进程间通信）机制，不同于传统的SystemVIPC机制，LiteIPC主要是为RPC（RemoteProcedureCall，即远程过程调用）而设计的，而且是通过设备文件的方式对上层提供接口的，而非传统的API函数方式。LiteIPC中有两
《凤凰架构》C12-容器间网络 Epi_HHH 阅读笔记网络容器
一、Linux网络虚拟化1）干预网络通信——以NetFliter与iptable为例钩子是iptables在内核网络协议栈处理数据包时的“插入点”，也就是规则生效的具体时刻和位置。数据包经过网络栈，会在不同阶段被iptables规则检查。INPUT：处理进入本机的数据包OUTPUT：处理由本机发出的数据包FORWARD：处理经过本机转发的数据包PREROUTING：数据包进入路由决策前（常用来做D
【LLaMA 3实战】3、LLaMA 3长文本处理终极指南：从128K上下文到百万级文档实战无心水 LLaMA 3 模型实战专栏 LLaMA LLaMA 3 长文本处理 Meta AI大模型 CSDN技术干货 LLaMA 3 前沿模型实战
引言：长文本处理的技术跃迁当LLaMA3将上下文窗口扩展至128Ktokens（约8万字），长文本处理技术迎来了革命性突破。这不仅意味着模型能处理更复杂的文档，更开启了"全局认知"的新可能——从法律合同的全条款审查到代码仓库的跨文件重构，从金融报告的时序分析到医疗病历的全周期追踪。本文将系统拆解LLaMA3长文本能力的技术内核，提供工程级优化方案与实战技巧，助你突破长文本处理的算力瓶颈与应用边界。
（较详细）Kafka 安装配置耐思nice～数据分析 kafka 分布式
一，kafka介绍Kafka是一个分布式的消息队列系统，用于高效处理和传递大规模数据流。本文将指导您如何在您的系统上安装和配置Kafka。二，步骤概述1，下载Kafka前往,kafka官网下载Kafka（ApacheKafka）。2，安装Java确保您的系统上已安装Java。Kafka是用Java开发的，因此需要Java环境来运行。3，解压Kafka将下载的Kafka压缩文件解压到您选择的目录中。
第一节：kafka golang sarama初体验锅锅来了 Golang实战案例 kafka golang 运维开发
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、sarama是什么？typeClient：主要操作元数据typeClusterAdmin:二、小试牛刀1.创建项目2.创建kafka_client.go总结前言关于Kafka的开发库，以Java的居多，Golang语言的开发库，主要推荐的是sarama项目地址：https://github.com/IBM/sarama
Linux学习笔记：PCIe内核篇（1）：初始化与枚举流程 ZH_2025 嵌入式协议篇 PCIE
根据system.map查看内核中PCIe加载流程：root@zh-vm:~#cat/boot/System.map-5.15.0-130-generic|greppci|grepinitcallffffffff8350ff68d__initcall__kmod_pci__453_6907_pci_realloc_setup_params0ffffffff83510098d__initcall__
linux学习第五周运维小杨 linux 学习运维
目录1、总结rocky系统的启动流程，grub工作流程1.1系统启动整体流程（基于BIOS/UEFI）1.2硬件初始化阶段1.2.1BIOS（传统模式）1.2.2UEFI（新模式）1.3引导加载程序（GRUB2）阶段1.4内核加载与初始化阶段1.5用户空间初始化（systemd阶段）2、总结内核设计流派及特点。3、总结systemd服务配置文件4、总结DNS域名三级结构，DNS服务工作原理，涉及递
Linux运维学习路线沉默的八哥 Linux 运维 linux 学习
以下是一个Linux运维详细学习路线：一、Linux基础入门（第1-2个月）操作系统安装与基本概念学习Linux系统的安装，包括常见发行版（如Ubuntu、CentOS、Debian等）的选择。了解安装过程中的分区设置（如根分区、交换分区）、文件系统类型（如ext4、xfs）的选择及其对系统性能的影响。熟悉Linux的基本概念，如内核、shell、文件系统层次结构（FHS）标准。掌握文件系统的目录
Linux程序设计：什么时候选择开发内核模块？ mzhan017 kernel 笔记 linux 网络设计
最近看一个CPU使用率高的问题，从perf里看，是下面的一个占用的比较多是下面一个OverheadSource:LineSymbolSharedObject-8.48%[vdso][1129]0x1129B[.]0x0000000000001129
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
Kafka中的消费者偏移量是如何管理的？ java1234_小锋 java kafka 分布式
大家好，我是锋哥。今天分享关于【Kafka中的消费者偏移量是如何管理的？】面试题。希望对大家有帮助；Kafka中的消费者偏移量是如何管理的？超硬核AI学习资料，现在永久免费了！在Kafka中，消费者的偏移量（offset）是用来追踪消费者读取消息的位置。Kafka提供了多种方式来管理消费者偏移量，确保消息能够从正确的位置继续消费。以下是Kafka中消费者偏移量的管理方式：1.自动提交（AutoCo
Kafka的消费消息是如何传递的？ java1234_小锋 java kafka 分布式
大家好，我是锋哥。今天分享关于【Kafka的消费消息是如何传递的？】面试题。希望对大家有帮助；Kafka的消费消息是如何传递的？超硬核AI学习资料，现在永久免费了！在Kafka中，消息的消费是通过消费者（Consumer）和消费者组（ConsumerGroup）来完成的。Kafka通过这种机制来传递消息并确保消息被正确消费。下面是Kafka消费消息传递的基本流程：消息生产（Producer）：Ka
Kafka与RabbitMQ相比有什么优势？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【Kafka与RabbitMQ相比有什么优势？】面试题。希望对大家有帮助；Kafka与RabbitMQ相比有什么优势？超硬核AI学习资料，现在永久免费了！Kafka与RabbitMQ在消息队列的设计和应用上有一些显著的区别，每个都有各自的优势。以下是Kafka相比RabbitMQ的几个优势：高吞吐量和低延迟：Kafka能够处理大量消息并保持高吞吐量，适用于实时数据流处
Linux PXE高效批量网络装机城南云小白 linux
目录一、PXE概念1.PXE基本概念2.优点3.实现PXE的前提条件4.搭建PXE远程安装服务器二、搭建PXE远程安装服务器1.安装并启用TFTP服务2.安装并启用DHCP服务3.准备Linux内核、初始化镜像文件4.准备PXE引导程序5.安装FTP服务，准备CentOS7安装源6.配置启动菜单文件7.关闭防火墙，验证PXE网络安装三、实现Kickstart无人值守安装1.安装system-con
Linux: config: CONFIG_PREEMPT_NOTIFIERS mzhan017 kernel linux kernel sched
RHEL设置了这个config；没有在内核里找到这个config的说明。所以只能根据git的历史记录来看这个功能的解释#grepPREEMPT_NOTIFIERS/boot/config-4.18.0-553.51.1.el8_10.x86_64CONFIG_PREEMPT_NOTIFIERS=ycommite107be36efb2a233833e8c9899039a370e4b2318Autho
Linux【7】------Linux系统编程（进程间通信IPC） Invinciblenuonuo linux 多进程进程间通信
文章目录1信号1.1信号类型1.2信号含义1.3信号产生按键硬件异常调用接口发送指令内核检测1.4信号处理默认捕捉忽略1.5信号阻塞1.6信号挂起2消息队列2.1概念2.2创建消息队列2.3访问消息队列2.4控制消息队列3共享内存3.1申请共享内存3.2共享内存映射3.3控制共享内存3.4信号量3.5操作信号量1信号信号是一种异步通信方式同步通信同步指的是当进程发起一个请求，但是该请求并未马上响应
在 Ubuntu 18.04 环境下通过 qemu 运行 aarch64 linux 内核古道上的西风与瘦马 linux
1.1Ubuntu环境(Ubuntu18.04LTS)$lsb_release-aNoLSBmodulesareavailable.DistributorID:UbuntuDescription:Ubuntu18.04LTSRelease:18.04Codename:bionic1.2安装基础软件sudoaptupdatesudoaptinstallflexbisonlibncurses5-dev
TCP 缓冲区核心机制 FHKHH tcp/ip php 网络
一、TCP缓冲区核心机制1.发送与接收缓冲区发送缓冲区：当应用程序调用send()或write()函数时，数据从应用进程复制到内核的发送缓冲区。TCP协议负责将这些数据分段并发送。例如，Web服务器向客户端发送网页数据时，应用程序将内容传递到发送缓冲区，TCP再将其分割成合适大小的报文段进行传输。接收缓冲区：接收端将收到的数据存入内核的接收缓冲区，应用程序调用recv()或read()函数从中读取
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他