流月up

3.使用spark开发第一个程序WordCount程序及多方式运行代码

概述

WordCount 是一个快速入门案例，单词统计，通过此案例，学习如何用 scala 来编写 spark 程序，spark 支持 java，scalal 这些语言，目前在企业中大部分公司都是使用 scala 进行开发，后序的 flink 是基于 java 开发的，这与官网的引导有关，flink 的源码在去scala 化，基于此，将要实现以下几个目标：

WordCount程序
任务提交
- 使用 idea
- 使用 spark-submit
- 使用 spark-shell
Spark historyServer 配置

前置文章请参考：

scala安装
idea如何开发spark代码
本节涉及代码地址
此篇文章涉及到相关的知识点较多，跟着做完，即能有所得

WordCount程序

本程序基于 spark 3.2.4 ，scala 2.12.x 版本开发

准备工作

由于后续任务运行时，需要在 客户端节点或hadoop节点机器上 操作，文件来源，使用 hdfs
hello.txt上传至 hdfs如下操作

[root@hadoop01 data]# hdfs dfs -put hello.txt /tmp/
2023-11-02 09:23:45,159 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
[root@hadoop01 data]# ls
hadoop_repo  hello.txt  hive_repo  soft

上传结果如下图

scala编写代码

编码之前，要清楚代码的逻辑，即加载的数据如何一步一步变换成最终想要的结果，由下分析步骤可知，万变不离其宗 S -> T -> S 三板斧，详细请参考 Spark的工作与架构原理

创建SparkContext
加载数据(S)
对数据进行分隔，将一行数据分隔成一个一个的单词 (T)
迭代 words，将第个 word 转化为 (word,1) 这种形式 (T)
第五步：根据 key (其实就是 word) 进行分组聚合统计 (T)
第六步：结果打印 (S)

代码如下

object WordCount {
  def main(args: Array[String]): Unit = {
    // "hdfs:///tmp/hello.txt"
    var path = "/Users/hyl/Desktop/fun/sts/spark-demo/hello.txt"
    if(args.length==1){
      path = args(0)
    }

    // 第一步：创建SparkContext
    val conf = new SparkConf()
    conf
      // 设置任务名称
      .setAppName("WordCount")
      // local 表示本地运行
      .setMaster("local")
    val sp = new SparkContext(conf)
    // 第二步：加载数据
    val lineRdd = sp.textFile(path)
    // 第三步：对数据进行分隔，将一行数据分隔成一个一个的单词
    val wordsRdd = lineRdd.flatMap(_.split(" "))
    // 第四步：迭代 words，将第个 word 转化为 (word,1) 这种形式
    val pairRdd = wordsRdd.map((_, 1))
    // 第五步：根据 key (其实就是 word) 进行分组聚合统计
    val wordCountRdd = pairRdd.reduceByKey(_ + _)
    // 第六步：结果打印
    wordCountRdd.foreach(println _)
  }
}

任务提交

使用 `idea`

运行 idea 得如下结果

来体验一下 scala 函数式编程的极简之美

object WordCount2 {
  def main(args: Array[String]): Unit = {
    var path = "/Users/hyl/Desktop/fun/sts/spark-demo/hello.txt"
    if (args.length == 1) {
      path = args(0)
    }
    val conf = new SparkConf()
    conf
      // 设置任务名称
      .setAppName("WordCount")
      // local 表示本地运行
      .setMaster("local")
    new SparkContext(conf).textFile(path).flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _).foreach(println _)
  }
}

使用 `spark-submit`

使用 spark-submit 提交到集群执行，实际工作中会使用这种方式
那接下来需要把代码提交到集群中去执行
这个时候就需要对代码打包了
首先在项目的 pom文件中添加 build 配置，和 dependencies 标签平级，详细请参考源码

注意： 打包时，要将如下图的代码注释掉

[root@hadoop01 jar]# ls
spark-demo-1.0-SNAPSHOT.jar
[root@hadoop01 jar]# pwd
/data/jar

spark-submit \
--class com.fun.scala.WordCount2 \
--master yarn \
--deploy-mode client \
--executor-memory 1G \
--num-executors 1 \
/data/jar/spark-demo-1.0-SNAPSHOT.jar \
hdfs:///tmp/hello.txt

异常

Exception in thread “main” org.apache.spark.SparkException: When running with master ‘yarn’ either HADOOP_CONF_DIR or YARN_CONF_DIR must be set in the environment.

[root@hadoop01 bin]# vi /etc/profile
export HADOOP_CONF_DIR=/data/soft/hadoop-3.2.4/etc/hadoop/
[root@hadoop01 bin]# source /etc/profile
[root@hadoop01 bin]#

执行成功

使用 `spark-shell`

这种方式方便在集群环境中调试代码
有一些代码对环境没有特殊依赖的时候可以直接使用第一种方式，在idea中调试代码
但是有时候代码需要依赖线上的一些环境，例如：需要依赖线上的数据库中的数据，由于权限问题，在本地是无法连接的

这个时候想要调试代码的话，可以选择使用spark-shell的方式，直接在线上服务器中开启一个spark 的交互式命令行窗口

注意：使用spark-shell的时候，也可以选择指定开启本地spark集群，或者连接standalone集群，或者使用on yarn模式，都是可以的

[root@hadoop01 bin]# spark-shell 
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
2023-11-02 10:20:11,746 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Spark context Web UI available at http://hadoop01:4040
Spark context available as 'sc' (master = local[*], app id = local-1698891612526).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 3.2.4
      /_/
         
Using Scala version 2.12.15 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_391)
Type in expressions to have them evaluated.
Type :help for more information.

scala>

执行需要的代码

scala> val path = "hdfs:///tmp/hello.txt"
path: String = hdfs:///tmp/hello.txt

scala> sc.textFile(path).flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _).foreach(println _)
(hyl,1)0:>                                                          (0 + 2) / 2]
(word,1)
(hello,4)
(12755167,1)
(test,1)
                                                                                
scala>

效果图

`Spark historyServer` 配置

请先配置 hadoop historyServer

刚才使用 on yarn 模式的时候会发现看不到输出的日志信息，这主要是因为没有开启 spark 的historyserver，只开启了hadoop的historyserver
需要修改spark-defaults.conf和spark-env.sh
首先对spark-defaults.conf.template重命名
然后在spark-defaults.conf中增加以下内容

spark.eventLog.enabled=true
spark.eventLog.compress=true
spark.eventLog.dir=hdfs:///tmp/logs/root/logs
spark.history.fs.logDirectory=hdfs:///tmp/logs/root/logs
spark.yarn.historyServer.address=http://hadoop01:18080

注意：在哪个节点上启动spark的historyserver进程，spark.yarn.historyServer.address的值里面就指定哪个节点的主机名信息

在spark-env.sh中增加以下内容

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.fs.logDirectory=hdfs:///tmp/logs/root/logs"

bug

java.io.FileNotFoundException: File does not exist: hdfs:/tmp/logs/root/logs

解决 : 预先建立一个目录

[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# hdfs dfs -mkdir hdfs:/tmp/logs/root/logs
2023-11-02 10:36:47,136 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# sbin/start-history-server.sh
starting org.apache.spark.deploy.history.HistoryServer, logging to /data/soft/spark-3.2.4-bin-hadoop3.2/logs/spark-root-org.apache.spark.deploy.history.HistoryServer-1-hadoop01.out
[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# jps
11716 NameNode
2628 Jps
12117 SecondaryNameNode
12503 ResourceManager
10520 Master
11243 RunJar
2333 HistoryServer

在 yarn 上重新执行 WorkCount 程序，可以看到以下输出内容

结束

至此 WordCount 程序开发及运行结束，如有问题，欢迎评论区留言。

你可能感兴趣的:(spark,spark,大数据,WordCount,单词统计,scala,日志聚合)

springboot + logback + filebeat + elk 实现分布式日志中心 imalvisc java spring linux 运维
前言：本文主要介绍docker搭建elk分布式日志平台，利用filebeat监听logback日志文件，传输到elk中，最终在kibana渲染展示。主要思路：filebeat监听日志文件的变化，传输到logstash，logstash通过分析提取，将日志信息推送到elasticsearch指定索引中，最终kibana从elasticsearch索引中查询并展示日志信息。一、docker搭建elk日
nodejs：express + js-mdict 网页查询英汉词典，能播放声音 belldeep nodejs web服务 nodejs express js-mdict
向DeepSeekR1提问：我想写一个Web前端网页，后台用nodejs+js-mdict,实现在线查询英语单词1.项目结构首先，创建一个项目目录，结构如下：mydict-app/├──public/│├──index.html│├──styles.css│└──script.js├──server/│└──server.js├──package.json└──README.md英汉词典文件（*.
nodejs：express + js-mdict 网页查询英汉词典，能显示图片 belldeep nodejs javascript nodejs javascript js-mdict express
向DeepSeekR1提问：我想写一个Web前端网页，后台用nodejs+js-mdict,实现在线查询英语单词，并能显示图片1.项目结构首先，创建一个项目目录，结构如下：mydict-app/├──public/│├──index.html│├──styles.css│└──script.js├──server/│└──server.js├──package.json└──README.md英汉
煤矸石无线测温系统项目背景德明电子无线测温
一、煤矸石煤场场监测系统项目背景煤矸石是采煤和洗煤过程中的排弃物，含碳量较低、比煤坚硬的黑色岩石，通常占采煤量的15%～20%，其年产量约占煤炭总产量的十分之一。据不完全统计，国有煤矿现有煤矸石山6000余座，堆积量50亿吨以上，占我国工业固体废物排放总量的40％以上。目前，随着综采机械化的提高及煤炭资源的大量利用，使得煤矸石的产生量逐年增加，为了节约土地利用率一般都是将煤矸石山堆积成山，但是长期
pandas（02 pandas基本功能和描述性统计） twilight ember pandas python 开发语言
前面内容：pandas(01入门)目录一、PythonPandas基本功能1.1Series基本功能1.2DataFrame基本功能二、PythonPandas描述性统计2.1常用函数*2.2汇总数据(describe)*一、PythonPandas基本功能到目前为止，我们已经学习了三种Pandas数据结构以及如何创建它们。我们将主要关注DataFrame对象，因为它在实时数据处理中非常重要，并讨
最新2024.5.7版威盾IP-guard V4.84全向文档加密桌面安全管理系统8000用户破解 heike_沧海 tcp/ip 安全网络协议系统安全数据库前端 web安全
最新2024.5.7版威盾IP-guardV4.84全向文档加密桌面安全管理系统8000用户破解,可注册用户数V4.84.112（New）功能改进:日志查询的时间范围增加了时分秒的设置远程维护进程信息增加了进程树和加载模块等信息客户端增加了扫描企业微信、钉钉二维码登录验证增加了管控企业微信登录的组织的功能涉敏信息全盘扫描任务增加了备份副本的功能涉敏信息外传策略中增加了应用程序条件增加了复制到剪切板
大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm 2301_76348014 程序员深度学习大数据知识图谱
文章目录大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介Django技术介绍Neo4j数据库Bootstrap4框架Echarts简介NavicatPremium15简介Layui简介Python语言介绍MySQL数据库深度学习六、核心理论贪心算法A
C#中使用 Prism 框架 0仰望星空007 C#基础 c#开发语言 .net Prism wpf
C#中使用Prism框架前言一、安装Prism框架二、模块化开发三、依赖注入四、导航五、事件聚合六、状态管理七、测试前言Prism框架是一个用于构建可维护、灵活和可扩展的XAML应用程序的框架。它提供了一套工具和库，帮助开发者实现诸如依赖注入、模块化、导航、事件聚合等功能。使用Prism可以帮助我们构建具有良好结构的应用程序，并且使得代码更易于理解和维护。一、安装Prism框架在VisualStu
vs发布后再linux打包linux版本的安装包 kevinfkq linux github 运维
*****Linux安装包打包：**在vs打包好linux运行文件，将linux-x64复制到linux电脑桌面上，准备好可执行文件和资源后，先打开终端输入./overview.Desktop试试是否可以运行。（本项目可能需要输入sudomkdir-p/home/coalcar和sudochmod-R777/home/coalcar进行日志文件夹的创建和权限赋予）。在linux电脑操作即可。一、首
文件超 100M 推送至 Github 解决方案 Vinca@ github Git LFS Git Git Graph 代码提交大文件
文件超100M推送至Github解决方案问题原因：在使用Git将本地仓库代码推送到远端仓库时，发现本地仓库提交的commit历史存在超100M文件(如"*.obj"或"*.stl")，以致无法推送到Github远端仓库。控制台错误日志输出如下：$gitpushEnumeratingobjects:13,done.Countingobjects:100%(13/13),done.Deltacompr
Flink SQL 优化实战 - 维表 JOIN 优化腾讯云大数据大数据数据库 flink sql
作者：龙逸尘，腾讯CSIG高级工程师背景介绍维表（DimensionTable）是来自数仓建模的概念。在数仓模型中，事实表（FactTable）是指存储有事实记录的表，如系统日志、销售记录等，而维表是与事实表相对应的一种表，它保存了事实表中指定属性的相关详细信息，可以跟事实表做关联；相当于将事实表上经常重复出现的属性抽取、规范出来用一张表进行管理。在实际生产中，我们经常会有这样的需求，以原始数据流
LeetCode Hot100刷题圈圈编码 leetcode 算法数据结构
560.和为k的子数组给你一个整数数组nums和一个整数k，请你统计并返回该数组中和为k的子数组的个数。子数组是数组中元素的连续非空序列。示例1：输入：nums=[1,1,1],k=2输出：2示例2：输入：nums=[1,2,3],k=3输出：2解题思路：前缀和+哈希表优化前缀和：前缀和是指从数组开头到当前位置的所有元素的和。例如，数组[1,2,3]的前缀和数组为[1,3,6]。哈希表：哈希表用于
8.12 orm-聚合查询 yangshiting84 暑期规划 django python 后端
8.12orm-聚合查询聚合查询（aggregate）聚合查询函数是对一组值执行计算，并返回单个值。Django使用聚合查询前要先从django.db.models引入Avg、Max、Min、Count、Sum（首字母大写）。fromdjango.db.modelsimportAvg,Max,Min,Count,Sum#引入函数聚合查询返回值的数据类型是字典。聚合函数aggregate()是Que
如何利用缺陷项目统计表提高项目管理效率？项目管理
在软件开发过程中，缺陷管理是项目管理的关键环节之一。缺陷项目统计表作为一种有效的工具，能够帮助项目经理和团队成员更好地掌握项目质量状况，从而提高项目管理效率。本文将深入探讨如何充分利用缺陷项目统计表，以优化项目流程，提升产品质量。缺陷项目统计表不仅仅是一个简单的数据记录工具，它能够为项目管理提供全面的洞察。通过系统性地收集、分析和呈现缺陷数据，项目团队可以更快速地识别问题模式，制定有针对性的改进策
Django ORM - 聚合查询 lsx202406 开发语言
DjangoORM-聚合查询引言Django是一个强大的PythonWeb框架，它拥有一个功能丰富的对象关系映射（Object-RelationalMapping，简称ORM）。ORM允许开发者以Python类和对象的交互方式来操作数据库，而不是直接编写SQL查询。本文将深入探讨DjangoORM中的聚合查询功能，包括其基本用法、常用函数以及在实际开发中的应用场景。聚合查询简介聚合查询，顾名思义，
【kafka系列】如何选择消息语义？漫步者TZ kafka kafka 分布式数据库大数据
目录业务权衡如何选择消息语义？业务权衡维度At-Most-OnceAt-Least-OnceExactly-Once消息丢失风险高低无消息重复风险无高无网络开销最低（无重试）中等（可能重试）最高（事务+协调）适用场景可容忍丢失的实时数据流不允许丢失的日志采集金融交易、精准统计如何选择消息语义？At-Most-Once：优先性能与低延迟，接受数据丢失（如实时监控）。At-Least-Once：优先可
初中信息技术说课python_第一单元走进Python 编程世界 weixin_39917046 初中信息技术说课python
(共17张PPT)今年一场突如其来的新冠肺炎不仅使得人人带上了口罩，过了一个不一样的寒假，同时也使得我们以不一样的方式开启我们的学习。同学们你们知道那些人容易得肺炎重症呢？有基础病的身体素质差的身体质量指数(BMI，BodyMassIndex)是国际上常用的衡量人体肥胖程度和是否健康的重要标准，主要用于统计分析。肥胖程度的判断不能采用体重的绝对值，它天然与身高有关。因此，BMI通过人体体重和身高两
大数据专业毕业设计选题118例：数据挖掘数据分析可视化 HaiLang_IT 毕设选题教程毕业设计大数据数据挖掘
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
【SpringBoot3】面向切面 AspectJ AOP 使用详解 m0_74825152 面试学习路线阿里巴巴 python 前端开发语言
文章目录一、AspectJ介绍二、简单使用步骤1、引入依赖2、定义一个Aspect3、开启AOP支持三、AOP核心概念四、切点（Pointcut）1.execution2.within3.this&target4.args&@args5.@within&@target&@annotation五、通知（Advice）1.@Before示例：日志记录2.@AfterReturning示例：处理返回值3
Hadoop综合项目——二手房统计分析（可视化篇） WHYBIGDATA 大数据项目 hadoop 大数据
Hadoop综合项目——二手房统计分析（可视化篇）文章目录Hadoop综合项目——二手房统计分析（可视化篇）0、写在前面1、数据可视化1.1二手房四大一线城市总价Top51.2统计各个楼龄段的二手房比例1.3统计各个城市二手房标签的各类比例1.4统计各个城市各个楼层的平均价格1.5统计各个城市二手房优势的各类比例1.6统计各个城市二手房数量和关注人数的关系1.7统计各个城市二手房规格的各类比例1.
理解设计模式与 UML 类图：构建稳健软件架构的基石 A_cot 设计模式 uml microsoft 简单工厂模式工厂方法模式
在软件开发的广阔天地里，设计模式与UML（统一建模语言）类图犹如两座灯塔，为开发者照亮前行的道路，指引着我们构建出高质量、可维护且易于扩展的软件系统。今天，就让我们一同深入探索单一职责、开闭原则、简单工厂模式以及UML类图中的关键概念，包括关联、依赖、泛化、实现，还有关联关系中的特殊形式——组合与聚合。一、设计模式的基石：单一职责与开闭原则（一）单一职责原则单一职责原则如同软件世界中的“专注大师”
Spark 性能优化（四）：Cache LevenBigData spark 性能调优 spark 性能优化大数据
在Spark中，缓存是一种将计算结果存储在内存中的方式，目的是加速后续操作。当你执行迭代算法或查询时，如果多次重复使用相同的数据集，缓存可以避免每次都重新计算相同的转换操作。通过缓存，Spark可以将数据存储在内存中，这样在后续的处理阶段就能更快地访问。1.Spark缓存的关键点：缓存基本概念：通过调用.cache()对DataFrame或RDD进行缓存。默认情况下，数据会存储在内存中（RAM），
网络安全2024就业前景如何？找工作容易吗？_网络空间安全的就业方向与待遇 Hacker_Oldv 安全 web安全
众所周知，网络安全与我们息息相关，无论是企业还是个人都应该重视网络安全。而网络安全作为一个新兴行业，人才需求量远大于供给，因此在薪资福利上具有很大的优势，但对于初学者而言，很多人依然担心前景问题，那么网络安全就业前景如何？本文将为大家介绍一下。从目前市场情况来讲，网络安全的就业前景是非常不错的，2022年的统计数据，网络安全专业的缺口已经增长到140万人。1、就业岗位多，发展方向广①就业环境：网络
三种方式实现人车流统计（yolov5+opencv+deepsort+bytetrack+iou） Jayson God 人工智能 c++yolov5 opencv 算法人工智能
一、运行环境1、项目运行环境如下2、CPU配置3、GPU配置如果没有GPUyolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++，使用的第三方库，onnxruntime-linux-x64-1.12.1，opencv-4.6.0opencv官方地址Releases-OpenCVopencvgithub地址https://github.com/opencv/opencv/tr
基于Unity引擎的日志管理模块深度技术分析晴空了无痕项目框架 unity 游戏引擎系统架构
引言在游戏开发领域，日志系统是诊断运行时问题的重要基础设施。本文将以GameFramework.Logging命名空间下的LogController类为研究对象（原YouYou.LoggerManager），从架构设计、实现机制、性能优化等多个维度进行深入剖析，并提出改进建议。本文涉及的类名和变量名均经过语义化重构，以提升代码可读性。一、架构设计分析1.1类层次结构设计publicclassLog
沃德代驾系统uniapp+php 博纳软云博纳miui52086 全行业源码sony52101 uni-app 微信小程序小程序微信
代驾软件的主要功能包括预约代驾、在线抢单、一键定位、在线支付、车主登记和代驾司机实名登记等‌。用户可以通过小程序预约代驾服务，系统会估算代驾价格并推送附近代驾司机供用户选择；司机接到订单后，会自动生成路线，方便快速找到车主；服务结束后，用户可以直接在线支付。用户端代驾端更新日志V1.0.0发布版本
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
使用Docker搭建Flink集群 O_1CxH Flink大数据 Kafka大数据 docker flink 容器
目录使用Docker搭建Flink集群docker-compose一键搭建步骤附录参考资料使用Docker搭建Flink集群在学习大数据框架的时候，需要一个真实的环境。我们知道，像spark、flink这些计算框架都有多种运行模式：在本地使用多线程模拟集群真正的分布式集群如果直接在IDE（Intellj）里面编译和运行写好的程序，实际上是用的前一种运行模式；如果想尝试真正的生产环境中任务的提交和管
领域驱动设计（DDD）是什么？——从理论到实践的全方位解析小胡说技书 Java+SSM+DB java 领域驱动设计（DDD）架构领域模型微服务
文章目录一、引言二、核心概念与定位2.1DDD定义与核心理念2.2DDD关键元素三、底层原理与技术细节3.1领域模型与普适语言3.1.1领域模型3.1.2普适语言（UbiquitousLanguage）3.2战术设计模式详解3.2.1实体、值对象、聚合与领域服务3.2.2无状态函数在领域服务中的应用3.2.3工厂与仓储模式3.3战略设计：限界上下文与防腐层3.3.1限界上下文（BoundedCon
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他