PENGYUCHENG32109

Spark Streaming初体验之NetworkWordCount案例完美解读

参考

DT大数据梦工厂@王家林系列
Spark Streaming官网

场景

分别用scala与java写一个Spark应用程序：实时监听、接收并计算某socket中字符及其出现的次数。例如：在socket中输入 “hello world hello spark” 则计算结果为（hello,2） (world,1) (spark,1)

实验

java版

package cool.pengych.spark.streaming;
import java.util.Arrays;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaPairDStream;
import org.apache.spark.streaming.api.java.JavaReceiverInputDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import scala.Tuple2;
public class WordCountOnline
{
    public static void main(String[] args) 
    {
        /* * 第一步：配置SparkConf */
        SparkConf  conf = new SparkConf().setMaster("local[2]").setAppName("WordCountOnline");
        /* * 第二步：创建SparkStreamingContext */
        JavaStreamingContext jsc = new JavaStreamingContext(conf, Durations.seconds(1));

        /* * 第三步：创建Spark Streaming输入数据来源 input stream */
        JavaReceiverInputDStream<String> lines = jsc.socketTextStream("localhost", 9999);

        /* *第四步：基于DStream进行编程 */
        JavaDStream<String> words = lines.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public Iterable<String> call(String line) throws Exception{
                return Arrays.asList(line.split(" "));
            }
        });
        JavaPairDStream<String,Integer> pairs = words.mapToPair(new PairFunction<String, String, Integer>() {
            @Override
            public Tuple2<String,Integer> call(String word) throws Exception{
                return new Tuple2<String,Integer>(word,1);
            }
        });
        JavaPairDStream<String, Integer> wordsCount = pairs.reduceByKey(new Function2<Integer,Integer,Integer>(){
            @Override
            public Integer call(Integer v1, Integer v2) throws Exception {
                return v1 + v2;
            }
        });
        wordsCount.print();

        /* * 第五步：启动StreamingContext的执行. */
        jsc.start();

        jsc.awaitTermination();
    }
}

scala官网版

package main.scala
import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.Seconds
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.streaming.dstream.DStream.toPairDStreamFunctions

object NetworkWordCount {
  def main(args: Array[String]) {
    if (args.length < 2) {
      System.err.println("Usage: NetworkWordCount <hostname> <port>")
      System.exit(1)
    }

    // Create the context with a 1 second batch size
    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount")
    val ssc = new StreamingContext(sparkConf, Seconds(1))

    // Create a socket stream on target ip:port and count the
    // words in input stream of \n delimited text (eg. generated by 'nc')
    // Note that no duplication in storage level only for running locally.
    // Replication necessary in distributed scenario for fault tolerance.
    val lines = ssc.socketTextStream("localhost", 9999,StorageLevel.MEMORY_AND_DISK_SER)
    val words = lines.flatMap(_.split(" "))
    val wordCounts = words.map(x => (x, 1)).reduceByKey(_ + _)
    wordCounts.print()
    ssc.start()
    ssc.awaitTermination()
  }
}
// scalastyle:on println

scala精简版

package main.scala

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.streaming.Seconds
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.dstream.ReceiverInputDStream
import org.apache.spark.streaming.dstream.DStream

object WordsCountOnline {

  def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("Network words onLine")
    val ssc = new StreamingContext(sparkConf,Seconds(1))

   ssc.socketTextStream("localhost", 9999, StorageLevel.MEMORY_AND_DISK_SER).flatMap { line =>line.split(" ") }.map { word => (word,1) }.reduceByKey(_+_).print

   ssc.start()
   ssc.awaitTerminationOrTimeout(10000)
  } 
}

执行结果

16/05/14 12:19:10 INFO DAGScheduler: Job 16 finished: print at WordsCountOnline.scala:20, took 0.018674 s -------------------------------------------
Time: 1463199550000 ms -------------------------------------------
(yes,3)
(yse,1)
16/05/14 12:19:10 INFO JobScheduler: Finished job streaming job 1463199550000 ms.0 from job set of time 1463199550000 ms

执行过程

第一步：配置SparkConf

1、至少2条线程：因为spark streaming 应用程序在运行的时候至少有一条线程在不断的循环接收数据，并且至少有一条线程用于处理接收的数据，否则的话，随着时间的推移，内存和磁盘都会不堪重负。

2、对于集群而言，每个Excecutor一般肯定不止一个Thread,那对于处理Spark Streaming的应用程序而言，每个Executor一般分配多少Core比较合适？经验:5个左右是最佳的!

第二步：创建SparkStreamingContext

1、SparkStreaming应用程序所有功能的其始点和程序调度的核心。SparkStreamingContext的构建可以基于SparkConf参数，也可基于持久化的SparkStreamingContext的内容恢复过来：典型的场景是Driver崩溃后重新启动，由于Spark Streaming具有连续7*24小时不间断运行的特征，所有需要在Driver重新启动后继续上一次的状态，此时状态的恢复需要基于曾经的checkpoint。

2、在一个Spark Streaming应用程序中可以创建若干个SparkStreamingContext对象，使用下一个SparkStreaming之前要把前面正在运行的SparkStreamingContext对象关闭调，由此，我们获得一个重大启发：SparkStreaming只是Spark Core上的一个应用程序而已，只不过Spark Streaming构架箱运行的话需要Spark工程师写业务逻辑处理数据。

第三步：创建Spark Streaming输入数据来源 input stream

1、数据输入来源可以基于 File、HDFS、Flume、Kafka、Socket等。

2、以socket端口为例，Spark streaming链接上该端口并在运行的时候一直监听该端口的数据（当然该端口服务必须存在：nt -lk 9999 :在本地启动一个socket服务，该服务监听并接收从端口9999写入的数据），并且在后续会根据业务需要不断的有数据产生。

3、如果经常在每间隔5秒钟没有数据的话，不断启动空的Job其实会造成调度资源的浪费，因为并没有数据需要发生计算。
实际的企业级生成环境的代码在具体提交Job 前会判断是否有数据，没有的话就不再提交Job。

第四步：基于DStream编程

就像对于RDD编程一样基于DStream进行编程。DStream是RDD产生的类，在SparkStreaming具体发生计算前，其实质是把每个Batch的DStream的操作翻译成为对RDD的操作。

注：
1、Spark Streamig应用程序要执行具体的Job，对DStream就必须有output Stream的操作，output Stream有很多类型的触发函数例如：print、savaAsTextFile etc。其中最重要的一个方法是foreachRDD，因为Spark Streaming处理的结果，一般都会放在Redis、DB、DashBoard等上面，foreachRDD主要就是用来完成这些功能的，而且可以随意的自定义具体数据到底放在哪里。

2、print 并不会直接触发Job的执行 ,因为现在的一切都是在Spark Streaming框架的控制之下的，对于Spark Streaming而言具体是否真正触发Job运行是基于设置的Durations时间间隔。

3、Spark Streaming执行引擎也就是Driver开始运行，Driver启动的时候是位于一条新的线程中的，当然其内部有消息循环体，用于接收应用程序本身或者Excecutor中的消息。

总结

DStream(discretized stream)是RDD产生的类或者抽象(a DStream is represented as a sequence of RDDs.)，在SparkStreaming具体发生计算前，其实质是把每个Batch的DStream操作翻译成为对RDD的操作。

你可能感兴趣的:(spark,大数据)

Spark MLlib 数据预处理－特征变换 weixin_33841722 大数据人工智能 scala
2019独角兽企业重金招聘Python工程师标准>>>Tokenizer（分词器）算法介绍：Tokenization将文本划分为独立个体（通常为单词）。RegexTokenizer基于正则表达式提供更多的划分选项。默认情况下，参数“pattern”为划分文本的分隔符。或者可以指定参数“gaps”来指明正则“patten”表示“tokens”而不是分隔符，这样来为分词结果找到所有可能匹配的情况。调用
spark应用程序转换_4.Spark特征提取、转换和选择 - 简书 weixin_39956182 spark应用程序转换
在实际机器学习项目中，我们获取的数据往往是不规范、不一致、有很多缺失数据，甚至不少错误数据，这些数据有时又称为脏数据或噪音，在模型训练前，务必对这些脏数据进行处理，否则，再好的模型，也只能脏数据进，脏数据出。这章我们主要介绍对数据处理涉及的一些操作，主要包括：特征提取特征转换特征选择4.1特征提取特征提取一般指从原始数据中抽取特征。4.1.1词频－逆向文件频率(TF-IDF)词频－逆向文件频率(T
Spark权威指南读书笔记（二）：结构化API kaiker
第四章结构化API概述结构化API主要指三种核心分布式集合类型API：Dataset、DataFrame、SQL表和视图DataFrame和Dataset类型DataFrame和Dataset是具有行和列的类似于数据表的集合类型Spark中的DataFrame和Dataset代表不可变的数据集合Schema定义了DataFrame的列名和类型两者比较非类型化的DataFrame和类型化的Datas
大数据分析与大数据开发两者的区别是怎样的? 泰迪智能科技01 就业班大数据
大数据主要分为两个就业方向：①大数据开发②大数据分析大数据分析：主要负责现有数据价值提炼与挖掘，包括业务增长点挖掘，产品改进点挖掘，业务分析指标体系构建，业务分析报告出具等大数据开发：主要负责大数据平台与应用开发，包括数据仓库构建，离线计算、实时计算应用开发，大数据应用后端开发，企业数据标准制定等就业岗位薪资（平均月薪如下）大数据的培训目标是什么呢？大数据分析方向：从企业实际数据分析需求出发，满足
飞凌方案丨基于LS1028A系列核心板打造一款边缘计算网关 spear800 5G LS1028A 飞凌嵌入式边缘计算网关
随着物联网、大数据、人工智能等技术的快速发展与应用,给传统的云计算模式带来了巨大的挑战,这也催生出了计算模式的变革,边缘计算由此诞生。所谓边缘计算,是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务。通俗的讲,就是在数据采集的本地完成对数据的计算、处理后(譬如打上时间戳,数据格式化、对事件和过程数据分类),根据结果进行“就地”决策,并将处理完成的数
Spark-RDD迭代器管道计算隔着天花板看星星 spark 大数据 scala
一、上下文《Spark-Task启动流程》中讲到我们提交Stage是传入的是这个Stage最后一个RDD，当Task中触发ShuffleWriter、返回Driver数据或者写入Hadoop文件系统时才触发这个RDD调用它的iterator()，下面我们就来看下RDD.iterator()背后的故事。二、RDD中的iterator我们先来看下rdd.iterator()以及后面一些列的调用fina
Kylin的工作原理及使用分享操作指南 vvvae1234 kylin
ApacheKylin是一个分布式的分析引擎，专为大数据环境中的快速分析和查询而设计。它通过构建OLAP（联机分析处理）立方体，使得对海量数据的实时分析成为可能，极大地提升了数据查询的效率。本文将详细介绍Kylin的工作原理，结合实际操作案例，分享如何有效使用Kylin进行大数据分析。1.Kylin概述Kylin是一个开源项目，支持SQL查询，兼容与Hive和MapReduce等大数据技术的集成。
每天一个数据分析题（五百零五）- 提升方法跟着紫枫学姐学CDA 数据分析题库数据分析
提升方法（Boosting），是一种可以用来减小监督式学习中偏差的机器学习算法。基于Boosting的集成学习，其代表算法不包括？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据
每天一个数据分析题（五百零六）- 装袋方法跟着紫枫学姐学CDA 数据分析数据挖掘
装袋方法(bagging)也叫做bootstrapaggregating,是在原始数据集有放回地重采样S次后得到新数据集的一种技术，其代表算法有？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专
Elasticsearch 压测方案之 esrally 简介叫小七的剑客
由于Elasticsearch（后文简称es）的简单易用及其在大数据处理方面的良好性能，越来越多的公司选用es作为自己的业务解决方案。然而在引入新的解决方案前，不免要做一番调研和测试，本文便是介绍官方的一个es压测工具esrally，希望能为大家带来帮助。为什么要压测？关于压测，我们先来看下百度百科上的一个定义。压测，即压力测试，是确立系统稳定性的一种测试方法，通常在系统正常运作范围之外进行，以考
关于这道填空题，你会如何回答？（附带学习链接） csdn业界要闻
曾经有一篇百万阅读量的爆文，里面出了道填空题，问：____是铜牌，____是银牌，____是金牌，____是王牌。小白的答案是：Java是铜牌，Linux是银牌，Hadoop是金牌，大数据是王牌。因为Java是学大数据的基础，有基础然后就可以学后续的；最后只有学好大数据这一王牌才能出去找一份比较好的工作。在这里相信有许多想要学习大数据的同学，所以小白我就给大家整理了一下各个学习网站，帮助大家不仅可
spark mllib 特征学习笔记（一）路人与大师 spark-ml 学习笔记
PySparkMLlib特征处理详解PySparkMLlib提供了丰富的特征处理工具，帮助我们进行特征提取、转换和选择。以下是PySparkMLlib中常用的特征处理类及其简要介绍。1.BinarizerBinarizer是将连续特征二值化的转换器。frompyspark.ml.featureimportBinarizerbinarizer=Binarizer(threshold=0.5,inpu
Spark MLlib 特征工程系列—特征转换VectorSizeHint 不二人生 Spark 实战 spark-ml 机器学习 spark
SparkMLlib特征工程系列—特征转换VectorSizeHintVectorSizeHint是Spark提供的一个特征转换器，用于指定向量列的大小（即维度）。在一些特征转换和建模过程中，要求输入的向量必须有固定的大小。当数据中包含不同大小的向量时，Spark可能无法自动推断出向量的正确大小。这时，VectorSizeHint可以显式地声明向量的大小，确保后续的操作能够顺利进行。为什么需要使用
《未来二十年，AI、区块链、云与大数据技术引领全球变革》久绊A 文献/论文人工智能区块链云计算大数据
摘要在未来二十年，全球社会与经济将深刻受到人工智能（AI）、区块链（Blockchain）、云计算（Cloud）和大数据（Data）四大核心技术的驱动。这些技术不仅从宏观上重塑产业结构，更在微观层面显著提升生活品质与效率。本文通过详尽的案例分析，结合国内外最新研究成果，深入剖析这四大技术如何在教育、智能家居、农业、金融等多个关键领域产生深远影响。关键字人工智能（AI）、区块链（Blockchain
向量数据库 Faiss 的搭建与使用 eqa11 数据库
向量数据库Faiss的搭建与使用一、引言在人工智能和大数据技术飞速发展的今天，向量数据库作为处理高维数据检索的关键技术，越来越受到重视。Faiss，作为由MetaAI（原FacebookAIResearch）开源的高效相似性搜索库，以其卓越的性能和灵活性，成为众多技术选型中的佼佼者。本文将深入探讨Faiss的搭建和使用，旨在为读者提供一个全面而详细的指南。二、Faiss简介与环境搭建1、Faiss
【大数据】深入解析向量数据库Faiss：搭建与使用指南程序者王大川杂谈 kylin faiss 学习数据库 ai编程
摘要：本文将介绍向量数据库的概念，重点讲解Faiss这一高性能相似性搜索库。通过分析官网内容，详细阐述Faiss的安装过程及使用方法，帮助读者快速上手并应用于实际项目中。什么是向量数据向量数据是一种数据类型，通常用于数学、物理学、计算机科学和数据分析等领域。在技术术语中，向量数据通常指的是以下几种概念：数学向量：在数学中，向量是一个具有大小和方向的量，可以在平面上或空间中表示为箭头。数学向量可以是
【区块链 + 司法存证】数据存证区块链服务开放平台 | FISCO BCOS应用案例 FISCO_BCOS 2023FISCO BCOS产业应用发展报告区块链司法存证
大数据时代，数据参与社会生产过程，实现价值增值，是一种新型生产要素。数据产品具有易复制、易修改等特点，因而数据产品在使用、流通过程中面临被非法复制、非法传播、非法篡改和知识产权窃取等安全风险。在存证数据上链过程中，业务单位会面临技术门槛高、布链成本高、项目建设周期长、权威机构认定对接流程复杂等问题。数据存证区块链服务开放平台基于政务、企业、互联网平台等数据应用，通过由各地建设联盟链数据节点，实现对
远程收款风控怎么解决,怎样收款不被大数据监控神州网络公司
现如今无论是用户还是各大企业以及商户，在进行交易时，大多都非常重视扫码支付平台的选择，但无论是传统电商平台的支付工具还是当下各大商业卖场所选择的支付渠道，重点还是在于要有利于自身业务的开展，接下来就为大家简单解析、选择扫码支付平台所需要注意到的问题。费率不是重点需要注意的是，不少商家在选择扫码支付平台的过程中过多地重视所谓的费率，一旦偏高就选择不再使用。当然太高很有可能导致整体的交易成本上升，但是
550MHz超高主频：揭秘ST公司M7单核性能王MCU（附全系列MCU报告一览表） Victor-Tian MCU 意法半导体 ST MCU 微控制器
550MHz超高主频：揭秘ST公司M7单核性能王MCU（附全系列MCU报告一览表）这周末，除非外面下钞票，否则谁也拦不住我玩《黑神话悟空》（附：两款可以玩转悟空的显卡推荐）原创IPBrain平台君集成电路大数据平台2024年08月27日17:26北京太阳能作为自然界中最广泛，最易取得的可再生能源，取之不尽用之不竭。如今在针对光伏储能技术新趋势中，通过运用STM32H7系列芯片，可以在光伏发电中实现
【软考】【多媒体应用设计师】元数据与数字对象标识码软考鸭软考软考多媒体应用设计师
数字对象唯一标识码（DOI)一经产生和分配就将（）。A.随所标识对象属性的改变而改变B.随机改变C.随所标识对象所处网络的改变而改变D.永久不变正确答案：D答案解析数字对象唯一标识码（DOI)的主要功能是能够对数字资源的内容做唯一的命名与辨识。DOI能唯一地标识网络环境下的任何数字对象，它一经产生和分配就永久不变，不随其所标识的对象属性的改变而改变，这是云计算背景下的大数据样本存储和应用技术的体现
Python 自动化脚本系列：介绍 codeory Python python 自动化
在大数据和数字化转型的时代，自动化已成为成功的关键组成部分。Python自动化提供了许多好处，可以彻底改变我们工作和解决问题的方式。以下是Python自动化如此重要的一些关键原因：时间节约：使用Python自动化处理重复和耗时的任务可以让个人和组织节省大量时间。通过让Python脚本处理单调乏味的任务，专业人士可以专注于需要人类创造力和决策的高价值活动。提高效率：Python自动化简化工作流程，消
每天一个数据分析题（五百零二）- 分割式聚类算法跟着紫枫学姐学CDA 数据分析题库算法数据分析聚类
以下哪个选项是分割式聚类算法?A.K-Means。B.CentroidMethodC.Ward’sMethodD.以上皆非数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据分析从业者刷题必备神器！
Python大数据学习day01——大数据开发概论笨小孩124 python 学习总结大数据学习 python
目录大数据概念大数据特点大数据应用场景大数据分析业务步骤大数据职业规划大数据学习路线1.大数据解决问题海量数据存储——海量数据运算——海量数据迁移2.大数据特点（大、多、值、快、信）数据体量大种类和来源多源化实现低价值密度速度快数据的质量准确可信3.大数据应用4.大数据分析步骤明确分析目的思路——数据收集——数据处理（ETL）——数据分析——数据展现——撰写报告5.大数据职业规划6.大数据学习路线
Python大数据之Python爬虫学习总结——day16 数据可视化笨小孩124 Python爬虫学习总结信息可视化 python 大数据
数据可视化Map_地图基础地图知识点:基础示例:实战练习:知识点:自定义模块:制作中国地图data1.txt文件内容python代码示例制作区域地图data2.txt文件内容python代码示例Line_折线图基础折线图实战练习:Bar_柱状图基础柱状图反转以及主题设置Json数据python数据转为json数据知识点:示例:json数据转为python数据知识点:json文件:示例:Map_地图
SparkStreaming 如何保证消费Kafka的数据不丢失不重复 K. Bob Spark Spark
目录SparkStreaming接收Kafka数据的方式有两种：Receiver接收数据和采用Direct方式。（1）一个Receiver效率低，需要开启多个线程，手动合并数据再进行处理，并且Receiver方式为确保零数据丢失，需要开启WAL(预写日志)保证数据安全，这将同步保存所有收到的Kafka数据到HDFS，以便在发生故障时可以恢复所有数据。尽管WAL可以保证数据零丢失，但是不能保证exa
SparkSql 李思缘的大数据之路 spark sparksql
SparkSQL基本介绍什么是SparkSQL?用于处理结构化数据的Spark模块。可以通过DataFrame和DataSet处理数据。SparkSQL特点1、易整合可以使用java、scala、python、R等语言的API操作。2、统一的数据访问连接到任何数据源的方式相同。3、兼容Hive4、标准的数据连接（JDBC/ODBC）SQL优缺点优点：表达非常清晰，难度低、易学习。缺点：复杂的业务需
SparkSQL优化查询性能的方法大数据海中游泳的鱼 Spark 大数据优化 spark 大数据
一、PySpark如何提高程序的运行效率和性能PySpark的运行效率和性能受到多个因素的影响，包括数据大小、算法复杂度、硬件资源等。以下是一些提高PySpark程序运行效率和性能的方法：1.使用DataFrame而不是RDDDataFrame比RDD更高效，因为它们使用了更为优化的二进制编码格式和查询引擎。如果可能，尽量使用DataFrame而不是RDD。2.使用广播变量（BroadcastVa
Spark on YARN 静听山水 Spark spark 大数据分布式
ApacheSpark和ApacheHadoopYARN是两个紧密相关的项目，它们经常一起使用来处理大规模数据集。下面我将解释Spark如何与YARN配合工作，以及如何在YARN上运行Spark应用程序。ApacheSparkApacheSpark是一个快速通用的大规模数据处理引擎，支持多种计算模式，如批处理、流处理、机器学习和图形处理。Spark提供了一个统一的编程模型，可以在单个集群上运行各种
知识分享系列三：大数据技术（上） jinruimeng 知识分享大数据
本文系统地介绍了大数据技术的相关知识，由于篇幅比较长，分为上下两部分，其中上半部分先介绍基本概念、核心领域，下半部分介绍主要技术、平台架构，以及相关企业案例。目录一、基本概念1.1从数据资源到大数据1.2从大数据到数据要素二、核心领域2.1概述2.2数据存储与计算2.2.1发展历程2.2.2发展特点2.2.2.1云化改造全面加速2.2.2.2融合一体化持续加深2.2.2.3安全能力快速补强2.2.
MongoDB适用场景 Rverdoser mongodb 数据库
MongoDB是一个基于分布式文件存储的开源数据库系统，其主要目标是为WEB应用提供高性能，高可用性和高伸缩性的数据存储解决方案。MongoDB将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB文档类似于JSON对象。字段值可以包含其他文档，数组及文档数组。MongoDB适用场景：大数据量存储：MongoDB非常适合存储PB级的数据。高性能：MongoDB能够实现高
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他