oxuzhenyi

Spark2.x 快速入门教程 7

Spark Streaming 整合 Kafka

一、实验介绍

1.1 实验内容

Kafka是一个分布式的发布-订阅式的消息系统，可以作为 DStream 的高级数据源，本部分以单击统计为例介绍 Spark Streaming 程序从 kafka 中消费数据，包括两部分（基于 Kafka Receiver 方式，基于Kafka Direct方式)。

1.2 先学课程

1.2 先学课程

Hadoop 入门进阶课程：https://www.shiyanlou.com/courses/237

Kafka 快速上手教程：https://www.shiyanlou.com/teacher/courses/785

1.3 实验知识点

Kafka Receiver
Kafka Direct
Spark Streaming
Maven

1.4 实验环境

Hadoop-2.6.1
kafka_2.10-0.10.0.0
Xfce 终端
1.5 适合人群
本课程属于初级难度级别，适合具有 Kafka 基础的用户，如果对 Streaming 了解能够更好的上手本课程。

二、实验步骤

2.1 Spark Streaming设计设计思想

Spark Streaming 是 Spark 的核心组件之一，为 Spark 提供了可拓展、高吞吐、容错的流计算能力。如下图所示，Spark Streaming 可整合多种输入数据源，如 Kafka、Flume、HDFS等，经处理后的数据可存储至文件系统、数据库，或显示在仪表盘里。

Spark Streaming 最主要的抽象是 DStream（Discretized Stream，离散化数据流），表示连续不断的数据流。在内部实现上，Spark Streaming 的输入数据按照时间片（如1秒）分成一段一段的 DStream，每一段数据转换为 Spark 中的 RDD，并且对 DStream 的操作都最终转变为对相应的 RDD 的操作。例如，下图展示了进行单词统计时，每个时间片的数据（存储句子的 RDD）经 flatMap 操作，生成了存储单词的 RDD。整个流式计算可根据业务的需求对这些中间的结果进一步处理，或者存储到外部设备中。

2.2 准备工作

我们已经在实验楼环境里下载并配置启动 hadoop-2.6.1 所需的文件，免除您配置文件的麻烦，您可以在 /opt 找到，只需格式化并启动 hadoop 进程即可。

双击打开桌面上的 Xfce 终端，用 sudo 命令切换到 hadoop 用户，hadoop 用户密码为 hadoop，用 cd 命令进入 /opt目录。

$ su hadoop
$ cd /opt/

在 /opt 目录下格式化 hadoop。

$ hadoop-2.6.1/bin/hdfs namenode -format

在 /opt 目录下启动 hadoop 进程。

$ hadoop-2.6.1/sbin/start-all.sh

用 jps 查看 hadoop 进程是否启动。

2.3 下载配置 Kafka

在 /opt 目录下，用 hadoop 用户通过 wget 命令下载，并用 tar 解压。


$ sudo wget http://labfile.oss.aliyuncs.com/courses/785/kafka_2.10-0.10.0.0.tgz
$ sudo tar -zxf kafka_2.10-0.10.0.0.tgz

分别启动 zookeeper，kafka。

#权限不足，授权
$ sudo chmod 777 -R kafka_2.10-0.10.0.0
$ cd  kafka_2.10-0.10.0.0
#启动zookeeper
$ bin/zookeeper-server-start.sh  config//zookeeper.properties &

#启动kafka
$ bin/kafka-server-start.sh  config/server.properties  &

用 jps命令查看进程。

用 kafka-topics.sh 脚本创建主题。

bin/kafka-topics.sh  --create --zookeeper localhost:2181  --replication-factor 1 --partitions 1 --topic wc1

三、代码实现及测试

注意:本节课实验是沿用上节课的 scala IDE 环境，pom.xml 不需要修改，需要的 spark-streaming-kafka_2.10 jar 依赖已经添加在里面。

1). 基于Kafka Receiver方式

选中 cn.com.syl.spark 包 -> 用快捷键 Ctrl+N ->搜索 class -> 选中 java class -> Next

输入类名 -> Finish

KafkaReceiverSpark.java 代码如下：

package cn.com.syl.spark;

import java.util.Arrays;
import java.util.HashMap;
import java.util.Map;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaPairReceiverInputDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.kafka.KafkaUtils;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaPairDStream;

import scala.Tuple2;

public class KafkaReceiverSpark {

    public static void main(String[] args) {
        SparkConf conf = new SparkConf()
                .setMaster("local[2]")
                .setAppName("KafkaReceiverSpark");  
        JavaStreamingContext jsc = new JavaStreamingContext(conf, Durations.seconds(6));

        // 使用KafkaUtils.createStream()方法，创建 Kafka 的输入数据流
        Map topicThreadMap = new HashMap();
        topicThreadMap.put("wc1", 1);

        JavaPairReceiverInputDStream lines = KafkaUtils.createStream(
                jsc, 
                "localhost:2181", 
                "DefaultConsumerGroup", 
                topicThreadMap);



        // wordcount code
        JavaDStream words = lines.flatMap(

                new FlatMapFunction, String>() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Iterable call(Tuple2 tuple)
                            throws Exception {
                        return Arrays.asList(tuple._2.split(" "));  
                    }

                });

        JavaPairDStream pairs = words.mapToPair(

                new PairFunction() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Tuple2 call(String word)
                            throws Exception {
                        return new Tuple2(word, 1);
                    }

                });

        JavaPairDStream wordCounts = pairs.reduceByKey(

                new Function2() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Integer call(Integer v1, Integer v2) throws Exception {
                        return v1 + v2;
                    }

                });

        wordCounts.print();  

        jsc.start();
        jsc.awaitTermination();
        jsc.close();
    }

}

启动 Spark Streaming。

打开 Xfce 终端启动 kafka Producer。

$ bin/kafka-console-producer.sh  --broker-list localhost:9092 --topic wc1
#输入任意

快速切换到scala IDE Console 控制台，屏幕上会显示程序运行的相关信息，并会每隔6秒钟刷新一次信息，大量信息中会包含如下重要信息，默认只显示前十条：

同样地，您也可以再另外开启 consume 终端。

$ bin/kafka-console-consumer.sh  --zookeeper localhost:2181 --from-beginning --topic wc1

至此基于 Kafka Receiver 方式整哈Spark Streaming 顺利完成。实验结束后，要关闭各个终端，只要切换到该终端窗口，然后按键盘的 Ctrl+C 组合键，就可以结束程序运行。

2). 基于Kafka Direct 方式

关于基于 Kafka Direct 方式，只需要新建一个类 KafkaDirectSpark，具体代码如下：

package cn.com.syl.spark;

import java.util.Arrays;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;
import kafka.serializer.StringDecoder;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaPairDStream;
import org.apache.spark.streaming.api.java.JavaPairInputDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.kafka.KafkaUtils;

import scala.Tuple2;


public class KafkaDirectSpark{

    public static void main(String[] args) {
        SparkConf conf = new SparkConf()
                .setMaster("local[2]")
                .setAppName("KafkaDirectSpark");  
        JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(6));

        // 创建map，添加参数
        Map<String, String> kafkaParams = new HashMap<String, String>();
        kafkaParams.put("metadata.broker.list", 
                "localhost:9092");

        // 创建一个集合set，添加读取的topic

        Set<String> topics = new HashSet<String>();
        topics.add("wc1");

        // 创建输入DStream
        JavaPairInputDStream<String, String> lines = KafkaUtils.createDirectStream(
                jssc, 
                String.class, 
                String.class, 
                StringDecoder.class, 
                StringDecoder.class, 
                kafkaParams, 
                topics);

        // 单词统计
        JavaDStream<String> words = lines.flatMap(

                new FlatMapFunctionString,String>, String>() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Iterable<String> call(Tuple2<String, String> tuple)
                            throws Exception {
                        return Arrays.asList(tuple._2.split(" "));  
                    }

                });

        JavaPairDStream<String, Integer> pairs = words.mapToPair(

                new PairFunction<String, String, Integer>() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Tuple2<String, Integer> call(String word) throws Exception {
                        return new Tuple2<String, Integer>(word, 1);
                    }

                });

        JavaPairDStream<String, Integer> wordCounts = pairs.reduceByKey(

                new Function2() {

                    private static final long serialVersionUID = 1L;

                    @Override
                    public Integer call(Integer v1, Integer v2) throws Exception {
                        return v1 + v2;
                    }

                });

        wordCounts.print();

        jssc.start();
        jssc.awaitTermination();
        jssc.close();
    }

}

执行方式和上述基于 Kafka Receiver 方式一模一样，在此就不演示了，请您完成。

补充知识：

假定您是在 windows 平台写的代码，对于上面的代码，您完全可以用打 jar 包的方式运行，具体参考上节 Streaming 整合 Flume

四、实验总结

本节课主要介绍了 Spark Streaming 与 Kafka 的整合的两种方式，并就 Windows 平台如何打 jar 包提交到远程服务器进行讲解，希望学完本节课，能帮助您理解 Spark Streaming，并能很快上手。

五、参考阅读

http://spark.apache.org/docs/latest/streaming-programming-guide.html

你可能感兴趣的:(实验楼课程)

Sed 用法夸克星
http://www.frostsky.com/2014/01/linux-sed-command/应用在实验楼课程:sed-i"s/Share/share/g"`grepShare-rl.`
xmake 官方入门课程上线: Xmake 带你轻松构建 C/C++ 项目 waruqi c++cmake 跨平台构建编译器
实验楼课程Xmake带你轻松构建C/C++项目是我们在实验楼上推出的一门xmake入门和进阶课程（收费），以边学边做实验的方式快速学习xmake的使用。通过此处优惠码购买可享9折优惠：NYFbmf3Xxmake介绍Xmake是一个基于Lua的轻量级跨平台C/C++构建工具，使用xmake.lua维护项目构建，相比makefile/CMakeLists.txt而言，配置语法更加简洁直观，对新手非常友
Linux基础入门笔记 Dream&fighting 机器学习笔记
Linux操作系统基础入门，学习实验楼课程做的些许笔记。文章目录用户及权限管理命令目录结构及文件操作文件查找文件解压缩磁盘管理帮助命令任务计划程序crontab命令管道软件安装工作管理进程管理用户及权限管理命令查看当前终端的用户名：whoami创建用户：sudoadduser//使用前提一是你要知道当前登录用户的密码，二是当前用户必须在sudo用户组。更改用户密码：sudopasswd切换登录用户
输出 100 万字、维护 3 个GitHub 项目，技术大佬的 2019 太燃了…… 实验楼v
一个技术大佬的2019——实验楼课程作者：十三日常工作之外，2019年这一年的时间里我制作并上线了四个付费专栏，输出了近100万字，在GitHub开源平台上维护了3个开源项目，同时也学习并实际的录制了100集视频教程……我是十三，这是「我的2019」。人生有梦，各自精彩每年的年末，在各个博客平台，掘金、博客园、CSDN、简书等等活跃着IT工作人员的网站，都会出现很多年度总结，每年都如此，我自己也会
ROS1.0个人笔记【1】背景介绍 Bluet_1997 ROS
ROS学习笔记整合本文章属于个人学习笔记，希望通过文章记录，规范整理学习内容，方便未来知识整理和分享。如果有错误的地方，还请指出，感谢！写在前面：本章节关于ROS的基本背景介绍个人认为，官方的文档已经非常的详细介绍了ROS所有的细节。干货写在前面，介绍部分，需要了解的可以详细看下，当作快速阅读训练。可直接跳转到下一篇笔记：传送门ROS相关个人学习资料推荐：实验楼课程部分图片截取来自实验楼课件。RO
Spark实现流式实时日志分析系统飄落 spark ambari
实验介绍我们知道对于一个网站的用户访问流量是不间断的，基于网站的访问日志，即WEBLOG的分析是经典的流式实时计算应用场景。比如百度统计，它可以做流量分析、来源分析、网站分析、转化分析。另外还有特定场景分析，比如安全分析，用来识别CC攻击、SQL注入分析、脱库等。这里我们简单实现一个类似于百度分析的系统。课程来源这里的课程来自于【实验楼课程】：流式实时日志分析系统——《Spark最佳实践》。课程内
网络爬虫小白入坑的辛酸血泪史（持续更新挖土直到入坟） hengyanxu
首先作为学校的IT工作室招新进去的实习小白丁，此刻正怀着忐忑而又激动的心情在凌晨三点写下这篇博客，开始了属于自己的码农（秃头）生涯。第一次布置了一个任务是爬取实验楼课程的相关内容。就是这样的界面需要爬取首先点击审查元素，看一看网页的html代码，鼠标放上标签的时候会在网页对应的地方显示出蓝色，对应找到课程的名称，是否是免费课，关注，学习，评论的人数，还有老师的名字。作为一个小白，不犯一点白痴的错误
“数据库系统实验”实验报告(8) Greyson：数据库 mysql sql 数据库 linux
实验目的为了测试一个新的功能组件，我们需要构建一个简单的实验楼课程数据库。右边是实验楼的服务器，请尝试在MySQL中创建一个名称为shiyanlou的数据库。服务器中的MySQL还没有启动，请注意MySQL的root账户默认密码为空。首先在服务器中下载要导入的数据文件，数据文件是csv格式的，数据项之间使用逗号隔开。下载命令：wgethttp://labfile.oss.aliyuncs.com/
Python 实现简单画板实验楼
相信用过Windows的同学一定都对Windows自带的画板不陌生吧，虽然功能简单却也还实用。那作为一名程序员，你是否想过自己实现这样一个画板呢？！来吧，想自己实现画板的童鞋，和实验楼课程一起，利用Pygame模块来自己实现一个画板。画板效果图：此处输入图片的描述Pygame简介：项目主要利用Pygame模块来进行开发，所以先简单的介绍一下Pygame。Pygame是跨平台Python模块，专为电
实验三：进程运行轨迹的跟踪与统计快把节操捡起来
实验要求实验要求参考实验楼课程。实验目的掌握Linux下的多进程编程技术；通过对进程运行轨迹的跟踪来形象化进程的概念；在进程运行轨迹跟踪的基础上进行相应的数据统计，从而能对进程调度算法进行实际的量化评价，更进一步加深对调度和调度算法的理解，获得能在实际操作系统上对调度算法进行实验数据对比的直接经验。实验内容基于模板“process.c”编写多进程的样本程序，实现如下功能：所有子进程都并行运行，每个
Git 分支与合并实验楼
前言：以下内容全部截选自实验楼课程【Git实战教程】，更多Git使用介绍，可以点击这里，进行查看~一、分支与合并Git的分支可以让你在主线（master分支）之外进行代码提交，同时又不会影响代码库主线。分支的作用体现在多人协作开发中，比如一个团队开发软件，你负责独立的一个功能需要一个月的时间来完成，你就可以创建一个分支，只把该功能的代码提交到这个分支，而其他同事仍然可以继续使用主线开发，你每天的提
学习实验楼课程：Java实现简单计算器（三） Kant_14
整体代码如下：packagekant.learning;//其实我不太清楚需要用到哪些包，因此，都是用到了之后再点击导入的；importjavax.swing.*;importjava.awt.*;importjava.awt.event.*;publicclassMyCalculator{/*基本参数定义并初始化*/floatans=0;//用于存储答案，初始为0；Stringans_dis="
学习实验楼课程：Java实现简单计算器（一） Kant_14
初学Java，在实验楼尝试这个项目，不太懂，我看到了完整的代码，但不知道这些代码是怎么来的。没办法，自己从头开始，看看一个计算器的实现是怎么一个过程。首先，我觉得需要一个界面，简单一点的，于是，先随手画了一个界面：一个简单的界面，看上去很厉害的样子那么，第一步就先做出这个界面吧，按钮有没有用先不管，先看到才是真的。知道是用Swing做出来的，搜索了一下这个包的基本用法；外加自己的猜测，我想应该是有
输出 100 万字、维护 3 个GitHub 项目，技术大佬的 2019 太燃了…… 实验楼
一个技术大佬的2019by实验楼课程作者：十三日常工作之外，2019年这一年的时间里我制作并上线了四个付费专栏，输出了近100万字，在GitHub开源平台上维护了3个开源项目，同时也学习并实际的录制了100集视频教程……我是十三，这是「我的2019」。人生有梦，各自精彩每年的年末，在各个博客平台，掘金、博客园、CSDN、等等活跃着IT工作人员的网站，都会出现很多年度总结，每年都如此，我自己也会写年
输出 100 万字、维护 3 个GitHub 项目，技术大佬的 2019 太燃了…… 实验楼
一个技术大佬的2019by实验楼课程作者：十三日常工作之外，2019年这一年的时间里我制作并上线了四个付费专栏，输出了近100万字，在GitHub开源平台上维护了3个开源项目，同时也学习并实际的录制了100集视频教程……我是十三，这是「我的2019」。人生有梦，各自精彩每年的年末，在各个博客平台，掘金、博客园、CSDN、简书等等活跃着IT工作人员的网站，都会出现很多年度总结，每年都如此，我自己也会
Python学习日记 2017-11-30 薛衡
学习进度：《零基础入门学习Python》视频教程90%实验楼课程《Linux基础入门》100%《Vim编辑器》100%《MySQL基础课程》100%《Git实战教程》100%《Python3简明教程》100%《Python学习手册》第一遍80%进行中的项目1.快来搜搜Fast-Search用途：用于快速实用的资源搜索，解决用户的资源搜索问题。现版本号：V1.2下载链接：https://pan.ba
学习实验楼课程：Java实现简单计算器（二） Kant_14
现在得仔细考虑界面背后的计算逻辑了，我对原代码中的计算逻辑既看不懂，也没什么兴趣，感觉各种复杂麻烦。那就自己来看这个逻辑要怎么设计。计算的一般操作是怎么样的？首先我按下一个数字，假如是1，计算器要存储这个1；（这边需要一个tmp变量，可能要全局使用的；）如果我又按了一次1，计算器要存储的数字是11，这个逻辑有两种实现方式：一种是用String形式，最后的时候转换成数字，好像原代码就是这么办的，那就
实验一：基于mykernel的一个简单的时间片轮转多道程序内核代码分析 PCM
实验一：基于mykernel的一个简单的时间片轮转多道程序内核代码分析学号293，转载请注明出处本实验来源：https://github.com/mengning/linuxkernel/一、mykernel这是孟老师基于linuxkernel3.9.4sourcecode建立的开发操作系统内核平台。源码可以根据老师写的readme文件进行部署也可以直接在实验楼课程中提供的实验环境进行实验二、实验
第一周作业学习笔记假的课代表
第一周学习笔记疑问1.who-r没有反应首先我查询了运行等级的含义。0：关机1：单用户2：无网络的多用户3：命令行模式4：未用5：GUI（图形桌面模式）6：重启自己的实体机或者虚拟机操作没有问题大概是实验楼的那个里面没权限吧用户权限管理还需要反复练习。记不住。。2.实验楼课程第二个实验的讲解部分出现了三个词，我不知道它们三个是什么关系。查阅了度娘，归纳如下：终端：在UNIX/LINUX系统中，用户
Linxu基础知识：终端、终端模拟器、shell 假的课代表
实验楼课程第二个实验的讲解部分出现了三个词，我不知道它们三个是什么关系。查阅了度娘，归纳如下：-终端：在UNIX/LINUX系统中，用户通过终端登录系统后得到一个Shell进程，这个终端就成为Shell进程的控制终端。linux下一切皆文件，所以终端本质上也是一个文件，因此每个终端设备都对应一个不同的设备文件。换句话来说：进程与终端相关联，所以可以通过改变进程关联的终端设备文件，使某终端的进程运行
2017-2018-1 学号20155209 《信息安全系统设计基础》第十五周学习总结 weixin_30567471 操作系统人工智能 java
2017-2018-1学号20155209《信息安全系统设计基础》第十五周学习总结20155209《信息安全系统设计基础》课程总结每周作业链接汇总第一周简要内容：完成实验楼课程资料:实验二内内容第二周简要内容：完成课上没完成的内容第二周续简要内容：完成myod第三周简要内容：学习教材第二章《信息的表示和处理》第四周简要内容：补充完成课上没有完成的内容和课后head,tail的使用。第五周简要内容：
实验楼课程列表 oxuzhenyi 实验楼课程
最新实验楼课程收集本博客收录最新实验楼课程，栏目分类如下：机器学习&深度学习大数据与云计算图像处理数据可视化PythonRROS机器人教程C++计算机网络Web开发机器学习&深度学习[自然语言处理基础入门][使用Python对股票数据分析预测]手写数字识别[p1]用神经网络破解验证码[p1]使用机器学习方法预测世界杯冠军[p1]Python实现数据科学中的无监督挖掘技术[p1]python聚类算法
用 HTML 和 CSS 来打造一个自己的「大白(●—●)」小柑
注：本文转载自实验楼课程【打造网页版「大白」】，转载请注明出处~还记得《超能陆战队》里的“暖男”-「大白」么？是不是很想拥有一个？我们就利用HTML和CSS来打造一个自己的「大白」吧！最终的成果是这样滴，是不是萌萌哒……PS：您最好对HTML和CSS有一定的了解，但如果你是小白也没关系，小白见「大白」也是可以的！再PS：这个「大白」的教程步骤是基于实验楼环境制作的，你也可以上实验楼在线查看该课程~
数据结构（非线性表） jijerry
非线性结构-树实验简介前面两章我们讲解了数据结构中的线性结构--线性表、栈和队列，这章开始以及下一章我们将讲解非线性结构树和图。一、树什么是树呢？树很好地反应了一种层次结构，例如下图，这就是一种树形结构，它有很多结点组成，最上面的实验楼课程结点称为树的根，结点拥有的直接子节点数称为结点的度，度为0的结点称为叶子，例如C语言、评估课这些结点，而树的度是所有结点的度中的最大值，这颗树的度就是3，一个结
Shell 脚本实现 Linux 系统监控 _dahu_ linux
转载实验楼课程一、实验介绍1.1实验内容本课程实现shell脚本监控系统的各项参数，并可以将脚本加入系统环境中，可以直接在终端里执行。还添加了几个参数，一个脚本可以执行不同的操作。1.2知识点本实验涵盖以下知识点：Bash脚本编程如何获取Linux系统信息如何实时获取Linux资源使用率1.3实验环节vim编辑器shell解释器(linux自带)1.4适合人群适合人群：本课程适合有shell语法基
20145240 《信息安全系统设计基础》第六周同学问题总结 20145240刘士嘉
20145240《信息安全系统设计基础》第六周同学问题总结学习目标了解ISA抽象的作用掌握ISA，并能举一反三学习其他体系结构了解流水线和实现方式学习资源教材：第四章《处理器体系结构》，详细学习指导见教材导读与每周考试重点。：重点是4.1节，4.2节，4.3节。实验楼课程资料：实验五，课程邀请码：W7FQKW4Y学习任务1、阅读教材，完成课后练习（书中有参考答案),考核：练习题把数据变换一下2、教
vim查找替换 liuyanfeier
注：本内容来自实验楼课程一、字符的替换及撤销(Undo操作)1.替换和撤销(Undo)命令替换和Undo命令都是针对普通模式下的操作命令说明r+将游标所在字母替换为指定字母R连续替换，直到按下Esccc替换整行，即删除游标所在行，并进入插入模式cw替换一个单词，即删除一个单词，并进入插入模式C(大写)替换游标以后至行末~反转游标所在字母大小写u{n}撤销一次或n次操作U(大写)撤销当前行的所有修改
vim文档编辑 liuyanfeier vim
注：本内容来自实验楼课程一、vim重复命令1.重复执行上次命令在普通模式下.(小数点)表示重复上一次的命令操作拷贝测试文件到本地目录$cp/etc/protocols. 打开文件进行编辑$vimprotocols 普通模式下输入x，删除第一个字符，输入.(小数点)会再次删除一个字符，除此之外也可以重复dd的删除操作2.执行指定次数相同的命令进入普通模式输入N，N表示重复后面的次数，下面来练习以下：
Linux终端使用技巧 Richard_coding Linux
Linux终端使用技巧关于Linux终端使用技巧一些总结注：部分内容来自实验楼课程文档Linux终端使用技巧一终端常用快捷键二Shel常用通配符三在命令行中获取帮助一、终端常用快捷键Tab：命令补全Ctrl+c：结束程序，但不终止终端tail：接下来的输入都没有任何反应了，只是将你输入的东西显示出来。可以Ctrl+c终止find/其他快捷键Ctrl+d键盘输入结束或退出终端Ctrl+s暂定当前程序
实验楼课程管理程序-深入学习《C++ Primer第五版》实验报告&学习笔记1 lulujianjie
本片博客为实验楼的训练营课程深入学习《C++Primer第五版》的实验报告和学习笔记。原课程地址为：https://www.shiyanlou.com/courses/405#原文出处：http://www.cnblogs.com/jacklu/p/4793049.html程序设计思路实验结果：源代码：header.h#pragmaonce #include #include #includ
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他