菜鸟周星星

Hadoop从入门到入土（一）------------java知识复习+大数据开发简介

知识复习

序列化和反序列化

序列化：将java程序中的对象写入持久化到硬盘当中，转变为二进制的数据，这个过程称为序列化，也叫钝化。
反序列化：而将硬盘中二进制的数据读取到java程序中转化为对象，这个过程称为反序列化，也叫活化。
应用场景：将内存中的对象数据持久化到硬盘当中；将硬盘中的数据反序列化到内存当中；在网络中传输对象，都需要使用到序列化和反序列化。

代码示例见上篇文章序列化与反序列化

优化jdk序列化数据冗余问题

jdk自带的序列化数据，往往会自带一些其他冗余的数据，比如类名、包名等等，那如何优化呢？

1.借助第三方包方法将对象转化为json字符串写入到硬盘当中

2.直接写属性到硬盘当中（序列化）从硬盘中读取属性到内存（反序列化）时需要知道序列化时写属性的顺序示例代码见下自定义序列化规则

自定义序列化规则

序列化规则（接口）

package demo01;

import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;

public interface Writable {

    void read(ObjectInputStream ois) throws Exception;
    
    void write(ObjectOutputStream oos) throws Exception;

}

Bean Cat类，实现接口

package demo01;

import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;

public class Cat implements Writable {
    private String gender;
    private int age;
    private String name;
    private String color;

    public Cat() {
    }
    
    public Cat(String gender, int age, String name, String color) {
        this.gender = gender;
        this.age = age;
        this.name = name;
        this.color = color;
    }
    
    public String getGender() {
        return gender;
    }
    
    public void setGender(String gender) {
        this.gender = gender;
    }
    
    public int getAge() {
        return age;
    }
    
    public void setAge(int age) {
        this.age = age;
    }
    
    public String getName() {
        return name;
    }
    
    public void setName(String name) {
        this.name = name;
    }
    
    public String getColor() {
        return color;
    }
    
    public void setColor(String color) {
        this.color = color;
    }
    
    @Override
    public String toString() {
        return "Cat{" +
                "gender='" + gender + '\'' +
                ", age=" + age +
                ", name='" + name + '\'' +
                ", color='" + color + '\'' +
                '}';
    }
    
    //序列化
    @Override
    public void write(ObjectOutputStream oos) throws Exception {
        oos.writeUTF(this.gender);
        oos.writeInt(this.age);
        oos.writeUTF(this.name);
        oos.writeUTF(this.color);
        oos.close();
    }
    
    //反序列化
    @Override
    public void read(ObjectInputStream ois) throws Exception {
        this.gender = ois.readUTF();
        this.age = ois.readInt();
        this.name = ois.readUTF();
        this.color = ois.readUTF();
        ois.close();
    }


}

测试类：

package demo01;

import java.io.*;

public class TestSer {

    public static void main(String[] args) throws Exception {
        //直接序列化属性

//        ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("aaa\\cat.txt"));
//        Cat c = new Cat("男", 2, "tom", "蓝色");
//        oos.writeUTF(c.getGender());
//        oos.writeInt(c.getAge());
//        oos.writeUTF(c.getName());
//        oos.writeUTF(c.getColor());
//        oos.close();


        //反序列化
        ObjectInputStream ois = new ObjectInputStream(new FileInputStream("aaa\\cat.txt"));
        String gender = ois.readUTF();
        int age = ois.readInt();
        String name = ois.readUTF();
        String color = ois.readUTF();
        Cat c = new Cat(gender, age, name, color);
        System.out.println(c);
    }

}

迭代器

迭代器提供了可以遍历容器集合中元素的方法，它不需要知道容器中的数据结构和个数。

简而言之，迭代器模式提供了一种方法，可以对一个容器中的各个元素进行访问，而又不用暴露该容器内部数据组织结构的细节。

迭代器与与普通循环遍历集合的区别：

普通循环遍历集合，比如List 集合当中存入的是所有的元素，占用很大的内存；
而迭代器不一样，迭代器中只需要这个元素的一个对象，即可完成所有元素的遍历，内存占用很小。

迭代器核心方法：hasNext() 、next()

hasNext() 判断是否有元素，有，则返回true 没有返回false
next() 取出元素
例：
while(it.hasNext())
{
Object o=it.next();
}

大数据开发简介

大数据基本概念

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强大的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据，这些数据在下载到关系型数据库用于分析时会花费大量的时间和金钱。

大数据主要解决两个主要问题

海量数据的存储 : 例如分布式存储文件系统 : HDFS

海量数据的运算: 例如分布式运算框架 : MAPREDUCE,SPARK等

什么是分布式（并行）

就是将一个文件存储在很多台机器上，其实就是有一个系统帮助我们存储文件，这个系统看起来是由目录组成的（也就是说是由统一的路径的，但是该路径和机器上的真实路径是不相关的），将该文件放到这个文件系统的某个路径下的时候，他会将该文件切分成不同的文件块，存放在不同的机器上（用户并不知道里面的存储信息），这就是分布式存储

存储框架

分布式文件存储系统HDFS

分布式数据库系统 ElasticSearch mongDB hbase redis

计算框架

解决的核心问题就是将用户的计算逻辑分布在多台机器上并行计算

MapReduce计算框架 -- Hadoop中的计算框架

Spark计算框架 -- 做离线批处理、实时流式处理

Strom计算框架 -- 做实时流式处理

flink 实时处理的框架

辅助类工具

Hive -- 数据仓库工具：可以接受SQL，将SQL语句解析成MapReduce或者Spark程序处理

Flume -- 数据采集 , 普通的文件数据

Sqoop -- 数据迁移 , 将结构化的数据库中的数据迁移到分布式文件系统中

hbase -- 分布式的数据库 , 列式存储的数据库 , 对mysql进行补充

大数据主要技术组件

Sqoop：Sqoop是一款开源的工具，主要用于在Hadoop、Hive与传统的数据库(MySql)间进行数据的传递，可以将一个关系型数据库（例如：MySQL，Oracle 等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。MYSQL<=============>HDFS

Flume：Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

Kafka：Kafka是一种高吞吐量的分布式发布订阅消息系统，有如下特性：

（1）通过O(1)的磁盘数据结构提供消息的持久化，这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。

（2）高吞吐量：即使是非常普通的硬件Kafka也可以支持每秒数百万的消息。

（3）支持通过Kafka服务器和消费机集群来分区消息。

（4）支持Hadoop并行数据加载。

Storm：Storm用于“连续计算”，对数据流做连续查询，在计算时就将结果以流的形式输出给用户

Spark：Spark是当前最流行的开源大数据内存计算框架。可以基于Hadoop上存储的大数据进行计算。

Hbase：HBase是一个分布式的、面向列的开源数据库。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。 nosql not only sql

Hive：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析

R语言：R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。

Mahout：Apache Mahout是个可扩展的机器学习和数据挖掘库。

ZooKeeper：Zookeeper是Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统，提供的功能包括：配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

Redis:（全称：Remote Dictionary Server 远程字典服务）是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库(文件系统)，并提供多种语言的API。

ElasticSearch: 是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。能够达到实时搜索，稳定，可靠，快速，安装使用方便.

MongoDB:是由C++语言编写的一个介于关系数据库和非关系数据库之间的分布式文件存储的数据库。是非关系数据库当中功能最丰富，最像关系数据库的。它支持的数据结构非常松散，是类似json的bson格式，因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。

flink: 是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序，Flink的流水线运行时系统可以执行批处理和流处理程序。此外，Flink的运行时本身也支持迭代算法的执行。是当下比较流行的实时计算框架的领头羊!

大数据开发运用场景广泛

数据处理的最典型的应用场景：公司产品运营情况分析

电商推荐系统：基于海量的浏览行为、购物行为数据，进行大量的算法模型的运算，得出各类推荐结论，以供电商网站页面来为用户进行商品推荐。

广告精准推送系统：基于海量的互联网用户的各类数据，统计分析，进行用户画像（得到用户的各种属性标签），然后可以为广告主进行针对性的精准广告投放

金融行业，大数据在高频交易、社交情绪分析和信贷风险分析三大金融创新领域发挥重大作用

个人生活，大数据还可以应用于个人生活，利用与每个人相关联的“个人大数据”，分析个人生活行为习惯，为其提供更加周到的个性化服务

等等等等

大数据框架之Hadoop

大数据核心技术 ----------->1.分布式存储 2.分布式运算

Hadoop 是一门大数据技术，是一套大数据组件

Hadoop核心组件+Common工具包

HDFS 分布式文件存储系统

MAPREDUCE 分布式运算编程框架

YARN 分布式运算资源调度系统

Common 工具包类

Hadoop思维脑图

个别内容网上借鉴，下篇将进入Hadoop生态技术的正式学习。

更多学习、面试资料尽在微信公众号：Hadoop大数据开发

深拷贝和浅拷贝菜鸟蹦迪 java语法 windows
一、定义定义：浅拷贝创建一个新对象，但不复制对象内部的引用指向的对象。复制的是对原始对象内存地址的引用。改变新对象内部的引用所指向的对象会影响原始对象。定义：深拷贝创建一个新对象，并递归地复制原始对象及其引用的所有对象。新对象和原始对象完全独立，修改一个不会影响另一个。二、实例展示importjava.util.ArrayList;importjava.util.List;classShallow
Java【多线程基础4】单例模式中的饿汉模式和懒汉模式灵魂相契的树 JavaEE初阶单例模式 java 开发语言饿汉模式懒汉模式
文章目录前言一、什么是单例模式二、饿汉模式三、懒汉模式四、多线程环境下的单例模式总结前言各位读者好,我是小陈,这是我的个人主页小陈还在持续努力学习编程,努力通过博客输出所学知识如果本篇对你有帮助,烦请点赞关注支持一波,感激不尽希望我的专栏能够帮助到你:JavaSE基础:基础语法,类和对象,封装继承多态,接口,综合小练习图书管理系统等Java数据结构:顺序表,链表,堆,二叉树,二叉搜索树,哈希表等J
Java 内存溢出（java.lang.OutOfMemoryError）的常见情况和处理方式总结笑锝没心没肺 JAVA java 开发语言
介绍PermGenspace的全称是PermanentGenerationspace,是指内存的永久保存区域OutOfMemoryError:PermGenspace从表面上看就是内存益出，解决方法也一定是加大内存。说说为什么会内存益出：这一部分用于存放Class和Meta的信息,Class在被Load的时候被放入PermGenspace区域，它和和存放Instance的Heap区域不同,GC(G
各类语言的比较 Xia0Mo java 开发语言
1.设计理念Java：面向对象，强调“一次编写，到处运行”，通过JVM实现跨平台兼容性。Go：简洁高效，注重并发性和编译速度，适合构建高性能分布式系统。C++：面向对象与过程式编程的结合，强调高性能和底层控制，适合系统级编程。Python：强调代码可读性和简洁性，支持多种编程范式（面向对象、函数式、过程式），适合快速开发。2.语法Java：语法严谨，支持类、接口、继承等面向对象特性，代码较为冗长。
Java基础语法练习37（枚举、注解（@Override、@Deprecated和@SuppressWarnings））橙序研工坊小白Java的成长 java 开发语言
一、枚举在Java中，枚举（enum）是一种特殊的数据类型，它允许开发者定义一组命名的常量集合先看正常示例，如下代码：publicclassEnum01{publicstaticvoidmain(String[]args){System.out.println(Season.SPRING.getName());}}classSeason{privateStringname;privateStrin
java继承后赋值返回_Java基础进阶第三天单例模式、继承、final weixin_39757212 java继承后赋值返回
今日任务1、能够理解单例设计模式2、能够独立使用继承3、能够独立使用final关键字1.代码块1.1.代码块的概念和格式代码块，就是使用大括号括起来的一段代码；书写格式：{代码；}1.2.代码块的分类1.2.1.静态代码块静态代码块，就是使用static修饰的代码块，直接写在类中的代码块；classDemo{static{System.out.pintln("静态代码块")}}2.png静态代码块
JavaWeb——HTML Clrove.11 JavaWeb html 前端
一、什么是HTMLHTML(HyperTextMarkupLanguage)：超文本标记语言超文本：超越了文本的限制，比普通文本更强大。除了文字信息还可以定义图片，音频，视频等。标记语言：由标签构成的语言HTML语言都是预定义好的。例如：使用展示超链接，使用展示图片，展示视频。HTML代码直接在浏览器中运行，HTML标签由浏览器解析。二、HTML基础语法HTML基本结构标题填写内容HTML标签不区
java面试题-微服务（一） qq_51598807 java面试题大全微服务云原生
一、相关概念1、什么是集群集群是指将多台服务器集中在一起,每台服务器都实现相同的业务,做相同的事，一起来工作，从而提高工作能力。可以分散服务器压力解决高并发的问题，同时也能预防单节点故障，即一台服务器故障不影响其他服务器正常运行，但没有解决单体应用代码臃肿，业务复杂，维护性差等等问题。2、什么是负载均衡使用了集群后，解决高并发同时有一个新的问题，就是客户端的请求如何分配到多台服务。因此需要通过负载
java面试题-微服务相关组件 Builder 王 java面试题 java 微服务开发语言
Nacos1.什么是Nacos？Nacos是一个开源项目，由阿里巴巴推出，旨在为构建云原生应用提供动态服务发现、配置管理和服务管理平台。Nacos支持微服务的发现、配置和管理，提供简单易用的特性集，能够快速实现动态服务发现、服务配置、服务元数据及流量管理。Nacos帮助用户更敏捷和容易地构建、交付和管理微服务平台，构建以“服务”为中心的现代应用架构，例如微服务范式、云原生范式。此外，Nacos提供
基于javaweb的流浪宠物管理系统的设计与实现然然学长 java 开发语言 spring boot 毕业设计
运行环境环境说明:开发语言:java框架:springboot，vueJDK版本:JDK1.8数据库:mysql5.7+(推荐5.7，8.0也可以)数据库工具:Navicat11+开发软件:idea/eclipse(推荐idea)Maven包:Maven3.3.9+系统实现5.1个人中心通过设计的个人中心管理功能模块，管理用户可以对相关的个人信息进行管理，比如管理用户可以更新个人账号的密码信息，修
Java开发或调用WebService的几种方式 m0_74822999 java 开发语言
Java开发或调用WebService的几种方式文章目录Java开发或调用WebService的几种方式一.JDK自带的JAX-WS方式开发WebService服务1.服务端开发与发布2.客户端开发与测试二.Axis1.4调用.Net返回值为DataSet类型的WebService接口1.相关说明2.Axis1.4客户端WebService服务1.Axis1.4下载2.WebService服务接口
Vue.js表单输入绑定孤客网络科技工作室 vue.js vue.js 前端 javascript
表单输入绑定在前端处理表单时，我们常常需要将表单输入框的内容同步给JavaScript中相应的变量。手动连接值绑定和更改事件监听器可能会很麻烦：templatetext=event.target.value">v-model指令帮我们简化了这一步骤：template另外，v-model还可以用于各种不同类型的输入，、元素。它会根据所使用的元素自动使用对应的DOM属性和事件组合：文本类型的和元素会绑
37.索引生命周期管理—kibana 索引配置大勇任卷舒 ELK elasticsearch 大数据 big data
37.1背景引入索引生命周期管理的一个最重要的目的就是对大量时序数据在es读写操作的性能优化如通过sparkstreaming读取Kafka中的日志实时写入es，这些日志高峰期每天10亿+，每分钟接近100w，希望es能够对单分片超过50g或者30天前的索引进行归档，并能够自动删除90天前的索引这个场景可以通过ILM进行策略配置来实现37.2介绍ES索引生命周期管理分为4个阶段：hot、warm、
JavaWeb——html表单与CSS anrui0 JavaWeb入门学习
html表单介绍概念：用于采集用户输入的数据，用于和服务器交互。使用的标签：from。用于定义表单。可以定义一个范围，范围代表采集用户数据的范围。表单属性：1.action：指定提交数据的URL。2.method：指定提交的方式。method分类：一共7种，两种比较常用get:1.请求的参数会在地址栏中显示。2.请求参数的长度是有限制的。3.不太安全post1.请求的参数不会再地址栏中显示。2.请
【完整汇总】近 5 年 JavaScript 新特性完整总览
Hey,我是沉浸式趣谈本文首发于【沉浸式趣谈】，我的个人博客https://yaolifeng.com也同步更新。转载请在文章开头注明出处和版权信息。如果本文对您有所帮助，请点赞、评论、转发，支持一下，谢谢！本文深度解析近5年来JavaScript的所有重要更新，帮助你快速了解JavaScript新特性。ES2024：不断增强的实用性API了解最新的JavaScript特性可以让你的代码更简洁优雅
WebSocket调试神器对决：Apipost VS Apifox
你以为所有API工具都能玩转WebSocket？当你的APP需要实时股票行情推送，当你的游戏要处理千人同屏交互，当你的IM系统必须保障消息零延迟——传统HTTP协议的"一问一答"模式瞬间破功。此刻WebSocket协议才是真正的救世主，这个全双工通信协议能让客户端与服务器建立"永不挂断的热线"，但掌握这把利器的开发者们，却常常在调试环节摔得鼻青脸肿：▎传统调试：手写JavaScript+浏览器Co
Java——通配符以及上下限六七_Shmily java java windows 开发语言
在Java泛型中，通配符?用于表示未知类型，通常用于增强泛型的灵活性。通配符可以与上限和下限结合使用，进一步限制类型的范围。以下是通配符及其上下限的详细介绍：一、通配符?的基本用法通配符?表示未知类型，可以用于泛型类、泛型接口和泛型方法的参数类型。示例：使用通配符//定义一个方法，接受任意类型的ListpublicstaticvoidprintList(Listlist){for(Objectel
JavaWeb——CSS Clrove.11 JavaWeb css 前端
一、什么是CSSCSS(CascadingStyleSheet)：层叠样式表，是一种用于描述网页内容外观和样式的语言，主要用于控制网页的布局、颜色、字体、间距、动画等视觉效果。CSS基本语法：CSS基本语法十分简单，基本由以下几个部分组成：selector{property:value;property:value;...}其中，selector表示要设置样式的HTML元素，property表示要
Java基础语法练习33（单例模式：饿汉式和懒汉式）橙序研工坊小白Java的成长 java 开发语言
单例模式：1.饿汉式2.懒汉式饿汉式：步骤如下：1.构造器私有化（防止new）2.类的内部创建对象3.向外暴露一个静态的公共方法个人理解：饿（等不及）就是已经创建好了对象等你来用示例代码如下：publicclasseTon{publicstaticvoidmain(String[]args){//第四步通过方法可以获取对象girlFiendinstance1=girlFiend.getInstan
【场景实现】React+material-ui+typescript实现H5上传身份证后显示图片，FileReader.readAsDataURL()方法读取图像信息椰卤工程师超级避坑指难 React 移动多端 typescript reactjs material-ui
原理readAsDataURL方法用于读取指定的内容File。读取操作完成后，readyState变成DONE，并loadend触发。那时，该result属性包含数据作为数据：URL表示文件数据为base64编码的字符串。举个栗子HTMLJavascriptfunctionpreviewFile(){constpreview=document.querySelector('img');constf
通过spark-redshift工具包读取redshift上的表 stark_summer spark spark redshift parquet api 数据
spark数据源API在spark1.2以后，开始提供插件诗的机制，并与各种结构化数据源整合。spark用户可以读取各种各样数据源的数据，比如Hive表、JSON文件、列式的Parquet表、以及其他表。通过spark包可以获取第三方数据源。而这篇文章主要讨论spark新的数据源，通过spark-redshift包，去访问AmazonRedshift服务。spark-redshift包主要由Dat
大数据面试临阵磨枪不知看什么？看这份心理就有底了-大数据常用技术栈常见面试100道题大模型大数据攻城狮大数据面试职场和发展面试题数据仓库算法
目录1描述Hadoop的架构和它的主要组件。2MapReduce的工作原理是什么？3什么是YARN，它在Hadoop中扮演什么角色？4Spark和HadoopMapReduce的区别是什么？5如何在Spark中实现数据的持久化？6SparkStreaming的工作原理是什么？7如何优化Spark作业的性能？8描述HBase的架构和它的主要组件。9HBase的读写流程是怎样的？10HBase如何处理
Spark复习八：简述Spark运行流程以及Spark分区以及简述SparkContext IT change the world spark spark 大数据面试 hadoop zookeeper
1.简述Spark运行流程：1.构建SparkApplication的运行环境,启动SparkContext2.SparkContext向资源管理器(可以是Standalone,Mesos,Yarm)申请运行Executor资源，并启动StandaloneExecutorbackend3.Executor向SparkContext申请Task4.SparkContext将应用程序分发给Execut
Spark使用Parqute存储方式有什么好处冰火同学 Spark spark
列式存储：压缩效率和查询效率谓词下推存储层：查询数据块生态兼容性高：Spark，hadoop等都兼容
一篇文章让你学会Java之定义方法来实现基本的算术运算操作凭君语未可 Java java 开发语言
定义方法来实现基本的算术运算操作方法的基本语法示例代码：实现基本算术运算代码讲解注意事项改进版本：支持用户选择运算类型在Java中，可以通过定义方法（method）来实现基本的算术运算操作（如加法、减法、乘法和除法）。方法是一段代码的封装，能够被重复调用，以实现特定的功能。方法的基本语法在Java中，方法的基本结构如下：[修饰符]返回值类型方法名(参数列表){//方法体//返回结果}修饰符：通常用
排序算法系列10-基数排序 dulang2015 数据结构与算法排序算法数据结构
基数排序简介实现(java)复杂度和稳定性1.基数排序简介非比较排序,从个位开始,分配,收集,逐位进行计数排序,桶排序的一种实现2.实现(java)publicclassRadixSort{publicstaticvoidmain(String[]args){int[]arr={40,35,5,63,21,82,96,77,52,19};System.out.println("原数组:"+Arra
【JAVA面试题】设计模式之原型模式今天你慧了码码码码码码码码码码 JAVA面试题原型模式 java 设计模式
【JAVA面试题】设计模式之原型模式一、原型模式核心概念原型模式（PrototypePattern）是一种创建型设计模式，通过复制现有对象（原型）来创建新对象，避免反复初始化带来的性能损耗。适用于需要高频创建相似对象的场景。二、原型模式实战案例：敌机生成优化1.原始方案性能缺陷publicclassClient{publicstaticvoidmain(String[]args){Listenem
Flink----常见故障排除天冬忘忧 Flink 大数据 flink
目录常见故障排除1非法配置异常2Java堆空间异常3直接缓冲存储器异常4元空间异常5网络缓冲区数量不足6超出容器内存异常7Checkpoint失败7.1CheckpointDecline7.2CheckpointExpire8Checkpoint慢SourceTriggerCheckpoint慢：使用增量Checkpoint：作业存在反压或者数据倾斜：Barrier对齐慢主线程太忙，导致没机会做s
Docker相关知识 shenzhenNBA Java 运维管理者/开发者 docker linux 运维容器
Docker如今已经应用到软件开发中很多地方，有必要了解一下其相关知识，什么是docker？docker是一款可以将我们目标应用程序和该程序运行所需的配置和依赖库等环境信息打包成镜像并运行的软件工具；什么是基础镜像？它只需要利用操作系统用户空间部分，就能构建出应用所需的环境，将选中的操作系统文件系统和依赖库等，打包成一个类似“压缩包”的文件，这就是所谓的基础镜像，baseimage；Java项目构
蓝桥杯 2022 Java 研究生省赛 3 题质因数个数菜鸟0088 蓝桥杯 java 职场和发展
importjava.util.Scanner;//1:无需package//2:类名必须Main,不可修改publicclassMain{publicstaticvoidmain(String[]args){Scannerscan=newScanner(System.in);//唯一分离定律任何一个数都可以被分解为两个质数相乘的形式//所以找质因数当一个数能longn=scan.nextLong
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi