雨诺风

hbase基础(四)——MapReduce操作

目录

一、前言

准备工作

二、HDFS——MapReduce操作1

1、Map阶段

2、Reduce阶段

3、Driver阶段

4、结果查询

三、HDFS——MapReduce操作2

1、Map阶段

2、Reduce阶段

3、Driver阶段

4、结果查询

一、前言

本篇文章主要分享，编写简单的hbase与mapreduce集合的案例，即从hdfs中读取数据导入到hbase表里，读取hbase表中的指定数据，导入到另外一张表中。

准备工作

创建学生成绩表
vi student.tsv

添加数据
1	1001	刘一	99
2	1002	陈二	98
3	1003	张三	97
4	1004	李四	96

上传到hdfs的指定路径中
hadoop fs -put student.tsv /Data/Hbase/textHbase/HbaseMapreduce/input/

在hbase中创建两个表，为后续导入数据做准备
hbase(main):013:0> create 'student','info'
Created table student
Took 4.2924 seconds                                                                                                                                                                                        
=> Hbase::Table - student
hbase(main):014:0> create 'student_new','info'
Created table student_new
Took 1.2611 seconds                                                                                                                                                                                        
=> Hbase::Table - student_new

二、HDFS——MapReduce操作1

读取hdfs中的文件数据，导入到hbase中

1、Map阶段

package com.itcast.hbase.example.Hbase_MapReduce1;

import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class ReadDataMapper extends Mapper {
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        //接收传入进来的一行文本，并转换成String类型
        String line = value.toString();
        //将这行内容按分隔符空格切割成单词，保存在String数组中
        String[] words = line.split("\t");
        
        //构建Put对象
        Put put = new Put(Bytes.toBytes(words[0]));
        //添加读取的数据
        put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("Number"), Bytes.toBytes(words[1]));
        put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("Name"), Bytes.toBytes(words[2]));
        put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("Source"), Bytes.toBytes(words[3]));
        
        //使用context，把map阶段处理的数据发送给reduce阶段作为输入数据
        context.write(new ImmutableBytesWritable(Bytes.toBytes(words[0])), put);
    }
}

2、Reduce阶段

package com.itcast.hbase.example.Hbase_MapReduce1;

import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableReducer;
import org.apache.hadoop.io.NullWritable;

import java.io.IOException;

public class ReadDataReduce extends TableReducer {
    protected void reduce(ImmutableBytesWritable key, Iterable values, Context context) throws IOException, InterruptedException {
        //循环遍历，将每一行的数据写入到hbase的表中
        for (Put value : values) {
            context.write(NullWritable.get(), value);
        }
    }
}

3、Driver阶段

package com.itcast.hbase.example.Hbase_MapReduce1;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.HRegionPartitioner;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import java.io.IOException;

public class ReadDataDriver {
    static FileSystem fs = null;
    public static void main(String[] args) throws IOException, InterruptedException, ClassNotFoundException {
        //通过 Job 来封装本次 MapReduce 的相关信息
        Configuration configuration = HBaseConfiguration.create();
        //设置参数，指定要访问的文件系统的类型：HDFS文件系统
        configuration.set("fs.defaultFS","hdfs://hadoop01:9000");
        //配置zookeeper访问地址configuration.set("hbase.zookeeper.quorum","hadoop01:2181,hadoop02:2181,hadoop03:2181");
        //设置客户端的访问身份，以root身份访问HDFS
        System.setProperty("HADOOP_USER_NAME","root");
        //通过FileSystem类的静态方法，获取文件系统客户端对象
        fs = FileSystem.get(configuration);

        //获取Job运行实例
        Job job = Job.getInstance(configuration);
        //指定 MapReduce Job jar运行主类
        job.setJarByClass(ReadDataDriver.class);
        //指定本次MapReduce的Mapper类
        job.setMapperClass(ReadDataMapper.class);
        //设置业务逻辑 Mapper 类的输出 key 和 value 的数据类型
        job.setMapOutputKeyClass(ImmutableBytesWritable.class);
        job.setMapOutputValueClass(Put.class);
        //指定要处理的数据所在的位置
        FileInputFormat.setInputPaths(job, new Path("/Data/Hbase/textHbase/HbaseMapreduce/input/"));
        //设置Reduce数量
        job.setNumReduceTasks(10);
        //设置Reducer
        TableMapReduceUtil.initTableReducerJob("student", ReadDataReduce.class, job, HRegionPartitioner.class);
        //提交程序
        job.waitForCompletion(true);
    }
}

4、结果查询

hbase(main):003:0> scan 'student',{FORMATTER=>'toString'}
ROW                                                 COLUMN+CELL                                                                                                                                            
 1                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=刘一                                                                                         
 1                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1001                                                                                     
 1                                                  column=info:Source, timestamp=2023-04-15T19:35:19.445Z, value=99                                                                                       
 2                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=陈二                                                                                         
 2                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1002                                                                                     
 2                                                  column=info:Source, timestamp=2023-04-15T19:35:19.445Z, value=98                                                                                       
 3                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=张三                                                                                         
 3                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1003                                                                                     
 3                                                  column=info:Source, timestamp=2023-04-15T19:35:19.445Z, value=97                                                                                       
 4                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=李四                                                                                         
 4                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1004                                                                                     
 4                                                  column=info:Source, timestamp=2023-04-15T19:35:19.445Z, value=96                                                                                       
4 row(s)
Took 0.0119 seconds

三、HDFS——MapReduce操作2

读取表student中的数据，将指定数据导入到student_new表中

1、Map阶段

package com.itcast.hbase.example.Hbase_MapReduce2;

import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class ReadysMapreduce extends TableMapper {
    protected void map(ImmutableBytesWritable key, Result value,
                       Mapper
                               .Context context)throws IOException, InterruptedException {
        //将student的Name和Number提取出来，相当于将每一个数据读取出来放入到Put对象中
        Put put = new Put(key.get());
        //遍历添加column行
        for (Cell cell : value.rawCells()) {
            //添加/克隆列族：info
            if ("info".equals(Bytes.toString(CellUtil.cloneFamily(cell)))) {
                //添加/克隆列：name
                if ("Name".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))) {
                    //将该列cell加入到Put对象中
                    put.add(cell);
                    添加/克隆列：color
                }else if ("Number".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))) {
                    put.add(cell);
                }
            }
        }
        context.write(key, put);
    }
}

2、Reduce阶段

package com.itcast.hbase.example.Hbase_MapReduce2;

import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableReducer;
import org.apache.hadoop.io.NullWritable;

import java.io.IOException;

public class WriteysReduce extends TableReducer {
    protected void reduce(ImmutableBytesWritable key, Iterable vaules, Context context)
        throws IOException, InterruptedException {
        //读出来的每一行数据写入到student_mr表中
        for (Put put : vaules) {
            context.write(NullWritable.get(), put);
        }
    }
}

3、Driver阶段

package com.itcast.hbase.example.Hbase_MapReduce2;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.mapreduce.Job;

public class JobysMapreduce {
    static FileSystem fs = null;
    public static void main(String[] args) throws Exception {
        //得到Configuration
        //通过 Job 来封装本次 MapReduce 的相关信息
        Configuration configuration = HBaseConfiguration.create();
        //设置参数，指定要访问的文件系统的类型：HDFS文件系统
        configuration.set("fs.defaultFS","hdfs://hadoop01:9000");
        //配置zookeeper访问地址
        configuration.set("hbase.zookeeper.quorum","hadoop01:2181,hadoop02:2181,hadoop03:2181");
        //设置客户端的访问身份，以root身份访问HDFS
        System.setProperty("HADOOP_USER_NAME","root");
        //通过FileSystem类的静态方法，获取文件系统客户端对象
        fs = FileSystem.get(configuration);

        //获取Job运行实例
        Job job = Job.getInstance(configuration);
        //指定 MapReduce Job jar运行主类
        job.setJarByClass(JobysMapreduce.class);
        //配置Job
        Scan scan = new Scan();
        scan.setCacheBlocks(false);
        scan.setCaching(500);
        TableMapReduceUtil.initTableMapperJob(
                "student",                     //数据源的表名
                scan,                               //scan控制器
                ReadysMapreduce.class,              //设置Mapper类
                ImmutableBytesWritable.class,       //设置Mapper输出key类型
                Put.class,                          //设置Mapper输出value值类型
                job                                 //设置给哪个JOB
        );
        //设置Reducer
        TableMapReduceUtil.initTableReducerJob("student_new", WriteysReduce.class, job);
        //设置Reduce数量至少1个
        job.setNumReduceTasks(1);
        //提交程序
        job.waitForCompletion(true);
    }
}

4、结果查询

hbase(main):004:0> scan 'student_new',{FORMATTER=>'toString'}
ROW                                                 COLUMN+CELL                                                                                                                                            
 1                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=刘一                                                                                         
 1                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1001                                                                                     
 2                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=陈二                                                                                         
 2                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1002                                                                                     
 3                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=张三                                                                                         
 3                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1003                                                                                     
 4                                                  column=info:Name, timestamp=2023-04-15T19:35:19.445Z, value=李四                                                                                         
 4                                                  column=info:Number, timestamp=2023-04-15T19:35:19.445Z, value=1004                                                                                     
4 row(s)
Took 0.7145 seconds

你可能感兴趣的:(Hbase基础,hbase,mapreduce,hadoop,hdfs,大数据)

HIVE 面试题总结小余真旺财 Hive hive
Hive依赖于HDFS存储数据，Hive将HQL转换成MapReduce执行，所以说Hive是基于Hadoop的一个数据仓库工具，实质就是一款基于HDFS的MapReduce计算框架，对存储在HDFS中的数据进行分析和管理。一、Hive架构用户接口：CLI（hiveshell）、JDBC/ODBC(java访问hive)、WEBUI（浏览器访问hive）元数据：元数据包括：表名、表所属的数据库（默
探秘 ES6 模板字符串：从基础语法到高级应用的全方位解析码上前端 javascript vue.js
前言：家人们，大家好！今天分享一篇文章给大家！要是文章对你有帮助，激发了你的灵感，求个收藏+关注啦～后续还有超多惊喜，别错过！目录引言一、基础语法：告别传统字符串拼接的繁琐（一）传统字符串拼接的困境（二）模板字符串的简洁之美二、多行字符串：轻松实现复杂文本布局（一）传统方式处理多行字符串的难题（二）模板字符串的多行支持三、表达式求值：动态生成字符串内容（一）嵌入简单变量（二）进行数学运算（三）调用
实现一个 RDMA 用户态驱动程序
写在前面随着DeepSeek的火爆，当众人将目光集中到模型优化时，底层网络通信基础设施的重要性往往容易被忽略。实际上，高性能、易维护、易定制的网络基础设施对于提升AI训练、推理的效率是至关重要的一环。目前，主流的高性能网络通信方案基本被几家头部公司垄断，其提供的标准API接口也已经被精心封装，绝大多数开发者无需关心底层实现细节。达坦科技始终致力于国产高性能网络基础设施解决方案的研发，深知网络通信基
MobPush扩展业务功能设置 java
扩展业务说明MobPush提供的扩展业务功能包括：按照地域提供更为精准的推送；实现网络链路的选择与优化、检测并实现与特定区域相关的服务；生成用户画像；合并链路服务。其中鸿蒙端支持上述第一项和第二项功能。MobPush为开发者提供退出上述功能的接口，开发者可以调用接口，向最终用户提供退出的能力。最终用户退出上述功能后，MobPush依然可以为您终端用户提供基础的消息推送服务。开发者需遵守相关法律法规
SQLite Select 语句详解 lsx202406 开发语言
SQLiteSelect语句详解引言SQLite是一款轻量级的数据库管理系统，以其小巧的体积、易于使用和跨平台的特点受到广泛欢迎。在SQLite中，SELECT语句是最基本的数据查询操作，用于从数据库表中检索数据。本文将详细介绍SQLite的SELECT语句，包括其语法、功能以及一些高级用法。1.SELECT语句基础SELECT语句的基本语法如下：SELECTcolumn1,column2,...
Hive 面试题昨夜为你摘星
什么是Hive?Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的意义（最初研发的原因）?降低程序员使用Hadoop的难度，降低学习成本Hive的内部组成模块，作用
leetcode刷题-动态规划06 emmmmXxxy leetcode 动态规划算法
代码随想录动态规划part06|322.零钱兑换、279.完全平方数、139.单词拆分322.零钱兑换279.完全平方数139.单词拆分关于多重背包，你该了解这些！背包问题总结篇！322.零钱兑换leetcode题目链接代码随想录文档讲解思路：完全背包整理：完全背包理论基础：装满这个背包可得的最大价值（遍历顺序可以颠倒）零钱兑换2：装满背包有多少种方法（每种方法不强调顺序，组合数）（先遍历物品再遍
Maven详解：从入门到进阶 CarlowZJ maven java
前言Maven是一款广泛应用于Java项目的构建和管理工具，通过标准化的项目结构和生命周期管理，极大地简化了项目构建过程。本文将从Maven的基础知识讲起，逐步深入到其核心概念、常用命令、依赖管理、插件使用以及实战应用，帮助读者全面掌握Maven。1.Maven概述1.1为什么使用Maven在传统的Java项目开发中，开发者需要手动下载依赖包、管理包的版本以及解决依赖冲突。Maven的出现解决了这
基础篇——数据库与表操作暴怒的代码 oracle 数据库
引言在掌握MySQL环境搭建后，数据库与表的操作是开发者必须精通的核心技能。本文系统讲解数据库与表的创建、数据类型选择、约束设计以及表结构修改四大模块，特别标注20+个新手高频踩坑点，帮助读者避开90%的常见错误。一、数据库与表的基础操作1.1创建/删除数据库标准语法：--创建数据库（必须指定字符集）CREATEDATABASEshop_dbDEFAULTCHARACTERSETutf8mb4CO
TCP 三次握手与四次挥手 FHKHH tcp/ip 网络服务器
TCP三次握手与四次挥手知识总结一、TCP连接与断开的核心机制1.三次握手（建立连接）目的：建立客户端与服务端之间的双向传输通道，确保双方都能确认对方的接收和发送能力，为后续的数据传输奠定可靠基础。流程：客户端发送SYN客户端发送SYN报文，请求建立连接，并包含初始序列号（SEQ），此时客户端进入SYN_SENT状态。服务端回应SYN-ACK服务端收到SYN后，回应SYN-ACK，其中ACK为客户
从黑暗到光明：FPC让盲人辅助眼镜成为视障者的生活明灯！【新立电子】珠海新立电子科技有限公司盲人辅助智能眼镜智能眼镜新立电子 fpc柔性线路板
在科技日新月异的今天，智能技术正以前所未有的方式改变着我们的生活。对于视障人士而言，科技的进步更是为他们打开了一扇通往更加独立自主生活的大门。其中，盲人辅助智能眼镜可以成为视障人士日常生活中的得力助手。FPC在AR眼镜中的应用，更是为盲人辅助智能眼镜的性能提升和可靠性保障提供了坚实的技术基础。盲人辅助智能眼镜，通过内置的高性能摄像头和先进的图像识别算法，能够实时捕捉并分析周围环境中的信息。无论是道
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 web安全 CTF 网络安全大赛 python Linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
深入探讨Ceph：分布式存储架构的未来深度Linux ceph 分布式架构 C/C++
在数字化浪潮汹涌澎湃的当下，数据量呈爆发式增长，传统存储系统在应对海量数据存储、高并发访问以及灵活扩展等方面，逐渐显得力不从心。分布式存储技术应运而生，成为解决现代数据存储难题的关键方案，而Ceph作为分布式存储领域的佼佼者，正日益受到广泛关注和应用。Ceph以其卓越的性能、高可靠性、强大的扩展性以及开源的特性，在众多分布式存储系统中脱颖而出，被广泛应用于云计算、大数据、人工智能等前沿领域。无论是
pytorch基础 nn.embedding yuweififi pytorch 人工智能 nlp
nn.Embedding是PyTorch中的一个模块，用于创建嵌入层（embeddinglayer），它将离散的索引（例如词汇表中的单词索引）映射为固定大小的稠密向量。这是许多NLP模型（包括Transformer）中的基本组件。示例用法：importtorchimporttorch.nnasnn#定义一个嵌入层vocab_size=10000#词汇表大小embedding_dim=512#嵌入向
pytorch基础-layernormal 与 batchnormal yuweififi pytorch 人工智能 python
nn.LayerNorm（层归一化）和nn.BatchNorm（批量归一化）是深度学习中常用的两种归一化方法，都有助于提高模型的训练效率和稳定性，但它们在归一化维度、应用场景、计算方式等方面存在明显区别，以下为你详细介绍：1、归一化维度nn.LayerNorm：对单个样本的特征维度进行归一化。无论输入数据的形状如何，它会计算每个样本在特征维度上的均值和方差，然后进行归一化。例如，对于一个形状为(b
【Multipath网络层协议】MPTCP工作原理码上为赢 Multipath精通之路 multipath MPTCP
常见网络层多路径协议介绍MPTCP（MultipathTCP）MPTCP是在传统TCP基础上进行扩展的协议，它允许在源端和目的端之间建立多个TCP子流，这些子流可以通过不同的网络路径传输数据。例如，一台笔记本电脑同时连接了Wi-Fi网络和以太网网络，当使用MPTCP进行数据传输时，它可以将数据分别通过Wi-Fi和以太网这两条不同的路径发送到目标服务器，从而充分利用两条链路的带宽。LISP（Loca
【面试实战】Spring基础、IoC、AOP、MVC、Mybatis、Spring Boot Sivan_Xin 技术实战专栏（已上云）面试 mvc spring
version：1.0文章目录SpringSpring基础/IoC‍♂️面试官：举例Spring的模块？‍♂️面试官：Spring、SpringMVC、SpringBoot关系？‍♂️面试官：说说对SpringIoC的了解？‍♂️面试官：什么是SpringBean？‍♂️面试官：Bean的作用域？‍♂️面试官：Bean的生命周期？‍♂️面试官：单例Bean的线程安全问题了解吗？‍♂️面试官：@Co
【目录】PMP项目管理—基础认知篇—十五至尊图洛北辰南 PMP PMP 项目管理目录
笔者已经3A通过PMP考试，近期抽空会把上网课记录的笔记腾到博客中，以此文为目录链接全部内容，欢迎订阅关注。已整理完成基础认知篇、整合管理篇。持续更新中…知识领域启动过程组规划过程组执行过程组监控过程组收尾过程组项目整合管理4.1制定项目章程4.2制定项目管理计划4.3指导和管理项目工作4.4管理项目知识4.5监控项目工作4.6实施整体变更控制4.7结束项目或阶段项目范围管理5.1规划范围管理5.
Spring Boot的项目结构 m0_74823983 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot的项目结构技术背景SpringBoot项目结构遵循Maven或Gradle的标准目录结构，同时融入了SpringBoot的特定约定。良好的项目结构不仅有助于代码组织，还能提高开发效率和项目可维护性。了解SpringBoot的项目结构对于开发高质量的应用至关重要。1.基础项目结构1.1标准目录结构基本的SpringBoot项目结构如下：myproject/├──src/│├──m
【C++设计模式】工厂方法设计模式：深入解析从基础到进阶老猿讲编程 C++编程 c++设计模式开发语言
1.引言在软件开发的世界里，设计模式如同巧妙的建筑蓝图，为解决常见问题提供了行之有效的方案。工厂方法模式作为一种广受欢迎的创建型设计模式，以其独特的优势在众多项目中得到广泛应用。它不仅能够为对象的创建提供通用且灵活的方式，还能有效隐藏实现细节，提升代码的可维护性和可扩展性。本文将全方位深入探讨工厂方法模式，从基础定义、实现过程，到进阶优化和功能扩展，带领读者全面掌握这一重要的设计模式。2.工厂方法
第14天：C++异常处理实战指南 - 构建安全的文件解析系统 JuicyActiveGilbert C++教程 c++安全开发语言
第14天：C++异常处理实战指南-构建安全的文件解析系统一、今日学习目标掌握C++异常处理的核心语法与流程️理解RAII在资源管理中的关键作用创建自定义文件解析异常体系实现安全的文件解析器原型二、C++异常处理核心机制1.异常处理基础语法#include#include#includevoidparseConfiguration(conststd::string&path){std::ifstre
Spark技术系列（一）：初识Apache Spark——大数据处理的统一分析引擎数据大包哥 #Spark 大数据
Spark技术系列（一）：初识ApacheSpark——大数据处理的统一分析引擎1.背景与核心价值1.1大数据时代的技术演进MapReduce的局限性：磁盘迭代计算、中间结果落盘导致的性能瓶颈Spark诞生背景：UCBerkeleyAMPLab实验室为解决复杂迭代计算需求研发（2010年开源）技术定位：基于内存的通用分布式计算框架（支持批处理、流计算、机器学习、图计算等）1.2Spark内置模块S
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
C++游戏开发系列教程之第二篇：面向对象编程与游戏架构设计放氮气的蜗牛深度博客游戏
大家好，欢迎回到C++游戏开发系列教程！在第一篇中，我们介绍了C++游戏开发的基本概念和如何搭建一个简单的游戏循环，为新手打开了C++游戏开发的大门。本篇博客将深入讲解面向对象编程（OOP）在游戏开发中的重要性，以及如何设计一个简单而有效的游戏架构。通过本篇文章，你将学到如何利用C++的类与继承构建游戏中的各个对象（如玩家、敌人等），并结合游戏循环实现一个基础的游戏状态管理系统。所有代码均附有详细
硬盘数据恢复操作全攻略 AR新视野
本文还有配套的精品资源，点击获取简介：硬盘数据恢复是一项需要精确操作的技术活动，主要针对丢失、误删或损坏的文件进行恢复。本教程通过深入探讨数据恢复的基础知识和步骤，指导用户如何安全有效地执行数据恢复。教程强调了在硬盘故障发生时的正确处理方式，包括避免在受损硬盘上直接操作、使用保护卡或克隆技术复制数据，以及选择合适的数据恢复软件等。教程还提供了数据恢复的基本步骤，并告诫用户在数据非常关键或硬件问题复
编程基础-算法研究-算法题周陽讀書算法基础个人经验可供分享算法
没想到工作几年后还要考算法题目遂研究记录目录0.简介1.丑数1.1题目1.2要点1.2.1丑数如何判别1.2.2后续丑数如何找到1.2.3结尾th,nd,st规律1.2.4完整可参考代码2大斐波那契数2.1题目2.2要点2.2.1范围超界2.3完整参考代码2.4延伸：C语言计算100的阶乘2.5其他细节点3迷宫问题3.1迷宫问题13.2迷宫问题20.简介一些技巧：~scanf#include{in
网络安全加密python代码黑客Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快网络信息安全中遇到的各种攻击是防不胜防的，采取适当的防护措施就能有效地保护网络信息的安全,包括防火墙、入侵检测系统、漏洞扫描技术以及加密技术等多种防护措施。而信息安全的本质就是要保护信息本身和信息系统在存储、传输中的完整性和保密性,保障不被攻击和篡改,上述的主动攻击、被动攻击和病毒袭击都会造成信息的破坏和泄密,我们以信息安全中的基础理论出
222222222222222 智能与优化开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas是基于Nu
探索React的深度应用：React Survey——构建问卷神器傅尉艺Maggie
探索React的深度应用：ReactSurvey——构建问卷神器去发现同类优质开源项目:https://gitcode.com/在浩瀚的前端开发世界里，React与Redux已成为构建复杂Web应用的得力助手，但它们的强大往往隐藏在基础教程之后。今天，让我们一同探索【ReactSurvey】，一个将React与Redux之力发挥至极致的开源项目，教你如何轻松打造专业的在线问卷系统。项目介绍Reac
白帽黑客系列教程之Windows驱动开发（64位环境）入门教程（七）黑客影儿技术分享原创文章系统安全驱动开发 c语言 windows 系统安全程序人生学习方法 visual studio
为什么要写这篇文章呢？作为一名白帽黑客，如果想要学习ROOTKIT攻防技术，就必须要有能力进行驱动开发！本文章仅提供学习，切勿将其用于不法手段！在Windows操作系统的64位环境中，进行ROOTKIT攻防，就必须要学会Windows驱动开发！Windows驱动开发，是掌握Rootkit技术的硬性基础之一！不会Windows环境下的驱动开发，你就难以透彻理解ROOTKIT攻防技术的真相！接上一篇文
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他