阿洋太爱大数据

HDFS编程实践（Hadoop3.3.1）

我们是在Hadoop伪分布式下去进行HDFS的编程实践

准备工作：

vm15.5

hadoop3.3.1

eclipse-java-2021-09-R-linux-gtk-x86_64

参考：林子雨：HDFS编程实践（Hadoop3.1.3）_厦大数据库实验室博客 (xmu.edu.cn)

他使用的是Hadoop3.1.3版本的，过程可能会遇到的坑将在另一篇文章中总结:在进行HDFS实践时遇到的问题：_阿洋太爱大数据的博客-CSDN博客

开始

在HDFS编程实践前，我们需要启动Hadoop（版本是Hadoop3.1.3）。

执行如下命令：

cd /usr/local/hadoop
./sbin/start-dfs.sh

并且jps检查是否启动成功:

[hadoop@localhost hadoop]$ jps
5233 SecondaryNameNode
5382 Jps
5018 DataNode
4893 NameNode

成功后开始我们的实践

一、利用Shell命令与HDFS进行交互

在终端输入如下命令，查看fs总共支持了哪些命令

[hadoop@localhost hadoop]$ ./bin/hadoop fs

在终端输入如下命令，可以查看具体某个命令的作用

例如：我们查看rm命令如何使用，可以输入如下命令

./bin/hadoop fs -help rm

1、目录操作

Hadoop系统安装好以后，第一次使用HDFS时，需要首先在HDFS中创建用户目录。我们在这里采用hadoop用户登录Linux系统，因此，需要在HDFS中为hadoop用户创建一个用户目录，命令如下：

cd /usr/local/hadoop
./bin/hdfs dfs -mkdir -p /user/hadoop

该命令中表示在HDFS中创建一个“/user/hadoop”目录，“–mkdir”是创建目录的操作，“-p”表示如果是多级目录，则父目录和子目录一起创建，这里“/user/hadoop”就是一个多级目录，因此必须使用参数“-p”，否则会出错。 “/user/hadoop”目录就成为hadoop用户对应的用户目录，可以使用如下命令显示HDFS中与当前用户hadoop对应的用户目录下的内容：

[hadoop@localhost hadoop]$ ./bin/hdfs dfs -ls   #该命令中，“-ls”表示列出HDFS某个目录下的所有内容，“.”表示HDFS中的当前用户目录，也就是“/user/hadoop”目录，因此，上面的命令和下面的命令是等价的：
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -ls /user/hadoop
#如果要列出HDFS上的所有目录，可以使用如下命令：
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -ls
#下面，可以使用如下命令创建一个input目录：
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -mkdir input
#在创建个input目录时，采用了相对路径形式，实际上，这个input目录创建成功以后，它在HDFS中的完整路径是“/user/hadoop/input”

可以使用rm命令删除一个目录，比如，可以使用如下命令删除刚才在HDFS中创建的“/input”目录（不是“/user/hadoop/input”目录）：

./bin/hdfs dfs –rm –r /input   #“-r”参数表示如果删除“/input”目录及其子目录下的所有内容，如果要删除的一个目录包含了子目录，则必须使用“-r”参数，否则会执行失败。

2.文件操作

在实际应用中，经常需要从本地文件系统向HDFS中上传文件，或者把HDFS中的文件下载到本地文件系统中。首先，使用vim编辑器，在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件myLocalFile.txt，里面可以随意输入一些单词

[hadoop@localhost ~]$ cd /home
[hadoop@localhost home]$ cd /home/hadoop
[hadoop@localhost ~]$ pwd
/home/hadoop
[hadoop@localhost ~]$ vim myLocalFile.txt

然后，可以使用如下命令把本地文件系统的“/home/hadoop/myLocalFile.txt”上传到HDFS中的当前用户目录的input目录下，也就是上传到HDFS的“/user/hadoop/input/”目录下：(注意路径)

[hadoop@localhost ~]$ cd /usr/local/hadoop
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -put /home/hadoop/myLocalFile.txt  input

可以使用ls命令查看一下文件是否成功上传到HDFS中，具体如下：

[hadoop@localhost hadoop]$ ./bin/hdfs dfs -ls input

下面使用如下命令查看HDFS中的myLocalFile.txt这个文件的内容：

./bin/hdfs dfs –cat input/myLocalFile.txt

下面把HDFS中的myLocalFile.txt文件下载到本地文件系统中的“/home/hadoop/下载/”这个目录下，命令如下：

./bin/hdfs dfs -get input/myLocalFile.txt  /home/hadoop/下载

[hadoop@localhost hadoop]$ cd ~
[hadoop@localhost ~]$ cd 下载
[hadoop@localhost 下载]$ ls
hadoop-3.3.1.tar.gz  myLocalFile.txt
[hadoop@localhost 下载]$ cat myLocalFile.txt

最后，了解一下如何把文件从HDFS中的一个目录拷贝到HDFS中的另外一个目录。比如，如果要把HDFS的“/user/hadoop/input/myLocalFile.txt”文件，拷贝到HDFS的另外一个目录“/input”中（注意，这个input目录位于HDFS根目录下），可以使用如下命令：

./bin/hdfs dfs -cp input/myLocalFile.txt  /input

二、利用Web界面管理HDFS

通过浏览器访问：http://localhost:9870

三、利用JAVA API与HDFS进行交互

（一）安装eclipse：

1在centos7中安装eclipse

下载地址：Luna SR2 | Eclipse Packages

2.通过xftp来传输

a)先在Windows环境下下载好文件Luna SR2 | Eclipse Packages选择正确的文件

b)通过xftp远程登录虚拟机来传输文件

名称自定，主机为虚拟机的IP地址（通过ifconfig来查看），用户名为hadoop，密码为自己虚拟机用户的密码，然后点击连接

然后将下载好的eclipse压缩包通过拖拽的方式拖到想要的目录下，此处为下载目录

c)在虚拟机内解压缩eclipse压缩包

已经通过xftp完成了eclipse压缩包的传输，在下载目录下ls查看是否成功：

[hadoop@localhost 下载]$ ls
eclipse-java-2021-09-R-linux-gtk-x86_64.tar.gz  hadoop-3.3.1.tar.gz  myLocalFile.txt

出现了目标的压缩包，则已经成功

解压缩：（eclipse-java-2021-09-R-linux-gtk-x86_64.tar.gz为自己的压缩包文件名）

sudo tar -zxvf ./eclipse-java-2021-09-R-linux-gtk-x86_64.tar.gz -C /usr/local
eclipse/

等待片刻后成功，通过如下启动eclipse：

cd /usr/local/eclipse
./eclipse

（二）使用eclipse开发调试HDFS Java程序

1.在eclipse中创建项目：

启动eclipse，出现以下界面：

可以直接采用默认的设置“/home/hadoop/workspace”

进入后：选择“File–>New–>Java Project”菜单，开始创建一个Java工程，会弹出如下图所示界面。

在“Project name”后面输入工程名称“HDFSExample”，选中“Use default location”，让这个Java工程的所有文件都保存到“/home/hadoop/workspace/HDFSExample”目录下。在“JRE”这个选项卡中，可以选择当前的Linux系统中已经安装好的JDK

可以见到我这里是选项Use a project specific JRE选项里面这里是有对应合适的JDK包，但是我刚进去的时候是没有的，需要手动自己配置一下：

点击蓝色字体：Configure JREs...

点击右侧的Add

点击Standard VM后点击next

再弹出的窗口的JRE home处填入自己的Java安装路径，可以在我教程Java安装教程里面找到，简单来说也就是需要配置环境变量这里的这个路径。

完成后finish，退出重新打卡，就有了

点击next，在这个界面中加载该Java工程所需要用到的JAR包，这些JAR包都位于Linux系统的Hadoop安装目录下，即“/usr/local/hadoop/share/hadoop”，点击界面中的“Libraries”选项卡，然后，点击界面右侧的“Add External JARs…”按钮。

先点一下ModulePath,再点Add External JARs...

将以下四个文件夹里面的全部JAR包选择添加(不含文件和目录)。

“/usr/local/hadoop/share/hadoop/common”

“/usr/local/hadoop/share/hadoop/common/lib”

“/usr/local/hadoop/share/hadoop/hdfs”

“/usr/local/hadoop/share/hadoop/hdfs/lib”

导入后：

添加完四个文件夹内的jar包后点击Finish，完成项目创建

2.编写Java应用程序

在Eclipse工作界面左侧的“Package Explorer”面板中，找到刚才创建好的工程名称“HDFSExample”，然后在该工程名称上点击鼠标右键，在弹出的菜单中选择“ New–>Class”菜单

只需要在“Name”后面输入Java类文件的名称“MergeFile”，其余设置默认

在“MergeFile.java”源文件代码写入下代码，先别运行

import java.io.IOException;
import java.io.PrintStream;
import java.net.URI;
 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
 
/**
 * 过滤掉文件名满足特定条件的文件 
 */
class MyPathFilter implements PathFilter {
     String reg = null; 
     MyPathFilter(String reg) {
          this.reg = reg;
     }
     public boolean accept(Path path) {
        if (!(path.toString().matches(reg)))
            return true;
        return false;
    }
}
/***
 * 利用FSDataOutputStream和FSDataInputStream合并HDFS中的文件
 */
public class MergeFile {
    Path inputPath = null; //待合并的文件所在的目录的路径
    Path outputPath = null; //输出文件的路径
    public MergeFile(String input, String output) {
        this.inputPath = new Path(input);
        this.outputPath = new Path(output);
    }
    public void doMerge() throws IOException {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS","hdfs://localhost:9000");
          conf.set("fs.hdfs.impl","org.apache.hadoop.hdfs.DistributedFileSystem");
        FileSystem fsSource = FileSystem.get(URI.create(inputPath.toString()), conf);
        FileSystem fsDst = FileSystem.get(URI.create(outputPath.toString()), conf);
                //下面过滤掉输入目录中后缀为.abc的文件
        FileStatus[] sourceStatus = fsSource.listStatus(inputPath,
                new MyPathFilter(".*\\.abc")); 
        FSDataOutputStream fsdos = fsDst.create(outputPath);
        PrintStream ps = new PrintStream(System.out);
        //下面分别读取过滤之后的每个文件的内容，并输出到同一个文件中
        for (FileStatus sta : sourceStatus) {
            //下面打印后缀不为.abc的文件的路径、文件大小
            System.out.print("路径：" + sta.getPath() + "    文件大小：" + sta.getLen()
                    + "   权限：" + sta.getPermission() + "   内容：");
            FSDataInputStream fsdis = fsSource.open(sta.getPath());
            byte[] data = new byte[1024];
            int read = -1;
 
            while ((read = fsdis.read(data)) > 0) {
                ps.write(data, 0, read);
                fsdos.write(data, 0, read);
            }
            fsdis.close();          
        }
        ps.close();
        fsdos.close();
    }
    public static void main(String[] args) throws IOException {
        MergeFile merge = new MergeFile(
                "hdfs://localhost:9000/user/hadoop/",
                "hdfs://localhost:9000/user/hadoop/merge.txt");
        merge.doMerge();
    }
}

Hadoop的准备：

确保Hadoop已经启动运行，如果还没有启动，需要打开一个Linux终端，输入以下命令启动Hadoop：

$   cd /usr/local/hadoop
$   ./sbin/start-dfs.sh

在Linux创建5个文件，file1.txt、file2.txt、file3.txt、file4.abc和file5.abc。假设内容如下：(vim 创建，填写内容)

file1.txt的内容是： this is file1.txt

file2.txt的内容是： this is file2.txt

file3.txt的内容是： this is file3.txt

file4.abc的内容是： this is file4.abc

file5.abc的内容是： this is file5.abc

然后将这五个文件转到HDFS(其他文件同理)，这里我把5个文件放到了/home//hadoop/下了

通过$ ./bin/hdfs dfs -put file1.txt的路径

[hadoop@localhost bin]$ cd /home/hadoop/
[hadoop@localhost ~]$ vim file2.txt
[hadoop@localhost ~]$ vim file3.txt
[hadoop@localhost ~]$ vim file4.abc
[hadoop@localhost ~]$ vim file5.abc
[hadoop@localhost ~]$ cd /usr/local/hadoop
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -put /home/hadoop/file2.txt
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -put /home/hadoop/file3.txt
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -put /home/hadoop/file4.abc
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -put /home/hadoop/file5.abc

现在可以让代码运行了，在代码旁边右键鼠标，在弹出的菜单中选择“Run As”，继续在弹出来的菜单中选择“Java Application”

应用部署：Java应用程序生成JAR包，部署到Hadoop平台上运行。首先，在Hadoop安装目录下新建一个名称为myapp的目录，用来存放我们自己编写的Hadoop应用程序，可以在Linux的终端中执行如下命令：

[hadoop@localhost hadoop]$ mkdir myapp
[hadoop@localhost hadoop]$ cd ./myapp

然后，请在Eclipse工作界面左侧的“Package Explorer”面板中，在工程名称“HDFSExample”上点击鼠标右键，在弹出的菜单中选择“Export”，如下图所示。

在弹出的界面中选中JAVA,然后选择Runnable JAR file

点击next，然后在该界面中，“Launch configuration”用于设置生成的JAR包被部署启动时运行的主类，需要在下拉列表中选择刚才配置的类“MergeFile-HDFSExample”。在“Export destination”中需要设置JAR包要输出保存到哪个目录，比如，这里设置为“/usr/local/hadoop/myapp/HDFSExample.jar”。在“Library handling”下面选择“Extract required libraries into generated JAR”。

一定要在此路径下

然后一路OK，遇到警告忽略就可

至此，已经顺利把HDFSExample工程打包生成了HDFSExample.jar

可以在Linux的终端中执行如下命令：

[hadoop@localhost hadoop]$ cd /usr/local/hadoop
[hadoop@localhost hadoop]$ cd ./myapp
[hadoop@localhost myapp]$ ls

可以看到，“/usr/local/hadoop/myapp”目录下已经存在一个HDFSExample.jar文件

由于之前已经运行过一次程序，已经生成了merge.txt，因此，需要首先执行如下命令删除该文件：

[hadoop@localhost myapp]$ cd /usr/local/hadoop
[hadoop@localhost hadoop]$ ./bin/hdfs dfs -rm /user/hadoop/merge.txt
Deleted /user/hadoop/merge.txt

现在，就可以在Linux系统中，使用hadoop jar命令运行程序，命令如下(注意是相对路径)：

[hadoop@localhost hadoop]$ ./bin/hadoop jar ./myapp/HDFSExample.jar

结果如下：

【Linux | 网络】网络编程套接字是阿建吖! 【Linux】【网络】linux 网络
目录一、预备知识1.1理解IP地址1.2认识端口号1.3理解网络套接字1.4理解"端口号"和"进程ID"1.5认识TCP协议与UDP协议1.6网络字节序二、socket编程接口2.1socket常见API2.1.1socket函数2.1.2bind函数2.1.3listen函数2.1.4accept函数2.1.5connect函数2.2主机字节序和网络字节序的转换的函数2.2.1htonl函数2.
Linux·网络入门基础知识迅~ Linux应用编程服务器网络 linux
目录网络的位置计算机网络背景网络发展认识“协议”网络协议初始协议分层编辑OSI七层模型编辑TCP/IP五层（或四层）模型网络传输基本流程编辑同局域网的两台主机通信跨网络的两台主机通信网络中的地址管理认识IP地址认识MAC地址网络的位置我们通常在手机或者电脑上使用的APP，比如抖音、快手、淘宝等，这些APP都是在应用层的。用户在应用层的各种请求最终会下达给操作系统，操作系统内除了进程管理、文件管理、
一行配置引起的Linux默认路由未生效问题彭泽布衣 Linux操作系统 Linux问题排查小记 linux 运维服务器默认路由
默认路由问题Linux多网卡默认路由未配置问题背景问题分析Linux多网卡默认路由未配置问题背景最近装机比较频繁，但是装完机，启动系统之后，发现Linux系统没有默认路由。centos系统，说是修改/etc/sysconfig/network-scripts/ifcfg-xxx，加一行GATEWAY=192.168.1.1就可以，但是我加完之后，重启了network，检查默认路由，看并没有生效。问
【无标题】 KellenKellenHao tomcat java
一、tomcat安装 #关闭防火墙与SELinux [root@proxy_host~]#rz rzwaitingtoreceive.**[root@proxy_host~]#ls anaconda-ks.cfg ceph-release-1-1.el7.noarch.rpm apache-tomcat-8.5.40.tar.gznginx-1.27.3.tar.gz #解压到指定路径
Linux信号处理全解析程序员弘羽 Linux系统编程 java 网络 linux
在Linux系统编程中，信号（Signal）是一种异步通知机制，用于告知进程发生了某种事件。理解常见的信号及其默认行为对于编写健壮的应用程序至关重要。目录一、信号的分类与作用1.SIGHUP（信号编号：1）2.SIGINT（信号编号：2）3.SIGQUIT（信号编号：3）4.SIGILL（信号编号：4）5.SIGABRT（信号编号：6）6.SIGFPE（信号编号：8）7.SIGKILL（信号编号：
YARN container cpu超核如何解决 fzip YARN 超核
在ApacheHadoopYARN中，ContainerCPU超核（即Container使用的CPU资源超过分配量）是一个常见问题，可能导致集群性能下降或不稳定。以下是解决该问题的详细步骤：1.问题诊断1.1确认超核现象查看YARNWebUI：访问http://:8088，检查Container的CPU使用率是否持续超过分配的vCore数。检查NodeManager日志：查看/var/log/ha
Linux 命令使用笔记【sysctl】 fzip Linux linux 服务器运维
名称在系统运行时，配置修改内核参数概要sysctl[options][variable[=value]][...]sysctl-p[fileorregexp][...]描述sysctl用于在linux系统运行时修改内核参数。可以修改的参数都在/proc/sys/文件夹下。Linux中的sysctl支持需要Procfs。您可以使用sysctl来读写sysctl数据。参数variable要从中读取的键
Linux 命令使用笔记【zcat】 fzip Linux linux zcat
zcat命令zcat命令用于不真正解压缩文件，就能显示压缩包中文件的内容的场合。语法zcat(选项)(参数)选项-S：指定gzip格式的压缩包的后缀。当后缀不是标准压缩包后缀时使用此选项；-c：将文件内容写到标注输出；-d：执行解压缩操作；-l：显示压缩包中文件的列表；-L：显示软件许可信息；-q：禁用警告信息；-r：在目录上执行递归操作；-t：测试压缩文件的完整性；-V：显示指令的版本信息；-l
运维系列&Linux系列【仅供参考】：Ubuntu 16 永久修改ulimit中的max file open限制坦笑&&life 运维运维 linux ubuntu
Ubuntu16永久修改ulimit中的maxfileopen限制Ubuntu16永久修改ulimit中的maxfileopen限制摘要正文Ubuntu16永久修改ulimit中的maxfileopen限制摘要本文介绍如何在Ubuntu16系统中增加最大文件打开数限制，通过修改系统配置文件来实现对nginx等服务中worker_connections参数的有效提升。正文Ubuntu16–howto
Linux - 修改系统的max open files、max user processes（附ulimit的使用方法） oldbalck java 操作系统网络
Linux-修改系统的maxopenfiles、maxuserprocesses（附ulimit的使用方法）目录1问题说明2修改maxopenfiles3修改maxuserprocesses4附录:ulimit命令说明1问题说明Linux系统默认的maxopenfiles=1024,在大内存服务器中,如果运行负载比较大的程序,很容易发生error:toomanyopenfiles,特别是提供大量静
max open files mysql_MySQL性能优化之open_files_limit，table_open_cache和max_connections配置关系... Moriarty K max open files mysql
MySQL的变量open_files_limit，table_open_cache和max_connections是相互关联的。如果对有些变量进行了设置，有的变量没有设置，mysql会根据一定的计算公式进行计算得出其他的，当然有些时候会触发mysql的一些警告来。本文探讨的均基于Linux系统首先，mysql会基于max_connections和table_open_cache的值计算最低需要的文
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
mysql日志报：Changed limits: max_open_files: 1024
linux上的数据库mysql突然挂掉了重启mysql（systemctlrestartmysqld），出现类似下面的情况：/system.slice/mysqld.service└─control├─2571/bin/bash/usr/bin/mysql-systemd-startpost└─3541sleep1最后查看mysql.log发现不知道错误的错误：[Warning]Bufferedw
在Ubuntu主机中修改ARM Linux开发板的根文件系统牧以南歌〆嵌入式Linux linux ubuntu arm开发驱动开发
目录在Ubuntu主机中修改ARMLinux开发板的根文件系统一、安装环境二、根文件系统镜像扩容三、挂载扩容后的根文件系统镜像四、修改相关配置五、创建挂载脚本六、切换回主机目录七、取消挂载八、精简根文件系统镜像大小在Ubuntu主机中修改ARMLinux开发板的根文件系统开发环境：Ubuntu20.04、飞凌OK3568开发板、开发板使用的根文件系统镜像为ubuntu.img一、安装环境首先使用以
Bash Shell面试题高级汇总002 韩公子的Linux大集市 Bash入门 bash 开发语言
文章目录一、Shell原理进阶二、性能与资源管理三、并发控制与IPC四、安全与防御五、调试与追踪六、文本处理黑科技七、系统级深入题八、容器化环境九、综合场景题十、面试官深度追问方向以下是一份深度梳理的LinuxShell高级面试题汇总，涵盖脚本优化、系统原理、故障排查、安全实践等高频考点，适用于中高级开发/运维岗位：一、Shell原理进阶exec3<>file的作用是什么？文件描述符0-2的默认指
一个小时快速部署大模型，附大模型书：ChatGLM3大模型本地化部署、应用开发与微调! LLM教程人工智能 langchain 知识图谱 Agent 大模型 LLM AI
这个教程有以下几部分构成：硬件配置概念介绍实操测试结果1.硬件配置本文使用的方法配置要求低，没有gpu也可以正常使用(就是有点慢)，不管是windows还是linux，都可以无障碍使用大模型，有脚就行，废话少说，let’srock!2.概念介绍几个部署要用到的概念，工具和项目huggingface:类似于模型的github，各种各样的开源模型都可以在这被找到.模型量化技术：这也是我们能够在低端设备
vscode报错：找不到任务“g++.exe build active file”。（Linux)
错误原因：task.json文件中的“label”和launch.json中的"preLaunchTask"不匹配，要保持这两个参数一致（大部分原因都是因为中英文不匹配）！task.jsonlaunch.json以上是修改后的，因为task文件是自动生成的，label处错误写法是：g++.exe的生成活动文件（中文），而launch文件找不到中文，就报错找不到了。把task文件中的改成英文就可以了
Hadoop-Mapreduce入门
Hadoop-Mapreduce入门MapReduce介绍mapreduce设计MapReduce编程规范入门案例WordCountMapReduce介绍MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。知识。Map负责“分”，把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算，彼此间几乎没有依赖关系。Redu
Flink ClickHouse 连接器：实现 Flink 与 ClickHouse 无缝对接 Edingbrugh.南空大数据 flink flink clickhouse 大数据
引言在大数据处理领域，ApacheFlink是一款强大的流处理和批处理框架，而ClickHouse则是一个高性能的列式数据库，专为在线分析处理（OLAP）场景设计。FlinkClickHouse连接器为这两者之间搭建了一座桥梁，使得用户能够在Flink中方便地与ClickHouse数据库进行交互，实现数据的读写操作。本文将详细介绍FlinkClickHouse连接器的相关内容，包括其特点、使用方法
Hadoop MapReduce入门且行且安~ 数据分析进阶之路 Linux命令 hadoop MapReduce入门
入门简介计算过程分为两个阶段Map和ReduceMap阶段并行处理输入数据Reduce阶段对Map结果进行汇总针对python语言来说：map函数或者reduce函数来说，输出的数据格式为元组tuple一个简单的MapReduce程序只需要指定map()reduce()input()output()剩下的由框架完成。Linux常见命令：-读取文件（文本文件，在Windows下使用记事本打开的文件）
基于Linux下的vscode c/c++开发环境搭建详细教程墨小傲 linux vscode c语言
vscode是文本编辑而非集成开发环境，需要经过配置才能在其上编译执行代码。本教程将具体详解在linux上配置VisualStudioCode使用GCCC++编译器（g++）和GDB调试器的方法（GCC是GNU编译器集合，GDB则是GNU调试器）。配置vscode后，将通过在VSCode中编译和调试一个简单的C++程序告知您具体该如何操作。一、先决条件安装VisualStudioCode.安装C+
Hadoop MapReduce 入门
一、Hadoop3.0.4环境准备1.环境要求Java8（Hadoop3.0.4不支持Java11+）单节点或多节点Linux系统（推荐Ubuntu18.04+）至少4GB内存（建议8GB+）50GB以上磁盘空间2.安装Java#安装Java8sudoapt-getinstallopenjdk-8-jdk#验证安装java-version3.下载与安装Hadoop3.0.4#下载Hadoop3.0
Linux Vim 如何使用 BACKLS gradle vim
LinuxVim最全面教程目录介绍安装Vim基本操作启动与退出插入模式移动光标删除、复制和粘贴撤销与重做高级操作查找与替换多文件编辑宏与自动化插件管理配置Vim编辑vimrc常用配置示例总结介绍Vim是一个高度可配置的文本编辑器，适用于从日常文本编辑到复杂的编程任务。它的前身是vi编辑器，具有强大的文本处理能力和灵活的扩展性。安装Vim在不同的Linux发行版上安装Vim的方法略有不同。以下是一些
【前端开发】Uniapp分页器：新增输入框跳转功能
基于UniApp官方扩展组件库uni-ui中的uni-pagination分页器组件，针对大数据量场景进行优化主要优化以下内容：新增输入框跳转功能：在原有分页器基础上，新增了一个输入框区域，允许用户直接输入目标页码进行跳转双向页码绑定优化：实现了输入框与当前页码的双向绑定机制。当用户通过其他方式（如点击上一页、下一页、页码按钮）切换页面时，输入框会自动更新显示当前页码。同时，当用户在输入框中输入页
大数据技术之Flink
第1章Flink概述1.1Flink是什么1.2Flink特点1.3FlinkvsSparkStreaming表Flink和Streaming对比FlinkStreaming计算模型流计算微批处理时间语义事件时间、处理时间处理时间窗口多、灵活少、不灵活（窗口必须是批次的整数倍）状态有没有流式SQL有没有1.4Flink的应用场景1.5Flink分层API第2章Flink快速上手2.1创建项目在准备
Android 音频降噪 webrtc 去回声
Android音频降噪webrtc去回声集成AECM模块集成NS模块需要源码请留言集成AECM模块1.通过webrtc官网下载需要模块\modules\audio_processing\aecm2.新建eclipse工程,新建jni文件夹将webrtcaecm模块拷贝到jni文件夹下3.编写本地接口packagecom.wrtcmy.webrtc.aecm;/***Thisclasssupport
java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试木林网络 mybatis java 数据库
java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、
基于JAVA的酒店管理系统的设计与实现代论文网课招代理前端 javascript 开发语言网络数据库
目录绪论3第一章课题研究途径与意义51.1本课题研究途径51.2本课题研究意义6第二章酒店管理系统分析72.1背景介绍72.2现实需求分析81)酒店首页介绍模块92)顾客注册登录模块93)信息查询模块104)预订管理模块105)管理员登录模块106)超级管理员登录模块107)房间信息模块102.3系统环境需求101)系统采用Windows操作系统下MyEclipse开发平台开发；102)程序设计语
Docker技术全景解析：从核心原理到实践应用 Liudef06小白 docker 容器运维
Docker技术全景解析：从核心原理到实践应用引言：容器化革命的引擎2013年诞生的Docker并非容器技术的发明者，却成功地将Linux容器（LXC）这一底层技术转化为开发者友好的标准化工具。它通过镜像封装、环境一致性和资源隔离三大创新，解决了“在我机器上能跑，线上为什么不行”这一行业顽疾。Docker的核心突破在于创建了跨环境的应用交付标准——开发者构建的Docker镜像可在开发笔记本、测试服
PHP 安装指南 wjs2024 开发语言
PHP安装指南引言PHP是一种广泛使用的开源服务器端脚本语言，常用于Web开发。正确安装PHP是开始构建动态网站或应用程序的第一步。本文将详细介绍如何在各种操作系统上安装PHP，并指导您完成必要的配置步骤。安装环境准备在安装PHP之前，请确保您的系统满足以下条件：操作系统：PHP可以在多种操作系统上运行，包括Windows、Linux和macOS。Web服务器：虽然PHP主要用作服务器端脚本语言，
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l