梁辰兴

Hadoop 综合训练：文件内容的显示与排序

文章目录

一，显示文件内容
- （一）启动hadoop服务
- （二）创建并上传本地文件
- - （1）创建students.txt文件
  - （2）上传文件到HDFS
- （三）创建Maven项目：DisplayFile
- - （1）添加相关依赖
  - （2）创建日志属性文件
- （四）创建读取文件类：ReadFileOnHDFS
- （五）运行ReadFileOnHDFS类，查看结果
二，完成数据排序
- （一）启动hadoop服务
- （二）创建Maven项目：SortByAge
- - （1）创建：SortByAge
  - （2）添加相关依赖
  - （3）创建日志文件
- （三）创建实体类：FlowBean
- （四）创建年龄排序映射器类：SortByAgeMapper
- （五）创建年龄排序归并器类：SortByAgeReducer
- （六）创建年龄排序驱动器类：SortByAgeDriver
- （七）运行SortByAgeDriver类，查看结果

一，显示文件内容

（一）启动hadoop服务

在master虚拟机上执行命令：start-all.sh

（二）创建并上传本地文件

（1）创建students.txt文件

1.在master虚拟机上创建/export/task目录，输入命令：mkdir /export/task

2.在/export/task目录下创建文件students.txt，输入命令：touch /export/task/student.txt

3.向student.txt文件添加如下内容：

李晓文 女 20
张晓航 男 19
郑小刚 男 21
吴文华 女 18
肖云宇 男 22
陈燕文 女 19
李连杰 男 23
艾晓丽 女 21
童安格 男 18

（2）上传文件到HDFS

1.创建/student/input目录，输入命令：hdfs dfs -mkdir -p /student/input

2.上传student.txt文件到HDFS上，输入命令：hdfs dfs -put /export/task/student.txt /student/input

3.在hadoop webui界面查看文件是否上传成功

（三）创建Maven项目：DisplayFile

1.设置为下图所示，单击【Create】按钮

2.删除【Main】主类：右击【Main】类，单击【Delete】

（1）添加相关依赖

1.在pom.xml文件里添加hadoop和junit依赖，内容如下：

<dependencies>                                   
                                 
    <dependency>                                 
        <groupId>org.apache.hadoopgroupId>     
        <artifactId>hadoop-clientartifactId>   
        <version>3.3.4version>                 
    dependency>                                
                                    
    <dependency>                                 
        <groupId>junitgroupId>                 
        <artifactId>junitartifactId>           
        <version>4.13.2version>                
    dependency>                                
dependencies>

2.单击【maven】，单击那个刷新按钮，它会自动下载相关依赖

（2）创建日志属性文件

1.右击resources目录，单击【new】选择【resources bundle】，弹出下图界面输入log4j，单击【ok】按钮
2.在弹出的【Create Resource Bundle】对话框中输入：log4j，单击【OK】按钮

3.log4j.properties文件添加如下内容：

log4j.rootLogger=INFO, stdout, logfile
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/wordcount.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

（四）创建读取文件类：ReadFileOnHDFS

1.右击【net.army.mr】包，选择【new】，单击【java class】
2.在弹出的对话框输入ReadFileOnHDFS，按下回车键

3.编写代码

package net.army.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URI;

/**
 * 作者：梁辰兴
 * 日期：2022/12/14
 * 功能：读取HDFS上的文件
 */
public class ReadFileOnHDFS {
    public static void main(String[] args) throws Exception {
        // 创建配置对象
        Configuration conf = new Configuration();
        // 设置数据节点主机名属性
        conf.set("dfs.client.use.datanode.hostname", "true");
        // 定义统一资源标识符（uri: uniform resource identifier）
        String uri = "hdfs://master:9000";
        // 创建文件系统对象（基于HDFS的文件系统）
        FileSystem fs = FileSystem.get(new URI(uri), conf, "root");
        // 创建路径对象（指向文件）
        Path path = new Path(uri + "/student/input/student.txt");
        // 创建文件系统数据字节输入流（进水管：数据从文件到程序）
        FSDataInputStream in = fs.open(path);
        // 创建缓冲字符输入流，提高读取效率（字节流-->字符流-->缓冲流）
        BufferedReader br = new BufferedReader(new InputStreamReader(in));
        // 定义行字符串变量
        String nextLine = "";
        // 通过循环遍历缓冲字符输入流
        while ((nextLine = br.readLine()) != null) {
            // 在控制台输出读取的行
            System.out.println(nextLine);
        }
        // 关闭缓冲字符输入流
        br.close();
        // 关闭文件系统数据字节输入流
        in.close();
        // 关闭文件系统
        fs.close();
    }
}

（五）运行ReadFileOnHDFS类，查看结果

二，完成数据排序

（一）启动hadoop服务

输入命令：start-all.sh

（二）创建Maven项目：SortByAge

（1）创建：SortByAge

1.配置为如下图所示，单击【Create】按钮
2.如果不想关闭当前项目，就单击【New Window】

3.成功创建并打开了项目，然后删除【Main】类，如下图操作即可

（2）添加相关依赖

1.向pom.xml文件里添加hadoop和junit依赖，内容如下：

<dependencies>                                        
                                      
    <dependency>                                      
        <groupId>org.apache.hadoopgroupId>          
        <artifactId>hadoop-clientartifactId>        
        <version>3.3.4version>                      
    dependency>                                     
                                         
    <dependency>                                      
        <groupId>junitgroupId>                      
        <artifactId>junitartifactId>                
        <version>4.13.2version>                     
    dependency>                                     
dependencies>

2.添加完成后的示例图

3.刷新本地的maven仓库，如果没有下载，会自动下载依赖到本地：单击【Maven】，单击【刷新】按钮

（3）创建日志文件

1.在resources目录里创建log4j.properties文件，右击【resources】，选择【New】，单击【Resource Bundle】
2.在弹出的对话框中输入：log4j，按【OK】按钮，成功创建

3.向log4j.properties文件添加如下内容：

log4j.rootLogger=INFO, stdout, logfile
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/topnscore.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

（三）创建实体类：FlowBean

1.右击【net.army.mr】，选择【New】，单击【Java Class】
2.在弹出的对话框中输入：FlowBean，按下回车键，成功创建

3.编写代码

package net.army.mr;

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

/**
 * 作者：梁辰兴
 * 日期：2022/12/17
 * 功能：序列化方法
 */
public class FlowBean implements WritableComparable<FlowBean> {
    String name;
    String sex;
    int age;

    @Override
    public String toString() {
        return "FlowBean{" +
                "name='" + name + '\'' +
                ", sex='" + sex + '\'' +
                ", age=" + age +
                '}';
    }

    public String getSex() {
        return sex;
    }

    public void setSex(String sex) {
        this.sex = sex;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int compareTo(FlowBean o) {
            return o.getAge() - this.getAge();
    }

    @Override
    public void write(DataOutput dataOutput) throws IOException {
        dataOutput.writeUTF(name);
        dataOutput.writeUTF(sex);
        dataOutput.writeInt(age);
    }

    @Override
    public void readFields(DataInput dataInput) throws IOException {
        name = dataInput.readUTF();
        sex = dataInput.readUTF();
        age = dataInput.readInt();
    }
}

（四）创建年龄排序映射器类：SortByAgeMapper

1.右击【net.army.mr】，选择【New】，单击【Java Class】
2.在弹出的对话框中输入：SortByAgeMapper，按下回车键，成功创建

3.编写代码

package net.army.mr;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * 作者：梁辰兴
 * 日期：2022/12/16
 * 功能：年龄排序映射器类
 */
public class SortByAgeMapper extends Mapper<LongWritable, Text, FlowBean, NullWritable> {
    public void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
        // 获取行
        String line = value.toString();
        // 拆分
        String[] nums = line.split(" ");
        // 抓取数据
        String name = nums[0];
        String sex = nums[1];
        int age = Integer.parseInt(nums[2]);
        // 创建flowbean对象
        FlowBean flowBean = new FlowBean();
        flowBean.setName(name);
        flowBean.setSex(sex);
        flowBean.setAge(age);
        // 传出
        context.write(flowBean, NullWritable.get());
    }
}

（五）创建年龄排序归并器类：SortByAgeReducer

1.右击【net.army.mr】，选择【New】，单击【Java Class】

2.在弹出的对话框中输入：SortByAgeReducer，按下回车键，成功创建

3.编写代码

package net.army.mr;

import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

/**
 * 作者：梁辰兴
 * 日期：2022/12/16
 * 功能：年龄排序归并器类
 */
public class SortByAgeReducer extends Reducer<FlowBean, NullWritable, Text, NullWritable> {
    @Override
    protected void reduce(FlowBean key, Iterable<NullWritable> values, Reducer<FlowBean, NullWritable, Text, NullWritable>.Context context) throws IOException, InterruptedException {
        for (NullWritable value : values) {
            // 拼接数据
            String StudentInfo = key.getName() + "\t" + key.sex + "\t" + key.age;
            // 传出
            context.write(new Text(StudentInfo), NullWritable.get());
        }
    }
}

（六）创建年龄排序驱动器类：SortByAgeDriver

1.右击【net.army.mr】，选择【New】，单击【Java Class】
2.在弹出的对话框中输入：SortByAgeDriver，按下回车键，成功创建

3.编写代码

package net.army.mr;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.net.URI;

/**
 * 作者：梁辰兴
 * 日期：2022/12/16
 * 功能：年龄排序驱动器类
 */
public class SortByAgeDriver {
    public static void main(String[] args) throws Exception {
        // 创建配置对象
        Configuration conf = new Configuration();
        // 设置数据节点主机名属性
        conf.set("dfs.client.use.datanode.hostname", "true");

        // 获取作业实例
        Job job = Job.getInstance(conf);

        // 设置作业启动类
        job.setJarByClass(SortByAgeDriver.class);

        // 设置Mapper类
        job.setMapperClass(SortByAgeMapper.class);
        // 设置map任务输出键类型
        job.setMapOutputKeyClass(FlowBean.class);
        // 设置map任务输出值类型
        job.setMapOutputValueClass(NullWritable.class);
        
        // 设置Reducer类
        job.setReducerClass(SortByAgeReducer.class);
        // 设置reduce任务输出键类型
        job.setOutputKeyClass(Text.class);
        // 设置reduce任务输出值类型
        job.setOutputValueClass(NullWritable.class);

        // 定义uri字符串
        String uri = "hdfs://master:9000";
        // 创建输入目录
        Path inputPath = new Path(uri + "/student/input");
        // 创建输出目录
        Path outputPath = new Path(uri + "/student/output");

        // 获取文件系统
        FileSystem fs = FileSystem.get(new URI(uri), conf);
        // 删除输出目录
        fs.delete(outputPath, true);

        // 给作业添加输入目录
        FileInputFormat.addInputPath(job, inputPath);
        // 给作业设置输出目录
        FileOutputFormat.setOutputPath(job, outputPath);

        // 等待作业完成
        job.waitForCompletion(true);

        // 输出统计结果
        System.out.println("======统计结果======");
        FileStatus[] fileStatuses = fs.listStatus(outputPath);
        for (int i = 1; i < fileStatuses.length; i++) {
            // 输出结果文件路径
            System.out.println(fileStatuses[i].getPath());
            // 获取文件输入流
            FSDataInputStream in = fs.open(fileStatuses[i].getPath());
            // 将结果文件显示在控制台
            IOUtils.copyBytes(in, System.out, 4096, false);
        }
    }
}

（七）运行SortByAgeDriver类，查看结果

大数据手册(Spark)--Spark安装配置 WilenWu 数据分析(Data Analysis)大数据 spark 分布式
本文默认在zsh终端安装配置，若使用bash终端，环境变量的配置文件相应变化。若安装包下载缓慢，可复制链接到迅雷下载，亲测极速～准备工作Spark的安装过程较为简单，在已安装好Hadoop的前提下，经过简单配置即可使用。假设已经安装好了hadoop（伪分布式）和hive，环境变量如下JAVA_HOME=/usr/opt/jdkHADOOP_HOME=/usr/local/hadoopHIVE_HO
YOLO11改进-模块-引入CMUNeXt Block 增强全局信息一勺汤 YOLOv11模型改进系列网络 YOLO 目标检测模块魔改 YOLOv11 YOLOV11模型改进
在医学图像分割领域面临诸多问题，如U形架构卷积网络难以提取全局信息，混合架构因计算资源受限在实际医疗场景应用受阻，轻量化网络在保证性能与提取全局信息上存在矛盾。因此，设计了CMUNeXtBlock，CMUNeXtBlock采用大核深度可分离卷积替代普通卷积来提取全局信息，凭借深度可分离卷积减少参数和计算成本以维持轻量化，同时综合利用卷积归纳偏置和全局信息提取能力，有效解决了这些问题。代码：http
《java性能调优》2.Stream如何提高遍历集合效率 just_one_wk java性能调优
在Java8中，Collection新增了两个流方法，分别是Stream()和parallelStream()。什么是Stream？在Java8之前，我们通常是通过for循环或者Iterator迭代来重新排序合并数据，又或者通过重新定义Collections.sorts的Comparator方法来实现，这两种方式对于大数据量系统来说，效率并不是很理想。Java8中添加了一个新的接口类Stream，
网络运维学习笔记（DeepSeek优化版） 018 HCIA-Datacom综合实验03 技术小齐网络运维学习
文章目录综合实验3实验需求一：A公司网络规划二：B公司网络规划配置一、ip、vlan、vlanif，stp、eth-trunkSW1SW2R1二、ospfSW1R1三、NATR1ISP四、拒绝ping允许httpSW1五、右半部分vlan、dhcp、ospf、NATSW4R2综合实验3实验需求一：A公司网络规划SW1/2/3组成了A公司的交换网络，其中SW1是核心层，SW2/3是接入层。三台交换机
uni-app App 端分段导出 JSON 数据为文件 _虾仁不眨眼_ uni-app
在开发过程中，我们经常需要将大量数据导出为JSON文件，尤其是在处理长列表或大数据集时。然而，直接将所有数据写入一个文件可能会导致性能问题，尤其是在移动设备上。为了优化性能并提高用户体验，我们可以将数据分段导出到多个文件中。实现思路分段处理数据：将长JSON数据分段，每段包含固定数量的数据。使用plus.io写入文件：利用uni-app的plus.ioAPI，将每段数据写入单独的文件。提示用户导出
智慧运维与物联网技术在地铁车辆段的应用项目罗博深
本文还有配套的精品资源，点击获取简介：随着物联网技术的广泛应用，智慧运维系统通过传感器、大数据分析、云计算等技术集成，提升了地铁车辆段的运维效率和安全性。该系统可以实时监控设备状态、预测故障、提供智能决策支持、优化维护策略，并降低运营成本，同时提高乘客安全。其应用拓展至整个地铁线路，乃至与城市交通系统协同，展现了智慧运维对公共交通系统现代化的贡献。1.物联网技术基础与应用物联网（Interneto
Java多线程与并发编程实战——从基础到进阶 AI天才研究院 Python实战 Java实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介互联网企业都在大力拓展自己的业务，而新的技术革命也带来了海量的数据量，因此，单机并发处理能力已经无法满足现代信息时代对高速数据的需求。大数据和云计算带来的分布式系统架构，让单台计算机不仅能够执行单个任务，而且可以横向扩展处理大量任务。在这种情况下，如何充分利用多核CPU、共享内存等资源并发地处理多项任务就成为现代系统设计者们必备技能之一。本书将以实操为导向，全面
深入解析LTE-A到5G的系统消息架构与功能演进罗博深
本文还有配套的精品资源，点击获取简介：系统消息是移动通信网络中，UE与网络间信息交换的核心，涵盖了网络状态、服务信息与系统配置。文章深入分析了4GLTE-A到5G网络中系统消息的组成、作用及其演进，包括MIB和SIBs的功能与内容，以及5G对系统消息的优化和新技术的引入，如动态调度、网络切片和针对物联网设备的特定参数配置。5G系统消息还通过机器学习和大数据分析实现智能化分发，增强了网络灵活性、智能
TRAE与Cursor AI编程工具综合对比（截至2025年3月） xinxiyinhe AI编程 AI编程 python
一、核心定位与差异化Trae（字节跳动）本土化优先：专为中文开发者设计，提供全中文界面、中文代码注释及语义优化，例如可直接用中文描述需求（如“实现带登录功能的网页”）生成完整代码框架。免费策略：完全免费，集成Claude3.5和GPT-4o双模型，支持私有化部署及企业级数据隔离。开发环境：构建完整的AI原生IDE，注重项目全流程管理，支持从需求到部署的端到端开发。Cursor（Anysphere）
房产租赁数据分析与可视化学习只是用户态数据分析信息可视化数据挖掘
【实训目的】通过本次实训，要求了解Python用于数据可视化的常用包：matplotlib、seaborn、pyecharts等基本使用，及各种图形的使用。【实训环境】 Jupyter环境、Pandas、NumPy、Matplotlib。【实训内容】 1.数据统计与分析方面的可视化； 2.数据分析与预测方面的可视化； 3.数据多类型的可视化。本次实验以温州市三区房屋租赁数据（res
机器学习算法实战——天气数据分析（主页有源码）喵了个AI 机器学习实战机器学习算法数据分析
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言天气数据分析是气象学和数据科学交叉领域的一个重要研究方向。随着大数据技术的发展，气象数据的采集、存储和分析能力得到了显著提升。机器学习算法在天气数据分析中的应用，不仅能够提高天气预报的准确性，还能为气候研究、灾害预警等提供有力支持。本文将介绍机器学习在天气数据分析中的应用，探讨
多线程到底重不重要？ Vic2334 JAVA java 开发语言
我们先说一下为什么要讲多线程和高并发？原因是，你想拿到一个更高的薪水，在面试的时候呈现出了两个方向的现象：第一个是上天项目经验高并发缓存大流量大数据量的架构设计第二个是入地各种基础算法，各种基础的数据结构JVMOS线程IO等内容多线程和高并发，就是入地里面的内容。基本概念我们先从线程的基本概念开始，给大家复习一下，不知道有多少同学是基础不太好，说什么是线程都不知道的，如果这样的话，花时间去补初级内
Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
基于Mosquitto和Paho，在C++中使用MQTT 牛魔王的小怪兽 MQTT c++开发语言网络协议
基于Mosquitto和Paho，使用C++进行MQTT相关应用的开发文章目录基于Mosquitto和Paho，使用C++进行MQTT相关应用的开发1.什么是MQTT2.MQTT的应用场景3.基于Paho，在C++中使用MQTT3.1.下载Paho库3.2.发布消息的代码示例3.3.订阅消息的代码示例3.4.综合示例3.4.1.LinuxC++发布端代码3.4.2.LinuxC++订阅端代码4.基
点亮绿色未来：走进综合能源服务认证 AEMC马广川能源 java 前端服务器大数据人工智能
能源，是城市运转的血液，也是社会发展的动力。然而，传统的能源利用方式正面临着资源紧张、环境污染等挑战。如何破解能源困局，构建清洁低碳、安全高效的能源体系？综合能源服务认证，为我们提供了一把开启绿色未来的钥匙。一、认证的意义：为绿色未来保驾护航想象一下，未来的城市，高楼大厦不再是被冰冷的钢筋水泥包裹，而是披上了一层“绿色外衣”。这层“外衣”不仅能遮风挡雨，还能吸收太阳能、风能，为建筑提供清洁能源。而
提出机器人自主学习新范式，深大团队最新顶会论文，刷新6大复杂任务SOTA 量子位
关注前沿科技量子位让机器人轻松学习复杂技能有新框架了！深圳大学大数据系统计算技术国家工程实验室李坚强教授团队联合鹏城国家实验室、北京理工莫斯科大学，提出了奖励函数与策略协同进化框架ROSKA。在多个高维度机器人任务上，在仅使用89%训练样本的情况下，比现有SOTA方法平均性能提升95.3%。众所周知，随着机器人技术的快速发展，其应用已渗透至日常生活和工业生产场景。然而在多自由度机器人控制领域，传统
基于Asp.net的汽车租赁管理系统计算机学姐 Asp精选实战项目源码 asp.net 汽车后端 mysql sqlserver vue.js c#
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Asp.net的汽车租赁管理系统开发
【AI热点】OpenAI新发布API技术深度洞察碣石潇湘无限路人工智能
以下内容基于对OpenAI最新发布的AgentAPI及相关工具的官方信息、技术演示和已有报道进行综合解读与深度分析，供您参考。本报告将围绕最新发布的ResponsesAPI（智能体核心新接口）、内置工具（websearch、filesearch、computeruse）、全新的AgentsSDK以及核心安全与可观测性机制，帮助您深入理解其原理、特性及应用价值。一、背景：为什么要推出新的AgentA
【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）碣石潇湘无限路开源人工智能
以下报告将基于今天各大社区对Qwen/QwQ-32B（下文简称「QwQ-32B」）模型的讨论、测评与实测体验进行综合性分析与洞察。本报告将从模型背景与定位、核心技术、性能表现与对比、部署与使用方式，以及未来潜力与可能的影响五个维度，帮助读者更好地了解这一新兴且备受瞩目的开源推理模型。一、模型背景与定位1.发布方与家族概览QwQ-32B模型由阿里巴巴（Alibaba）旗下的Qwen团队推出，属于Qw
焊接机器人与线激光视觉系统搭配的详细教程自动化专业爱好者机器人 opencv 人工智能
以下是关于焊接机器人与线激光视觉系统搭配的详细教程，包含核心程序框架、调参方法及源码实现思路。本文综合了多个技术文档与专利内容，结合工业应用场景进行系统化总结。一、系统硬件配置与视觉系统搭建1.硬件组成焊接机器人系统通常由以下模块构成：线激光视觉传感器：用于发射线激光并采集焊缝图像（如英莱科技PF系列传感器，支持4K视频监控与微间隙焊缝检测）。机器人本体与焊枪：需支持外部轴控制，传感器通过夹具安装
虚拟机中Hadoop集群NameNode进程缺失问题解析与解决申朝先生 hadoop 大数据分布式 linux
目录问题概述问题分析解决办法总结问题概述在虚拟机中运行Hadoop集群时，通过执行jps命令检查进程时，发现NameNode进程缺失。这通常会导致Hadoop集群无法正常运行，影响数据的存储和访问。问题分析导致NameNode进程缺失的原因可能有以下几点：集群未正确停止：在关闭虚拟机或重启Hadoop集群之前，未执行stop-all.sh命令正确停止集群，导致Hadoop服务异常退出，留下残留数据
Python数据可视化 Pyecharts 制作 Grid 组合组件 Mr数据杨 Python 数据可视化数据可视化 python 数据分析 pyecharts 组合组件
在数据可视化中，常常需要将多个不同类型的图表放置在同一个页面中，以便综合展示多个维度的数据。pyecharts库中的Grid类正是为此设计的，它允许用户将多个图表组合在一起，实现复杂的数据展示需求。通过灵活的布局配置，Grid类不仅能够帮助用户创建具有多图组合的复杂布局，还能通过精细的网格和坐标轴设置，提升图表的整体视觉效果和交互体验。本文将介绍如何使用Grid类创建并行多图，并通过多种图表组合的
2024最新版头歌实践教学平台数据库原理与应用实训答案泠波数据库
实训一:数据定义和操纵(4课时)初识MySQL数据库第1关：创建数据库mysql-uroot-p123123-h127.0.0.1createdatabaseMyDb;showdatabases;第2关：创建表mysql-uroot-p123123-h127.0.0.1createdatabaseTestDb;createtablet_emp(idint,namevarchar(32),deptI
TDengine 使用教程：从入门到实践遇见伯灵说 tdengine 大数据时序数据库
TDengine是一款专为物联网（IoT）和大数据实时分析设计的时序数据库。它能够高效地处理海量的时序数据，并提供低延迟、高吞吐量的性能表现。在本文中，我们将带领大家从TDengine的安装、基本操作到一些高级功能，帮助你快速上手。1.TDengine简介TDengine是一个高效的时序数据存储解决方案，支持高并发写入和快速的实时分析。它适用于各种物联网应用场景，如传感器数据监控、日志数据处理等。
【系统架构设计师】论文：论软件产品线技术数据知道系统架构中间件论文系统架构设计师软考高级软件产品线
论文：论软件产品线技术文章目录摘要正文总结摘要根据“十五”国防科技重点实验室—“机载XXPD火控雷达性能开发与评估实验室”的建设需求。我所在的中国x集团公司x所电子对抗研究部组织了用于该实验室目布式联网试验，主要任务是试验机载雷达的各项技术指标，模拟较逼真的雷达信号环境和其他电磁信号环境，检查机载雷达工作性能、探测和跟踪精度及飞机综合火控系统性能。我担任了该软件系统负责人。我成功的将软件产品线技术
educoder实训——流程控制【4】 lzl2040 educoder python实训 python educoder
按从小到大顺序输出小于n的非负整数任务描述本关任务：编写一个能在同一行输出小于n的非负整数的小程序。相关知识rangerange类型表示不可变的数字序列，通常用于在for循环中循环指定的次数。range参数必须为整数，如果省略step参数，则默认为1。如果省略start参数，则默认为0。如果step为零，则会引发ValueError。range对象支持除拼接和重复外的通用序列操作range(sto
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
【头歌C语言程序与设计】数据类型与基本操作畅游星辰大海 #头歌C语言程序设计 c语言
目录写在前面正文第1关：数值与字符的通用性实验第2关：转义字符实验第3关：浮点数实验第4关：数值类型综合实验写在最后写在前面本文代码是我自己所作，本人水平有限，可能部分代码看着不够简练，运行效率不高,但都能运行成功。另外，如果想了解更多，请订阅专栏头歌C语言程序与设计正文第1关：数值与字符的通用性实验本关任务：了解C语言中字符型和整型的通用性，根据提示，输出字母p-Q的数值大小，理解英文姓名排序方
大语言模型的潜力是否被高估 dev.null AI #NLP 语言模型人工智能机器学习
关于大语言模型（LLM）的潜力是否被高估，目前学术界和产业界存在显著分歧。以下从技术能力、应用局限性和未来发展方向三个方面综合分析：一、技术能力的争议：潜力与局限并存对现实世界的理解与模拟MIT的研究表明，LLM在训练过程中可能自发形成对现实世界的内部模拟。例如，通过解决卡雷尔编程谜题（KarelPuzzle），模型在没有直接接触环境信息的情况下，正确率从初始的随机指令提升至92.4%，并展现出对
掌握大数据时代的心跳：实时数据处理的崛起 Echo_Wish 大数据大数据
掌握大数据时代的心跳：实时数据处理的崛起在大数据时代，我们每天都在生成海量的数据——从社交媒体上的点赞到物联网设备上传的传感器数据，数据无处不在。然而，仅仅存储这些数据已经无法满足现代业务的需求，“实时数据处理”已经从一项可选技术跃升为业务成功的关键所在。如何让数据在其生成的瞬间就能被分析、处理并驱动决策，这是我们今天要探讨的重点。为什么实时数据处理如此重要？想象一下这样两个场景：在线交易平台：当
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

Hadoop 综合训练：文件内容的显示与排序

文章目录

一，显示文件内容

（一）启动hadoop服务

（二）创建并上传本地文件

（1）创建students.txt文件

（2）上传文件到HDFS

（三）创建Maven项目：DisplayFile

（1）添加相关依赖

（2）创建日志属性文件

（四）创建读取文件类：ReadFileOnHDFS

（五）运行ReadFileOnHDFS类，查看结果

二，完成数据排序

（一）启动hadoop服务

（二）创建Maven项目：SortByAge

（1）创建：SortByAge

（2）添加相关依赖

（3）创建日志文件

（三）创建实体类：FlowBean

（四）创建年龄排序映射器类：SortByAgeMapper

（五）创建年龄排序归并器类：SortByAgeReducer

（六）创建年龄排序驱动器类：SortByAgeDriver

（七）运行SortByAgeDriver类，查看结果

你可能感兴趣的:(大数据,hadoop,hdfs,大数据,综合实训)