Ian Meyers

如何将Node.js Streaming MapReduce引入Amazon EMR

概述

Node.js是一套JavaScript框架，其核心诉求在于利用非阻塞I/O以及异步式事件驱动处理模型实现服务器端应用程序的高性能运行。

当客户需要处理规模庞大且复杂性较高的数据时，Node.js能够提供一套以原生方式支持JSON数据结构的运行时环境。Python及Ruby等编程语言都拥有面向JSON数据的优秀支持能力，但Node.js在处理包含列表及数组的结构时显得尤为得心应手。Node.js还提供一套高性能且具备可扩展能力的备用方案，能够以原生方式将JSON数据作为对象加以处理。目前大家已经可以获得专门针对Node.js的AWS SDK(http://aws.amazon.com/sdkfornodejs)，其允许我们将Node.js应用程序与AWS服务加以紧密整合。

在今天的文章中，大家将了解到如何在Amazon Elastic MapReduce（简称Amazon EMR）当中安装Node.js、如何构建一款Node.js应用程序并将其与Hadoop Streaming并发处理架构相整合、外加如何在AWS之上部署并运行我们的Node.js MapReduce应用程序。要了解更多与Amazon EMR以及Hive项目相关之细节信息，请大家点击此处查看专题教程。

本文假定大家已经熟知与Hadoop、Hive以及Amazon EMR相关的专业知识。

用例

在本文当中，我们将使用来自Twitter的数据，这部分数据中包含由推文、转发、回复以及直发信息所构成的复杂信息体系。每个文件中都包含有单一Twitter事务数据块，我们需要将其内容写入至Amazon Simple Storage Service（简称Amazon S3）并随时加以读取。我们希望针对Hive的实际需求对数据进行转换，旨在对转发率、每秒推文数量以及每用户直发信息数量等指标进行汇总。

样本输入数据

我们的数据表现出一套由大量Twitter用户所构成的复杂交互图谱，其中包括推文转发与回复内容，如下图所示：

为了进行数据发现，我们可以利用Hive配合JsonSerde（可参看http://aws.amazon.com/articles/2854）对数据进行调查。不过由于这套图谱非常复杂而且存在自我指涉，因此大部分Hive JsonSerde无法将这部分数据显示为表格。能够在Node.js中进行数据处理，我们能够更轻松地利用简单语法实现数据图谱导航。

安装Node.js

我们可以利用以下bootstrap操作将Node.js安装在Amazon EMR集群当中：

---bootstrap-actions Path=s3://github-emr-bootstrap-actions/node/install-nodejs.sh,Name=InstallNode.js

(如果大家此前从未接触过bootstrap操作，请点击此处查阅Amazon EMR提供的说明文档。)

编写MapReduce代码

现在Node.js已经被安装在Amazon EMR集群之上，而Hadoop Streaming也得到正确配置，接下来我们需要运行自己的Node.js应用程序以完成映射与归约操作。利用Hadoop Streaming处理架构，我们能够为流任务指定所需要使用的映射与归约代码。

与其它Hadoop Streaming兼容语言一样，我们必须从Amazon S3数据存储或者HDFS文件系统当中利用标准输入（即stdin）方式实现数据读取。在Node.js当中，stdin能够利用处理全局对象的方式获得可访问能力（参见http://nodejs.org/api/process.html）。这就使我们得以访问多种控制机制，进而通过管理输入与输出数据流对数据进行读取与写入，例如process.stdin与process.stdout。

我们的MapReduce程度必须执行五项主要函数以实现从Hadoop Streaming以及输出结果中读取数据。

配置标准输入

在默认情况下，process.stdin输入通道会处于暂停状态，且不触发任何事件。在将其启用之前，我们必须首先配置所需的字符集编码。对于非多字节字符集而言，我们可以使用UTF-8。因此，我们映射或者归约方案的主体流程应该从这里开始：

process.stdin.setEncoding('utf8');

或者，我们也可以使用UTF-16实现多字节支持。在此之后，我们必须启用stdin对事件进行恢复以及触发：

process.stdin.resume();

处理来自STDIN的输入内容

当我们的Node.js应用程序使用该stdin.data事件时，process.stdin通道会就此发出通知——stdin.data事件会在一定数量的数据可用于读取时被触发。我们的Node.js应用程序必须对这部分数据进行缓存处理以备后续使用，因为事件所提供的每一个数据块可能都仅仅属于标准输入内容中全部可用数据的一小部分。由于我们此前通过配置让Hadoop Streaming使用非分割式FileInputFormat，因此我们会在单一映射器中获取到完整的JSON数据，并能够将该文件作为整体加以处理。有鉴于此，我们可以通过以下代码将数据块缓存于data事件当中：

var line = ‘’;
// fires on every block of data read from stdin
process.stdin.on('data', function(chunk) {
    // chunk and emit on newline
    lines = chunk.split("\n")
     
    if (lines.length > 0) {
        // append the first chunk to the existing buffer
        line += lines[0]
         
        if (lines.length > 1) {
            // emit the current buffer
            emitter.emit(lineEvent,line);
 
            // go through the rest of the lines and emit them, buffering the last
            for (i=1;i<lines.length; i++) {
                if (i<lines.length) {
                    emitter.emit(lineEvent,lines[i]);
                } else {
                    line = lines[i];
                }
            }
        }
    }
});

上述操作会将全部数据块附加至行变量处，并在每一次发现新的换行符时触发“lineReady”事件。

处理完整的stdin数据

在全部来自stdin的数据被读取完成后，该流程将触发stdin.end事件。我们已经将全部数据收集到行缓冲区当中，这样我们只需要利用以下代码刷新最后一行数据：

// fires when stdin is completed being read
process.stdin.on('end', function() {
    emitter.emit(lineEvent,line);
});

每当新的内容行准备就绪时，我们都将利用以下代码将其排序至一个JSON对象当中：

try {
    obj = JSON.parse(line);
} catch (err) {
    process.stderr.write('Error Processing Line ' + line + '\n');
    process.stderr.write(err);
    return;
}

我们可以选择把复杂的JSON数据简化为普通输出结果，以供Hive JsonSerde进行加载，或者选择生成CSV或者XML数据来代替。

以Hadoop兼容格式写入数据

对于某些特定的MapReduce操作类型，我们需要确保其归约器能够获取到归属于特定类型的全部数据。为了实现这一目标，我们必须指定一个键值，并保证Hadoop在调用该归约器之前会首先对输出结果进行分类。在进行文本内容处理时，我们会利用由\t标签开头的字符串来表示这个值。

要执行存储或者移除方面的数据写入操作，我们需要利用process.stdout.write()向stdout实施写入。

制作可执行文件

Amazon EMR利用命令行语法调用的方式运行映射器与归约器，例如“./mapper.js”。因此，我们需要确保我们所构建的Node.js模块能够通过命令行实现调用。为达成这一目标，我们在映射器或者归约器文件的开头处添加一条标准“shebang”命令，这样它就能调用Node.js并运行脚本内容：

#!/usr/bin/env node

接下来，大家可以通过命令行调用的方式测试自己的映射器代码了（以下示例假定代码位于名为Mapper.js的文件当中）：

./mapper.js < input-file-path

部署与运行

在编写了自己的映射器与归约器之后，接下来我们将其传输至Amazon S3当中，而后利用Amazon EMR针对部分输入数据运行MapReduce。

以下示例讲解了如何利用Amazon EMR命令行执行各个步骤（参见http://aws.amazon.com/developertools/2264），不过大家也可以在Amazon EMR控制台（参见console.aws.amazon.com/elasticmapreduce）或者Amazon EMR API（参见http://docs.aws.amazon.com/ElasticMapReduce/latest/API/Welcome.html?r=8857）中利用命令实现同样的效果。我们将展示如何以自动方式利用AWS命令行工具运行该应用程序，但大家完全可以使用AWS Web Console或者AWS Data Pipeline完成同样的工作。我们可以使用--create-cluster命令启动一套新的Amazon EMR集群，同时利用以下代码启动该集群并捃行我们的Node.js bootstrap操作：

aws emr create-cluster --ami-version 3.3.1 --enable-debugging --visible-to-all-users
 --name MyNodeJsMapReduceCluster --instance-groups  InstanceCount=2,InstanceGroupType=CORE,InstanceType=m3.xlarge 
InstanceCount=1,InstanceGroupType=MASTER,InstanceType=m3.xlarge --
no-auto-terminate --enable-debugging --log-uri s3:///logs --
bootstrap-actions Path=s3://github-emr-bootstrap-
actions/node/install-nodejs.sh,Name=InstallNode.js --ec2-attributes 
KeyName=<my key pair>

这样我们就创建了一套始终启用的集群，其中包含配备3.3.1 AMI、双核心节点以及一个主节点，全部采用m3.xlarge实例类型。以上代码同时为指定存储桶设定了调试与日志记录机制，并通过bootstrap操作完成了Node.js的启动时安装。除此之外，代码中还使用了Amazon EC2密钥对，从而将SSH安全机制引入该Hadoop集群。

接下来，我们将添加Hadoop Streaming流程，旨在处理自己的输入数据。在以下代码中，大家需要把<my cluster ID>替换为自己的实际集群ID：

aws emr add-steps --cluster-id <my cluster ID> 
--steps Name=NodeJSStreamProcess,Type=Streaming

我们通过创建一套文件系统参考（利用—files参数）添加自己的映射器与归约器JavaScript文件，而后将该基础文件名通过-mapper与-reducer进行引用：

Args=--files,"s3://<path to mapper>/mapper.js\,s3://<path to 
reducer>/reducer.js",-mapper,mapper.js,-reducer,reducer.js

而后，我们添加该输入与输出文件的位置：

-input,s3://<path-to-input-files>,-output,s3://<path-to-output-files>

这样一来，我们就获得了如下完整命令行调用代码：

aws emr add-steps --cluster-id <my cluster ID> 
--steps Name=NodeJSStreamProcess,Type=Streaming,Args=--files,
"s3://<path to mapper>/mapper.js\,s3://<path to reducer>/reducer.js",
-input,s3://<path-to-input-files>,-output,s3://<
path-to-output-files>,-mapper,mapper.js,-reducer,reducer.js

大家只需要提供相应的时间量用于该流程运行，Hadoop集群不再需要其它迭代实现数据生成。请确保在运行上述示例时，大家在执行完成后及时关闭自己的集群。我们可以利用以下Amazon EMR命令完成集群关闭操作：

aws emr terminate-clusters --cluster-ids <my cluster ID>

总结

Node.js能够在实现MapReduce应用程序快速执行效果的同时，利用简洁的原生语法对高复杂性JSON数据加以处理。通过Amazon EMR配置选项，大家可以轻松运行基于Node.js的应用程序，并随时间推移或者输入数据量的增加提升其规模。

附录——映射/归约应用程序示例

以下MapReduce程序旨在以天为单位将推文内容输出为高复杂性JSON结构化数据。在本示例中，Twitter数据由DataSift（来自datasift.com）负责收集。我们去掉了其中的某些特殊字符，例如换行符与制表符，并将推文created_at字段输出为键。归约器随后根据日期对这部分数据加以排序，并输出推文的整体数量。

映射器

#!/usr/bin/env node
 
var events = require('events');
var emitter = new events.EventEmitter();
 
var line = '';
var lineEvent = 'line';
var dataReady = 'dataReady';
 
//移除全部控制字符，从而保证输出结果由纯文本内容构成
String.prototype.escape = function() {
    return this.replace('\n', '\\n').replace('\'', '\\\'').replace('\"', '\\"')
            .replace('\&', '\\&').replace('\r', '\\r').replace('\t', '\\t')
            .replace('\b', '\\b').replace('\f', '\\f');
}
 
//为此附加一套数组
Array.prototype.appendArray = function(arr) {
    this.push.apply(this, arr);
}
 
//数据完成后，将其写入至必要的输出通道
emitter.on(dataReady, function(arr) {
    var dateComponents = arr[9].split(' ');
    var d = [dateComponents[1],dateComponents[2],dateComponents[3]].join(' ');
     
    var interaction = {
        key_date : d,
        content: {
            objectId : arr[0],
            hash : arr[1],
            id : arr[2],
            author_id : arr[3],
            author_avatar : arr[4],
            author_link : arr[5],
            author_name : arr[6],
            author_username : arr[7],
            content : arr[8],
            created_at : arr[9],
            link : arr[10],
            schema_version : arr[11],
            source : arr[12]
        }
    };
 
    process.stdout.write(interaction.key_date + '\t' + JSON.stringify(interaction) + '\n');
});
 
//通过捕捉到的输入数据生成一个JSON对象
//而后生成所需的输出结果
emitter.on(lineEvent, function(l) {
    var obj;
 
    //通过input事件创建该JSON对象
    //如果无法创建，则丢弃该项目
    //
    // TODO在此生成一个例外以代替？
    if (!line || line == '') {
        return;
    }
     
    try {
        obj = JSON.parse(line);
    } catch (err) {
        process.stderr.write('Error Processing Line ' + line + '\n');
        process.stderr.write(err);
        return;
    }
     
    //为每个交互对象生成一个输出结果组
    for ( var i = 0; i < obj.interactions.length; i++) {
        //根据语法创建几个便捷对象
        var int = obj.interactions[i];
        var a = int.interaction.author;
         
        //提取我们需要保留的对象模型内容
        var output = [ obj.id, obj.hash, int.interaction.id, a.id,
                a.avatar, a.link, a.name, a.username,
                int.interaction.content.escape(), int.interaction.created_at,
                int.interaction.link, int.interaction.schema.version,
                int.interaction.source ];
         
        //当输出数组完成后触发事件
        emitter.emit(dataReady, output);
    }
});
 
//作用于每一次由stdin引发的数据块读取操作
process.stdin.on('data', function(chunk) {
    //新行中汇总并执行
    lines = chunk.split("\n")
     
    if (lines.length > 0) {
        //将第一套数据块添加至现有缓冲区中
        line += lines[0]
         
        if (lines.length > 1) {
            //执行当前缓冲内容
            emitter.emit(lineEvent,line);
 
            //推进行内剩余内容并加以执行，将最新内容纳入缓冲区 
            for (i=1; i<lines.length; i++) {
                if (i < lines.length) {
                    emitter.emit(lineEvent,lines[i]);
                } else {
                    line = lines[i];
                }
            }
        }
    }
});
 
//当stdin读取操作完成后触发
process.stdin.on('end', function() {
    emitter.emit(lineEvent,line);
});
 
//设置STDIN编码
process.stdin.setEncoding('utf8');
 
//恢复STDIN——默认暂停
process.stdin.resume();

归约器

#!/usr/bin/env node
 
var events = require('events');
var emitter = new events.EventEmitter();
 
var remaining = '';
var lineReady = 'lineReady';
var dataReady = 'dataReady';
 
var interactionSummary = {
    day : '',
    count : 0
};
 
//移除全部控制字符，从而保证输出结果由纯文本内容构成
String.prototype.escape = function() {
    return this.replace('\n', '\\n').replace('\'', '\\\'').replace('\"', '\\"')
            .replace('\&', '\\&').replace('\r', '\\r').replace('\t', '\\t')
            .replace('\b', '\\b').replace('\f', '\\f');
}
 
//为此附加一套数组
Array.prototype.appendArray = function(arr) {
    this.push.apply(this, arr);
}
 
//数据完成后，将其写入至必要的输出通道
emitter.on(dataReady, function(o) {
    if (o) {
        process.stdout.write(JSON.stringify(o) + '\n');
    }
});
 
//通过捕捉到的输入数据生成一个JSON对象
//而后生成所需的输出结果
emitter.on(lineReady,function(data) {   
    if (!data || data == '') {
        // null数据可能是一个关闭事件，意味着数据已经处理完毕
        emitter.emit(dataReady, interactionSummary);
        return;
    }
     
    try {
        obj = JSON.parse(data.split('\t')[1]);
    } catch (err) {
        process.stderr.write('Error Processing Line ' + data + '\n')
        process.stderr.write(err);
        return;
    }
 
    if (interactionSummary.day == '') {
        interactionSummary.day = obj.key_date;
        interactionSummary.count = 1;       
    } else {
        if (obj.key_date != interactionSummary.day) {
            //数组削减完成后触发事件
            emitter.emit(dataReady, interactionSummary);
            interactionSummary.day = obj.key_date;
            interactionSummary.count = 1;
        } else {
            interactionSummary.count += 1;
        }
    }
});
 
//作用于每一个从stdin处进行读取的数据块
process.stdin.on('data', function(chunk) {
    var capture = chunk.split('\n');
 
    for (var i=0;i<capture.length; i++) {
        if (i==0) {
            emitter.emit(lineReady,remaining + capture[i]);
        } else if (i<capture.length-1) {
            emitter.emit(lineReady,capture[i]);
        } else {
            remaining = capture[i];
        }
    }
});
 
//当stdin读取操作完成后触发
process.stdin.on('end', function() {
    emitter.emit(lineReady,remaining);
});
 
//恢复STDIN——默认为暂停
process.stdin.resume();
 
//设置STDIN编码
process.stdin.setEncoding('utf8');

运行示例

aws emr create-cluster --ami-version 3.3.1 --enable-debugging --visible-to-all-users 
--name MyNodeJsMapReduceCluster --instance-groups  InstanceCount=2,InstanceGroupType=CORE,InstanceType=m3.xlarge 
InstanceCount=1,InstanceGroupType=MASTER,InstanceType=m3.xlarge --
no-auto-terminate --enable-debugging --log-uri s3://<log 
bucket>/EMR/logs --bootstrap-actions Path=s3://github-emr-
bootstrap-actions/node/install-nodejs.sh,Name=InstallNode.js --
service-role EMR_DefaultRole --ec2-attributes KeyName=<my key 
pair>,InstanceProfile=EMR_EC2_DefaultRole

aws emr add-
steps --cluster-id  --steps 
Name=NodeJSStreamProcess,Type=Streaming,Args=--files,"s3://github-
aws-big-data-blog/aws-blog-nodejs-on-emr/scripts/sample-mapper.js
\,s3://github-aws-big-data-blog/aws-blog-nodejs-on-
emr/scripts/sample-reducer.js",-input,s3://github-aws-big-data-
blog/aws-blog-nodejs-on-emr/sample/tweets,-output,s3://<my output
 bucket>/node_sample,-mapper,mapper.js,-reducer,reducer.js

在上述代码中，<my output bucket>应被替代为我们希望创建输出结果的目标存储桶名称。执行完成后，预配置的输出存储桶及路径内将出现多个文件，其中包含整理得出的示例数据集中单一一天内出现的推文数量：

{"day":"14 Feb 2013","count":1071}

如果大家愿意提出一点意见或者建议，请在下方的评论栏中与我们分享。

原文链接：http://blogs.aws.amazon.com/bigdata/post/TxVX5RCSD785H6/Node-js-Streaming-MapReduce-with-Amazon-EMR

Java 企业级 Jakarta EE 11 发布 ejinxian Java java 开发语言 Jakarta EE 11 java EE 11
标志着企业级Java在简化开发、提升开发人员生产力和整体性能方面的进步。主要亮点包括：现代化的测试兼容性工具包(TCK)、全新JakartaData规范的引入、对现有规范的重大更新以及对最新JavaLTS版本的支持，使开发人员能够充分利用Java21中的增强功能，包括虚拟线程JakartaData在简化企业应用程序持久化逻辑方面迈出了重要一步。主要功能包括：BasicRepository：基础存储
GTID（Global Transaction Identifier，全局事务标识符）：MySQL 主从复制的核心机制心灵星图运维 mysql 数据库
GTID（GlobalTransactionIdentifier，全局事务标识符）是MySQL数据库在主从复制中引入的核心机制，用于唯一标识全局事务，简化复制管理和故障转移流程。其核心概念与工作机制如下：一、GTID的定义与组成基本结构GTID由两部分构成：source_id:transaction_id。source_id：即MySQL实例的唯一标识server_uuid（首次启动时生成，存储在
区块链知识总结——POS权益证明 The_Killer. 区块链
背景：pow由于其对资源的消耗而饱受争议。由此引入pos权益证明：posVSpow优缺点：1.节能2.pos是闭环生态，pow是开源生态。pos天然防范了51%攻击解释：pow之下，attacker可以在现实世界中购买矿机，来增加算力以达到51%attack目的，而pos下attacker必须购买更多的加密货币（相当于成为股东），才有发动attack的能力，但此时对币的开发者和早起的矿工其实是受益
第 2 部分 - 请求与响应 pythondjango
从这里开始，我们将深入介绍REST框架的核心内容。首先，让我们来了解一下几个基础且重要的构建模块。请求对象REST框架引入了一个Request对象，它扩展了普通的HttpRequest，并提供了更灵活的请求解析功能。Request对象的核心功能是request.data属性，它类似于request.POST，但在处理WebAPI时更为实用。request.POST#仅处理表单数据。仅适用于'POS
git rebase -i 详解张紫娃 GIT git elasticsearch 大数据
gitrebase-i操作指令含义Git信息（引入年份/最低版本）pick§使用该提交，rebase时用来保留某个提交原样不变2007/Gitv1.5.4drop(d)删除该提交2007/Gitv1.5.4reword®修改提交信息2007/Gitv1.5.4edit(e)修改提交内容（可暂停rebase来修改）2007/Gitv1.5.4squash(s)合并到前一个提交（保留提交信息）,清理历
React - 错误边界（Error boundary）风轻轻~ #React__基础 react.js
React-错误边界（Errorboundary）一.理解二.使用1.使用方式2.使用案例错误边界：https://zh-hans.reactjs.org/docs/error-boundaries.html一.理解部分UI的JavaScript错误不应该导致整个应用崩溃，为了解决这个问题，React16引入了一个新的概念——错误边界。错误边界是一种React组件，这种组件可以捕获发生在其子组件树
Tailwind CSS自定义用法 TE-茶叶蛋面试复习系列 css css 前端
文章目录前言✅一、集成TailwindCSS到React项目1.安装依赖2.配置`tailwind.config.js`3.创建全局样式文件（如`src/index.css`）@tailwindbase;@tailwindcomponents;@tailwindutilities;4.在`main.tsx`或`main.jsx`中引入样式✅二、自定义样式方式汇总1.`theme.extend`自定
番外篇 | SEAM-YOLO：引入SEAM系列注意力机制，提升遮挡小目标的检测性能小哥谈 YOLOv8：从入门到实战 YOLO 深度学习人工智能机器学习计算机视觉神经网络
前言：Hello大家好，我是小哥谈。SEAM(Squeeze-and-ExcitationAttentionModule)系列注意力机制是一种高效的特征增强方法，特别适合处理遮挡和小目标检测问题。该机制通过建模通道间关系来自适应地重新校准通道特征响应。在遮挡小目标检测中的应用优势包括：1）通道注意力增强：SEAM通过全局平均池化捕获通道级全局信息，帮助网络在遮挡情况下仍能关注关键特征。2）多尺度特
保护生产中 Node.js 应用程序安全的 15 项最佳实践梦玄海 node.js 安全人工智能分布式音视频 AI编程低代码
为什么应该构建安全的Node.js应用程序？构建安全的Node.js应用程序非常重要，至少有以下三个原因：保护用户数据：您的应用程序可能会处理敏感的用户信息，如个人信息、登录凭证、支付数据或机密的业务见解。如果不能保护这些数据，您可能会被隐私监管机构处以数百万美元的罚款。通过实施强大的安全措施，您可以保护用户数据并避免法律问题。保护应用程序功能：安全漏洞可能会损害后端提供的功能。攻击者可能会利用弱
AI生成代码安全审计：从AST逆向到对抗样本生成梦玄海人工智能安全
引言随着Codex、Copilot等AI代码生成工具的普及，开发效率显著提升的同时，也引入了新型安全风险：模型生成的代码可能隐含漏洞（如SQL注入、XSS）、逻辑错误，或被恶意样本“投毒”。传统的静态扫描工具（如SonarQube）难以覆盖AI模型的上下文语义逻辑，亟需结合程序分析与AI对抗技术进行深度审计。本文将从AST逆向工程切入，深入探讨如何通过对抗样本检测AI生成代码的脆弱性。一、核心挑战
揭秘MySQL索引下推（ICP）的底层原理与高并发场景性能调优 Minxinbb 数据库 mysql 数据库 dba
引言在千万级数据量的OLTP场景中，索引下推（IndexConditionPushdown,ICP）作为MySQL5.6引入的核心优化技术，可将特定场景的查询性能提升10倍以上。本文将从InnoDB存储引擎的索引结构出发，结合B+树遍历原理，深入解析ICP的工作机制，并通过压力测试对比验证优化效果。一、索引下推的核心原理剖析1.1传统索引查询的瓶颈未启用ICP时的查询流程（以复合索引(a,b,c)
计算机组成原理超详细DRAM集中刷新、分散刷新，异步刷新
在一个存取周期内，我们可以只进行读写操作，也可以只进行刷新操作；同样也可以前半段读写后半段刷新。但是对于如何设置DRAM刷新，那么就引入了下面的三种刷新方式1.集中刷新：统一分配时间来刷新DRAM，对于刷新间隔为2ms，内部储存单元为128*128的DRAM。若存取周期是0.5us，那么需要分配128*0.5也就是64us的时间来统一刷新每一行。这部分的时间称为死时间，此时不能进行读写操作。我们把
学习日记-spring-day37-6.25 永日45670 学习日记学习 spring java
知识点：1.使用utillist进行配置知识点核心内容重点Spring框架中utl名称空间创建List通过utl名称空间创建并管理集合对象，实现数据复用utllist与普通list赋值的区别;名称空间引入方法无参构造器使用规则当类中没有其他构造器时，默认无参构造器可不写；若有其他构造器则必须显式定义无参构造器构造器覆盖机制;显式定义的必要性XML名称空间引入使用alt+enter自动引入或手动添加
MapReduce概述 Tate小白大数据学习 mapreduce
1、MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架，是用户开发“Hadoop的数据分析应用”的核心框架。MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。Map负责“分”，即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算，彼此间几乎没有依赖关系。Reduc
47、文件系统操作与管理 nnn11 C++编程精华：从基础到高级 C++文件系统 std::filesystem
文件系统操作与管理1.文件系统的概述文件系统是操作系统中用于组织、管理和存储文件的数据结构。在C++中，文件系统的操作主要依赖于标准库中的头文件，该库提供了丰富的API来处理文件和目录。通过std::filesystem命名空间，开发者可以轻松地进行文件路径解析、目录遍历、文件属性查询等操作，极大地提高了代码的可读性和可维护性。2.库简介C++17引入了库，使得文件系统操作更加简便和高效。std:
【头歌】MapReduce基础实战答案 Seven_Two2 头歌大数据实验答案 c#开发语言
本专栏已收集大数据所有答案第1关：成绩统计编程要求使用MapReduce计算班级每个学生的最好成绩，输入文件路径为/user/test/input，请将计算后的结果输出到/user/test/output/目录下。答案：需要先在命令行启动HDFS#命令行start-dfs.sh再在代码文件中写入以下代码#代码文件importjava.io.IOException;importjava.util.S
ASPICE评估：汽车软件质量的守护神亚远景aspice 汽车
随着汽车行业的快速发展，车载软件系统的复杂性和重要性日益凸显。为了确保汽车软件的质量和安全性，汽车行业引入了ASPICE（AutomotiveSPICE）评估作为评价软件开发团队研发能力的重要工具。本文将详细介绍ASPICE评估的概念、过程及其在汽车软件开发中的重要作用。一、ASPICE评估概述ASPICE，即“汽车软件过程改进及能力评定”，是汽车行业用于评价软件开发团队研发能力水平的模型框架。它
如何保证软件质量？汽车软件基于模型开发的十个问题与质量工具推荐 MESMarketing 自动驾驶
如何保证软件质量？汽车软件基于模型开发的十个问题与质量工具推荐基于模型的软件开发（MBD）在20世纪90年代兴起，当时Simulink®和Matrix®等工具正在从学术或研究领域过渡到生产支持领域。MBD在1999年引入高效自动代码生成后，借助EmbeddedCoder®和TargetLink®等工具迅速扩展。随着电子电器系统日趋复杂，有别于传统的软件开发，基于模型的软件开发成为自动化行业贴别是汽
使用POI导入Excel文件数据处理生活压力大 Java开发 poi java excel
前言最近项目中做了一个Excel模板导入功能，需要将文件中的数据获取后保存，优于Excel文件中表头多行，数据比较凌乱所以采用了POI进行导入。引入jar包我的是maven项目，所以直接在pom文件中引入相关依赖即可，我使用的jar包为3.16：org.apache.poipoi3.16org.apache
【Linux 从基础到进阶】IPv6配置与管理爱技术的小伙子 Linux从基础到进阶 linux 运维服务器
IPv6配置与管理引言随着互联网地址资源的不断消耗，IPv6作为IPv4的继任者，已逐渐成为网络中的主流协议。相比IPv4，IPv6不仅提供了更为丰富的地址空间，还引入了多种新功能，如自动配置、安全性增强以及改进的路由效率。对于系统管理员来说，掌握IPv6的配置与管理至关重要。本文将详细介绍如何在CentOS和Ubuntu系统中进行IPv6的配置与管理，涵盖基本的网络配置、地址分配、路由配置以及常
七、SPringCloud中间件 @平常心～～～ spring cloud 中间件 spring
1.Nacos(配置数据库)注册中心配置中心注册中心：服务治理:引入注册中心(将服务注册到注册中心)1.注册中心:存的是服务提供者的服务,和可以被推送的服务2.服务消费者:从注册中心订阅服务,既可以拉取服务,也可以推送变更3.服务提供者:向注册中心提供服务的端口号,IP等,心跳续约:隔一段时间会向注册中心推送新的服务注册中心挂断,不会立即断开连接,除非服务提供者改变IP,有缓存用户如何挑选实例(服
Apache POI导入导出excel文件实战小白de成长之路 Java相关 apache excel 前端
文章目录前言技术栈1、引入依赖2、导入代码实现3、导出代码实现3.1、准备导出文件模板3.2、导出代码实现4、代码实现解释5、常见问题前言这两天公司项目业务提出需求，要求在前端上传excel文件然后解析展示，因此写篇文章记录一下实现。技术栈springboot2.6.61、引入依赖maven格式：org.apache.poipoi3.14org.apache.poipoi-ooxml3.142、导
鸿蒙 Swiper 组件解析：轮播交互与动画效果全指南谢道韫689 鸿蒙自定义组件 harmonyos 交互华为
一、引言：Swiper——动态轮播场景的核心解决方案在鸿蒙应用开发中，Swiper组件作为构建滑动轮播界面的核心容器，广泛应用于图片轮播、广告展示、多页内容切换等高频交互场景。自API7版本引入以来，其通过标准化的属性配置、丰富的动画效果及跨设备适配能力，成为开发者实现丝滑轮播体验的首选方案。从电商平台的首页Banner到新闻客户端的头条轮播，Swiper以简洁的接口实现了复杂的轮播逻辑，本文将系
航天VR赋能，无人机总测实验舱开启高效新篇 ykjhr_3d vr 无人机
(一)沉浸式培训体验在传统的无人机培训中，操作人员主要通过理论学习和简单的模拟操作来掌握技能。但这种方式存在很大局限性，难以让操作人员真正感受无人机在复杂环境下的运行状态。而航天VR技术引入到VR无人机总测实验舱后，彻底改变了这一局面。操作人员戴上VR设备，就能瞬间“置身”于VR无人机总测实验舱的虚拟场景中，这里的一切都无比逼真，仿佛真实存在。在虚拟场景里，操作人员可以全方位、多角度地观察无人机的
Redis——》双写一致性
思考：项目为什么要用redis?redis配置集群了吗？怎么配的？几台机器？单台redis的压力多少？一、我们为什么引入redis？一定要根据业务场景来，首先分析读写情况，再来考虑要不要引入redis读少写多：不要引用redis读多写多：适当引用redis（可以减少mysql数据库压力，如果不引用，可以使用数据库的主从复制，读写分离）读少写少：不要引用redis（根本没有必要）读多写少：可以引用r
【AI成长会】针对高并发场景下基于用户ID的聊天接口优化方案，包含5个核心方法
以下是针对高并发场景下基于用户ID的聊天接口优化方案，包含5个核心方法、对比表格及权威来源：5大优化方案1.索引优化机制：对user_id字段添加B+树索引，联合查询字段使用覆盖索引（如(user_id,timestamp)）优化点：减少全表扫描，提升索引命中率适用场景：基础优化，所有规模均需2.缓存层引入（Redis/Memcached）机制：使用Redis存储用户最近聊天记录（Key:user
《三生原理》如何优化注意力机制？
AI辅助创作：《三生原理》通过融合《周易》哲学的数理模型，对注意力机制进行了多维度优化，主要体现在动态计算重构、位置编码革新与训练效率提升三方面，具体路径如下：‌一、动态筛网替代传统注意力计算‌‌三级筛网分层过滤‌‌初级筛网‌：基于素数参数化公式（p=3(2n+1)+2(2n+m+1)）预判无效特征交互，压缩注意力计算范围，减少多头冗余计算45%。‌中级判据‌：引入五行属性权重动态分配机制，依据模
Maven 如何引入外部依赖jar包
1、在src目录下创建libs目录，并将需要引入的jar包放到lib目录下2、然后添加以下依赖到pom.xml文件中com.cryptoFrontcryptoFrontsystem1.0.0${project.basedir}/libs/cryptofront-2.1.8.jar3、点击idea中项目结构3、选择库，点击新建项目库，找到libs位置添加并应用保存4、此时看到这里就可以看出jar包就
一个非常好用的快速生成数据库表映射工具-Screw qq_21526409 数据库 java
将数据库的表结构生成文档需要引入的依赖org.springframework.bootspring-boot-starter-jdbcorg.springframework.bootspring-boot-starter-testtestcn.smallbun.screwscrew-core1.0.5com.zaxxerHikariCP5.1.0测试代码importcn.smallbun.scre
将Python Tkinter程序转换为手机可运行的Web应用 - 详细教程随机森林404 python 智能手机前端
前言作为一名Python开发者，你可能已经使用Tkinter创建了一些桌面GUI应用。但是如何让这些应用也能在手机上运行呢？本教程将详细介绍如何将基于Tkinter的Python程序转换为手机可访问的Web应用，让你的应用随时随地可用！一、为什么需要转换？Tkinter是Python的标准GUI库，但它主要针对桌面环境。移动设备(Android/iOS)上无法直接运行Tkinter程序，主要原因有
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu