摘要
作为一个一直用java来写后端的程序员用NodeJS来写后台,实在不是很爽。这里记下这两个月的NodeJS学习所遇之坑,与java转NodeJS的同仁共勉。学习时间不长,若有理解错误,望指正。
一.JS基本
exports,module.exports
- exports 就是module.exports的引用
- 在module 被计算之前,会将module.exports的值赋给exports
- 当module.exports赋值之后,再对exports改值,不会影响module.exports的值,而外部
require module的时候,如果module.exports有定义,调用的是module.exports的值。
eg1.
module.exports.hello = true; // Exported from require of module
exports = { hello: false }; // Not exported, only available in the module
eg2.
module.js
module.exports = 'a';
exports.B = 'b';
call.js
var module = require('module');
console.log(module.B);
//undefined
- exports 就是传统的module实例,可以exports 变量,也可以exports 方法,调用的时候都一样,通过
instance.xxx来调用
eg. module.js
exports.A = 'a'
exports.add = function add(a, b){
return a+b;
}
call.js
var module = require('module');
module.A;
module.add(xx,xx);
- module.exports可以将module,exports成任何合法的js 类型,boolean,JSON,function都可以。
从这点上说,就不能将javascript中的module类比成java中的类/实例。
module.exports = function (a, b) {
return a + b;
}
import 某个module的属性
与直接import不同
import { test } from ‘xxx’
issue
class 与instance
js中并没有class,一切皆为对象。面向对象的实现是通过prototype来实现的。
例如一般在某个文件中调用某个js文件,就是在文件开始部分require,然后在文件中
各处引用。而这点与java不同,java是首先import,然后具体用的时候需要new 一个instance再使用
js中require 以后直接使用。不需要new instance。所以各处用的都是同一个instance。
如果想new一个object,创建新的instance,则需要使用原型。这样每个new出来的对象就有对应的
原型方法了。
eg.
test.js
// 类似于构造函数
function Test() {
}
Test.prototype.add = function (a,b) {
return a+b;
};
module.exports = Test;
call.js
require Test from 'test';
function sub(){
var test1 = new Test();
test1.add();
}
作用域
对于方法而言,js没有类似于java的那么强的域控制public,protected,private
就分内部与外部,只在函数内部使用的就不要export出去。
二.异步回调
js 代码写起来和java代码最大的不同就是回调了。
java代码基本消灭了随意跳转的goto。阅读代码块或者写代码块时基本就是按照从上
到下的顺序即可。因为java代码都是同步执行的。而JS很多都是异步执行,所以如果你想
你的逻辑是顺序执行的话,必须等待异步执行返回结果后,再去执行下面的代码。因为js
方法大多是非阻塞。
—-2017.3.14更新———-
其实这代表了两种不同的并发处理方式,一种是java的,基于线程的并发,一个task一个线程。
写起来也是顺序执行的。但是task增多,多个线程之间切换代价昂贵,可能会导致吞吐量下降。
而nodejs,则是基于事件的并发,单线程处理事件,每个并发流实现为一个有限状态机。所以需要回调。应用直接控制。但是当并发负载增加的时候,吞吐量饱和响应时间线性增长
还有一种的话就是之前介绍的cassandra实现的SEDA模型
eg.实现查mongo数据库
java code
MongoClient client = new MongoClient(url);
Collection coll = client.getCollection('test');
ResultSet rs = coll.find({});
而js则是
MongoClient.connect(url, function(err, db) {
//回调,等待连接成功,才能执行下一步。
if (err) {
callback(err);
}
var coll = db.collection('test');
coll.find({name:"mike"}).toArray(function(err, results) {
console.log(results);
db.close();
});
});
三.内存溢出
NodeJs使用google V8来管理内存,V8会将js代码编译为本地代码,然后执行它。
V8会按需进行内存的分配和释放。和JVM差不多了。将内存区域分区,
- 代码区域
- 栈
值类型的数据,内部变量,控制程序的指针。 - 堆
保存引用类型(对象,字符串,闭包)
在做mongodb数据大量插入的时候遇到过一次内存溢出的问题,所以需要分析溢出原因,
java中一般是dump处文件,然后用其他工具分析对象。NodeJs也类似。
var heapdump = require('heapdump');
heapdump.writeSnapshot();
然后在chrome中的Profile工具来分析溢出对象。但是实际中此效果不好,原因是chrome的内存不够大(可能需要调整浏览器内存大小),另外结果不是很直观。还可以使用util包中输出内存占用
var util = require('util');
console.log(util.inspect(process.memoryUsage()));
内存溢出原因:
在上面提到过在js中基本都是回调函数,mongo插入同样也是。使用mongo.insertMany(array)来批量插入提高性能。同时充分利用异步特点,使用async.each来控制,模拟多线程并发。但是这边就存在一个问题,有经验的老手就能看出来了,插入的数据array占用的内存什么时候释放。mongo.insertMany调用开始,到真正插入到db中需要一定时间。插入上千万条数据的,内存回收不及时的话肯定是要溢出的。所以要加一层并发控制,比如说以10万条数据为内层并发,这些数据的插入是并发操作的,无序的,等这一批数据插入成功后,再进行下一批数据插入,释放内存。
四.打包
java中依赖其他包,使用jar包。build工具可以用maven,gradle。
nodejs中依赖其他包,使用module.使用npm来构建
在package.json中的 files属性中定义要打包的文件
“files”: [
“src/publish”,
],
在main属性中定义main文件
“main”: “src/index.js”,
使用npm publish命令到repository。如果是本地的调用,使用npm pack 打包
在其他project中使用 npm install -s $PATH/publish-service-0.0.1.tgz添加引用
五.参考
http://www.hacksparrow.com/node-js-exports-vs-module-exports.html
https://cnodejs.org/topic/55accdeab4ab1d7d02bf0d8c
http://wwsun.github.io/posts/understanding-nodejs-gc.html