node.js和npm介绍和使用

node简介

node.js是一个基于Chorme V8引擎的javascript运行环境,如浏览器也是js的运行环境,node也是js的运行环境,但是将js代码的应用场景扩展到了服务器端。node.js使用了一个事件驱动,非阻塞式I/O模型,使其轻量又高效。

在Node上运行的JavaScript相比其他后端开发语言有何优势?

  JavaScript是单线程执行,只能进行异步IO操作,借助JavaScript天生的事件驱动机制加V8高性能引擎,使编写高性能Web服务轻而易举。

  JavaScript语言本身是完善的函数式语言,在Node环境下,通过模块化的JavaScript代码,加上函数式编程,并且无需考虑浏览器兼容性问题,直接使用最新的ECMAScript 6标准,可以完全满足工程上的需求。

为什么要用node.js?

  总的来说,Node.js 适合以下场景:

  1. 实时性应用,比如在线多人协作工具,网页聊天应用等。
  2. 以 I/O 为主的高并发应用,比如为客户端提供 API,读取数据库。
  3. 流式应用,比如客户端经常上传文件。
  4. 前后端分离。

  实际上前两者可以归结为一种,即客户端广泛使用长连接,虽然并发数较高,但其中大部分是空闲连接。

  Node.js 也有它的局限性,它并不适合 CPU 密集型应用,比如人工智能方面的计算,视频、图片的处理等。

其他概念

概念参考他人文章

并发

  与客户端不同,服务端开发者非常关心的一项数据是并发数,也就是这台服务器最多能支持多少个客户端的并发请求。早年的 C10K 问题就是讨论如何利用单台服务器支持 10K 并发数。当然随着软硬件性能的提高,目前 C10K 已经不再是问题,我们开始尝试解决 C10M 问题,即单台服务器如何处理百万级的并发。

  在 C10K 提出时,我们还在使用 Apache 服务器,它的工作原理是每当有一个网络请求到达,就 fork 出一个子进程并在子进程中运行 PHP 脚本。执行完脚本后再把结果发回客户端。

  这样可以确保不同进程之间互不干扰,即使一个进程出问题也不影响整个服务器,但是缺点也很明显:进程是一个比较重的概念,拥有自己的堆和栈,占用内存较多,一台服务器能运行的进程数量有上限,大约也就在几千左右。

虽然 Apache 后来使用了 FastCGI,但本质上只是一个进程池,它减少了创建进程的开销,但无法有效提高并发数。

  Java 的 Servlet 使用了线程池,即每个 Servlet 运行在一个线程上。线程虽然比进程轻量,但也是相对的。 有人测试过 ,每个线程独享的栈的大小是 1M,依然不够高效。除此以外,多线程编程会带来各种麻烦,这一点想必程序员们都深有体会。

  如果不使用线程,还有两种解决方案,分别是使用协程(coroutine)和非阻塞 I/O。协程比线程更加轻量,多个协程可以运行在同一个线程中,并由程序员自己负责调度,这种技术在 Go 语言中被广泛使用。而非阻塞 I/O 则被 Node.js 用来处理高并发的场景。

非阻塞 I/O

  这里所说的 I/O 可以分为两种: 网络 I/O 和文件 I/O,实际上两者高度类似。 I/O 可以分为两个步骤,首先把文件(网络)中的内容拷贝到缓冲区,这个缓冲区位于操作系统独占的内存区域中。随后再把缓冲区中的内容拷贝到用户程序的内存区域中。

  对于阻塞 I/O 来说,从发起读请求,到缓冲区就绪,再到用户进程获取数据,这两个步骤都是阻塞的。

  非阻塞 I/O 实际上是向内核轮询,缓冲区是否就绪,如果没有则继续执行其他操作。当缓冲区就绪时,讲缓冲区内容拷贝到用户进程,这一步实际上还是阻塞的。

I/O 多路复用技术是指利用单个线程处理多个网络 I/O,我们常说的 select 、 epoll 就是用来轮询所有 socket 的函数。比如 Apache 采用了前者,而 Nginx 和 Node.js 使用了后者,区别在于后者效率更高。由于 I/O 多路复用实际上还是单线程的轮询,因此它也是一种非阻塞 I/O 的方案。

  异步 I/O 是最理想的 I/O 模型,然而可惜的是真正的异步 I/O 并不存在。 Linux 上的 AIO 通过信号和回调来传递数据,但是存在缺陷。现有的 libeio 以及 Windows 上的 IOCP,本质上都是利用线程池与阻塞 I/O 来模拟异步 I/O。

网络 I/O

  Node.js 确实可以在单线程中处理大量的并发请求,但这需要一定的编程技巧。总之,在利用 Node.js 编程时,任何耗时操作一定要使用异步来完成,避免阻塞当前函数。因为你在为客户端提供服务,而所有代码总是单线程、顺序执行。

文件 I/O

  异步是为了优化体验,避免卡顿。而真正节省处理时间,利用 CPU 多核性能,还是要靠多线程并行处理。

  实际上 Node.js 在底层维护了一个线程池。之前在基础概念部分也提到过,不存在真正的异步文件 I/O,通常是通过线程池来模拟。线程池中默认有四个线程,用来进行文件 I/O。

  需要注意的是,我们无法直接操作底层的线程池,实际上也不需要关心它们的存在。线程池的作用仅仅是完成 I/O 操作,而非用来执行 CPU 密集型的操作,比如图像、视频处理,大规模计算等。

  如果有少量 CPU 密集型的任务需要处理,我们可以启动多个 Node.js 进程并利用 IPC 机制进行进程间通讯,或者调用外部的 C++/Java 程序。如果有大量 CPU 密集型任务,那只能说明选择 Node.js 是一个错误的决定。

事件循环

  在 Node.js 中存在一个事件循环(Event Loop)。

  一次完整的 Event Loop 也可以分为多个阶段(phase),依次是 poll、check、close callbacks、timers、I/O callbacks 、Idle。

由于 Node.js 是事件驱动的,每个事件的回调函数会被注册到 Event Loop 的不同阶段。比如 fs.readFile 的回调函数被添加到 I/O callbacks, setImmediate 的回调被添加到下一次 Loop 的 poll 阶段结束后, process.nextTick() 的回调被添加到当前 phase 结束后,下一个 phase 开始前。

  不同异步方法的回调会在不同的 phase 被执行,掌握这一点很重要,否则就会因为调用顺序问题产生逻辑错误。

  Event Loop 不断的循环,每一个阶段内都会同步执行所有在该阶段注册的回调函数。这也正是为什么我在网络 I/O 部分提到,不要在回调函数中调用阻塞方法,总是用异步的思想来进行耗时操作。一个耗时太久的回调函数可能会让 Event Loop 卡在某个阶段很久,新来的网络请求就无法被及时响应。

由于本文的目的是对 Node.js 有一个初步的,全面的认识。就不详细介绍 Event Loop 的每个阶段了。

数据流

  使用数据流的好处很明显,生活中也有真实写照。举个例子,老师布置了暑假作业,如果学生每天都做一点(作业流),就可以比较轻松的完成任务。如果积压在一起,到了最后一天,面对堆成小山的作业本,就会感到力不从心。

  Server 开发也是这样,假设用户上传 1G 文件,或者读取本地 1G 的文件。如果没有数据流的概念,我们需要开辟 1G 大小的缓冲区,然后在缓冲区满后一次性集中处理。

如果是采用数据流的方式,我们可以定义很小的一块缓冲区,比如大小是 1Mb。当缓冲区满后就执行回调函数,对这一小块数据进行处理,从而避免出现积压。

实际上 request 和 fs 模块的文件读取都是一个可读数据流。

总结

  对于高并发的长连接,事件驱动模型比线程轻量得多,多个 Node.js 进程配合负载均衡可以方便的进行拓展。因此 Node.js 非常适合为 I/O 密集型应用提供服务。但这种方式的缺陷就是不擅长处理 CPU 密集型任务。

node运行环境的搭建

node安装

node安装地址:下载 | Node.js 中文网

可以根据不同平台系统选择你需要的 Node.js 版本安装包。

node.js和npm介绍和使用_第1张图片

 下载好后安装程序,一路默认即可,注意安装目录不能是中文

若要测试node是否安装成功,可以使用win+R快捷键输入cmd或win10中的powershell

在cmd工具中,输入node -v即可查看node版本,如果能够显示版本号,说明node安装成功

node.js和npm介绍和使用_第2张图片

 在多个项目同时开发时,由于项目时间不同,我们会遇到不同项目所支持的node.js版本不一致的情况,导致运行项目时产生冲突。可以使用gnvm-node.js多版本管理器,来自由切换和管理我们需要的不同版本node。关于gnvm介绍可查看下方链接。gnvm-node.js多版本管理器_每天都要进步哦的博客-CSDN博客_gnvm

npm

安装node后,我们就可以使用npm了,npm的全称是Node Package Manager,是一个node.js包管理和分发工具,也是JavaScript运行时环境Node.js的默认包管理器,已经成为了非官方的发布Node模块(包)的标准,用于 Node.js 包的发布、传播、依赖控制。npm 提供了命令行工具,使你可以方便地下载、安装、升级、删除包,也可以让你作为开发者发布并维护包。

npm功能介绍

npm 是随同 Node.js 一起安装的包管理工具,能解决 Node.js 代码部署上的很多问题,常见的使用场景有以下几种:

    允许用户从 npm 服务器下载别人编写的第三方包到本地使用。
    允许用户从 npm 服务器下载并安装别人编写的命令行程序到本地使用。
    允许用户将自己编写的包或命令行程序上传到 npm 服务器供别人使用。

常用的npm命令

  • npm -v:查看npm版本。
  • npm init:初始化后会出现一个package.json配置文件。可以在后面加上-y ,快速跳过问答式界面。
  • npm install:会根据项目中的package.json文件自动下载项目所需的全部依赖。
  • npm install 包名 --save-dev(npm install 包名 -D):安装的包只用于开发环境,不用于生产环境,会出现在package.json文件中的devDependencies属性中。
  • npm install 包名 --save(npm install 包名 -S):安装的包需要发布到生产环境的,会出现在package.json文件中的dependencies属性中。
  • npm list:查看当前目录下已安装的node包。
  • npm list -g:查看全局已经安装过的node包。
  • npm --help:查看npm帮助命令。
  • npm update 包名:更新指定包。
  • npm uninstall 包名:卸载指定包。
  • npm config list:查看配置信息。
  • npm 指定命令 --help:查看指定命令的帮助。
  • npm info 指定包名:查看远程npm上指定包的所有版本信息。
  • npm config set registry https://registry.npm.taobao.org: 修改包下载源,此例修改为了淘宝镜像。
  • npm root:查看当前包的安装路径。
  • npm root -g:查看全局的包的安装路径。
  • npm ls 包名:查看本地安装的指定包及版本信息,没有显示empty。
  • npm ls 包名 -g:查看全局安装的指定包及版本信息,没有显示empty。

cnpm

因为npm安装插件是从国外服务器下载,受网络的影响比较大,淘宝npm镜像是一个完整npmjs.org镜像,你可以用此代替官方版本(只读),同步频率目前为 10分钟 一次以保证尽量与官方服务同步。

你可以使用淘宝定制的cnpm(gzip压缩支持)命令行工具代替默认的npm:

npm install -g cnpm --registry=https://registry.npm.taobao.org

安装完成后,输入cnpm -v,即可检查是否安装成功 

node.js和npm介绍和使用_第3张图片

使用命令时,将cnpm代替npm即可

你可能感兴趣的:(前端开发,大数据)