信徒favor

【操作系统+Linux】吐血整理-操作系统+Linux合集

文章目录

操作系统
- - - 用户态和内核态
    - Linux中的虚拟内存和物理内存
    - Linux的kill命令（-9信号的作用）
    - 匿名管道使用限制
    - 共享内存的实现方法
  - 日志系统
  - - 管道涉及的数据拷贝
- 1、请你说一下进程和线程的区别？
- 2、什么是临界资源？什么是临界区？
- 3、谈一谈操作系统的地址转化
- 4、请你说一下OS缺页置换算法
- 5、请你说一说死锁发生的条件以及如何解决死锁
- 6、系统调用和普通函数的区别
- 7、操作系统中进程间通信方式
- 8、操作系统中的PV指的是什么
- 9、多进程和多线程的优缺点比较
- 10、虚拟内存和物理内存怎么对应？
- 11、操作系统的缺页异常
- 12、vfork和fork
- 13、谈谈并发与并行
- 14、互斥锁、读写锁、自旋锁
- 15、僵尸进程，孤儿进程
- 16、系统调用的具体过程
- 17、send和recv的底层过程
- 18、实模式和保护模式的区别
- 19、几种常用的线程模型
- 20、编译的链接详细过程
- 21、静态链接和动态链接
- 22、如何解决读写锁中存在的写饥饿问题
- 23、操作系统中的多级缓存
- 24、TLB缓存页表机制
Linux
- 1、CPU负载和CPU利用率的区别是什么？
- 2、那如果CPU负载很高，利用率却很低该怎么办？
- 3、那如果负载很低，利用率却很高呢？
- 4、那如果CPU使用率达到100%呢？怎么排查？
- 5、说说常见的Linux命令把？
- 6、性能指标有哪些？
- 7、Linux下的五种IO模型
- 8、谈谈Linux虚存管理和虚拟地址空间
- 9、Linux中的文件系统
- 10、Linux中软链接和硬链接的区别？
- 11、谈谈Linux线程实现方式
- 12、Linux下的零拷贝技术

操作系统

用户态和内核态

从图上我们可以看出来通过系统调用将Linux整个体系分为用户态和内核态（或者说内核空间和用户空间）。那内核态到底是什么呢？其实从本质上说就是我们所说的内核，它是一种特殊的软件程序，特殊在哪儿呢？控制计算机的硬件资源，例如协调CPU资源，分配内存资源，并且提供稳定的环境供应用程序运行。

用户态就是提供应用程序运行的空间，为了使应用程序访问到内核管理的资源例如CPU，内存，I/O。内核必须提供一组通用的访问接口，这些接口就叫系统调用。

其实用一句话就能概括：它们权限不同。用户态的进程能够访问的资源受到了极大的控制，而运行在内核态的进程可以“为所欲为”。一个进程可以运行在用户态也可以运行在内核态，那它们之间肯定存在用户态和内核态切换的过程。打一个比方：C库接口malloc申请动态内存，malloc的实现内部最终还是会调用brk（）或者mmap（）系统调用来分配内存。

那为问题又来了，从用户态到内核态到底怎么进入？只能通过系统调用吗？还有其他方式吗？

从用户态到内核态切换可以通过三种方式：

系统调用，这个上面已经讲解过了，在我公众号之前的文章也有讲解过。其实系统调用本身就是中断，但是软件中断，跟硬中断不同。
异常：如果当前进程运行在用户态，如果这个时候发生了异常事件，就会触发切换。例如：缺页异常。
外设中断：当外设完成用户的请求时，会向CPU发送中断信号。

Linux中的虚拟内存和物理内存

操作系统有虚拟内存与物理内存之分。在虚拟内存出现之前，程序寻址用的都是物理地址，因此程序能寻址的范围是有限的，具体程序可以寻址的范围有多大取决于CPU的地址线条数。比如在32位平台下，寻址的范围是2^32也就是4G，并且这是固定的，如果没有虚拟内存，且每次开启一个进程都分配出来4G的物理内存，就会出现很多问题：

· 因为物理内存是有限的，当有多个进程要执行的时候，对每个进程都要分配4G内存，很显然你内存若小一点，这很快就分配完了，于是没有得到分配资源的进程就只能等待。当一个进程执行完后，再将等待的进程装入内存。这种频繁的装入内存的操作是很没效率的。

· 由于指令都是直接访问物理内存的，那么进程就可以修改其他进程的数据，甚至会修改内核地址空间的数据，这是我们不想看到的。

· 因为内存是随机分配的，所以程序运行的地址也是不正确的。

为了解决上述问题，于是就出现了虚拟内存。

关系：一个进程运行时会被分配4G的虚拟内存。进程有了虚拟内存后，每个进程都认为自己拥有4G的内存空间，当然这只是每个进程认为的。但实际上，虚拟内存对应的实际物理内存，可能只对应的分配了一点点的物理内存，实际使用了多少内存，就会对应多少物理内存。

进程得到的这4G虚拟内存是一个连续的地址空间（这也只是进程认为），而实际上，它的数据是存储在多个物理内存碎片的，还有一部分存储在外部磁盘存储器上，在需要时将数据交换进物理内存。

进程开始要访问一个地址，它可能会经历下面的过程

\1. 进程每次要访问地址空间上的某一个地址时，都需要把地址翻译为实际物理内存地址。

\2. 所有进程共享一整块物理内存，每个进程只把自己目前需要访问的虚拟地址空间映射到物理内存上。

\3. 进程需要知道哪些虚拟内存地址空间上的数据在物理内存上，哪些不在（可能这部分存储在磁盘上），若在物理内存上存在，则需要进一步知道数据存储在物理内存上的具体位置，这都需要通过页表来记录。

\4. 页表的每一个表项分两部分，第一部分记录此页是否在物理内存上，第二部分记录物理内存页的地址（如果在的话）。

\5. 当进程访问某个虚拟地址的时候，就会先去看页表，如果发现对应的数据不在物理内存上，就会发生缺页异常。

\6. 缺页异常的处理过程，操作系统立即阻塞该进程，并将硬盘里对应的页换入内存，然后使该进程就绪，如果内存已经满了，没有空地方了，那就找一个页覆盖，至于具体覆盖的哪个页，就需要看操作系统的页面置换算法是怎么设计的了。

当每个进程创建的时候，内核会为进程分配4G的虚拟内存，当进程还没有开始运行时，这只是一个内存布局。实际上并不立即就把虚拟内存对应位置的程序数据和代码（比如.text .data段）拷贝到物理内存中，只是建立好虚拟内存和磁盘文件之间的映射关系（叫做存储器映射）。这个时候数据和代码还是在磁盘上的。当运行到对应的程序时，进程去访问页表，发现页表中地址没有存放在物理内存上，而是在磁盘上，于是发生缺页异常，于是将磁盘上的数据拷贝到物理内存中。

Linux的kill命令（-9信号的作用）

kill命令用于终止Linux进程，默认情况下，如果不指定信号，kill 等价于kill -15。

kill -15执行时，系统向对应的程序发送SIGTERM（15）信号，该信号是可以被执行、阻塞和忽略的，所以应用程序接收到信号后，可以做一些准备工作，再进行程序终止。

有的时候，kill -15无法终止程序，因为他可能被忽略，这时候可以使用kill -9，系统会发出SIGKILL（9）信号，该信号不允许忽略和阻塞，所以应用程序会立即终止。

这也会带来很多副作用，如数据丢失等，所以，在非必要时，不要使用kill -9命令，尤其是那些web应用、提供RPC服务、执行定时任务、包含长事务等应用中，因为kill -9 没给spring容器、tomcat服务器、dubbo服务、流程引擎、状态机等足够的时间进行收尾。

匿名管道使用限制

管道的本质就是在内核中开辟的一段空间，这段空间也可以称之为缓冲区，并且这段空间是没有标识符的

数据的拷贝过程——管道需要在内核和用户空间进行四次的数据拷贝：由用户空间的buf中将数据拷贝到内核中 -> 内核将数据拷贝到内存中 -> 内存到内核 -> 内核到用户空间的buf。

匿名管道只允许单向通信

匿名管道自带互斥同步机制

匿名管道只能用于有血缘关系的进程，常用于父子进程间通信

匿名管道是面向字节流的

管道的生命周期随通信双方的进程

4种情况：

当管道的读端不读且不关闭时，写端会一直写，写满时，写端会出现阻塞式等待

当管道的写端不写也不关闭时，读端会一直读，读完时，读端也会出现阻塞式等待

当管道的读端不读且读文件描述符关闭时，写端会退出

当管道的写端不读并且关闭时，读端也会退出

共享内存的实现方法

共享内存是一种最为高效的进程间通信方式，进程可以直接读写内存，而不需要任何数据的拷贝。它是IPC对象的一种。
为了在多个进程间交换信息，内核专门留出了一块内存区，可以由需要访问的进程将其映射到自己的私有地址空间。进程就可以直接读写这一内存区而不需要进行数据的拷贝，从而大大提高的效率。

方法一、利用POSIX有名信号灯实现共享内存的同步

方法二、利用POSIX无名信号灯实现共享内存的同步

方法三、利用System V的信号灯实现共享内存的同步

方法四、利用信号实现共享内存的同步

日志系统

ELK日志分析系统：ELK是由Elasticsearch Logstash Kibana三大组件构成的一个基于web页面的日志分析工具。

日志分析是运维工程师解决系统故障，发现问题的主要手段。日志包含多种类型，包括程序日志，系统日志以及安全日志等。通过对日志分析，预发故障的发生，又可以在故障发生时，寻找到蛛丝马迹，快速定位故障点。及时解决。

组件结构：

Elasticsearch：是一个开源分布式时实分析搜索引擎，建立在全文搜索引擎库Apache Lucene基础上，同时隐藏了Apache Lucene的复杂性。Elasticsearch将所有的功能打包成一个独立的动画片，索引副本机制，RESTful风格接口，多数据源。自动搜索等特点。

Logstash ：是一个完全开源的工具，主要用于日志收集，同时可以对数据处理，并输出给Elasticarch

Kibana：也是一个完全开源的工具，kibana可以为Logstash和Elasticsearch提供图形化的日志分析。Web界面，可以汇总，分析和搜索重要数据日志。

管道涉及的数据拷贝

消息队列和管道基本上都是4次拷贝，而共享内存（mmap, shmget）只有两次。
4次：1，由用户空间的buf中将数据拷贝到内核中。2，内核将数据拷贝到内存中。3，内存到内核。4，内核到用户空间的buf.
2次： 1，用户空间到内存。 2，内存到用户空间。

消息队列和管道都是内核对象，所执行的操作也都是系统调用，而这些数据最终是要存储在内存中执行的。因此不可避免的要经过4次数据的拷贝。但是共享内存不同，当执行mmap或者shmget时，会在内存中开辟空间，然后再将这块空间映射到用户进程的虚拟地址空间中，即返回值为一个指向一个内存地址的指针。当用户使用这个指针时，例如赋值操作，会引起一个从虚拟地址到物理地址的转化，会将数据直接写入对应的物理内存中，省去了拷贝到内核中的过程。当读取数据时，也是类似的过程，因此总共有两次数据拷贝。

1、请你说一下进程和线程的区别？

概念：

进程是运行时程序的封装。是操作系统进行资源分配和调度的基本单位，它实现了操作系统内部的并发。

线程：线程是进行的一个子任务，是cpu可以识别和执行的最小单位，保证了程序内部的并发。同一进程中的所有线程都有自己的任务，但是他们共享同一地址空间，打开的文件队列和其他资源。

区别：

\1. 一个进程最少有一个线程，也可多个线程。一个线程只能属于一个进程。线程依赖于进程存在(火车，火车车厢)。

\2. 进程是操作系统进行资源分配和调度的基本单位，线程是CPU调度的最小单位。

\3. 不同的进程都有自己的地址空间，相互之间是独立的。但是多个线程共享同一地址空间，堆，代码段，数据段。但是每个线程都有自己的栈空间，栈段也叫运行时的段。

\4. 进程创建，切换或者销毁的系统开销都是远大于线程的。创建和销毁时候操作系统需要给进程分配或者回收相应的地址空间和IO资源等，因此创建或者切换的开销都是远大于线程的。切换时候，操作系统需要对整个CPU环境的保存，以及对于新环境的设置。而线程切换只要保存少量寄存器内容即可。

\5. 通信方式：线程间通信的方式非常简单，因为他们共享了地址空间，比如有数据段，所以可以很轻易的通过全局变量来进行线程间的通信。但是需要一些保证同步和互斥的操作，保障数据的一致性。

\6. 一个进程挂掉，一般不会影响到别的进程。但是一个线程挂了，会导致所在的整个进程挂掉。

同步通信：

进程通信：

\1. 管道：PIPE和FIFO。PIPE只能半双工的，想要数据的双向流动就需要创建两个进行通信。在有父

子和兄弟进程之间使用。FIFO没有这个限制。

\2. 系统IPC：共享内存，消息队列，信号，信号量。

\3. 套接字通信：SOCKET。

线程通信：

\1. 通过临界区的数据。

\2. 互斥量。不会被多个线程访问。

\3. 信号量。会被做个线程访问。

\4. 事件。通知操作，提供了线程优先级比较。

2、什么是临界资源？什么是临界区？

临界资源：同一时刻只允许一个进程（线程）访问的资源，叫临界资源。

临界区：访问临界资源的代码段叫临界区。

3、谈一谈操作系统的地址转化

第一步：CPU段式管理中——逻辑地址转线性地址

CPU要利用其段式内存管理单元，先将为个逻辑地址转换成一个线程地址。

一个逻辑地址由两部份组成，【段标识符：段内偏移量】。

段标识符是由一个16位长的字段组成，称为段选择符。其中前13位是一个索引号。后面3位包含一些硬件细节，如图：

通过段标识符中的索引号从GDT或者LDT找到该段的段描述符，段描述符中的base字段是段的起始地址GDT在内存中的地址和大小存放在CPU的gdtr控制寄存器中，而LDT则在ldtr寄存器中。

段起始地址+ 段内偏移量 = 线性地址

第二步：页式管理——线性地址转物理地址

CPU的页式内存管理单元，负责把一个线性地址，最终翻译为一个物理地址。

线性地址被分为以固定长度为单位的组，称为页(page)，例如一个32位的机器，线性地址最大可为4G，可以用4KB为一个页来划分，这页，整个线性地址就被划分为一个tatol_page[2^20]的大数组，共有2的20个次方个页。

另一类“页”，我们称之为物理页，或者是页框、页桢的。是分页单元把所有的物理内存也划分为固定长度的管理单位，它的长度一般与内存页是一一对应的。

每个进程都有自己的页目录，当进程处于运行态的时候，其页目录地址存放在cr3寄存器中。

每一个32位的线性地址被划分为三部份，【页目录索引(10位)：页表索引(10位)：页内偏移(12位)】

依据以下步骤进行转换：

\1. 从cr3中取出进程的页目录地址（操作系统负责在调度进程的时候，把这个地址装入对应寄存器）；

\2. 根据线性地址前十位，在数组中，找到对应的索引项，因为引入了二级管理模式，页目录中的项，

不再是页的地址，而是一个页表的地址。（又引入了一个数组），页的地址被放到页表中去了。

\3. 根据线性地址的中间十位，在页表（也是数组）中找到页的起始地址；

\4. 将页的起始地址与线性地址中最后12位相加。

4、请你说一下OS缺页置换算法

页面置换算法：地址映射过程中，当CUP需要访问的页面不在内存中，则发生缺页中断！当缺页中断发生后，内存中没有空闲的页面，则必须选择一个页面将其移出内存（如果选择的页面上的数据没有被修改，则直接用新页覆盖，如果修选择的页面上的数据被修改了，则必须将其置换到虚拟空间上），为访问的页面腾出空间。选择移出页面的算法称为页置换算法。

设计页面置换算法的目标：

1、降低随后发生缺页中断的次数或者概率。选择的页面在随后相当长时间不会被访问到，最好是再也不会被访问。 2、应该选择一个没有修改过的页面，这样，替换时就无需将被替换的页面内容写回到磁盘，从而进一步加快缺页中断的响应时间。

常用的页面置换算法有：

1、OPT（最佳置换算法）

2、FIFO（先进先出置换算法）

3、第二次机会算法（Second Chance）

4、NRU（最近未使用算法）

5、 LRU（最近最少使用置换算法）

6、时钟（CLOCK）置换算法

7、工作集算法

8、工作集时钟算法

5、请你说一说死锁发生的条件以及如何解决死锁

死锁的概念：多个进程或线程访问一组竟态资源的时候，出现的永久阻塞的问题。产生的原因主要有三个：系统资源不足，程序运行推进的顺序不当，资源分配不当。

产生的四个条件是：

1）互斥：：进程对所分配到的资源不允许其他进程访问，若其他进程访问该资源，只能等待，直至占有该资源的进程使用完成后释放该资源；

2）请求与保持：进程获得一定的资源后，又对其他资源发出请求，但是该资源可能被其他进程占有，此时请求阻塞，但该进程不会释放自己已经占有的资源。

3）不可抢占：进程已获得的资源，在未完成使用之前，不可被剥夺，只能在使用后自己释放

4）循环等待：进程发生死锁后，必然存在一个进程-资源之间的环形链

解决死锁的方法即破坏上述四个条件之一，主要方法如下：

资源一次性分配，从而剥夺请求和保持条件。如某个进程申请多个资源，只要有一个资源不满足暂时就不要分配任何资源。等所有资源能满足时一起分配。

可剥夺资源：即当进程新的资源未得到满足时，释放已占有的资源，从而破坏不可剥夺的条件

资源有序分配法：系统给每类资源赋予一个序号，每个进程按编号递增的请求资源，释放则相反，从而破坏环路等待的条件

6、系统调用和普通函数的区别

系统调用和普通函数的最大区别就在于执行需要的权限不同。普通函数可以由用户空间去直接执行，而系统调用必须由内核帮用户执行。也就是说：发起系统调用，从用户态切换到内核态，内核执行完毕函数之后，再将执行结果返回给用户，从内核态切换回去用户态。（系统调用的开销要大于普通函数）

为什么要有系统调用？为了操作系统的安全性，我们把直接对与IO设备等等一些操作，都设计为系统调用，也就是只能由操作系统内核帮我们去执行，提高了操作系统的安全性问题。

7、操作系统中进程间通信方式

了进程间通讯，Linux下进程间的通讯方式有：信号、管道（有名、无名）、信号量、消息队列、共享内存、socket等。

1：信号

信号是系统预先定义好的一些特定的事件，信号可以被产生，也可以被接收，产生和接收的主体都是进程。接收到信号的进程会采取相应的一些行动。一般信号是由于某些错误条件而生成的，比如内存段冲突、浮点处理器错误或非法指令等。信号也可以作为进程间传递消息或修改行为的一种方式，明确地由一个进程发送给另一个进程。接收到信号的进程有三种响应方式，分别为：忽略（SIG_IGN）默认（SIG_DFL）自定义/捕获（自定义的函数）

进程修改信号响应方式的函数：

typedef void (*Fun_Handle_t)(int);

Fun_Handle_t signal(int sig, Fun_Handle_t fun);

```

进程发送信号的函数：int kill(pid_t pid, int sig); //向指定进程发送指定的信号

```

B：管道

管道是进程间传递数据的一种通讯方式，管道分为有名管道和无名管道，有名管道在文件系统中会生成一个管道文件。但是这个文件只是一个文件标识，而不占据磁盘空间，所以可以在任意两个进程间完成通讯。无名管道则是利用父子进程共享fork之前打开的文件描述符，所以只能应用于父子进程之间。

有名管道的使用：

创建： 1、命令： mkfififo fifilename

2、函数： int mkfifo(const char *filename, mode_t mode);

打开： int open(const char *filename, int flag, /mode_t mode/);

读取内容： int read(int fd, void *buf, int size);

写内容： int write(int fd, void *buf, int len);

关闭： int close(int fd);

无名管道的使用：

```c++

```c++ 创建： int pipe(int fds[2]); // 此函数必须在fork之前调用，作用是创建一个无名管道，并使fds[0]

指向其读端, fds[1]指向其写端

读取内容： int read(int fd, void *buf, int size);

写内容： int write(int fd, void *buf, int len);

关闭： int close(int fd);

C： 信号量

信号量可以完成进程间的同步控制，（进程同步就是一个进程的执行必须等待另一个进程使某种条件的发生）。信号量相当于一个特殊的计数器，在其值大于零时，记录资源能被几个进程使用，当其值小于零时，记录等待资源的进程数量。当一个进程使用资源之前必须先对信号量的值进行减一操作（P操作），然后判断其是否大于或等于零，如果小于零，必须等待。而当一个进程使用完资源之后，必须对信号量的值进行加一操作（V操作），意味着自己将资源释放出来。

信号量的操作：

创建或获取： int semget(key_t key, int nsems, int flag);

P、V操作： int semop(int semid, struct sembuf semoparray[], size_t nops);

操作控制： int semctl(int semid, int semnum, int cmd, /*union semun

arg*/);

D： 消息队列

消息队列也可以实现进程间传递数据，不过传递的数据是带有type的，不同的进程可以根据需要获取不同类型的数据，如果队列中同一类型的数据有多条，则采用先进先出的原则获取数据。

消息队列的操作：

创建或获取： int msgget(key_t key, int flag);

发送消息： int msgsnd(int msgid, const void *msg_ptr, size_t msg_sz, int

msgflg);

获取消息：

int msgrcv(int msgid, void *msg_ptr, size_t msg_sz, long int msgtype, int

msgflg);

控制操作： int msgctl(int msgid, int cmd, struct msgid_ds *buf);

E： 共享内存

共享内存是用同一块物理内存映射到不同的两个进程上的虚拟地址空间上来完成进程间通讯的。在每个进程中，都可以将这块空间看做自己的一部分，使用时，少了用户空间数据与内核创建的空间拷贝的过程，所以共享内存是最快的一种IPC。

共享内存的使用：

创建或获取： int shmget(key_t key, size_t size, int flag);

映射到虚拟地址空间： void * shmat(int shmid, void *addr, int flag);

断开映射： int shmdt(void *shm_addr); 控制操作： int shmctl(int shmid, int cmd, struct shmid_ds *buf);

F：socket****网络编程，通过网络实现不同主机上的两个进程间的通讯

8、操作系统中的PV指的是什么

pv操作都是对信号量而言的，p是对信号量的值进行原子减一,代表获取资源，当信号量的值为0时，p操作会阻塞，意味着资源不可用。

v操作是对信号量的值进行原子加一，代表释放资源，v操作从不阻塞。

9、多进程和多线程的优缺点比较

多进程：

多进程优点：

1、每个进程互相独立，不影响主程序的稳定性，子进程崩溃没关系；

2、通过增加CPU，就可以容易扩充性能；

3、可以尽量减少线程加锁/解锁的影响，极大提高性能，就算是线程运行的模块算法效率低也没关系；

4、每个子进程都有2GB地址空间和相关资源，总体能够达到的性能上限非常大。

**多进程缺点：**1、逻辑控制复杂，需要和主程序交互；

2、需要跨进程边界，如果有大数据量传送，就不太好，适合小数据量传送、密集运算多进程调度开销比较大；

3、最好是多进程和多线程结合，即根据实际的需要，每个CPU开启一个子进程，这个子进程开启多线程可以为若干同类型的数据进行处理。当然你也可以利用多线程+多CPU+轮询方式来解决问题……

4、方法和手段是多样的，关键是自己看起来实现方便有能够满足要求，代价也合适。

多线程：

多线程的优点：

1、无需跨进程边界；

2、程序逻辑和控制方式简单；

3、所有线程可以直接共享内存和变量等；

4、线程方式消耗的总资源比进程方式好。

多线程缺点：

1、每个线程与主程序共用地址空间，受限于2GB地址空间；

2、线程之间的同步和加锁控制比较麻烦；

3、一个线程的崩溃可能影响到整个程序的稳定性；

4、到达一定的线程数程度后，即使再增加CPU也无法提高性能，例如Windows Server 2003，大约是1500个左右的线程数就快到极限了（线程堆栈设定为1M），如果设定线程堆栈为2M，还达不到1500个线程总数；

5、线程能够提高的总性能有限，而且线程多了之后，线程本身的调度也是一个麻烦事儿，需要消耗较多的CPU。多进程模型的优势是CPU多线程模型主要优势为线程间切换代价较小，因此适用于I/O密集型的工作场景，因此I/O密集型的工作场景经常会由于I/O阻塞导致频繁的切换线程。同时，多线程模型也适用于单机多核分布式场景。多进程模型，适用于CPU密集型。同时，多进程模型也适用于多机分布式场景中，易于多机扩展。

10、虚拟内存和物理内存怎么对应？

每个进程都有自己的页目录，当进程处于运行态的时候，其页目录地址存放在cr3寄存器中。

每一个32位的线性地址被划分为三部份，【页目录索引(10位)：页表索引(10位)：页内偏移(12位)】

依据以下步骤进行转换：

从cr3中取出进程的页目录地址（操作系统负责在调度进程的时候，把这个地址装入对应寄存器）；

根据线性地址前十位，在数组中，找到对应的索引项，因为引入了二级管理模式，页目录中的项，不再是页的地址，而是一个页表的地址。（又引入了一个数组），页的地址被放到页表中去了。

根据线性地址的中间十位，在页表（也是数组）中找到页的起始地址；

将页的起始地址与线性地址中最后12位相加。

11、操作系统的缺页异常

malloc()和mmap()等内存分配函数，在分配时只是建立了进程虚拟地址空间，并没有分配虚拟内存对应的物理内存。当进程访问这些没有建立映射关系的虚拟内存时，处理器自动触发一个缺页异常。

缺页异常：在请求分页系统中，可以通过查询页表中的状态位来确定所要访问的页面是否存在于内存中。每当所要访问的页面不在内存是，会产生一次缺页中断，此时操作系统会根据页表中的外存地址在外存中找到所缺的一页，将其调入内存。

缺页需要经过4个处理步骤：

1、保护CPU现场

2、分析中断原因

3、转入缺页中断处理程序进行处理

4、恢复CPU现场，继续执行

但是缺页是由于所要访问的页面不存在于内存时，由硬件所产生的一种特殊的中断，因此，与一般的中断存在区别：

1、在指令执行期间产生和处理缺页中断信号

2、一条指令在执行期间，可能产生多次缺页中断

3、缺页中断返回是，执行产生中断的一条指令，而一般的中断返回是，执行下一条指令。

12、vfork和fork

除了子进程必须要立刻执行一次对exec的系统调用，或者调用_exit( )退出，对vfork( )的成功调用所产生的结果和fork( )是一样的。vfork( )会挂起父进程直到子进程终止或者运行了一个新的可执行文件的映像。通过这样的方式，vfork( )避免了地址空间的按页复制。在这个过程中，父进程和子进程共享相同的地址空间和页表项。实际上vfork( )只完成了一件事：复制内部的内核数据结构。因此，子进程也就不能修改地址空间中的任何内存。

vfork( )是一个历史遗留产物，Linux本不应该实现它。需要注意的是，即使增加了写时复制，vfork( )也要比fork( )快，因为它没有进行页表项的复制。然而，写时复制的出现减少了对于替换fork( )争论。实际上，直到2.2.0内核，vfork( )只是一个封装过的fork( )。因为对vfork( )的需求要小于fork( )，所以vfork( )的这种实现方式是可行的。

后来fork引入了写时拷贝技术，同样可以解决fork+exec系列产生的不需要拷贝问题，所以vfork成了历史的产物

13、谈谈并发与并行

并发（concurrency）：指宏观上看起来两个程序在同时运行，比如说在单核cpu上的多任务。但是从微观上看两个程序的指令是交织着运行的，你的指令之间穿插着我的指令，我的指令之间穿插着你的，在单个周期内只运行了一个指令。这种并发并不能提高计算机的性能，只能提高效率。

并行（parallelism）：指严格物理意义上的同时运行，比如多核cpu，两个程序分别运行在两个核上，两者之间互不影响，单个周期内每个程序都运行了自己的指令，也就是运行了两条指令。这样说来并行的确提高了计算机的效率。所以现在的cpu都是往多核方面发展。

14、互斥锁、读写锁、自旋锁

互斥锁：mutex，用于保证在任何时刻，都只能有一个线程访问该对象。当获取锁操作失败时，线程会进入睡眠，等待锁释放时被唤醒

读写锁：rwlock，分为读锁和写锁。处于读操作时，可以允许多个线程同时获得读操作。但是同一时刻只能有一个线程可以获得写锁。其它获取写锁失败的线程都会进入睡眠状态，直到写锁释放时被唤醒。

注意：写锁会阻塞其它读写锁。当有一个线程获得写锁在写时，读锁也不能被其它线程获取；写者优先于读者（一旦有写者，则后续读者必须等待，唤醒时优先考虑写者）。适用于读取数据的频率远远大于写数据的频率的场合。

自旋锁：spinlock，在任何时刻同样只能有一个线程访问对象。但是当获取锁操作失败时，不会进入睡眠，而是会在原地自旋，直到锁被释放。这样节省了线程从睡眠状态到被唤醒期间的消耗，在加锁时间短暂的环境下会极大的提高效率。但如果加锁时间过长，则会非常浪费CPU资源。

15、僵尸进程，孤儿进程

1）正常进程

正常情况下，子进程是通过父进程创建的，子进程再创建新的进程。子进程的结束和父进程的运行是一个异步过程，即父进程永远无法预测子进程到底什么时候结束。当一个进程完成它的工作终止之后，它的父进程需要调用wait()或者waitpid()系统调用取得子进程的终止状态。

unix提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息，就可以得到：在每个进程退出的时候，内核释放该进程所有的资源，包括打开的文件，占用的内存等。但是仍然为其保留一定的信息，直到父进程通过wait / waitpid来取时才释放。保存信息包括：

1进程号the process ID

2退出状态the termination status of the process

3运行时间the amount of CPU time taken by the process等

2）孤儿进程

一个父进程退出，而它的一个或多个子进程还在运行，那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养，并由init进程对它们完成状态收集工作。

3）僵尸进程

一个进程使用fork创建子进程，如果子进程退出，而父进程并没有调用wait或waitpid获取子进程的状态信息，那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程。

僵尸进程是一个进程必然会经过的过程：这是每个子进程在结束时都要经过的阶段。如果子进程在exit()之后，父进程没有来得及处理，这时用ps命令就能看到子进程的状态是“Z”。如果父进程能及时处理，可能用ps命令就来不及看到子进程的僵尸状态，但这并不等于子进程不经过僵尸状态。

如果父进程在子进程结束之前退出，则子进程将由init接管。init将会以父进程的身份对僵尸状态的子进程进行处理。

危害：

如果进程不调用wait / waitpid的话，那么保留的那段信息就不会释放，其进程号就会一直被占用，但是系统所能使用的进程号是有限的，如果大量的产生僵死进程，将因为没有可用的进程号而导致系统不能产生新的进程。

外部消灭：

通过kill发送SIGTERM或者SIGKILL信号消灭产生僵尸进程的进程，它产生的僵死进程就变成了孤儿进程，这些孤儿进程会被init进程接管，init进程会wait()这些孤儿进程，释放它们占用的系统进程表中的资源

内部解决：

1、子进程退出时向父进程发送SIGCHILD信号，父进程处理SIGCHILD信号。在信号处理函数中调用wait进行处理僵尸进程。

2、fork两次，原理是将子进程成为孤儿进程，从而其的父进程变为init进程，通过init进程可以处理僵尸进程。

16、系统调用的具体过程

简单来说，系统过程的过程可以分为下面两个部分:

【1】产生0x80号中断，保存当前进程现场信息，将该系统调用的系统调用号写入eax寄存器中。【2】中断处理程序执行，也即切换到了内核态，此处也就是执行系统调用的程序，从eax寄存器中读出系统调用号，查系统调用表，找到对应的内核函数执行，将结果继续写入eax寄存器中。中断处理程序执行完成，恢复原程序的执行，也即回到了用户态。应用程序从eax寄存器中读取返回值。

下面为更为详细的描述：

整个过程如下：首先指令流执行到系统调用函数时，系统调用函数通过int 0x80指令进入系统调用入口程序，并且把系统调用号放入%eax中，如果需要传递参数，则把参数放入ebx，ecx和%edx中。进入系统调用入口程序（System_call）后，它首先把相关的寄存器压入内核堆栈（以备将来恢复），这个过程称为保护现场。保护现场的工作完成后，开始检查系统调用号是不是一个有效值，如果不是则退出。

接下来根据系统调用号开始调用系统调用处理程序（这是一个正式执行系统调用功能的函数），从系统调用处理程序返回后，就会去检查当前进程是否处于就绪态、进程时间片是否用完，如果不在就绪态或者时间片已用完，那么就会去调用进程调度程序schedule()，转去执行其他进程。如果不执行进程调度程序，那么接下来就会开始执行ret_from_sys_call，顾名思义，这这个程序主要执行一些系统调用的后处理工作。比如它会去检查当前进程是否有需要处理的信号，如果有则去调用do_signal()，然后进行一些恢复现场的工作，返回到原先的进程指令流中。至此整个系统调用的过程就结束了。

17、send和recv的底层过程

send和recv是利用建立好的tcp连接进行发送数据和接收数据的系统调用。send负责将要发送的数据写入对应套接字文件描述符的发送缓冲区，send成功并不能说明数据发送到了对端，它的返回值是实际写入发送缓冲区的字节数，什么时候发送给对端由底层协议完成。

如果缓冲区满则有可能阻塞send。send在在内核中最终通过__sock_sendmsg，将数据写入相应的缓冲区。

recv是从文件描述符对应的接收缓冲区，读取数据，读取多少由缓冲区当前数据量和应用程序期望的读取的字节数决定，取小者。recv在内核中最终通过__sock_recvmsg，从缓冲区读到数据，再拷贝到用户空间。

18、实模式和保护模式的区别

实模式和保护模式本质来讲寻址方式，和寻址范围不同。

【1】实模式：以8086为代表，物理地址=段寄存器<<4 + 偏移量。对内存的访问没有任何的保护措施，给出合适的段基地址和偏移量就可访问整个内存地址空间。

【2】保护模式：以80386为代表，段寄存器得到的不是段基地址，而是段描述符表的下标，及当前

是处于内核态还是用户态，有权限的控制。通过查段描述符表可以得到 “段的基地址”，然后段的基地址+ 偏移量 =线性地址。

此处得到的线性地址并不是直接作用与物理地址，而是通过分页的方式，将线性地址再映射到物理页面得到物理地址，在这一步会有读写等等权限的控制在里面。

19、几种常用的线程模型

1、Future模型

该模型通常在使用的时候需要结合Callable接口配合使用。

Future是把结果放在将来获取，当前主线程并不急于获取处理结果。允许子线程先进行处理一段时间，处理结束之后就把结果保存下来，当主线程需要使用的时候再向子线程索取。

Callable是类似于Runnable的接口，其中call方法类似于run方法，所不同的是run方法不能抛出受检异常没有返回值，而call方法则可以抛出受检异常并可设置返回值。两者的方法体都是线程执行体。

2、fork&join模型

该模型包含递归思想和回溯思想，递归用来拆分任务，回溯用合并结果。可以用来处理一些可以进行拆分的大任务。其主要是把一个大任务逐级拆分为多个子任务，然后分别在子线程中执行，当每个子线程执行结束之后逐级回溯，返回结果进行汇总合并，最终得出想要的结果。

这里模拟一个摘苹果的场景：有100棵苹果树，每棵苹果树有10个苹果，现在要把他们摘下来。为了节约时间，规定每个线程最多只能摘10棵苹树以便于节约时间。各个线程摘完之后汇总计算总苹果树。

3、actor模型

actor模型属于一种基于消息传递机制并行任务处理思想，它以消息的形式来进行线程间数据传输，避免了全局变量的使用，进而避免了数据同步错误的隐患。actor在接受到消息之后可以自己进行处理，也可以继续传递（分发）给其它actor进行处理。在使用actor模型的时候需要使用第三方Akka提供的框架。

4、生产者消费者模型生产者消费者模型都比较熟悉，其核心是使用一个缓存来保存任务。开启一个/多个线程来生产任务，然后再开启一个/多个来从缓存中取出任务进行处理。这样的好处是任务的生成和处理分隔开，生产者不需要处理任务，只负责向生成任务然后保存到缓存。而消费者只需要从缓存中取出任务进行处理。使用的时候可以根据任务的生成情况和处理情况开启不同的线程来处理。比如，生成的任务速度较快，那么就可以灵活的多开启几个消费者线程进行处理，这样就可以避免任务的处理响应缓慢的问题。

5、master-worker模型

master-worker模型类似于任务分发策略，开启一个master线程接收任务，然后在master中根据任务的具体情况进行分发给其它worker子线程，然后由子线程处理务。如需返回结果，则worker处理结束之后把处理结果返回给master。

20、编译的链接详细过程

编译

\1. 编译的第一步就是将.cpp文件进行预编译，预编译要处理的就是以#开头的代码，比如 #include .#define , #ifdef 等等。但是我们一定要注意，并不是所有以开头的代码都会在这个时期进行处理，比如下面这样的代码

第一段代码#progma lib:处理程序需要连接的库并不是编译阶段处理的，需要存活到连接的阶段

第二段代码#progma link:修改程序的入口地址，同样需要存活到链接阶段。

宏的展开是有一些副作用的，这里我们一定要注意，具体内容参考c语言学习

\2. 编译的第二步就是进行代码的编译： g++ -O 1 2 3 这样的操作可是选定编译优化的优先级别。这

个阶段会生成一些相应平台所对应的汇编指令，

\3. 编译的第三步就是进行汇编：汇编会生成符号表和符号。过后的结果会生成一个二进制的可重定位的目标文件，这里一定要注意，并不是直接生成了可执行文件，只是.o(linux)或者.obj(window)的可重定位的二进制文件。整个编译过程就到这里结束。

链接：

首先需要知道，链接会链接所有完成编译的.o文件+静态库文件.lib，但是并不会链接动态库，动态库是在程序执行阶段进行动态链接的。

\1. 链接第一步：所有文件进行段的合并，符号表生成以后，进行符号解析。

\2. 链接第二步：符号的重定位（重定向）

21、静态链接和动态链接

1、静态链接：

函数和数据被编译进一个二进制文件。在使用静态库的情况下，在编译链接可执行文件时，链接器从库中复制这些函数和数据并把它们和应用程序的其它模块组合起来创建最终的可执行文件。

空间浪费：因为每个可执行程序中对所有需要的目标文件都要有一份副本，所以如果多个程序对同一个目标文件都有依赖，会出现同一个目标文件都在内存存在多个副本；

更新困难：每当库函数的代码修改了，这个时候就需要重新进行编译链接形成可执行程序。

#pragma lib

#pragma link

运行速度快：但是静态链接的优点就是，在可执行程序中已经具备了所有执行程序所需要的任何东西，在执行的时候运行速度快。

2、动态链接：

动态链接的基本思想是把程序按照模块拆分成各个相对独立部分，在程序运行时才将它们链接在一起形成一个完整的程序，而不是像静态链接一样把所有程序模块都链接成一个单独的可执行文件。

共享库：就是即使需要每个程序都依赖同一个库，但是该库不会像静态链接那样在内存中存在多分，副本，而是这多个程序在执行时共享同一份副本；

更新方便：更新时只需要替换原来的目标文件，而无需将所有的程序再重新链接一遍。当程序下一次运行时，新版本的目标文件会被自动加载到内存并且链接起来，程序就完成了升级的目标。

性能损耗：因为把链接推迟到了程序运行时，所以每次执行程序都需要进行链接，所以性能会有一定损失。

22、如何解决读写锁中存在的写饥饿问题

这其实类似于linux内核中的RCU(read-copy-update)锁,RCU的核心理念其实就是读线程访问时，写线程可以去更新保护数据的副本，但写线程需要等待所有读线程完成读取后，才可以删除老对象。那么可以通过这种思想，在用户级实现一个类似的锁来解决读写锁带来的问题。

23、操作系统中的多级缓存

在现代的计算机系统中，通常总是采用由三种运行原理不同，性能差异很大的存储介质分别构建高速缓冲存储器、主存储器和虚拟存储器，再将它们组成三级结构的统一管理、调度的一体化存储器系统。如图所示：

高速缓存一般会分为三级，我们称之为CPU的三级缓存机制。

CPU缓存的作用。

1、缩短延迟

访问缓存的时间应该尽可能缩短，可以通过多种的方式缩短这个时间，比如能够通过减小缓存的大小或关联性来降低缓存的延迟，还有方式预测、增加带宽等方法。

2、提升命中率所谓的命中率是在高速缓存中找到内存引用的速率，我们希望能够首先通过缓存中获得信息，以得到速度优势，所以缓存需要最大限度地实现这一目标。对于单个高速缓存，大小、关联性和块大小决定命中率。

3、降低更低级别内存下的开销

高速缓存是内存层次结构的一部分，其性能会影响其它性能，处理其它内存花费的时间越长，意味着系统性能越低，也就是说尽可能让处理在缓存中完成。

24、TLB缓存页表机制

1)TLB的概述

TLB是一个内存管理单元用于改进虚拟地址到物理地址转换速度的缓存.

TLB是位于内存中的页表的cache，如果没有TLB，则每次取数据都需要两次访问内存,即查页表获得物理地址和取数据.

2)tlb的原理

当cpu对数据进行读请求时, CPU根据虚拟地址(前20位)到TLB中查找 .

TLB中保存着虚拟地址(前20位)和页框号的对映关系 ,如果匹配到虚拟地址就可以迅速找到页框号,通过页框号与虚拟地址后12位的偏移组合得到最终的物理地址.页框号可以理解为页表项如果没在TLB中匹配到虚拟地址,就出现TLB丢失,需要到页表中查询页表项,如果不在页表中,说明要读取的内容不在内存,需要到磁盘读取.

TLB是MMU中的一块高速缓存,也是一种Cache.在分页机制中,TLB中的数据和页表的数据关联,不是由处理器维护,而是由OS来维护,TLB的刷新是通过装入处理器中的CR3寄存器来完成.如果MMU发现在TLB中没有命中,它在常规的页表查找后,用找到的页表项替换TLB中的一个条目.

3)tlb的刷新原则

当进程进行上下文切换时重新设置cr3寄存器,并且刷新tlb.

有两种情况可以避免刷tlb.

第一种情况是使用相同页表的进程切换.

第二种情况是普通进程切换到内核线程.

lazy-tlb(懒惰模式)的技术是为了避免进程切换导致tlb被刷新.

当普通进程切换到内核线程时,系统进入lazy-tlb模式,切到普通进程时退出该模式.

Linux

1、CPU负载和CPU利用率的区别是什么？

我们可以通过uptime，w或者top命令看到CPU的平均负载

平均负载：代表的是当前系统正在运行的和处于等待运行的进程数之和。也指的是处于可运行状态和不可中断状态的平均进程数。

如果是单核CPU的话，负载达到1就代表CPU已经达到满负荷的状态了，超过1，后面的进程就需要排队等待处理了。

如果是多核多CPU的话，假设现在服务器是2个CPU，每个CPU2个核，那么总负荷不超过4都没什么问题。

通过命令cat /proc/cpuinfo | grep "model name"查看CPU的情况。

CPU利用率：和负载不同，CPU利用率指的是当前正在运行的进程实时占用CPU的百分比，它是对一段时间内CPU使用状况的统计。

2、那如果CPU负载很高，利用率却很低该怎么办？

这样情况说明处于等待状态的任务很多，负载很高，代表可能很多僵死的进程。通常这种情况是IO密集型的任务，大量请求在请求相同的IO，导致任务队列堆积。

同样，可以先通过top命令观察，假设发现现在确实是高负载低使用率。

然后，再通过命令ps -axjf查看是否存在状态为D+状态的进程，这个状态指的就是不可中断的睡眠状态的进程。处于这个状态的进程无法终止，也无法自行退出，只能通过恢复其依赖的资源或者重启系统来解决。

3、那如果负载很低，利用率却很高呢？

这表示CPU的任务并不多，但是任务执行的时间很长，大概率就是你写的代码本身有问题，通常是计算密集型任务，生成了大量耗时短的计算任务。

怎么排查？直接top命令找到使用率最高的任务，定位到去看看就行了。如果代码没有问题，那么过段时间CPU使用率就会下降的。

4、那如果CPU使用率达到100%呢？怎么排查？

通过top找到占用率高的进程。
通过top -Hp pid找到占用CPU高的线程ID。这里找到958的线程ID
再把线程ID转化为16进制，printf "0x%x\n" 958，得到线程ID0x3be
通过命令jstack 163 | grep '0x3be' -C5 --color 或者 jstack 163|vim +/0x3be - 找到有问题的代码

5、说说常见的Linux命令把？

常用的文件、目录命令

ls：用户查看目录下的文件，ls -a可以用来查看隐藏文件，ls -l可以用于查看文件的详细信息，包括权限、大小、所有者等信息。

touch：用于创建文件。如果文件不存在，则创建一个新的文件，如果文件已存在，则会修改文件的时间戳。

cat：cat是英文concatenate的缩写，用于查看文件内容。使用cat查看文件的话，不管文件的内容有多少，都会一次性显示，所以他不适合查看太大的文件。

more：more和cat有点区别，more用于分屏显示文件内容。可以用空格键向下翻页，b键向上翻页

less：和more类似，less用于分行显示

tail：可能是平时用的最多的命令了，查看日志文件基本靠他了。一般用户tail -fn 100 xx.log查看最后的100行内容

常用的权限命令

chmod：修改权限命令。一般用+号添加权限，-号删除权限，x代表执行权限，r代表读取权限，w代表写入权限，常见写法比如chmod +x 文件名 添加执行权限。

还有另外一种写法，使用数字来授权，因为r=4，w=2，x=1，平时执行命令chmod 777 文件名这就是最高权限了。

第一个数字7=4+2+1代表着所有者的权限，第二个数字7代表所属组的权限，第三个数字代表其他人的权限。

常见的权限数字还有644，所有者有读写权限，其他人只有只读权限，755代表其他人有只读和执行权限。

chown：用于修改文件和目录的所有者和所属组。一般用法chown user 文件用于修改文件所有者，chown user:user 文件修改文件所有者和组，冒号前面是所有者，后面是组。

常用的压缩命令

zip：压缩zip文件命令，比如zip test.zip 文件可以把文件压缩成zip文件，如果压缩目录的话则需添加-r选项。

unzip：与zip对应，解压zip文件命令。unzip xxx.zip直接解压，还可以通过-d选项指定解压目录。

gzip`：用于压缩.gz后缀文件，gzip命令不能打包目录。需要注意的是直接使用`gzip 文件名`源文件会消失，如果要保留源文件，可以使用`gzip -c 文件名 > xx.gz`，解压缩直接使用`gzip -d xx.gz

tar：tar常用几个选项，-x解打包，-c打包，-f指定压缩包文件名，-v显示打包文件过程，一般常用tar -cvf xx.tar 文件来打包，解压则使用tar -xvf xx.tar。

Linux的打包和压缩是分开的操作，如果要打包并且压缩的话，按照前面的做法必须先用tar打包，然后再用gzip压缩。当然，还有更好的做法就是-z命令，打包并且压缩。

使用命令tar -zcvf xx.tar.gz 文件来打包压缩，使用命令tar -zxvf xx.tar.gz来解压缩
ls：用户查看目录下的文件，ls -a可以用来查看隐藏文件，ls -l可以用于查看文件的详细信息，包括权限、大小、所有者等信息。

touch：用于创建文件。如果文件不存在，则创建一个新的文件，如果文件已存在，则会修改文件的时间戳。

more：more和cat有点区别，more用于分屏显示文件内容。可以用空格键向下翻页，b键向上翻页

less：和more类似，less用于分行显示

tail：可能是平时用的最多的命令了，查看日志文件基本靠他了。一般用户tail -fn 100 xx.log查看最后的100行内容

cd /home 进入 ‘/ home’ 目录’

cd … 返回上一级目录

cd …/… 返回上两级目录

cd 进入个人的主目录

cd ~user1 进入个人的主目录

cd - 返回上次所在的目录

pwd 显示工作路径

ls 查看目录中的文件

ls -F 查看目录中的文件

ls -l 显示文件和目录的详细资料

ls -a 显示隐藏文件

ls [0-9] 显示包含数字的文件名和目录名

tree 显示文件和目录由根目录开始的树形结构(1)

lstree 显示文件和目录由根目录开始的树形结构(2)

mkdir dir1 创建一个叫做 ‘dir1’ 的目录’

mkdir dir1 dir2 同时创建两个目录

mkdir -p /tmp/dir1/dir2 创建一个目录树

rm -f file1 删除一个叫做 ‘file1’ 的文件’

rmdir dir1 删除一个叫做 ‘dir1’ 的目录’

rm -rf dir1 删除一个叫做 ‘dir1’ 的目录并同时删除其内容

rm -rf dir1 dir2 同时删除两个目录及它们的内容

mv dir1 new_dir 重命名/移动一个目录

cp file1 file2 复制一个文件

cp dir/* . 复制一个目录下的所有文件到当前工作目录

cp -a /tmp/dir1 . 复制一个目录到当前工作目录

cp -a dir1 dir2 复制一个目录

ln -s file1 lnk1 创建一个指向文件或目录的软链接

ln file1 lnk1 创建一个指向文件或目录的物理链接

touch -t 0712250000 file1 修改一个文件或目录的时间戳 - (YYMMDDhhmm)

file file1 outputs the mime type of the file as text

iconv -l 列出已知的编码

6、性能指标有哪些？

通常是以 4 个指标来衡量网络的性能，分别是带宽、延时、吞吐率、PPS（Packet Per Second），它们表示的意义如下：

带宽，表示链路的最大传输速率，单位是 b/s （比特 / 秒），带宽越大，其传输能力就越强。
延时，表示请求数据包发送后，收到对端响应，所需要的时间延迟。不同的场景有着不同的含义，比如可以表示建立 TCP 连接所需的时间延迟，或一个数据包往返所需的时间延迟。
吞吐率，表示单位时间内成功传输的数据量，单位是 b/s（比特 / 秒）或者 B/s（字节 / 秒），吞吐受带宽限制，带宽越大，吞吐率的上限才可能越高。
PPS，全称是 Packet Per Second（包 / 秒），表示以网络包为单位的传输速率，一般用来评估系统对于网络的转发能力。

当然，除了以上这四种基本的指标，还有一些其他常用的性能指标，比如：

网络的可用性，表示网络能否正常通信；
并发连接数，表示 TCP 连接数量；
丢包率，表示所丢失数据包数量占所发送数据组的比率；
重传率，表示重传网络包的比例；

7、Linux下的五种IO模型

阻塞型IO：最简单的一种IO模型，简单理解就是死等，即进程或线程一直等待莫格条件，不满足则一直

等待。

非阻塞型IO：应用进程与内核交互，目的未达到之前会直接返回，然后不断轮询，不停的去问内核数据

是否准备好？如果发现准备好了，那就把数据拷贝到用户空间中。应用进程通过 recvfrom 调用不停的

去和内核交互，直到内核准备好数据。如果没有准备好，内

核会返回error，应用进程在得到error后，过一段时间再发送recvfrom请求。在两次发送请求的时间

段，进程可以先做别的事情。

信号驱动IO：我们会发现非阻塞型IO方式一遍一遍的轮询不如等内核把数据准备好，然后通知进程，当

进程收到该通知时，便开始把数据拷贝到用户空间中。

即应用进程预先向内核注册一个信号处理函数，然后用户进程返回，并不阻塞，当内核数据准备就绪时

会发送一个信号给进程，用户进程便在信号处理函数中开始把数据拷贝到用户空间中

IO复用模型：顾名思义，即将多个进程I/0注册到同一管道上，这里管道会统一和内核交互。当管道中的

某一个请求需要好的数据准备好之后，进程再把对应的数据拷贝到用户空间中。

I/O多路转接是多了一个Select函数，多个进程的IO可以注册到同一个Select中，用户调用该Select。

Select会监听所有注册好的I/O，如果所有被监听的I/O需要的数据都没有准备好，Select调用进程会阻

塞。当任意一个I/O所需要的数据准备好之后，Select调用就

会返回，然后进程再通过recvfrom来进行数据拷贝。但实际上，它并未向内核注册信号处理函数，所

以它并不是非阻塞的。

大家肯定会有疑问，为什么之前的这四种模型都是同步的呢？因为无论以上哪种模型，真正的数据拷贝

过程都是同步的（自己的理解便是：所有的数据拷贝过程都是用户进程手动执行的）

那么我们来看真正异步执行的I/O模型：

异步I/O模型：应用进程把I/O请求传给内核后，完全由内核去操作文件拷贝。内核完成相关操作后，会

发信号告诉应用进程本次I/O已经完成。用户进程发起aio_read操作之后，给内核传递描述符、缓冲区

指针、缓冲区大小等，告诉内核进程当整个操作完成时，如何通知进程，然后就立刻去做其他事儿了。

当内核收到aio_read后，会立刻返回，然后内核开始等待数据准备，数据准备好以后，直接把数据拷贝

到用户控件，然后再通知进程本次IO已经完成。

8、谈谈Linux虚存管理和虚拟地址空间

虚拟内存技术使得不同进程在运行过程中，它所看到的是自己独自占有了当前系统的4G内存。所有进程

共享同一物理内存，每个进程只把自己目前需要的虚拟内存空间映射并存储到物理内存上。事实上，在

每个进程创建加载时，内核只是为进程“创建”了虚拟内存的布局，具体就是初始化进程控制表中内存相

关的链表，实际上并不立即就把虚拟内存对应位置的程序数据和代码（比如.text .data段）拷贝到物理

内存中，只是建立好虚拟内存和磁盘文件之间的映射就好（叫做存储器映射），等到运行到对应的程序

时，才会通过缺页异常，来拷贝数据。还有进程运行过程中，要动态分配内存，比如malloc时，也只是

分配了虚拟内存，即为这块虚拟内存对应的页表项做相应设置，当进程真正访问到此数据时，才引发缺

页异常。

虚拟内存的好处：

1.扩大地址空间；

2.内存保护：每个进程运行在各自的虚拟内存地址空间，互相不能干扰对方。虚存还对特定的内存地址

提供写保护，可以防止代码或数据被恶意篡改。

3.公平内存分配。采用了虚存之后，每个进程都相当于有同样大小的虚存空间。

4.当进程通信时，可采用虚存共享的方式实现。

5.当不同的进程使用同样的代码时，比如库文件中的代码，物理内存中可以只存储一份这样的代码，不

同的进程只需要把自己的虚拟内存映射过去就可以了，节省内存

6.虚拟内存很适合在多道程序设计系统中使用，许多程序的片段同时保存在内存中。当一个程序等待它

的一部分读入内存时，可以把CPU交给另一个进程使用。在内存中可以保留多个进程，系统并发度提高

7.在程序需要分配连续的内存空间的时候，只需要在虚拟内存空间分配连续空间，而不需要实际物理内

存的连续空间，可以利用碎片

虚拟内存的代价：

1.虚存的管理需要建立很多数据结构，这些数据结构要占用额外的内存

2.虚拟地址到物理地址的转换，增加了指令的执行时间。

3.页面的换入换出需要磁盘I/O，这是很耗时的

4.如果一页中只有一部分数据，会浪费内存。

9、Linux中的文件系统

Linux的文件系统：

Linux操作系统的文件子系统采用的是索引式文件系统Ext2，将磁盘格式化成Ext2文件系统格式的时

候，会划分出三个区域： superblock 、 inode 、 block。

superblock：记录文件系统的详细信息以及inode&block的总量、使用量和剩余量。

inode：记录文件的属性信息以及文件的权限信息。

block：存储文件的真实数据。

Linux上的文件类型：

Linux上一切皆文件，而Linux系统将文件分为以下几类：

普通文件（-）

目录文件（d）

链接文件（l）

管道文件（p）

设备文件（b:块设备 c：字符设备 s：套接字）

10、Linux中软链接和硬链接的区别？

为了解决文件共享问题，Linux引入了软链接和硬链接。除了为Linux解决文件共享使用，还带来了隐藏文件路径、增加权限安全及节省存储等好处。若1个inode号对应多个文件名，则为硬链接，即硬链接就是同一个文件使用了不同的别名,使用ln创建。若文件用户数据块中存放的内容是另一个文件的路径名指向，则该文件是软连接。软连接是一个普通文件，有自己独立的inode,但是其数据块内容比较特殊

11、谈谈Linux线程实现方式

Linux实现线程的方式非常独特，对于Linux内核来说，并没有线程这个概念。Linux把所有的线程都当做进程来实现。内核并没有准备相应的调度算法或者定义特别的数据结构来表示线程。线程仅仅被视为一个与其他进程贡献某些资源的进程而已。每个线程都有自己的task_struct，所以在内核中，看起来和普通进程没什么差异

12、Linux下的零拷贝技术

为什么为提出零拷贝：

通常我们会有这样的需求：将本地磁盘上的一个文件通过网络发送给远端的另一个服务。在传统的I/O中，会经过下面几个步骤：

\1. 发出read()系统调用，这时处理器会从用户空间切换至内核空间;

\2. 向磁盘请求数据;

\3. 通过DMA将文件从磁盘上读取到内核空间缓冲区;

\4. read()系统调用返回，将数据从内核空间缓冲区拷贝至用户空间缓冲区，这时候处理器会从内核空间切换至用户空间;

\5. 发出write()系统调用，并将数据从用户空间缓冲区拷贝至目标socket 在内核空间的缓冲区，这时候处理器会从用户空间切换至内核空间;

\6. write()调用返回;

\7. 通过DMA将数据从内核空间缓冲区中拷贝至协议引擎(该操作是独立且异步的)。

总的来说：传统的I/O操作在整个过程中将会产生4次上下文切换和4次数据拷贝。

零拷贝的实现：

Linux 中提供类似的系统调用主要有 sendfifile()、mmap() 和splice()。

通过sendfifile实现

sendfifile系统调用在内核版本2.1中被引入，目的是简化通过网络在两个本地文件之间进行的数据传输过

程。sendfifile系统调用的引入，不仅减少了数据复制，还减少了上下文切换的次数。

\1. 发出sendfifile()系统调用，这时处理器会从用户空间切换至内核空间;

\2. 向磁盘请求数据;

\3. 通过DMA将文件从磁盘上读取到内核空间缓冲区;

\4. 将数据从内核空间缓冲区拷贝到目标socket缓冲区;

\5. Sendfifile()返回，这时处理器从内核空间切换至用户空间;

\6. 通过DMA将数据从目标socket缓冲区拷贝至协议引擎。

总结一下这种实现，整个过程产生了2次上下文切换和3次数据拷贝（其中2次DMA拷贝和1次CPU拷贝）。

该实现虽然减少了2次上下文切换，但仍然还有1次CPU拷贝。那这次拷贝是不是也可以省掉呢？答案是肯定的。但是需要底层操作系统的一些支持。那就是带有DMA收集功能的sendfifile实现的零拷贝。

有DMA收集功能的sendfifile实现的零拷贝

操作系统底层提供了带有scatter/gather的DMA来从内核空间缓冲区中将数据读取到协议引擎中。这就意味着等待传输的数据不需要在连续存储器中，它可以分散在不同的内存位置。那这样一来，从文件中读出的数据就不必拷贝至目标socket的缓冲区中，只需要将缓冲区描述符添加到目标socket的缓冲区中，DMA收集操作会根据缓冲区描述符中的信息将内核空间缓冲区中的数据读取到协议引擎。这种方法不仅减少了上下文切换、还减少了由CPU参与的数据拷贝。

\1. 发出sendfifile()系统调用，处理器从用户空间切换至内核空间;

\2. 通过DMA将数据copy至内核空间缓冲区;

\3. 将数据在内核空间缓冲区的地址和偏移量拷贝至目标socket的缓冲区;

\4. Sendfifile()返回，处理器从内核空间切换至用户空间。

\5. 带有scatter/gather 功能的DMA将数据直接从内核缓冲区读取到协议引擎，从而消除了最后一次CPU拷贝。

总结一下，这种方法产生了2次上下文切换和2次数据拷贝。(减少了一次数据拷贝)。

总结sendfifile的缺点所在：如果我把数据从磁盘上读出来后，再编辑一下，再发送出去，以上所说的零拷贝则不能实现。针对这个问题，linux内核为我们提供了mmap方法。

通过mmap实现的零拷贝

mmap(内存映射):mmap操作提供了一种机制，让用户程序直接访问设备内存，这种机制，相比较在用户空间和内核空间互相拷贝数据，效率更高。

\1. 发出mmap()系统调用，处理器从用户空间切换至内核空间。

\2. 向磁盘请求数据;

\3. 通过DMA将数据从磁盘拷贝至内核空间缓冲区;

\4. mmap()调用返回，这时候用户程序和操作系统共享这个缓冲区，不需要再将数据从kernel buffffer拷贝至 user buffffer,处理器从内核空间切换至用户空间;

\5. 用户逻辑处理;

\6. 发出write()系统调用，将数据从内核空间缓冲区拷贝至目标socket缓冲区，这时处理器从用户空间切换至内核空间;

\7. write()调用返回，处理器从内核空间切换至用户空间;

\8. 通过DMA将数据拷贝至协议引擎。使用****splicesendfifile只适用于将数据从文件拷贝到套接字上，限定了它的使用范围。

在两个文件描述符之间传输数据，不用拷贝。但输入和输出文件描述符必须有一个是pipe。也就是说如果你需要从一个socket 传输数据到另外一个socket，是需要使用 pipe来做为中介的。 pipe buffffer被抽象出来，当作 “内核缓存结构”，一种流缓冲，可以理解成你的数据从写入 “内核流缓存”里面，然后在从一个”内核流缓存“复制到另外一个比如说socket的缓存。全部数据都是在内核空间进行。当然你的数据复制也是不用复制，他那个pipe buffffer本来就是使用page去管理缓存的，就是缓存地址加偏移地址的办法，只是Linus 觉splice的需要很像之前的pipe思想，所以splice就用这个个pipe来作为”内核缓存结构“了。

你可能感兴趣的:(内核,网络,操作系统,linux)

深入了解 Ubuntu 中的 build-essential：开发者的必备工具 scoone Linux ubuntu linux 运维
摘要：本文将介绍Ubuntu系统中的build-essential包，包括其作用、包含的工具和库，以及如何在Ubuntu上安装和使用build-essential。正文：一、什么是build-essential？build-essential是Ubuntu和其他基于Debian的Linux发行版中的一个元包，它包含了编译软件所必需的工具和库。这个包主要面向开发人员，尤其是那些需要从源代码编译软件的
设备树学习（二十三、番外篇-中断子系统之softirq）奔跑的小刺猬设备树设备树原理和实现
既然开始学了，那么还是一次把中断的所有知识都系统的学一下。刚好有蜗窝大神的博客做指引。http://www.wowotech.net/irq_subsystem/soft-irq.html一、前言对于中断处理而言，linux将其分成了两个部分，一个叫做中断handler（tophalf），是全程关闭中断的，另外一部分是deferabletask（bottomhalf），属于不那么紧急需要处理的事情
Hyperlane：Rust 生态中的轻量级高性能 HTTP 服务器库，助力现代 Web 开发 LTPP rust http 服务器开发语言后端前端面试
Hyperlane：Rust生态中的轻量级高性能HTTP服务器库，助力现代Web开发在Rust生态系统中，Hyperlane是一个备受关注的HTTP服务器库，以其轻量级、高性能和易用性脱颖而出。无论你是想快速构建一个高效的Web服务，还是需要支持实时通信的现代应用，Hyperlane都能成为你的理想选择。它不仅简化了网络服务的开发，还提供了强大的功能支持，如HTTP请求解析、响应构建、TCP通信，
代替Windows系统的最佳系统开发：开源、国产与跨平台的选择指南夏末之花 windows 开源
近年来，随着技术自主化和隐私安全需求的提升，越来越多的用户开始寻求Windows系统的替代方案。本文结合国内外热门操作系统及开发工具，分析其核心优势与适用场景，助你找到最适合的开发与日常使用平台。一、开源之王：Linux发行版1.Ubuntu与LinuxMint作为最受欢迎的Linux发行版，Ubuntu和LinuxMint以用户友好性著称，尤其适合从Windows迁移的用户。其内置的软件包管理器
基于 KubeSphere v4 的 Kubernetes 生产环境部署架构设计及成本分析 KubeSphere 云原生 kubernetes 容器云原生
本文作者：运维有术。今天分享的主题是：如何规划设计一个高可用、可扩展的中小规模生产级K8s集群？通过本文的指导，您将掌握以下设计生产级K8s集群的必备技能：集群规划能力合理规划节点规模和资源配置设计高可用的控制平面、计算平面、存储平面架构规划网络拓扑和安全策略制定存储解决方案组件选型能力选择适合的容器运行时(ContainerRuntime)评估和选择网络插件(CNIPlugin)规划监控、日志等
linux基础命令top,Linux 入门命令TOP 10 慧人小圣
原标题：Linux入门命令TOP10作为一只接触Linux不久的小菜鸟，今天厚着脸皮给大家分享一些常用的Linux入门的命令。在Linux“漆黑”的系统中“溜达”之前，先看下“地图”，也就是先了解一下Linux的目录(Directory，可视作“文件夹”)结构。在操作Linux系统中，一切都是文件，而目录是Linux系统组织文件的一种特殊文件。根目录由“/”来表示，可理解为windows系统的“我
信创系统安全优化与持续改进策略有哪些？ weixin_37579147 系统安全安全
信创系统（信息技术应用创新系统）的安全优化与持续改进是保障国产化技术生态安全可靠运行的关键。以下从技术、管理、组织等多个维度提出系统性策略，并结合实际场景展开说明：一、技术层面的安全优化策略1.核心组件安全加固国产化组件漏洞管理：建立针对国产操作系统（如统信UOS、麒麟）、数据库（达梦、OceanBase）的漏洞扫描与修复机制，联合厂商建立漏洞情报共享平台。硬件层可信计算：采用基于国产芯片（如鲲鹏
【前端】面试八股文——输入URL到页面展示的过程帅比九日面试八股文前端面试 javascript
【前端】面试八股文——输入URL到页面展示的过程1.DNS解析当用户在浏览器中输入URL并按下回车时，首先需要将域名转换为IP地址，这个过程称为DNS（域名系统）解析。具体步骤如下：浏览器缓存：浏览器首先检查自身缓存中是否有该域名的IP地址。操作系统缓存：如果浏览器缓存中没有找到，浏览器会向操作系统请求DNS信息。路由器缓存：如果操作系统缓存也没有找到，操作系统会向本地网络中的路由器请求DNS信息
NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题 Chaos_Wang_ NLP常见面试题自然语言处理 rnn 人工智能
普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小，最终趋于接近0，导致模型前层的参数难以更新。原因：在反向传播时，每一层的梯度是通过链式法则计算得到的。因为链式求导中不断乘以一个较小的数值（小于1），随着层数或时间步的增加，梯度将指数级
信息收集综合只不过是胆小鬼罢了信息收集 php web安全安全
1《应用服务器资产分析与角色定性详解》在网络安全领域，对应用服务器的资产分析与角色定性是至关重要的工作。通过对服务器的操作系统、IP资产、端口资产等方面进行详细分析，可以更好地了解服务器的特性与用途，从而为网络安全防护提供有力支持。本文将从多个维度深入探讨应用服务器的资产分析与角色定性方法。一、操作系统分析1.Web大小写敏感性在分析应用服务器的操作系统时，Web大小写敏感性是一个重要的参考因素。
常见Linux指令详解：新手入门指南 PS下载安装免费教程 Linux linux 网络服务器
一、文件和目录管理1.ls：列出目录内容功能：显示指定目录中的文件和文件夹。常用选项：-l：以详细列表形式显示-a：显示所有文件，包括隐藏文件-h：以人类可读的格式显示文件大小示例：ls-lh/home/user2.cd：改变当前工作目录功能：切换当前的工作目录。示例：cd/var/www3.mkdir：创建新目录功能：创建一个或多个新目录。示例：mkdirmy_projectmkdir-ppro
2025年计算机毕业设计springboot 智慧社区管理系统 zhihao503 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于智慧社区管理系统的研究，现有成果多聚焦于单一功能模块的数字化（如物业缴费或门禁系统），缺乏对多场景服务整合与用户体验优化的系统性研究。国外研究侧重物联网技术应用（如新加坡“智慧国”计划中的社区传感器网络），而国内研究更多关注管理平台的基础框架设计，但针对业主、物业、设备多方
Linux虚拟机安装Redis lllsure Redis linux 运维服务器 redis
1.前提准备安装好虚拟机，这里使用Centos7演示；安装好Xshell，Xftp，一个用来远程登录虚拟机，一个用来远程传输文件。Xshell，Xftp下载地址：家庭/学校免费-NetSarangWebsiteRedis源码包，下载地址：Indexof/releases/2.将安装包通过Xftp传到虚拟机上并解压解压指令：tar-zxvfredis-6.2.6.tar.gz3.引入gcc依赖因为R
Kafka 数据写入问题喝醉酒的小白 DBA kafka 分布式
目录标题分析思路1.**生产者配置问题**：Kafka生产者的配置参数生产者和消费者的处理确定并优化2.**网络问题**：3.**Kafka集群配置问题**：unclean.leader.election.enable4.**Zookeeper配置问题**：5.**JVM参数调优**：6.**副本因子和同步复制**：分析思路针对您提到的Kafka数据写入问题，以下是一些具体的原因和排查命令：1.生
微信小程序面试内容整理-图片优化不务正业的猿面试微信小程序前端微信小程序 notepad++小程序面试职场和发展
在微信小程序中，图片优化是提升加载速度、节省网络带宽和提高用户体验的重要步骤。图片通常是小程序页面中的主要资源，合理的图片优化能显著提高小程序的性能，尤其是在用户网络状况较差的情况下。1.选择合适的图片格式不同的图片格式有不同的特点，选择合适的格式能够有效减小图片的大小，同时保证图片质量。
eNSP-DHCP服务 2022级计算机网络一班何宏超网络服务器 linux
DHCP：动态主机配置协议DHCP（DynamicHostConfigurationProtocol，动态主机配置协议）DHCP用途：用来分配IP地址等网络参数一、基于全局地址池的DHCP服务器1、在R1上配置G0/0/1的IP地址[R1]intg0/0/1[R1-GigabitEthernet0/0/1]ipadd192.168.100.254242、创建全局地址池[R1]ippoolpool1
vim在Linux中的作用 U_p_ Linux linux 运维服务器
你这里产生的疑惑其实源于对文件类型和文件扩展名的一些误解。一、什么是普通文件？在Linux中，所有的文件默认都是普通文件，不管你命名为：mkhahamkhaha.txtmkhaha.sh这些名字或者扩展名本身并不决定文件的类型，它们只是为了方便人类识别用途而已。Linux系统中，并不会严格依赖扩展名来决定文件类型。你看到的mkhaha文件的类型：-rwxr-xr-x开头的-表示它是普通文件，而非目
计算机端口的作用 U_p_ 计算机网络知识运维服务器 windows linux
计算机端口的作用在计算机网络中，端口（Port）的作用是用于区分不同的网络服务和应用进程，使得计算机能够在同一个IP地址上同时运行多个网络服务。1.端口的基本概念端口是软件层面的概念，用于标识同一设备上的不同网络服务。端口号是0~65535之间的整数，由操作系统管理。端口号通常与IP地址结合使用，形成IP:端口（如192.168.1.1:80）来标识特定的网络服务。2.端口的分类端口号范围：0-6
「TCP/IP」图解TCP的通信机制肥肥技术宅 java tcp/ip 网络网络协议
TCP（TransmissionControlProtocol）是传输控制协议，其作用于传输层，是一种提供了面向连接通信服务的协议看TCP的英文全称就知道，其主要作用就是传输、控制，传输的是数据，控制的是在传输过程中丢包后的重发、分包乱序后的有序重组、控制数据传输的速率防止网络拥塞等这也是我们口中一直说的TCP是一种可靠的传输协议的原因。本文就将对TCP的作用过程以及一些机制进行讲解TCP的通信机
从数据中心机房来看云服务器的可用性与性能！数据中心云服务器
数据中心机房是云服务器的物理承载基础，机房的硬件设施、运行环境和管理水平直接影响云服务器的可用性和性能表现。了解数据中心机房，明白哪些因素可能导致云服务器出现故障或性能下降，就能够依据数据中心机房的实际情况做出更明智的决策，保障自身业务的稳定运行。数据中心机房的硬件设施是保障云服务器可用性的基础。网络设备作为数据传输的桥梁，高性能的路由器、交换机等确保了数据的快速、准确传输。电力供应则是云服务器运
HTTP 408 Request Timeout 请求超时，远程 GitHub 服务器断开了连接 linff911 http github 服务器
你的gitpush遇到了HTTP408RequestTimeout错误，说明请求超时，远程GitHub服务器断开了连接。解决方法：检查你的网络(1)测试GitHub是否正常pinggithub.com如果返回：Requesttimedout.说明你的网络连接GitHub有问题，建议：尝试换个网络（如手机热点）使用VPN连接GitHub稍后再试如果网络没有问题，修改Git连接方式(1)使用SSH代替
深入学习 DNS 域名解析 dns解析
一、前言在平时工作中相信大家都离不开DNS解析，因为DNS解析是互联网访问的第一步，无论是使用笔记本浏览器访问网络还是打开手机APP的时候，访问网络资源的第一步必然要经过DNS解析流程。二、DNS是什么DNS（域名系统DomainNameSystem），它是一个记录域名和Ip地址相互映射的一个系统，是互联网的“电话簿”，负责将人类可读的域名（如example.com）转换为机器可识别的IP地址（如
Python自动化运维开发系列—CICD项目 weixin_46240874
导语都忘记是什么时候知道python的了，我是搞linux运维的，早先只是知道搞运维必须会shell,要做一些运维自动化的工作，比如实现一些定时备份数据啊、批量执行某个操作啊、写写监控脚本什么的。后来发现工作量大的时候shell开始变慢，实现某个功能使用shell感觉力不从心，听人说python能实现shell能做的一切功能，而且开发效率高，速度快，慢慢的就认识了python,多多少少看点简单的东
企业数据存储的几种方式对比存储
在当今信息化时代，企业常见的数据存储方式包括本地存储、云存储、网络附加存储（NAS）、对象存储等，它们在安全性、扩展性与成本方面各有优势。其中，云存储凭借高弹性、低维护成本等特点备受青睐。它利用网络将数据托管于远程服务器，企业无需自建机房，也能快速扩容并进行全球化部署，极大降低了初期投入成本。这种方式实现了随用随付、自动备份，为众多中小型企业提供了便捷且经济的选择。一、本地存储本地存储是指企业将数
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
QT多媒体播放器类：QMediaPlayer 程序先锋 QT界面开发 qt 开发语言
QMediaPlayer是QtMultimedia模块中的核心类，用于播放音频和视频媒体文件。它支持本地文件、网络流媒体以及实时数据源，具备播放控制、状态管理、元数据访问等功能。QMediaPlayer的基本用法可能包括设置媒体源、控制播放（播放、暂停、停止）、调整音量、监听播放状态变化等。1.信号（Signals）信号用于通知外部对象播放器状态、媒体属性和错误事件的变化。（1）媒体改变voidm
【一起学Rust | Tauri2.0框架】基于 Rust 与 Tauri 2.0 框架实现软件开机自启广龙宇 Tauri2应用开发一起学Rust rust 策略模式开发语言
文章目录前言一、准备工作1.1环境搭建1.2创建Tauri项目1.3添加依赖二、实现开机自启的基本原理2.1开机自启的基本概念2.2Tauri应用的生命周期三、Windows平台实现3.1Windows注册表机制3.2实现步骤3.3注意事项四、Linux平台实现4.1Linuxsystemd服务4.2实现步骤4.3Rust实现4.4注意事项五、macOS平台实现5.1macOSLaunchAgen
linux下安装卸载永中office步骤,永中集成Office For Linux安装图文指南及简介 weixin_39625975
永中集成OfficeForLinux安装图文指南及简介永中集成Office在一套标准的用户界面下集成了文字处理、电子表格和简报制作三大应用，提供自选图形、艺术字、剪贴画、图表和科教编辑器等附加功能；基于创新的数据对象储藏库专利技术，有效解决了Office各应用之间的数据集成问题，构成了一套独具特色的集成办公软件。永中集成Office用户界面和使用方式与常见Office相似，易学易用；能够双向精确兼
永中office linux卸载,安装永中Office for linux 徐瑞涛永中office linux卸载
安装要求用户具有root的权限，如当前用户不具有root权限，可用如下方式得到：1.以具有root权限的用户重新登录。2.在终端窗口里使用suroot切换到root。3.在终端窗口里使用sudo./setup临时获得root权限，执行安装程序(这里先要进入安装程序的目录；setup是永中Office的安装可执行程序)。然后，就可以执行setup运行安装向导，依据向导提示完成安装。---------
linux下安装卸载永中office步骤,永中office2012 for Linux的安装胡大渔
以LinuxMint为例讲述永中office2012的安装永中office2012forLinux的安装永中office符合中国人的使用习惯，同时兼容MSOffice各种文档格式。个人认为比开源的libreoffice更适合国人使用。下面就以office2012forLinux为例，讲述一下永中Office的安装。1、首先下载office2012forLinux。百度一下即可，下载后应该得到一个Y
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag