言之命至9012

[Linux 进程basic] task_struct&mm_map&查看进程&进程状态&进程优先级&环境变量

- 进程的概念
- - 管理的本质
  - PCB
- task_struct
- - task_ struct内容分类
  - 进程切换
  - 前台进程和后台进程
  - 组织进程
- 查看进程
- - 通过系统调用获取进程标示符
  - proc目录
  - 通过系统调用获取进程标示符
  - 通过系统调用创建进程-fork初识
- fork快速入门
- - 父子进程关系
  - 两次返回值
  - fork用if分流
  - fork总结
- 进程状态
- - Running
  - Sleeping
  - Disk sleep
  - Stoppped
  - Dead
  - Zombie
  - - 僵尸状态快速入门
    - 为什么要有僵尸状态？僵尸状态进程创建的意义
    - 模拟僵尸状态
    - 总结僵尸进程
  - 孤儿进程
- 进程优先级
- - 什么是优先级
  - 排队
  - 查看系统进程
  - PRI and NI
  - 用top和renice命令更改已存在进程的nice
- 多进程概念
- 环境变量
- - 理解命令和环境变量
  - 常见环境变量
  - - PATH
    - - 方法一
      - 方法二
    - HOME
    - SHELL
  - 环境变量相关命令
  - - env
    - 如何让我们自己的命令也能够像可执行程序执行
  - 和环境变量相关的命令
  - 环境变量组织
  - 代码获取环境变量
  - 环境变量访问方式
  - - 代码获取
    - - 命令行参数
      - 通过第三方变量environ获取
    - 系统调用获取
  - 环境变量通全局属性
- 进程地址空间
- - Linux中的进程地址空间排布规则
  - 进程独立性
  - - 用例子证明
    - 进程的写时拷贝技术
  - 虚拟地址映射
  - - 为什么要有地址空间？
    - 地址空间进程独立性小结
    - 执行文件的分段（补充）
- 进程调度队列(极简)
- - 一个CPU拥有一个runqueue
  - 优先级
  - 活动队列
  - 过期队列
  - active指针和expired指针
  - 进程调度算法
- 总结

进程的概念

描述进程的概念我们有下面两个方式

课本概念： 程序的一个执行实例，正在执行的程序等。
内核观点： 担当分配系统资源（CPU时间，内存）的实体。

当你的代码进行编译链接后便会生成一个可执行程序，这个可执行程序本质上是一个文件，是放在磁盘上的。当我们双击这个可执行程序将其运行起来时，本质上是将这个程序加载到内存当中了，因为只有加载到内存后，CPU才能对其进行逐行的语句执行，而一旦将这个程序加载到内存后，我们就不应该将这个程序再叫做程序了，严格意义上将应该将其称之为进程。

##理解管理和PCB

管理的本质

管理我们需要理解的是：决策和执行

管理是什么管是在管被管理对象的，理是在理清楚数据的

任何管理本质上都可以转化为先描述后组织

对任意对象的管理就被转化成了一些数据结构去方便管理

PCB

一个操作系统要管理就需要先描述再组织，进程当然也要被管理，那么描述进程的结构体叫做PCB，Linux中具体的PCB就叫做task-struct，会被读入RAM中，然后包含着进程的信息

系统当中可以同时存在大量进程，使用命令ps aux便可以显示系统当中存在的进程。

而当你开机的时候启动的第一个程序就是我们的操作系统（即操作系统是第一个加载到内存的），我们都知道操作系统是做管理工作的，而其中就包括了进程管理。而系统内是存在大量进程的，那么操作系统是如何对进程进行管理的呢？

这时我们就应该想到管理的六字真言：先描述，再组织。操作系统管理进程也是一样的，操作系统作为管理者是不需要直接和被管理者（进程）直接进行沟通的，当一个进程出现时，操作系统就立马对其进行描述，之后对该进程的管理实际上就是对其描述信息的管理。

进程信息被放在一个叫做进程控制块的数据结构中，可以理解为进程属性的集合，课本上称之为PCB（process control block）。

操作系统将每一个进程都进行描述，形成了一个个的进程控制块（PCB），并将这些PCB以双链表的形式组织起来。操作系统对进程的管理实际上就变成了对该双链表的增、删、查、改等操作。

task_struct

task_ struct内容分类

内容	内容描述
标示符（pid，ppid）	描述本进程的唯一标示符，用来区别其他进程。状态: 任务状态，退出代码，退出信号等。
优先级	相对于其他进程的优先级
程序计数器（PC）	程序中即将被执行的下一条指令的地址。
内存指针	内存指针可以帮我们找到代码和数据包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针
上下文数据	进程执行时处理器的寄存器中的数据。
I／O状态信息	包括显示的I/O请求,分配给进程的I／O设备和被进程使用的文件列表。
记账信息	可能包括处理器时间总和，使用的时钟数总和，时间限制，记账号等。
连接信息	数据结构要连起来
时间片	操作系统进程控制块的时间片轮转算法

进程切换

CPU只有一套寄存器，计算需要将我们的内存数据移动到寄存器中，形成当前进程的上下文数据
进程被切换可能在任何时间点被切换，要么是当前时间片到了，要么被当前更高优先级的进程抢占了
如果进程直接走了，下一个进程覆盖了上一个进程，那么上一个进程应该如何回来？
- 类比大学时征兵的例子，引征入伍的时候肯定需要首先保留学籍，为了回来的时后可以继续学习之前的内容
- 对于进程来说只要我们保存寄存器中的上下文数据就可以了，这就是恢复上下文
- 保存上下文数据的方法是保存到进程控制块task_struct中（不是特别准确）

前台进程和后台进程

对于前台进程来说，后台进程指令是无法影响的，我们也可以运行可执行程序，创建一个后台进程

./[name] &

此时的后台进程是不影响后台指令的输入的

后台进程如何删除,单纯Ctrl+c是不能的，那只能结束前台进程

kill -9 [pid]

组织进程

可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里

CPU找到task_struct之后，CPU开始循环执行取值令，分析指令，执行指令

CPU只需要向指令寄存器eip去拿指令就可以了，所谓的函数跳转，分支判断，循环等，都是通过修改eip完成的

查看进程

通过系统调用获取进程标示符

大多数进程信息同样可以使用top和ps这些用户级工具来获取

ps aux 
ps axj

ps命令与grep命令搭配使用，即可只显示某一进程的信息。

proc目录

ls /proc

在根目录下有一个名为proc的系统文件夹。

文件夹当中包含大量进程信息，其中有些子目录的目录名为数字。

这些数字其实是某一进程的PID，对应文件夹当中记录着对应进程的各种信息。跟上的话查看具体进程信息

ls /proc/[pid]

这是我们会发现进程都有一个cwd，就叫做当前进程的当前工作目录

通过系统调用获取进程标示符

进程id（PID）
父进程id（PPID）

#include 
#include 
#include 
int main()
{
	printf("pid: %d\n", getpid());
	printf("ppid: %d\n", getppid());
	return 0;
}

通过系统调用创建进程-fork初识

代码级别创建进程

fork的功能就是创建子进程

fork快速入门

父子进程关系

fork创建子进程，fork之前的代码有父进程执行，fork之后的代码，默认情况父子都可以执行

#include 
#include 
#include 
int main()
{
    cout<<"I am running"<<endl;//父进程
	int ret = fork();
    //下面开始父子进程
	printf("hello proc : %d!, ret: %d\n", getpid(), ret);
	sleep(1);
	return 0;
}

父子进程代码共享，但是数据？

fork有了两个进程，这两个进程谁先被调度？不确定，要取决于OS的调度算法

两次返回值

fork函数会有两次返回值，给父进程返回子进程的pid，给子进程返回0

#include     
#include     
#include     
int main()
{    
  pid_t  ret = fork();    
  printf("hello proc : %d!, ret: %d\n", getpid(), ret);    
  sleep(1);    
  return 0;    
}

fork用if分流

fork函数创建出来的子进程与其父进程共同使用一份代码，但我们如果真的让父子进程做相同的事情，那么创建子进程就没有什么意义了。

实际上，在fork之后我们通常使用if语句进行分流，即让父进程和子进程做不同的事。

fork函数的返回值：
1、如果子进程创建成功，在父进程中返回子进程的PID，而在子进程中返回0。
2、如果子进程创建失败，则在父进程中返回 -1。

既然父进程和子进程获取到fork函数的返回值不同，那么我们就可以据此来让父子进程执行不同的代码，从而做不同的事。

int main()
{
	int ret = fork();
	if(ret < 0){
		perror("fork");
		return 1;
	}
	else if(ret == 0){ //child
		printf("I am child : %d!, ret: %d\n", getpid(), ret);
	}else{ //father
		printf("I am father : %d!, ret: %d\n", getpid(), ret);
	}
	sleep(1);
	return 0;
}

区别于此前的if分支一次只能够执行一个，现在fork可以同时执行超过一个分支，因此我们可以通过if来实现分流，控制父进程和子进程

fork总结

所以说当前阶段fork的重点就是习惯使用分流父子进程操作

进程状态

一个进程从创建而产生至撤销而消亡的整个生命期间，有时占有处理器执行，有时虽可运行但分不到处理器，有时虽有空闲处理器但因等待某个时间的发生而无法执行，这一切都说明进程和程序不相同，进程是活动的且有状态变化的，于是就有了进程状态这一概念。

新建，运行，就绪，挂起，阻塞等待，退出，这些都是某个进程的一些状态

这些都是操作系统级别的理解，也就是应该符合操作系统的共性，所以我们可以有一个具体的操作系统，下面来学习Linux的进程状态

状态能数据化吗？都是可以数据化的，进程的状态信息就保存在了task_struct中

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
    "R (running)", /* 0 */
    "S (sleeping)", /* 1 */
    "D (disk sleep)", /* 2 */
    "T (stopped)", /* 4 */
    "t (tracing stop)", /* 8 */
    "X (dead)", /* 16 */
    "Z (zombie)", /* 32 */
};

注意：在Linux操作系统当中我们可以通过 ps aux 或 ps axj 命令查看进程的状态。

Running

**R运行状态（running）: 并不意味着进程一定在运行中，它表明进程要么是在运行中要么在运行队列里。**也就是说，可以同时存在多个R状态的进程。

P.S.: 所有处于运行状态，即可被调度的进程，都被放到运行队列当中，当操作系统需要切换进程运行时，就直接在运行队列中选取进程运行。

如果是1个CPU，可不可以同时存在多个R状态的进程

其实进程是R状态，不代表在运行，代表的是可以调度

操作系统除了会维护一个表示进程信息的task_struct，还会维护一个调度队列

CPU调度的话就可以在调度队列中，进行选择调度，这里启用的就是FIFO的调度算法

Sleeping

S睡眠状态（sleeping): 意味着进程在等待事件完成（这里的睡眠有时候也叫做可中断睡眠（interruptible sleep））。

浅度睡眠的意义在于可以被唤醒也可以被杀掉

我们可以主动的赋予一个进程休眠状态

sleep(1000);

代码当中调用sleep函数进行休眠100秒，在这期间我们若是查看该进程的状态，则会看到该进程处于浅度睡眠状态。

Disk sleep

D磁盘休眠状态（Disk sleep）有时候也叫不可中断睡眠状态（uninterruptible sleep），在这个状态的进程通常会等待IO的结束。

与TASK_INTERRUPTIBLE状态类似，进程处于睡眠状态，但是此刻进程是不可中断的。不可中断，指的并不是CPU不响应外部硬件的中断，而是指进程不响应异步信号。

绝大多数情况下，进程处在睡眠状态时，总是应该能够响应异步信号的。否则你将惊奇的发现，kill -9竟然杀不死一个正在睡眠的进程了！于是我们也很好理解，为什么ps命令看到的进程几乎不会出现TASK_UNINTERRUPTIBLE状态，而总是TASK_INTERRUPTIBLE状态。

而TASK_UNINTERRUPTIBLE状态存在的意义就在于，内核的某些处理流程是不能被打断的。如果响应异步信号，程序的执行流程中就会被插入一段用于处理异步信号的流程（这个插入的流程可能只存在于内核态，也可能延伸到用户态），于是原有的流程就被中断了。（参见《linux内核异步中断浅析》）

在进程对某些硬件进行操作时（比如进程调用read系统调用对某个设备文件进行读操作，而read系统调用最终执行到对应设备驱动的代码，并与对应的物理设备进行交互），可能需要使用TASK_UNINTERRUPTIBLE状态对进程进行保护，以避免进程与设备交互的过程被打断，造成设备陷入不可控的状态。这种情况下的TASK_UNINTERRUPTIBLE状态总是非常短暂的，通过ps命令基本上不可能捕捉到。

Stoppped

T停止状态（stopped）：可以通过发送 SIGSTOP 信号给进程来停止（T）进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。

手动暂停状态

kill -SIGSTOP

手动继续执行

kill -SIGCONT

我们如果对T状态的进程操作杀死进程，那么只有在唤醒的时候才会回收资源

后期会学到通过信号发送和键盘发送信号的几种方式来传递停止信号Ctrl+Z

Dead

X死亡状态（dead）：这个状态只是一个返回状态，你不会在任务列表里看到这个状态。

Zombie

僵尸状态快速入门

僵死状态（Zombies）是一个比较特殊的状态。当进程退出并且父进程（使用wait()系统调用,后面讲）没有读取到子进程退出的返回代码时就会产生僵死(尸)进程

僵死进程会以终止状态保持在进程表中，并且会一直在等待父进程读取退出状态代码。

所以，只要子进程退出，父进程还在运行，但父进程没有读取子进程状态，子进程进入Z状态

举一个警察赶到犯罪现场的例子

封锁现场
采集有效信息
清理现场

拥有前两个状态的就是僵尸状态，而清理现场最后一个状态的是退出状态，

进程退出，系统层面，曾经申请的资源并不是立即释放，而是暂存一段时间，供OS(父进程)读取，也就是僵尸状态

为什么要有僵尸状态？僵尸状态进程创建的意义

我们先回答下面的一个问题：任务完成的时候，调用方应不应该知道任务完成的怎么样了？

当然是应该知道!!

此时我们想到我们在main函数的返回值，这个退出码其实就是代表了程序运行的结果

int main()
{
	...
	return 0;
}

我们说在Linux中有一个$?命令，这个表示的就是在命令行中，最近的一次进程退出时的退出码

echo $?  # 我们可以通过这个指令来先是上一次进程退出的退出码

所以说main函数的退出码就是表示任务完成的成果，也就是我们为什么一直需要return 0，这就是退出码

进程退出的信息（退出码）是会暂时保存起来，保存在task_struct中，如果不读取的话，此时相关的数据就不应该被释放，这种就是僵尸进程

模拟僵尸状态

#include 
#include
#include 
int main()
{
    printf("I am running ....\n"); 
    pid_t id= fork();
    if(id==0){
        //child
        int count=5;
        while(count){
            printf("I am a child,pid: %d,ppid: %d\n,count: %d\n",
                   getpid(),getppid(),--count);
            sleep(1);
        }
        printf("child quit");                                                 
        exit(1);                                                               
    }else if(id>0) {                                                           
        //father    
        while(1){                                                             
            printf("I am a father,pid: %d,ppid: %d\n",getpid(),getppid());  
            sleep(1); 
        }
    }else{       
        //do nothing       
    }     
    return 0;
}

输入以下脚本查看状态

while :; do ps aux | head -1 && ps aux |grep myproc| grep -v grep; echo "################################"; sleep 1; done

可以看到子进程变成了僵尸进程，此时父进程还在执行

总结僵尸进程

僵尸进程是什么？

僵尸进程是已经退出，但是相关资源还没有被回收，为了表示这个状态，我们称之为Z状态

往往是子进程先退出而父进程没有对子进程的退出信息进行读取

为什么要有僵尸进程？

因为我们必须保证这个进程跑完，作为这个进程的父进程，必须知道布置给子进程的任务完成的怎么样了，需要起码知道结果

僵尸进程的危害？

僵尸进程的退出状态必须一直维持下去，因为它要告诉其父进程相应的退出信息。可是父进程一直不读取，那么子进程也就一直处于僵尸状态。

僵尸进程的退出信息被保存在task_struct(PCB)中，僵尸状态一直不退出，那么PCB就一直需要进行维护。

若是一个父进程创建了很多子进程，但都不进行回收，那么就会造成资源浪费，因为数据结构对象本身就要占用内存。

僵尸进程申请的资源无法进行回收，那么僵尸进程越多，实际可用的资源就越少，也就是说，僵尸进程会导致内存泄漏。

孤儿进程

父进程如果提前退出，那么子进程后退出，进入Z之后，那该如何处理呢？

子进程先退出而父进程没有对子进程的退出信息进行读取，称为“僵尸进程”

父进程先退出，子进程就称之为“孤儿进程”

孤儿进程被1号init进程领养，当然要有init进程回收喽。也就是说孤儿进程会被父亲操作系统领养

#include 
#include 
#include 
int main()
{
    pid_t id = fork();
    if(id < 0){
        perror("fork");
        return 1;
    }
    else if(id == 0){//child
        printf("I am child, pid : %d\n", getpid());
        sleep(10);
    }else{//parent
        printf("I am parent, pid: %d\n", getpid());
        sleep(3);
        exit(0);
    }
    return 0;
}

Ptrace 详解

进程优先级

cpu资源分配的先后顺序，就是指进程的优先权（priority）。

优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用，可以改善系统性能。

还可以把进程运行到指定的CPU上，这样一来，把不重要的进程安排到某个CPU，可以大大改善系统整体性能。

⚠️ 虽然我们是可以改的，但是最好不要改变操作系统所控制的优先级

什么是优先级

优先级本质上是谁先占有资源和谁后占有资源的问题

权限是能不能获得，而优先级值得是谁先谁后

###为什么要有优先级

资源有限的，进程是可以有多个的，通过标优先级是可以提高系统性能的（其实改善的是我们想要的性能，因为改善这个，那个就会收到影响，对于操作系统而言似乎是没有什么性能提升的）

进程需要优先级设置，进行排序

排队

进程需要排队，如何理解进程需要排队

进程排队：PCB去排，PCB属性信息放到CPU里面计算

查看系统进程

在linux或者unix系统中，用ps –l命令则会类似输出以下几个内容：

ps -l

信息	描述
UID	代表执行者的身份
PID	代表这个进程的代号
PPID	代表这个进程是由哪个进程发展衍生而来的，亦即父进程的代号
PRI	代表这个进程可被执行的优先级，其值越小越早被执行
NI	代表这个进程的nice值

PRI and NI

PRI也还是比较好理解的，即进程的优先级，或者通俗点说就是程序被CPU执行的先后顺序，此值越小进程的优先级别越高

NI是nice值，其表示进程可被执行的优先级的修正数值，进程的nice值不是进程的优先级，他们不是一个概念，但是进程nice值会影响到进程的优先级变化。可以理解nice值是进程优先级的修正修正数据

PRI值越小越快被执行，那么加入nice值后，将会使得PRI变为：PRI(new)=PRI(old)+nice，这里的old默认为80

当nice值为负值的时候，那么该程序将会优先级值将变小，即其优先级会变高，则其越快被执行

调整进程优先级，在Linux下，就是调整进程nice值

nice其取值范围是-20至19，一共40个级别。

用top和renice命令更改已存在进程的nice

top

进入top后按“r”–>输入进程PID–>输入nice值

另外还有renice操作

若是想将NI值调为负值，也就是将进程的优先级调高，需要使用sudo命令提升权限。

多进程概念

竞争性: 系统进程数目众多，而CPU资源只有少量，甚至1个，所以进程之间是具有竞争属性的。为了高效完成任务，更合理竞争相关资源，便具有了优先级

独立性: 多进程运行，需要独享各种资源，多进程运行期间互不干扰

并行: 多个进程在多个CPU下分别，同时进行运行，这称之为并行

并发: 多个进程在一个CPU下采用进程切换的方式，在一段时间之内，让多个进程都得以推进，称之为并发

环境变量

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数

使用场景：我们在编写C/C++代码的时候，在链接的时候，从来不知道我们的所链接的动态静态库在哪里，但是照样可以链接成功，生成可执行程序，原因就是有相关环境变量帮助编译器进行查找。

环境变量通常具有某些特殊用途，还有在系统当中通常具有全局特性

为什么要有环境变量？

来确认当前所处的状态，比如说，我当前是谁，当前终端是谁…

理解命令和环境变量

命令本身其实是一个可执行程序，诸如ls的命令可以响应，但是自己随便生成的一个可执行程序是无法随便响应的，只能在当前目录响应

这是因为自己的程序没有添加环境变量

常见环境变量

PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。

PATH

查找方式

echo $NAME //NAME:你的环境变量名称

这里我们来找到环境变量

echo $PATH

这时如果我们要我们的某一个自己写的可执行程序也能在任意位置执行怎么操作？

方法一

我们找一下ls的位置

所以说如果我们把我们的可执行文件放到usr/bin中的时候我们可以在任意位置执行这个可执行程序了

sudo cp -f [filename] /usr/bin

然而这个方法是不推荐的，因为这会污染环境变量

方法二

推荐的方法是在PATH中更新环境变量

export PATH=$PATH:[路径]

然而这个PATH按照如上操作的话是每次登录的时候都会更新的

HOME

echo $HOME

SHELL

bash其实就是系统当中的命令，该命令跑起来之后形成一个线程进行解释我们的命令

环境变量相关命令

echo: 显示某个环境变量值
export: 设置一个新的环境变量
env: 显示所有环境变量
unset: 清除环境变量
set: 显示本地定义的shell变量和环境变量

env

echo "hello linux" > /dev/pts/0

这个就是终端设备输出，奇怪我这里没有SSH_TTY显示环境变量

实际上我们可以用who来看

如何让我们自己的命令也能够像可执行程序执行

方式一：将可执行程序拷贝到环境变量PATH的某一路径下。

sudo cp [dirname] /usr/bin

方式二：将可执行程序所在的目录导入到环境变量PATH当中。

export PATH=$PATH:/绝对路径

和环境变量相关的命令

1、echo：显示某个环境变量的值。

2、export：设置一个新的环境变量。

3、env：显示所有的环境变量。

4、set：显示本地定义的shell变量和环境变量。

5、unset：清除环境变量。

有关环境变量

环境变量名称	表示内容
PATH	命令的搜索路径
HOME	用户的主工作目录
SHELL	当前Shell
HOSTNAME	主机名
TERM	终端类型
HISTSIZE	记录历史命令的条数
SSH_TTY	当前终端文件
USER	当前用户
MAIL	邮箱
PWD	当前所处路径
LANG	编码格式
LOGNAME	登录用户名

环境变量组织

系统当中环境变量的组织是这样的

每个程序都会收到一张环境变量表，环境表是一个字符指针数组，每个指针指向一个以’\0’结尾的环境字符串，最后一个字符指针为空。

代码获取环境变量

我们说main函数其实是可以有参数的

int main(int argc, char *argv[], char *envp[])

char *argv[]

其中这个argv值得是命令行参数数组，接收的是命令行参数，其实我们可以理解ls是一个C语言写的程序，然后接收这个-a、-l`等选项的呢，本质即使main函数是接收的这个命令行参数数组

main函数的前两个参数，main函数的第二个参数是一个字符指针数组，数组当中的第一个字符指针存储的是可执行程序的位置，其余字符指针存储的是所给的若干选项，最后一个字符指针为空，而main函数的第一个参数代表的就是字符指针数组当中的有效元素个数。

int main(int argc, char *argv[], char *envp[])
{
    if(argc == 2){
        if(strcmp(argv[1], "-a") == 0){
            printf("hello allen\n");
        }
        else if(strcmp(argv[1], "-b") == 0){
            printf("hello world!\n");
        }
        else{
            printf("hello default!\n");
        }
    }
    printf("argc : %d\n", argc);
    for(int i=0; i < argc; i++){
        printf("argv[%d]: %s\n", i, argv[i]);
    }
}

char *envp[]

这个就是环境变量信息，envp存储结构就是命令行参数

系统调用这个程序的时候传入的环境变量，

环境变量访问方式

代码获取

命令行参数

#include 
int main(int argc, char *argv[], char *env[])
{
    int i = 0;
    for(; env[i]; i++){
        printf("%s\n", env[i]);
    }
    return 0;
}

通过第三方变量environ获取

二级指针指向环境变量指针

由于libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时要用extern声明。

#include 
int main(int argc, char *argv[])
{
    extern char **environ;
    int i = 0;
    for(; environ[i]; i++){
        printf("%s\n", environ[i]);
    }
    return 0;
}

系统调用获取

getenv

#include 
#include 
int main()
{
    printf("%s\n", getenv("PATH"));
    return 0;
}

常用getenv和putenv函数来访问特定的环境变量。

环境变量通全局属性

环境变量通常具有全局属性，可以被子进程继承下去

#include 
#include 
int main()
{
    char * env = getenv("MYENV");
    if(env){
        printf("%s\n", env);
    }
    return 0;
}

直接查看，发现没有结果，说明该环境变量根本不存在

导出环境变量

export MYENV="hello world"

再次运行程序，发现结果有了！说明：环境变量是可以被子进程继承下去

进程地址空间

进程地址空间是内存中的内核数据结构mm_struct

其实这个图就叫做进程地址空间

注意该图显示的所有内容都不是内存，或者和内存没有直接关系

我们说当又有一个进程被创建出来的时候，系统就会生成一个mm_struct和一个task_struct，这些东西是存在内存中的

Linux中的进程地址空间排布规则

#include 
#include 
#include 
#include
#include 

int main(int argc, char *argv[], char *envp[])
{
    printf("code addr: %p\n", main);
    char *str = "hello world";
    printf("read only addr: %p\n", str);
    printf("init addr: %p\n", &g_val);
    printf("uninit addr: %p\n", &g_unval);

    int *p = malloc(10);
    printf("heap addr: %p\n", p);

    printf("stack add: %p\n", &str);
    printf("stack add: %p\n", &p);

    for (int i = 0; i < argc; i++)
    {
        printf("args addr: %p\n", argv[i]); // ls -a -l
    }
    int i = 0;
    while (envp[i])
    {
        printf("env addr: %p\n", envp[i]);
        i++;
    }
    return 0;
}

这样的排布是符合上图的

进程独立性

用例子证明

为了演示进程之间的独立性和解决上述的进程地址空间和内存有没有关系，我们可以做下面的测试

如果我们让父子进程打印输出一下这个全局变量的值和地址我们会发现输出出来的变量值和地址是一模一样的，因为子进程按照父进程为模版，而父子并没有对变量进行进行任何修改

int g_val = 100;

int main(int argc, char *argv[], char *envp[])
{
    pid_t id = fork();
    //int id = fork();
    if(id == 0){
        //child
        printf("child: pid: %d, ppid : %d, g_val: %d, &g_val: %p\n", 
               getpid(), getppid(), g_val, &g_val);
    }
    else{
        //father
        sleep(2);
        printf("father: pid: %d, ppid : %d, g_val: %d, &g_val: %p\n", 
               getpid(), getppid(), g_val, &g_val);
    }
    sleep(1);
}

接下来我们修改一下代码，我们让子进程把全局变量修改一下

我们的问题是g_val的地址是否变化，其次是如果子进程先运行，然后修改了g_val，然后观察父进程来打印g_val，看看是修改前的还是修改后的

int g_val = 100;

int main(int argc, char *argv[], char *envp[])
{
    pid_t id = fork();
    //int id = fork();
    if(id == 0){
        //child
        g_val=200;
        printf("child: pid: %d, ppid : %d, g_val: %d, &g_val: %p\n", 
               getpid(), getppid(), g_val, &g_val);
    }
    else{
        //father
        sleep(2);
        printf("father: pid: %d, ppid : %d, g_val: %d, &g_val: %p\n", 
               getpid(), getppid(), g_val, &g_val);
    }
    sleep(1);
}

结果是父进程虽然和子进程仍然是一个地址，但是值确是独立的

所以通过这个测试我们可以了解到进程之间是有独立性的

同时还有下面几点特性 :

变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
地址值是一样的，说明，该地址绝对不是物理地址，是虚拟地址
在Linux地址下，这种地址叫做虚拟地址
我们在用C/C++语言所看到的地址，全部都是虚拟地址！
物理地址，用户一概看不到，由OS统一管理，OS必须负责将虚拟地址转化成物理地址。

进程的写时拷贝技术

我们说之前我们曾在string的模拟实现中有提到一个写时拷贝技术，也就是通过计数+写时拷贝来解决浅拷贝的析构多次问题，那么这里的进程独立性是怎么解决的呢？其实用到的也就是写时拷贝技术

而当子进程刚刚被创建时，子进程和父进程的数据和代码是共享的，即父子进程的代码和数据通过页表映射到物理内存的同一块空间。只有当父进程或子进程需要修改数据时，才将父进程的数据在内存当中拷贝一份，然后再进行修改。

例如，子进程需要将全局变量g_val改为200，那么此时就在内存的某处存储g_val的新值，并且改变子进程当中g_val的虚拟地址通过页表映射后得到的物理地址即可。

虚拟地址映射

所以我们说进程地址空间的内容是被转化成了虚拟地址空间，映射在内存中

[Linux 进程basic] task_struct&mm_map&查看进程&进程状态&进程优先级&环境变量_第23张图片

虚拟地址空间，如果是32位的话就是4GB

注意这2³²次的空间的大小其实和物理空间大小本身是没有什么关系的，而进程地址空间本身其实和物理内存没有关系

下面我们来看一下mm_struct:

每个进程被创建时，其对应的进程控制块（task_struct）和进程地址空间（mm_struct）也会随之被创建。而操作系统可以通过进程的task_struct找到其mm_struct，因为task_struct当中有一个结构体指针存储的是mm_struct的地址。

例如，父进程有自己的task_struct和mm_struct，该父进程创建的子进程也有属于其自己的task_struct和mm_struct，父子进程的进程地址空间当中的各个虚拟地址分别通过页表映射到物理内存的某个位置，如下图：

如果我们想要寻找某一个地址的话只需要基地址+偏移量

如果我们想要扩大这个某个空间的划分的时候其实只要修改某一个end指针就可以了

为什么要有地址空间？

此时我们再来回答这个问题：为什么要有地址空间？

把地址编上了“刻度”，方便存储查找数据

这样也不会存在系统级的越界问题（错误的访问物理内存）了，因为

空间访问如果越界的话，如果查看页表没有找到映射，那么就判定为野指针，页表的其他区域（不属于你的空间）不会允许你访问

地址空间进程独立性小结

为什么数据要进行写时拷贝？

进程具有独立性。多进程运行，需要独享各种资源，多进程运行期间互不干扰，不能让子进程的修改影响到父进程。

为什么不在创建子进程的时候就进行数据的拷贝？

子进程不一定会使用父进程的所有数据，并且在子进程不对数据进行写入的情况下，没有必要对数据进行拷贝，我们应该按需分配，在需要修改数据的时候再分配（延时分配），这样可以高效的使用内存空间。

代码会不会进行写时拷贝？

90%的情况下是不会的，但这并不代表代码不能进行写时拷贝，例如在进行进程替换的时候，则需要进行代码的写时拷贝。

地址空间的特点

地址空间功能

虚拟地址空间+页表本质功能就是保护内存

相同的进程结构

每个进程都认为看到的是相同的空间范围（构成，顺序）

独占内存

每个进程都认为自己在独占内存，更好的完成进程独立性和合理使用空间

这样的好处就是可以将进程进行调度，内存管理进行解耦或者分离，可以延迟加载（提高效率），可以按照需要，动态地加载入内存

执行文件的分段（补充）

同时我们的exe文件也是如此，是分段的，为了方便操作系统来针对性的解析

进程调度队列(极简)

一个CPU拥有一个runqueue

如果有多个CPU就要考虑进程个数的父子均衡问题

优先级

普通优先级：100～139（我们的操作都是普通的优先级，因为nice值的取值范围限制）
实时优先级：0～99（不是重点）

活动队列

时间片还没有结束的所有进程都按照优先级放在该队列
nr_active: 总共有多少个运行状态的进程
queue[140]: 一个元素就是一个进程队列，相同优先级的进程按照FIFO规则进行排队调度,所以，数组下标就是优先级！

从该结构中，选择一个最合适的进程的过程

从0下表开始遍历queue[140]
找到第一个非空队列，该队列必定为优先级最高的队列
拿到选中队列的第一个进程，开始运行，调度完成！
遍历queue[140]时间复杂度是常数！但还是太低效了！

bitmap[5]:一共140个优先级，一共140个进程队列，为了提高查找非空队列的效率，就可以用5*32个比特位表示队列是否为空，这样，便可以大大提高查找效率！

过期队列

过期队列和活动队列结构一模一样
过期队列上放置的进程，都是时间片耗尽的进程
当活动队列上的进程都被处理完毕之后，对过期队列的进程进行时间片重新计算

active指针和expired指针

active指针永远指向活动队列
expired指针永远指向过期队列

活动队列上的进程会越来越少，过期队列上的进程会越来越多，因为进程时间片到期时一直都存在的。
在合适的时候，只要能够交换active指针和expired指针的内容，就相当于有具有了一批新的活动进程

进程调度算法

在系统当中查找一个最合适调度的进程的时间复杂度是一个常数，不随着进程增多而导致时间成本增加，我们称之为进程调度O(1)算法

总结

对于操作系统来说，进程就是正在运行中的程序，而对于内存来说，进程只是一块地址空间。

**为什么需要抽象出进程？**这是因为我们需要同时运行多个程序提高效率

参考资料：https://blog.csdn.net/chenlong_cxy/article/details/120193456

你可能感兴趣的:(请回答Linux,linux,进程,环境变量,mm_map,c++)

linux驱动(三):gpiolib 菜_小_白 linux c语言驱动开发
本文主要探讨使用210的gpiolib库编写led驱动。gpio.h#defineS5PV210_GPIO_A0_NR(8)......#defineS5PV210_GPIO_ETC4_NR (6)定义端口的GPIO数目#defineS5PV210_GPIO_NEXT(__gpio)\ ((__gpio##_START)+(__gpio##_NR)+CONFIG_S3C_GPIO_SPAC
python电脑怎么打开任务管理器_利用Python调用Windows API，实现任务管理器功能 weixin_39778400
任务管理器具体功能有：1、列出系统当前所有进程。2、列出隶属于该进程的所有线程。3、如果进程有窗口，可以显示和隐藏窗口。4、强行结束指定进程。通过Python调用WindowsAPI还是很实用的，能够结合Python的简洁和WindowsAPI的强大，写出各种各样的脚本。编码中的几个难点有：1、API的入参是结构体时，怎么解决？答：Python内手动建立结构体。详见：https://baijiah
Windows操作系统部署Tomcat详细讲解 web15085415935 面试学习路线阿里巴巴 windows tomcat java
Tomcat是一个开源的JavaServlet容器，用于处理JavaWeb应用程序的请求和响应。以下是关于Tomcat的用法大全：一、安装Tomcat下载访问ApacheTomcat官方网站（https://tomcat.apache.org/），根据你的操作系统（如Windows、Linux、macOS）和需求选择合适的版本进行下载。例如，对于开发环境，通常选择较新的稳定版本。安装（以Windo
Linux第零节：Linux命令速查图表（按功能分类）熊峰峰 5.Linux linux php
Linux命令速查图表（按功能分类）思维导图示意Linux命令文件操作权限管理系统管理网络操作文本处理压缩归档ls/cd/pwdmkdir/rm/cpcat/less/findchmodchownps/top/killshutdown/unamecurl/netstatnc/tcpdumpgrep/awk/sedtar/zip/unzip一、文件与目录操作命令功能描述常用选项示例ls列出目录内容-
通过stm32最小系统板实现串口收发功能超561 stm32学习笔记 stm32 嵌入式硬件单片机
使用时请确保系统时钟配置正确本文使用到两个串口其配置方式一样USART1初始化函数Usart1_InitvoidUsart1_Init(unsignedintbaud){GPIO_InitTypeDefgpio_initstruct;USART_InitTypeDefusart_initstruct;NVIC_InitTypeDefnvic_initstruct;RCC_APB2PeriphClo
Tomcat升级步骤 qq_33928223 软件部署 tomcat java
以下是ApacheTomcat升级的一般步骤，具体操作可能因环境和需求有所不同，请根据实际情况进行调整：1.确定当前版本和目标版本确认当前版本:查看当前正在运行的Tomcat版本。$CATALINA_HOME/bin/version.sh选择目标版本:根据需求选择要升级到的目标版本（如从8.x到9.x或更高版本）。2.备份现有安装备份配置文件：server.xmlweb.xmlcontext.xm
使用HSDB验证Class对象和类的静态对象保存在堆中 Yuck1125 技术 java jvm
HSDB(HotspotDebugger)运行图形界面java-cp$JAVA_HOME/lib/sa-jdi.jarsun.jvm.hotspot.HSDB命令行java-cp$JAVA_HOME/lib/sa-jdi.jarsun.jvm.hotspot.CLHSDB本文使用的时命令行CLHSDB。由于HSDB会先attach进程，然后暂停进程，所以线上慎用。。。验证过程使用到的类public
QML与C++集成之道 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QML与C++集成之道补天云火鸟博客创作软件1QML基础和C++整合入门1.1QML语言概览1.1.1QML语言概览QML语言概览QML语言概览QML简介及用途QML（QuickModelLanguage）是Qt库中的一种声明式编程语言，主要用于构建复杂的用户界面。它是一种面向对象的语言，但使用场景和传统面向对象编程有所不同。QML允许开发者以XML或JSON格式编写代码来描述UI组件、它们的属性
C++ 的内存管理有哪些改进？ c++
C++20引入了对协程的官方支持，这是C++语言发展的一个重要里程碑。协程为异步编程、并发任务处理以及复杂的控制流提供了一种更高效、更简洁的解决方案。以下是C++20中协程支持的主要优势：一、简化异步编程在传统的异步编程中，开发者通常需要使用回调函数、std::future和std::promise等机制来处理异步任务。这些方法虽然有效，但代码往往难以阅读和维护，且容易出错。C++20的协程提供了
富途证券C++面试题及参考答案大模型大数据攻城狮 c++java 后端面试大厂面试 Epoll 智能指针数据库索引
C++中堆和栈的区别在C++中，堆和栈是两种不同的内存区域，它们有许多区别。从内存分配方式来看，栈是由编译器自动分配和释放的内存区域。当一个函数被调用时，函数内的局部变量、函数参数等会被压入栈中，这些变量的内存空间在函数执行结束后会自动被释放。例如，在下面的函数中：voidfunc(){inta=5;//这里的变量a存储在栈中，当func函数结束后，a所占用的栈空间会自动释放}而堆是由程序员手动分
腾讯面经，有点难度~ 后端go
今天分享组织内的朋友在腾讯安全的实习面经。内容涵盖了QPS测试方法、SQL聚合查询、Linux进程管理、Redis数据结构与持久化、NAT原理、Docker隔离机制、Go语言GMP调度模型、协程控制、系统调用流程、变量逃逸分析及map操作等等知识点。下面是我整理的面经详解：面经详解一个表，里面有数据列，id，name,class，查学生最喜欢的前10个课程，sql语句实现SELECTclass,C
unique_ptr 和 shared_ptr 有什么区别？
std::unique_ptr和std::shared_ptr是C++中两种主要的智能指针类型，它们都用于自动管理动态分配的内存，但在所有权模型、使用场景和性能上有显著的区别。以下是它们的详细对比：一、所有权模型std::unique_ptr独占所有权：std::unique_ptr表示对资源的独占所有权。一个资源在同一时间只能被一个std::unique_ptr所拥有。禁止复制：std::uni
信息学奥赛一本通1353 表达式括号匹配(stack) （栈） Star77777 信息学奥赛一本通 #数据结构栈信息学奥赛一本通括号匹配
1353：表达式括号匹配(stack)时间限制:1000ms内存限制:65536KB提交数:14209通过数:7610【题目描述】设一个表达式有英文字母（小写）、运算符（+，—，∗，/+，—，∗，/）和左右小（圆）括号构成，以“@@”作为表达式的结束符。请编写一个程序检查表达式中的左右圆括号是否匹配，若匹配，则返回“YESYES”；否则返回“NONO”。表达式长度小于255255，左圆括号少于20
LeetCode215. 数组中的第K个最大元素 techpupil 算法快速选择 leetcode
给定整数数组nums和整数k，请返回数组中第k个最大的元素。请注意，你需要找的是数组排序后的第k个最大的元素，而不是第k个不同的元素。你必须设计并实现时间复杂度为O(n)的算法解决此问题。示例1:输入:[3,2,1,5,6,4],k=2输出:5示例2:输入:[3,2,3,1,2,4,5,5,6],k=4输出:4分析：本题我们能想到最简单的方法就是直接给数组排序，然后取第第N-k个元素，但题目要求是
hsdb查看Tomcat注解的实例 ok060 tomcat java hsdb
‌一、HSDB查看Tomcat注解的实例步骤‌‌1.附加Tomcat进程‌‌获取Tomcat进程ID‌：使用jps-l命令查找Tomcat的PID（如12345），确保Tomcat处于运行状态‌38。‌启动HSDB‌：jhsdbhsdb--pid12345‌2.定位目标类‌‌打开ClassBrowser‌：在HSDB界面点击‌Tools→ClassBrowser‌，输入目标类名（如com.exam
AI 真的懂你问的问题吗？ llmclaudeopenai
Hey,我是沉浸式趣谈本文首发于【沉浸式趣谈】，我的个人博客https://yaolifeng.com也同步更新。转载请在文章开头注明出处和版权信息。如果本文对您有所帮助，请点赞、评论、转发，支持一下，谢谢！AI真的懂你问的问题吗？AI—它可能是个「语言魔术师」，但绝对不是「人类大脑」你心血来潮问AI：你：「为什么古埃及人建造金字塔？」AI（认真回答）：「古埃及人建造金字塔主要是作为法老的陵墓，同
文件的基本的基本属性伶星37 linux 服务器
为什么要有基本属性Linux系统是一种典型的多用户系统，不同的用户处于不同的地位，拥有不同的权限。为了保护系统的安全性，Linux系统对不同的用户访问同一文件（包括目录文件）的权限做了不同的规定。例子你可以把Linux比作成一个学校，里面的人学生老师校长里面的资料课本学校档案老师个人备案资料学生只能看课本，其他的都不能看，而老师，可以看老师备案资料和课本。校长上面都可以看。在Linux中我们通常使
操作系统练习题齐飞 linux
文章目录一、单选题二、多选题三、填空题四、简答题一、单选题1、在计算机系统中配置操作系统的主要目的是（）。A、增强计算机系统的功能B、提高系统资源的利用率C、提高系统的运行速度D、合理组织系统的工作流程，以提高系统吞吐量正确答案：B2、操作系统的主要功能是管理计算机系统中的（），其中包括处理机、存储器，以及文件和设备。这里的存储器管理主要是对进程进行管理。A、程序和数据B、资源C、软件D、硬件正确
MongoDB实战-生产环境中分片的部署与配置 perfecttshoot MongoDB 部署配置分片集群 mongodb
在生产环境里部署分片集群时，面前会出现很多选择和挑战。下面会介绍几个推荐的拓扑结构。1.部署拓扑要运行示例MongoDB分片集群，你一共要启动九个进程（每个副本集三个mongod，外加三个配置服务器）。咋一看，这个数字有点吓人。一开始用户会假设在生产环境里运行两个分片集群要有九台独立的机器。幸运的是，实际需要的机器要少很多，看一下集群中各组件所要求的资源就知道为什么了。首先考虑下副本集，每个成员都
C++开发内存监控工具推荐点云SLAM 开发工具开发环境 c++开发语言 AddProperty gperftools Address 内存监控访问越界
在C++开发中，内存管理是至关重要的，尤其是当程序处理大数据或长时间运行时，内存泄漏或不当使用可能导致性能下降或崩溃。以下是几种常见且有效的内存监控工具，它们可以帮助开发者实时分析、诊断和优化程序的内存使用。1.ValgrindValgrind是一个广泛使用的内存调试和性能分析工具，它的Memcheck工具可以帮助你检查程序中的内存泄漏、内存越界、未初始化内存使用等问题。特点：检测内存泄漏。检查内
vscode python 入门教程(一) window 10 环境下安装pyenv hamish-wu Python python 开发语言 pyenv
python的环境配置方法很多，由于python有两个大版本，很多时候需要切换某个固定的版本才能运行三方包，所以推荐使用pyenv配置python环境变量pyenv的安装安装方法：Invoke-WebRequest-UseBasicParsing-Uri"https://raw.githubusercontent.com/pyenv-win/pyenv-win/master/pyenv-win/i
Mongodb配置分片服务器 czw0723 mongodb 数据库服务器
mongodb的sharding集群由以下3个服务组成：ShardsServer:每个shard由一个或多个mongod进程组成，用于存储数据ConfigServer:用于存储集群的Metadata信息，包括每个Shard的信息和chunks信息RouteServer:用于提供路由服务，由Client连接，使整个Cluster看起来像单个DB服务器另外，Chunks是指MongoDB中一段连续的数
ERROR: Failed building wheel for pyaudioFailed to build pyaudioERROR: ERROR: Failed to build insta 小李飞刀李寻欢 python audio pyaudio 安装库 python
ERROR:FailedbuildingwheelforpyaudioFailedtobuildpyaudioERROR:ERROR:Failedtobuildinstallablewheelsforsomepyproject.tomlbasedprojects(pyaudio)这个错误表明在编译pyaudio时缺少PortAudio开发库。以下是完整解决方案：Linux系统解决方案#1.安装系统
服务器负载均衡冬冬小圆帽服务器负载均衡 vim
1.安装EPEL仓库EPEL（ExtraPackagesforEnterpriseLinux）仓库提供了额外的软件包，安装HAProxy前需要先启用EPEL仓库。sudoyuminstallepel-release-y2.安装HAProxy通过EPEL仓库安装HAProxy。sudoyuminstallhaproxy-y注意：如果服务器上已安装Docker，可能会干扰HAProxy的安装。建议先关
Centos Redis安装与配置指南程序~阿呆 linux 开发工具 redis 中间件
1.环境说明centos7.9redis6.2.6安装方式：外网服务器可以使用wget来下载安装，内网服务器只能windows下载后上传到linux服务器上2.新建下载目录将下载的Redis放在本文件夹中mkdir/tools3.Redis下载服务器执行wget命令：wgethttp://download.redis.io/releases/redis-6.2.6.tar.gz4.解压和编译依次执
Day 21: 数组中的逆序对 m0_65150762 排序算法数据结构算法
在股票交易中，如果前一天的股价高于后一天的股价，则可以认为存在一个「交易逆序对」。请设计一个程序，输入一段时间内的股票交易记录record，返回其中存在的「交易逆序对」总数。示例1：输入：record=[9,7,5,4,6]输出：8解释：交易中的逆序对为(9,7),(9,5),(9,4),(9,6),(7,5),(7,4),(7,6),(5,4)。提示：0=right){return0;}intm
OpenRAND可重复的随机数生成库 novanova2009 elasticsearch 大数据搜索引擎
OpenRAND是一个C++库，旨在通过提供强大且可复制的随机数生成解决方案来促进可重复的科学研究。它是一个简单的仅头文件库，性能可移植，统计稳健，并且易于集成到任何HPC计算项目中。特征跨平台支持：OpenRAND旨在跨各种平台无缝工作，包括CPU和GPU。其仅标题库设计使其能够轻松集成到您的项目中。用户友好的API：OpenRAND提供了一个用户友好的API，可以直接在您的应用程序中生成随机数
图解HTTP的知识框架详解 GISer_Jinger javascript 前端架构
图解HTTP的知识框架详解，我需要结合提供的搜索结果来整理出一个结构化的回答。首先，看看用户提供的搜索结果，有三个文档，分别是关于《图解HTTP》的读书笔记、Java解析HTTP的方法，以及网络基础知识的图解内容。不过用户的问题主要集中在HTTP的知识框架，所以可能主要参考第一个和第三个文档。第一个搜索结果[1]是《图解HTTP》的读书笔记，里面详细介绍了HTTP协议的基本概念、请求方法、状态码、
【操作系统概念】【恐龙书】笔记六——第六章进程同步我岂是非人哉计算机操作系统
Chapter6:ProcessSynchronization问题的提出：彼此合作的进程之间可以用共享逻辑地址空间的方式来实现，共享逻辑地址空间，也就是共享代码区和数据区，会导致数据不一致，所以介绍一些避免数据不一致的机制。6.1BackgroundConcurrentaccesstoshareddatamayresultindatainconsistencyMaintainingdatacons
Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi