FSM有限状态机基础和linux select网络阻塞编程应用

有限状态机(Finite-state machine)是一个非常有用的模型,可以模拟世界上大部分事物。

FSM有限状态机基础和linux select网络阻塞编程应用_第1张图片


简单说,它有三个特征:

  * 状态总数(state)是有限的。
  * 任一时刻,只处在一种状态之中。
  * 某种条件下,会从一种状态转变(transition)到另一种状态。


状态机可归纳为4个要素,即现态、条件、动作、次态。“现态”和“条件”是因,“动作”和“次态”是果。详解如下:

①现态:是指当前所处的状态。

②条件:又称为“事件”。当一个条件被满足,将会触发一个动作,或者执行一次状态的迁移。

③动作:条件满足后执行的动作。动作执行完毕后,可以迁移到新的状态,也可以仍旧保持原状态。动作不是必需的,当条件满足后,也可以不执行任何动作,直接迁移到新状态。

④次态:条件满足后要迁往的新状态。“次态”是相对于“现态”而言的,“次态”一旦被激活,就转变成新的“现态”了。


假设项目状态包括:

NOT_PRESENT:

OFFLINE: 

POWER:

INIT:

BOOT:

SYNC:

RUN:

FAIL:


事件包括:

TIMEOUT:

DETECT:

CMD_START:

CMD_NETBOOT:

CMD_STOP:

CMD_RESET:

REMOVE:

BOARD_START:

BOARD_READY:

FAILURE:


主系统首先开启一个定时器,主要功能:定时检测系统内所有子系统的插拔(Present/Not_Present)变化,主要看各子系统是否被插入系统,或者是从系统中移除,然后将此DETECT事件分发给个子系统状态机,这个定时器为2ms.

对于每一个子系统,系统启动一个定时器,这个定时器主要是发起一个TIMEOUT事件,让子系统状态机根据此事件开始运转到相应的状态,比如子系统在POWER status状态下收到TIMEOUT事件,将会根据状态机运转逻辑切换到下一个状态INIT. 当然,如果这个时候,主系统queue里有没有执行完的message, 系统就会让子系统定时器开启,继续等待message执行完,而不是直接发起一个TIMEOUT事件。timeout时间也是2ms.


接下来,主系统为每个子系统创建一个状态机,包括主系统自己,也安排一个状态机,使得每个系统独立运行,初始状态设定为NOT_PRESENT.


然后在主循环while(1)里:
1. 查看Message queue里是否有未执行完的msg, 如果有,先执行message queue里面的message
2. 等待一段时间到这个heartbeat过完,然后在检查一下是否所有message都执行完了,如果没有,继续执行,直到message全部执行完;
3. 接下来就是等待message或者直到状态机timeout,这个逻辑可以用select来实现,当有message过来是,立马返回执行,如果没有message过来,就阻塞等待直到timeout. select timeout 时间为100ms.

主系统对子系统的监控有:
1. 主系统在FSM每一个“网络alive”的状态(包括:SYNC, RUN)的timeout callback中去ping子系统,看是否子系统alive,如果累计时间超过300s 是not alive的状态,就直接发起一个FAILURE事件,将子系统置于fail状态;
2. 通过直接cmdline对子系统进行操作控制。
3. 定时器监控子系统插拔状态。

本系统的输入事件有两种:
1. 定时器:定时器超时,会去查找一下子系统状态,如果有变化,就会发起一个detect事件
2. 系统消息:主系统接收各主系统消息,如果有系统关系system manager 类的消息,就会执行相关消息的Handler, 这个handler里面就可能执行这个状态之间的切换事件函数。


select()函数基础:

Select在Socket编程中还是比较重要的,可是对于初学Socket的人来说都不太爱用Select写程序,他们只是习惯写诸如connect、accept、recv或recvfrom这样的阻塞程序(所谓阻塞方式block,顾名思义,就是进程或是线程执行到这些函数时必须等待某个事件的发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。可是使用Select就可以完成非阻塞(所谓非阻塞方式non-block,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况,如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率较高)方式工作的程序,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。下面详细介绍一下! 

Select的函数格式(我所说的是Unix系统下的伯克利socket编程,和windows下的有区别,一会儿说明): 

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout); 

先说明两个结构体: 

第一,struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然Unix下任何设备、管道、FIFO等都是文件形式,全部包括在内,所以毫无疑问一个socket就是一个文件,socket句柄就是一个文件描述符。fd_set集合可以通过一些宏由人为来操作,比如清空集合FD_ZERO(fd_set *),将一个给定的文件描述符加入集合之中FD_SET(int ,fd_set *),将一个给定的文件描述符从集合中删除FD_CLR(int ,fd_set*),检查集合中指定的文件描述符是否可以读写FD_ISSET(int ,fd_set* )。一会儿举例说明。 

第二,struct timeval是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是毫秒数。 

具体解释select的参数: 

int maxfdp是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在Windows中这个参数的值无所谓,可以设置不正确。 

fd_set *readfds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select就会返回一个大于0的值,表示有文件可读,如果没有可读的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读变化。 

fd_set *writefds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select就会返回一个大于0的值,表示有文件可写,如果没有可写的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的写变化。 

fd_set *errorfds同上面两个参数的意图,用来监视文件错误异常。 

struct timeval* timeout是select的超时时间,这个参数至关重要,它可以使select处于三种状态,第一,若将NULL以形参传入,即不传入时间结构,就是将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为0秒0毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;第三,timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。 

返回值: 

负值:select错误 正值:某些文件可读写或出错 0:等待超时,没有可读写或错误的文件 


你可能感兴趣的:(基础知识)