skynet
的环境,并成功启动了 skynet
服务框架,为了从底层更好地理解整个框架的实现过程,我们有必要剖析一下源码,由于底层的源码都是用C语言写的,lua脚本基本是用来进行业务层开发,所以我们从C源码开始解读框架。打开下载包的 skynet-src
目录,这里是skynet框架的核心C源码,接下来我们就要来解读 skynet_main.c
和 skynet_start.c
这两个与skynet启动相关的C源码。
我们启动 skynet
使用的指令 ./skynet example/config
实际上就是调用 skynet-src/skynet_main.c
脚本的入口 main
函数,调用时将 config
配置文件地址传入到函数中,并在此函数中完成:设置环境
和 加载配置文件
//skynet_main.c
int main(int argc, char *argv[]) {
//保存config文件地址的变量
const char * config_file = NULL ;
if (argc > 1) {
//读取配置文件config的地址,保存在config_file变量中
config_file = argv[1];
} else {
//不传入config文件地址会提示错误并结束程序
fprintf(stderr, "Need a config file. Please read skynet wiki : https://github.com/cloudwu/skynet/wiki/Config\n"
"usage: skynet configfilename\n");
return 1;
}
//初始化操作
luaS_initshr();
//全局初始化,为线程特有数据使用pthread_key_create()函数创建一个key,然后使用pthread_setspecific()函数为这个key设置value值
skynet_globalinit();
//初始化lua环境,创建一个全局数据结构struct skynet_env *E,并初始化结构的值
skynet_env_init();
//设置信号处理函数,用于忽略SIGPIPE信号的处理
sigign();
//创建启动skynet所需的必要配置信息结构数据
struct skynet_config config;
//申请一个lua虚拟机
struct lua_State *L = luaL_newstate();
//链接一些必要的lua库到刚刚申请的lua虚拟机中
luaL_openlibs(L); // link lua lib
//执行config配置文件在lua中的读取
int err = luaL_loadbufferx(L, load_config, strlen(load_config), "=[skynet config]", "t");
assert(err == LUA_OK);
//把C读取的config配置文件内容串压入栈顶
lua_pushstring(L, config_file);
//执行栈顶的chunk,实际上就是加载config这个lua脚本字符串的内容
err = lua_pcall(L, 1, 1, 0);
if (err) {
fprintf(stderr,"%s\n",lua_tostring(L,-1));
lua_close(L);
return 1;
}
//初始化保存config信息的环境env
_init_env(L);
//通过skynet_getenv()接口从env中获取配置文件的信息(其实内部机制是通过lua_setglobal把之前压入栈顶的config_file转成lua中作为全局变量)
config.thread = optint("thread",8);
config.module_path = optstring("cpath","./cservice/?.so");
config.harbor = optint("harbor", 1);
config.bootstrap = optstring("bootstrap","snlua bootstrap");
config.daemon = optstring("daemon", NULL);
config.logger = optstring("logger", NULL);
config.logservice = optstring("logservice", "logger");
config.profile = optboolean("profile", 1);
//关闭上面创建的L(lua虚拟机)
lua_close(L);
//开始执行skynet的真是启动skynet服务程序的操作
skynet_start(&config);
//对应上面的skynet_globalinit(),用于删除 线程存储的Key。
skynet_globalexit();
//对应上面的luaS_initshr()
luaS_exitshr();
return 0;
}
必要的数据被定义在一个 skynet-src/skynet_imp.h
中的 skynet_config
结构体内:
//skynet_imp.h
struct skynet_config {
int thread; //启动工作线程数量,不要配置超过实际拥有的CPU核心数
int harbor; //skynet网络节点的唯一编号,可以是 1-255 间的任意整数。一个 skynet 网络最多支持 255 个节点。每个节点有必须有一个唯一的编号。如果 harbor 为 0 ,skynet 工作在单节点模式下。此时 master 和 address 以及 standalone 都不必设置。
int profile; //是否开启统计功能,统计每个服务使用了多少cpu时间,默认开启
const char * daemon; //后台模式:daemon = "./skynet.pid"可以以后台模式启动skynet(注意,同时请配置logger 项输出log)
const char * module_path; //用 C 编写的服务模块的位置,通常指 cservice 下那些 .so 文件
const char * bootstrap; //skynet 启动的第一个服务以及其启动参数。默认配置为 snlua bootstrap ,即启动一个名为 bootstrap 的 lua 服务。通常指的是 service/bootstrap.lua 这段代码。
const char * logger; //它决定了 skynet 内建的 skynet_error 这个 C API 将信息输出到什么文件中。如果 logger 配置为 nil ,将输出到标准输出。你可以配置一个文件名来将信息记录在特定文件中。
const char * logservice; //默认为 "logger" ,你可以配置为你定制的 log 服务(比如加上时间戳等更多信息)。可以参考 service_logger.c 来实现它。注:如果你希望用 lua 来编写这个服务,可以在这里填写 snlua ,然后在 logger 配置具体的 lua 服务的名字。在 examples 目录下,有 config.userlog 这个范例可供参考。
};
在 skynet-src/skynet_main.c
的 main
函数末尾,完成 环境设置 和 配置信息加载 之后,调用了 skynet_start(&config);
函数,这是在 skynet-src/skynet_start.c
中定义的,接下来我们来看一下实现的源码:
//skynet_start.c
void skynet_start(struct skynet_config * config) {
// register SIGHUP for log file reopen
struct sigaction sa;
sa.sa_handler = &handle_hup;
sa.sa_flags = SA_RESTART;
sigfillset(&sa.sa_mask);
sigaction(SIGHUP, &sa, NULL);
if (config->daemon) {
if (daemon_init(config->daemon)) {
exit(1);
}
}
skynet_harbor_init(config->harbor);
skynet_handle_init(config->harbor);
skynet_mq_init();
skynet_module_init(config->module_path);
skynet_timer_init();
skynet_socket_init();
skynet_profile_enable(config->profile);
struct skynet_context *ctx = skynet_context_new(config->logservice, config->logger);
if (ctx == NULL) {
fprintf(stderr, "Can't launch %s service\n", config->logservice);
exit(1);
}
bootstrap(ctx, config->bootstrap);
start(config->thread);
// harbor_exit may call socket send, so it should exit before socket_free
skynet_harbor_exit();
skynet_socket_free();
if (config->daemon) {
daemon_exit(config->daemon);
}
}
根据配置信息进行各个服务的初始化:
使用 ->
间接引用运算符,config
是指向 skynet_config
结构体的指针,config->
是引用结构体成员变量:
//根据配置信息进行一系列初始化
if (config->daemon) {
//初始化守护进程
if (daemon_init(config->daemon)) {
exit(1);
}
}
//初始化节点模块,用于集群,转发远程节点的消息
skynet_harbor_init(config->harbor);
//初始化句柄模块,用于给每个Skynet服务创建一个全局唯一的句柄值
skynet_handle_init(config->harbor);
//初始化消息队列模块,这是Skynet的主要数据结构
skynet_mq_init();
//初始化服务动态库加载模块,主要用于加载符合Skynet服务模块接口的动态链接库(.so)
skynet_module_init(config->module_path);
//初始化定时器模块
skynet_timer_init();
//初始化网络模块
skynet_socket_init();
//加载日志模块
skynet_profile_enable(config->profile);
创建第一个模块 logger
服务的实例,并启动这个服务:
使用 skynet_context_new(...)
函数实例化一个服务:
struct skynet_context *ctx = skynet_context_new(config->logservice, config->logger);
这里传入两个参数:参数一是 加载模块的名称,参数二是初始化由模块生成的实例时所需的 传入设置参数,下面是创建一个服务的具体流程:
会从 logger.so
中把模块加载出来:
struct skynet_module * mod = skynet_module_query(name);
让加载出来的模块自动生成一个新的实例:
void *inst = skynet_module_instance_create(mod);
给新实例注册一个事件处理的handle
:
ctx->handle = skynet_handle_register(ctx);
创建这个实例的消息队列:
struct message_queue * queue = ctx->queue = skynet_mq_create(ctx->handle);
调用模块的初始化方法
int r = skynet_module_instance_init(mod, inst, ctx, param);
将实例的消息队列加到全局的消息队列中,这样才能收到消息回调
skynet_globalmq_push(queue);
加载 bootstrap
引导模块:
bootstrap(ctx, config->bootstrap);
安装默认 config
的配置内容,config->bootstrap
的内容就是一串字符串 bootstrap = "snlua bootstrap"
,下面来看一下 bootstrap
函数的具体实现过程:
static void bootstrap(struct skynet_context * logger, const char * cmdline) {
//获取字符串长度
int sz = strlen(cmdline);
char name[sz+1];
char args[sz+1];
//将传入的cmdline字符串按照格式分割成两部分,前部分模块名,后部分为模块初始化参数
sscanf(cmdline, "%s %s", name, args);
//创建并启动指定模块的一个服务
struct skynet_context *ctx = skynet_context_new(name, args);
//假如创建失败
if (ctx == NULL) {
//通过传入的logger服务接口构建错误信息假如logger消息队列
skynet_error(NULL, "Bootstrap error : %s\n", cmdline);
//输出消息队列中的错误信息
skynet_context_dispatchall(logger);
//结束程序
exit(1);
}
}
同样使用 skynet_context_new()
与上面启动 logger
服务一样,先把 snlua.so
模块加载进来,然后调用此模块自身的实例化方法,去实例化一个 snlua
服务,并传入要实例化的 lua服务的脚本名称
为 bootstarp
,bootstrap会根据config中 luaservice
配置的目录去获取指定名称的 lua脚本,按照默认目录最后会匹配到 service/bootstrap.lua
。snlua
是lua的沙盒服务,所有的 lua服务
都是一个 snlua
的实例。
snlua
实例化的过程:
这里我们来看一下 snlua
模块的实例化方法,源码在 service-src/service_snlua.c
中的 snlua_create(void)
函数:
struct snlua * snlua_create(void) {
struct snlua * l = skynet_malloc(sizeof(*l));
memset(l,0,sizeof(*l));
l->mem_report = MEMORY_WARNING_REPORT;
l->mem_limit = 0;
//创建一个lua虚拟机(Lua State)
l->L = lua_newstate(lalloc, l);
return l;
}
最后返回的是一个通过 lua_newstate
创建出来的 Lua vm
(lua虚拟机),也就是一个沙盒环境,这是为了达到让每个 lua服务
都运行在独立的虚拟机中。
* lua服务
的初始化:*
上面的实例化步骤,只是生成了 lua服务
的运行沙盒环境,至于沙盒内运行的具体内容,是在初始化的时候才填充进来的,这里我们再来简单剖析一下初始化函数 snlua_init
的源码:
int snlua_init(struct snlua *l, struct skynet_context *ctx, const char * args) {
int sz = strlen(args);
//在内存中准备一个空间(动态内存分配)
char * tmp = skynet_malloc(sz);
//内存拷贝:将args内容拷贝到内存中的temp指针指向地址的内存空间
memcpy(tmp, args, sz);
//注册回调函数为launch_cb这个函数,有消息传入时会调用回调函数并处理
skynet_callback(ctx, l , launch_cb);
const char * self = skynet_command(ctx, "REG", NULL);
//当前lua实例自己的句柄id(转为无符号长整型)
uint32_t handle_id = strtoul(self+1, NULL, 16);
// it must be first message
// 给自己发送一条消息,内容为args字符串
skynet_send(ctx, 0, handle_id, PTYPE_TAG_DONTCOPY,0, tmp, sz);
return 0;
}
这个初始化函数主要完成了两件事:
launch_cb
;bootstrap
。当此服务的消息队列被push进全局的消息队列后,本服务收到的第一条消息就是上述在初始化中给自己发送的那条消息,此时便会调用回调函数launch_cb
并执行处理逻辑:
static int launch_cb(struct skynet_context * context, void *ud, int type, int session, uint32_t source , const void * msg, size_t sz) {
assert(type == 0 && session == 0);
struct snlua *l = ud;
//将服务原本绑定的句柄和回调函数清空
skynet_callback(context, NULL, NULL);
//设置各项资源路径参数,并加载loader.lua
int err = init_cb(l, context, msg, sz);
if (err) {
skynet_command(context, "EXIT", NULL);
}
return 0;
}
这个方法里把服务自己在C语言层面的回调函数给注销了,使它不再接收消息,目的是:在lua层重新注册它,把消息通过lua接口来接收。
紧接着执行init_cb
方法:
设置了一些虚拟机环境变量(紫瑶是资源路径类的):
const char *path = optstring(ctx, "lua_path","./lualib/?.lua;./lualib/?/init.lua");
lua_pushstring(L, path);
lua_setglobal(L, "LUA_PATH");
const char *cpath = optstring(ctx, "lua_cpath","./luaclib/?.so");
lua_pushstring(L, cpath);
lua_setglobal(L, "LUA_CPATH");
const char *service = optstring(ctx, "luaservice", "./service/?.lua");
lua_pushstring(L, service);
lua_setglobal(L, "LUA_SERVICE");
const char *preload = skynet_command(ctx, "GETENV", "preload");
lua_pushstring(L, preload);
lua_setglobal(L, "LUA_PRELOAD");
加载执行了lualib\loader.lua
文件:
const char * loader = optstring(ctx, "lualoader", "./lualib/loader.lua");
loader
的作用是以 cml
参数为名去各项代码目录 查找lua文件,找到后 loadfile
并执行(等效于 dofile
)。
同时把真正要加载的文件(此时是 bootstrap.lua
)作为参数传给它,最终 bootstrap.lua
脚本会被加载并执行脚本中的逻辑, 控制权就开始转到lua层。
完成上述的所有底层 C语言
逻辑之后,我们开始执行 lua层
的业务逻辑,起点就是上述最后加载和执行的 bootstrap.lua
,打开脚本,脚本内容如下:
local skynet = require "skynet"
local harbor = require "skynet.harbor"
require "skynet.manager" -- import skynet.launch, ...
local memory = require "memory"
skynet.start(function()
local sharestring = tonumber(skynet.getenv "sharestring" or 4096)
memory.ssexpand(sharestring)
local standalone = skynet.getenv "standalone"
local launcher = assert(skynet.launch("snlua","launcher"))
skynet.name(".launcher", launcher)
local harbor_id = tonumber(skynet.getenv "harbor" or 0)
if harbor_id == 0 then
assert(standalone == nil)
standalone = true
skynet.setenv("standalone", "true")
local ok, slave = pcall(skynet.newservice, "cdummy")
if not ok then
skynet.abort()
end
skynet.name(".cslave", slave)
else
if standalone then
if not pcall(skynet.newservice,"cmaster") then
skynet.abort()
end
end
local ok, slave = pcall(skynet.newservice, "cslave")
if not ok then
skynet.abort()
end
skynet.name(".cslave", slave)
end
if standalone then
local datacenter = skynet.newservice "datacenterd"
skynet.name("DATACENTER", datacenter)
end
skynet.newservice "service_mgr"
pcall(skynet.newservice,skynet.getenv "start" or "main")
skynet.exit()
end)
这里执行了 skynet.start
这个接口,这也是所有 lua服务
的标准启动入口,服务启动完成后,就会调用这个接口,传入的参数就是一个function(方法),而且这个方法就是此 lua服务
的在lua层的回调接口,本服务的消息都在此回调方法中执行。
skynet.start
接口:
关于每个lua服务的启动入口 skynet.start
接口的实现代码在 service/skynet.lua
中:
function skynet.start(start_func)
--重新注册一个callback函数,并且指定收到消息时由dispatch_message分发
c.callback(skynet.dispatch_message)
skynet.timeout(0, function()
skynet.init_service(start_func)
end)
end
具体如何实现回调方法的注册过程,需要查看c.callback
这个C语言方法的底层实现,源码在 lualib-src/lua-skynet.c
:
static int lcallback(lua_State *L) {
struct skynet_context * context = lua_touserdata(L, lua_upvalueindex(1));
int forward = lua_toboolean(L, 2);
luaL_checktype(L,1,LUA_TFUNCTION);
lua_settop(L,1);
lua_rawsetp(L, LUA_REGISTRYINDEX, _cb);
lua_rawgeti(L, LUA_REGISTRYINDEX, LUA_RIDX_MAINTHREAD);
lua_State *gL = lua_tothread(L,-1);
if (forward) {
skynet_callback(context, gL, forward_cb);
} else {
skynet_callback(context, gL, _cb);
}
return 0;
}
与上面snlua
初始化中的一致,使用 skynet_callback
来实现回调方法的注册。
跟随逻辑去查看源码,大致了解到skynet服务框架的启动实现流程大致为:
evn
-> 创建和启动C服务logger
-> 启动引导模块并启动第一个lua服务(例如:bootstrap
)。第一个启动的lua服务其实都会由 config
配置文件中的 bootstrap
配置项所决定的,可以根据项目实际情况进行修改,当然也可以保持默认设置,保持使用 bootstrap
作为第一个lua服务,直接或间接地去启动其他的lua服务。