nginx模块
模块配置结构
nginx配置信息分为几个作用域,main, server, 以及location。同样的,每个模块提供的配置指令也可以出现在这几个作用域中。对于这三个作用域的配置信息,每个模块要按需定义不同的数据结构去存储,需要几个就定义几个。
对于模块配置信息的定义,命名习惯是ngx_http_<module name>_(main/srv/loc)_conf_t
, 例如:
模块配置指令
一个模块的配置指令是定义在一个静态数组中的,例如:
|
|
上面的例子,定义了两个配置指令:
hello_string
: 可以接受一个参数,或者是没有参数hello_counter
: 接受一个NGX_CONF_FLAG
类型的参数
ngx_command_t
的定义,位于src/core/ngx_conf_file.h
中:
-
name: 配置指令的名称
-
type: 该配置的类型,其实更准确一点说,是该配置指令属性的集合。nginx提供了很多预定义的属性值(一些宏定义),通过逻辑或运算符可组合在一起,形成对这个配置指令的详细的说明。
NGX_CONF_NOARGS
: 配置指令不接受任何参数NGX_CONF_TAKE1
: 配置指令接受1个参数NGX_CONF_TAKE2
: 配置指令接受2个参数NGX_CONF_TAKE3
: 配置指令接受3个参数NGX_CONF_TAKE4
: 配置指令接受4个参数NGX_CONF_TAKE5
: 配置指令接受5个参数NGX_CONF_TAKE6
: 配置指令接受6个参数NGX_CONF_TAKE7
: 配置指令接受7个参数
可以组合多个属性,比如一个指令即可以不填参数,也可以接受1个或者2个参数。那么就是
NGX_CONF_NOARGS|NGX_CONF_TAKE1|NGX_CONF_TAKE2
。如果写上面三个属性在一起,比较麻烦,就是用下面这些配置:NGX_CONF_TAKE12
: 配置指令接受1个或者2个参数NGX_CONF_TAKE13
: 配置指令接受1个或者3个参数NGX_CONF_TAKE23
: 配置指令接受2个或者3个参数NGX_CONF_TAKE123
: 配置指令接受1个或者2个或者3个参数NGX_CONF_TAKE1234
: 配置指令接受1个或者2个或者3个或者4个参数NGX_CONF_1MORE
: 配置指令接受至少一个参数NGX_CONF_2MORE
: 配置指令接受至少2个参数NGX_CONF_MULTI
: 配置指令可以接受多个参数,即个数不定NGX_CONF_BLOCK
: 配置指令可以接受的值是一个配置信息块。也就是一对大括号括起来的内容。里面可以再包括很多的配置指令。比如常见的server指令就是这个属性的。NGX_CONF_FLAG
: 配置指令可以接受的值是"on"或者"off",最终会被转成bool值。NGX_CONF_ANY
: 配置指令可以接受的任意的参数值。一个或者多个,或者"on"或者"off",或者是配置块。
最后要说明的是,无论如何,nginx的配置指令的参数个数不可能超过
NGX_CONF_MAX_ARGS
个。目前这个值被定义为8,也就是不能超过8个参数值。配置指令可以出现的位置的属性:
NGX_DIRECT_CONF
: 可以出现在配置文件中最外层。例如已经提供的配置指令daemon,master_process
等。NGX_MAIN_CONF
: http, mail, events,error_log
等NGX_ANY_CONF
: 该配置指令可以出现在任意配置级别上NGX_HTTP_MAIN_CONF
: 可以直接出现在http配置指令里NGX_HTTP_SRV_CONF
: 可以出现在http里面的server配置指令里NGX_HTTP_LOC_CONF
: 可以出现在http server块里面的location配置指令里NGX_HTTP_UPS_CONF
: 可以出现在http里面的upstream配置指令里NGX_HTTP_SIF_CONF
: 可以出现在http里面的server配置指令里的if语句所在的block中NGX_HTTP_LMT_CONF
: 可以出现在http里面的limit_except
指令的block中NGX_HTTP_LIF_CONF
: 可以出现在http server块里面的location配置指令里的if语句所在的block中
-
set: 这是一个函数指针,当nginx在解析配置的时候,如果遇到这个配置指令,将会把读取到的值传递给这个函数进行分解处理。因为具体每个配置指令的值如何处理,只有定义这个配置指令的人是最清楚的。
- 函数原型:
char *(*set)(ngx_conf_t *cf, ngx_command_t *cmd, void *conf);
- 返回值: 处理成功,返回NGX_OK,否则返回NGX_CONF_ERROR,或者是一个自定义的错误信息字符串
- cf: 该参数里面保存从配置文件读取到的原始字符串以及相关的一些信息。cf.args字段是一个
ngx_str_t
类型的数组,该数组的首个元素是这个配置指令本身,第二个元素是指令的第一个参数,第三个元素是第二个参数,依次类推。 - cmd: 这个配置指令对应的
ngx_command_t
结构 - conf: 存储配置值的结构体,比如
ngx_http_hello_loc_conf_t
。当解析这个hello_string
变量的时候,传入的conf就指向一个ngx_http_hello_loc_conf_t
类型的变量。
- nginx默认提供的set函数:
ngx_conf_set_flag_slot
: 读取NGX_CONF_FLAG
类型的参数ngx_conf_set_str_slot
: 读取字符串类型的参数ngx_conf_set_str_array_slot
: 读取字符串数组类型的参数ngx_conf_set_keyval_slot
: 读取键值对类型的参数ngx_conf_set_num_slot
: 读取整数类型(有符号整数ngx_int_t
)的参数ngx_conf_set_size_slot
: 读取size_t
类型的参数,也就是无符号数。ngx_conf_set_off_slot
: 读取off_t
类型的参数ngx_conf_set_msec_slot
: 读取毫秒值类型的参数ngx_conf_set_sec_slot
: 读取秒值类型的参数ngx_conf_set_bufs_slot
: 读取的参数值是2个,一个是buf的个数,一个是buf的大小。例如:output_buffers 1 128k;
ngx_conf_set_enum_slot
: 读取枚举类型的参数,将其转换成整数ngx_unit_t
类型ngx_conf_set_bigmask_slot
: 读取参数的值,并将这些参数的值以bit位的形式参数。例如:HttpDavModule模式的dav_methods
指令
- 函数原型:
-
conf: 该字段被
NGX_HTTP_MODULE
类型模块所用(我们编写的基本上都是NGX_HTTP_MODULE
,只有一些nginx核心模块是非NGX_HTTP_MODULE
),该字段指定当前配置项存储的内存位置。实际上是使用哪个内存池的问题。因为http模块对所有http模块所要保存的配置信息,划分了main,server和location三个地方进行存储,每个地方都有一个内存池用来分配存储这些信息的内存。这里可能的值为NGX_HTTP_MAIN_CONF_OFFSET
、NGX_HTTP_SRV_CONF_OFFSET
或NGX_HTTP_LOC_CONF_OFFSET
。当然也可以直接置为0,就是NGX_HTTP_MAIN_CONF_OFFSET
-
offset: 指定该配置项值的精确存放位置,一般指定为某一个结构体变量的字段偏移。因为对于配置信息的存储,一般我们都是定义个结构体来存储的。如果我们定义了一个结构体A,该项配置的值需要存储到该结构体的b字段,那么就设置为
offsetof(A,b)
。 -
post: 该字段存储一个指针。可以指向任何一个在读取配置过程中需要的数据,以便于进行配置读取的处理。大多数时候,都不需要,所以简单地设为0即可。
模块上下文结构
这是一个ngx_http_module_t
类型的静态变量。这个变量实际上是提供一组回调函数指针,这些函数有在创建存储配置信息的对象的函数,也有在创建前和创建后会调用的函数。这些函数都将被nginx在合适的时间进行调用。
|
|
- preconfiguration: 在创建和读取该模块的配置信息之前被调用
- postconfiguration: 在创建和读取该模块的配置信息之后被调用
create_main_conf
: 调用该函数创建本模块位于http block的配置信息存储结构。该函数成功的时候,返回创建的配置对象。失败的话,返回NULL。int_main_conf
: 调用该函数初始化本模块位于http block的配置信息存储结构。该函数成功的时候,返回NGX_CONF_OK
。失败的话,返回NGX_CONF_ERROR
或错误字符串。create_srv_conf
: 调用该函数创建本模块位于http server block的配置信息存储结构,每个server block会创建一个。该函数成功的时候,返回创建的配置对象。失败的话,返回NULL。merge_srv_conf
: 因为有些配置指令既可以出现在http block,也可以出现在http server block中。那么遇到这种情况,每个server都会有自己的存储结构来存储该server的配置,但是这种情况下http block中的配置与server block中的配置信息发生冲突的时候,就需要调用此函数进行合并,该函数并非必须提供,当预计到绝对不会发生需要合并的情况的时候,就无需提供。当然为了安全起见还是建议提供。该函数执行成功的时候,返回NGX_CONF_OK
。失败的话,返回NGX_CONF_ERROR
或错误字符串。create_loc_conf
: 调用该函数创建本模块位于location block的配置信息存储结构。每个在配置中指定的location创建一个。该函数执行成功,返回创建的配置对象。失败的话,返回NULL。merge_loc_conf
: 与merge_srv_conf
类似,这个也是进行配置值合并的地方。该函数成功的时候,返回NGX_CONF_OK
。失败的话,返回NGX_CONF_ERROR
或错误字符串。
这些配置信息一般默认都应该设为一个未初始化的值,针对这个需求,Nginx定义了一系列的宏定义来代表各种配置所对应数据类型的未初始化值,如下:
模块的定义
对于开发一个模块来说,我们都需要定义一个ngx_module_t
类型的变量来说明这个模块本身的信息,从某种意义上来说,这是这个模块最重要的一个信息,它告诉了nginx这个模块的一些信息,上面定义的配置信息,还有模块上下文信息,都是通过这个结构来告诉nginx系统的,也就是加载模块的上层代码,都需要通过定义的这个结构,来获取这些信息。
|
|
再看一下hello模块的模块定义:
|
|
模块可以提供一些回调函数给nginx,当nginx在创建进程线程或者结束进程线程时进行调用。但大多数模块在这些时刻并不需要做什么,所以都简单赋值给NULL。
handler模块的基本结构
handler模块还必须提供一个真正的处理函数,这个函数负责对来自客户端请求的真正处理。这个函数的处理,既可以选择自己直接生成的内容,也可以选择拒绝处理,由后续的handler去进行处理,或者是选择丢给后续的filer进行处理。
typedef ngx_int_t (*ngx_http_handler_pt)(ngx_http_request_t *r);
r是http请求。里面包含请求所有的信息,这里不详细说明了,可以参考别的章节的介绍。该函数处理成功返回NGX_OK
,处理发生错误返回NGX_ERROR
,拒绝处理(留给后续的handler进行处理)返回NGX_DECLINE
。返回NGX_OK
也就代表给客户端的响应已经生成好了,否则返回NGX_ERROR
就发生错误了。