SQLite权威指南(第二版）第七章 The Extension C API

本章介绍有关SQLite的新技术。主要讨论用户自定义函数、聚合、排序规则

用户自定义函数：用户编写的用于特定应用的SQL函数，可以在SQL语句中调用
聚合：聚合函数可以从多个字段进行计算（普通函数对单个记录进行操作），SQLite标准的聚合函数有SUM()/COUNT()/AVG()
排序规则：对文本进行比较和排序的方法。SQLite默认规则BINARY

一、API

在程序中注册过 函数、聚合、排序规则的回调block实现，才可以在SQL中使用他们（排序规则使用单独的注册函数）
扩展API的生命周期是短暂的，他们是基于连接注册的且不存储在数据库中，需要确保应用程序加载了扩展API并在连接中注册

1.注册函数`sqlite3_create_function()`

int sqlite3_create_function(
    sqlite3 *cnx, /* connection handle */
    const char *zFunctionName, /* function/aggregate name in SQL */
    int nArg, /* number of arguments. -1 = unlimited. */
    int eTextRep, /* encoding (UTF8, 16, etc.) */
    void *pUserData, /* application data, passed to callback */
    void (*xFunc)(sqlite3_context*,int,sqlite3_value**),
    void (*xStep)(sqlite3_context*,int,sqlite3_value**),
    void (*xFinal)(sqlite3_context*)
);

参数定义如下：
- cnx：数据库连接句柄，函数和聚合的置顶连接。若要使用函数，必须在连接上注册
- zFunctionName：将在SQL中调用的函数名称，长度在255字节以内
- nArg：自定义函数的参数数量。SQLite将会强制函数格式保证参数都输入。-1是不限制参数数量
- eTextRep：首选文本编码。比如：SQLITE_UTF8/SQLITE_UTF16/SQLITE_UTF16BE/SQLITE_UTF16LE/SQLITE_ANY
- pUserData:应用程序数据。该数据可供在xFunc、xStep和xFinal指定的回调函数中使用。
- xFunc：回调函数。这是SQL函数的真是实现。用户自定义函数只需要提供该回调，同时让xStep、xFinal函数指针未null。后两个回调函数是专门给用户自定义聚合实现使用的
- xStep：聚合步骤函数。SQLite每次处理聚合结婚集中的一行都要调用xStep，以便聚合处理该行的相关字段值，并将其包含在聚合计算的结果中
- xFinal：finalize聚合函数。处理完所有的行后，SQLite调用该函数进行整个聚合汇总处理，该干啥通常是由计算追终止和可选的情况不符组成

2.步骤函数

void fn(sqlite3_context* ctx, int nargs, sqlite3_value** values)

ctx 是函数/聚合的上下文。它保持特殊函数调用的实例状态，通过它可以活动squlite3_create_function()挺的应用程序数据参数（pUserData）.
可以通过sqlite3_user_data()获取用户数据：

void *sqlite3_user_data(sqlite3_context*);

对函数而言，这些数据可以在左右的调用中共享，因此对函数调用的特定实例而言它不是唯一的
同样的pUserData可以在给定函数的所有实例中传递或共享，但是聚合可以通过sqlite3_aggregate_context()为每个特定的实例分配状态：

void *sqlite3_aggregate_context(sqlite3_context*, int nBytes);

第一次调用该函数时执行一个特殊的聚合函数，分配n字节内存，赋值为0，并与上下文关联。
上下文环境汇总后面的调用（同一个聚合的实例）可以返回这些分配的内存
使用该函数是，聚合可以在调用之间存储状态一遍堆积数据
打枊聚合完成final()回调时，由SQLite自动释放内存。

注意： API始终以 void 指针形式使用用户数据。因为：API的很多不法会触发回调函数，在实现所谓的回调函数时，只是作为一种维护状态的便捷方法。

3.返回值

参数values是sqlite3_value结构体数组，是SQLite实际参数值的句柄。这些值的实际数据可以使用sqlite3_value_xxx()系列函数获取：xxx sqlite3_value_xxx(sqlite3_value* value);
比如获取标量值函数

int sqlite3_value_int(sqlite3_value*);
sqlite3_int64 sqlite3_value_int64(sqlite3_value*);
double sqlite3_value_double(sqlite3_value*);

比如获取数组值函数

int sqlite3_value_bytes(sqlite3_value*);
const void *sqlite3_value_blob(sqlite3_value*);
const unsigned char *sqlite3_value_text(sqlite3_value*);

函数 sqlite3_value_bytes()返回blob缓冲去中数据的长度
函数sqlite3_value_blob()返回指向缓冲区的数据的指针
有了空间和指针，就可以复制出数据。eg。：自定义函数的第一个参数是blob，复制数据如下：

int len;
void* data;
len = sqlite3_value_bytes(values[0]);
data = sqlite3_malloc(len);
memcpy(data, sqlite3_value_blob(values[0]), len);

获取值类型sqlite3_value_type()

int sqlite3_value_type(sqlite3_value*);

#define SQLITE_INTEGER 1
#define SQLITE_FLOAT 2
#define SQLITE_TEXT 3
#define SQLITE_BLOB 4
#define SQLITE_NULL 5

二、函数

举个栗子说明实现简单的函数hello_newman(),接收一个参数，访问人名

sqlite > select hello_newman('Jerry') as reply;
reply
------------------
Hello Jerry
sqlite > select hello_newman('Kramer') as reply;
reply
------------------
Hello Kramer
sqlite > select hello_newman('George') as reply;
reply
------------------
Hello George

代码实现如下

int main(int argc, char **argv)
{
    int rc; sqlite3 *db;
    sqlite3_open_v2("test.db", &db);
    sqlite3_create_function( db, "hello_newman", 1, SQLITE_UTF8, NULL,
    hello_newman, NULL, NULL);
    /* Log SQL as it is executed. 执行时记录SQL日志 */
    log_sql(db,1);
    /* Call function with one text argument.传入1个文本参数调用函数 */
    fprintf(stdout, "Calling with one argument.\n");
    print_sql_result(db, "select hello_newman('Jerry')");
    /* Call function with two arguments. 传入两个参数调用函数（会失败，因为注册时只接收1个参数）
    ** It will fail as we registered the function as taking only one argument.*/
    fprintf(stdout, "\nCalling with two arguments.\n");
    print_sql_result(db, "select hello_newman ('Jerry', 'Elaine')");
    /* Call function with no arguments. This will fail too 不传参调用函数也失败 */
    fprintf(stdout, "\nCalling with no arguments.\n");
    print_sql_result(db, "select hello_newman()");
    /* Done */
    sqlite3_close(db);
    return 0;
}

void hello_newman(sqlite3_context* ctx, int nargs, sqlite3_value** values)
{
    const char *msg;
    /* Generate Newman's reply 生成 Newman的 回复 */
    msg = sqlite3_mprintf("Hello %s", sqlite3_value_text(values[0]));
    /* Set the return value. Have sqlite clean up msg w/ sqlite_free().
       设置返回值，用 sqlite3_free清理msg
     */
    sqlite3_result_text(ctx, msg, strlen(msg), sqlite3_free);
}

运行结果：

Calling with one argument.
    TRACE: select hello_newman('Jerry')
hello_newman('Jerry')
---------------------
Hello Jerry
Calling with two arguments.
execute() Error: wrong number of arguments to function hello_newman()
Calling with no arguments.
execute() Error: wrong number of arguments to function hello_newman()

log_sql()简单的调用了sqlite3_trace()，在追踪函数中传递哪些带有TRACE的SQL追踪内容。记录SQL的执行
print_sql_result()的声明：int print_sql_result(sqlite3 *db, const char* sql, ...),是对sqlite3_prepare_v2()的简单封装，它将执行SQL预计并打印结果

1.返回值

sqlite3_result_text()是sqlite3_result_xxx()系列之一，该系列函数是用户用来自定义函数和聚合返回值的。标量函数如下:

void sqlite3_result_double(sqlite3_context*, double);
void sqlite3_result_int(sqlite3_context*, int);
void sqlite3_result_int64(sqlite3_context*, long long int);
void sqlite3_result_null(sqlite3_context*);

这些函数在函数名称中接收一个指定类型的参数（第二个参数），将其设置为函数的返回值。数组函数如下：

void sqlite3_result_text(sqlite3_context*, const char*, int n, void(*)(void*));
void sqlite3_result_blob(sqlite3_context*, const void*, int n, void(*)(void*));

这些函数接收数组数据并将该数组设置为函数返回值

void sqlite3_result_xxx(
    sqlite3_context *ctx, /* function context */
    const xxx* value, /* array value */
    int len, /* array length */
    void(*free)(void*)); /* array cleanup function */

这里xxx是特殊的数组类型（void代表blob，char代表text）

2.数组与内存清理器

与在SQL预计中绑定数组只一样，这些函数与sqlite3_bind_xxx()的工作方式相同。他们需要一个指向数组的指针、一个数组的长度、指向清理函数的函数指针。清理函数的指针可以像sqlite3_bind_xxx()中的一样是预定义好的。

#define SQLITE_STATIC ((void(*)(void *))0)
#define SQLITE_TRANSIENT ((void(*)(void *))-1)

SQLITE_STATIC意味着数组内存驻留在非托管空间，因此SQLite不需要数据副本，也不会视图清理它。
SQLITE_TRANSIENT提示SQLite数组数据有可能改变，因此SQLite需要使用sqlite3_malloc()为自己复制一份数据。当函数返回时，分配的内存将会释放。
第三选项是传递一个指向如下形式的清理函数的指针：void cleanup(void*);
这种情况下，SQLite在洪湖自定义函数完成后，调用清理函数
例子：我们用sqlite3_mprintf()生成前面定义的hello_newman()回复，该回复在堆上分配字符串。我们将sqlite3_free()作为清理函数传递给sqlite3_result_text(),这样当扩展函数完成时，可以释放字符串内存。

3.错误处理

函数遇到错误时应该设置恰当的返回值。sqlite3_result_error()

void sqlite3_result_error(
    sqlite3_context *ctx, /* the function context */
    const char *msg, /* the error message */
    int len); /* length of the error message */

它通知SQLite出现错误，详细信息在msg中。SQLite会终止调用函数并将错误信息包含在msg中

4.返回输入值

场景：将输入的参数原样返回
sqlite3_column_xxx()获取值，sqlite3_result_xxx()设置返回值

void sqlite3_result_value(
    sqlite3_context *ctx, /* the function context */
    sqlite3_value* value); /* the argument value */

eg。创建一个可以回显首个参数的echo():

void echo(sqlite3_context* ctx, int nargs, sqlite3_value** values)
{
    sqlite3_result_value(ctx, values[0]);
}

三、聚合

自定义函数实现一个回调，聚合必须实现两个
- 步骤函数计算进行汇总的值
- finalize函数完成最终计算和清理工作

st=>start: select sum(id) from foo;
e=>end: sum(id)
op=>operation: sqlite_prepare()
op0=>operation: sqlite_step()
op1=>operation: xStep()
op2=>operation: xFinal()
cond=>condition: SQLITE_ROW

st->op->op0->cond
cond(yes)->op1->op0
cond(no)->op2->e

1.注册函数

int sqlite3_create_function(
    sqlite3 cnx*, /* connection handle */
    const char *zFunctionName, /* function/aggregate name in SQL */
    int nArg, /* number of arguments. -1 = unlimited. */
    int eTextRep, /* encoding (UTF8, 16, etc.) */
    void *pUserData, /* application data, passed to callback */
    void (*xFunc)(sqlite3_context*,int,sqlite3_value**),
    void (*xStep)(sqlite3_context*,int,sqlite3_value**),
    void (*xFinal)(sqlite3_context*)
);

2.实例

int main(int argc, char **argv)
{
    int rc; sqlite3 *db; char *sql;
    sqlite3_open_v2("foods.db", &db);
    /* Register aggregate. */
    fprintf(stdout, "Registering aggregate str_agg()\n");
    /* Turn SQL tracing on. */
    log_sql(db, 1);
    /* Register aggregate. */
    sqlite3_create_function( db, "str_agg", 1, SQLITE_UTF8, db,
    NULL, str_agg_step, str_agg_finalize);
    /* Test. */
    fprintf(stdout, "\nRunning query: \n");
    sql = "select season, str_agg(name, ', ') from episodes group by season";
    print_sql_result(db, sql);
    sqlite3_close(db);
    return 0;
}

注意，步骤函数str_agg_step(),finalize函数str_agg_finalize()
该聚合函数注册成只接收一个参数

3.步骤函数

void str_agg_step(sqlite3_context* ctx, int ncols, sqlite3_value** values)
{
    SAggCtx *p = (SAggCtx *) sqlite3_aggregate_context(ctx, sizeof(*p));
    static const char delim [] = ", ";
    char *txt = sqlite3_value_text(values[0]);
    int len = strlen(txt);
    if (!p->result) {
        p->result = sqlite_malloc(len + 1);
        memcpy(p->result, txt, len + 1);
        p->chrCnt = len;
    } else {
        const int delimLen = sizeof(delim);
        p->result = sqlite_realloc(p->result, p->chrCnt + len + delimLen + 1);
        memcpy(p->result + p->chrCnt, delim, delimLen);
        p->chrCnt += delimLen;
        memcpy(p->result + p->chrCnt, txt, len + 1);
        p->chrCnt += len;
    }
}


// SAggCtx是本例中的结构体
typedef struct SAggCtx SAggCtx;
struct SAggCtx {
    int chrCnt;
    char *result;
};

SAggCtx充当聚合迭代（对步骤函数的调用）之间的状态，维持不断增长的拼接文本和字符数

4.聚合上下文

通过sqlite3_aggregate_context()为给定的聚合实例获取结构体
sqlite3_aggregate_context()首次调用会为该上下文分配数据，之后调用直接获取
聚合完成后（str_agg_finalize()后），结构体内存自动释放
注意：若系统内存不足，sqlite3_aggregate_context()可能返回null,本例中没处理这种异常，实际开发必须处理
若返回null，需触发sqlite3_resut_error_nomem()
在str_agg_step()中，可以用sqlite3_value_text()从首个参数获取被聚合的文本值，然后将其谈价到结构体SAggCtx的result成员中，该及饿哦固体中介拼接字符串
注意2：若SQL参数是null，or内存不足，sqlite3_value_text()可能返回null,需要检查处理

5.Finalize函数

每次显示结果的记录都会触发str_agg_step()调用
所有记录完事后，SQLite调用str_agg_finalize()

void str_agg_finalize(sqlite3_context* ctx)
{
    SAggCtx *p = (SAggCtx *) sqlite3_aggregate_context(ctx, sizeof(*p));
    if( p && p->result ) sqlite3_result_text(ctx, p->result, p->chrCnt, sqlite_free);
}

str_agg_finalize()像用户滴定仪的回调函数一样工作。它获取及饿哦固体sAggctx，若该结构体存在，通过sqlite3_result_text()将聚合的返回值设置为结构体中存储的成员result
若内存不足，or未调用步骤函数，p->zResult 可能为null，SQLite会返回错误
若内存不足，or未调用步骤函数，sqlite3_result_text()可能返回null，聚合结构体也会是null

6.结果

Registering aggregate str_agg()
Running query:
TRACE: select season, str_agg(name, ', ') from episodes group by season
…
season str_agg(name, ', ')

0 Good News Bad News
1 Male Unbonding, The Stake Out, The Robbery, The Stock Tip
2 The Ex-Girlfriend, The Pony Remark, The Busboy, The Baby Shower, …
3 The Note, The Truth, The Dog, The Library, The Pen, The Parking Garage …
…

四、排序规则（Collations）

单词是校对的意思，这里翻译成了排序规则，我挺疑惑的
排序的目的：对事物进行分类比较。
SQLite对结果集中的字段进行排序时（SQLite使用比较操作符，如：< or >=, 在字段内对值进行比较）
首先根据存储类对字段值进行排列
在每种存储类中，根据该类指定的方法进行排序

1. NULL values
2. INTEGER and REAL values
3. TEXT values
4. BLOB values

SQLite 对每种存储类使用对应的排序算法
NULL没有排序
数字按照大小进行排序
BLOB按照二进制进行排序
最后，文本是我们要讨论的排序规则的重点

1.排序规则定义(Collation Defined)

排序规则是比较字符串的方法，定义如下
与逐个byte比较数字代码相反，排序规则使用语言敏感的规则对文本进行比较
通常，排序规则必须处理字符串和字符的排序、比较、排列
排序规则通常使用排序序列
排序序列是一局拍好像的字符串列表，通常都有数字编码，以便记忆和使用
字符串列表是用来判断字符是如何排序、比较以及分类的
给定俩字符，排序规则必须判断出那个在前or相等

1.1 排序规则原理(How Collation Works)

排序方法对将要比较的两个字符串进行切分，共同管排序序列逐一比较每个字符。从左到右进行比较 eg。 jerry与jello进行比较

378D1ACC-3582-4C40-AB9F-FD36C989AD6A.png

本例排序规则是ASCII字符集，图中显示了每个字符的ASCII值，使用刚描述的排序规则，字符串比较到第三个字符时，jerry胜出114>108,jerry>jello
若jerry变Jerry，那么jello胜出，因为J是74，74<106

1.2 标准排序规则类型(Standard Collation Types)

SQLite中唯一内置的排序规则binary使用标准的C函数库memcmp()比较两个字符串。binary排序规则对于英文文本使用很好。但对于其它语言，可能需要其它的排序规则。SQLite还提供了另一种排序规则nocase，它是大小写不敏感的。
排序规则是通过表字段or索引定义以及在查询中指定的方法和字段关联起来的。例如，在foo中创建大小写不敏感的bar字段，使用如下定义create table foo(bar text collate nocase, baz integer);
从那时起，SQLite处理bar字段时，就用使用nocase排序规则。如不想将排序规则附加到数据库对象上，而是在需要时在查询中指定，可以直接在查询中指定他们，如：select * from foo order by bar collate nocase;
SQLite 也可以对cast()表达式的结果应用排序规则，cast()表达式可以将非文本数据转文本数据。我们可以将bar数字值转文本，并像下面这样应用nocase排序：select cast(baz) collate nocase as baz_as text from foo order by baz_as text;

2.简单例子

实现 length_first 排序规则，接收俩字符串，根据长度排序；比如在店里吃名字短的食物
shlite3_create_collation_v2()注册排序规则

int sqlite3_create_collation_v2(
    sqlite3* db, /* database handle */
    const char *zName, /* collation name in SQL */
    int pref16, /* encoding */
    void* pUserData, /* application data */
    int(*xCompare)(void*,int,const void*,int,const void*)
    void(*xDestroy)(void*)
);

与sqlite3_create_function()相似。第一个参数是标准的数据库句柄，第二个是在SQL中使用的排序规则名称（与函数、聚合名称类似）,然后编码方式（编码方式从属于传递给比较函数时被比较字符串的格式）
pUserData是另一个API的主要支撑，该真真传递给回调函数。函数sqlite3_create_collation_v2()基本上是删减版的sqlite3_create_function()
- sqlite3_create_function()输入俩文本参数，返回一个int
- sqlite3_create_collation_v2()去掉了聚合回调函数指针

2.1 Compare函数

参数xCompare指向实际解析文本值的比较函数。比较函数格式如下：

int compare( void* data, /* application data */
    int len1, /* length of string 1 */
    const void* str1, /* string 1 */
    int len2, /* length of string 2 */
    const void* str2) /* string 2 */

字符串关系 < 返回负值，=返回0，>返回正值

int length_first_collation( void* data, int l1, const void* s1,
    int l2, const void* s2 )
    {
    int result, opinion;
    /* Compare lengths */
    if ( l1 == l2 ) result = 0;
    if ( l1 < l2 ) result = 1;
    if ( l1 > l2 ) result = 2;
    /* Form an opinion: is s1 really < or = to s2 ? */
    switch(result) {
        case 0: /* Equal length, collate alphabetically */
        opinion = strcmp(s1,s2);
        break;
        case 1: /* String s1 is shorter */
        opinion = -result;
        break;
        case 2: /* String s2 is shorter */
        opinion = result
        break;
        default: /* Assume equal length just in case */
        opinion = strcmp(s1,s2);
    }
    return opinion;
}

2.2 测试程序

int main(int argc, char **argv)
{
    char *sql; sqlite3 *db; int rc;
    sqlite3_open("foods.db", &db);
    /* Register Collation. */
    fprintf(stdout, "1. Register length_first Collation\n\n");
    sqlite3_create_collation_v2( db, "LENGTH_FIRST", SQLITE_UTF8, db,
    length_first_collation, length_first_collation_del );

    /* Turn SQL logging on. */
    log_sql(db, 1);
    /* Test default collation. */
    fprintf(stdout, "2. Select records using default collation.\n");
    sql = "select name from foods order by name";
    print_sql_result(db, sql);
    /* Test Length First collation. */
    fprintf(stdout, "\nSelect records using length_first collation. \n");
    sql = "select name from foods order by name collate LENGTH_FIRST";
    print_sql_result(db, sql);
    /* Done. */
    sqlite3_close(db);
    return 0;
}

2.3 结果

======================================================
1. Register length_first Collation
2. Select records using default collation.
TRACE: select name from foods order by name
name
-----------------
A1 Sauce
All Day Sucker
Almond Joy
Apple
Apple Cider
Apple Pie
Arabian Mocha Java (beans)
Arby's Roast Beef
Artichokes
Atomic Sub
...
Select records using length_first collation.
TRACE: select name from foods order by name collate LENGTH_FIRST
issue
-----------------
BLT
Gum
Kix
Pez
Pie
Tea
Bran
Duck
Dill
Life
...

======================================================

3.按需排序

SQLite提供一种知道实际需要时才注册排序的懒加载方式。
若不确定您的程序是否需要一些想length_first的排序规则，可以用sqlite3_collation_needed(),将注册延时到使用时
只需提供回调函数，SQLite会在需要时注册未知排序规则，并给定名称

总结

使用扩展C API 向SQLite核心库添加这些自定义函数是对SQLite核心库的重要补充。因此，您可以深挖和修改SQLite的核心内容，甚至可以说SQLite提供了友好的、易于使用的、可以更大范围扩展和定制自身的用户接口，特别是和SQLite汇总已有功能结合时

SQLite权威指南(第二版）第七章 The Extension C API

SQLite权威指南(第二版）第七章 The Extension C API

一、API

1.注册函数sqlite3_create_function()

2.步骤函数

3.返回值

二、函数

1.返回值

2.数组与内存清理器

3.错误处理

4.返回输入值

三、聚合

1.注册函数

2.实例

3.步骤函数

4.聚合上下文

5.Finalize函数

6.结果

四、排序规则（Collations）

1.排序规则定义(Collation Defined)

1.1 排序规则原理(How Collation Works)

1.2 标准排序规则类型(Standard Collation Types)

2.简单例子

2.1 Compare函数

2.2 测试程序

2.3 结果

3.按需排序

总结

你可能感兴趣的:(SQLite权威指南(第二版）第七章 The Extension C API)

1.注册函数`sqlite3_create_function()`