DanceFire

中科院中文分词系统ICTCLAS之人名识别词典分析

前言、

请在阅读本文前，先确认已阅读过论文《张华平,刘群.基于角色标注的中国人名自动识别研究》。

论文把与人名相关的词分为了15个角色，通过词典查询，可以判断某些文字、词所属角色，然后根据模式匹配找到匹配上的名字。

当我分析nr.dct的时候，却发现nr.dct并非完全按照论文所描述的进行的角色划分。以下是我对tag统计后的nr.dct的内容，能够在论文中找到含义的，我标注上了含义。

Tag Count:

Tag = B( 1 ), Count = 513 , 姓氏

Tag = C( 2 ), Count = 955 , 双名的首字

Tag = D( 3 ), Count = 1 , 043 , 双名的末字

Tag = E( 4 ), Count = 574 , 单名

Tag = F( 5 ), Count = 3 , 前缀

Tag = G( 6 ), Count = 9 , 后缀

*Tag = K( 10), Count = 0 , 人名的上文

Tag = L( 11 ), Count = 1 , 198 , 人名的下文

Tag = M( 12 ), Count = 1 , 684 , 两个中国人名之间的成分

Tag = N( 13), Count = 67, <无>

*Tag = U( 20), Count = 0 , 人名的上文与姓氏成词

*Tag = V( 21), Count = 0 , 人名的末字与下文成词

Tag = X( 23 ), Count = 84 , 姓与双名首字成词

Tag = Y( 24 ), Count = 47 , 姓与单名成词

Tag = Z( 25 ), Count = 388 , 双名本身成词

Tag = m( 44), Count = 58, <无>

Tag = *(100), Count = 1, 始##始

Tag = *(101), Count = 1, 末##末

一、关于粗分结果的切分

我们可以从这个统计结果看出，nr.dct中并没有U和V这两个标签，那ICTCLAS如何修正在粗分情况下错误切分的词语呢？据两个例子：

1、"邓/颖/超生/前/使用"

其中的"超生"就必须切开，分成"超/生"，后期才可进一步的标注。

2、"叶/莲/美的/一位/亲戚"

其中"美的"必须切开，分成"美/的"，后期才可进一步的标注。

首先是很不幸，对于上面第一个例子FreeICTCLAS无能为力，因为现在的ICTCLAS的nr.dct里面根本没有"超生"这个词，也就是说，如果粗分结果出现了"超生"这个错误组合了部分人名的词，那么ICTCLAS无法将其拆开从而正确识别人名。

那么对于第二个例子呢？

根据对现有的ICTCLAS的分析，注意到关于切分的地方有这么一个代码

if (m_tagType == TT_NORMAL ||! dictUnknown.IsExist(pWordItems[nWordsIndex].sWord, 44 ))

{

// 如果TT_NORMAL 或者NE词典中无此词（with tag 44）

// 将该词放到m_sWords[i]中，调整m_nWordPosition[i+1]的位置。

strcpy(m_sWords[i],pWordItems[nWordsIndex].sWord);//store currentword

m_nWordPosition[i+1]=m_nWordPosition[i]+strlen(m_sWords[i]);

}

else

{

if(!bSplit)

{

strncpy(m_sWords[i],pWordItems[nWordsIndex].sWord,2);//storecurrent word

m_sWords[i][2]=0;

bSplit=true;

}

else

{

unsigned int nLen=strlen(pWordItems[nWordsIndex].sWord+2);

strncpy(m_sWords[i],pWordItems[nWordsIndex].sWord+2,nLen);//storecurrent word

m_sWords[i][nLen]=0;

bSplit=false;

}

m_nWordPosition[i+1]=m_nWordPosition[i]+strlen(m_sWords[i]);

}

其中：

dictUnknown.IsExist(pWordItems[nWordsIndex].sWord, 44 )

到未登录词词典中去寻找标签为44的当前词，由此判定的是否继续执行切分操作。44是谁呢？前面的统计结果中已经有了：

Tag = m( 44 ), Count = 58 , < 无 >

标签44(m)没有任何对应于论文的说明。关于切分，论文只提到了对于U、V的切分。那m是U还是V呢？因为一共就58个，所以我列出了所有Tag=44的项，大家可以看一下：

Key: 三和 ID = 2 , 564 (Tag = 44 , Frequency = 1 )

Key: 东家 ID = 744 (Tag = 44 , Frequency = 1 )

Key: 之和 ID = 4 , 052 (Tag = 44 , Frequency = 1 )

Key: 健在 ID = 1 , 490 (Tag = 44 , Frequency = 7 )

Key: 初等 ID = 482 (Tag = 44 , Frequency = 2 )

Key: 到时 ID = 672 (Tag = 44 , Frequency = 1 )

Key: 前程 ID = 2 , 379 (Tag = 44 , Frequency = 1 )

Key: 华为 ID = 1 , 306 (Tag = 44 , Frequency = 3 )

Key: 华以 ID = 1 , 307 (Tag = 44 , Frequency = 1 )

Key: 同江 ID = 3 , 024 (Tag = 44 , Frequency = 1 )

Key: 和田 ID = 1 , 229 (Tag = 44 , Frequency = 2 )

Key: 国是 ID = 1 , 172 (Tag = 44 , Frequency = 1 )

Key: 国都 ID = 1 , 164 (Tag = 44 , Frequency = 1 )

Key: 图说 ID = 3 , 057 (Tag = 44 , Frequency = 1 )

Key: 在理 ID = 3 , 889 (Tag = 44 , Frequency = 1 )

Key: 天王 ID = 2,989 (Tag=44, Frequency=1 )

Key: 子书 ID = 4 , 247 (Tag = 44 , Frequency = 1 )

Key: 子孙 ID = 4 , 248 (Tag = 44 , Frequency = 1 )

Key: 学说 ID = 3 , 506 (Tag = 44 , Frequency = 1 )

Key: 对白 ID = 780 (Tag = 44 , Frequency = 1 )

Key: 帅才 ID = 2 , 828 (Tag = 44 , Frequency = 1 )

Key: 平和 ID = 2 , 305 (Tag = 44 , Frequency = 2 )

Key: 怡和 ID = 4 , 448 (Tag = 44 , Frequency = 1 )

Key: 慈和 ID = 538 (Tag = 44 , Frequency = 1 )

Key: 成说 ID = 444 (Tag = 44 , Frequency = 1 )

Key: 文说 ID = 3 , 186 (Tag = 44 , Frequency = 3 )

Key: 新说 ID = 3 , 416 (Tag = 44 , Frequency = 5 )

Key: 明说 ID = 2 , 130 (Tag = 44 , Frequency = 4 )

Key: 有请 ID = 3 , 772 (Tag = 44 , Frequency = 1 )

Key: 来时 ID = 1 , 817 (Tag = 44 , Frequency = 1 )

Key: 来由 ID = 1 , 820 (Tag = 44 , Frequency = 1 )

Key: 永不 ID = 3 , 746 (Tag = 44 , Frequency = 1 )

Key: 清谈 ID = 2 , 434 (Tag = 44 , Frequency = 1 )

Key: 清还 ID = 2 , 429 (Tag = 44 , Frequency = 6 )

Key: 特等 ID = 2 , 957 (Tag = 44 , Frequency = 1 )

Key: 王开 ID = 3 , 115 (Tag = 44 , Frequency = 1 )

Key: 生就 ID = 2 , 674 (Tag = 44 , Frequency = 1 )

Key: 石向 ID = 2 , 720 (Tag = 44 , Frequency = 4 )

Key: 维和 ID = 3 , 152 (Tag = 44 , Frequency = 1 )

Key: 美的 ID = 2,075 (Tag=44, Frequency=3 )

Key: 老是 ID = 1 , 852 (Tag = 44 , Frequency = 1 )

Key: 良将 ID = 1 , 938 (Tag = 44 , Frequency = 1 )

Key: 若是 ID = 2 , 556 (Tag = 44 , Frequency = 1 )

Key: 行将 ID = 3 , 450 (Tag = 44 , Frequency = 1 )

Key: 远在 ID = 3 , 847 (Tag = 44 , Frequency = 3 )

Key: 长发 ID = 388 (Tag = 44 , Frequency = 1 )

Key: 鲁迅文学奖 ID = 2 , 005 (Tag = 44 , Frequency = 1 )

Key: 茅盾文学奖 ID = 2 , 059 (Tag = 44 , Frequency = 3 )

其中有我们刚才说的"美的"，也就是说第二个例句 "叶/莲/美的/一位/亲戚" 会因为这个Tag=m的"美的"词条而成功的被切分为两条。

从这个例句，我们感觉，Tag=m相当于论文里的V，既"人名的末字与下文成词"。可是真的是这样么？

当我继续搜索标签为44的"天王"这个词条的时候，我注意到了199801人民日报语料中只有一条句子和拆分有关：

" 前几天王老头刚收到小孩寄来的照片 "

这句话是"人名的上文与姓氏成词"，也就是对应于论文的U。

这回就乱套了，"m"既对应U又对应V。按照上面拆分的代码，不管任何情况，将m的第一个字拆出来。

做为V还好说，第一个字是名字的末字。但是对于U来说，可就完全不见得了，对于U，应该是拆除了最后一个字的部分。二者交集只有一种特例情况，就是m的词长是2个字。这样拆第一个字和拆最后一个字事实上一样。观察上面Tag=m的词条，我们会发现，除了"茅盾文学奖"和"鲁迅文学奖"这两个莫名其妙的词条外，其余的词条全都是两个字的。词长上满足刚才说的特例。

难道就没有3个字的U和V了么？我相信肯定会有满足U或者V的三字词、四字词，这才是更通用的情况，而FreeICTCLAS里面将U,V特例化成了只允许为2字的词。估计也是因为这个原因，也就没有对应它为U或者V，而是用了另一个字母小写m来表示。

总结一下，FreeICTCLAS实际上并没有真正的实现论文中所说的U,V这两个需要切分的Tag，取而代之的是一个在2个字成词的特例情况下等效的m来针对两个字成词的特例进行处理。

二、关于前缀、后缀的思考

关于FreeICTCLAS中判定词的Pattern有下列几种：

// BBCD:姓+姓+名1+名2;

// BBE: 姓+姓+单名;

// BBZ: 姓+姓+双名成词;

// BCD: 姓+名1+名2;

// BE: 姓+单名;

// BEE: 姓+单名+单名;韩磊磊

// BG: 姓+后缀

// BXD: 姓+姓双名首字成词+双名末字

// BZ: 姓+双名成词;

// B: 姓

// CD: 名1+名2;

// EE: 单名+单名;

// FB: 前缀+姓

// XD: 姓双名首字成词+双名末字

// Y: 姓单名成词

下面是nr.dct关于前缀的词条：
Tag = F, 前缀

Key: 大 ID = 588 (Tag = 5 , Frequency = 3 )

Key: 老 ID = 1 , 834 (Tag = 5 , Frequency = 56 )

Key: 小 ID = 3 , 359 (Tag = 5 , Frequency = 68 )

下面是nr.dct关于后缀的词条：

Tag = G, 后缀

Key: 哥 ID = 1 , 014 (Tag = 6 , Frequency = 2 )

Key: 公 ID = 1 , 071 (Tag = 6 , Frequency = 13 )

Key: 姐 ID = 1 , 579 (Tag = 6 , Frequency = 4 )

Key: 老 ID = 1 , 834 (Tag = 6 , Frequency = 32 )

Key: 某 ID = 2 , 157 (Tag = 6 , Frequency = 40 )

Key: 嫂 ID = 2 , 573 (Tag = 6 , Frequency = 14 )

Key: 氏 ID = 2 , 758 (Tag = 6 , Frequency = 14 )

Key: 帅 ID = 2 , 827 (Tag = 6 , Frequency = 18 )

Key: 总 ID = 4 , 269 (Tag = 6 , Frequency = 2 )

关于前缀、后缀也有些不解。

既然可以如下成词：

// FB: 前缀+姓

// BG: 姓+后缀

那么"张老师"、"周总理"这种两个字的后缀为什么没有收录进来呢？
另外，前缀也有可能是2个字的，比如"馄饨侯"、"泥人张"、"年糕陈"，在前缀中也没有收录进来。

那么"老师"，"总理"这么常用的后缀在词库里是什么呢？

Key: 总理 ID = 4 , 281

(Tag = 11 , Frequency = 105 )

(Tag = 12 , Frequency = 110 )

Key: 老师 ID = 1 , 851

(Tag = 12 , Frequency = 27 )

11是L(实际上是论文中的K)，人名的上文；12是M(实际上是论文中的L)，人名的下文。

在语料库寻找一番后，注意到，"周总理"被标注为"周/nr 总理/n"，并不将二者合并为一个人名，做为同位语处理，后者为名词。因此估计所有两个字的前缀、后缀都是这样进行的标注，而这里所谓的前缀、后缀只是针对单字情况下的前缀、后缀。

三、关于(B)姓氏中出现的错误词条

(B)中有一些词条是不合理的。比如"建军"被标注为B，显然应该拆分为建C军D；而

Key: 孔子 ID = 1 , 779

(Tag = 1 , Frequency = 5 )

应该把"子"做为后缀G，"孔"为姓氏B，形成BG搭配。在Tag为B中，有大量的这类的例子。我感觉这是在根据语料库学习过程中，预处理程序做的不够好，从而导致了这种现象。论文中提到，北大标注的语料库没有能够区分姓和名，这应该是导致nr.dct词典里姓名标注错误的主要原因。而且我怀疑，前面的前缀、后缀是人工总结的，而不是自动抽取出来的。

四、关于论文中的(K)人名的上文、(L)人名的下文、(M)两个中国人名之间的成分

这三个角色如果按照论文中的字母去找，一定会出问题。

需要注意，词典中没有标签为K，人名的上文，的词条。却多出来一个N，论文中没有对应条目。我将N对应的词条贴出来：

[ 13 ] Key: 帮助 ID = 181 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 保 ID = 189 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 保山 ID = 192 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 背着 ID = 212 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 并 ID = 280 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 部署 ID = 326 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 称 ID = 430 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 称赞 ID = 431 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 出局 ID = 489 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 代表 ID = 630 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 的 ID = 685 (Tag = 13 , Frequency = 2 )

[ 13 ] Key: 对 ID = 779 (Tag = 13 , Frequency = 19 )

[ 13 ] Key: 分析 ID = 874 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 夫人 ID = 905 (Tag = 13 , Frequency = 26 )

[ 13 ] Key: 赶到 ID = 959 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 告诉 ID = 1 , 012 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 给 ID = 1 , 036 (Tag = 13 , Frequency = 2 )

[ 13 ] Key: 共诛 ID = 1 , 085 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 和 ID = 1 , 227 (Tag = 13 , Frequency = 76 )

[ 13 ] Key: 欢迎 ID = 1 , 324 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 会见 ID = 1 , 365 (Tag = 13 , Frequency = 3 )

[ 13 ] Key: 及 ID = 1 , 410 (Tag = 13 , Frequency = 2 )

[ 13 ] Key: 将 ID = 1 , 509 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 讲话 ID = 1 , 524 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 交代 ID = 1 , 530 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 接到 ID = 1 , 555 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 来到 ID = 1 , 813 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 老伴 ID = 1 , 836 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 女儿 ID = 2 , 235 (Tag = 13 , Frequency = 2 )

[ 13 ] Key: 陪 ID = 2 , 274 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 陪同 ID = 2 , 276 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 妻子 ID = 2 , 332 (Tag = 13 , Frequency = 3 )

[ 13 ] Key: 请 ID = 2 , 439 (Tag = 13 , Frequency = 3 )

[ 13 ] Key: 饰 ID = 2 , 756 (Tag = 13 , Frequency = 2 )

[ 13 ] Key: 受 ID = 2 , 788 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 送行 ID = 2 , 877 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 题词 ID = 2 , 973 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 同 ID = 3 , 021 (Tag = 13 , Frequency = 5 )

[ 13 ] Key: 托 ID = 3 , 078 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 文 ID = 3 , 179 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 先锋 ID = 3 , 294 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 向 ID = 3 , 348 (Tag = 13 , Frequency = 9 )

[ 13 ] Key: 研究 ID = 3 , 540 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 演 ID = 3 , 560 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 邀请 ID = 3 , 587 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 以 ID = 3 , 659 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 以及 ID = 3 , 660 (Tag = 13 , Frequency = 4 )

[ 13 ] Key: 应 ID = 3 , 720 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 由 ID = 3 , 762 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 与 ID = 3 , 800 (Tag = 13 , Frequency = 19 )

[ 13 ] Key: 原名 ID = 3 , 837 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 在 ID = 3 , 886 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 赞助 ID = 3 , 897 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 找 ID = 3 , 964 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 争取 ID = 4 , 011 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 直到 ID = 4 , 059 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 侄女 ID = 4 , 068 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 致 ID = 4 , 083 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 主持 ID = 4 , 176 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 祝 ID = 4 , 201 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 总书记 ID = 4 , 285 (Tag = 13 , Frequency = 1 )

[ 13 ] Key: 、 ID = 4 , 336 (Tag = 13 , Frequency = 3 , 404 )

[ 13 ] Key:  " ID= 4,347 (Tag=13, Frequency=2)

[ 13 ] Key: （ ID = 4 , 354 (Tag = 13 , Frequency = 18 )

[ 13 ] Key: ） ID = 4 , 355 (Tag = 13 , Frequency = 6 )

[ 13 ] Key: ， ID = 4 , 356 (Tag = 13 , Frequency = 11 )

[ 13 ] Key: ／ ID = 4 , 357 (Tag = 13 , Frequency = 15 )

我感觉这个N实际上是论文里的M, "两个中国人名之间的成分";
而现在的M，实际上是论文里的L, "人名的下文";
现在的L，实际上是论文里的K, "人名的上文"。

也就是说它们三个都错后了一个字母。

五、总结

那么我们重新整理最初的根据tag进行的词条数目统计表，并理解一下词典里的内容：

Tag Count:

Tag = B( 1 ), Count = 513 , (B)姓氏

Tag = C( 2 ), Count = 955 , (C)双名的首字

Tag = D( 3 ), Count = 1 , 043 , (D)双名的末字

Tag = E( 4 ), Count = 574 , (E)单名

Tag = F( 5 ), Count = 3 , (F)前缀

Tag = G( 6 ), Count = 9 , (G)后缀

Tag = L( 11), Count = 1,198, (K)人名的上文

Tag = M( 12), Count = 1,684, (L)人名的下文

Tag = N( 13), Count = 67 , (M)两个中国人名之间的成分

Tag = X( 23 ), Count = 84 , (X)姓与双名首字成词

Tag = Y( 24 ), Count = 47 , (Y)姓与单名成词

Tag = Z( 25 ), Count = 388 , (Z)双名本身成词

Tag = m( 44), Count = 58, (U)人名的上文与姓氏成词 & (V)人名的末字与下文成词

Tag = * ( 100 ), Count = 1 , 始##始

Tag = * ( 101 ), Count = 1 , 末##末

到现在，nr.dct的内容基本上清晰了。但是也提出了更复杂的要求，原ICTCLAS并没有实现3字以上词的切分，我们可能需要考虑实现；另外，如何有效地生成我们自己的nr.dct也是一个题目，这不同于core的一元词频或者二元转移词频，简单的扫描一遍就可以得出结果。从现有的nr.dct中我们可以看到由于预处理程序不完善，有不少错误的词存在在里面，我们需要在于处理中加入更多的分析和规则判断，从而让根据语料库学习的人名识别词典更加精准。

TypeScript 实用类型深度解析：Partial、Pick、Record 的妙用哎哟喂_! typescript javascript 前端
需求背景：在后台系统的用户管理模块中，我们常遇到这样的场景：修改用户资料时只需要传部分字段，展示用户列表时要隐藏敏感信息，快速查找用户需要ID索引等等，这些业务需求都可以通过TypeScript的实用类型优雅解决。文章目录一、`Partial`:构建灵活更新模型二、`Pick`:精准数据裁剪术三、`Record`:构建类型安全字典四、实用类型全家桶五、类型组合的化学效应六、最佳实践指南一、Part
Webshell管理工具的流量特征 w2361734601 WenShell 流量特征
目录一、常见Webshell工具流量特征1.中国菜刀（Chopper）2.冰蝎（Behinder）3.哥斯拉（Godzilla）4.蚁剑（AntSword）5.C99Shell6.Weevely7.隐蔽通道（DNS/ICMP）二、通用检测方法1.流量异常分析2.加密流量识别3.行为特征三、防御策略1.技术层面2.管理层面3.应急响应四、总结一、常见Webshell工具流量特征1.中国菜刀（Chop
实时数据流搜索新纪元：Deepseek与Apache Kafka的深度整合荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 大数据 hadoop 搜索引擎 mongodb 数据库
在大数据时代，实时数据流处理与搜索正成为企业信息架构中的关键挑战。本文提出了一种将Deepseek与ApacheKafka无缝集成的解决方案，通过经典代码示例、前沿异步代码及创新的智能重试机制，为构建高性能实时搜索引擎提供了一整套解决方案。本文不仅展示了技术实现细节，还探讨了架构设计背后的前瞻性思维与技术趋势。一、技术背景与架构设计1.1需求背景随着物联网、社交媒体和在线交易等业务场景的数据激增，
spring-boot-maven-plugin插件配置classifier打不出-exec.jar 阿狸尬多 java spring maven jar
场景：springboot默认打出的包是无法被依赖的，可以对spring-boot-maven-plugin插件配置classifier属性，生成两个jar包，一个是可执行的jar，一个是可以被依赖的jar问题描述配置了spring-boot-maven-plugin插件配置classifier属性，执行package命令，却没有打出-exec.jar包org.springframework.bo
imx6 Linux 编译烧写指南浅色的火
转载自http://blog.csdn.net/wince_lover/article/details/51456745在Ubuntu14.0464位系统上1搭建编译环境1.1安装软件包sudoapt-getinstallgawkwgetgit-corediffstatunziptexinfogcc-multilibbuild-essentialchrpathsocatlibsdl1.2-devs
在django admin里使用jQuery的datetimepicker 蟒蛇玩家 django django 日期时间 admin datetimepicker jquery
djangoadmin是一个很好的数据录入类的后台管理框架，但日期时间的输入插件并不理想。截至djangov2.2，默认的插件是这样的：日期和时间分开，且时间只能选取有限的几个关键时刻，显然不是很好用。网上有些人试图把jQuery里的datetimepicker集成进django，但做的不太干净，有许多坑需要很多注意避免。这里总结一下：安装在自己的django目录里直接拷贝：gitclonehtt
2025 搞钱年入百万最快速的方法只有一个 AI黑客火绒安全极限编程微信 everything 游戏
我之前发的帖子在下面:这里能找到你要的答案！90后的疯狂逆袭：从辞职零收入到宅家暴赚300万，手把手教你收割互联网红利！我的主页：AI黑客-CSDN博客做任何事情知其然才能知其所以然万丈高楼平地起不要想着一口气吃个金娃娃都是一步一步来的。学习也好做人也罢都是要循序渐进的！我今年又再次更新了超级多干货-每日更新的：极致助力让新手就算是六十岁的新手也能让你年入百万！
精通Tomcat：Java Web应用的全方位部署与管理牛牛网络 tomcat
引言在JavaWeb开发领域，Tomcat不仅是一个轻量级的Web应用服务器，更是Servlet和JSP规范的参考实现。它的强大功能和灵活性使得Tomcat成为了Java开发者的首选Web服务器之一。本文将深入探讨Tomcat的安装、配置、项目部署、性能调优以及高级管理技巧，帮助开发者充分利用Tomcat的强大功能。Tomcat服务器详解1.Tomcat简介Tomcat是一个开源的Web服务器和S
Apache Sqoop数据采集问题 Aimyon_36 Data Development apache sqoop hadoop
Sqoop数据采集格式问题一、Sqoop工作原理二、Sqoop命令格式三、Oracle数据采集格式问题四、Sqoop增量采集方案ApacheSqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如：MySQL,Oracle,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HD
抖音小程序开发常见问题与代码解决方案凡科网小帆抖音小程序
抖音小程序开发常见问题与代码解决方案一、API调用与组件使用问题1.分享卡片样式不生效问题：通过`onShareAppMessage`分享的小程序卡片样式显示旧版模板。代码示例：```javascriptPage({onShareAppMessage(){return{title:'新版分享卡片',imMsgType:1//必须添加该参数}}})```解决：在分享参数中显式声明`imMsgType
Web技术与Apache网站部署昭阳~ 前端
一、Web基础与HTTP协议1.1静态网页与动态网页静态网页定义：由纯HTML、CSS、JavaScript构成，文件扩展名为.htm或.html。内容在服务器生成后固定不变，仅通过客户端脚本（如JS）实现视觉动态效果（如动画）。特点：加载速度快、安全性高，但维护成本高，无法根据用户请求动态生成内容。适用场景：企业官网、产品展示页等内容稳定的场景。动态网页定义：结合后端编程语言（如PHP、Pyth
跨境合规必看！速卖通API数据采集与GDPR/CCPA隐私政策适配方案 API_technology 后端开发网络数据挖掘爬虫数据库
在跨境电商业务中，使用速卖通API进行数据采集时，需要严格遵循GDPR（通用数据保护条例，适用于欧盟地区）和CCPA（加州消费者隐私法案，适用于美国加利福尼亚州）等隐私政策。以下是适配方案：1.了解GDPR和CCPA核心要求GDPR数据主体权利：用户有权访问、更正、删除其个人数据，有权限制处理、反对处理，并有权数据可携性。合法处理依据：处理个人数据必须有合法依据，如用户同意、履行合同必要、法定义务
UniApp 实现分享功能哎哟喂_! uni-app vue.js 前端 javascript
文章目录一、环境准备二、代码实现三、常见问题解决一、环境准备1.必要的权限配置在manifest中添加以下权限：{"app-plus":{"distribute":{"android":{"permissions":["","","","",""]}}}}2.各平台配置微信配置前往微信开放平台注册应用在manifest.json中添加："app-plus":{"distribute":{"sdkC
项目管理 - 1.Maven 举目沧桑项目管理 maven java
1.Maven1.Maven是一个项目管理和构建工具，主要用于Java项目，提供1.项目构建（编译、测试、打包、部署等）2.依赖管理（自动下载和管理第三方库）3.项目信息管理（文档生成、报告等）4.统一的项目结构和构建流程2.Maven核心概念1.POM(ProjectObjectModel)：项目对象模型，XML格式的配置文件2.坐标(Coordinates)：通过groupId,artifac
django admin 去掉新增删除计算机辅助工程 django sqlite python
在DjangoAdmin中，你可以通过自定义Admin类来自定义哪些按钮显示，哪些不显示。如果你想隐藏“新增”和“删除”按钮，可以通过重写change_list_template或使用ModelAdmin的has_add_permission和has_delete_permission属性来实现。方法1：使用has_add_permission和has_delete_permission你可以在M
【nodejs】express-generator项目--创建接口及数据库连接步步生花@苏殿主 nodejs express 数据库 node.js
文章目录一、创建接口1、路由routes（1）新建路由文件（2）注册路由2、控制器controller（1）新建controller文件（2）代码3、services（1）新建services文件（2）代码4、models（1）新建services文件（2）安装mongoose（3）代码5、app.js（1）代码（2）连接数据库后重启项目（2）接口请求结果二、数据库连接1、db.config.js
韩国交易所股票行情数据API接口 qiyuansj python java php javascript
韩国股票行情数据API接口，印度股票行情数据API接口，日本股票行情数据API接口对接数据源：启源数据GET股票列表GET/stock-list请求参数名称位置类型必选说明apikeyquerystringyes密钥countryquerystringyes国家编码pagequerystringno页码pageSizequerystringno每页条数返回示例成功///stock-list?api
Android实现加载动画（附带源码） Katie。 Android实战项目 android
一、项目介绍1.背景与动机在现代移动应用中，加载动画不仅能向用户传达“正在努力加载中”的信号，缓解等待焦虑，还能通过视觉效果提升品牌识别度与用户体验。无论是网络请求、复杂计算、还是页面过渡，都离不开加载状态的优雅表达。本项目旨在演示如何在Android中从零实现多种常见的加载动画：系统原生ProgressBar：基于indeterminateDrawable的自定义风格属性动画：通过ObjectA
Windows 图形显示驱动开发-初始化WDDM 1.2 和 PnP 程序员王马 windows图形显示驱动开发驱动开发 windows
(WDDM)1.2及更高版本显示微型端口驱动程序的所有Windows显示驱动程序都必须支持以下行为，以响应即插即用(PnP)基础结构启动和停止请求。根据驱动程序返回成功或失败代码，或者系统硬件是基于基本输入/输出系统(BIOS)还是统一可扩展固件接口(UEFI)，行为可能会有所不同。显示微型端口驱动程序PnPDDI从Windows8开始，MicrosoftDirectX图形内核子系统提供此函数，当
Java [ 进阶 ] 深入理解 JVM lenyan~ JavaSE 笔记 java jvm 开发语言
✨探索Java基础深入理解JVM✨深入理解JVM：结构与垃圾回收机制Java虚拟机（JVM）是Java程序运行的核心，了解JVM的内部结构和垃圾回收机制对优化Java应用性能至关重要。本文将深入探讨JVM的结构和垃圾回收机制，并附上一些代码示例以帮助理解。JVM结构JVM是一种抽象的计算机，负责执行Java字节码程序。JVM的内部结构包括以下几个关键组件：类加载器子系统（ClassLoaderSu
使用PHP对接印度尼西亚股票市场金融数据出海 php 开发语言
在本篇文章中，我们将介绍如何使用PHP语言与StockTVAPI接口对接，获取并处理印度尼西亚（Indonesia）的股票市场数据。我们将以查询IPO信息和查看涨跌排行榜为例，展示具体的操作流程。准备工作首先，确保您已经从StockTV获得了API密钥，并且您的服务器环境支持cURL扩展，因为我们将使用它来发送HTTP请求。一、获取印度尼西亚市场的IPO新股信息为了获取印度尼西亚市场的IPO新股信
对接东南亚股票市场与印度尼西亚市场的数据源金融数据出海数据分析金融 python3.11 数据库 java
随着全球经济一体化的加深，东南亚及印度尼西亚的股票市场吸引了越来越多投资者的目光。本文将介绍如何对接这些市场的数据源，帮助开发者、分析师和投资者更好地获取和分析相关数据。我们将以StockTVAPI为例，展示如何使用Java和SpringBoot来对接这些市场的数据。一、东南亚股票市场的概况东南亚地区包括了多个国家和地区，每个地方都有其独特的金融市场。例如，新加坡交易所（SGX）、马来西亚证券交易
使用国内镜像加速器解决 Docker Hub 拉取镜像慢或被屏蔽的问题由数入道容器编排 docker 容器运维
一、问题背景DockerHub是Docker默认的镜像仓库，但由于网络限制，国内用户直接拉取镜像可能面临以下问题：下载速度极慢（尤其是大镜像）。连接超时或完全被屏蔽（部分网络环境）。依赖国外源的构建步骤失败（如apt-get、pip等）。解决方案：使用国内镜像加速器，将Docker请求代理到国内服务器，提升下载速度并避免网络限制。二、主流国内镜像加速器列表服务商加速器地址备注阿里云https://
有关context7-mcp的功能、场景、交互与实践由数入道交互 mcp 人工智能
一、服务定位与核心解决的问题context7-mcp是Upstash基于ModelContextProtocol(MCP)开发的上下文管理服务，核心目标是解决大语言模型(LLM)在处理复杂任务时的上下文管理难题，具体包括：长文本分段与上下文整合：突破LLM原生上下文长度限制（如GPT-4的32ktokens），支持处理超长文档（如书籍、代码库、多轮对话历史）。动态上下文优化：根据任务需求智能筛选、
【华为HCIP | 华为数通工程师】821—多选解析—第十八页灵韵设计华为数通HCIP821题库解析华为
多选856、以下哪些协议属于多通道协议?A、SMTPB、TelnetC、H.323D、FTP解析：属于多通道协议的有H.323，FTP多选857、堆叠中主交换机选举过程中涉及的参数包括以下哪些项?A、MAC地址B、运行状态C、堆叠IDD、堆叠优先级解析：堆叠的主交换机选举原则为：1.运行状态比较，已经运行的交换机比处于启动状态的交换机优先竞争为主交换机堆叠主交换机选举超时时间为20s，堆叠成员交换
rk3588 驱动开发（三）第五章新字符设备驱动实验 Ant?1 Linux驱动 RK3588 驱动开发数据库
register_chrdev和unregister_chrdev这两个函数是老版本驱动使用的函数，现在新的字符设备驱动已经不再使用这两个函数，而是使用Linux内核推荐的新字符设备驱动API函数。本节我们就来学习一下如何编写新字符设备驱动，并且在驱动模块加载的时候自动创建设备节点文件设备节点文件：设备节点文件（DeviceNode或DeviceFile），也叫设备文件，是Linux系统中用来访问
C++每日训练 Day 18：构建响应式表单与数据验证（初学者友好）嵌入式Jerry C++c++android 开发语言
本篇目标：在前几日协程与事件驱动机制基础上，构建一个响应式表单系统，实现用户输入的异步验证与反馈。通过协程挂起/恢复机制，简化异步逻辑，提升代码可读性。回顾Day17：响应式加载动画与异步数据处理在Day17中，我们实现了一个完整的“点击按钮→显示加载动画→异步加载数据→显示结果”的流程。主要内容包括：加载动画组件：用于在数据加载期间显示加载状态。异步数据加载器：模拟异步加载数据的过程。协程处理逻
commix Julian Paul Assange Kali骇客工具教程 kali commix 网络安全 mysql sql注入
Commix基础用法和高级用法基础用法Commix是一个自动化的命令行注入工具，用于检测和利用Web应用程序中的命令注入漏洞。以下是基本使用方法：基本扫描pythoncommix.py-u"http://example.com/vuln.php?id=1"指定注入点pythoncommix.py-u"http://example.com/vuln.php?id=1"--data="user=adm
亚马逊SP-API自发货标记发货对接剑侠之孤狼 PHP php
基本思路：1.拉取sdk2.createFeedDocument->uploadFeedDocument->createFeed3.getOrder查看订单状态实现过程：1.github找到一个比较好用的sdk进入项目目录，运行composerrequiredouble-break/spapi-php2.执行流程，createFeedDocument->uploadFeedDocument->cr
python——字典晨曦543210 python 开发语言
目录一、简介二、关键知识1、创建字典2、访问元素3、添加/修改元素4、删除元素选择建议5、遍历字典(1)keys()总结6、合并字典核心特性适用场景核心特性增强赋值运算符|=使用建议性能与内存考虑一、简介Python中的字典（dict）是一种非常重要的数据结构，它用于存储键值对（key-valuepairs）。字典的特点是查找速度快、灵活易用。键（Key）：必须是不可变类型（如字符串、数字、元组）
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

中科院中文分词系统ICTCLAS之人名识别词典分析

你可能感兴趣的:(c,华为,照片)