Yakuho

【机器学习】KNN算法及其用KNN解决字体反爬

KNN算法及其用KNN解决字体反爬

关于KNN算法
- 概要
- 简介
- 原理
KNN算法Python实现
KNN解决字体反爬
- web-font介绍
- 例子
最后

关于KNN算法

概要

K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。
KNN方法虽然从原理上也依赖于极限定理，但在类别决策时，只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属类别的，因此对于类域的交叉或重叠较多的待分样本集来说，kNN方法较其他方法更为适合。

简介

下图中，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方形比例为3/5，因此绿色圆被赋予蓝色四方形类。
K最近邻(k-NearestNeighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
KNN算法不仅可以用于分类，还可以用于回归。通过找出一个样本的k个最近邻居，将这些邻居的属性的平均值赋给该样本，就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权值(weight)，如权值与距离成反比。

原理

首先先抛出欧几里得距离公式：

这个公式表示的是在n维空间内，任意两点之间的欧式距离。
举个例子已知两个类别的量化点为：
A类别->x点的量化坐标为(0, 0, 2, 5);
B类别->y点的量化坐标为(1, 1, 5, 2)；
已知一个未知点C量化坐标为(0, 1, 2, 4);
经过计算代入公式:
在维度为1的情况下C与A、B两点的距离分别为0, -1
在维度为2的情况下C与A、B两点的距离分别为1, 0
在维度为3的情况下C与A、B两点的距离分别为0, -3
在维度为4的情况下C与A、B两点的距离分别为-1, 2
再经过公式后，负距离的都会变成正的。最后通过数值得到，A与C的距离值是最小的，所以就把C归类为A。

KNN算法Python实现

在实际应用中，通常已知类别都是很多行的，如果只用for，while循环等一个一个进行计算必然会很影响效率，这时候我们一般都是应该使用numpy进行计算，将多行多列的相同维度的数据变成一个矩阵，之后我们都是使用矩阵进行运算(不太熟悉矩阵运算规则的可以查询一下线性代数的相关知识)，因为python的矩阵运算是用多线程机制，运算速度比普通循环速度快很多。
算法流程：

准备数据。将数据转为矩阵，数据是指量化过后的数据(1、只包含数字；2、相同维度)
准备标签数据。标签数据应为一维数据（如果是矩阵可以将矩阵先扁平化），直接使用下标取值。
将输入矩阵与已有的矩阵进行矩阵减法，算出距离。前提是先把一维的输入矩阵复制多行（python语句np.tile()），使得矩阵与已有的矩阵阶数相同才能进行减法。ps:在Python的numpy中，好像不用扩展输入矩阵，有一个机制会自动匹配已有矩阵的阶数，当进行减法的时候，会自动将输入矩阵变成与已有矩阵相同阶数，不过要相同行数才行。
矩阵进行平方运算。
将矩阵的每一行求和。
将矩阵进行更号运算。
根据距离大小，将距离最小的值对应的索引放到前面，第二小的放第二，以此类推。
根据输入的k范围，计算在k范围内，包含已知矩阵的哪些类别数目最多，返回这个类别的标签
下面贴出代码

def classify_knn(input_x: np.ndarray or list, dataSet: np.ndarray or list, labels: np.ndarray or list, k:int)->list:
    '''
    :param input_x:     data for predicting
    :param dataSet:     dataset for training
    :param labels:   The labels of dataset
    :param k:   The range of a point of input_x
    :return list:  A list of probability which have minimum distance

    Either input_x or dataSet, they're should to normalize at first
    '''
    dataSet = np.array(dataSet)
    labels = np.array(labels).flatten()  # flattening (扁平化)
    dataSetSize = dataSet.shape[0]
    diffMat = np.tile(input_x, (dataSetSize, 1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)  # Turning the sum of every rows to 1*dataSetSize matrix
    distances = sqDistances**0.5
    # Return a sorted(fr min to huge) index list of the value of 1*dataSetSize matrix
    sortedDistIndicies = distances.argsort()
    classCount = {
     }
    for i in range(k):  # Place k numbers of labels/type to classCount keys, and add the values of classCount[label[k]]
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True) # sorted by values(the labels times)
    return sortedClassCount[0][0]

有了这个，我们就可以愉快的进行各种分类问题了。
另外，有另一个问题，如果各维度的值相差较大，不在同一个数量级的话，就要将输入数据和已有的数据都要进行归一化处理，再进行KNN比较好，为什么呢？具体的话看我之前写过的文章。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
https://blog.csdn.net/weixin_41861700/article/details/103100243

KNN解决字体反爬

这次学习用某某点评的例子作为案例:

web-font介绍

web-font是CSS3中的一种标记 @font-face，在@font-face声明里，你可以声明一种字体，指定这种字体字体库文件从网络某个地址下载。

具体写法如下：

@font-face {
    font-family: '字体名称';
    src:  url('http://www.example.com/字体名称.eot'); /* IE9 Compat Modes */
    src:  url('http://www.example.com/字体名称.eot?#iefix') format('embedded-opentype'), /* IE6-IE8 */
    url('http://www.example.com/字体名称.ttf') format('truetype'), /* Safari, Android, iOS */
    url('http://www.example.com/字体名称.woff') format('woff'),  /* Chrome 6+, Firefox 3.6+, IE 9+, Safari 5.1+ */
    url('http://www.example.com/字体名称.svg?#字体名称') format('svg'); /* Legacy iOS */
}

当网页数据需要使用特别的字体来修饰时，我们就可以使用web-font。因为使用web-font会自动从网络中加载字体，并不需要用户本机有安装这个字体。

例子

从某某点评看到，上面清楚的写到什么信息用了什么字体文件。
点开Font，下载对应的woff文件并打开，可以发现如下图：

每一个字对应有一个uni码，但是通常这个值是变化的，那怎么办呢？
我们可以利用fontTools这个第三方库，来对这些字体文件进行操作

from fontTools.ttLib import TTFont
font_1 = TTFont('base.woff')
font_1.saveXML('base_font.xml')

我们打开这个xml，这些个id不用理睬，并不代表真正的数字，我们前面通过FontEditor 百度字体编辑器已找到对应数字关系

比如’uniE7F9’代表数字’7’，在这个文件中找下

我们刷新网页重新获取一个woff文件，重复上面操作
这里’uniEFAC’代表数字’7’ ，保存为xml打开

发现了嘛，这两个不同字体文件中对数字 '7’的描述(TTGlyph 字形位置x，y，on这些)是完全一致的，仅仅是不同的字体文件它对’7’的命名不同，同时观察其他数字也能得到相同的结论。这样我们就找到了问题的关键，只要TTGlyph对象相同，它所表示的就是相同的数字。有时候，这些字形位置只会改变很小，因为如果变化很大的话，字就会变化了。
思路：

1.下载一个字体做基准，建立基准字体unicode和文字关系。

2.刷新后的新字体记为网站字体2，匹配网站字体1和网站字体2的字形找到两种unicode的联系。

3.相同的unicode找到字体库和unicode的关系，最后unicode替换成文字。

下面我们使用KNN。

准备字体，将woff的排版的字通过各大平台的ocr识别下来，得到

font_chi = ' .1234567890店中美家馆小车大市公酒行国品发电金心业商司超生装园场食有新限天面工服海华水房饰城乐汽香部利子老' \
           '艺花专东肉菜学福饭人百餐茶务通味所山区门药银农龙停尚安广鑫二容动南具源兴鲜记时机烤文康信果阳理锅宝达地儿' \
           '衣特产西批坊州牛佳化五米修爱北养卖建材三会鸡室红站德王光名丽油院堂烧江社合星货型村自科快便日民营和活童明' \
           '器烟育宾精屋经居庄石顺林尔县手厅销用好客火雅盛体旅之鞋辣作粉包楼校鱼平彩上吧保永万物教吃设医正造丰健点汤' \
           '网庆技斯洗料配汇木缘加麻联卫川泰色世方寓风幼羊烫来高厂兰阿贝皮全女拉成云维贸道术运都口博河瑞宏京际路祥青' \
           '镇厨培力惠连马鸿钢训影甲助窗布富牌头四多妆吉苑沙恒隆春干饼氏里三管诚制售嘉长轩杂副清计黄讯太鸭号街交与叉' \
           '附近层旁对巷栋环省桥湖段乡厦府铺內侧元购前幢滨处向座下噥凤港开关景泉塘放昌线湾政步宁解白田町溪十八古双胜' \
           '本单同九迎第台玉锦底后七斜期武岭松角纪朝峰六振珠局岗洲横边济井办汉代临弄团外塔杨铁浦字年岛陵原梅进荣友虹' \
           '央桂沿事津凯莲丁秀柳集紫旗张谷的是不了很还个也这我就在以可到错没去过感次要比觉看得说常真们但最喜哈么别位' \
           '能较境非为欢然他挺着价那意种想出员两推做排实分间甜度起满给热完格荐喝等其再几只现朋候样直而买于般豆量选奶' \
           '打每评少算又因情找些份置适什蛋师气你姐棒试总定啊足级整带虾如态且尝主话强当更板知己无酸让入啦式笑赞片酱差' \
           '像提队走嫩才刚午接重串回晚微周值费性桌拍跟块调糕'

将已有的数据uni码对应写成映射关系

font_dict = {
     'glyph00000': ' ', 'x': '.', 'unif347': '1', 'unie5fb': '2', 'unie607': '3', 'unif37a': '4',
            'unie1a3': '5', 'unif4f2': '6', 'unif01a': '7', 'unieb4f': '8', 'unif67a': '9', 'unif21e': '0',
            'unie208': '店', 'unif002': '中', 'unif756': '美', 'unif10a': '家', 'unie25b': '馆', 'uniea7e': '小',
            'uniea2b': '车', 'unie77a': '大', 'unief33': '市', 'unied96': '公', 'unied7c': '酒', 'unie9ce': '行',
            'unif8de': '国', 'unif447': '品', 'unie819': '发', 'uniee90': '电', 'unie7ce': '金', 'unie557': '心',
            'unieec2': '业', 'unie5e1': '商', 'unieace': '司', 'unie709': '超', 'unif738': '生', 'unif646': '装',
            'unie266': '园', 'unie2dc': '场', 'uniea0a': '食', 'unif3df': '有', 'unif1d7': '新', 'unif38a': '限',
            'unie4e5': '天', 'unif80f': '面', 'unie09e': '工', 'unie1df': '服', 'unie7bf': '海', 'unie8cf': '华',
            'unif538': '水', 'unie68a': '房', 'unif7b4': '饰', 'uniefed': '城', 'unif3e2': '乐', 'unie832': '汽',
            'uniea50': '香', 'unif64b': '部', 'unie637': '利', 'unif2b4': '子', 'unif43c': '老', 'unif282': '艺',
            'unie1e1': '花', 'unie696': '专', 'unie954': '东', 'uniec76': '肉', 'unif0e9': '菜', 'unie7db': '学',
            'uniec32': '福', 'unie76c': '饭', 'unieb8b': '人', 'unif106': '百', 'unieb18': '餐', 'unif8b0': '茶',
            'unie513': '务', 'unie18f': '通', 'unieb5e': '味', 'unif4b5': '所', 'uniedec': '山', 'unif2f7': '区',
            'unif4ab': '门', 'unie585': '药', 'unie5f0': '银', 'uniee6e': '农', 'unie581': '龙', 'uniea6e': '停',
            'unie6aa': '尚', 'unif5fc': '安', 'unif87b': '广', 'unieb2c': '鑫', 'unie0ac': '二', 'unif750': '容',
            'unie22a': '动', 'unif86b': '南', 'unie011': '具', 'unie4be': '源', 'unie4ae': '兴', 'unif8f0': '鲜',
            'unief48': '记', 'unie54f': '时', 'unieaf2': '机', 'unieb69': '烤', 'unieee3': '文', 'unif58a': '康',
            'uniea24': '信', 'unie751': '果', 'unied85': '阳', 'uniee30': '理', 'unie6e4': '锅', 'unif18a': '宝',
            'unieb4b': '达', 'unif1b4': '地', 'unif251': '儿', 'unif833': '衣', 'unief78': '特', 'unif627': '产',
            'unif288': '西', 'unie4ab': '批', 'uniec8d': '坊', 'unie0e0': '州', 'uniec0c': '牛', 'unie7be': '佳',
            'unie556': '化', 'unie43f': '五', 'unie238': '米', 'unie296': '修', 'uniea14': '爱', 'unif5f6': '北',
            'unie003': '养', 'unie01b': '卖', 'unif39a': '建', 'unif528': '材', 'unif800': '三', 'unif611': '会',
            'unie404': '鸡', 'unif492': '室', 'unif132': '红', 'unie4f1': '站', 'unieb13': '德', 'unieead': '王',
            'unie97f': '光', 'unif8d6': '名', 'uniec06': '丽', 'unif269': '油', 'unied4a': '院', 'unif372': '堂',
            'unied3c': '烧', 'unif5a6': '江', 'unie43c': '社', 'unif048': '合', 'unie4b8': '星', 'unie539': '货',
            'unie710': '型', 'unie53b': '村', 'unieb6b': '自', 'uniec93': '科', 'unif4de': '快', 'unif5d0': '便',
            'unif64c': '日', 'uniee12': '民', 'unieafd': '营', 'unie56f': '和', 'uniedfb': '活', 'unif609': '童',
            'unif544': '明', 'unie4a2': '器', 'unif8a8': '烟', 'unie622': '育', 'unief11': '宾', 'unie410': '精',
            'unie541': '屋', 'unif0f0': '经', 'unieffa': '居', 'unie94e': '庄', 'uniec28': '石', 'unif1c4': '顺',
            'unie81e': '林', 'unief62': '尔', 'unif22e': '县', 'unif854': '手', 'unif072': '厅', 'unif3b4': '销',
            'uniea63': '用', 'unif706': '好', 'unif417': '客', 'unif5ba': '火', 'unif76a': '雅', 'unif044': '盛',
            'unif466': '体', 'unie078': '旅', 'unie991': '之', 'unie031': '鞋', 'unie8ae': '辣', 'unif2ca': '作',
            'unif3e1': '粉', 'unie601': '包', 'unif3ff': '楼', 'unif5d8': '校', 'uniecd4': '鱼', 'unieb06': '平',
            'unieb9b': '彩', 'unie39b': '上', 'uniec98': '吧', 'unif404': '保', 'unie5d0': '永', 'uniec0f': '万',
            'unieaeb': '物', 'unif014': '教', 'unie167': '吃', 'unie843': '设', 'unif415': '医', 'unif7fa': '正',
            'unif5d2': '造', 'unieac6': '丰', 'unie224': '健', 'unif88d': '点', 'unie806': '汤', 'unie13b': '网',
            'unif62c': '庆', 'unie949': '技', 'unie7ba': '斯', 'unie1c5': '洗', 'unie58a': '料', 'unif794': '配',
            'unie189': '汇', 'unie54d': '木', 'unif381': '缘', 'unie5b3': '加', 'unif79a': '麻', 'unie553': '联',
            'unif813': '卫', 'unie5b4': '川', 'unied27': '泰', 'unie20e': '色', 'unif7d0': '世', 'unif13f': '方',
            'unie232': '寓', 'unie288': '风', 'unie16d': '幼', 'unie63f': '羊', 'unief5c': '烫', 'unif675': '来',
            'unif5c3': '高', 'unie61b': '厂', 'unie894': '兰', 'unie4b1': '阿', 'unif2f8': '贝', 'unif144': '皮',
            'unieba3': '全', 'unif694': '女', 'unie221': '拉', 'unie2b6': '成', 'unif48a': '云', 'unif64a': '维',
            'uniea91': '贸', 'uniec86': '道', 'unie7fb': '术', 'uniecde': '运', 'unie150': '都', 'unif012': '口',
            'unie0e6': '博', 'unie40d': '河', 'uniebe1': '瑞', 'unieaf0': '宏', 'unif5ae': '京', 'uniec37': '际',
            'unie20a': '路', 'unie201': '祥', 'unie080': '青', 'unie9ae': '镇', 'unie979': '厨', 'unieb62': '培',
            'unied3b': '力', 'unieebc': '惠', 'uniee49': '连', 'unif8ac': '马', 'unief87': '鸿', 'unie24c': '钢',
            'unie0ab': '训', 'unief01': '影', 'uniee27': '甲', 'unif433': '助', 'uniecb5': '窗', 'uniec84': '布',
            'unif89f': '富', 'unif7e3': '牌', 'uniea1a': '头', 'unif770': '四', 'unie5e7': '多', 'unif89a': '妆',
            'unie2b8': '吉', 'unie428': '苑', 'unie3eb': '沙', 'unie6ad': '恒', 'unie57a': '隆', 'uniead2': '春',
            'unie4e9': '干', 'unif04a': '饼', 'unif749': '氏', 'unie06f': '里', 'unif078': '三', 'unieb80': '管',
            'uniec91': '诚', 'unied29': '制', 'unif088': '售', 'unieadb': '嘉', 'unif15d': '长', 'unie359': '轩',
            'unif530': '杂', 'unie3aa': '副', 'unif7d2': '清', 'uniebc6': '计', 'unif595': '黄', 'unif66c': '讯',
            'unif70f': '太', 'unie90e': '鸭', 'uniebc2': '号', 'unif0b2': '街', 'unieb23': '交', 'unie180': '与',
            'unie152': '叉', 'unif677': '附', 'unie875': '近', 'unie450': '层', 'unie688': '旁', 'unif8b5': '对',
            'unied11': '巷', 'uniee83': '栋', 'unie41b': '环', 'unie58b': '省', 'unie3af': '桥', 'unif2e9': '湖',
            'unie653': '段', 'unie638': '乡', 'unie7a7': '厦', 'unif023': '府', 'unif84d': '铺', 'unief0a': '內',
            'unie24d': '侧', 'unie897': '元', 'unie822': '购', 'unie971': '前', 'unie37b': '幢', 'unif658': '滨',
            'unie80e': '处', 'unie7e2': '向', 'unie2a1': '座', 'uniec53': '下', 'unie987': '噥', 'unief17': '凤',
            'unie06a': '港', 'unie25e': '开', 'unie19b': '关', 'unif39c': '景', 'unif1d3': '泉', 'unief50': '塘',
            'unif4a8': '放', 'unie166': '昌', 'unie578': '线', 'uniebb4': '湾', 'unif54e': '政', 'unie12d': '步',
            'unif298': '宁', 'uniebee': '解', 'uniefd9': '白', 'uniea54': '田', 'unif1ed': '町', 'unied5b': '溪',
            'uniefb2': '十', 'unif231': '八', 'unif43a': '古', 'unif326': '双', 'unieea5': '胜', 'unieda0': '本',
            'unie1f9': '单', 'unie5c2': '同', 'unief60': '九', 'unif380': '迎', 'unie9d4': '第', 'unif8dd': '台',
            'unie57e': '玉', 'unie889': '锦', 'unif78a': '底', 'unif27a': '后', 'unieb8d': '七', 'unie2f3': '斜',
            'unie90c': '期', 'uniebd2': '武', 'unif526': '岭', 'uniea94': '松', 'unie92e': '角', 'unie923': '纪',
            'unif287': '朝', 'unif0ef': '峰', 'unieea9': '六', 'uniea90': '振', 'unif307': '珠', 'unie811': '局',
            'unie6ef': '岗', 'unie9cc': '洲', 'unie57d': '横', 'unie935': '边', 'unie9da': '济', 'unif867': '井',
            'unif300': '办', 'unif194': '汉', 'unie064': '代', 'unif36f': '临', 'uniebc1': '弄', 'unied54': '团',
            'uniedce': '外', 'unie974': '塔', 'uniefcd': '杨', 'unie05d': '铁', 'unie3bd': '浦', 'unif696': '字',
            'unie88a': '年', 'unif8fd': '岛', 'unie7da': '陵', 'uniec29': '原', 'unie99f': '梅', 'unif405': '进',
            'uniea03': '荣', 'unif29a': '友', 'unie9e2': '虹', 'unie379': '央', 'unif0f3': '桂', 'uniea85': '沿',
            'unif6f8': '事', 'unie87f': '津', 'unie5c3': '凯', 'unie91c': '莲', 'unied0b': '丁', 'unie457': '秀',
            'unie378': '柳', 'unie626': '集', 'uniee13': '紫', 'unie154': '旗', 'unie535': '张', 'unif870': '谷',
            'unie119': '的', 'unie6d9': '是', 'unif484': '不', 'unie71e': '了', 'unie732': '很', 'unie4cf': '还',
            'unif04b': '个', 'unie3db': '也', 'unied72': '这', 'unie69f': '我', 'unif2a4': '就', 'unie33e': '在',
            'unieaf8': '以', 'unif059': '可', 'unieb6a': '到', 'unie769': '错', 'unif33b': '没', 'unif880': '去',
            'unie70d': '过', 'unie320': '感', 'unif371': '次', 'unie42e': '要', 'unif375': '比', 'unif318': '觉',
            'unief6e': '看', 'unie018': '得', 'unieee8': '说', 'unif1a9': '常', 'unif28b': '真', 'unif01e': '们',
            'unie0df': '但', 'unif4e0': '最', 'unif310': '喜', 'unied9c': '哈', 'unif5e7': '么', 'unif3a0': '别',
            'unif3a9': '位', 'unif14f': '能', 'unieb35': '较', 'unie4b7': '境', 'unif2cf': '非', 'unie13d': '为',
            'uniec2d': '欢', 'unif4a6': '然', 'unief30': '他', 'unie2cb': '挺', 'unie9c2': '着', 'unie866': '价',
            'unif157': '那', 'unif61f': '意', 'unif4e1': '种', 'unif765': '想', 'unif545': '出', 'unif893': '员',
            'unie838': '两', 'unif7c0': '推', 'unie621': '做', 'unied73': '排', 'uniea48': '实', 'unif430': '分',
            'unif7ec': '间', 'unie2ea': '甜', 'unif19c': '度', 'unie29f': '起', 'unief00': '满', 'unif2ab': '给',
            'uniefde': '热', 'unie49a': '完', 'uniec23': '格', 'unif38b': '荐', 'uniee0f': '喝', 'uniee33': '等',
            'unif82a': '其', 'unieb4a': '再', 'uniedaf': '几', 'unie983': '只', 'unieffe': '现', 'unie32c': '朋',
            'unie02e': '候', 'unied6e': '样', 'unif53a': '直', 'unif767': '而', 'unie305': '买', 'unie51f': '于',
            'unif1b3': '般', 'unie733': '豆', 'unie85d': '量', 'unif724': '选', 'unif3b8': '奶', 'uniee57': '打',
            'unie6b4': '每', 'unie0ae': '评', 'unie417': '少', 'unif4fc': '算', 'unif4a7': '又', 'unie0b7': '因',
            'unie59e': '情', 'unif63f': '找', 'unif13c': '些', 'uniefbc': '份', 'unie047': '置', 'unie5c4': '适',
            'uniec33': '什', 'unif58c': '蛋', 'unieb8e': '师', 'unif0d3': '气', 'unie7a3': '你', 'unif7dd': '姐',
            'unif120': '棒', 'uniee9e': '试', 'unif069': '总', 'unief71': '定', 'uniede2': '啊', 'unie620': '足',
            'unif5e8': '级', 'unie038': '整', 'unie2c3': '带', 'unie2ca': '虾', 'unie30e': '如', 'unie4f3': '态',
            'unie906': '且', 'unif1fa': '尝', 'unie69b': '主', 'unie0a9': '话', 'unif2a3': '强', 'uniecb4': '当',
            'uniea31': '更', 'unie371': '板', 'unif71e': '知', 'unif5ea': '己', 'unie74b': '无', 'uniec2e': '酸',
            'unif703': '让', 'unie682': '入', 'uniee50': '啦', 'uniefb4': '式', 'unie642': '笑', 'unif418': '赞',
            'unie2c8': '片', 'uniefac': '酱', 'unief35': '差', 'unif05b': '像', 'unief38': '提', 'unif29f': '队',
            'unied5f': '走', 'unif438': '嫩', 'unieac5': '才', 'uniecf9': '刚', 'uniee82': '午', 'unif6c4': '接',
            'unif12a': '重', 'uniec92': '串', 'unif54a': '回', 'unie73a': '晚', 'unie677': '微', 'unie397': '周',
            'unie239': '值', 'unie7b0': '费', 'unif0dc': '性', 'unif3e4': '桌', 'unif271': '拍', 'unie1bc': '跟',
            'unie8e1': '块', 'uniec4e': '调', 'unie69e': '糕'}

通过TTfont拿到各个字的字形位置，并统一化。就是一些字的字形位置信息仅包含很少信息，而有些复杂一点的字的字形位置信息很多，这时候就可以通过不够长度的补0来对数据进行统一化。
通过输入预测矩阵，拿到距离最小的点的标签，也就是原有数据的uni码，通过字典映射，从而拿到实际值。
下面贴出代码

# 训练用
data_list1 = get_offset_font('3aefeca3.xml')
group = np.array(data_list1)[:, 1:].tolist()
labels = get_label_font(np.array(data_list1)[:, :1])
normalize_group = KNN.normalize_data_z_score_arctan(group)
# 测试用
data_list2 = get_offset_font('892bb594.xml')
test_group = np.array(data_list2)[:, 1:].tolist()
test_labels = get_label_font(np.array(data_list2)[:, :1])
normalize_test_group = KNN.normalize_data_z_score_arctan(test_group)
# 测试字体的映射
test_unicode_list = [TTFont('892bb594.woff').getGlyphName(a) for a in range(603)]
test_dict = {
     i: j for i, j in zip(test_unicode_list, font_chi)}

i ,j = 0, 0
total = len(test_labels)
for item in np.array(normalize_test_group).tolist():
   result = KNN.classify_knn(item, dataSet=normalize_group, labels=labels, k=3)
   result_fact = test_dict[test_labels[i]]
   result = font_dict[result]
   print(f'正在预测中，预测结果为【{result}】 实际结果为【{result_fact}】.')
   i += 1
   if result == result_fact:
       j += 1
   else:
       print('↑')
else:
   print(f'准确率为{round(j / total * 100, 2)}%')

...
正在预测中，预测结果为【华】 实际结果为【华】.
正在预测中，预测结果为【影】 实际结果为【影】.
正在预测中，预测结果为【格】 实际结果为【格】.
正在预测中，预测结果为【意】 实际结果为【意】.
正在预测中，预测结果为【比】 实际结果为【比】.
正在预测中，预测结果为【源】 实际结果为【源】.
正在预测中，预测结果为【卫】 实际结果为【卫】.
正在预测中，预测结果为【找】 实际结果为【找】.
正在预测中，预测结果为【.】 实际结果为【.】.
准确率为100.0%

完整项目代码在github。
https://github.com/Yakuho/KNN_Font

最后

欢迎各位和我一起交流交流技术，若你有一些更好的处理方法或者找到我的一些错误，欢迎指出，作者本人水平有限。并且如果觉得有用，请在github留下你们的stars.谢谢.

参考资料
https://baike.baidu.com/item/%E9%82%BB%E8%BF%91%E7%AE%97%E6%B3%95/1151153?
https://zhuanlan.zhihu.com/p/76636123

六月份阶段性大总结之Doris/Clickhouse/Hudi一网打尽王知无(import_bigdata) 大数据编程语言人工智能 java 数据分析
点击上方蓝色字体，选择“设为星标”回复"面试"获取更多惊喜全网最全大数据面试提升手册！这是个阶段性小总结，后面会持续更新。ClickHouse「Clickhouse系列」分布式表&本地表详解「ClickHouse系列」ClickHouse之MergeTree原理「ClickHouse系列」Replication机制详解「ClickHouse系列」ClickHouseSQL基本语法和导入导出实战「C
2024前端Webpack面试题司宁前端面试题前端 webpack
1、谈谈你对Webpack的理解Webpack是一个模块打包工具，可以使用它管理项目中的模块依赖，并编译输出模块所需的静态文件。它可以很好地管理、打包开发中所用到的HTML,CSS,JavaScript和静态文件（图片，字体）等，让开发更高效。对于不同类型的依赖，Webpack有对应的模块加载器，而且会分析模块间的依赖关系，最后合并生成优化的静态资源。2、Webpack的基本功能代码转换：Type
ruby的命令行选项 lizzywu 工具介绍 ruby 脚本编译器 extension shell cgi
ruby的命令行选项来源:LUPA开源社区发布时间:2007-06-2117:04版权申明字体:小中大文章来源于http://www.lupaworld.com请使用如下命令行启动Ruby解释器.ruby[option...][--][programfile][argument...]这里的"option"指下文将要提到的命令行选项中的一个。"--"则显式地表明选项字符串到此结束。"program
Python多版本环境管理UV 坐吃山猪 Python python uv 开发语言
Python多版本环境管理UV1-参考网址Python虚拟环境UV管理工具-官网Python虚拟环境UV管理工具-快速开始pyproject.toml使用指导2-核心知识点1）python项目维护requirements.txt2）python机器学习环境Anaconda3）python轻量级环境管理uv4）uvx快速上手使用3-上手实操1-安装UV虚拟环境管理工具UV官网安装教程#Windows
安装并配置终端字体獨梟全面配置 linux 运维服务器
1.简介在使用OhMyZsh+Powerlevel10k时，正确的字体配置至关重要。Powerlevel10k依赖NerdFonts扩展字体，以正确显示Git状态、分支、时间、图标等信息。如果没有正确配置字体，你可能会看到乱码、问号（?）、方块（□）或缺失的Powerlevel10k图标。本指南将介绍如何安装和配置终端字体，适用于Linux（Ubuntu、CentOS、Arch）、macOS、Wi
《Python实战进阶》No23: 使用 Selenium 自动化浏览器操作带娃的IT创业者 Python实战进阶 python selenium 自动化
No23:使用Selenium自动化浏览器操作摘要Selenium是自动化浏览器操作的“瑞士军刀”，可模拟人类行为操作网页，适用于爬虫、测试、重复任务自动化等场景。本集通过代码驱动实战，从安装配置到复杂交互，带你掌握Selenium的核心技能，并结合电商网站登录、商品下单等真实场景，解决动态加载、反爬等实际问题。核心概念与代码实战1.环境配置与WebDriver基础安装命令：pipinstalls
Flutter如何实现导航状态栏透明 yuanlaile flutter javascript 前端
Flutter如何实现导航状态栏透明，具体操作如下：Widgetbuild(BuildContextcontext){returnMaterialApp(title:'FlutterDemo',theme:ThemeData(colorScheme:ColorScheme.fromSeed(seedColor:Colors.deepPurple),useMaterial3:true,//状态栏字体
python实现KNN算法的手写数字识别：深入解析与完整项目流程快撑死的鱼 Python算法精解算法
随着人工智能和机器学习的快速发展，图像识别技术在多个领域得到广泛应用。而手写数字识别作为图像识别的典型场景之一，已经成为研究者和开发者学习、应用机器学习算法的经典项目。本文将深入解析如何使用Python编程语言，结合KNN（K-最近邻）算法实现手写数字识别系统。文章不仅介绍了算法的核心原理，还从用户交互、图像处理、数据预处理等多个角度对整个项目进行了全方位的讲解。读者通过本文，可以全面掌握手写数字
Flutter container text 组件详解 mylgcs flutter flutter android
Flutter文章目录Container组件是一个常用的可视化容器，可以用来包裹其他Widget，并且它可以设置自己的宽和高，边距，背景颜色等等。而Text组件则是用来显示文本的Widget，可以设置字体大小，颜色，字体样式等等。提示：如有雷同、请联系作者删除文章目录Flutter文章目录前言一、Container1.container组件详解2.用container实现一个自定义按钮二、text
Typora 0.11.18最后一个免费版 hishere python java html c++c#
http://pmkiu.woguheihuasheng.cn/3578174开始typora是非常好用的一个md文件编辑器但是最新版是收费的，直到0.11.18版本这已经够用了https://www.aliyundrive.com/s/X6D4LqiUtD5typora的语法typora语法字体Ctrl+1,2,3,4,5,6,对应6个标题,井号与标题直接有空格#标题1##标题2下划线ctrl+
机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 | 小酒馆燃着灯机器学习算法 k近邻算法
文章目录一KNN算法原理二KNN三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与目标检测3.YOLOv54.YOLOv5改进5.YOLOv8及其改进6.Python与PyTorch7.工具8.小知识点9.杂记一KNN算法原理K近邻分类
KNN算法实例_手写识别系统 V文宝机器学习算法
创建一个简单的书写识别系统，使用KNN算法来识别手写数字。分别使用手写KNN算法和调用scikit-learn库来实现。在数据处理过程中，将使用一个常见的手写数字数据集，如MNIST数据集。数据集我们将使用MNIST数据集，它包含60000个训练样本和10000个测试样本。每个样本是一个28x28像素的灰度图像，表示0-9之间的手写数字。手写KNN算法我们首先手写一个KNN算法来实现书写识别系统。
深入浅出 K 近邻算法：原理、实践与应用烂蜻蜓机器学习近邻算法算法
引言在机器学习的众多算法中，K近邻算法（K-NearestNeighbors，简称KNN）以其简洁而强大的特性占据着重要地位。它既可以用于分类任务，也能在回归任务中发挥作用。无论是处理简单数据集，还是面对复杂的数据分布，KNN都展现出独特的魅力。本文将深入探讨KNN算法的原理、特点、优缺点、实现步骤以及在分类和回归任务中的具体应用。KNN算法的基本原理KNN算法属于监督学习范畴，其核心思想质朴而直
【Python爬虫(71)】用Python爬虫解锁教育数据的奥秘奔跑吧邓邓子 Python爬虫 python 爬虫开发语言教育数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、确定目标网站2.1教育机构官网2.2在线学习平台三、爬
Python爬虫实战：抓取电子图书平台图书信息与下载数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言网络爬虫信息可视化
前言电子图书平台汇集了海量的图书资源和丰富的信息，抓取这些数据可用于研究图书销售趋势、阅读偏好分析，甚至为书籍推荐系统提供数据支持。本文将详细介绍如何使用Python爬虫技术抓取电子图书平台的图书信息和下载数据。我们会涵盖从需求分析到代码实现的完整流程，探讨如何应对复杂的反爬机制，并使用最新的技术工具优化抓取过程。目录前言一、需求分析与目标1.1抓取目标1.2难点与挑战二、技术选型与工具2.1使用
Spring Boot + EasyExcel导入导出，简直太好用了！十一技术斩 spring boot java mybatis
背景老项目主要采用的POI框架来进行Excel数据的导入和导出，但经常会出现OOM的情况，导致整个服务不可用。后续逐步转移到EasyExcel，简直不能太好用了。EasyExcel是阿里巴巴开源插件之一，主要解决了poi框架使用复杂，sax解析模式不容易操作，数据量大起来容易OOM，解决了POI并发造成的报错。主要解决方式：通过解压文件的方式加载，一行一行地加载，并且抛弃样式字体等不重要的数据，降
2024年最全Python逆向进阶：Web逆向私单_逆向工程能接爬虫私活吗(1) 2401_84692110 程序员 python 前端爬虫
可见，大家都迫切地想要掌握Python爬虫技术。很多人都表示，高阶的爬虫技术不太好上手，找到合适的练手项目也很不容易，每个人都在期待一套能快速进阶的技术速成方案。想要快速学好爬虫，尤其是可以用于变现的高阶爬虫技术，野路子的啃书自学就大可不必了，辣条推荐大家直接来参加Python爬虫实战特训营。可直接白瓢三天~↓↓↓文末的这个名片直接找我，直接参加即可↓↓↓这是一套专讲爬虫与反爬虫攻防的实战特训，迄
2024年Python逆向进阶：Web逆向私单_逆向工程能接爬虫私活吗(2) 2301_82243558 程序员 python 前端爬虫
可见，大家都迫切地想要掌握Python爬虫技术。很多人都表示，高阶的爬虫技术不太好上手，找到合适的练手项目也很不容易，每个人都在期待一套能快速进阶的技术速成方案。想要快速学好爬虫，尤其是可以用于变现的高阶爬虫技术，野路子的啃书自学就大可不必了，辣条推荐大家直接来参加Python爬虫实战特训营。可直接白瓢三天~↓↓↓文末的这个名片直接找我，直接参加即可↓↓↓这是一套专讲爬虫与反爬虫攻防的实战特训，迄
基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别普和司
importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet,testDataSet):withopen(filename1,'r')ascsvfile1:lines1=csv.reader(csvfile1)dataSet=list(lines1
HTML常用标签花林似霰f html 前端 javascript
（一）标题标签-标题标签从到一共只有6级标题文本会加粗从上到下字体逐渐减小（二）段落和换行标签1.我是一个段落标签2.在HTML中，一个段落中的文字会从左到右依次排列，直到浏览器窗口的右端，然后才自动换行。如果希望某段文本强制换行显示，就需要使用换行标签。（少有的单标签）（三）和标签和是没有语义的，可以看做是一个盒子，用来装内容的。1.标签用来布局，但是现在一行只能放一个。大盒子2.标签用来布局，
Windows控制台API基本使用(下) 生活需要深度 Windows windows DOS API C++
文章目录前言十三、控制台字体二、字体不支持当前代码页十四、填充指定行一、直接输出二、使用API三、使用转义序列十五、DEC线条绘制功能十六、备用和主缓冲区十七、控制台模式(Consolemode)一、获取控制台模式二、设置控制台模式十八、移动控制台上的文本一、直通链接二、使用API的概述三、此API的参数四、SMALL_RECT结构五、示例一、示例描述二、代码六、特性++？十九、为文本盖上阴影一、
TrueType字体格式（TTF）详解源之缘-OFD专家—求职中字体 truetype ttf
TrueType字体格式（TrueTypeFont，简称TTF）是由苹果公司在1980年代末开发的一种字体格式，旨在提供高质量的屏幕显示和打印输出。TrueType字体格式因其跨平台兼容性和高质量的渲染效果，迅速成为桌面出版和图形设计领域的主流字体格式之一。本文将详细介绍TTF字体格式的结构、特点以及常用的处理工具。一、TrueType字体格式的结构TrueType字体文件由多个表（Tables）
二十二、QT记事本辰卓 qt 开发语言 c++
1.项目概述1.1功能介绍支持文本创建，打开，保存，关闭的功能UI样式美化添加打开快捷键，添加保存快捷底部显示行列号及文本字符编码Ctrl加鼠标滚轮支持字体放大缩小1.2界面预览2.3工程概述MainWindows还是Widget在Qt中，创建"MainWindow"与"Widget"项目的主要区别在于他们的用途和功能范围：1.MainWindow：这是一个包含完整菜单栏、工具栏和状态栏的主窗口应
LVGL v8学习笔记 | 字体的应用技巧嵌入式 CodeMaven 学习笔记前端嵌入式
LVGLv8学习笔记|字体的应用技巧嵌入式在嵌入式系统中，显示器的使用是非常普遍且重要的功能。而为了实现更灵活、美观的用户界面，字体的应用不可或缺。本文将介绍LVGLv8中字体的基本概念以及在嵌入式系统中使用字体的方法，并提供相应的源代码示例。一、字体的基本概念在LVGLv8中，字体是以像素点阵的形式存在的。每个字符由一系列像素点组成，这些像素点排列成矩阵，在显示器上渲染出相应的字符。字体可以分为
告别印象笔记的局限：探索更强大的Markdown编辑工具——Joplin与Obsidian 后端
在信息爆炸的时代，笔记软件成为了我们整理思绪、记录灵感的得力助手。然而，面对市面上琳琅满目的选择，你是否还在为找不到一款称心如意的Markdown编辑工具而烦恼？印象笔记虽自带Markdown编辑功能，却因字体不可修改、渲染效果差等问题让人望而却步；马克飞象虽能与印象笔记同步，但速度慢且收费不菲。今天，我们将为你推荐两款Markdown软件——Joplin和Obsidian，它们不仅解决了上述问题
python学智能算法（七）|KNN邻近算法西猫雷婶人工智能 python学习笔记算法
【1】引言前述学习进程中，已经了解了一些非常经典的智能算法，相关文章包括且不限于：python学智能算法（三）|模拟退火算法：深层分析_模拟退火动画演示-CSDN博客python学智能算法（四）|遗传算法：原理认识和极大值分析_遗传算法和模拟退火时间复杂度-CSDN博客python学智能算法（五）|差分进化算法：原理认识和极小值分析-CSDN博客python学智能算法（六）|神经网络算法：BP神经
Python网络爬虫实战：抓取猫眼TOP100电影信息莱财一哥
本文还有配套的精品资源，点击获取简介：在Python中，Web爬虫是获取互联网数据的关键技能。本教程将指导如何结合使用requests库和正则表达式来从猫眼电影网站的TOP100榜单中抓取电影信息。首先通过requests库发送HTTP请求获取网页内容，然后运用正则表达式提取电影名和评分等信息。在进行网络爬虫时，遵守robots.txt规则，设置请求延时，并考虑处理网站的反爬虫策略。对于更复杂的网
前端-webpack一些常用配置的作用大嘴史努比前端 webpack node.js
1.LoaderLoader用于对模块的源代码进行转换。它可以将非JavaScript文件（如CSS、图片、字体等）转换为webpack能够处理的模块。常用Loader及其作用Loader作用babel-loader将ES6+代码转换为ES5，兼容旧版浏览器。css-loader解析CSS文件，处理@import和url()等语法。style-loader将CSS插入到DOM中，通过标签生效。sa
基于Linux C应用的0.96寸OLED硬件监测器页面 plmm烟酒僧 #香橙派 linux c语言 oled 0.96 应用开发 UI设计
一、前言开发板：香橙派5Plus。librknnrt.so版本：2.3.0。rknndriver：0.9.8。本次的页面设计基于之前写的手写FrameBuffer驱动：Linux手写FrameBuffer任意引脚驱动spi屏幕_rk3588framebuffer-CSDN博客https://blog.csdn.net/plmm__/article/details/145193029?spm=100
前端开发简历优化指南，DeepSeek助您前端简历秒变高分！大模型大数据攻城狮前端面试前端面经前端简历 vue原理社招校招前端框架
目录一、简历格式与排版（一）简洁至上（二）字体与字号的选择（三）文字间距与对齐（四）使用分段与列表二、内容优化（一）个人信息（二）教育背景（三）工作经历（四）专业技能（五）项目经验（六）自我评价（七）技术亮点深度挖掘（八）典型项目模版（九）实习经历技术化改造三、其他注意事项（一）避免错别字与语法错误（二）定制化简历（三）更新频率（四）技术细节缺失（五）技术关联性断裂（六）模糊表达修正（七）技术堆砌
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa