NLP-文本分类(2)

文章目录

  • 1 任务
  • 2.IMDB数据集下载探索
  • 3.THUCNews数据子集探索
      • 查看下训练集总共有多少种类别,以及各类别的数量
    • 数据预处理
    • 1.通过训练集数据,建立自己的字典
    • 2、读取字典的方法,供后续使用
  • 任务三
    • 机器学习中的分类指标
      • 精确率和召回率
          • 精确率(Precision)
          • 召回率(Recall)
          • F1分数
      • P-R曲线
      • ROC和AUC
          • ROC
          • AUC

1 任务

  1. 数据集
    数据集:中、英文数据集各一份

中文数据集:THUCNews
THUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud
英文数据集:IMDB数据集 Sentiment Analysis

  1. IMDB数据集下载和探索

参考TensorFlow官方教程:影评文本分类 | TensorFlow
科赛 - Kesci.com

  1. THUCNews数据集下载和探索

参考博客中的数据集部分和预处理部分:CNN字符级中文文本分类-基于TensorFlow实现 - 一蓑烟雨 - CSDN博客
参考代码:text-classification-cnn-rnn/cnews_loader.py at mas…

  1. 学习召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念

参考1:机器学习之类别不平衡问题 (2) —— ROC和PR曲线_慕课手记

2.IMDB数据集下载探索

#导入包
import tensorflow as tf
from tensorflow import keras

import numpy as np

#导入iMBD数据集
imdb = keras.datasets.imdb

#探索数据集
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

#分析数据集
help(imdb.load_data)

Help on function load_data in module tensorflow.python.keras.datasets.imdb:

load_data(path='imdb.npz', num_words=None, skip_top=0, maxlen=None, seed=113, start_char=1, oov_char=2, index_from=3, **kwargs)
    Loads the IMDB dataset.
    
    Arguments:
        path: where to cache the data (relative to `~/.keras/dataset`).
        num_words: max number of words to include. Words are ranked
            by how often they occur (in the training set) and only
            the most frequent words are kept
        skip_top: skip the top N most frequently occurring words
            (which may not be informative).
        maxlen: sequences longer than this will be filtered out.
        seed: random seed for sample shuffling.
        start_char: The start of a sequence will be marked with this character.
            Set to 1 because 0 is usually the padding character.
        oov_char: words that were cut out because of the `num_words`
            or `skip_top` limit will be replaced with this character.
        index_from: index actual words with this index and higher.
        **kwargs: Used for backwards compatibility.
    
    Returns:
        Tuple of Numpy arrays: `(x_train, y_train), (x_test, y_test)`.
    
    Raises:
        ValueError: in case `maxlen` is so low
            that no input sequence could be kept.
    
    Note that the 'out of vocabulary' character is only used for
    words that were present in the training set but are not included
    because they're not making the `num_words` cut here.
    Words that were not seen in the training set but are in the test set
    have simply been skipped.
print("Training shape: {}, labels: {}".format(train_data.shape, train_labels.shape))
Training shape: (25000,), labels: (25000,)
print(train_data[:5])
print(train_labels[:5])
[list([1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65, 458, 4468, 66, 3941, 4, 173, 36, 256, 5, 25, 100, 43, 838, 112, 50, 670, 2, 9, 35, 480, 284, 5, 150, 4, 172, 112, 167, 2, 336, 385, 39, 4, 172, 4536, 1111, 17, 546, 38, 13, 447, 4, 192, 50, 16, 6, 147, 2025, 19, 14, 22, 4, 1920, 4613, 469, 4, 22, 71, 87, 12, 16, 43, 530, 38, 76, 15, 13, 1247, 4, 22, 17, 515, 17, 12, 16, 626, 18, 2, 5, 62, 386, 12, 8, 316, 8, 106, 5, 4, 2223, 5244, 16, 480, 66, 3785, 33, 4, 130, 12, 16, 38, 619, 5, 25, 124, 51, 36, 135, 48, 25, 1415, 33, 6, 22, 12, 215, 28, 77, 52, 5, 14, 407, 16, 82, 2, 8, 4, 107, 117, 5952, 15, 256, 4, 2, 7, 3766, 5, 723, 36, 71, 43, 530, 476, 26, 400, 317, 46, 7, 4, 2, 1029, 13, 104, 88, 4, 381, 15, 297, 98, 32, 2071, 56, 26, 141, 6, 194, 7486, 18, 4, 226, 22, 21, 134, 476, 26, 480, 5, 144, 30, 5535, 18, 51, 36, 28, 224, 92, 25, 104, 4, 226, 65, 16, 38, 1334, 88, 12, 16, 283, 5, 16, 4472, 113, 103, 32, 15, 16, 5345, 19, 178, 32])
 list([1, 194, 1153, 194, 8255, 78, 228, 5, 6, 1463, 4369, 5012, 134, 26, 4, 715, 8, 118, 1634, 14, 394, 20, 13, 119, 954, 189, 102, 5, 207, 110, 3103, 21, 14, 69, 188, 8, 30, 23, 7, 4, 249, 126, 93, 4, 114, 9, 2300, 1523, 5, 647, 4, 116, 9, 35, 8163, 4, 229, 9, 340, 1322, 4, 118, 9, 4, 130, 4901, 19, 4, 1002, 5, 89, 29, 952, 46, 37, 4, 455, 9, 45, 43, 38, 1543, 1905, 398, 4, 1649, 26, 6853, 5, 163, 11, 3215, 2, 4, 1153, 9, 194, 775, 7, 8255, 2, 349, 2637, 148, 605, 2, 8003, 15, 123, 125, 68, 2, 6853, 15, 349, 165, 4362, 98, 5, 4, 228, 9, 43, 2, 1157, 15, 299, 120, 5, 120, 174, 11, 220, 175, 136, 50, 9, 4373, 228, 8255, 5, 2, 656, 245, 2350, 5, 4, 9837, 131, 152, 491, 18, 2, 32, 7464, 1212, 14, 9, 6, 371, 78, 22, 625, 64, 1382, 9, 8, 168, 145, 23, 4, 1690, 15, 16, 4, 1355, 5, 28, 6, 52, 154, 462, 33, 89, 78, 285, 16, 145, 95])
 list([1, 14, 47, 8, 30, 31, 7, 4, 249, 108, 7, 4, 5974, 54, 61, 369, 13, 71, 149, 14, 22, 112, 4, 2401, 311, 12, 16, 3711, 33, 75, 43, 1829, 296, 4, 86, 320, 35, 534, 19, 263, 4821, 1301, 4, 1873, 33, 89, 78, 12, 66, 16, 4, 360, 7, 4, 58, 316, 334, 11, 4, 1716, 43, 645, 662, 8, 257, 85, 1200, 42, 1228, 2578, 83, 68, 3912, 15, 36, 165, 1539, 278, 36, 69, 2, 780, 8, 106, 14, 6905, 1338, 18, 6, 22, 12, 215, 28, 610, 40, 6, 87, 326, 23, 2300, 21, 23, 22, 12, 272, 40, 57, 31, 11, 4, 22, 47, 6, 2307, 51, 9, 170, 23, 595, 116, 595, 1352, 13, 191, 79, 638, 89, 2, 14, 9, 8, 106, 607, 624, 35, 534, 6, 227, 7, 129, 113])
 list([1, 4, 2, 2, 33, 2804, 4, 2040, 432, 111, 153, 103, 4, 1494, 13, 70, 131, 67, 11, 61, 2, 744, 35, 3715, 761, 61, 5766, 452, 9214, 4, 985, 7, 2, 59, 166, 4, 105, 216, 1239, 41, 1797, 9, 15, 7, 35, 744, 2413, 31, 8, 4, 687, 23, 4, 2, 7339, 6, 3693, 42, 38, 39, 121, 59, 456, 10, 10, 7, 265, 12, 575, 111, 153, 159, 59, 16, 1447, 21, 25, 586, 482, 39, 4, 96, 59, 716, 12, 4, 172, 65, 9, 579, 11, 6004, 4, 1615, 5, 2, 7, 5168, 17, 13, 7064, 12, 19, 6, 464, 31, 314, 11, 2, 6, 719, 605, 11, 8, 202, 27, 310, 4, 3772, 3501, 8, 2722, 58, 10, 10, 537, 2116, 180, 40, 14, 413, 173, 7, 263, 112, 37, 152, 377, 4, 537, 263, 846, 579, 178, 54, 75, 71, 476, 36, 413, 263, 2504, 182, 5, 17, 75, 2306, 922, 36, 279, 131, 2895, 17, 2867, 42, 17, 35, 921, 2, 192, 5, 1219, 3890, 19, 2, 217, 4122, 1710, 537, 2, 1236, 5, 736, 10, 10, 61, 403, 9, 2, 40, 61, 4494, 5, 27, 4494, 159, 90, 263, 2311, 4319, 309, 8, 178, 5, 82, 4319, 4, 65, 15, 9225, 145, 143, 5122, 12, 7039, 537, 746, 537, 537, 15, 7979, 4, 2, 594, 7, 5168, 94, 9096, 3987, 2, 11, 2, 4, 538, 7, 1795, 246, 2, 9, 2, 11, 635, 14, 9, 51, 408, 12, 94, 318, 1382, 12, 47, 6, 2683, 936, 5, 6307, 2, 19, 49, 7, 4, 1885, 2, 1118, 25, 80, 126, 842, 10, 10, 2, 2, 4726, 27, 4494, 11, 1550, 3633, 159, 27, 341, 29, 2733, 19, 4185, 173, 7, 90, 2, 8, 30, 11, 4, 1784, 86, 1117, 8, 3261, 46, 11, 2, 21, 29, 9, 2841, 23, 4, 1010, 2, 793, 6, 2, 1386, 1830, 10, 10, 246, 50, 9, 6, 2750, 1944, 746, 90, 29, 2, 8, 124, 4, 882, 4, 882, 496, 27, 2, 2213, 537, 121, 127, 1219, 130, 5, 29, 494, 8, 124, 4, 882, 496, 4, 341, 7, 27, 846, 10, 10, 29, 9, 1906, 8, 97, 6, 236, 2, 1311, 8, 4, 2, 7, 31, 7, 2, 91, 2, 3987, 70, 4, 882, 30, 579, 42, 9, 12, 32, 11, 537, 10, 10, 11, 14, 65, 44, 537, 75, 2, 1775, 3353, 2, 1846, 4, 2, 7, 154, 5, 4, 518, 53, 2, 2, 7, 3211, 882, 11, 399, 38, 75, 257, 3807, 19, 2, 17, 29, 456, 4, 65, 7, 27, 205, 113, 10, 10, 2, 4, 2, 2, 9, 242, 4, 91, 1202, 2, 5, 2070, 307, 22, 7, 5168, 126, 93, 40, 2, 13, 188, 1076, 3222, 19, 4, 2, 7, 2348, 537, 23, 53, 537, 21, 82, 40, 2, 13, 2, 14, 280, 13, 219, 4, 2, 431, 758, 859, 4, 953, 1052, 2, 7, 5991, 5, 94, 40, 25, 238, 60, 2, 4, 2, 804, 2, 7, 4, 9941, 132, 8, 67, 6, 22, 15, 9, 283, 8, 5168, 14, 31, 9, 242, 955, 48, 25, 279, 2, 23, 12, 1685, 195, 25, 238, 60, 796, 2, 4, 671, 7, 2804, 5, 4, 559, 154, 888, 7, 726, 50, 26, 49, 7008, 15, 566, 30, 579, 21, 64, 2574])
 list([1, 249, 1323, 7, 61, 113, 10, 10, 13, 1637, 14, 20, 56, 33, 2401, 18, 457, 88, 13, 2626, 1400, 45, 3171, 13, 70, 79, 49, 706, 919, 13, 16, 355, 340, 355, 1696, 96, 143, 4, 22, 32, 289, 7, 61, 369, 71, 2359, 5, 13, 16, 131, 2073, 249, 114, 249, 229, 249, 20, 13, 28, 126, 110, 13, 473, 8, 569, 61, 419, 56, 429, 6, 1513, 18, 35, 534, 95, 474, 570, 5, 25, 124, 138, 88, 12, 421, 1543, 52, 725, 6397, 61, 419, 11, 13, 1571, 15, 1543, 20, 11, 4, 2, 5, 296, 12, 3524, 5, 15, 421, 128, 74, 233, 334, 207, 126, 224, 12, 562, 298, 2167, 1272, 7, 2601, 5, 516, 988, 43, 8, 79, 120, 15, 595, 13, 784, 25, 3171, 18, 165, 170, 143, 19, 14, 5, 7224, 6, 226, 251, 7, 61, 113])]
[1 0 0 1 0]
#获取前两个文本长度
len(train_data[0]), len(train_data[1])

(218, 189)
#获取前三个类别
print(train_labels[:3])

[1 0 0]
#:
#获取字词-整数字典标签
word_index = imdb.get_word_index()
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb_word_index.json
1646592/1641221 [==============================] - 0s 0us/step
# reverse_word_index反序字典格式:{序号:单词}
reverse_word_index=dict([(value, key) for (key, value) in word_index.items()])
# 查看前5个序号的单词,注意序号从1开始
for i in range(5):
    print(reverse_word_index[i+1])
the
and
a
of
to
# 在开头添加这几个特殊标志,并占用前几个字符
# 上一部得知,序号是从1开始,所以这里+3是正确的,即先把所有序号往后推3位,再添加特殊标志
word_index = {k:(v+3) for k,v in word_index.items()}
word_index[""] = 0
word_index[""] = 1
word_index[""] = 2  # unknown
word_index[""] = 3
#把字典啊{字符:序号}转化成{序号:字符}的形式
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
for i in range(5):
    print(reverse_word_index[i])




the
# 定义一个函数,将序号文本转换成单词文本,用空格连接
#揭秘文档,text内容应该都是序号,要转换成字符
def decode_review(text):
    #把序号转换成字符,若有新字符,用?代替。最后并组成一个字符串
    return ' '.join([reverse_word_index.get(i, '?') for i in text])
text0=decode_review(train_data[0])
print(text0)
 this film was just brilliant casting location scenery story direction everyone's really suited the part they played and you could just imagine being there robert  is an amazing actor and now the same being director  father came from the same scottish island as myself so i loved the fact there was a real connection with this film the witty remarks throughout the film were great it was just brilliant so much that i bought the film as soon as it was released for  and would recommend it to everyone to watch and the fly fishing was amazing really cried at the end it was so sad and you know what they say if you cry at a film it must have been good and this definitely was also  to the two little boy's that played the  of norman and paul they were just brilliant children are often left out of the  list i think because the stars that play them all grown up are such a big profile for the whole film but these children are amazing and should be praised for what they have done don't you think the whole story was so lovely because it was true and was someone's life after all that was shared with us all
#影评长度标准化
train_data = keras.preprocessing.sequence.pad_sequences(train_data,
                                                        value=word_index[""],
                                                        padding='post',
                                                        maxlen=256)


test_data = keras.preprocessing.sequence.pad_sequences(test_data,
                                                       value=word_index[""],
                                                       padding='post',
                                                       maxlen=256)
print(train_data[0])
[   1   14   22   16   43  530  973 1622 1385   65  458 4468   66 3941
    4  173   36  256    5   25  100   43  838  112   50  670    2    9
   35  480  284    5  150    4  172  112  167    2  336  385   39    4
  172 4536 1111   17  546   38   13  447    4  192   50   16    6  147
 2025   19   14   22    4 1920 4613  469    4   22   71   87   12   16
   43  530   38   76   15   13 1247    4   22   17  515   17   12   16
  626   18    2    5   62  386   12    8  316    8  106    5    4 2223
 5244   16  480   66 3785   33    4  130   12   16   38  619    5   25
  124   51   36  135   48   25 1415   33    6   22   12  215   28   77
   52    5   14  407   16   82    2    8    4  107  117 5952   15  256
    4    2    7 3766    5  723   36   71   43  530  476   26  400  317
   46    7    4    2 1029   13  104   88    4  381   15  297   98   32
 2071   56   26  141    6  194 7486   18    4  226   22   21  134  476
   26  480    5  144   30 5535   18   51   36   28  224   92   25  104
    4  226   65   16   38 1334   88   12   16  283    5   16 4472  113
  103   32   15   16 5345   19  178   32    0    0    0    0    0    0
    0    0    0    0    0    0    0    0    0    0    0    0    0    0
    0    0    0    0    0    0    0    0    0    0    0    0    0    0
    0    0    0    0]
len(train_data[0]), len(train_data[1])
(256, 256)
#输入形状是用于电影评论的词汇计数(10,000字)
vocab_size = 10000

model = keras.Sequential()
#第一层是 Embedding 层。该层会在整数编码的词汇表中查找每个字词-索引的嵌入向量。
#模型在接受训练时会学习这些向量。这些向量会向输出数组添加一个维度。生成的维度为:(batch, sequence, embedding)。
model.add(keras.layers.Embedding(vocab_size, 16))
# GlobalAveragePooling1D 层通过对序列维度求平均值,针对每个样本返回一个长度固定的输出向量。
#这样,模型便能够以尽可能简单的方式处理各种长度的输入。
model.add(keras.layers.GlobalAveragePooling1D())
#该长度固定的输出向量会传入一个全连接 (Dense) 层(包含 16 个隐藏单元)。
model.add(keras.layers.Dense(16, activation=tf.nn.relu))
model.add(keras.layers.Dropout(0.5))
#最后一层与单个输出节点密集连接。应用 sigmoid 激活函数后,结果是介于 0 到 1 之间的浮点值,表示概率或置信水平。
model.add(keras.layers.Dense(1, activation=tf.nn.sigmoid))

model.summary()
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\ops\resource_variable_ops.py:435: colocate_with (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
Instructions for updating:
Colocations handled automatically by placer.
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\keras\layers\core.py:143: calling dropout (from tensorflow.python.ops.nn_ops) with keep_prob is deprecated and will be removed in a future version.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding (Embedding)        (None, None, 16)          160000    
_________________________________________________________________
global_average_pooling1d (Gl (None, 16)                0         
_________________________________________________________________
dense (Dense)                (None, 16)                272       
_________________________________________________________________
dropout (Dropout)            (None, 16)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 17        
=================================================================
Total params: 160,289
Trainable params: 160,289
Non-trainable params: 0
_________________________________________________________________
#模型损失函数与指定优化函数
model.compile(optimizer=tf.train.AdamOptimizer(),
              loss='binary_crossentropy',
              metrics=['accuracy'])

#构建验证集
x_val = train_data[:10000]
partial_x_train = train_data[10000:]

y_val = train_labels[:10000]
partial_y_train = train_labels[10000:]

#训练模型
history = model.fit(partial_x_train,
                    partial_y_train,
                    epochs=40,
                    batch_size=512,
                    validation_data=(x_val, y_val),
                    verbose=1)
Train on 15000 samples, validate on 10000 samples
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
Epoch 1/40
15000/15000 [==============================] - 2s 122us/sample - loss: 0.6917 - acc: 0.5569 - val_loss: 0.6895 - val_acc: 0.7405
Epoch 2/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.6856 - acc: 0.6554 - val_loss: 0.6815 - val_acc: 0.7569
Epoch 3/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.6736 - acc: 0.7032 - val_loss: 0.6651 - val_acc: 0.7628
Epoch 4/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.6508 - acc: 0.7277 - val_loss: 0.6376 - val_acc: 0.7629
Epoch 5/40
15000/15000 [==============================] - 1s 75us/sample - loss: 0.6161 - acc: 0.7631 - val_loss: 0.6003 - val_acc: 0.7981
Epoch 6/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.5762 - acc: 0.7805 - val_loss: 0.5576 - val_acc: 0.8163
Epoch 7/40
15000/15000 [==============================] - 1s 72us/sample - loss: 0.5294 - acc: 0.8121 - val_loss: 0.5114 - val_acc: 0.8315
Epoch 8/40
15000/15000 [==============================] - 1s 63us/sample - loss: 0.4825 - acc: 0.8334 - val_loss: 0.4690 - val_acc: 0.8431
Epoch 9/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.4452 - acc: 0.8420 - val_loss: 0.4324 - val_acc: 0.8527
Epoch 10/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.4094 - acc: 0.8567 - val_loss: 0.4030 - val_acc: 0.8585
Epoch 11/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.3800 - acc: 0.8647 - val_loss: 0.3784 - val_acc: 0.8671
Epoch 12/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.3556 - acc: 0.8763 - val_loss: 0.3596 - val_acc: 0.8689
Epoch 13/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.3336 - acc: 0.8814 - val_loss: 0.3432 - val_acc: 0.8734
Epoch 14/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.3146 - acc: 0.8876 - val_loss: 0.3312 - val_acc: 0.8765
Epoch 15/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.2984 - acc: 0.8945 - val_loss: 0.3213 - val_acc: 0.8780
Epoch 16/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.2866 - acc: 0.8998 - val_loss: 0.3125 - val_acc: 0.8780
Epoch 17/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.2715 - acc: 0.9048 - val_loss: 0.3053 - val_acc: 0.8810
Epoch 18/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.2586 - acc: 0.9118 - val_loss: 0.3001 - val_acc: 0.8818
Epoch 19/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.2458 - acc: 0.9154 - val_loss: 0.2947 - val_acc: 0.8844
Epoch 20/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2338 - acc: 0.9205 - val_loss: 0.2911 - val_acc: 0.8832
Epoch 21/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2220 - acc: 0.9239 - val_loss: 0.2879 - val_acc: 0.8841
Epoch 22/40
15000/15000 [==============================] - 1s 60us/sample - loss: 0.2171 - acc: 0.9261 - val_loss: 0.2862 - val_acc: 0.8858
Epoch 23/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2056 - acc: 0.9331 - val_loss: 0.2856 - val_acc: 0.8850
Epoch 24/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1998 - acc: 0.9327 - val_loss: 0.2835 - val_acc: 0.8850
Epoch 25/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1948 - acc: 0.9372 - val_loss: 0.2826 - val_acc: 0.8869
Epoch 26/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.1857 - acc: 0.9420 - val_loss: 0.2828 - val_acc: 0.8846
Epoch 27/40
15000/15000 [==============================] - 1s 61us/sample - loss: 0.1783 - acc: 0.9433 - val_loss: 0.2827 - val_acc: 0.8868
Epoch 28/40
15000/15000 [==============================] - 1s 62us/sample - loss: 0.1719 - acc: 0.9463 - val_loss: 0.2836 - val_acc: 0.8861
Epoch 29/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1661 - acc: 0.9481 - val_loss: 0.2873 - val_acc: 0.8841
Epoch 30/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1621 - acc: 0.9506 - val_loss: 0.2855 - val_acc: 0.8856
Epoch 31/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1544 - acc: 0.9535 - val_loss: 0.2874 - val_acc: 0.8867
Epoch 32/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.1486 - acc: 0.9556 - val_loss: 0.2892 - val_acc: 0.8866
Epoch 33/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1438 - acc: 0.9581 - val_loss: 0.2914 - val_acc: 0.8860
Epoch 34/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1392 - acc: 0.9613 - val_loss: 0.2931 - val_acc: 0.8855
Epoch 35/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1351 - acc: 0.9610 - val_loss: 0.2964 - val_acc: 0.8855
Epoch 36/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1300 - acc: 0.9641 - val_loss: 0.2981 - val_acc: 0.8842
Epoch 37/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1249 - acc: 0.9664 - val_loss: 0.3009 - val_acc: 0.8839
Epoch 38/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1221 - acc: 0.9669 - val_loss: 0.3049 - val_acc: 0.8829
Epoch 39/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.1187 - acc: 0.9689 - val_loss: 0.3086 - val_acc: 0.8816
Epoch 40/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1128 - acc: 0.9709 - val_loss: 0.3102 - val_acc: 0.8832

#训练模型
history = model.fit(partial_x_train,
                    partial_y_train,
                    epochs=40,
                    batch_size=512,
                    validation_data=(x_val, y_val),
                    verbose=1)
Train on 15000 samples, validate on 10000 samples
Epoch 1/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1097 - acc: 0.9719 - val_loss: 0.3141 - val_acc: 0.8821
Epoch 2/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1073 - acc: 0.9721 - val_loss: 0.3164 - val_acc: 0.8813
Epoch 3/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1040 - acc: 0.9743 - val_loss: 0.3202 - val_acc: 0.8824
Epoch 4/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1001 - acc: 0.9763 - val_loss: 0.3233 - val_acc: 0.8811
Epoch 5/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0977 - acc: 0.9760 - val_loss: 0.3278 - val_acc: 0.8799
Epoch 6/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0947 - acc: 0.9774 - val_loss: 0.3362 - val_acc: 0.8771
Epoch 7/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0914 - acc: 0.9777 - val_loss: 0.3355 - val_acc: 0.8788
Epoch 8/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0881 - acc: 0.9802 - val_loss: 0.3405 - val_acc: 0.8787
Epoch 9/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.0846 - acc: 0.9815 - val_loss: 0.3447 - val_acc: 0.8777
Epoch 10/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0812 - acc: 0.9829 - val_loss: 0.3486 - val_acc: 0.8789
Epoch 11/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0799 - acc: 0.9835 - val_loss: 0.3526 - val_acc: 0.8782
Epoch 12/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0779 - acc: 0.9825 - val_loss: 0.3611 - val_acc: 0.8754
Epoch 13/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0768 - acc: 0.9839 - val_loss: 0.3636 - val_acc: 0.8757
Epoch 14/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.0712 - acc: 0.9853 - val_loss: 0.3686 - val_acc: 0.8758
Epoch 15/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0704 - acc: 0.9865 - val_loss: 0.3728 - val_acc: 0.8774
Epoch 16/40
15000/15000 [==============================] - 1s 63us/sample - loss: 0.0677 - acc: 0.9865 - val_loss: 0.3804 - val_acc: 0.8760
Epoch 17/40
15000/15000 [==============================] - 1s 64us/sample - loss: 0.0667 - acc: 0.9865 - val_loss: 0.3824 - val_acc: 0.8773
Epoch 18/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.0653 - acc: 0.9869 - val_loss: 0.3937 - val_acc: 0.8726
Epoch 19/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0615 - acc: 0.9879 - val_loss: 0.3931 - val_acc: 0.8763
Epoch 20/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0600 - acc: 0.9891 - val_loss: 0.3983 - val_acc: 0.8752
Epoch 21/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0591 - acc: 0.9893 - val_loss: 0.4023 - val_acc: 0.8762
Epoch 22/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0572 - acc: 0.9898 - val_loss: 0.4078 - val_acc: 0.8754
Epoch 23/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0545 - acc: 0.9907 - val_loss: 0.4136 - val_acc: 0.8750
Epoch 24/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0527 - acc: 0.9900 - val_loss: 0.4196 - val_acc: 0.8740
Epoch 25/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0515 - acc: 0.9905 - val_loss: 0.4248 - val_acc: 0.8743
Epoch 26/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0493 - acc: 0.9909 - val_loss: 0.4310 - val_acc: 0.8738
Epoch 27/40
15000/15000 [==============================] - 1s 52us/sample - loss: 0.0468 - acc: 0.9928 - val_loss: 0.4392 - val_acc: 0.8719
Epoch 28/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0479 - acc: 0.9916 - val_loss: 0.4440 - val_acc: 0.8726
Epoch 29/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0452 - acc: 0.9924 - val_loss: 0.4491 - val_acc: 0.8719
Epoch 30/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.0445 - acc: 0.9928 - val_loss: 0.4543 - val_acc: 0.8717
Epoch 31/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0424 - acc: 0.9931 - val_loss: 0.4633 - val_acc: 0.8708
Epoch 32/40
15000/15000 [==============================] - 1s 67us/sample - loss: 0.0411 - acc: 0.9933 - val_loss: 0.4677 - val_acc: 0.8702
Epoch 33/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0404 - acc: 0.9930 - val_loss: 0.4732 - val_acc: 0.8705
Epoch 34/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0385 - acc: 0.9941 - val_loss: 0.4791 - val_acc: 0.8702
Epoch 35/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0363 - acc: 0.9949 - val_loss: 0.4854 - val_acc: 0.8702
Epoch 36/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0379 - acc: 0.9935 - val_loss: 0.4895 - val_acc: 0.8696
Epoch 37/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0353 - acc: 0.9949 - val_loss: 0.5010 - val_acc: 0.8680
Epoch 38/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0336 - acc: 0.9955 - val_loss: 0.5022 - val_acc: 0.8693
Epoch 39/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0330 - acc: 0.9953 - val_loss: 0.5120 - val_acc: 0.8680
Epoch 40/40
15000/15000 [==============================] - 1s 61us/sample - loss: 0.0333 - acc: 0.9949 - val_loss: 0.5170 - val_acc: 0.8678
#评估模型
results = model.evaluate(test_data, test_labels)

print(results)
25000/25000 [==============================] - 0s 18us/sample - loss: 0.5483 - acc: 0.8566
[0.5482739968276024, 0.85664]
#创建准确率和损失随时间变化的图
history_dict = history.history
history_dict.keys()
dict_keys(['loss', 'acc', 'val_loss', 'val_acc'])
#导入做图包matplotlib
import matplotlib.pyplot as plt
#赋值
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

#损失图
epochs = range(1, len(acc) + 1)

plt.plot(epochs, loss, 'bo', label = 'Training loss')     #bo 蓝点
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')     #b 蓝线
plt.title('Training and Validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()


plt.clf()   # 清图
acc_values = history_dict['acc']
val_acc_values = history_dict['val_acc']

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()

plt.show()

3.THUCNews数据子集探索

import pandas as pd
import numpy as np
import tensorflow as tf

# 训练集数据
train_data=pd.read_csv('./cnews.train.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(train_data.shape)
train_data.head()
(50000, 2)
.dataframe tbody tr th {
    vertical-align: top;
}

.dataframe thead th {
    text-align: right;
}
label content
0 体育 马晓旭意外受伤让国奥警惕 无奈大雨格外青睐殷家军记者傅亚雨沈阳报道 来到沈阳,国奥队依然没有...
1 体育 商瑞华首战复仇心切 中国玫瑰要用美国方式攻克瑞典多曼来了,瑞典来了,商瑞华首战求3分的信心也...
2 体育 冠军球队迎新欢乐派对 黄旭获大奖张军赢下PK赛新浪体育讯12月27日晚,“冠军高尔夫球队迎新...
3 体育 辽足签约危机引注册难关 高层威逼利诱合同笑里藏刀新浪体育讯2月24日,辽足爆发了集体拒签风波...
4 体育 揭秘谢亚龙被带走:总局电话骗局 复制南杨轨迹体坛周报特约记者张锐北京报道 谢亚龙已经被公安...
test_data = pd.read_csv('./cnews.test.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(test_data.shape)
test_data.head()
(10000, 2)
.dataframe tbody tr th {
    vertical-align: top;
}

.dataframe thead th {
    text-align: right;
}
label content
0 体育 鲍勃库西奖归谁属? NCAA最强控卫是坎巴还是弗神新浪体育讯如今,本赛季的NCAA进入到了末...
1 体育 麦基砍28+18+5却充满寂寞 纪录之夜他的痛阿联最懂新浪体育讯上天对每个人都是公平的,贾维...
2 体育 黄蜂vs湖人首发:科比冲击七连胜 火箭两旧将登场新浪体育讯北京时间3月28日,NBA常规赛洛...
3 体育 双面谢亚龙作秀终成做作 谁来为低劣行政能力埋单是谁任命了谢亚龙?谁放纵了谢亚龙?谁又该为谢亚...
4 体育 兔年首战山西换帅后有虎胆 张学文用乔丹名言励志今晚客场挑战浙江稠州银行队,是山西汾酒男篮的兔...
# 验证集数据
validation_data = pd.read_csv('./cnews.val.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(test_data.shape)
validation_data.head()
(10000, 2)
.dataframe tbody tr th {
    vertical-align: top;
}

.dataframe thead th {
    text-align: right;
}
label content
0 体育 黄蜂vs湖人首发:科比带伤战保罗 加索尔救赎之战 新浪体育讯北京时间4月27日,NBA季后赛...
1 体育 1.7秒神之一击救马刺王朝于危难 这个新秀有点牛!新浪体育讯在刚刚结束的比赛中,回到主场的马...
2 体育 1人灭掘金!神般杜兰特! 他想要分的时候没人能挡新浪体育讯在NBA的世界里,真的猛男,敢于直...
3 体育 韩国国奥20人名单:朴周永领衔 两世界杯国脚入选新浪体育讯据韩联社首尔9月17日电 韩国国奥...
4 体育 天才中锋崇拜王治郅 周琦:球员最终是靠实力说话2月14日从土耳其男篮邀请赛回到北京之后,周琦...

查看下训练集总共有多少种类别,以及各类别的数量

s=train_data['label'].value_counts()
print(s)
财经    5000
科技    5000
娱乐    5000
时政    5000
房产    5000
游戏    5000
家居    5000
体育    5000
教育    5000
时尚    5000
Name: label, dtype: int64
label2id_dict={x:i for i,x in enumerate(train_data['label'].value_counts().index)}
print(label2id_dict)
{'教育': 0, '体育': 1, '娱乐': 2, '家居': 3, '游戏': 4, '时尚': 5, '财经': 6, '时政': 7, '科技': 8, '房产': 9}

数据预处理

1.通过训练集数据,建立自己的字典

from collections import Counter
def build_voca_txt(train_dir,save_path,vocal_size=5000):
    """
    创建字典文件
    """
    train_data=pd.read_csv(train_dir,sep='\t',engine='python',names=['labels',
  File "", line 6
    train_data=pd.read_csv(train_dir,sep='\t'
                                             ^
SyntaxError: unexpected EOF while parsing
from collections import Counter
def build_voca_txt(train_dir, save_path, vocab_size=5000):
    """
    创建字典文件
    """
    train_data = pd.read_csv(train_dir,sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
    df = train_data['content'].apply(lambda x:[word for word in x],1)
    print(df.head())
    
    all_data = []
    for line in df:
        all_data.extend(line)
    
    #学习Counter类的使用,all_data为一维列表
    counter = Counter(all_data)
    #去出现次数最多前5000-1个
    count_pairs = counter.most_common(vocab_size - 1)
    #只取字符,不取个数
    words, _ = list(zip(*count_pairs))
    #添加标识符
    words = [''] + list(words)
    #保存到文件里
    open(save_path, mode='w',encoding='utf-8').write('\n'.join(words) + '\n')

build_voca_txt('./cnews.train.txt','./vocab.txt')
0    [马, 晓, 旭, 意, 外, 受, 伤, 让, 国, 奥, 警, 惕,  , 无, 奈, ...
1    [商, 瑞, 华, 首, 战, 复, 仇, 心, 切,  , 中, 国, 玫, 瑰, 要, ...
2    [冠, 军, 球, 队, 迎, 新, 欢, 乐, 派, 对,  , 黄, 旭, 获, 大, ...
3    [辽, 足, 签, 约, 危, 机, 引, 注, 册, 难, 关,  , 高, 层, 威, ...
4    [揭, 秘, 谢, 亚, 龙, 被, 带, 走, :, 总, 局, 电, 话, 骗, 局, ...
Name: content, dtype: object

2、读取字典的方法,供后续使用

def read_vocab(vocab_path):
    """
    读取字典,保存格式:{字符:序号}
    """
    vocab_dict = {}
    with open(vocab_path,encoding='utf-8') as f:
        for i,word in enumerate(f):
            vocab_dict[word[:-1]] = i
    return vocab_dict

vocab_dict = read_vocab('./vocab.txt')
print(len(vocab_dict))
print(vocab_dict.items())
5000
dict_items([('', 0), (',', 1), ('的', 2), ('。', 3), ('一', 4), ('是', 5), ('在', 6), ('0', 7), ('有', 8), ('不', 9), ('了', 10), ('中', 11), ('1', 12), ('人', 13), ('大', 14), ('、', 15), ('国', 16), (' ', 17), ('2', 18), ('这', 19), ('上', 20), ('为', 21), ('个', 22), ('“', 23), ('”', 24), ('年', 25), ('学', 26), ('时', 27), ('我', 28), ('地', 29), ('和', 30), ('以', 31), ('到', 32), ('出', 33), ('来', 34), ('会', 35), ('行', 36), ('发', 37), (':', 38), ('对', 39), ('们', 40), ('要', 41), ('生', 42), ('家', 43), ('他', 44), ('能', 45), ('也', 46), ('业', 47), ('金', 48), ('3', 49), ('成', 50), ('可', 51), ('分', 52), ('多', 53), ('现', 54), ('5', 55), ('就', 56), ('场', 57), ('新', 58), ('后', 59), ('于', 60), ('下', 61), ('日', 62), ('经', 63), ('市', 64), ('前', 65), ('过', 66), ('方', 67), ('得', 68), ('作', 69), ('月', 70), ('最', 71), ('开', 72), ('房', 73), ('》', 74), ('《', 75), ('高', 76), ('9', 77), ('8', 78), ('.', 79), ('而', 80), ('比', 81), ('公', 82), ('4', 83), ('说', 84), (')', 85), ('将', 86), ('(', 87), ('都', 88), ('资', 89), ('e', 90), ('6', 91), ('基', 92), ('用', 93), ('面', 94), ('产', 95), ('还', 96), ('自', 97), ('者', 98), ('本', 99), ('之', 100), ('美', 101), ('\xa0', 102), ('很', 103), ('同', 104), ('7', 105), ('部', 106), ('进', 107), ('但', 108), ('主', 109), ('外', 110), ('动', 111), ('机', 112), ('元', 113), ('理', 114), ('加', 115), ('a', 116), ('全', 117), ('与', 118), ('实', 119), ('影', 120), ('好', 121), ('小', 122), ('间', 123), ('其', 124), ('天', 125), ('定', 126), ('表', 127), ('力', 128), ('如', 129), ('次', 130), ('合', 131), ('长', 132), ('o', 133), ('体', 134), ('价', 135), ('i', 136), ('所', 137), ('内', 138), ('子', 139), ('目', 140), ('电', 141), ('-', 142), ('当', 143), ('度', 144), ('品', 145), ('看', 146), ('期', 147), ('关', 148), ('更', 149), ('n', 150), ('等', 151), ('工', 152), ('然', 153), ('斯', 154), ('重', 155), ('些', 156), ('球', 157), ('此', 158), ('里', 159), ('利', 160), ('相', 161), ('情', 162), ('投', 163), ('点', 164), ('没', 165), ('因', 166), ('已', 167), ('三', 168), ('心', 169), ('特', 170), ('明', 171), ('位', 172), ('两', 173), ('法', 174), ('从', 175), ('入', 176), ('名', 177), ('万', 178), ('手', 179), ('计', 180), ('性', 181), ('事', 182), ('只', 183), ('样', 184), ('示', 185), ('r', 186), ('种', 187), ('报', 188), ('海', 189), ('平', 190), ('数', 191), ('%', 192), ('第', 193), ('并', 194), ('色', 195), ('建', 196), ('据', 197), ('提', 198), ('商', 199), ('员', 200), ('通', 201), ('去', 202), ('民', 203), ('t', 204), ('着', 205), ('你', 206), ('片', 207), ('展', 208), ('道', 209), ('文', 210), ('演', 211), ('赛', 212), ('区', 213), ('交', 214), ('意', 215), ('政', 216), ('么', 217), ('今', 218), ('让', 219), ('起', 220), ('信', 221), ('化', 222), ('银', 223), ('记', 224), ('司', 225), ('北', 226), ('游', 227), ('科', 228), ('戏', 229), ('被', 230), ('格', 231), ('保', 232), ('及', 233), ('常', 234), ('物', 235), ('问', 236), ('s', 237), ('量', 238), ('制', 239), ('持', 240), ('果', 241), ('感', 242), ('设', 243), ('队', 244), ('无', 245), ('收', 246), ('正', 247), ('应', 248), ('?', 249), ('那', 250), ('活', 251), ('身', 252), ('式', 253), ('打', 254), ('l', 255), ('系', 256), ('尔', 257), ('总', 258), ('京', 259), ('A', 260), ('至', 261), ('己', 262), ('务', 263), ('受', 264), ('想', 265), ('星', 266), ('回', 267), ('留', 268), ('由', 269), ('网', 270), ('达', 271), ('认', 272), ('做', 273), ('题', 274), ('选', 275), ('费', 276), ('城', 277), ('增', 278), ('近', 279), ('华', 280), ('风', 281), ('非', 282), ('战', 283), ('布', 284), ('该', 285), ('接', 286), ('款', 287), ('项', 288), ('S', 289), ('英', 290), ('女', 291), ('程', 292), ('导', 293), ('管', 294), ('二', 295), ('强', 296), ('证', 297), ('水', 298), ('代', 299), ('调', 300), ('少', 301), ('专', 302), ('型', 303), ('台', 304), ('给', 305), ('需', 306), ('规', 307), ('图', 308), ('周', 309), ('德', 310), ('解', 311), ('各', 312), ('C', 313), ('向', 314), (';', 315), ('别', 316), ('股', 317), ('东', 318), ('结', 319), ('或', 320), ('首', 321), ('士', 322), ('西', 323), ('安', 324), ('教', 325), ('变', 326), ('火', 327), ('节', 328), ('际', 329), ('任', 330), ('单', 331), ('先', 332), ('再', 333), ('观', 334), ('校', 335), ('显', 336), ('克', 337), ('组', 338), ('直', 339), ('装', 340), ('求', 341), ('才', 342), ('率', 343), ('较', 344), ('造', 345), ('使', 346), ('每', 347), ('考', 348), ('亿', 349), ('请', 350), ('流', 351), ('完', 352), ('拍', 353), ('取', 354), ('院', 355), ('线', 356), ('门', 357), ('放', 358), ('世', 359), ('住', 360), ('续', 361), ('联', 362), ('张', 363), ('P', 364), ('息', 365), ('空', 366), ('c', 367), ('研', 368), ('它', 369), ('十', 370), ('立', 371), ('原', 372), ('易', 373), ('整', 374), ('—', 375), ('术', 376), ('论', 377), ('消', 378), ('太', 379), ('知', 380), ('王', 381), ('质', 382), ('约', 383), ('客', 384), ('几', 385), ('配', 386), ('马', 387), ('统', 388), ('值', 389), ('T', 390), ('头', 391), ('件', 392), ('带', 393), ('服', 394), ('她', 395), ('界', 396), ('指', 397), ('D', 398), ('级', 399), ('企', 400), ('传', 401), ('老', 402), ('类', 403), ('始', 404), ('气', 405), ('I', 406), ('户', 407), ('超', 408), ('育', 409), ('未', 410), ('具', 411), ('m', 412), ('低', 413), ('济', 414), ('处', 415), ('技', 416), ('望', 417), ('把', 418), ('M', 419), ('究', 420), ('什', 421), ('热', 422), ('推', 423), ('称', 424), ('购', 425), ('!', 426), ('季', 427), ('米', 428), ('光', 429), ('广', 430), ('份', 431), ('乐', 432), ('又', 433), ('获', 434), ('真', 435), ('觉', 436), ('E', 437), ('玩', 438), ('形', 439), ('集', 440), ('备', 441), ('优', 442), ('领', 443), ('势', 444), ('h', 445), ('楼', 446), ('准', 447), ('包', 448), ('像', 449), ('则', 450), ('难', 451), ('爱', 452), ('四', 453), ('申', 454), ('B', 455), ('d', 456), ('售', 457), ('u', 458), ('快', 459), ('连', 460), ('话', 461), ('师', 462), ('告', 463), ('何', 464), ('视', 465), ('确', 466), ('深', 467), ('预', 468), ('局', 469), ('亚', 470), ('评', 471), ('票', 472), ('卡', 473), ('改', 474), ('候', 475), ('买', 476), ('况', 477), ('存', 478), ('支', 479), ('拉', 480), ('仅', 481), ('办', 482), ('注', 483), ('反', 484), ('环', 485), ('供', 486), ('角', 487), ('篮', 488), ('标', 489), ('转', 490), ('拿', 491), ('运', 492), ('参', 493), ('升', 494), ('众', 495), ('O', 496), ('/', 497), ('创', 498), ('浪', 499), ('陈', 500), ('精', 501), ('号', 502), ('见', 503), ('助', 504), ('且', 505), ('土', 506), ('半', 507), ('议', 508), ('花', 509), ('步', 510), ('策', 511), ('南', 512), ('板', 513), ('居', 514), ('友', 515), ('越', 516), ('功', 517), ('构', 518), ('贷', 519), ('划', 520), ('模', 521), ('山', 522), ('融', 523), ('社', 524), ('G', 525), ('决', 526), ('共', 527), ('案', 528), ('g', 529), ('销', 530), ('走', 531), ('套', 532), ('路', 533), ('即', 534), ('言', 535), ('容', 536), ('均', 537), ('试', 538), ('积', 539), ('团', 540), ('府', 541), ('查', 542), ('条', 543), ('限', 544), ('引', 545), ('随', 546), ('择', 547), ('希', 548), ('口', 549), ('奇', 550), ('涨', 551), ('港', 552), ('盘', 553), ('象', 554), ('置', 555), ('林', 556), ('益', 557), ('效', 558), ('神', 559), ('极', 560), ('语', 561), ('复', 562), ('够', 563), ('阿', 564), ('币', 565), ('根', 566), ('州', 567), ('历', 568), ('采', 569), ('奖', 570), ('终', 571), ('适', 572), ('N', 573), ('尼', 574), ('命', 575), ('段', 576), ('景', 577), ('险', 578), ('却', 579), ('失', 580), ('军', 581), ('权', 582), ('车', 583), ('L', 584), ('剧', 585), ('速', 586), ('攻', 587), ('许', 588), ('足', 589), ('算', 590), ('清', 591), ('争', 592), ('响', 593), ('移', 594), ('红', 595), ('必', 596), ('幅', 597), ('额', 598), ('y', 599), ('讯', 600), ('照', 601), ('源', 602), ('李', 603), ('验', 604), ('双', 605), ('刚', 606), ('另', 607), ('态', 608), ('p', 609), ('致', 610), ('底', 611), ('除', 612), ('满', 613), ('击', 614), ('白', 615), ('五', 616), ('往', 617), ('喜', 618), ('财', 619), ('防', 620), ('境', 621), ('排', 622), ('百', 623), ('降', 624), ('远', 625), ('书', 626), ('习', 627), ('龙', 628), ('债', 629), ('钱', 630), ('断', 631), ('富', 632), ('曾', 633), ('测', 634), ('签', 635), ('举', 636), ('飞', 637), ('便', 638), ('介', 639), ('博', 640), ('牌', 641), ('虽', 642), ('料', 643), ('例', 644), ('边', 645), ('罗', 646), ('搭', 647), ('香', 648), ('委', 649), ('营', 650), ('器', 651), ('R', 652), ('落', 653), ('跟', 654), ('列', 655), ('仍', 656), ('职', 657), ('尚', 658), ('阳', 659), ('监', 660), ('券', 661), ('儿', 662), ('尽', 663), ('衣', 664), ('负', 665), ('短', 666), ('找', 667), ('层', 668), ('黄', 669), ('艺', 670), ('域', 671), ('施', 672), ('F', 673), ('离', 674), ('波', 675), ('胜', 676), ('兰', 677), ('古', 678), ('录', 679), ('黑', 680), ('素', 681), ('普', 682), ('史', 683), ('版', 684), ('摄', 685), ('官', 686), ('否', 687), ('石', 688), ('·', 689), ('站', 690), ('w', 691), ('访', 692), (',', 693), ('初', 694), ('细', 695), ('继', 696), ('责', 697), ('括', 698), ('卫', 699), ('露', 700), ('协', 701), ('轻', 702), ('维', 703), ('澳', 704), ('纪', 705), ('欢', 706), ('卖', 707), ('早', 708), ('绩', 709), ('穿', 710), ('孩', 711), ('按', 712), ('眼', 713), ('围', 714), ('男', 715), ('依', 716), ('宝', 717), ('控', 718), ('b', 719), ('读', 720), ('状', 721), ('洲', 722), ('密', 723), ('差', 724), ('奥', 725), ('破', 726), ('块', 727), ('突', 728), ('…', 729), ('思', 730), ('画', 731), ('巴', 732), ('纳', 733), ('范', 734), ('映', 735), ('充', 736), ('媒', 737), ('室', 738), ('H', 739), ('材', 740), ('字', 741), ('武', 742), ('跌', 743), ('春', 744), ('湖', 745), ('简', 746), ('担', 747), ('欧', 748), ('谈', 749), ('切', 750), ('兴', 751), ('刘', 752), ('彩', 753), ('V', 754), ('稳', 755), ('待', 756), ('箭', 757), ('属', 758), ('声', 759), ('课', 760), ('透', 761), ('紧', 762), ('温', 763), ('绝', 764), ('园', 765), ('修', 766), ('农', 767), ('严', 768), ('减', 769), ('江', 770), ('讲', 771), ('航', 772), ('似', 773), ('独', 774), ('背', 775), ('夫', 776), ('甚', 777), ('志', 778), ('牛', 779), ('亮', 780), ('故', 781), ('W', 782), ('f', 783), ('汇', 784), ('义', 785), ('换', 786), ('货', 787), ('令', 788), ('饰', 789), ('招', 790), ('医', 791), ('占', 792), ('音', 793), ('群', 794), ('竞', 795), ('乎', 796), ('护', 797), ('姆', 798), ('席', 799), ('湾', 800), ('略', 801), ('央', 802), ('怎', 803), ('岁', 804), ('亲', 805), ('送', 806), ('补', 807), ('青', 808), ('索', 809), ('批', 810), ('核', 811), ('帮', 812), ('福', 813), ('伤', 814), ('v', 815), ('昨', 816), ('念', 817), ('激', 818), ('陆', 819), ('危', 820), ('巨', 821), ('省', 822), ('宣', 823), ('般', 824), ('筑', 825), ('k', 826), ('识', 827), ('守', 828), ('压', 829), ('错', 830), ('免', 831), ('店', 832), ('宅', 833), ('庭', 834), ('承', 835), ('雷', 836), ('云', 837), ('味', 838), ('典', 839), ('听', 840), ('笑', 841), ('登', 842), ('假', 843), ('审', 844), ('绍', 845), ('诉', 846), ('毕', 847), ('迷', 848), ('威', 849), ('谢', 850), ('练', 851), ('丽', 852), ('止', 853), ('微', 854), ('频', 855), ('净', 856), ('森', 857), ('拥', 858), ('须', 859), ('左', 860), ('印', 861), ('追', 862), ('秀', 863), ('托', 864), ('吴', 865), ('副', 866), ('疑', 867), ('千', 868), ('治', 869), ('冰', 870), ('右', 871), ('松', 872), ('晚', 873), ('皮', 874), ('K', 875), ('佳', 876), ('夏', 877), ('呢', 878), ('魔', 879), ('缺', 880), ('编', 881), ('析', 882), ('钟', 883), ('刻', 884), ('遇', 885), ('停', 886), ('写', 887), ('付', 888), ('食', 889), ('织', 890), ('闻', 891), ('检', 892), ('礼', 893), ('惊', 894), ('莱', 895), ('余', 896), ('死', 897), ('雅', 898), ('善', 899), ('干', 900), ('愿', 901), ('爆', 902), ('某', 903), ('端', 904), ('探', 905), ('述', 906), ('吧', 907), ('执', 908), ('村', 909), ('租', 910), ('健', 911), ('阵', 912), ('律', 913), ('虑', 914), ('临', 915), ('冲', 916), ('盟', 917), ('六', 918), ('吸', 919), ('束', 920), ('射', 921), ('久', 922), ('馆', 923), ('暴', 924), ('折', 925), ('苏', 926), ('顿', 927), ('借', 928), ('宇', 929), ('U', 930), ('病', 931), ('盛', 932), ('藏', 933), ('杰', 934), ('灵', 935), ('异', 936), ('察', 937), ('震', 938), ('退', 939), ('朋', 940), ('旅', 941), ('抢', 942), ('韩', 943), ('封', 944), ('轮', 945), ('康', 946), ('弹', 947), ('互', 948), ('伦', 949), ('败', 950), ('午', 951), ('河', 952), ('杀', 953), ('私', 954), ('镜', 955), ('扁', 956), ('潮', 957), ('幕', 958), ('旗', 959), ('党', 960), ('休', 961), ('八', 962), ('悉', 963), ('瑞', 964), ('逐', 965), ('征', 966), ('坚', 967), ('绿', 968), ('班', 969), ('迎', 970), ('吃', 971), ('母', 972), ('族', 973), ('税', 974), ('良', 975), ('丰', 976), ('训', 977), ('秘', 978), ('娱', 979), ('哈', 980), ('警', 981), ('伟', 982), ('您', 983), ('歌', 984), ('烈', 985), ('哪', 986), ('挑', 987), ('享', 988), ('肯', 989), ('凯', 990), ('顾', 991), ('杨', 992), ('丹', 993), ('雄', 994), ('键', 995), ('靠', 996), ('针', 997), ('木', 998), ('估', 999), ('届', 1000), ('?', 1001), ('嘉', 1002), ('洛', 1003), ('答', 1004), ('七', 1005), ('裙', 1006), ('岛', 1007), ('距', 1008), ('刺', 1009), ('趣', 1010), ('X', 1011), ('养', 1012), ('九', 1013), ('座', 1014), ('阶', 1015), ('庆', 1016), ('街', 1017), ('释', 1018), (':', 1019), ('扩', 1020), ('洋', 1021), ('永', 1022), ('顺', 1023), ('障', 1024), ('盖', 1025), ('勒', 1026), ('遭', 1027), ('铁', 1028), ('笔', 1029), ('启', 1030), ('判', 1031), ('倍', 1032), ('豪', 1033), ('吗', 1034), ('杂', 1035), ('哥', 1036), ('纷', 1037), ('婚', 1038), ('斗', 1039), ('秒', 1040), ('犯', 1041), ('剑', 1042), ('沙', 1043), ('派', 1044), ('归', 1045), ('操', 1046), ('扮', 1047), ('损', 1048), ('仓', 1049), ('延', 1050), ('暖', 1051), ('贵', 1052), ('档', 1053), ('载', 1054), ('丝', 1055), ('末', 1056), ('截', 1057), ('促', 1058), ('竟', 1059), ('困', 1060), ('油', 1061), ('泰', 1062), ('梦', 1063), ('播', 1064), ('革', 1065), ('络', 1066), ('熟', 1067), ('Q', 1068), ('酒', 1069), ('顶', 1070), ('础', 1071), (')', 1072), ('倒', 1073), ('著', 1074), ('’', 1075), ('麦', 1076), ('章', 1077), ('宁', 1078), ('雪', 1079), ('父', 1080), ('授', 1081), ('血', 1082), ('裤', 1083), ('静', 1084), ('诺', 1085), ('罚', 1086), ('输', 1087), ('润', 1088), ('害', 1089), ('船', 1090), ('+', 1091), ('掉', 1092), ('蓝', 1093), ('伊', 1094), ('脑', 1095), ('避', 1096), ('尤', 1097), ('赵', 1098), ('缩', 1099), ('综', 1100), ('挥', 1101), ('叫', 1102), ('储', 1103), ('镇', 1104), ('寻', 1105), ('怪', 1106), ('鲁', 1107), ('冠', 1108), ('(', 1109), ('努', 1110), ('丁', 1111), ('‘', 1112), ('坛', 1113), ('恩', 1114), ('概', 1115), ('扣', 1116), ('旧', 1117), ('趋', 1118), ('培', 1119), ('裁', 1120), ('屋', 1121), ('J', 1122), ('宽', 1123), ('汉', 1124), ('讨', 1125), ('谁', 1126), ('渐', 1127), ('账', 1128), ('涉', 1129), ('岸', 1130), ('胡', 1131), ('毛', 1132), ('锋', 1133), ('迪', 1134), ('幸', 1135), ('偏', 1136), ('秋', 1137), ('菲', 1138), ('码', 1139), ('纯', 1140), ('叶', 1141), ('峰', 1142), ('圣', 1143), ('兵', 1144), ('救', 1145), ('暗', 1146), ('鞋', 1147), ('冬', 1148), ('冷', 1149), ('蒂', 1150), ('侠', 1151), ('董', 1152), ('恐', 1153), ('熊', 1154), ('沃', 1155), ('献', 1156), ('惠', 1157), ('圈', 1158), ('朝', 1159), ('询', 1160), ('药', 1161), ('智', 1162), ('予', 1163), ('既', 1164), ('急', 1165), ('吉', 1166), ('曼', 1167), ('赢', 1168), ('姚', 1169), ('替', 1170), ('塔', 1171), ('狂', 1172), ('跳', 1173), ('抗', 1174), ('误', 1175), ('触', 1176), ('夜', 1177), ('朗', 1178), ('坦', 1179), ('附', 1180), ('慢', 1181), ('励', 1182), ('鱼', 1183), ('含', 1184), ('累', 1185), ('措', 1186), ('若', 1187), ('怀', 1188), ('贸', 1189), ('雨', 1190), ('草', 1191), ('苦', 1192), ('徐', 1193), ('贴', 1194), ('荣', 1195), ('孙', 1196), ('晓', 1197), ('脚', 1198), ('迅', 1199), ('聚', 1200), ('违', 1201), ('厅', 1202), ('募', 1203), ('鲜', 1204), ('潜', 1205), ('圆', 1206), ('餐', 1207), ('坐', 1208), ('仔', 1209), ('勇', 1210), ('软', 1211), ('莫', 1212), ('伯', 1213), ('梅', 1214), ('圳', 1215), ('呈', 1216), ('宾', 1217), ('库', 1218), ('凭', 1219), ('掌', 1220), ('焦', 1221), ('俄', 1222), ('漫', 1223), ('灾', 1224), ('曲', 1225), ('佛', 1226), ('怕', 1227), ('谓', 1228), ('劳', 1229), ('贝', 1230), ('廉', 1231), ('符', 1232), ('暂', 1233), ('唯', 1234), ('玉', 1235), ('詹', 1236), ('珍', 1237), ('舒', 1238), ('遗', 1239), ('x', 1240), ('厚', 1241), ('恒', 1242), ('跑', 1243), ('遍', 1244), ('隆', 1245), ('序', 1246), ('词', 1247), ('幻', 1248), ('舞', 1249), ('混', 1250), ('粉', 1251), ('灰', 1252), ('田', 1253), ('野', 1254), ('赴', 1255), ('宏', 1256), ('邮', 1257), ('硬', 1258), ('宜', 1259), ('帅', 1260), ('架', 1261), ('揭', 1262), ('堂', 1263), ('霸', 1264), ('呼', 1265), ('敌', 1266), ('纽', 1267), ('疗', 1268), ('塞', 1269), ('杜', 1270), ('珠', 1271), ('唐', 1272), ('罪', 1273), ('韦', 1274), ('辛', 1275), ('乡', 1276), ('零', 1277), ('迹', 1278), ('固', 1279), ('颜', 1280), ('坏', 1281), ('挂', 1282), ('树', 1283), ('戴', 1284), ('翻', 1285), ('帝', 1286), ('闭', 1287), ('川', 1288), ('撞', 1289), ('z', 1290), ('册', 1291), ('Y', 1292), ('楚', 1293), ('妈', 1294), ('弱', 1295), ('抵', 1296), ('猫', 1297), ('夺', 1298), ('召', 1299), ('埃', 1300), ('腿', 1301), ('筹', 1302), ('握', 1303), ('猛', 1304), ('齐', 1305), ('萨', 1306), ('诚', 1307), ('巧', 1308), ('摆', 1309), ('邀', 1310), ('辉', 1311), ('弃', 1312), ('弟', 1313), ('剩', 1314), ('谋', 1315), ('繁', 1316), ('闲', 1317), ('>', 1318), ('途', 1319), ('钢', 1320), ('衡', 1321), ('厂', 1322), ('拟', 1323), ('默', 1324), ('弗', 1325), ('恶', 1326), ('沉', 1327), ('锦', 1328), ('署', 1329), ('搞', 1330), ('赞', 1331), ('墙', 1332), ('伴', 1333), ('纹', 1334), ('兽', 1335), ('甲', 1336), ('扬', 1337), ('乔', 1338), ('赶', 1339), ('衫', 1340), ('薪', 1341), ('毫', 1342), ('迈', 1343), ('滑', 1344), ('订', 1345), ('禁', 1346), ('散', 1347), ('恋', 1348), ('隐', 1349), ('【', 1350), ('】', 1351), ('津', 1352), ('缓', 1353), ('泽', 1354), ('牙', 1355), ('腰', 1356), ('旦', 1357), ('童', 1358), ('霍', 1359), ('榜', 1360), ('冯', 1361), ('脱', 1362), ('跃', 1363), ('梁', 1364), ('植', 1365), ('肉', 1366), ('仪', 1367), ('醒', 1368), ('郭', 1369), ('晨', 1370), ('掘', 1371), ('涛', 1372), ('"', 1373), ('详', 1374), ('龄', 1375), ('脸', 1376), ('朱', 1377), ('洁', 1378), ('鼓', 1379), ('姐', 1380), ('侦', 1381), ('仙', 1382), ('洞', 1383), ('桥', 1384), ('骨', 1385), ('枪', 1386), ('晶', 1387), ('洗', 1388), ('亏', 1389), ('句', 1390), ('亡', 1391), ('乱', 1392), ('坡', 1393), ('骑', 1394), ('颗', 1395), ('胸', 1396), ('贡', 1397), ('啊', 1398), ('搜', 1399), ('宗', 1400), ('灯', 1401), ('染', 1402), ('奋', 1403), ('返', 1404), ('抓', 1405), ('淡', 1406), ('帽', 1407), ('皇', 1408), ('饭', 1409), ('艾', 1410), ('链', 1411), ('纸', 1412), ('摩', 1413), ('拆', 1414), (']', 1415), ('敏', 1416), ('亦', 1417), ('毒', 1418), ('汽', 1419), ('渠', 1420), ('援', 1421), ('姜', 1422), ('芬', 1423), ('诞', 1424), ('敢', 1425), ('甜', 1426), ('伙', 1427), ('轨', 1428), ('敦', 1429), ('曝', 1430), ('庄', 1431), ('凡', 1432), ('陷', 1433), ('恢', 1434), ('欣', 1435), ('[', 1436), ('拓', 1437), ('殊', 1438), ('添', 1439), ('誉', 1440), ('咨', 1441), ('壁', 1442), ('拜', 1443), ('荷', 1444), ('县', 1445), ('宫', 1446), ('径', 1447), ('蒙', 1448), ('驻', 1449), ('疯', 1450), ('尝', 1451), ('泡', 1452), ('荐', 1453), ('跨', 1454), ('炒', 1455), ('麻', 1456), ('帕', 1457), ('携', 1458), ('辑', 1459), ('屏', 1460), ('乏', 1461), ('缘', 1462), ('尊', 1463), ('彻', 1464), ('邦', 1465), ('督', 1466), ('蔡', 1467), ('贺', 1468), ('虚', 1469), ('浮', 1470), ('拼', 1471), ('劲', 1472), ('贾', 1473), ('虎', 1474), ('盈', 1475), ('卷', 1476), ('★', 1477), ('扰', 1478), ('祖', 1479), ('柔', 1480), ('偿', 1481), ('妙', 1482), ('硕', 1483), ('Z', 1484), ('闪', 1485), ('兑', 1486), ('兼', 1487), ('扎', 1488), ('郑', 1489), ('黎', 1490), ('鉴', 1491), ('侧', 1492), ('墅', 1493), ('挺', 1494), ('惯', 1495), ('艳', 1496), ('盗', 1497), ('忙', 1498), ('寸', 1499), ('尾', 1500), ('菜', 1501), ('孤', 1502), ('押', 1503), ('床', 1504), ('忘', 1505), ('痛', 1506), ('赏', 1507), ('惜', 1508), ('聊', 1509), ('逊', 1510), ('唱', 1511), ('尺', 1512), ('墨', 1513), ('柏', 1514), ('摇', 1515), ('漂', 1516), ('刊', 1517), ('偶', 1518), ('忆', 1519), ('刀', 1520), ('兄', 1521), ('捕', 1522), ('祝', 1523), ('慎', 1524), ('邓', 1525), ('柜', 1526), ('耶', 1527), ('沟', 1528), ('欲', 1529), ('胞', 1530), ('诸', 1531), ('鸟', 1532), ('患', 1533), ('敬', 1534), ('刷', 1535), ('赚', 1536), ('鹏', 1537), ('姓', 1538), ('迫', 1539), ('紫', 1540), ('迁', 1541), ('抽', 1542), ('宿', 1543), ('妻', 1544), ('矿', 1545), ('颇', 1546), ('鹿', 1547), ('氛', 1548), ('妇', 1549), ('抱', 1550), ('拒', 1551), ('隔', 1552), ('瓦', 1553), ('塑', 1554), ('羊', 1555), ('泛', 1556), ('慧', 1557), ('籍', 1558), ('绕', 1559), ('窗', 1560), ('孔', 1561), ('址', 1562), ('仿', 1563), ('伍', 1564), ('狼', 1565), ('佩', 1566), ('肩', 1567), ('~', 1568), ('冒', 1569), ('灭', 1570), ('忧', 1571), ('衬', 1572), ('稿', 1573), ('耳', 1574), ('谷', 1575), ('酷', 1576), ('递', 1577), ('阅', 1578), ('胀', 1579), ('杭', 1580), ('翰', 1581), ('篇', 1582), ('蕾', 1583), ('霆', 1584), ('汤', 1585), ('尖', 1586), ('娜', 1587), ('恰', 1588), ('袋', 1589), ('淑', 1590), ('覆', 1591), ('倾', 1592), ('描', 1593), ('览', 1594), ('迟', 1595), ('魅', 1596), ('蛋', 1597), ('宋', 1598), ('葛', 1599), ('残', 1600), ('烟', 1601), ('振', 1602), ('钻', 1603), ('番', 1604), ('贯', 1605), ('喷', 1606), ('靴', 1607), ('氏', 1608), ('沈', 1609), ('炸', 1610), ('奶', 1611), ('舍', 1612), ('铺', 1613), ('芳', 1614), ('杯', 1615), ('箱', 1616), ('寒', 1617), ('赖', 1618), ('谨', 1619), ('君', 1620), ('颁', 1621), ('诗', 1622), ('玛', 1623), ('蜂', 1624), ('赠', 1625), ('宠', 1626), ('桑', 1627), ('薄', 1628), ('潘', 1629), ('忽', 1630), ('液', 1631), ('俗', 1632), ('锁', 1633), ('浓', 1634), ('碰', 1635), ('俱', 1636), ('逃', 1637), ('披', 1638), ('懂', 1639), ('寄', 1640), ('燃', 1641), ('坞', 1642), ('沿', 1643), ('袭', 1644), ('奈', 1645), ('允', 1646), ('鹰', 1647), ('曹', 1648), ('骗', 1649), ('横', 1650), ('奢', 1651), ('寓', 1652), ('荡', 1653), ('抛', 1654), ('畅', 1655), ('爵', 1656), ('毁', 1657), ('乘', 1658), ('戈', 1659), ('稍', 1660), ('甘', 1661), ('阻', 1662), ('燕', 1663), ('捷', 1664), ('耗', 1665), ('甄', 1666), ('鬼', 1667), ('涯', 1668), ('墓', 1669), ('壮', 1670), ('赎', 1671), ('爸', 1672), ('虫', 1673), ('旁', 1674), ('阴', 1675), ('惑', 1676), ('耐', 1677), ('御', 1678), ('宙', 1679), ('遥', 1680), ('耀', 1681), ('逆', 1682), ('玲', 1683), ('刑', 1684), ('拖', 1685), ('鸡', 1686), ('沪', 1687), ('仁', 1688), ('偷', 1689), ('岩', 1690), ('池', 1691), ('魂', 1692), ('幽', 1693), ('厦', 1694), ('睡', 1695), ('绪', 1696), ('凌', 1697), ('剪', 1698), ('镑', 1699), ('踪', 1700), ('盾', 1701), ('奏', 1702), ('艰', 1703), ('悲', 1704), ('乌', 1705), ('浙', 1706), ('悬', 1707), ('旋', 1708), ('芝', 1709), ('卢', 1710), ('肖', 1711), ('稀', 1712), ('污', 1713), ('缴', 1714), ('堪', 1715), ('拔', 1716), ('袖', 1717), ('堆', 1718), ('裂', 1719), ('杉', 1720), ('厨', 1721), ('侵', 1722), ('聘', 1723), ('碎', 1724), ('胆', 1725), ('磨', 1726), ('役', 1727), ('译', 1728), ('洪', 1729), ('烦', 1730), ('妹', 1731), ('怡', 1732), ('捧', 1733), ('狗', 1734), ('忠', 1735), ('挡', 1736), ('尘', 1737), ('唤', 1738), ('肥', 1739), ('卧', 1740), ('嫌', 1741), ('赤', 1742), ('饮', 1743), ('嘴', 1744), ('辆', 1745), ('闹', 1746), ('浦', 1747), ('j', 1748), ('阔', 1749), ('猎', 1750), ('昌', 1751), ('浩', 1752), ('撑', 1753), ('沫', 1754), ('娘', 1755), ('逼', 1756), ('谭', 1757), ('症', 1758), ('夹', 1759), ('伏', 1760), ('驾', 1761), ('疾', 1762), ('貌', 1763), ('棒', 1764), ('粒', 1765), ('孟', 1766), ('乳', 1767), ('砍', 1768), ('矶', 1769), ('羽', 1770), ('鼠', 1771), ('猪', 1772), ('栋', 1773), ('绎', 1774), ('粗', 1775), ('腾', 1776), ('忍', 1777), ('昆', 1778), ('涵', 1779), ('爽', 1780), ('泉', 1781), ('郎', 1782), ('绘', 1783), ('桌', 1784), ('彼', 1785), ('碧', 1786), ('尸', 1787), ('浴', 1788), ('搬', 1789), ('喝', 1790), ('凤', 1791), ('×', 1792), ('纠', 1793), ('诱', 1794), ('践', 1795), ('惨', 1796), ('踏', 1797), ('坤', 1798), ('昂', 1799), ('悦', 1800), ('挖', 1801), ('泥', 1802), ('谊', 1803), ('肤', 1804), ('奔', 1805), ('碳', 1806), ('烧', 1807), ('谐', 1808), ('瓶', 1809), ('井', 1810), ('莉', 1811), ('俊', 1812), ('哦', 1813), ('妮', 1814), ('犹', 1815), ('巾', 1816), ('庞', 1817), ('宴', 1818), ('睛', 1819), ('幼', 1820), ('&', 1821), ('妆', 1822), ('契', 1823), ('舰', 1824), ('矛', 1825), ('铭', 1826), ('扫', 1827), ('陪', 1828), ('壳', 1829), ('弄', 1830), ('浅', 1831), ('酬', 1832), ('徒', 1833), ('填', 1834), ('*', 1835), ('兹', 1836), ('摸', 1837), ('夸', 1838), ('拨', 1839), ('炼', 1840), ('抑', 1841), ('愈', 1842), ('琼', 1843), ('晰', 1844), ('伸', 1845), ('梯', 1846), ('茂', 1847), ('烂', 1848), ('堡', 1849), ('驰', 1850), ('戒', 1851), ('捐', 1852), ('-', 1853), ('孝', 1854), ('碑', 1855), ('溢', 1856), ('吨', 1857), ('裕', 1858), ('猜', 1859), ('废', 1860), ('赔', 1861), ('磁', 1862), ('煤', 1863), ('吊', 1864), ('琴', 1865), ('旬', 1866), ('掩', 1867), ('纵', 1868), ('姿', 1869), ('菌', 1870), ('碍', 1871), ('怒', 1872), ('秦', 1873), ('怖', 1874), ('串', 1875), ('恤', 1876), ('氧', 1877), ('纺', 1878), ('辨', 1879), ('勤', 1880), ('袜', 1881), ('疫', 1882), ('乃', 1883), ('粮', 1884), ('邻', 1885), ('旺', 1886), ('吹', 1887), ('柯', 1888), ('循', 1889), ('琳', 1890), ('勃', 1891), ('瞬', 1892), ('爷', 1893), ('脉', 1894), ('叹', 1895), ('赋', 1896), ('淘', 1897), ('薇', 1898), ('漏', 1899), ('陶', 1900), ('页', 1901), ('蒋', 1902), ('辈', 1903), ('蓄', 1904), ('毅', 1905), ('雇', 1906), ('欠', 1907), ('牵', 1908), ('巡', 1909), ('插', 1910), ('奕', 1911), ('岗', 1912), ('娃', 1913), ('剂', 1914), ('桂', 1915), ('鸿', 1916), ('崇', 1917), ('暑', 1918), ('挤', 1919), ('郁', 1920), ('赌', 1921), ('胁', 1922), ('茶', 1923), ('膝', 1924), ('涌', 1925), ('廷', 1926), ('憾', 1927), ('鸣', 1928), ('雕', 1929), ('莎', 1930), ('凉', 1931), ('酸', 1932), ('贤', 1933), ('辞', 1934), ('滚', 1935), ('蝶', 1936), ('槛', 1937), ('啦', 1938), ('渡', 1939), ('锐', 1940), ('拳', 1941), ('玻', 1942), ('赫', 1943), ('翼', 1944), ('茨', 1945), ('厉', 1946), ('攀', 1947), ('•', 1948), ('颖', 1949), ('娇', 1950), ('翔', 1951), ('蛙', 1952), ('蜜', 1953), ('牢', 1954), ('桃', 1955), ('杆', 1956), ('斑', 1957), ('裸', 1958), ('驱', 1959), ('撤', 1960), ('朵', 1961), ('匹', 1962), ('瓜', 1963), ('辅', 1964), ('枚', 1965), ('械', 1966), ('妖', 1967), ('厘', 1968), ('晋', 1969), ('炮', 1970), ('瘦', 1971), ('璃', 1972), ('哭', 1973), ('飘', 1974), ('伪', 1975), ('侨', 1976), ('框', 1977), ('逾', 1978), ('翠', 1979), ('栏', 1980), ('胶', 1981), ('驶', 1982), ('苑', 1983), ('埋', 1984), ('扶', 1985), ('绒', 1986), ('垃', 1987), ('淇', 1988), ('坑', 1989), ('圾', 1990), ('寿', 1991), ('糕', 1992), ('罕', 1993), ('彭', 1994), ('扭', 1995), ('绑', 1996), ('苗', 1997), ('捉', 1998), ('吕', 1999), ('谱', 2000), ('穷', 2001), ('婴', 2002), ('屡', 2003), ('飙', 2004), ('聪', 2005), ('兆', 2006), ('慈', 2007), ('勿', 2008), ('卓', 2009), ('臣', 2010), ('衰', 2011), ('瓷', 2012), ('赁', 2013), ('腐', 2014), ('弥', 2015), ('斤', 2016), ('=', 2017), ('叠', 2018), ('奉', 2019), ('豆', 2020), ('荒', 2021), ('涂', 2022), ('纱', 2023), ('冻', 2024), ('睐', 2025), ('郊', 2026), ('滩', 2027), ('仇', 2028), ('鼎', 2029), ('祥', 2030), ('轰', 2031), ('盲', 2032), ('~', 2033), ('衷', 2034), ('滞', 2035), ('悠', 2036), ('怨', 2037), ('毯', 2038), ('贫', 2039), ('陨', 2040), ('琪', 2041), ('蛇', 2042), ('肃', 2043), ('泪', 2044), ('臂', 2045), ('侣', 2046), ('莲', 2047), ('陵', 2048), ('垫', 2049), ('猩', 2050), ('椅', 2051), ('劫', 2052), ('皆', 2053), ('尬', 2054), ('脏', 2055), ('尴', 2056), ('丢', 2057), ('铜', 2058), ('靓', 2059), ('盐', 2060), ('傲', 2061), ('彦', 2062), ('膨', 2063), ('旨', 2064), ('婆', 2065), ('辐', 2066), ('贬', 2067), ('疲', 2068), ('艇', 2069), ('棉', 2070), ('泄', 2071), ('妥', 2072), ('滨', 2073), ('胎', 2074), ('喊', 2075), ('柱', 2076), ('擎', 2077), ('翁', 2078), ('狱', 2079), ('馨', 2080), ('魏', 2081), ('糟', 2082), ('腕', 2083), ('悄', 2084), ('妨', 2085), ('砖', 2086), ('履', 2087), ('哲', 2088), ('_', 2089), ('谜', 2090), ('虹', 2091), ('吻', 2092), ('炉', 2093), ('纲', 2094), ('竹', 2095), ('劣', 2096), ('闷', 2097), ('纤', 2098), ('泳', 2099), ('咱', 2100), ('漆', 2101), ('凸', 2102), ('夕', 2103), ('脆', 2104), ('俩', 2105), ('饱', 2106), ('贪', 2107), ('藤', 2108), ('亩', 2109), ('猴', 2110), ('辽', 2111), ('漠', 2112), ('塌', 2113), ('丧', 2114), ('疆', 2115), ('孕', 2116), ('轩', 2117), ('q', 2118), ('玄', 2119), ('斌', 2120), ('擅', 2121), ('僵', 2122), ('汗', 2123), ('挣', 2124), ('峡', 2125), ('袁', 2126), ('衔', 2127), ('弊', 2128), ('凶', 2129), ('痕', 2130), ('巩', 2131), ('邪', 2132), ('勾', 2133), ('寺', 2134), ('朴', 2135), ('迄', 2136), ('侈', 2137), ('呆', 2138), ('抄', 2139), ('豹', 2140), ('掀', 2141), ('斥', 2142), ('彬', 2143), ('躲', 2144), ('裔', 2145), ('罩', 2146), ('辣', 2147), ('盒', 2148), ('啸', 2149), ('莞', 2150), ('丈', 2151), ('钩', 2152), ('肌', 2153), ('炎', 2154), ('缝', 2155), ('糊', 2156), ('狄', 2157), ('帆', 2158), ('橱', 2159), ('倡', 2160), ('媚', 2161), ('笼', 2162), ('凝', 2163), ('磊', 2164), ('慰', 2165), ('渔', 2166), ('割', 2167), ('逢', 2168), ('诈', 2169), ('舟', 2170), ('盼', 2171), ('辩', 2172), ('旭', 2173), ('摊', 2174), ('吓', 2175), ('诊', 2176), ('抬', 2177), ('!', 2178), ('魁', 2179), ('垂', 2180), ('逸', 2181), ('髦', 2182), ('彰', 2183), ('艘', 2184), ('屹', 2185), ('轴', 2186), ('蛮', 2187), ('遵', 2188), ('吁', 2189), ('斜', 2190), ('催', 2191), ('姑', 2192), ("'", 2193), ('姻', 2194), ('渤', 2195), ('狮', 2196), ('滋', 2197), ('馈', 2198), ('爬', 2199), ('咖', 2200), ('狠', 2201), ('霞', 2202), ('匪', 2203), ('撼', 2204), ('挫', 2205), ('恨', 2206), ('遮', 2207), ('泼', 2208), ('缀', 2209), ('腻', 2210), ('颠', 2211), ('胖', 2212), ('淀', 2213), ('柳', 2214), ('坠', 2215), ('骂', 2216), ('韵', 2217), ('鲨', 2218), ('湿', 2219), ('耕', 2220), ('敲', 2221), ('撰', 2222), ('啡', 2223), ('翡', 2224), ('穴', 2225), ('扇', 2226), ('疼', 2227), ('蝠', 2228), ('蛛', 2229), ('俏', 2230), ('醉', 2231), ('糖', 2232), ('煌', 2233), ('鲸', 2234), ('锡', 2235), ('渴', 2236), ('惧', 2237), ('愤', 2238), ('擦', 2239), ('窄', 2240), ('玫', 2241), ('峻', 2242), ('慕', 2243), ('削', 2244), ('抖', 2245), ('舱', 2246), ('抹', 2247), ('腊', 2248), ('摘', 2249), ('炫', 2250), ('楠', 2251), ('歧', 2252), ('帖', 2253), ('熙', 2254), ('穆', 2255), ('寨', 2256), ('捂', 2257), ('丑', 2258), ('兔', 2259), ('殖', 2260), ('慌', 2261), ('眠', 2262), ('嘛', 2263), ('帐', 2264), ('锻', 2265), ('坎', 2266), ('筐', 2267), ('粹', 2268), ('窃', 2269), ('钉', 2270), ('囊', 2271), ('汶', 2272), ('侯', 2273), ('●', 2274), ('羁', 2275), ('戛', 2276), ('□', 2277), ('仰', 2278), ('忌', 2279), ('歇', 2280), ('滴', 2281), ('芯', 2282), ('瘾', 2283), ('蝴', 2284), ('伐', 2285), ('趁', 2286), ('皱', 2287), ('欺', 2288), ('衍', 2289), ('/', 2290), ('溪', 2291), ('逛', 2292), ('吞', 2293), ('悚', 2294), ('蝙', 2295), ('揽', 2296), ('扑', 2297), ('崩', 2298), ('枝', 2299), ('缠', 2300), ('哨', 2301), ('勘', 2302), ('砸', 2303), ('堵', 2304), ('诠', 2305), ('鼻', 2306), ('珊', 2307), ('瑜', 2308), ('寂', 2309), ('帘', 2310), ('钞', 2311), ('烨', 2312), ('倩', 2313), ('昔', 2314), ('磅', 2315), ('瑟', 2316), ('骤', 2317), ('嫁', 2318), ('挪', 2319), ('贿', 2320), ('眉', 2321), ('凰', 2322), ('淋', 2323), ('鲍', 2324), ('俐', 2325), ('鹅', 2326), ('佣', 2327), ('腹', 2328), ('蓬', 2329), ('锤', 2330), ('廊', 2331), ('骄', 2332), ('悟', 2333), ('屈', 2334), ('呵', 2335), ('删', 2336), ('吐', 2337), ('盆', 2338), ('凳', 2339), ('搏', 2340), ('萎', 2341), ('恼', 2342), ('傅', 2343), ('陌', 2344), ('汪', 2345), ('愉', 2346), ('裹', 2347), ('瞩', 2348), (';', 2349), ('褶', 2350), ('巫', 2351), ('贼', 2352), ('坊', 2353), ('茅', 2354), ('撒', 2355), ('邱', 2356), ('@', 2357), ('雾', 2358), ('筒', 2359), ('咬', 2360), ('齿', 2361), ('矮', 2362), ('斩', 2363), ('鑫', 2364), ('璇', 2365), ('锅', 2366), ('樟', 2367), ('拐', 2368), ('函', 2369), ('逻', 2370), ('喻', 2371), ('苹', 2372), ('婷', 2373), ('瑰', 2374), ('旱', 2375), ('仲', 2376), ('慨', 2377), ('惹', 2378), ('■', 2379), ('窝', 2380), ('悍', 2381), ('讶', 2382), ('悔', 2383), ('膀', 2384), ('晃', 2385), ('颈', 2386), ('凑', 2387), ('讼', 2388), ('亨', 2389), ('葬', 2390), ('睹', 2391), ('叔', 2392), ('崔', 2393), ('蔓', 2394), ('弯', 2395), ('豫', 2396), ('歉', 2397), ('舆', 2398), ('闯', 2399), ('肿', 2400), ('仕', 2401), ('勋', 2402), ('牲', 2403), ('厌', 2404), ('踝', 2405), ('辰', 2406), ('宪', 2407), ('莹', 2408), ('萧', 2409), ('徽', 2410), ('雀', 2411), ('酿', 2412), ('咏', 2413), ('罢', 2414), ('癌', 2415), ('叛', 2416), ('巢', 2417), ('媛', 2418), ('膜', 2419), ('岳', 2420), ('滥', 2421), ('萍', 2422), ('屠', 2423), ('洒', 2424), ('闫', 2425), ('壤', 2426), ('冕', 2427), ('骚', 2428), ('灌', 2429), ('牧', 2430), ('蜘', 2431), ('橙', 2432), ('肢', 2433), ('垄', 2434), ('弘', 2435), ('牺', 2436), ('嫩', 2437), ('蹈', 2438), ('龟', 2439), ('肚', 2440), ('炭', 2441), ('汰', 2442), ('芒', 2443), ('傻', 2444), ('阁', 2445), ('桶', 2446), ('螺', 2447), ('壶', 2448), ('绮', 2449), ('胺', 2450), ('黛', 2451), ('#', 2452), ('晕', 2453), ('臀', 2454), ('绵', 2455), ('郡', 2456), ('泊', 2457), ('陕', 2458), ('脂', 2459), ('葡', 2460), ('蔚', 2461), ('秩', 2462), ('粤', 2463), ('秉', 2464), ('抚', 2465), ('婉', 2466), ('雯', 2467), ('睿', 2468), ('奠', 2469), ('羡', 2470), ('驳', 2471), ('囤', 2472), ('蚁', 2473), ('肆', 2474), ('疏', 2475), ('鳄', 2476), ('殿', 2477), ('逝', 2478), ('廖', 2479), ('洽', 2480), ('谦', 2481), ('钓', 2482), ('棚', 2483), ('挽', 2484), ('棕', 2485), ('卵', 2486), ('豚', 2487), ('顽', 2488), ('薛', 2489), ('沸', 2490), ('澄', 2491), ('拘', 2492), ('谍', 2493), ('禽', 2494), ('氢', 2495), ('辟', 2496), ('邵', 2497), ('苍', 2498), ('劝', 2499), ('剔', 2500), ('砂', 2501), ('舌', 2502), ('郝', 2503), ('丛', 2504), ('萄', 2505), ('%', 2506), ('懒', 2507), ('晤', 2508), ('啥', 2509), ('蒸', 2510), ('伞', 2511), ('湘', 2512), ('茫', 2513), ('拾', 2514), ('盯', 2515), ('尹', 2516), ('辖', 2517), ('蕴', 2518), ('溃', 2519), ('邹', 2520), ('禅', 2521), ('仗', 2522), ('晒', 2523), ('杠', 2524), ('佐', 2525), ('萌', 2526), ('奎', 2527), ('匆', 2528), ('娥', 2529), ('氰', 2530), ('夷', 2531), ('棋', 2532), ('拯', 2533), ('耍', 2534), ('冈', 2535), ('绸', 2536), ('厕', 2537), ('倪', 2538), ('翟', 2539), ('瞄', 2540), ('筋', 2541), ('碗', 2542), ('庸', 2543), ('祸', 2544), ('岭', 2545), ('暨', 2546), ('诀', 2547), ('竣', 2548), ('巅', 2549), ('麟', 2550), ('栖', 2551), ('丙', 2552), ('⊙', 2553), ('扔', 2554), ('镶', 2555), ('遣', 2556), ('楂', 2557), ('呀', 2558), ('俪', 2559), ('羞', 2560), ('祭', 2561), ('妩', 2562), ('澜', 2563), ('痴', 2564), ('浏', 2565), ('烛', 2566), ('仑', 2567), ('彗', 2568), ('袍', 2569), ('姬', 2570), ('焰', 2571), ('廓', 2572), ('绣', 2573), ('翅', 2574), ('辱', 2575), ('叙', 2576), ('蓉', 2577), ('刃', 2578), ('乾', 2579), ('戚', 2580), ('怜', 2581), ('阐', 2582), ('辜', 2583), ('雌', 2584), ('辕', 2585), ('臭', 2586), ('狐', 2587), ('渣', 2588), ('敞', 2589), ('荧', 2590), ('脖', 2591), ('帷', 2592), ('甩', 2593), ('胃', 2594), ('搁', 2595), ('瞻', 2596), ('晴', 2597), ('顷', 2598), ('聂', 2599), ('乙', 2600), ('饼', 2601), ('丘', 2602), ('惩', 2603), ('琦', 2604), ('梨', 2605), ('璐', 2606), ('侃', 2607), ('愁', 2608), ('柴', 2609), ('绚', 2610), ('魄', 2611), ('噪', 2612), ('犀', 2613), ('弈', 2614), ('崛', 2615), ('扯', 2616), ('灿', 2617), ('溯', 2618), ('躺', 2619), ('踢', 2620), ('◆', 2621), ('踩', 2622), ('恭', 2623), ('狭', 2624), ('乖', 2625), ('稻', 2626), ('潭', 2627), ('槽', 2628), ('惕', 2629), ('磋', 2630), ('靡', 2631), ('巷', 2632), ('暮', 2633), ('虐', 2634), ('粘', 2635), ('遏', 2636), ('$', 2637), ('铅', 2638), ('浸', 2639), ('绳', 2640), ('刮', 2641), ('愚', 2642), ('炜', 2643), ('镁', 2644), ('勉', 2645), ('哀', 2646), ('逗', 2647), ('酝', 2648), ('芭', 2649), ('沧', 2650), ('浑', 2651), ('畔', 2652), ('嵌', 2653), ('掏', 2654), ('匠', 2655), ('饲', 2656), ('懈', 2657), ('愧', 2658), ('兜', 2659), ('钗', 2660), ('嫦', 2661), ('咒', 2662), ('屿', 2663), ('叉', 2664), ('骸', 2665), ('渊', 2666), ('绯', 2667), ('躁', 2668), ('霖', 2669), ('漓', 2670), ('匙', 2671), ('昏', 2672), ('弧', 2673), ('蠢', 2674), ('阱', 2675), ('卜', 2676), ('鸭', 2677), ('脊', 2678), ('渗', 2679), ('庙', 2680), ('韧', 2681), ('屁', 2682), ('浆', 2683), ('肺', 2684), ('鸦', 2685), ('熔', 2686), ('拦', 2687), ('肠', 2688), ('摔', 2689), ('惟', 2690), ('郅', 2691), ('絮', 2692), ('碌', 2693), ('渝', 2694), ('é', 2695), ('幢', 2696), ('卸', 2697), ('伽', 2698), ('嘘', 2699), ('擂', 2700), ('腔', 2701), ('龚', 2702), ('烤', 2703), ('婧', 2704), ('矩', 2705), ('纶', 2706), ('硅', 2707), ('诡', 2708), ('昭', 2709), ('霜', 2710), ('娟', 2711), ('翘', 2712), ('摧', 2713), ('冉', 2714), ('燥', 2715), ('碟', 2716), ('篪', 2717), ('汁', 2718), ('玺', 2719), ('犸', 2720), ('甸', 2721), ('窦', 2722), ('晖', 2723), ('铝', 2724), ('蚀', 2725), ('剖', 2726), ('胚', 2727), ('崖', 2728), ('熬', 2729), ('朔', 2730), ('闵', 2731), ('掠', 2732), ('畏', 2733), ('缅', 2734), ('隅', 2735), ('贩', 2736), ('匿', 2737), ('钥', 2738), ('琢', 2739), ('谅', 2740), ('讽', 2741), ('圻', 2742), ('榄', 2743), ('誓', 2744), ('刹', 2745), ('谣', 2746), ('厄', 2747), ('萝', 2748), ('焕', 2749), ('骼', 2750), ('寞', 2751), ('寥', 2752), ('缎', 2753), ('沦', 2754), ('拷', 2755), ('挨', 2756), ('塘', 2757), ('澡', 2758), ('亥', 2759), ('枯', 2760), ('吵', 2761), ('僧', 2762), ('橘', 2763), ('栈', 2764), ('竭', 2765), ('捡', 2766), ('髓', 2767), ('谎', 2768), ('蔬', 2769), ('钮', 2770), ('橄', 2771), ('溜', 2772), ('撕', 2773), ('睁', 2774), ('沾', 2775), ('茵', 2776), ('缤', 2777), ('拇', 2778), ('罐', 2779), ('寰', 2780), ('佼', 2781), ('竖', 2782), ('屯', 2783), ('殷', 2784), ('崭', 2785), ('潇', 2786), ('犬', 2787), ('纬', 2788), ('.', 2789), ('讳', 2790), ('捞', 2791), ('筛', 2792), ('绽', 2793), ('捏', 2794), ('鞍', 2795), ('琐', 2796), ('卉', 2797), ('枫', 2798), ('涩', 2799), ('铃', 2800), ('唇', 2801), ('肝', 2802), ('腥', 2803), ('沛', 2804), ('瑶', 2805), ('卿', 2806), ('敛', 2807), ('扛', 2808), ('妍', 2809), ('嘲', 2810), ('弓', 2811), ('☆', 2812), ('坪', 2813), ('窍', 2814), ('觅', 2815), ('奴', 2816), ('凹', 2817), ('缔', 2818), ('佟', 2819), ('蔽', 2820), ('闸', 2821), ('扳', 2822), ('梳', 2823), ('冤', 2824), ('蚂', 2825), ('骏', 2826), ('爪', 2827), ('哄', 2828), ('丸', 2829), ('喂', 2830), ('镖', 2831), ('柄', 2832), ('湛', 2833), ('篷', 2834), ('娄', 2835), ('逮', 2836), ('蜥', 2837), ('盎', 2838), ('剥', 2839), ('缪', 2840), ('鹤', 2841), ('蟹', 2842), ('帜', 2843), ('傍', 2844), ('徊', 2845), ('枕', 2846), ('瀑', 2847), ('徘', 2848), ('俞', 2849), ('阮', 2850), ('炙', 2851), ('芙', 2852), ('哺', 2853), ('靖', 2854), ('挚', 2855), ('袂', 2856), ('炬', 2857), ('肪', 2858), ('硫', 2859), ('汀', 2860), ('禾', 2861), ('珀', 2862), ('钧', 2863), ('彪', 2864), ('肇', 2865), ('烹', 2866), ('噩', 2867), ('隙', 2868), ('桩', 2869), ('锈', 2870), ('礁', 2871), ('嚣', 2872), ('尿', 2873), ('垒', 2874), ('襟', 2875), ('+', 2876), ('攒', 2877), ('噬', 2878), ('苛', 2879), ('吼', 2880), ('棍', 2881), ('煞', 2882), ('迭', 2883), ('笨', 2884), ('暇', 2885), ('拢', 2886), ('涡', 2887), ('肘', 2888), ('宰', 2889), ('诛', 2890), ('喇', 2891), ('俭', 2892), ('→', 2893), ('钦', 2894), ('菊', 2895), ('藉', 2896), ('卑', 2897), ('坝', 2898), ('樊', 2899), ('铆', 2900), ('亭', 2901), ('锂', 2902), ('咕', 2903), ('虞', 2904), ('俯', 2905), ('斧', 2906), ('盔', 2907), ('棵', 2908), ('铸', 2909), ('饿', 2910), ('掷', 2911), ('彤', 2912), ('瞒', 2913), ('梭', 2914), ('淮', 2915), ('汹', 2916), ('卦', 2917), ('锣', 2918), ('辙', 2919), ('宵', 2920), ('濒', 2921), ('蜡', 2922), ('褐', 2923), ('耻', 2924), ('乍', 2925), ('咸', 2926), ('橡', 2927), ('缸', 2928), ('乞', 2929), ('垮', 2930), ('膏', 2931), ('鄂', 2932), ('弦', 2933), ('霉', 2934), ('倦', 2935), ('畴', 2936), ('虾', 2937), ('隧', 2938), ('荫', 2939), ('绅', 2940), ('冥', 2941), ('昧', 2942), ('荆', 2943), ('媳', 2944), ('瘤', 2945), ('浇', 2946), ('昊', 2947), ('嫂', 2948), ('遂', 2949), ('烫', 2950), ('赘', 2951), ('跻', 2952), ('烷', 2953), ('藻', 2954), ('酱', 2955), ('俨', 2956), ('驼', 2957), ('庚', 2958), ('糙', 2959), ('饥', 2960), ('曙', 2961), ('煮', 2962), ('辄', 2963), ('狙', 2964), ('茜', 2965), ('咋', 2966), ('佑', 2967), ('舶', 2968), ('趟', 2969), ('冀', 2970), ('钾', 2971), ('拱', 2972), ('腺', 2973), ('滤', 2974), ('妃', 2975), ('祈', 2976), ('骁', 2977), ('骷', 2978), ('斐', 2979), ('麒', 2980), ('颓', 2981), ('脾', 2982), ('髅', 2983), ('覃', 2984), ('熠', 2985), ('镂', 2986), ('儒', 2987), ('霄', 2988), ('哑', 2989), ('枢', 2990), ('噱', 2991), ('陋', 2992), ('冶', 2993), ('贞', 2994), ('圃', 2995), ('涅', 2996), ('耽', 2997), ('蒲', 2998), ('窥', 2999), ('喘', 3000), ('杖', 3001), ('隽', 3002), ('姨', 3003), ('哒', 3004), ('裴', 3005), ('|', 3006), ('岚', 3007), ('饶', 3008), ('搅', 3009), ('玮', 3010), ('埔', 3011), ('渲', 3012), ('熏', 3013), ('琛', 3014), ('○', 3015), ('─', 3016), ('喧', 3017), ('踊', 3018), ('℃', 3019), ('<', 3020), ('肋', 3021), ('拭', 3022), ('耿', 3023), ('厢', 3024), ('邢', 3025), ('捆', 3026), ('镯', 3027), ('峥', 3028), ('株', 3029), ('哇', 3030), ('譬', 3031), ('隶', 3032), ('璨', 3033), ('屑', 3034), ('嫣', 3035), ('葆', 3036), ('绰', 3037), ('沮', 3038), ('孵', 3039), ('歪', 3040), ('淹', 3041), ('揣', 3042), ('淳', 3043), ('奸', 3044), ('帧', 3045), ('瑚', 3046), ('宛', 3047), ('酶', 3048), ('陡', 3049), ('嗅', 3050), ('毋', 3051), ('嘿', 3052), ('啤', 3053), ('淫', 3054), ('臃', 3055), ('墟', 3056), ('砚', 3057), ('稽', 3058), ('缚', 3059), ('璀', 3060), ('锯', 3061), ('嬉', 3062), ('栽', 3063), ('茄', 3064), ('佬', 3065), ('Ⅱ', 3066), ('娅', 3067), ('畜', 3068), ('樱', 3069), ('氨', 3070), ('翩', 3071), ('倘', 3072), ('曦', 3073), ('瞧', 3074), ('暧', 3075), ('鳌', 3076), ('镀', 3077), ('桦', 3078), ('黯', 3079), ('寡', 3080), ('蚊', 3081), ('葱', 3082), ('惫', 3083), ('幂', 3084), ('烘', 3085), ('惬', 3086), ('抉', 3087), ('椎', 3088), ('飓', 3089), ('媲', 3090), ('溶', 3091), ('昕', 3092), ('妤', 3093), ('沼', 3094), ('闺', 3095), ('轶', 3096), ('滕', 3097), ('煎', 3098), ('饪', 3099), ('耸', 3100), ('聆', 3101), ('$', 3102), ('氮', 3103), ('蜀', 3104), ('庐', 3105), ('罄', 3106), ('菁', 3107), ('窘', 3108), ('姗', 3109), ('鲲', 3110), ('醋', 3111), ('窟', 3112), ('岂', 3113), ('棺', 3114), ('灶', 3115), ('雍', 3116), ('禧', 3117), ('赐', 3118), ('晟', 3119), ('瞎', 3120), ('艋', 3121), ('珂', 3122), ('釉', 3123), ('痒', 3124), ('缉', 3125), ('缆', 3126), ('窑', 3127), ('岐', 3128), ('柬', 3129), ('膊', 3130), ('狸', 3131), ('猿', 3132), ('琅', 3133), ('匀', 3134), ('迥', 3135), ('牟', 3136), ('嘟', 3137), ('爹', 3138), ('蜗', 3139), ('婕', 3140), ('骥', 3141), ('蹄', 3142), ('菱', 3143), ('骆', 3144), ('恳', 3145), ('拎', 3146), ('渺', 3147), ('炯', 3148), ('茹', 3149), ('赂', 3150), ('诟', 3151), ('哗', 3152), ('炳', 3153), ('笛', 3154), ('趾', 3155), ('∶', 3156), ('颐', 3157), ('歼', 3158), ('蝉', 3159), ('芦', 3160), ('泣', 3161), ('陀', 3162), ('堕', 3163), ('畸', 3164), ('涿', 3165), ('¥', 3166), ('硝', 3167), ('宕', 3168), ('釜', 3169), ('壹', 3170), ('玖', 3171), ('蓓', 3172), ('瑕', 3173), ('绷', 3174), ('贱', 3175), ('缭', 3176), ('豁', 3177), ('娶', 3178), ('禄', 3179), ('栗', 3180), ('伺', 3181), ('穗', 3182), ('泌', 3183), ('赝', 3184), ('膑', 3185), ('坍', 3186), ('稚', 3187), ('醛', 3188), ('叮', 3189), ('滔', 3190), ('胳', 3191), ('坟', 3192), ('凿', 3193), ('邬', 3194), ('躯', 3195), ('驭', 3196), ('瞪', 3197), ('葵', 3198), ('棱', 3199), ('瀚', 3200), ('烁', 3201), ('囚', 3202), ('溅', 3203), ('旷', 3204), ('矢', 3205), ('侍', 3206), ('榻', 3207), ('辗', 3208), ('轿', 3209), ('磷', 3210), ('憋', 3211), ('挠', 3212), ('炽', 3213), ('洼', 3214), ('阎', 3215), ('芽', 3216), ('捍', 3217), ('杏', 3218), ('诫', 3219), ('崎', 3220), ('嘱', 3221), ('劈', 3222), ('吾', 3223), ('谴', 3224), ('沐', 3225), ('梵', 3226), ('鸥', 3227), ('珑', 3228), ('檀', 3229), ('姥', 3230), ('蜴', 3231), ('鞭', 3232), ('棘', 3233), ('蜕', 3234), ('逍', 3235), ('堤', 3236), ('桐', 3237), ('惺', 3238), ('戮', 3239), ('跪', 3240), ('魑', 3241), ('嘻', 3242), ('癫', 3243), ('侏', 3244), ('沁', 3245), ('孢', 3246), ('喉', 3247), ('肾', 3248), ('瘫', 3249), ('醇', 3250), ('骇', 3251), ('喀', 3252), ('忐', 3253), ('忑', 3254), ('萃', 3255), ('栩', 3256), ('瓣', 3257), ('嗓', 3258), ('粪', 3259), ('徙', 3260), ('烯', 3261), ('榴', 3262), ('邸', 3263), ('诅', 3264), ('蹲', 3265), ('嗯', 3266), ('蕉', 3267), ('椒', 3268), ('凄', 3269), ('妞', 3270), ('芸', 3271), ('妒', 3272), ('羚', 3273), ('恍', 3274), ('朽', 3275), ('韬', 3276), ('蝇', 3277), ('剃', 3278), ('秃', 3279), ('亟', 3280), ('�', 3281), ('鄢', 3282), ('憧', 3283), ('褒', 3284), ('妄', 3285), ('牡', 3286), ('汐', 3287), ('扼', 3288), ('阀', 3289), ('呕', 3290), ('遐', 3291), ('蟒', 3292), ('铮', 3293), ('霾', 3294), ('毙', 3295), ('叭', 3296), ('簇', 3297), ('邂', 3298), ('逅', 3299), ('萱', 3300), ('吝', 3301), ('禺', 3302), ('嗜', 3303), ('酋', 3304), ('菇', 3305), ('襄', 3306), ('驯', 3307), ('蹊', 3308), ('颤', 3309), ('慑', 3310), ('祷', 3311), ('楷', 3312), ('珏', 3313), ('缇', 3314), ('拽', 3315), ('颂', 3316), ('寇', 3317), ('憬', 3318), ('飚', 3319), ('嫉', 3320), ('氯', 3321), ('灼', 3322), ('褪', 3323), ('眩', 3324), ('氦', 3325), ('螂', 3326), ('砌', 3327), ('咯', 3328), ('俑', 3329), ('悼', 3330), ('疵', 3331), ('铲', 3332), ('袱', 3333), ('枉', 3334), ('跷', 3335), ('兢', 3336), ('僚', 3337), ('澎', 3338), ('晔', 3339), ('晏', 3340), ('皓', 3341), ('匈', 3342), ('・', 3343), ('梓', 3344), ('娴', 3345), ('倚', 3346), ('弩', 3347), ('匮', 3348), ('徕', 3349), ('饽', 3350), ('汛', 3351), ('锥', 3352), ('厮', 3353), ('庇', 3354), ('荼', 3355), ('^', 3356), ('沓', 3357), ('恬', 3358), ('甫', 3359), ('匾', 3360), ('瑾', 3361), ('眷', 3362), ('孰', 3363), ('祺', 3364), ('鳞', 3365), ('孚', 3366), ('孜', 3367), ('坯', 3368), ('迦', 3369), ('拙', 3370), ('矫', 3371), ('啃', 3372), ('驴', 3373), ('饺', 3374), ('僻', 3375), ('莓', 3376), ('蘑', 3377), ('咽', 3378), ('跋', 3379), ('舵', 3380), ('煽', 3381), ('吟', 3382), ('焚', 3383), ('竿', 3384), ('绊', 3385), ('殴', 3386), ('躬', 3387), ('榆', 3388), ('陇', 3389), ('璧', 3390), ('痪', 3391), ('疤', 3392), ('槟', 3393), ('歹', 3394), ('觑', 3395), ('坷', 3396), ('呐', 3397), ('谬', 3398), ('铨', 3399), ('昱', 3400), ('茸', 3401), ('磕', 3402), ('泻', 3403), ('鞠', 3404), ('筝', 3405), ('缕', 3406), ('殆', 3407), ('簿', 3408), ('琥', 3409), ('苞', 3410), ('掐', 3411), ('兀', 3412), ('窈', 3413), ('窕', 3414), ('檐', 3415), ('熄', 3416), ('睦', 3417), ('凛', 3418), ('趴', 3419), ('盏', 3420), ('瑙', 3421), ('敷', 3422), ('摒', 3423), ('瞰', 3424), ('潢', 3425), ('栅', 3426), ('蹿', 3427), ('喔', 3428), ('佘', 3429), ('谙', 3430), ('擒', 3431), ('砥', 3432), ('抒', 3433), ('圭', 3434), ('仆', 3435), ('赃', 3436), ('碘', 3437), ('黏', 3438), ('羹', 3439), ('阪', 3440), ('舅', 3441), ('蹦', 3442), ('穹', 3443), ('婪', 3444), ('俘', 3445), ('屉', 3446), ('鳍', 3447), ('咎', 3448), ('愣', 3449), ('撇', 3450), ('叨', 3451), ('寐', 3452), ('°', 3453), ('挟', 3454), ('汲', 3455), ('笈', 3456), ('蛟', 3457), ('镍', 3458), ('惮', 3459), ('漩', 3460), ('巍', 3461), ('钙', 3462), ('堰', 3463), ('粥', 3464), ('隋', 3465), ('毗', 3466), ('骋', 3467), ('慷', 3468), ('鹊', 3469), ('煜', 3470), ('憨', 3471), ('丐', 3472), ('峨', 3473), ('烙', 3474), ('哎', 3475), ('酪', 3476), ('\\', 3477), ('惋', 3478), ('慵', 3479), ('娆', 3480), ('挎', 3481), ('棠', 3482), ('莘', 3483), ('煲', 3484), ('蚕', 3485), ('昵', 3486), ('咳', 3487), ('斋', 3488), ('寝', 3489), ('尧', 3490), ('翎', 3491), ('稠', 3492), ('捣', 3493), ('眨', 3494), ('犷', 3495), ('澈', 3496), ('稣', 3497), ('苯', 3498), ('绞', 3499), ('诧', 3500), ('雏', 3501), ('邃', 3502), ('砷', 3503), ('辫', 3504), ('裘', 3505), ('砭', 3506), ('椭', 3507), ('疟', 3508), ('篑', 3509), ('呛', 3510), ('嘎', 3511), ('涤', 3512), ('戟', 3513), ('榈', 3514), ('铐', 3515), ('岑', 3516), ('颅', 3517), ('衅', 3518), ('苟', 3519), ('筷', 3520), ('咧', 3521), ('螃', 3522), ('蚓', 3523), ('箍', 3524), ('惶', 3525), ('膺', 3526), ('呱', 3527), ('剽', 3528), ('曳', 3529), ('闽', 3530), ('泵', 3531), ('砝', 3532), ('臻', 3533), ('懵', 3534), ('戳', 3535), ('靶', 3536), ('侥', 3537), ('掺', 3538), ('沽', 3539), ('粟', 3540), ('弛', 3541), ('狡', 3542), ('峙', 3543), ('钵', 3544), ('蝎', 3545), ('昼', 3546), ('琉', 3547), ('伎', 3548), ('揪', 3549), ('迸', 3550), ('哮', 3551), ('奚', 3552), ('蛰', 3553), ('皙', 3554), ('碱', 3555), ('矜', 3556), ('戎', 3557), ('薯', 3558), ('悖', 3559), ('亢', 3560), ('垦', 3561), ('倔', 3562), ('胯', 3563), ('酣', 3564), ('窒', 3565), ('鸽', 3566), ('鹦', 3567), ('榕', 3568), ('踵', 3569), ('诵', 3570), ('姊', 3571), ('伶', 3572), ('钊', 3573), ('拧', 3574), ('哟', 3575), ('抨', 3576), ('撩', 3577), ('溉', 3578), ('酌', 3579), ('莅', 3580), ('®', 3581), ('μ', 3582), ('渎', 3583), ('峭', 3584), ('茧', 3585), ('妓', 3586), ('雁', 3587), ('◎', 3588), ('炅', 3589), ('柠', 3590), ('懿', 3591), ('酥', 3592), ('腩', 3593), ('窖', 3594), ('貂', 3595), ('舜', 3596), ('蒜', 3597), ('蚯', 3598), ('嵩', 3599), ('嚷', 3600), ('缄', 3601), ('肴', 3602), ('耘', 3603), ('麓', 3604), ('韶', 3605), ('娲', 3606), ('曜', 3607), ('诙', 3608), ('娓', 3609), ('氓', 3610), ('猬', 3611), ('敖', 3612), ('鹉', 3613), ('矣', 3614), ('紊', 3615), ('柿', 3616), ('匣', 3617), ('刁', 3618), ('鱿', 3619), ('邋', 3620), ('筠', 3621), ('※', 3622), ('淆', 3623), ('皂', 3624), ('鹜', 3625), ('竺', 3626), ('厥', 3627), ('窜', 3628), ('癖', 3629), ('馅', 3630), ('淌', 3631), ('攘', 3632), ('苓', 3633), ('斓', 3634), ('兮', 3635), ('夭', 3636), ('遢', 3637), ('驹', 3638), ('咪', 3639), ('喋', 3640), ('梗', 3641), ('屎', 3642), ('咀', 3643), ('瑛', 3644), ('幔', 3645), ('粽', 3646), ('鹭', 3647), ('茎', 3648), ('怠', 3649), ('噢', 3650), ('匡', 3651), ('沌', 3652), ('萤', 3653), ('铧', 3654), ('乒', 3655), ('睫', 3656), ('眈', 3657), ('阙', 3658), ('猖', 3659), ('滇', 3660), ('拌', 3661), ('潍', 3662), ('趸', 3663), ('葫', 3664), ('砺', 3665), ('撬', 3666), ('忡', 3667), ('〈', 3668), ('狩', 3669), ('裱', 3670), ('铂', 3671), ('檬', 3672), ('痊', 3673), ('锏', 3674), ('湮', 3675), ('悸', 3676), ('瓢', 3677), ('嚼', 3678), ('禹', 3679), ('粱', 3680), ('〉', 3681), ('崽', 3682), ('冗', 3683), ('=', 3684), ('贰', 3685), ('夯', 3686), ('乓', 3687), ('侮', 3688), ('笃', 3689), ('淤', 3690), ('涎', 3691), ('礴', 3692), ('汝', 3693), ('潞', 3694), ('侄', 3695), ('恪', 3696), ('吆', 3697), ('淼', 3698), ('呦', 3699), ('泓', 3700), ('怯', 3701), ('遴', 3702), ('荔', 3703), ('霓', 3704), ('沂', 3705), ('酵', 3706), ('勺', 3707), ('咫', 3708), ('尉', 3709), ('藩', 3710), ('墩', 3711), ('椰', 3712), ('簧', 3713), ('唾', 3714), ('柒', 3715), ('胧', 3716), ('薰', 3717), ('饕', 3718), ('桓', 3719), ('疮', 3720), ('泾', 3721), ('枣', 3722), ('瞿', 3723), ('槌', 3724), ('笋', 3725), ('钰', 3726), ('埠', 3727), ('蜿', 3728), ('蜒', 3729), ('熹', 3730), ('蠕', 3731), ('谧', 3732), ('钛', 3733), ('挝', 3734), ('羌', 3735), ('朦', 3736), ('丫', 3737), ('拂', 3738), ('醍', 3739), ('恺', 3740), ('赈', 3741), ('颚', 3742), ('睾', 3743), ('扉', 3744), ('匕', 3745), ('岌', 3746), ('荟', 3747), ('姝', 3748), ('餮', 3749), ('锄', 3750), ('锷', 3751), ('铎', 3752), ('暄', 3753), ('嘀', 3754), ('秽', 3755), ('萦', 3756), ('啬', 3757), ('芜', 3758), ('栾', 3759), ('眸', 3760), ('菩', 3761), ('踞', 3762), ('糅', 3763), ('湃', 3764), ('獗', 3765), ('芋', 3766), ('瀛', 3767), ('鬃', 3768), ('瞅', 3769), ('焉', 3770), ('昙', 3771), ('纭', 3772), ('裳', 3773), ('蛊', 3774), ('茱', 3775), ('罹', 3776), ('奂', 3777), ('阜', 3778), ('氟', 3779), ('嵘', 3780), ('篡', 3781), ('Ⅲ', 3782), ('濮', 3783), ('蛤', 3784), ('逞', 3785), ('撮', 3786), ('篱', 3787), ('璞', 3788), ('岔', 3789), ('铿', 3790), ('钝', 3791), ('痞', 3792), ('扒', 3793), ('祀', 3794), ('苇', 3795), ('峪', 3796), ('瞠', 3797), ('腱', 3798), ('莽', 3799), ('溺', 3800), ('蚤', 3801), ('珐', 3802), ('茬', 3803), ('晾', 3804), ('疚', 3805), ('俺', 3806), ('炖', 3807), ('矗', 3808), ('飒', 3809), ('彷', 3810), ('咄', 3811), ('掰', 3812), ('橹', 3813), ('颊', 3814), ('笙', 3815), ('蒿', 3816), ('泗', 3817), ('卒', 3818), ('宸', 3819), ('馒', 3820), ('砾', 3821), ('沥', 3822), ('嗽', 3823), ('寅', 3824), ('羲', 3825), ('螳', 3826), ('铠', 3827), ('漪', 3828), ('遛', 3829), ('姣', 3830), ('浒', 3831), ('荃', 3832), ('焱', 3833), (']', 3834), ('铀', 3835), ('聋', 3836), ('猥', 3837), ('诽', 3838), ('丞', 3839), ('[', 3840), ('α', 3841), ('忱', 3842), ('呗', 3843), ('榨', 3844), ('抠', 3845), ('叱', 3846), ('囱', 3847), ('啼', 3848), ('骰', 3849), ('隼', 3850), ('虱', 3851), ('皿', 3852), ('哼', 3853), ('眯', 3854), ('嚎', 3855), ('汾', 3856), ('唉', 3857), ('憩', 3858), ('哉', 3859), ('嗒', 3860), ('捅', 3861), ('猝', 3862), ('刨', 3863), ('猾', 3864), ('酯', 3865), ('鲶', 3866), ('谤', 3867), ('枭', 3868), ('蟾', 3869), ('锌', 3870), ('唏', 3871), ('曰', 3872), ('於', 3873), ('犁', 3874), ('诃', 3875), ('籽', 3876), ('垩', 3877), ('膛', 3878), ('唠', 3879), ('斟', 3880), ('稼', 3881), ('蜻', 3882), ('①', 3883), ('Ø', 3884), ('™', 3885), ('揍', 3886), ('拣', 3887), ('觎', 3888), ('叼', 3889), ('缮', 3890), ('痹', 3891), ('拗', 3892), ('揉', 3893), ('蟑', 3894), ('浚', 3895), ('汕', 3896), ('烬', 3897), ('è', 3898), ('蜓', 3899), ('胤', 3900), ('轼', 3901), ('猕', 3902), ('剿', 3903), ('榷', 3904), ('祉', 3905), ('泯', 3906), ('捺', 3907), ('鄙', 3908), ('晦', 3909), ('蹬', 3910), ('婿', 3911), ('虏', 3912), ('璋', 3913), ('莠', 3914), ('\x1f', 3915), ('搀', 3916), ('狈', 3917), ('绌', 3918), ('瘟', 3919), ('枷', 3920), ('觊', 3921), ('咤', 3922), ('辍', 3923), ('啪', 3924), ('缨', 3925), ('呜', 3926), ('钒', 3927), ('鹃', 3928), ('涓', 3929), ('霹', 3930), ('谛', 3931), ('亵', 3932), ('腼', 3933), ('蔷', 3934), ('〕', 3935), ('浣', 3936), ('赣', 3937), ('雳', 3938), ('饵', 3939), ('眶', 3940), ('翌', 3941), ('腮', 3942), ('瞥', 3943), ('腆', 3944), ('愫', 3945), ('桨', 3946), ('桔', 3947), ('绢', 3948), ('娩', 3949), ('椋', 3950), ('凋', 3951), ('鞘', 3952), ('惚', 3953), ('憎', 3954), ('旎', 3955), ('惦', 3956), ('跤', 3957), ('烽', 3958), ('〔', 3959), ('澧', 3960), ('喙', 3961), ('魇', 3962), ('贻', 3963), ('怂', 3964), ('赦', 3965), ('殃', 3966), ('涟', 3967), ('邝', 3968), ('祁', 3969), ('殉', 3970), ('芹', 3971), ('羔', 3972), ('昀', 3973), ('袒', 3974), ('麾', 3975), ('轲', 3976), ('咆', 3977), ('弋', 3978), ('蟆', 3979), ('驿', 3980), ('脐', 3981), ('珉', 3982), ('蕊', 3983), ('霁', 3984), ('蜍', 3985), ('螈', 3986), ('佯', 3987), ('惰', 3988), ('馥', 3989), ('踹', 3990), ('眺', 3991), ('渥', 3992), ('祠', 3993), ('蓟', 3994), ('¾', 3995), ('臼', 3996), ('瘪', 3997), ('懊', 3998), ('掂', 3999), ('禀', 4000), ('喽', 4001), ('蹭', 4002), ('贮', 4003), ('漾', 4004), ('涧', 4005), ('鲟', 4006), ('咐', 4007), ('摁', 4008), ('裆', 4009), ('钳', 4010), ('谑', 4011), ('舔', 4012), ('琨', 4013), ('缜', 4014), ('渍', 4015), ('昴', 4016), ('ü', 4017), ('肮', 4018), ('蛾', 4019), ('毡', 4020), ('蔑', 4021), ('秤', 4022), ('锢', 4023), ('焊', 4024), ('髻', 4025), ('摹', 4026), ('帼', 4027), ('邯', 4028), ('②', 4029), ('昶', 4030), ('‰', 4031), ('诩', 4032), ('涮', 4033), ('茁', 4034), ('睽', 4035), ('锚', 4036), ('袄', 4037), ('珞', 4038), ('町', 4039), ('鬣', 4040), ('诣', 4041), ('黔', 4042), ('臆', 4043), ('蔼', 4044), ('岖', 4045), ('梧', 4046), ('苔', 4047), ('糜', 4048), ('冽', 4049), ('菠', 4050), ('镰', 4051), ('掮', 4052), ('颌', 4053), ('鏖', 4054), ('蹂', 4055), ('躏', 4056), ('腋', 4057), ('殇', 4058), ('漱', 4059), ('膳', 4060), ('垢', 4061), ('泸', 4062), ('坨', 4063), ('铛', 4064), ('搂', 4065), ('妾', 4066), ('嗦', 4067), ('札', 4068), ('诘', 4069), ('偕', 4070), ('籁', 4071), ('嗡', 4072), ('玟', 4073), ('鹫', 4074), ('钚', 4075), ('炊', 4076), ('澍', 4077), ('卯', 4078), ('迢', 4079), ('隘', 4080), ('溥', 4081), ('遁', 4082), ('馍', 4083), ('袤', 4084), ('嘶', 4085), ('唧', 4086), ('垣', 4087), ('甭', 4088), ('胫', 4089), ('嘈', 4090), ('濡', 4091), ('唬', 4092), ('A', 4093), ('懦', 4094), ('迂', 4095), ('孽', 4096), ('翱', 4097), ('犒', 4098), ('闰', 4099), ('铤', 4100), ('胄', 4101), ('垡', 4102), ('幌', 4103), ('犊', 4104), ('喃', 4105), ('蹒', 4106), ('跚', 4107), ('晗', 4108), ('殡', 4109), ('棣', 4110), ('柚', 4111), ('蕙', 4112), ('荚', 4113), ('`', 4114), ('⋯', 4115), ('煊', 4116), ('哽', 4117), ('馋', 4118), ('蛆', 4119), ('馁', 4120), ('涝', 4121), ('睬', 4122), ('鸠', 4123), ('冼', 4124), ('痫', 4125), ('茉', 4126), ('遨', 4127), ('纣', 4128), ('靳', 4129), ('胰', 4130), ('芥', 4131), ('咂', 4132), ('搓', 4133), ('哆', 4134), ('砰', 4135), ('恙', 4136), ('浊', 4137), ('攫', 4138), ('啄', 4139), ('嗖', 4140), ('獒', 4141), ('霏', 4142), ('扈', 4143), ('榭', 4144), ('祛', 4145), ('磺', 4146), ('倭', 4147), ('◇', 4148), ('涸', 4149), ('苷', 4150), ('讧', 4151), ('拄', 4152), ('惭', 4153), ('搪', 4154), ('蜚', 4155), ('鸳', 4156), ('鲤', 4157), ('毓', 4158), ('岱', 4159), ('骅', 4160), ('钠', 4161), ('酰', 4162), ('镳', 4163), ('芮', 4164), ('偌', 4165), ('潦', 4166), ('藕', 4167), ('啧', 4168), ('脍', 4169), ('嗣', 4170), ('濠', 4171), ('瞳', 4172), ('簸', 4173), ('疹', 4174), ('à', 4175), ('菅', 4176), ('‧', 4177), ('徨', 4178), ('阂', 4179), ('搡', 4180), ('庶', 4181), ('梢', 4182), ('鸯', 4183), ('讹', 4184), ('妊', 4185), ('篆', 4186), ('嫔', 4187), ('後', 4188), ('『', 4189), ('』', 4190), ('G', 4191), ('犰', 4192), ('狳', 4193), ('珥', 4194), ('抡', 4195), ('惘', 4196), ('羸', 4197), ('虔', 4198), ('惴', 4199), ('掣', 4200), ('熨', 4201), ('讥', 4202), ('蹶', 4203), ('衩', 4204), ('嗔', 4205), ('莺', 4206), ('疙', 4207), ('瘩', 4208), ('呃', 4209), ('夙', 4210), ('锲', 4211), ('攸', 4212), ('↑', 4213), ('掳', 4214), ('茗', 4215), ('叩', 4216), ('孪', 4217), ('哩', 4218), ('丕', 4219), ('楔', 4220), ('郦', 4221), ('獭', 4222), ('燎', 4223), ('谩', 4224), ('愕', 4225), ('狞', 4226), ('渭', 4227), ('衙', 4228), ('唆', 4229), ('涕', 4230), ('瘠', 4231), ('祟', 4232), ('怅', 4233), ('窿', 4234), ('咔', 4235), ('黝', 4236), ('拈', 4237), ('恕', 4238), ('啷', 4239), ('浜', 4240), ('蔻', 4241), ('潺', 4242), ('纂', 4243), ('罡', 4244), ('H', 4245), ('Ⅶ', 4246), ('箴', 4247), ('舛', 4248), ('踌', 4249), ('躇', 4250), ('煦', 4251), ('藐', 4252), ('遑', 4253), ('咚', 4254), ('鸵', 4255), ('碾', 4256), ('衢', 4257), ('琶', 4258), ('泞', 4259), ('▲', 4260), ('婀', 4261), ('湄', 4262), ('筱', 4263), ('轧', 4264), ('邑', 4265), ('靛', 4266), ('鼬', 4267), ('魈', 4268), ('讷', 4269), ('瘸', 4270), ('攥', 4271), ('裨', 4272), ('杞', 4273), ('撂', 4274), ('拴', 4275), ('跆', 4276), ('腑', 4277), ('弑', 4278), ('徜', 4279), ('馗', 4280), ('忻', 4281), ('珈', 4282), ('灸', 4283), ('翊', 4284), ('佰', 4285), ('√', 4286), ('―', 4287), ('胱', 4288), ('麂', 4289), ('祚', 4290), ('铢', 4291), ('漳', 4292), ('樵', 4293), ('侬', 4294), ('忏', 4295), ('笆', 4296), ('幄', 4297), ('偎', 4298), ('叽', 4299), ('葩', 4300), ('锵', 4301), ('吱', 4302), ('娣', 4303), ('徉', 4304), ('冢', 4305), ('廿', 4306), ('皑', 4307), ('蛹', 4308), ('③', 4309), ('鲑', 4310), ('闳', 4311), ('鳗', 4312), ('椁', 4313), ('嗷', 4314), ('阑', 4315), ('怵', 4316), ('牒', 4317), ('恣', 4318), ('憔', 4319), ('悴', 4320), ('盹', 4321), ('亘', 4322), ('峦', 4323), ('Ⅰ', 4324), ('帚', 4325), ('蝌', 4326), ('歆', 4327), ('槐', 4328), ('蟠', 4329), ('舷', 4330), ('舸', 4331), ('汞', 4332), ('豉', 4333), ('蝓', 4334), ('伫', 4335), ('蘸', 4336), ('灏', 4337), ('掬', 4338), ('咙', 4339), ('酗', 4340), ('噎', 4341), ('蜷', 4342), ('C', 4343), ('贲', 4344), ('&', 4345), ('↓', 4346), ('褂', 4347), ('懋', 4348), ('蚪', 4349), ('蹴', 4350), ('甬', 4351), ('淅', 4352), ('郸', 4353), ('橇', 4354), ('洱', 4355), ('£', 4356), ('〖', 4357), ('〗', 4358), ('孱', 4359), ('雹', 4360), ('幺', 4361), ('谲', 4362), ('糗', 4363), ('谚', 4364), ('酮', 4365), ('颦', 4366), ('岷', 4367), ('摞', 4368), ('忒', 4369), ('赓', 4370), ('霰', 4371), ('∩', 4372), ('啮', 4373), ('磐', 4374), ('恿', 4375), ('帛', 4376), ('悯', 4377), ('旖', 4378), ('搔', 4379), ('俚', 4380), ('偃', 4381), ('恻', 4382), ('烩', 4383), ('娠', 4384), ('吒', 4385), ('坂', 4386), ('痰', 4387), ('T', 4388), ('荥', 4389), ('豌', 4390), ('楹', 4391), ('铱', 4392), ('β', 4393), ('铯', 4394), ('潸', 4395), ('崴', 4396), ('擞', 4397), ('狰', 4398), ('悻', 4399), ('啻', 4400), ('壕', 4401), ('骛', 4402), ('嗤', 4403), ('塾', 4404), ('纫', 4405), ('喳', 4406), ('辘', 4407), ('颢', 4408), ('鎏', 4409), ('嫡', 4410), ('稔', 4411), ('痼', 4412), ('蹩', 4413), ('瘀', 4414), ('迩', 4415), ('孀', 4416), ('戾', 4417), ('鬓', 4418), ('痘', 4419), ('Ⅳ', 4420), ('樾', 4421), ('缰', 4422), ('蔗', 4423), ('栎', 4424), ('傀', 4425), ('卞', 4426), ('蚝', 4427), ('谕', 4428), ('焙', 4429), ('糯', 4430), ('狒', 4431), ('蛞', 4432), ('鹈', 4433), ('鹕', 4434), ('仨', 4435), ('嗨', 4436), ('霎', 4437), ('唔', 4438), ('纾', 4439), ('楞', 4440), ('壑', 4441), ('骊', 4442), ('濑', 4443), ('诬', 4444), ('泱', 4445), ('倜', 4446), ('傣', 4447), ('滟', 4448), ('寮', 4449), ('儡', 4450), ('喱', 4451), ('拮', 4452), ('栓', 4453), ('蕨', 4454), ('≠', 4455), ('粼', 4456), ('蛀', 4457), ('钿', 4458), ('钨', 4459), ('£', 4460), ('疡', 4461), ('吡', 4462), ('纰', 4463), ('瓮', 4464), ('踉', 4465), ('箫', 4466), ('惆', 4467), ('>', 4468), ('樽', 4469), ('仝', 4470), ('嗲', 4471), ('诿', 4472), ('聿', 4473), ('褛', 4474), ('腌', 4475), ('嚏', 4476), ('腴', 4477), ('柑', 4478), ('饬', 4479), ('羿', 4480), ('漕', 4481), ('卤', 4482), ('瘙', 4483), ('≤', 4484), ('渚', 4485), ('俸', 4486), ('喵', 4487), ('泠', 4488), ('挛', 4489), ('鳖', 4490), ('诋', 4491), ('蚌', 4492), ('笠', 4493), ('幡', 4494), ('羯', 4495), ('傥', 4496), ('谒', 4497), ('酉', 4498), ('摺', 4499), ('氘', 4500), ('唰', 4501), ('拚', 4502), ('跄', 4503), ('揶', 4504), ('揄', 4505), ('镌', 4506), ('摈', 4507), ('杵', 4508), ('奄', 4509), ('苜', 4510), ('蓿', 4511), ('阋', 4512), ('庾', 4513), ('麝', 4514), ('囡', 4515), ('鼹', 4516), ('屐', 4517), ('盂', 4518), ('飕', 4519), ('箔', 4520), ('荀', 4521), ('樨', 4522), ('羟', 4523), ('炔', 4524), ('谟', 4525), ('锆', 4526), ('O', 4527), ('鳃', 4528), ('讪', 4529), ('痉', 4530), ('铩', 4531), ('恃', 4532), ('诨', 4533), ('蔫', 4534), ('蹋', 4535), ('阖', 4536), ('桎', 4537), ('梏', 4538), ('胭', 4539), ('殓', 4540), ('绛', 4541), ('鸸', 4542), ('鹋', 4543), ('逵', 4544), ('潼', 4545), ('钴', 4546), ('疱', 4547), ('褥', 4548), ('铬', 4549), ('の', 4550), ('蝰', 4551), ('稷', 4552), ('ä', 4553), ('脲', 4554), ('铍', 4555), ('鲼', 4556), ('撷', 4557), ('耷', 4558), ('赅', 4559), ('呻', 4560), ('牍', 4561), ('涣', 4562), ('N', 4563), ('啕', 4564), ('陲', 4565), ('镣', 4566), ('瞌', 4567), ('酩', 4568), ('嚓', 4569), ('§', 4570), ('吭', 4571), ('罔', 4572), ('粕', 4573), ('脓', 4574), ('绫', 4575), ('燮', 4576), ('陂', 4577), ('麽', 4578), ('銮', 4579), ('钜', 4580), ('皋', 4581), ('谘', 4582), ('*', 4583), ('湍', 4584), ('烊', 4585), ('闾', 4586), ('ン', 4587), ('珙', 4588), ('桀', 4589), ('捶', 4590), ('庖', 4591), ('跺', 4592), ('陛', 4593), ('嗑', 4594), ('擘', 4595), ('焯', 4596), ('唁', 4597), ('怦', 4598), ('忿', 4599), ('刽', 4600), ('"', 4601), ('伉', 4602), ('褚', 4603), ('垠', 4604), ('湫', 4605), ('麋', 4606), ('祯', 4607), ('蟋', 4608), ('蟀', 4609), ('僮', 4610), ('珩', 4611), ('榉', 4612), ('铰', 4613), ('坻', 4614), ('謦', 4615), ('滦', 4616), ('邙', 4617), ('荭', 4618), ('氚', 4619), ('骜', 4620), ('荤', 4621), ('黠', 4622), ('囔', 4623), ('孺', 4624), ('噜', 4625), ('剁', 4626), ('B', 4627), ('秧', 4628), ('脯', 4629), ('捎', 4630), ('瘁', 4631), ('缥', 4632), ('甥', 4633), ('痍', 4634), ('榔', 4635), ('沅', 4636), ('瞑', 4637), ('囿', 4638), ('胛', 4639), ('绥', 4640), ('锹', 4641), ('吏', 4642), ('咦', 4643), ('篝', 4644), ('娑', 4645), ('绉', 4646), ('嗝', 4647), ('胥', 4648), ('腭', 4649), ('淄', 4650), ('顼', 4651), ('颛', 4652), ('÷', 4653), ('亳', 4654), ('瓯', 4655), ('皖', 4656), ('É', 4657), ('鞑', 4658), ('桅', 4659), ('颞', 4660), ('E', 4661), ('熵', 4662), ('砒', 4663), ('谏', 4664), ('撅', 4665), ('岿', 4666), ('蹉', 4667), ('跎', 4668), ('颧', 4669), ('缈', 4670), ('漉', 4671), ('筵', 4672), ('谆', 4673), ('吩', 4674), ('赳', 4675), ('佻', 4676), ('仃', 4677), ('罂', 4678), ('宦', 4679), ('岫', 4680), ('鲈', 4681), ('\xad', 4682), ('²', 4683), ('D', 4684), ('<', 4685), ('诲', 4686), ('唳', 4687), ('鄞', 4688), ('楣', 4689), ('臧', 4690), ('杳', 4691), ('ó', 4692), ('蕲', 4693), ('噔', 4694), ('碉', 4695), ('汩', 4696), ('淞', 4697), ('诏', 4698), ('鼾', 4699), ('搐', 4700), ('飨', 4701), ('沣', 4702), ('龈', 4703), ('酚', 4704), ('氩', 4705), ('锭', 4706), ('皎', 4707), ('鳕', 4708), ('蛎', 4709), ('吮', 4710), ('イ', 4711), ('碴', 4712), ('嫖', 4713), ('髋', 4714), ('琵', 4715), ('鹬', 4716), ('赡', 4717), ('婶', 4718), ('癣', 4719), ('掴', 4720), ('膘', 4721), ('蹑', 4722), ('轫', 4723), ('楦', 4724), ('吠', 4725), ('咿', 4726), ('骡', 4727), ('艮', 4728), ('盥', 4729), ('榫', 4730), (''', 4731), ('ル', 4732), ('倬', 4733), ('泔', 4734), ('€', 4735), ('疣', 4736), ('蝾', 4737), ('V', 4738), ('蛭', 4739), ('汨', 4740), ('淖', 4741), ('抿', 4742), ('皈', 4743), ('袅', 4744), ('徇', 4745), ('踱', 4746), ('婵', 4747), ('柩', 4748), ('讴', 4749), ('叁', 4750), ('彝', 4751), ('炕', 4752), ('斡', 4753), ('褓', 4754), ('醺', 4755), ('岬', 4756), ('芊', 4757), ('仟', 4758), ('戊', 4759), ('氙', 4760), ('笺', 4761), ('龛', 4762), ('镉', 4763), ('畿', 4764), ('逯', 4765), ('荞', 4766), ('敝', 4767), ('綦', 4768), ('揆', 4769), ('耦', 4770), ('S', 4771), ('F', 4772), ('蚩', 4773), ('獠', 4774), ('莆', 4775), ('掖', 4776), ('噤', 4777), ('殒', 4778), ('蓦', 4779), ('嘹', 4780), ('龅', 4781), ('荻', 4782), ('跛', 4783), ('琮', 4784), ('韭', 4785), ('|', 4786), ('琏', 4787), ('葳', 4788), ('璎', 4789), ('觞', 4790), ('妲', 4791), ('庵', 4792), ('嘞', 4793), ('徵', 4794), ('俾', 4795), ('锰', 4796), ('璜', 4797), ('烃', 4798), ('「', 4799), ('」', 4800), ('勐', 4801), ('秣', 4802), ('兖', 4803), ('豺', 4804), ('鲇', 4805), ('ç', 4806), ('洙', 4807), ('鲔', 4808), ('缂', 4809), ('狨', 4810), ('袢', 4811), ('锶', 4812), ('裥', 4813), ('ア', 4814), ('菏', 4815), ('P', 4816), ('镪', 4817), ('鲵', 4818), ('肽', 4819), ('啶', 4820), ('芾', 4821), ('碜', 4822), ('浔', 4823), ('捋', 4824), ('蜇', 4825), ('堑', 4826), ('苒', 4827), ('镭', 4828), ('嬗', 4829), ('捱', 4830), ('棂', 4831), ('栉', 4832), ('暌', 4833), ('鸢', 4834), ('牦', 4835), ('箩', 4836), ('瓒', 4837), ('扪', 4838), ('嵋', 4839), ('叻', 4840), ('沱', 4841), ('邛', 4842), ('锟', 4843), ('驮', 4844), ('隍', 4845), ('≥', 4846), ('樘', 4847), ('桢', 4848), ('磬', 4849), ('颉', 4850), ('圩', 4851), ('滢', 4852), ('犄', 4853), ('蝗', 4854), ('鲱', 4855), ('涔', 4856), ('睑', 4857), ('靼', 4858), ('郇', 4859), ('擢', 4860), ('劾', 4861), ('馏', 4862), ('哌', 4863), ('蝮', 4864), ('鹳', 4865), ('γ', 4866), ('枳', 4867), ('阉', 4868), ('嶙', 4869), ('峋', 4870), ('颀', 4871), ('捻', 4872), ('淬', 4873), ('窠', 4874), ('蕃', 4875), ('芷', 4876), ('榛', 4877), ('娼', 4878), ('濂', 4879), ('悱', 4880), ('旮', 4881), ('骞', 4882), ('藓', 4883), ('褴', 4884), ('桉', 4885), ('仄', 4886), ('襁', 4887), ('溧', 4888), ('ス', 4889), ('枸', 4890), ('\uf06c', 4891), ('秸', 4892), ('ö', 4893), ('螨', 4894), ('莨', 4895), ('秆', 4896), ('ラ', 4897), ('疽', 4898), ('缱', 4899), ('鸩', 4900), ('踮', 4901), ('啖', 4902), ('蜃', 4903), ('谶', 4904), ('椿', 4905), ('湎', 4906), ('氪', 4907), ('Ⅵ', 4908), ('耆', 4909), ('硒', 4910), ('簪', 4911), ('邡', 4912), ('í', 4913), ('洵', 4914), ('睇', 4915), ('崂', 4916), ('旯', 4917), ('囹', 4918), ('圄', 4919), ('骧', 4920), ('绺', 4921), ('儆', 4922), ('鸾', 4923), ('梆', 4924), ('隈', 4925), ('砧', 4926), ('醚', 4927), ('④', 4928), ('厝', 4929), ('郴', 4930), ('锗', 4931), ('螯', 4932), ('ê', 4933), ('赭', 4934), ('ジ', 4935), ('墒', 4936), ('痤', 4937), ('M', 4938), ('岘', 4939), ('藜', 4940), ('肛', 4941), ('X', 4942), ('坳', 4943), ('}', 4944), ('澹', 4945), ('醪', 4946), ('桁', 4947), ('谔', 4948), ('钌', 4949), ('芑', 4950), ('醴', 4951), ('螭', 4952), ('岙', 4953), ('痨', 4954), ('韪', 4955), ('晌', 4956), ('睢', 4957), ('枥', 4958), ('绻', 4959), ('跗', 4960), ('浃', 4961), ('怆', 4962), ('竽', 4963), ('嶂', 4964), ('噼', 4965), ('俎', 4966), ('荏', 4967), ('撵', 4968), ('聩', 4969), ('纨', 4970), ('轱', 4971), ('郗', 4972), ('玷', 4973), ('孑', 4974), ('á', 4975), ('倌', 4976), ('貔', 4977), ('貅', 4978), ('挞', 4979), ('氤', 4980), ('氲', 4981), ('甯', 4982), ('垭', 4983), ('箐', 4984), ('弼', 4985), ('钺', 4986), ('绗', 4987), ('戍', 4988), ('涪', 4989), ('盅', 4990), ('枋', 4991), ('瓴', 4992), ('#', 4993), ('泷', 4994), ('遽', 4995), ('蚬', 4996), ('嵇', 4997), ('箕', 4998), ('柘', 4999)])
def idtext_decode(idtext, vocab_dict):
    """
    将id文本转换为字符文本
    """
    return ' '.join([vocab_dict.get(i,'?') for i in idtext])

def process_text(filename,vocab_path,max_length=1000):
    """
    
    """
    file_data = pd.read_csv(filename,sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
    
    vocab_id = read_vocab(vocab_path)
    
    y = file_data['label'].map(label2id_dict)
    X=[]
    
    for words in file_data['content']:
#         将字符文本转换为id文本
        id_list = [vocab_id[x] for x in words if x in vocab_id]
        
#         将文本pad为固定长度
        id_list_length = len(id_list)
        if id_list_length <= max_length:
            id_list.extend([0]*(max_length - id_list_length)) # PAD
        else:
            id_list = id_list[:max_length]
        X.append(id_list)

    return np.array(X),np.array(y)
process_text('./cnews.train.txt','./vocab.txt')
(array([[ 387, 1197, 2173, ...,    0,    0,    0],
        [ 199,  964,  280, ...,   14,    2,  101],
        [1108,  581,  157, ...,  709,    2,  381],
        ...,
        [1687,   92,  397, ...,  163,   89,  135],
        [1687,   92,  397, ...,    0,    0,    0],
        [ 779,   25,  193, ...,   72,  358,  253]]),
 array([1, 1, 1, ..., 6, 6, 6], dtype=int64))

任务三

机器学习中的分类指标

我们针对一个应用场景建立好一个对应的机器学习模型之后,怎么去评价我们这个模型的好坏呢?这就需要一些指标来判断,下面针对分类问题,简单介绍几个性能指标。

精确率和召回率

准确率和召回率多用于二分类问题,一般可以结合混淆矩阵来分析,如下图所示:
NLP-文本分类(2)_第1张图片
首先解释下上图中的名词:

  • True Positive 真正性:预测为1, 实际为1
  • False Positive 假正性:预测为1, 实际为0
  • True Negative 真反性:预测为0, 实际为0
  • False Negative:假反性:预测为0, 实际为1
精确率(Precision)
  • 精确率就是在测试集上识别正确的正样本除以模型所有预测为正样本数目
P = TP/(TP+FP)
  • 还有一个名词非常容易跟精确率混淆,那就是准确率(accuracy)。准确率就是在测试集上识别正确的所有(正和负都有样本除以测试集数据总样本数
A = (TP+TN)/(TP+FP+FN+TN)
  • 一定要注意两者区别,一个是相对正样本而言,一个相对所有样本而言
召回率(Recall)
  • 召回率就是由预测正确的正样本数目除以测试集中实际正样本数目
R = TP/(TP+FN)
F1分数
  • 而F1是前两者的调和均值,更接近两个数中较小的那个,所有当P和R接近时,F值最大。F1-score多用于数据分布不均衡的问题、推荐系统等。

P-R曲线

  • 一般来说,精确率和召回率是互斥的,也就是说精确率高的话,召回率会变低;召回率高的话,精确率会变低
  • P-R曲线的P就是精确率,R就是召回率。用P作为纵坐标,R作为横坐标,就可以画出P-R曲线。
    NLP-文本分类(2)_第2张图片
  • 其中平衡点就是P=R的点。P-R曲线越往右上角说明模型的性能越好

ROC和AUC

ROC
  • ROC全称“受试者工作特征”(Receiver Operating Characteristic)曲线
  • ROC曲线是以真正类率(true positive rate ,TPR)为纵坐标,以假正类率(false positive rate=FPR)为横坐标,两者的定义如下:

  • 个优秀分类器对应的ROC曲线应该尽量靠近单位方形的左上角。
  • ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。
AUC
  • AUC为ROC曲线下的面积,AUC值越大的分类器,正确率越高
  • AUC的物理意义为,随机给定一个正样本,一个负样本,使用分类器进行预测,设判断正样本为正的概率为P1,判断负样本为正的概率为P2,P1>P2的概率就是AUC值。

你可能感兴趣的:(NLP)