- 车辆检测与识别:车辆分类_(9).车辆分类模型的评估与优化
zhubeibei168
机器人(二)分类数据挖掘人工智能计算机视觉机器学习视频监控
车辆分类模型的评估与优化在车辆检测与识别领域,车辆分类模型的评估与优化是确保模型性能和可靠性的关键步骤。本节将详细介绍如何评估车辆分类模型的性能,并提供一些优化技术,以提高模型的准确性和效率。模型评估指标1.准确率(Accuracy)准确率是最直观的评估指标,表示分类器正确分类的样本占总样本的比例。然而,在不平衡数据集上,准确率可能具有误导性。fromsklearn.metricsimportac
- win7下python3.6通过pip安装scipy报错的解决办法
青松一夏
python
一、问题描述通过pip方式安装了numpy和sklearn,但是sklearn需要依赖于scipy,但当通过pip方式安装scipy时,报错:numpy.distutils.system_info.NotFoundError:nolapack/blasresourcesfound按照网上的教程,并没有找到真正的解决办法,后来我是通过如下方式解决的。二、我的解决方案(1)首先卸载numpypipun
- 【python 机器学习】sklearn数据集的使用
人才程序员
python机器学习sklearn人工智能深度学习神经网络目标检测
文章目录sklearn数据集的使用1.`sklearn`内置数据集2.导入`sklearn`数据集3.加载和使用Iris数据集3.1加载数据3.2查看数据3.3使用数据集进行分类任务4.加载和使用Digits数据集4.1加载数据4.2查看数据4.3使用数据集进行分类任务5.加载和使用BreastCancer数据集5.1加载数据5.2查看数据5.3使用数据集进行分类任务6.总结sklearn数据集的
- 【sklearn 01】人工智能概述
@金色海岸
人工智能sklearnpython
一、人工智能,机器学习,深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围,长远目标是让机器实现人工智能,但目前我们仍处在非常初始的阶段,甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型,是实现人工智能的手段之一,也是目前最主流的人工智能实现方法深度学习则是机器学习的分支,超过8层的神经网络模型就叫深度学习,深度即层数。深度学习目前在语音、图像等领域取得很好的效果
- 【sklearn 05】sklearn功能模块
@金色海岸
sklearn人工智能python
sklearn功能模块分类:识别某个对象属于那个类别回归:预测与对象相关联的连续值属性聚类:将相似对象自动分组降维:减少要考虑的随机变量的数量模型选择:比较、验证、选择参数和模型预处理:特征提取和归一化
- 【sklearn 07】sklearn工艺流程
@金色海岸
人工智能sklearnpython机器学习
01数据的获取02数据预处理03特征的提取04特征的选择05模型的训练06模型的评估07模型的优化
- 【人工智能】【Python】在Scikit-Learn中使用决策树算法(ID3和CART)
SmallBambooCode
机器学习人工智能python算法scikit-learn决策树机器学习ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
- 【sklearn 03】逻辑回归、决策树、支持向量机
@金色海岸
sklearn逻辑回归决策树
逻辑回归、决策树、支持向量机-逻辑回归logisticsregression(逻辑回归)算法是经典的分类算法,基本思想是构造一个概率的拟合函数。决策树决策树的基本思想是根据样例去推断其背后的树形知识表征支持向量机支持向量机SVM(supportvectormachine)的基本思想是寻找最大的间隔的分割超平面。离分割超平面最近的这些样本点称为支持向量机
- 训练数据重复采样,让正负样本比例1:1
kimi-222
机器学习人工智能深度学习
详细解释resample函数:resample函数来自sklearn.utils,用于从数据集中重新抽样。replace=True表示允许重复抽样,即同一个样本可以被多次选中。n_samples指定抽样的数量。确保训练集数量相同:通过resample函数,你可以确保正训练集和负训练集的数量相同,即使其中一个集的数量小于另一个集的数量。如果n_train_num小于max_train_num,res
- 【sklearn 04】DNN、CNN、RNN
@金色海岸
sklearndnncnn
DNNDNN(DeepNeuralNetworks,深度神经网络)是一种相对浅层机器学习模型具有更多参数,需要更多数据进行训练的机器学习算法CNNCNN(convolutionalNeuralNetworks,卷积神经网络)是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取,通过池化层进行降维,相比较全连接的神经网络,卷积神经网络降低了模型复杂度,减少了模型的参数,
- 【sklearn 02】监督学习、非监督下学习、强化学习
@金色海岸
sklearn学习人工智能
监督学习、非监督学习、强化学习**机器学习通常分为无监督学习、监督学习和强化学习三类。-第一类:无监督学习(unsupervisedlearning),指的是从信息出发自动寻找规律,分析数据的结构,常见的无监督学习任务有聚类、降维、密度估计、关联分析等。-第二类:监督学习(supervisedlearning),监督学习指的是使用带标签的数据去训练模型,并预测未知数据的标签。监督学习有两种,当预测
- 【机器学习】skit-learn中LSI模型的实现
一穷二白到年薪百万
机器学习pythonsklearn
参考文献[1]sklearn_api.lsimodel–ScikitlearnwrapperforLatentSemanticIndexing[2]Pythonmodels.LsiModel方法代码示例
- python手写kmeans算法
菜鸟懿
机器学习聚类算法python
kmean聚类是最基础和常见的算法,工程上使用比较常见,spark,sklearn都有实现,本文手写实现kmeans#!/usr/bin/pythonimportsysimportrandomimportmathdefcreate_rand_points(max_x,max_y,count):"""Createcountpoints(0-x),(0-y)."""points=[]foriinran
- 无网络entos7报错ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found更新glibc
夏离
网络
最近在尝试使用sklearn的升级版cuml,因为是一台没有连接互联网的gpu机器,所以构建cuml环境过程很坎坷,需要各种将各种whl包在线下载后上传到服务器中。当我终于解决完包的互相依赖问题后,在importcuml时候遇到一个错误:ImportError:/lib64/libm.so.6:version`GLIBC_2.27’notfound(requiredby/anaconda3/env
- 基于python的手写数字识别knn_用sklearn中的KNN实现Kaggle手写数字识别
普和司
importcsvfromsklearnimportneighbors#导入训练数据和测试数据defloadData(filename1,filename2,trainDataSet,trainTargetSet,testDataSet):withopen(filename1,'r')ascsvfile1:lines1=csv.reader(csvfile1)dataSet=list(lines1
- 基于线性回归和多项式回归的完整代码
yzx991013
回归线性回归算法
1.导入必要库importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.linear_modelimportLinearRegressionfromsklearn.preprocessingimportPolynomialFeaturesfromsklearn.pipelineimportPipelinefromsklearn.metricsi
- Bert的使用
巨鹿..
深度学习记录bert人工智能深度学习
一、Data.py#data负责产生两个dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split#给X,Y和分割比例,分割出来一个训练集和验证机的X,Yimporttorchdefread_file(path):data=[]label=[]with
- sklearn 支持向量机实践总结
可爱的红薯
pythonsklearn支持向量机pythonsklearn支持向量机
转自http://www.cnblogs.com/pinard/p/6117515.html之前通过一个系列对支持向量机(以下简称SVM)算法的原理做了一个总结,本文从实践的角度对scikit-learnSVM算法库的使用做一个小结。scikit-learnSVM算法库封装了libsvm和liblinear的实现,仅仅重写了算法了接口部分。1.scikit-learnSVM算法库使用概述sciki
- 加州房价数据集加载出错:无法获取数据,HTTP Error : Forbidden
code_welike
http网络协议网络python
加州房价数据集加载出错:无法获取数据,HTTPError:Forbidden在使用Python的sklearn库中,我们可以很方便地获取一些常用的数据集。在加载加州房价数据集时,有时会遇到“HTTPError:Forbidden”的错误提示,导致无法获取数据。这个问题的出现可能是因为我们的IP被限制了。那么该如何解决这个问题呢?解决方案:1.更换IP地址:首先,我们应该排除IP被限制的可能性。可以
- 解决Python中加载sklearn加州房价数据集出错的问题
冰雪之境
pythonsklearn开发语言Python
解决Python中加载sklearn加州房价数据集出错的问题在使用Python的scikit-learn库进行机器学习任务时,我们经常需要加载各种数据集。其中,加州房价数据集是一个常用的示例数据集之一,用于回归问题的训练和测试。然而,有时在加载加州房价数据集时可能会遇到HTTP错误的问题,具体表现为"HTTPError:HTTPError:Forbidden"。本文将介绍如何解决这个问题,并提供相
- 【完整版解决方案】sklearn加州房价数据集出错 housing = fetch_california_housing() HTTPError: HTTP Error 403: Forbidden
getalong
sklearn人工智能数据仓库python
完整解决方案(一键复制)代码替换housing=fetch_california_housing()翻了几条解决方案要么不全,要么收费,烦死个人下面给出完整解决方案!!!1、下载数据集原始数据集:cal_housing.tgz2、放置数据集查找本地位置,执行代码后进入目标文件夹。fromsklearnimportdatasetsdata_home=datasets.get_data_home()放
- sklearn库安装
吧啦吧啦吡叭卜
sklearn人工智能python
已经安装了numpy、matplotlib、scipy这些库一直报错×pythonsetup.pyegg_infodidnotrunsuccessfully.│exitcode:1╰─>[15linesofoutput]The'sklearn'PyPIpackageisdeprecated,use'scikit-learn'ratherthan'sklearn'forpipcommands.Her
- 深度学习分类回归(衣帽数据集)
何仙鸟
深度学习分类回归
一、步骤1加载数据集fashion_minst2搭建classNeuralNetwork模型3设置损失函数,优化器4编写评估函数5编写训练函数6开始训练7绘制损失,准确率曲线二、代码导包,打印版本号:importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportsklearnimport
- [Machine Learning] K-means算法
进阶的小蜉蝣
machinelearning算法kmeans机器学习
HuBERT预训练过程中会用到K-means算法,本文简单介绍一下K-means算法的基本流程。简单地讲,K-means就是给特征向量集进行聚类。给定一个特征向量集{X}和目标聚类数N,K-means会不断迭代,直到X被分成N类,且每一类的中心点不再明显变化。先看一个简单例子:fromsklearn.clusterimportKMeansimportnumpyasnpimportmatplotli
- 机器学习之学习笔记
孤城laugh
机器学习学习笔记人工智能python
机器学习-学习笔记1.简介2.算法3.特征工程3.1数据集3.2特征提取3.3特征预处理3.4特征降维4.分类算法4.1`sklearn`转换器和估计器4.2K-近邻算法(KNN)4.3模型选择与调优4.4朴素贝叶斯算法4.5决策树4.6集成学习方法之随机森林5.回归算法5.1线性回归5.2过拟合与欠拟合5.3岭回归5.4逻辑回归(实际上是分类算法,用于解决二分类问题)6.聚类算法1.无监督学习2
- kNN算法:对红酒数据进行分类
阿拉保
算法分类数据挖掘
第2关使用sklearn中的kNN算法进行分类fromsklearn.neighborsimportKNeighborsClassifierdefclassification(train_feature,train_label,test_feature):'''使用KNeighborsClassifier对test_feature进行分类:paramtrain_feature:训练集数据:para
- MATLAB基础应用精讲-【数模应用】主成分(pca)分析(附python代码实现)
林聪木
matlab人工智能大数据
目录前言知识储备降维概述算法原理什么是PCAPCA降维过程PCA算法数学步骤选择主成分个数(即k的值)sklearn中参数的解释数学模型协方差协方差矩阵编辑编辑原理推导编辑编辑编辑编辑实际操作主成分分析的计算方法方法1.协方差+特征值分解方法2:奇异值分解对比不同方法计算效率物理意义算法步骤SPSSAU主成分(pca)分析说明1、信息浓缩2、权重计算3、综合得分【综合竞争力】疑难解惑成分得分后用于
- python代码实现支持神经网络对鸢尾花分类
邀_灼灼其华
机器学习及概率统计python神经网络分类sklearn
1、导入支持向量机模型,划分数据集fromsklearnimportdatasetsfromsklearnimportsvmiris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices=np.random.permutation(len(iris_x))iris_x_train=iris_x[indices[:-10]]iri
- 构建神经网络之sklearn(完善)
邪恶的贝利亚
神经网络sklearn机器学习
1.数据预处理1.缺失值importpandasaspd#假设我们有一个DataFramedfprint(df.isnull().sum())#查看每一列缺失值的数量数值型数据:fromsklearn.imputeimportSimpleImputer#对于数值型数据,使用均值填充imputer=SimpleImputer(strategy='mean')#可选:'mean','median','
- 【Python-ML】SKlearn库性能指标ROC-AUC
fjssharpsword
Bigdatapython专栏
#-*-coding:utf-8-*-'''Createdon2018年1月19日@author:Jason.F@summary:ROC(receiveroperatorcharacteristic,基于模型真正率和假正率等性能指标评估分类模型'''importpandasaspdfromsklearn.preprocessingimportLabelEncoderfromsklearn.cros
- scala的option和some
矮蛋蛋
编程scala
原文地址:
http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html
对于学习 Scala 的 Java™ 开发人员来说,对象是一个比较自然、简单的入口点。在 本系列 前几期文章中,我介绍了 Scala 中一些面向对象的编程方法,这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念,找到其缺点
- NullPointerException
Cb123456
androidBaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference
出现以上异常.然后就在baidu上
- PHP使用文件和目录
天子之骄
php文件和目录读取和写入php验证文件php锁定文件
PHP使用文件和目录
1.使用include()包含文件
(1):使用include()从一个被包含文档返回一个值
(2):在控制结构中使用include()
include_once()函数需要一个包含文件的路径,此外,第一次调用它的情况和include()一样,如果在脚本执行中再次对同一个文件调用,那么这个文件不会再次包含。
在php.ini文件中设置
- SQL SELECT DISTINCT 语句
何必如此
sql
SELECT DISTINCT 语句用于返回唯一不同的值。
SQL SELECT DISTINCT 语句
在表中,一个列可能会包含多个重复值,有时您也许希望仅仅列出不同(distinct)的值。
DISTINCT 关键词用于返回唯一不同的值。
SQL SELECT DISTINCT 语法
SELECT DISTINCT column_name,column_name
F
- java冒泡排序
3213213333332132
java冒泡排序
package com.algorithm;
/**
* @Description 冒泡
* @author FuJianyong
* 2015-1-22上午09:58:39
*/
public class MaoPao {
public static void main(String[] args) {
int[] mao = {17,50,26,18,9,10
- struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题!
7454103
DAOspringAjaxjsonqq
struts2.18 出来有段时间了! (貌似是 稳定版)
闲时研究下下! 貌似 sruts2 搭配 json 做 ajax 很吃香!
实践了下下! 不当之处请绕过! 呵呵
网上一大堆 struts2+json 不过大多的json 插件 都是 jsonplugin.34.jar
strut
- struts2 数据标签说明
darkranger
jspbeanstrutsservletScheme
数据标签主要用于提供各种数据访问相关的功能,包括显示一个Action里的属性,以及生成国际化输出等功能
数据标签主要包括:
action :该标签用于在JSP页面中直接调用一个Action,通过指定executeResult参数,还可将该Action的处理结果包含到本页面来。
bean :该标签用于创建一个javabean实例。如果指定了id属性,则可以将创建的javabean实例放入Sta
- 链表.简单的链表节点构建
aijuans
编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h"
#define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}}
typedef struct node { &nbs
- tomcat下jndi的三种配置方式
avords
tomcat
jndi(Java Naming and Directory Interface,Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来,使得我们可以用名称
访问对象。目录服务是一种命名服务,在这种服务里,对象不但有名称,还有属性。
tomcat配置
- 关于敏捷的一些想法
houxinyou
敏捷
从网上看到这样一句话:“敏捷开发的最重要目标就是:满足用户多变的需求,说白了就是最大程度的让客户满意。”
感觉表达的不太清楚。
感觉容易被人误解的地方主要在“用户多变的需求”上。
第一种多变,实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的,只是比较多,也比较混乱,用户一般只能了解自己的那一小部分,所以没有用户能清楚的表达出整体需求。而由于各种条件的,用户表达自己那一部分时也有
- 富养还是穷养,决定孩子的一生
bijian1013
教育人生
是什么决定孩子未来物质能否丰盛?为什么说寒门很难出贵子,三代才能出贵族?真的是父母必须有钱,才能大概率保证孩子未来富有吗?-----作者:@李雪爱与自由
事实并非由物质决定,而是由心灵决定。一朋友富有而且修养气质很好,兄弟姐妹也都如此。她的童年时代,物质上大家都很贫乏,但妈妈总是保持生活中的美感,时不时给孩子们带回一些美好小玩意,从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
- oracle 日期时间格式转化
征客丶
oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP;
SYSDATE:不支持毫秒,取的是系统时间;
SYSTIMESTAMP:支持毫秒,日期,时间是给时区转换的,秒和毫秒是取的系统的。
日期转字符窜:
一、不取毫秒:
TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS')
简要说明,
YYYY 年
MM 月
- 【Scala六】分析Spark源代码总结的Scala语法四
bit1129
scala
1. apply语法
FileShuffleBlockManager中定义的类ShuffleFileGroup,定义:
private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) {
...
def apply(bucketId
- Erlang中有意思的bug
bookjovi
erlang
代码中常有一些很搞笑的bug,如下面的一行代码被调用两次(Erlang beam)
commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b
Author: Jovi Zhang <
[email protected]>
Date: Fri Dec 2 16:19:22 2011 +0100
erts:
- 移位打印10进制数转16进制-2008-08-18
ljy325
java基础
/**
* Description 移位打印10进制的16进制形式
* Creation Date 15-08-2008 9:00
* @author 卢俊宇
* @version 1.0
*
*/
public class PrintHex {
// 备选字符
static final char di
- 读《研磨设计模式》-代码笔记-组合模式
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
import java.util.ArrayList;
import java.util.List;
abstract class Component {
public abstract void printStruct(Str
- 利用cmd命令将.class文件打包成jar
chenyu19891124
cmdjar
cmd命令打jar是如下实现:
在运行里输入cmd,利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes)
现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作:
cd D: 回车
cd workspace/prpal
- [原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明
comsci
eclipse设计模式算法工作swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明
&nb
- SecureCRT右键粘贴的设置
daizj
secureCRT右键粘贴
一般都习惯鼠标右键自动粘贴的功能,对于SecureCRT6.7.5 ,这个功能也已经是默认配置了。
老版本的SecureCRT其实也有这个功能,只是不是默认设置,很多人不知道罢了。
菜单:
Options->Global Options ...->Terminal
右边有个Mouse的选项块。
Copy on Select
Paste on Right/Middle
- Linux 软链接和硬链接
dongwei_6688
linux
1.Linux链接概念Linux链接分两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接。
【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Index)。在Linux中,多个文件名指向同一索引节点是存在的。一般这种连
- DIV底部自适应
dcj3sjt126com
JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml&q
- Centos6.5使用yum安装mysql——快速上手必备
dcj3sjt126com
mysql
第1步、yum安装mysql
[root@stonex ~]# yum -y install mysql-server
安装结果:
Installed:
mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
- 如何调试JDK源码
frank1234
jdk
相信各位小伙伴们跟我一样,想通过JDK源码来学习Java,比如collections包,java.util.concurrent包。
可惜的是sun提供的jdk并不能查看运行中的局部变量,需要重新编译一下rt.jar。
下面是编译jdk的具体步骤:
1.把C:\java\jdk1.6.0_26\sr
- Maximal Rectangle
hcx2013
max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area.
public class Solution {
public int maximalRectangle(char[][] matrix)
- Spring MVC测试框架详解——服务端测试
jinnianshilongnian
spring mvc test
随着RESTful Web Service的流行,测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架,如果版本低于3.2,请使用spring-test-mvc项目(合并到spring3.2中了)。
Spring MVC测试框架提供了对服务器端和客户端(基于RestTemplate的客户端)提供了支持。
&nbs
- Linux64位操作系统(CentOS6.6)上如何编译hadoop2.4.0
liyong0802
hadoop
一、准备编译软件
1.在官网下载jdk1.7、maven3.2.1、ant1.9.4,解压设置好环境变量就可以用。
环境变量设置如下:
(1)执行vim /etc/profile
(2)在文件尾部加入:
export JAVA_HOME=/home/spark/jdk1.7
export MAVEN_HOME=/ho
- StatusBar 字体白色
pangyulei
status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent];
/*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
- 如何分析Java虚拟机死锁
sesame
javathreadoracle虚拟机jdbc
英文资料:
Thread Dump and Concurrency Locks
Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
- 位运算简介及实用技巧(一):基础篇
tw_wangzhengquan
位运算
http://www.matrix67.com/blog/archives/263
去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一,很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料,学习到了更多关于位运算的知识,有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章,与其说是原来那篇文章的follow-up,不如说是一个r
- jsearch的索引文件结构
yangshangchuan
搜索引擎jsearch全文检索信息检索word分词
jsearch是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。
jsearch的索引文件结构定义如下:
1、一个词的索引由=分割的三部分组成: 第一部分是词 第二部分是这个词在多少