weixin_30700977

数据挖掘：基于朴素贝叶斯分类算法的文本分类实践

前言：

如果你想对一个陌生的文本进行分类处理，例如新闻、游戏或是编程相关类别。那么贝叶斯分类算法应该正是你所要找的了。贝叶斯分类算法是统计学中的一种分类方法，它利用概率论中的贝叶斯公式进行扩展。所以，这里建议那些没有概率功底或是对概率论已经忘记差不多的读者可以先去学习或是温习一下《概率论与数理统计》中的条件概率那一个章节。

由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值，而此假设在实际情况中经常是不成立的，因此其分类准确率可能会下降。为此，就衍生出许多降低独立性假设的贝叶斯分类算法，如TAN(tree augmented Bayes network)算法。关于TAN算法不在本文的叙述范围之内，这里我们不作讨论。

下面我们就针对朴素贝叶斯分类算法，进行原理浅析和文本分类实践(这里笔者使用Java语言开发)。

本文链接：http://blog.csdn.net/lemon_tree12138/article/details/48520315 --Coding-Naga

--转载请注明出处

公式说明：

1.全概率公式：

2.贝叶斯公式：

上面的两个公式是最简单的两个公式说明，旨在简化理解。

思路分析：

在开始理解贝叶斯算法之前，独立于本文之外。如果有人问你如何让程序给一篇陌生的文章分类？你要怎么做呢？

我能想到的就是以关键词来区分。比如分类为邮箱的类别中，我选取三个关键词：邮箱、邮件和收发。然后使用这三个关键词在文章中去依次查找，统计出此三个关键词总共出现了多少次，再与其他的类别进行比较。次数最多的即为这篇文章的分类。如果要再精确一些，可以采用不同权重的方式，上面说的方法，权重为1。如果采用权重的策略，那么这里就不是出现次数最多的类别了，而是以计分的方式，次数*权重并累加。最高分的类别即为本文的分类。

当然，这是一种解决方法。这个其实跟贝叶斯分类算法还是有一些类似的，有了这种想法，再去理解贝叶斯就容易得多了。

流程说明：

朴素贝叶斯分类的流程可以由下图表示(图片来源网络)：

针对上图有一些需要说明的地方，首先这张流程图的确可以很清楚地表达我们朴素贝叶斯模型的流程。需要注意的是，这里如果P(x|yi)中的x如果是在训练集中不存在的一个特征值，我们是无法进行计算它的先验概率的。不过还好，因为x在训练中不存在，那么我们就可以粗略认为，x是一个与yi无关的值，即概率为0。

代码展示：

1.准备阶段：

在准备阶段有两个步骤，确定特征属性和获取样本。确定特征属性这个会因个人对分类的理解以及需求不同而不同；而获取样本则是比较简单的读取文件。如下：

/**
     * 读取训练文档中的训练数据
     * 并进行封装
     * 
     * @param filePath
     *          训练文档的路径
     * @return
     *          训练数据集
     */
    public static ArrayList> read(String filePath) {
        if (Tools.isEmptyString(filePath)) {
            return null;
        }
 
        ArrayList> trainningSet = new  ArrayList>();
        List datas = readFile(filePath);
        ArrayList singleTrainning = null;
        for (int i = 0; i < datas.size(); i++) {
            String[] characteristicValues = datas.get(i).split(" ");
            singleTrainning = new ArrayList();
            for (int j = 0; j < characteristicValues.length; j++) {
                if (!Tools.isEmptyString(characteristicValues[j])) {
                    singleTrainning.add(characteristicValues[j]);
                }
            }
            
            trainningSet.add(singleTrainning);
        }
        
        return trainningSet;
    }

2.训练阶段：

在训练阶段，我们就是预先计算出一些先验概率，这些先验概率是与待计算的特征值x无关的。不关这个x是否在训练集中存在，都是无关的，这个在前面已经说过了。那么先验概率主要有P(classify),P(key)和P(key|classify)。

P(classify):

/**
     * 预先计算出每个分类出现的概率
     * 
     * @param map
     *          所有分类总的数据集
     * @param classifyProbablityMap
     *          每个分类classify的出现概率
     */
    public void preCalculateClassifyProbablity(Map>> map, Map classifyProbablityMap) {
        if (map == null || classifyProbablityMap == null) {
            return;
        }
        
        Object[] classes = map.keySet().toArray();
        int totleClassifyCount = 0;
        for (int i = 0; i < classes.length; i++) {
            totleClassifyCount += map.get(classes[i].toString()).size();
        }
        
        if (totleClassifyCount == 0) {
            return;
        }
        
        for (int i = 0; i < classes.length; i++) {
            if (!classifyProbablityMap.containsKey(classes[i])) {
                classifyProbablityMap.put(classes[i].toString(), 1.0 * map.get(classes[i]).size() / totleClassifyCount);
            }
        }
    }

P(key):

/**
     * 预先计算出每个关键字出现的概率
     * TODO
     * @param map
     *          所有分类总的数据集
     * @param keyProbablityMap
     *          每个特征值key的出现概率
     */
    public void preCalculateKeyProbablity(Map>> map, Map keyProbablityMap) {
        if (map == null || keyProbablityMap == null) {
            return;
        }
        
        Object[] classes = map.keySet().toArray();
        String key = "";
        int totleKeyCount = 0;
        for (int i = 0; i < map.size(); i++) {
            ArrayList> classify = map.get(classes[i]);
            ArrayList featureVector = null; // 分类中的某一特征向量
            for (int j = 0; j < classify.size(); j++) {
                featureVector = classify.get(j);
                for (int k = 0; k < featureVector.size(); k++) {
                    key = featureVector.get(k);
                    totleKeyCount++;
                    if (keyProbablityMap.get(key) == null) {
                        keyProbablityMap.put(key, 1.0);
                    } else {
                        keyProbablityMap.replace(key, keyProbablityMap.get(key) + 1.0);
                    }
                }
            }
        }
        
        if (totleKeyCount == 0) {
            return;
        }
        
        Set keys = keyProbablityMap.keySet();
        for (String string : keys) {
            keyProbablityMap.replace(string, keyProbablityMap.get(string) / totleKeyCount);
        }
    }

P(key|classify):

/**
     * 计算先验概率P(key|classify)
     * 
     * @param map
     *          所有分类总的数据集
     * @param keyClassifyMap
     *          先验概率P(key|classify)的所有数据集
     */
    public void preCalculateKeyInClassifyProbablity(Map>> map, Map> keyClassifyMap) {
        if (map == null || keyClassifyMap == null) {
            return;
        }
        
        // 统计每种分类共有多少个特征值
        Map keyCountMap = new HashMap();
        
        // 统计key｜classify的个数
        Object[] classes = map.keySet().toArray();
        Map vector = null;
        for (int i = 0; i < map.size(); i++) {
            ArrayList> classify = map.get(classes[i]);
            for (int j = 0; j < classify.size(); j++) {
                ArrayList featureVector = classify.get(j);
                for (int k = 0; k < featureVector.size(); k++) {
                    // 统计特征值
                    if (keyClassifyMap.containsKey(classes[i])) {
                        if (keyClassifyMap.get(classes[i]).containsKey(featureVector.get(k))) {
                            double lastValue = keyClassifyMap.get(classes[i]).get(featureVector.get(k));
                            vector = keyClassifyMap.get(classes[i]);
                            vector.put(featureVector.get(k), 1.0 + lastValue);
                            keyClassifyMap.replace(classes[i].toString(), vector);
                        } else {
                            vector = keyClassifyMap.get(classes[i]);
                            vector.put(featureVector.get(k), 1.0);
                            keyClassifyMap.put(classes[i].toString(), vector);
                        }
                    } else {
                        vector = new HashMap();
                        vector.put(featureVector.get(k), 1.0);
                        keyClassifyMap.put(classes[i].toString(), vector);
                    }
                    
                    // 统计每种分类共有多少个特征值 keyCountMap
                    if (keyCountMap.containsKey(classes[i])) {
                        keyCountMap.put(classes[i].toString(), 1.0 + keyCountMap.get(classes[i]));
                    } else {
                        keyCountMap.put(classes[i].toString(), 1.0);
                    }
                }
            }
        }
        
        // 遍历keyClassifyMap计算概率
        Map keyVector = null;
        Object[] keys = null;
        for (int i = 0; i < keyClassifyMap.size(); i++) {
            keyVector = keyClassifyMap.get(classes[i]);
            keys = keyVector.keySet().toArray();
            for (int j = 0; j < keyVector.size(); j++) {
                keyVector.put(keys[j].toString(), keyVector.get(keys[j]) / keyCountMap.get(classes[i]));
            }
            
            keyClassifyMap.put(classes[i].toString(), keyVector);
        }
    }

3.应用阶段：

对于贝叶斯的应用，即是针对上面的贝叶斯公式进行的。即计算P(classify|key)=?.

也就是说，在特征值为key时，分类为classify的概率为多少？这是我们所求的。这一步很简单，只要我们拿到公式右边的三个概率值，就可以计算出贝叶斯公式左边的值：

/**
     * 计算在出现key的情况下，是分类classify的概率 [ P(Classify | key) ]
     * 
     * @param map
     *          所有分类的数据集
     * @param classify
     *          某一特定分类
     * @param key
     *          某一特定特征
     * @return
     *          P(Classify | key)
     */
    private double calProbabilityClassificationInKey(Map>> map, Map classPMap, Map keyPMap, Map> keyClassifyMap, String classify, String key) {
        double pkc = (keyClassifyMap.get(classify).containsKey(key) ? keyClassifyMap.get(classify).get(key) : 0); // p(key|classify)
        double pc = classPMap.get(classify); // p(classify)
        double pk = keyPMap.get(key) == null ? 0 : keyPMap.get(key); // p(key)
        double pck = 0.0; // p(classify | key)
        
        if (pk == 0) {
            pck = 0;
        } else {
            pck = (pkc * pc / pk) * pk;
        }
        
        return pck;
    }

以上就是本文关于贝叶斯分类算法的全部内容。如有疑问可以留言，大家一起讨论学习。

参考：

1.《概率论与数理统计》(第四版) 浙大版

2.《数据之美》

3.http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html

4.http://www.ruanyifeng.com/blog/2013/12/naive_bayes_classifier.html

附件源码：

下面的代码是最初的一个版本，大家可以结合本文对代码进行修改。

http://download.csdn.net/detail/u013761665/9114225

转载于:https://www.cnblogs.com/fengju/p/6336044.html

你可能感兴趣的:(数据挖掘：基于朴素贝叶斯分类算法的文本分类实践)

常院士：您好。祝您2008年身体健康，事业顺利。我是西安交通大学生物工程专业的一名大三学生。我希望能考取您的研究生，做膜蛋白的解析工作，并且想于今年暑假到您实验室参力学AI有限元人工智能
常院士：您好。祝您2008年身体健康，事业顺利。我是西安交通大学生物工程专业的一名大三学生。我希望能考取您的研究生，做膜蛋白的解析工作，并且想于今年暑假到您实验室参观与学习。希望您能接纳。我一直对膜蛋白的三维结构和功能解析很感兴趣，高中时听说人类破解了“基因天书”，我感到很震惊。现在才知道要想破解“人类天书”，路还很长，而且首先得明确什么是关键。不错，就是蛋白质。蛋白质是构成人体的重要组分，其作用
pjsip pjsua_media_config 结构体说明小gpt& Pjsip 音视频 qt c++
clock_rate描述：设置会议桥（conferencebridge）的时钟频率（采样率）。默认值：0（使用默认值PJSUA_DEFAULT_CLOCK_RATE，通常为16kHz）。作用：影响音频的采样率，常见值有8000（8kHz）、16000（16kHz）、48000（48kHz）等。snd_clock_rate描述：设置音频设备的时钟频率（采样率）。默认值：0（使用会议桥的时钟频率）。作
MATLAB 操作指南（结尾附实操案例） vvvae1234 信息可视化
一、MATLAB简介MATLAB（矩阵实验室）是一个高级技术计算语言和交互环境，它主要用于数值计算、数据分析、算法开发和可视化。MATLAB的核心功能是矩阵运算，它能够处理向量和矩阵为中心的数学问题，方便用户进行算法的开发和数据可视化。主要特点高效的数值计算：MATLAB内置了许多用于数学和工程计算的函数，用户可以轻松地进行数值运算。可视化功能：MATLAB提供了丰富的工具，用于生成各种类型的图形
【JS性能优化黑魔法】从8秒到0.8秒的奇迹の逆袭（祖传代码大改造）—— 让老板跪下喊爸爸的极致优化指南 vvvae1234 github
️第一章：渲染の禁忌仪式（重绘与回流）场景：购物车动画卡成PPT//菜鸟写法（每秒60次全局地震）setInterval(()=>{cartItems.forEach(item=>{item.style.top=`${Math.sin(Date.now())*10}px`;//持续触发回流});},16);//老司机优化（GPU加速の奥义）functionsmoothAnimation(){req
10个工具让你秒变数字艺术家，小白也能画出百万点赞神图 ivwdcwso AI AI绘画副业变现 Midjourney教程
一、新手必看：3步出神图的核心心法1.咒语炼金术（Prompt魔法公式）#万能结构：画风+主体+细节+神级后缀"8kCG,(赛博朋克美少女:1.3),霓虹机械臂,雨夜东京街景,宫崎骏风格--ar16:9--niji6--style4b"2.参数调教秘籍参数效果推荐值--ar画面比例9:16（手机壁纸）--chaos创意随机性30-80（越高越抽象）--stylize艺术化程度500-1000（漫画
【后端】【django】Django DRF `@action` 详解：自定义 ViewSet 方法患得患失949 django知识面试考题专栏（前后端）django sqlite python
DjangoDRF@action详解：自定义ViewSet方法在DjangoRESTFramework（DRF）中，@action装饰器用于为ViewSet添加自定义的API端点。相比于update、create等默认方法，@action允许我们定义更加清晰、语义化的API访问路径，使接口更加易读且符合RESTful设计原则。1.@action的作用@action主要用于自定义API端点，避免滥用
SQL必知必会40-SQLite：为什么微信用SQLite存储聊天记录？程序员zhi路 MYSQL专栏 sql sqlite jvm
我在上一篇文章中讲了WebSQL，当我们在Chrome、Safari和Firefox等浏览器客户端中使用WebSQL时，会直接操作SQLite。实际上SQLite本身是一个嵌入式的开源数据库引擎，大小只有3M左右，可以将整个SQLite嵌入到应用中，而不用采用传统的客户端／服务器（Client/Server）的架构。这样做的好处就是非常轻便，在许多智能设备和应用中都可以使用SQLite，比如微信就
游戏策划学习（二）---游戏策划与开发方法---常见的游戏类型靖簳策划游戏策划
目录1.动作类游戏（ACT-ActionGame）2.策略类游戏（SLG-StrategyGame）3.角色扮演类游戏（RPG-RolePlayingGame）4.模拟经营类游戏（SIM-SimulationGame）5.冒险类游戏（AVG-AdventureGame）6.益智类游戏（EG-EducationalGame）7.体育类游戏（SG-SportGame）8.射击类游戏（STG-Shoot
doris：SQL 方言兼容向阳1218 大数据 doris
提示从2.1版本开始，Doris可以支持多种SQL方言，如Presto、Trino、Hive、PostgreSQL、Spark、Clickhouse等等。通过这个功能，用户可以直接使用对应的SQL方言查询Doris中的数据，方便用户将原先的业务平滑的迁移到Doris中。警告该功能目前是实验性功能，您在使用过程中如遇到任何问题，欢迎通过邮件组、GitHubIssue等方式进行反馈。部署服务下载最新版
Android Dagger2 框架注入模块源码深度剖析(四) &有梦想的咸鱼& android
一、引言在Android开发中，依赖注入（DependencyInjection，简称DI）是一种重要的设计模式，它能够有效降低代码之间的耦合度，提高代码的可测试性和可维护性。Dagger2作为一款强大的依赖注入框架，在编译时生成依赖注入代码，避免了运行时反射带来的性能开销。注入模块是Dagger2的核心部分，负责将依赖对象注入到目标对象中。本文将深入分析Dagger2框架的注入模块，从源码级别详
SpringBoot设置过滤器（Filter）或拦截器（Interceptor）的执行顺序：@Order注解、setOrder()方法 pan_junbiao Spring Spring Boot 我の原创 spring boot java 后端
JavaWeb过滤器、拦截器、监听器，系列文章：（1）过滤器（Filter）的使用：《Servlet过滤器（Filter）的使用：Filter接口、@WebFilter注释》《SpringMVC使用过滤器（Filter）解决中文乱码》《SpringBoot过滤器（Filter）的使用：Filter接口、FilterRegistrationBean类配置、@WebFilter注释》《SpringBo
SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志 pan_junbiao Spring Spring Boot 我の原创 spring boot 后端 java
Spring面向切面编程（AOP），系列文章：《Spring面向切面编程（AOP）的简单实例》《Spring使用AspectJ的注解式实现AOP面向切面编程》《SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志》《SpringBoot使用AspectJ的@Around注解实现AOP全局记录接口：请求日志、响应日志、异常日志》1、AspectJ框架的简介Aspec
C++枚举算法详解卫青~护驾！算法数据结构 c++青少年编程枚举算法
一、枚举算法核心思想枚举算法是一种通过遍历所有可能情况来解决问题的暴力搜索方法，其核心特点是：全面性：不遗漏任何可能性简单性：逻辑直接易实现低效性：时间复杂度通常较高（O(n^k)）适用场景：问题规模有限且可穷举的情况（如数值范围小、维度低）二、经典案例：福尔摩斯密码破解问题描述ABCDE×?=EDCBA其中A,E,?∈[1,9]，B,C,D∈[0,9]所有字符互不相同算法实现（6层嵌套循环）fo
自动化测试：灵活书写XPATH定位路径 ZJ_star_1220 python html css 前端 python
进行UI自动化测试过程中XPATH定位是使用最多的定位方法，但是有时候直接复制出来的XPATH路径会比较长，所以就需要掌握一些更高级的方法，通过询问AI，最终得到了以下方法，感觉很有用，所以记录下来一、基础定位语法绝对路径与相对路径绝对路径：以/开头，从根节点逐层定位（如/html/body/div/input），路径长且易受页面结构调整影响相对路径：以//开头，直接定位目标元素（如//input
【信息学奥赛一本通】2040：筛选法找质数 repas-originse C++筛法质数算法 C++程序设计
【题目描述】用筛法求出n(2≤n≤1000)n(2≤n≤1000)以内的全部质数。【输入】输入nn。【输出】多行，由小到大的质数。【输入样例】10【输出样例】2357【代码】#includeusingnamespacestd;intmain
PTA:空心字母金字塔悦悦子a啊 C语言PTA习题 c++算法
输入一个大写的英文字母，输出空心的字母金字塔。输入格式:一个大写英文字母。输出格式:一个空心的大写英文字母金字塔，其中第1层的“A”在第1行的第40列，列从1开始计数。输入样例:E输出样例:ABBCCDDEEEEEEEEE代码如下：#includeusingnamespacestd;intmain(){chara;cin>>a;intn=a-'A';charb='A';if(a=='A'){for
信息学奥赛一本通（2040：【例5.7】筛选法找质数）橙子教师信奥一本通（数组）
2040：【例5.7】筛选法找质数时间限制:1000ms内存限制:65536KB提交数:490通过数:335【题目描述】用筛法求出n(2≤n≤1000)n(2≤n≤1000)以内的全部质数。【输入】输入nn。【输出】多行，由小到大的质数。【输入样例】10【输出样例】2357【参考代码】#include#defineN1010inttable[N]={1,1};voidisprime(){inti,
Python 实现的采集诸葛灵签老大白菜 python python 开发语言
Python实现的采集诸葛灵签项目介绍这是一个基于Python开发的诸葛灵签数据采集和展示项目。通过爬虫技术获取诸葛神签的签文和解签内容，并提供数据存储和查询功能。项目结构zhuge/├──zhuge_scraper.py#爬虫主程序├──zhuge_pages/#数据存储目录│├──all_signs.json#汇总数据│└──zhuge_sign_*.json#单个签文数据└──zhuge.m
两会聚焦科技金融创新，赛逸展2025成重要实践平台赛逸展张胜科技金融
在今年两会的热烈讨论中，科技金融创新成为核心议题之一，引发各界高度关注。国家对于科技金融的重视达到新高度，一系列旨在推动科技创新与金融深度融合的政策呼之欲出，力求为硬科技企业的成长注入强劲动力。会议期间，中国人民银行行长潘功胜透露，人民银行正携手证监会、科技部等部门，全力筹备在债券市场推出“科技板”。这一举措旨在通过创新金融工具，为科技型企业开辟更为便捷的融资渠道。通过完善发行交易制度，创新风险分
Flutter 按钮组件 ElevatedButton 详解帅次 Flutter flutter android ios macos android studio web app taro
目录1.引言2.ElevatedButton的基本用法3.主要属性4.自定义按钮样式4.1修改背景颜色和文本颜色4.2修改按钮形状和边框4.3修改按钮大小4.4阴影控制4.5水波纹效果5.结论相关推荐1.引言在Flutter中，ElevatedButton是一个常用的按钮组件，它带有背景颜色和阴影效果，适用于强调操作。ElevatedButton继承自ButtonStyleButton，相比Tex
2025年，我们应该对供应链金融有怎样的考校？产业家金融人工智能大数据
在这些市场讨论的水面之上的数字之外，一个辐射出的更本质问题恰是市场对于供应链金融企业的愈发关注——即在经济逐步昂头的如今，刨除之前的波动不谈，作为产业经济的催化剂，供应链金融企业能否承担起应有的动力角色？或者说在面对不同市场水温和风险之中，供应链金融企业能否有更抗击风险、跨越周期的能力？作者|皮爷出品|产业家“最近几个月，我们明显看到入场的资金开始变多了。”一位证券机构人员告诉产业家，“不仅是内地
源自神话的写作要义之英雄之旅博文视点生活情感框架体育
源自神话的写作要义之英雄之旅英雄之旅从本质上说，不论如何变化，英雄的故事总是一段旅程。英雄离开舒适、平淡的地方，到充满挑战的陌生世界去冒险。它可以是外部之旅，去一个明确的地点：迷宫、森林、洞穴、陌生的城市或者国度——这个新的地域会成为英雄和反派及挑战者角力的竞技场。而也有很多故事让英雄去经历一段内心之旅，在头脑、内心、精神领域里展开旅途。在所有精彩的故事中，英雄都会成长和改变，在旅途中改变自己的人
Python爬虫实战：从青铜到王者的数据采集进化论 Loving_enjoy 实用技巧爬虫 python
#开篇：当你打开浏览器时，爬虫程序在暗处露出了姨母笑某日凌晨3点，程序员老张盯着满屏的404错误，突然领悟了爬虫的真谛——这哪里是数据采集，分明是与网站运维人员斗智斗勇的谍战游戏！本文将带你体验从"HelloWorld"式爬虫到工业级采集系统的奇幻漂流，全程高能预警，请系好安全带。---###第一章青铜时代：初学者的三板斧####1.1环境搭建：你的第一把手术刀安装Python就像选择武器库：``
C语言零基础入门：嵌入式系统开发之旅岱宗夫up C语言开发语言 c语言学习
C语言零基础入门：嵌入式系统开发之旅一、引言嵌入式系统开发是当今科技领域中一个极具魅力和挑战性的方向。从智能家居设备到汽车电子系统，从智能穿戴设备到工业自动化控制，嵌入式系统无处不在。而C语言，作为嵌入式开发中最常用的语言之一，以其高效、灵活和接近硬件的特点，成为了嵌入式开发者的首选工具。如果你对嵌入式系统开发充满兴趣，但又对C语言一窍不通，那么这篇文章将是你开启这段奇妙旅程的完美起点。二、C语言
Elasticsearch Java High Level Client [7.17] 使用 DavidSoCool java elasticsearch 开发语言
es的HighLevelClient存在es源代码的引用，结合springboot使用时，会存在es版本的冲突，这里记录下解决冲突和使用方式（es已经不建议使用这个了）。注意es服务端的版本需要与client的版本对齐，否则返回数据可能会解析失败！！！文档地址：JavaHighLevelRESTClient|JavaRESTClient[7.17]|Elastic1、首先创建个javaspring
泛目录程序：站群策略在SEO优化中的优势与应用奥顺互联_老张站群 php 数据库缓存搜索引擎
泛目录程序案例：站群策略在SEO优化中的优势与应用引言在当今竞争激烈的互联网环境中，搜索引擎优化（SEO）已成为企业提升在线可见性和流量的关键策略。泛目录和站群作为SEO优化中的两种重要策略，近年来备受关注。本文将通过具体案例，深入探讨这两种策略在SEO优化中的优势与应用。一、泛目录的定义与优势1.1泛目录的定义泛目录是指通过创建大量内容相关、结构相似的目录页面，覆盖广泛的搜索关键词，从而提升网站
矩阵转置（信息学奥赛一本通-1126） Doopny@ 信息学奥赛一本通算法
【题目描述】输入一个n行m列的矩阵A，输出它的转置AT。【输入】第一行包含两个整数n和m，表示矩阵A的行数和列数(1usingnamespacestd;constintN=1e2+10;intnums[N][N];intmain(){intn,m;cin>>n>>m;for(inti=1;i>nums[i][j];}}for(inti=1;i<=m;i++){for(intj=1;j<=n;j++
for循环及其应用场景烈焰猩猩 python
for循环及其应用场景一,for循环语法for循环结构主要用于(‘序列’:字符串,列表,元组,集合以及字典)类型数据的遍历(循环)操作.for循环主要用于序列类型数据的循环操作(遍历操作).另外,当循环次数未知的情况,建议使用for循环.for循环格式for临时变量in序列:重复执行的代码1重复执行的代码2案例:使用for循环遍历字符串"itheima"str1='itheima'foriinst
Shell 目录 ianozo #反弹shell linux 运维服务器
反弹shellSUID提权一些疑问什么是SUID：SUID=SetUserID，特殊权限，标志为s（如-rwsr-xr-x），当用户执行该程序时，程序会以文件所有者的权限运行（比如以root身份运行）但是为什么不用sudo密码就能直接运行root呢：无需sudo密码的关键原因——管理员错误配置了sudo权限，配置了NOPASSWD为什么需要SUID？比如说最需要SUID权限的/user/bin/p
数据输入输出的概念及在C语言中的实现小宋同学在不断学习旧版C语言学习 c语言开发语言
前言概括1所谓输入输出是以计算机为主体而言的2本章介绍的是向标准输出设备显示器输出数据的语句3在C语言中，所有的数据输入、输出都是由库函数完成的，因此都是函数语句4在使用C语言库函数时，要用编译命令#include将有关“头文件”包括到源文件中，使用标准输入输出库函数时要用到“stdio.h”文件，因此源文件开头由以下预编译指令#include或者#include"stdio.h"stdio是st
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他