u013027996

【九度】抓取九度AC所有代码以及在CSDN的解题思路链接形成文件提交至github

前言

抓取在九度AC的所有代码。
抓取每个题目在CSDN解题思路的链接地址。
输出为多个Java/C++文件。
提交至github。

抓取九度代码

目前题目编号为1001至1557。
从该题目编号依次遍历url。
url格式为：http://ac.jobdu.com/problem.php?pid=1000
即前缀加题目编号。
获取每个人的提交历史。
url格式为：
http://ac.jobdu.com/status.php?pid=1000&user_id=wangzhenqing
传递了两个参数，题目编号和用户名。
获取提交历史需要登陆，看了下登陆传递的参数。
然后就是抓取过程。使用了Python的第三方依赖requests以及BeautifulSoup，具体代码如下：

# !/usr/bin/env python
# -*- coding: utf-8 -*-
# author: wangzhenqing <[email protected]>
# date: 2015-06-29 14:32:07


import requests
from BeautifulSoup import BeautifulSoup as soup
import sys

reload(sys)
sys.setdefaultencoding('utf-8')


# 根据登陆url，用户名，密码获取登陆后的requests
def get_login_requests(login_url, user_id, password):
    # 获取网页内容
    headers = {
        'Content-Type': 'application/x-www-form-urlencoded',
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/43.0.2357.130 Safari/537.36'
    }
    s = requests.session()
    data = dict(user_id=user_id, password=password)
    s.post(login_url, data=data, headers=headers)
    return s


# 获取每道题目的Java内容
def get_every_java_solution(s, prob_id, user_id):
    # 获取网页内容
    r = s.get('http://ac.jobdu.com/status.php?pid=' +
              str(prob_id) + '&user_id=' + user_id)
    # 修改编码格式，否则输出为乱码
    r.encoding = 'utf-8'
    data = r.text
    # 获取所有table内容，主要获取我的提交历史。这里的table应该只有一个。
    table = soup(data).findAll('table')
    if len(table) == 0:
        return ''
    # 理论上来讲，获取第一个table就可以。好像实际也是这样
    table = table[0]
    # 开始获取每一行了，应该是每个tbody。有多少行就有多少个tbody
    tbody = table.findAll('tbody')
    tbodyLen = len(tbody)
    for i in range(tbodyLen):
        body = tbody[i]
        # 针对每个body取出td。
        tds = body.findAll(name="td")
        yuyan = tds[8].text
        # 列值是有规律的，不再遍历，10列
        ac = tds[3].find('font').string
        if ac != 'Accepted' or 'C++' not in yuyan:
            continue
        url = 'http://ac.jobdu.com/showsource.php?sid=' + tds[0].string
        urlr = s.get(url)
        urlr.encoding = 'utf-8'
        code = urlr.text
        pre = soup(code, convertEntities=soup.HTML_ENTITIES).findAll('pre')
        if len(pre) == 0:
            print prob_id
            print url
            print pre
        print pre
        return pre[0].string


# 获取文件名
def get_prob_names(s, prob_id):
    r = s.get('http://ac.jobdu.com/problem.php?pid=' + str(prob_id))
    r.encoding = 'utf-8'
    if r.status_code != 200:
        return ''
    data = r.text
    # 获取题目内容
    table = soup(data, convertEntities=soup.HTML_ENTITIES)
    # print table
    head = table.findAll('dt', {"class": "title-hd"})
    # print type(head[0])
    return head[0].text


# 写文件
def write_file(filename, code):
    print type(filename)
    filename = filename.encode('utf-8', 'ignore')
    file_object = open('c++/' + filename + '.cpp', 'w')
    file_object.write(code)
    file_object.close()


# 主函数
def print_all_problems():
    num = 1557
    start = 1001
    login_url = 'http://ac.jobdu.com/login.php'
    username = 'wangzhenqing'
    password = 'password'
    while start <= num:
        s = get_login_requests(login_url, username, password)
        code = get_every_java_solution(s, start, username)
        if code is None or code == '':
            start += 1
            continue
        print type(code)
        filename = get_prob_names(s, start)
        print filename
        write_file(filename, code)
        start += 1


if __name__ == '__main__':
    print_all_problems()
    print 'over'

这样就将文件抓取到了。
然后代码格式比较乱，没有说明，所以我又用Java对JavaAC代码进行了格式化。代码如下：

/** * @author:wangzq * @email:[email protected] * @date:2015-06-30 11:01:54 * @description:将抓取的代码进行代码格式化 */

import org.eclipse.jdt.core.JavaCore;
import org.eclipse.jdt.core.ToolFactory;
import org.eclipse.jdt.core.formatter.CodeFormatter;
import org.eclipse.jdt.core.formatter.DefaultCodeFormatterConstants;
import org.eclipse.jface.text.Document;
import org.eclipse.jface.text.IDocument;
import org.eclipse.text.edits.TextEdit;

import java.io.*;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Map;


public class JavaCodeFormatUtils {

    /** * 调用eclipse jdt core对生成的java源码进行格式化 * 尝试对传入的JavaSourceFile格式化，此操作若成功则将改变传入对象的内容 * * @author pf-miles 2014-4-16 下午2:48:29 */
    @SuppressWarnings({"rawtypes", "unchecked"})
    public static String reformatCode(String code, String fileName) {
        String formatCode = "";
        Map m = DefaultCodeFormatterConstants.getEclipseDefaultSettings();
        m.put(JavaCore.COMPILER_COMPLIANCE, 1.6);
        m.put(JavaCore.COMPILER_CODEGEN_TARGET_PLATFORM, 1.6);
        m.put(JavaCore.COMPILER_SOURCE, 1.6);
        m.put(DefaultCodeFormatterConstants.FORMATTER_LINE_SPLIT, "80");
        m.put(DefaultCodeFormatterConstants.FORMATTER_TAB_CHAR,
                JavaCore.SPACE);

        IDocument doc = null;
        try {
            CodeFormatter codeFormatter = ToolFactory.createCodeFormatter(m);
            TextEdit textEdit = codeFormatter.format(
                    CodeFormatter.K_UNKNOWN, code, 0, code.length(), 0, null);
            if (textEdit != null) {
                doc = new Document(code);
                textEdit.apply(doc);
                formatCode += doc.get() + "\n";
            }
        } catch (Exception e) {
            System.err.println("格式化文件出错" + e);
            e.printStackTrace();
        }
        if ("".equals(formatCode)) {
            System.out.println(fileName);
            return code;
        }
        return formatCode;
    }


    /** * @param file * @return * @Description: 获取文件内容 * @date 2013-7-11,下午04:30:48 * @author wangzq * @version 3.0.0 */
    public static String getFileCode(File file) {
        String code = "";
        try {
            String encoding = "utf-8";
            if (file.isFile() && file.exists()) { // 判断文件是否存在
                InputStreamReader read = new InputStreamReader(
                        new FileInputStream(file), encoding);// 考虑到编码格式
                BufferedReader bufferedReader = new BufferedReader(read);
                String lineTxt = null;
                while ((lineTxt = bufferedReader.readLine()) != null) {
                    code += lineTxt + "\n";
                }
                read.close();
            } else {
                System.err.println("找不到指定的文件");
            }
        } catch (Exception e) {
            System.err.println("读取文件内容出错");
            e.printStackTrace();
        }
        return code;
    }

    /** * 获取目录下的所有文件。 * * @param path */
    public static void getDirectoryFiles(String path, String newPath) {
        File dirFile = new File(path);
        if (!dirFile.isDirectory()) {
            System.err.println(path + "不是文件夹，请检查!");
        }
        File[] files = dirFile.listFiles();
        int k = 0;
        for (File file : files) { // 遍历文件
            String fileName = file.getName();
            String head = getCodeHead(fileName);
            String code = getFileCode(file);
            code = head + code;
            code = reformatCode(code, fileName);
            if ("".equals(code)) {
                System.out.println(fileName);
            }
// System.out.println(code);
            writeCodeToFile(newPath + File.separator + fileName, code);
            k++;
        }
    }

    /** * 将内容写入文件 * * @param filePath * @param code */
    public static void writeCodeToFile(String filePath, String code) {
        try {
            File file = new File(filePath);
            PrintStream ps = new PrintStream(new FileOutputStream(file));
            ps.println(code);// 往文件里写入字符串
        } catch (FileNotFoundException e) {
            System.err.println("写文件内容出错");
            e.printStackTrace();
        }
    }

    /** * 给每个文件增加文件头 * * @param fileName * @return */
    public static String getCodeHead(String fileName) {
        String probId = fileName.substring(2, 6);
        String probName = fileName.substring(0, fileName.length() - 5);
        SimpleDateFormat dateFormat = new
                SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        String head = "" + "\n";
        head += "" + "\n";
        head += "// " + probName + "\n";
        head += "" + "\n";
        head += "/**" + "\n";
        head += " * @author:wangzq" + "\n";
        head += " * @email:[email protected]" + "\n";
        head += " * @date:" + dateFormat.format(new Date()) + "\n";
        head += " * @url:http://ac.jobdu.com/problem.php?pid=" + probId + "\n";
        head += " */" + "\n";
        return head;
    }


    public static void main(String[] args) {
        String path = "/Users/wangzhenqing/git_work/java/test";
        String newPath = "/Users/wangzhenqing/git_work/java/new";
        getDirectoryFiles(path, newPath);
    }
}

有一些因为代码的原因没有格式化成功，手动格式化即可。

抓取CSDN博客题目列表

然后我还不死心，我要抓取博客的题目列表，把解题思路的url加进去。
所以我抓取了CSDN的题目成为txt文档。

# !/usr/bin/env python
# -*- coding: utf-8 -*-
# author: wangzhenqing <[email protected]>
# date: 2015-06-30 13:47:19


import requests
from BeautifulSoup import BeautifulSoup as soup
import sys

reload(sys)
sys.setdefaultencoding('utf-8')


# 获取csdn列表
def get_cdsn_url():
    urls = []
    # 获取网页内容
    headers = {
        'Content-Type': 'application/x-www-form-urlencoded',
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/43.0.2357.130 Safari/537.36'
    }
    for x in xrange(1, 20):
        print x
        s = requests.session()
        cur_url = 'http://blog.csdn.net/u013027996/article/list/' + str(x)
        r = s.get(cur_url, headers=headers)
        # 这里主要转义一些特殊符号，如<会有问题
        r.encoding = 'utf-8'
        # , 'id': 'article_list'
        # print r.text
        html = soup(r.text, convertEntities=soup.HTML_ENTITIES)
        link_titles = html.findAll('span', {"class": "link_title"})
        # print articles
        for link_title in link_titles:
            common_url = 'http://blog.csdn.net'
            title = link_title.text
            url = common_url + link_title.find('a')['href']
            url = title + '||' + url
            print url
            if url in urls:
                continue
            urls.append(url)
    return urls


# 写文件
def write_file(urls):
    file_object = open('url.txt', 'w')
    for url in urls:
        file_object.write(url + '\n')
    file_object.close()


if __name__ == '__main__':
    urls = get_cdsn_url()
    write_file(urls)
    print 'over'

然后用java解析生成的txt文件，并且把url加进去。其实可以用Python实现，不知道当时怎么想的。

/** * @author:wangzq * @email:[email protected] * @date:2015-06-30 11:01:54 * @description:将抓取的代码进行代码格式化 */

import java.io.*;
import java.util.HashMap;
import java.util.Map;
import java.util.regex.Pattern;


public class JavaCodeUrlUtils {

    private static Map<String, String> articleMap =
                                new HashMap<String, String>();

    /** * @param file * @return * @Description: 获取文件内容 * @date 2013-7-11,下午04:30:48 * @author wangzq * @version 3.0.0 */
    public static String getFileCode(File file, String fileName) {
        fileName = fileName.substring(0, fileName.length() - 5);
        System.out.println(fileName);
        if (fileName.equals("题目1040：Prime Number")) {
            System.out.println(111);
        }
        String code = "";
        try {
            String encoding = "utf-8";
            if (file.isFile() && file.exists()) { // 判断文件是否存在
                InputStreamReader read = new InputStreamReader(
                        new FileInputStream(file), encoding);// 考虑到编码格式
                BufferedReader bufferedReader = new BufferedReader(read);
                String lineTxt = null;
                while ((lineTxt = bufferedReader.readLine()) != null) {
                    code += lineTxt + "\n";
                    if (lineTxt.contains("@url:http://ac.jobdu.com/problem.php?pid")
                            && articleMap.containsKey(fileName)) {
                        System.out.println(fileName);

                        code += " * 解题思路参考csdn:" + articleMap.get(fileName) + "\n";
                    }
                }
                read.close();
            } else {
                System.err.println("找不到指定的文件");
            }
        } catch (Exception e) {
            System.err.println("读取文件内容出错");
            e.printStackTrace();
        }
        return code;
    }

    /** * 获取目录下的所有文件。 * * @param path */
    public static void getDirectoryFiles(String path, String newPath) {
        File dirFile = new File(path);
        if (!dirFile.isDirectory()) {
            System.err.println(path + "不是文件夹，请检查!");
        }
        File[] files = dirFile.listFiles();
        for (File file : files) {
            String fileName = file.getName();
            String code = getFileCode(file, fileName);
            if ("".equals(code)) {
                System.out.println(fileName);
            }
// System.out.println(code);
            writeCodeToFile(newPath + File.separator + fileName, code);
        }
    }

    /** * 将内容写入文件 * * @param filePath * @param code */
    public static void writeCodeToFile(String filePath, String code) {
        try {
            File file = new File(filePath);
            PrintStream ps = new PrintStream(new FileOutputStream(file));
            ps.println(code);// 往文件里写入字符串
        } catch (FileNotFoundException e) {
            System.err.println("写文件内容出错");
            e.printStackTrace();
        }
    }

    /** * @param filename * @return * @Description: 获取博客日志信息 * @date 2015-06-30 16:54:22 * @author wangzq */
    public static void getCSDNArticles(String filename) {
        File file = new File(filename);
        try {
            String encoding = "utf-8";
            if (file.isFile() && file.exists()) { // 判断文件是否存在
                InputStreamReader read = new InputStreamReader(
                        new FileInputStream(file), encoding);// 考虑到编码格式
                BufferedReader bufferedReader = new BufferedReader(read);
                String lineTxt = null;
                while ((lineTxt = bufferedReader.readLine()) != null) {
                    lineTxt = lineTxt.trim();
                    String array[] = lineTxt.split(Pattern.quote("||"));
                    String head = "";
                    String url = array[1].trim();
                    if (array[0].contains("&&")) {
                        String headArr[] = array[0].split("&&");
                        for (int i = 0; i < headArr.length; i++) {
                            if (!headArr[i].contains("LeetCode")) {
                                head = headArr[i].replace("【九度】", "").trim();
                                articleMap.put(head, url);
                            }
                        }
                    } else if (array[0].contains("【九度】")) {
                        head = array[0].replace("【九度】", "").trim();
                        articleMap.put(head, url);
                    }
                }
                read.close();
            } else {
                System.err.println("找不到指定的文件");
            }
        } catch (Exception e) {
            System.err.println("读取文件内容出错");
            e.printStackTrace();
        }
    }

    public static void main(String[] args) {
        String path = "/Users/wangzhenqing/git_work/java/test";
        String newPath = "/Users/wangzhenqing/git_work/java/new";
        getCSDNArticles("/Users/wangzhenqing/git_work/java/1.txt");
        System.out.println(articleMap.size());
        for (String head : articleMap.keySet()) {
            System.out.println(head);
            System.out.println(articleMap.get(head));
        }
        System.out.println(articleMap.get("题目1040：Prime Number"));
        getDirectoryFiles(path, newPath);
    }
}

然后就大功告成了。
Jobdu的代码在https://github.com/wzqwsrf/Jobdu。
爬虫的代码在
https://github.com/wzqwsrf/python-demo/tree/master/jobdu。

遇到的问题

九度获取历史信息需要登陆，在用requests模拟浏览器登陆上耗费不少时间。
Java代码格式化，研究了一下快捷键的源码，因为懒得手动去做。
抓取CSDN博客题目列表，好像每次只能抓到15个。所以我循环了22次。
不过总算是完成了，替我做了很多大量重复的无意义的工作。

python实现二分查找（对新手友好，内容通俗易懂） dlage python 列表 python 数据结构
python实现二分查找二分查找又名折半查找。优点：查询速度快，性能好。缺点：要求查询的表为有序表原理：将表中间位置（mid）的数字与待查数字（data）做比较，如果相等：返回true，结束。如果不相等：则使用中间位置的记录将表分为前后两个子表。若data>mid则进一步查找后一个表。若datadata:last=mid-1elifalist[mid]data:last=mid-1elifalis
零基础程序员如何快速学会python Java进阶营菌程序员职场 Python python 开发语言后端 pycharm 程序人生
学会Python能做的事情也很多，常见的就有网络爬虫，数据分析，前端开发，机器学习，都能很好地提高工作效率，往任何一个领域发展，工作前景是非常不错的。接下来我从基本的软件安装开始，仔细的给大家分析新手入门应该怎样学习Python吧，如果有讲得不到位的地方也欢迎大家指正，我会及时进行修改。一、软件的安装和选择1、配置环境关系到实操，所以在选择资料的同时，你还需要安装好Python需要的软件，软件版本
新手0基础路由器刷机（小米WR30U） frank_double 路由器刷机智能路由器
准备工作：登陆恩山论坛搜237去下载刷路由器别人已经备好的各种包目录一、#######开SSH###########1、进小米路由系统设置“启用与智能网关的无线配置同步”为开启、再DHCP为自动配置DNS，最后设置wan口为第一个端口。2、将笔记本电脑与wan1口用网线连接，笔记本进入控制面板-网络管理-无线网卡-右键无线网卡属性，将网络共享给WR30U。3、CMD运行python.exeserv
一文搞懂Python的yield关键字（新手友好）蜘蛛侠在写码 python python 开发语言
在python中，yield是一个不好理解的概念，Up初学Python时看了一些教程，但还是似懂非懂。今天，Up尝试用通俗易懂的语言说清楚yield的用法和原理。想要更好的理解yield，需要先理解Python的迭代器，墙裂建议先看一下Up上一期的文章：一文搞懂Python迭代器注：本文长期有效，持续迭代完善，建议收藏。提前划重点为什么yield难理解口诀一：调用时不要看成return口诀二：ne
Python实现三维空间中的RRT避障路径规划算法 C_mony 机械臂 python 算法机器人
文章目录前言一、算法原理二、代码实现1.定义节点2.碰撞检测3.RRT算法4.完整代码运行结果前言基于快速随机搜索树（Rapidly-exploringRandomTree,RRT）的优化算法，通过对状态空间中的采样点进行碰撞检测，避免了对空间的建模，能够有效地解决高维空间和复杂约束的路径规划问题，在机械臂路径规划与避障中扮演着关键角色。RRT算法通过随机生成的树状结构来探索高维空间，尤其适合于解
Java 国密算法 SM2 加密加签，SM3 摘要加密，SM4 加密解密工具类（附完整代码）程序员白羊 java java 算法密码学安全
目录介绍开始引入BouncyCastle依赖SM2算法完整代码(SM2Util.java)测试调用1.生成公钥私钥2.加密解密3.加签验签SM3算法1.摘要加密完整代码（SM3Util.java）SM4算法1.生成随机密钥2.加密解密完整代码（SM4Util.java）下载代码（Gitee代码参考）介绍针对BouncyCastle做了封装工具类，用于实现国密算法中的SM2、SM3、SM4。国密算法
[密码学实战]Java实现国密（SM2）密钥协商详解：原理、代码与实践曼岛_ 国密实战密码学 java 开发语言
一、代码运行结果二、国密算法与密钥协商背景2.1什么是国密算法？国密算法是由中国国家密码管理局制定的商用密码标准，包括：SM2：椭圆曲线公钥密码算法（非对称加密/签名/密钥协商）SM3：密码杂凑算法（哈希）SM4：分组密码算法（对称加密）2.2密钥协商的意义在安全通信中，双方需要在不安全的信道上协商出相同的会话密钥，用于后续对称加密。SM2密钥协商协议解决了以下问题：避免预先共享密钥抵抗中间人攻击
Springboot项目中线程池使用整理 m0_74823715 面试学习路线阿里巴巴 spring boot 后端 java
文章目录Springboot项目中线程池使用整理学习目标线程池类型及特点Java基础线程池SpringThreadPoolTaskExecutorThreadPoolTaskExecutorvsThreadPoolExecutor主要区别@Async注解使用AsyncConfigurer接口CompletableFuture线程池实现方式比较1.Spring@Bean方式2.AsyncConfig
spring boot面试笔记表面矿工面试题 spring boot 面试笔记
starterSpringBoot、SpringMVC和Spring有什么区别？Spring和SpringMVC：1、Spring是一个一站式的轻量级的java开发框架，核心是控制反转（IOC）和面向切面（AOP），针对于开发的WEB层（springMvc）、业务层（Ioc）、持久层（jdbcTemplate）等都提供了多种配置解决方案；2、springMvc是spring基础之上的一个MVC框架
Python中的__slots__ 李星星BruceL 问题集 python
在Python中，__slots__的用途是什么？以及在哪些情况下应避免使用它？简而言之（TL;DR）：特殊属性__slots__允许你明确声明对象实例应该具有的实例属性，并带来以下预期效果：更快的属性访问。节省内存空间。内存节省来自于：将值引用存储在__slots__中，而不是在__dict__中。如果父类禁止创建__dict__和__weakref__，并且你声明了__slots__，则会阻止
META-INF 文件夹用途杏花春雨江南 java基础 pycharm ide python
META-INF文件夹是Java应用程序和库中一个特殊的目录，通常用于存放元数据（Metadata）和配置文件。它是Java标准的一部分，Java虚拟机和相关工具会识别并处理该目录中的特定文件。以下是META-INF文件夹的常用使用场景：1.存放Manifest文件(MANIFEST.MF)作用：MANIFEST.MF是JavaJAR文件的元数据文件，用于描述JAR文件的内容和属性。常用场景：指定
java 方法入参对象重新赋值后，方法外获取没有变化。为什么杏花春雨江南 java基础 java 开发语言
在Java中，当你将一个对象作为参数传递给一个方法，并在方法内部重新赋值这个对象，方法外的对象不会发生变化。这是因为Java是按值传递的，即使传递的是对象引用，也是传递引用的副本。让我们详细讨论一下这个问题。按值传递Java中的参数传递机制是按值传递的，这意味着方法内部对参数所做的任何更改不会影响方法外部的变量。具体来说：基本数据类型：方法内部对参数的修改不会影响外部变量。对象引用：方法内部对对象
最新版studio android 项目中没有 activity_main.xml 文件，怎么回事杏花春雨江南 android android xml
因为下载的androidstudio是最新版本，新建项目形式都为新的（kotlin版本），但是在搜索相关文章时，很多文章都是基于（xml声明配置或java相关的），所以在摸索期间遇到很多问题。也在逐个遇见逐个击破。以上。在AndroidStudio项目中，activity_main.xml是默认创建的一个Layout文件，通常作为应用程序的主活动布局。如果你的项目中没有这个文件，可能有以下几种原因
【datetime】Python datetime模块常用用法晨风_Chenfeng python
1.datetime模块中的主要类date:处理日期（年、月、日）。time:处理时间（时、分、秒、微秒）。datetime:处理日期和时间。timedelta:处理时间间隔（两个日期或时间之间的差）。tzinfo:处理时区信息。2.date类date类用于表示日期（年、月、日）。2.1创建date对象fromdatetimeimportdate#使用年、月、日创建date对象d=date(202
Monkey异常报错： Error: A RuntimeException occurred Qearl鱼 Android性能测试 Monkey测试权限 USB调试输入事件
使用小米手机跑monkey时，刚启动出现如下错误：**Error:ARuntimeExceptionoccurred:java.lang.SecurityException:InjectingtoanotherapplicationrequiresINJECT_EVENTSpermissionatandroid.os.Parcel.createException(Parcel.java:2074)
学习笔记分享-进阶数据结构与算法-图-并查集-优化 -暮倦- #学习笔记分享-数据结构与算法学习笔记
前言图片上面的personal表示只有图片上面的一行语句是解释图片内容的、local表示这个图片所在标题下的所有语句都是解释图片内容的、global表示有多个标题下的所有语句都是解释图片内容的我是一名大二的学生，学了差不多一年java技术栈了，想记录一下自己对知识点的心得，目前还是个小白，期望大佬们可以指出我笔记中的不足之处、对知识点的认知错误、笔记结构的混乱等这些图片内容都是在观看黑马课程时的视
编程入门难？Python 十大核心知识点，手把手教你！编程咕咕gu- Python基础 python 开发语言 Python教程网络爬虫
如果你对编程感兴趣，但又不知道从哪里开始，那么Python会是你的好选择。它简单易学，是初学者学习编程的好帮手。这篇文章会用轻松的方式，带你了解Python的十个重要概念，一步步帮助你从零开始！1.Python文件与扩展名学习Python的第一步是创建一个Python文件。Python文件的名字后面都会加上.py作为扩展名。例如，你可以创建一个名为main.py的文件，这就是一个Python脚本。
Windows和Linux下，通过C++实现获取蓝牙版本号 xingyun86 C++windows linux c++
在C++中获取蓝牙版本号，不同的操作系统有不同的实现方式，下面分别介绍在Windows和Linux系统下的实现方法。Windows系统在Windows系统中，可以使用WindowsAPI来与蓝牙设备交互，获取蓝牙版本号。以下是一个示例代码：收起cpp#include#include#include#include#include#pragmacomment(lib,"Bthprops.lib")/
使用 nodejs 和 ElasticSearch 快速搭建全文检索 dbLenis 数据库 java 编程语言大数据 linux
点击蓝色“有关SQL”关注我哟加个“星标”，天天与10000人一起快乐成长上次群友问我，Python怎么学，我说四个小时足够了，你们不信。这次，我用2个小时，仅仅用Google，快速搭建了一个nodejs+Elasticsearch的小Demo.足可见，在有搜索的年代，快速上手一门技术，已经不是什么难事。1安装1.1下载地址https://nodejs.org/en/download提供windo
JavaScript 系列之：函数程序员SKY JavaScript javascript
函数的定义方式函数声明functionadd(a,b){returna+b;}函数声明的最重要的一个特征是函数声明提升，它允许你在函数声明之前调用该函数。add(1,2);functionadd(a,b){returna+b;}函数表达式//普通的函数表达式letadd=function(a,b){returna+b;}add(1,2)//函数表达式也可以有函数名，这个函数名不能在函数外面用，只能
C++之vector和list辨析 C嘎嘎嵌入式开发 C++c++开发语言算法
std::vector和std::list是C++标准库中两种常用的容器，它们都用于存储和管理元素集合，但在底层实现和性能特性上有显著的区别。1.底层实现std::vector:基于动态数组实现。元素在内存中是连续存储的。支持随机访问（通过下标访问元素）。当容量不足时，会重新分配更大的内存块，并将所有元素复制到新内存中。std::list:基于双向链表实现。元素在内存中是非连续存储的，每个元素包含
如何高效利用C++的for循环 C嘎嘎嵌入式开发 c++前端服务器
在C++的for循环中，for(初始化;条件;更新)的三个参数都是可选的，你可以不写其中的一个、两个，甚至全部三个参数。1.不写初始化如果循环变量已经在循环外部定义并初始化，可以省略for循环中的初始化部分。例子：inti=0;//初始化在外部完成for(;i=5){break;//手动退出循环}cout=5){break;//手动退出循环}cout<
MATLAB基础应用精讲-【数模应用】主成分(pca)分析（附python代码实现）林聪木 matlab 人工智能大数据
目录前言知识储备降维概述算法原理什么是PCAPCA降维过程PCA算法数学步骤选择主成分个数（即k的值）sklearn中参数的解释数学模型协方差协方差矩阵编辑编辑原理推导编辑编辑编辑编辑实际操作主成分分析的计算方法方法1.协方差+特征值分解方法2：奇异值分解对比不同方法计算效率物理意义算法步骤SPSSAU主成分(pca)分析说明1、信息浓缩2、权重计算3、综合得分【综合竞争力】疑难解惑成分得分后用于
【JavaSE Pro】 Java 进阶笔记汇总（更新中） m0_74823863 面试学习路线阿里巴巴 java 笔记开发语言
【JavaSEPro】Java进阶笔记汇总Java进阶内容的笔记整理汇总，主要讲解的是Java基础语法之外的一些特有的语言特性，包括接口，内部类，Lambda表达式，泛型，异常等。有问题欢迎和我交流！Day1面向对象进阶（static、单例、代码块、继承）Day2面向对象进阶（包、权限修饰符、抽象类、接口）Day3多态，内部类，常用API(Object,Objects,StringBuilder,
使用Java操作Excel m0_67244960 Java基础 java excel python
1.引入依赖com.alibabaeasyexcel3.1.32.编写实体类，用注解映射Excel表格属性@DatapublicclassExcel{@ExcelProperty("用户名")@ColumnWidth(20)privateStringname;@ExcelProperty("性别")@ColumnWidth(20)privateStringsex;}3.编写Java代码向Excel
深入理解 JSP：从基础知识到实战技巧的全面解析 CarlowZJ java 开发语言
JSP（JavaServerPages）是一种基于Java的服务器端技术，用于开发动态Web应用。它通过将Java代码嵌入到HTML页面中，简化了Web开发的复杂性。JSP是JavaWeb开发的重要组成部分，与Servlet、JavaBean等技术紧密集成，广泛应用于企业级Web应用开发。本文将从基础知识、核心特性、生命周期、与Servlet的关系、框架支持、最佳实践等方面对JSP进行详细解析，帮
基于Python的网络漏洞扫描系统的设计与实现毕设工作室_wlzytw python论文项目 python 网络开发语言 django tornado dash pygame
摘要随着互联网不断发展、贴近生活，电子化的生活安全依赖着网络安全。在漏洞泛滥的今天，网络安全状态不容乐观，许多机构都因没有及时处理漏洞导致被恶意入侵，若网络安全保护不当，将会影响现实安全。中小型网络运维人员常因为外部因素影响难以开展网络安全行动。为了应对这一问题，本文研究尝试用Python语言尝试做一个集成漏洞扫描系统的设计与实现。运用以Python为基础的DjangoWeb框架实现快速的业务开发
React - 兄弟互传 - 消息订阅 - 发布机制来一碗刘肉面 React react.js 前端 javascript
pubsub-js是一个轻量级的JavaScript库，用于实现发布-订阅（Pub/Sub）模式。该模式使得组件间的通信变得简单和高效，特别适用于React中的兄弟组件之间通信。通过pubsub-js，一个组件可以发布消息，其他组件可以订阅这些消息以获得更新。1.安装pubsub-jsnpminstallpubsub-js//或者yarnaddpubsub-js2.基本概念发布（Publish）:
基于 Python 的漏洞扫描工具的设计与实现计算机毕业设计指导 python 开发语言信息安全
引言随着信息技术的快速发展，网络安全问题成为了各类组织和个人面临的重要挑战之一。漏洞是网络安全中的一个重要问题，黑客和恶意攻击者往往通过利用这些漏洞来侵入系统，窃取敏感信息或进行其他恶意行为。因此，及时发现和修复漏洞是确保网络安全的重要手段。本项目旨在设计和实现一个基于Python的漏洞扫描工具，帮助用户快速发现系统中的潜在漏洞，并提供修复建议。该工具将包括对Web应用程序、操作系统、服务等的漏洞
VS code 之 c++远程开发环境搭建汝何秀 linux vscode
文章目录VScode之c/c++远程开发环境搭建1.基本环境2.远程主机的开发环境搭建3.本地vscode的配置配置ssh选项4远程开发教程VScode之c/c++远程开发环境搭建1.基本环境本地主机：VisualStudioCode远程主机：CentOS72.远程主机的开发环境搭建安装环境的压缩包：dev_env_install.tar.gz解压文件夹：repo自动安装脚本为：dev_env.s
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

【九度】抓取九度AC所有代码以及在CSDN的解题思路链接形成文件提交至github

前言

抓取九度代码

抓取CSDN博客题目列表

遇到的问题

你可能感兴趣的:(java,C++,python)