ClearSkyQQ

Python爬虫-CSDN博客排行榜数据爬取

文章目录

前言
网络爬虫
- 搜索引擎
- 爬虫应用
- 谨防违法
爬虫实战
- 网页分析
- 编写代码
- 运行效果
反爬技术

前言

开始接触 CTF 网络安全比赛发现不会写 Python 脚本的话简直寸步难行……故丢弃 Java 学习下 Python 语言，但单纯学习语法又觉得枯燥……所以从 Python 爬虫应用实战入手进行学习 Python。本文将简述爬虫定义、爬虫基础、反爬技术和 CSDN博客排行榜数据爬取实战。

网络爬虫

网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等，可以代替人们自动地在互联网中进行数据信息的采集与整理。在大数据时代，信息的采集是一项重要的工作，如果单纯靠人力进行信息采集，不仅低效繁琐，搜集的成本也会提高。

网络爬虫自动化浏览网络中的信息的时候需要按照我们制定的规则进行，这些规则我们称之为网络爬虫算法。使用Python可以很方便地编写出爬虫程序，进行互联网信息的自动化检索。

搜索引擎

搜索引擎离不开爬虫，比如百度搜索引擎的爬虫叫作百度蜘蛛（Baiduspider）。百度蜘蛛每天会在海量的互联网信息中进行爬取，爬取优质信息并收录，当用户在百度搜索引擎上检索对应关键词时，百度将对关键词进行分析处理，从收录的网页中找出相关网页，按照一定的排名规则进行排序并将结果展现给用户。（除了百度搜索引擎离不开爬虫以外，其他搜索引擎也离不开爬虫，它们也拥有自己的爬虫。比如360的爬虫叫360Spider，搜狗的爬虫叫Sogouspider，必应的爬虫叫Bingbot。）

在这个过程中，百度蜘蛛起到了至关重要的作用。那么，如何覆盖互联网中更多的优质网页？又如何筛选这些重复的页面？这些都是由百度蜘蛛爬虫的算法决定的。采用不同的算法，爬虫的运行效率会不同，爬取结果也会有所差异。所以，我们在研究爬虫的时候，不仅要了解爬虫如何实现，还需要知道一些常见爬虫的算法，如果有必要，我们还需要自己去制定相应的算法，在此，我们仅需要对爬虫的概念有一个基本的了解。

爬虫应用

在上面的图中可以看到，网络爬虫可以代替手工做很多事情，比如可以用于做搜索引擎，也可以爬取网站上面的图片，比如有些朋友将某些网站上的图片全部爬取下来，集中进行浏览，同时，网络爬虫也可以用于金融投资领域，比如可以自动爬取一些金融信息，并进行投资分析等。

由于互联网中的用户数据信息，相对来说是比较敏感的数据信息，所以，用户爬虫的利用价值也相对较高。利用用户爬虫可以做大量的事情，比如在2015年，有网友爬取了3000万QQ空间的用户信息，并同样从中获得了大量潜在数据：

QQ空间用户发说说的时间规律：晚上22点左右，平均发说说的数量是一天中最多的时候；
QQ空间用户的年龄阶段分布：出生于1990年到1995年的用户相对来说较多；
QQ空间用户的性别分布：男生占比多于50%，女生占比多于30%，未填性别的占10%左右。

用户爬虫还可以做很多事情，比如爬取淘宝的用户信息，可以分析淘宝用户喜欢什么商品，从而更有利于我们对商品的定位等。由此可见，利用用户爬虫可以获得很多有趣的潜在信息。

谨防违法

网络爬虫在大多数情况中都不违法，我们生活中几乎每天都在爬虫应用（如百度），从目前的情况来看，如果抓取的数据属于个人使用或科研范畴，基本不存在问题；而如果数据属于商业盈利范畴，就有可能属于违法行为。

Robots协议

Robots协议（爬虫协议）的全称是“网络爬虫排除标准”（Robots Exclusion Protocol），网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。该协议是国际互联网界通行的道德规范，虽然没有写入法律，但是每一个爬虫都应该遵守这项协议。

淘宝网对用户代理为百度爬虫引擎进行了规定，我们可以查看淘宝网的 robots.txt：

User-agent: *表示允许所有搜索引擎蜘蛛来爬行抓取，也可以把*去掉，改为特定某一个或者某些搜索引擎蜘蛛来爬行抓取，如百度是Baiduspider，谷歌是Googlebot；
以 Allow 项的值开头的URL是允许robot访问的。例如，Allow：/article允许百度爬虫引擎访问 /article.htm、/article/12345.com等。
以 Disallow 项为开头的链接是不允许百度爬虫引擎访问的。例如，Disallow：/product/ 不允许百度爬虫引擎访问 /product/12345.com 等。

最后一行，Disallow：/ 表示禁止百度爬虫访问除了Allow规定页面外的其他所有页面。百度作为一个搜索引擎，良好地遵守了淘宝网的 robot.txt 协议。

网络爬虫的约束

除了上述Robots协议之外，我们使用网络爬虫的时候还要对自己进行约束：过于快速或者频密的网络爬虫都会对服务器产生巨大的压力，网站可能封锁你的IP，甚至采取进一步的法律行动。因此，你需要约束自己的网络爬虫行为，将请求的速度限定在一个合理的范围之内。简而言之，如果你因为爬取数据导致人家服务器宕机，你就惹祸上身了……

爬虫实战

进入正题之前通过一张图来简要了解下爬虫的工作过程：

下面将演示如何借助 Python 爬虫爬取CSDN排行榜Top 100的大佬们的数据信息，保存到本地 Excel 文件进行膜拜。

网页分析

访问本次爬取目标——CSDN博客排行榜：https://blog.csdn.net/rank/writing_rank：

抓包分析：

发现返回排行榜用户信息（每次返回一页10位）的API：

/api/WritingRank/weekList?username=weixin_39190897&page=1&size=10

具体数据包如下：

分析一下参数：

url：      从返回的json数据看，显然该请求便是需要爬取的url，而不是最开始给的网址
username:  这个表示你自己的用户id，不带的话就表示没登入 （不带也可以）
page:      表示当前页数，测试发现这个只能显示Top100，也就最大10页
size:      表示每次每页显示的数据量，每次json包里面只包括 10 个大佬的数据

这里面只有page会发生变化，所以我们只要一个循环，不断的去构造这个网址就行了。

编写代码

1、初始化参数：

    def __init__(self):
        self.ua = UserAgent().chrome
        self.url = 'https://blog.csdn.net/api/WritingRank/weekList?'  # ajax 请求网址
        self.header = {
     
            'Referer': 'https://blog.csdn.net/weixin_39190897',
            "Upgrade-Insecure-Requests": "1",
            'User-Agent': self.ua
        }
        # 配置保存表格的基本
        self.workbook = Workbook()
        self.sheet = self.workbook.active
        self.sheet.title = 'CSDNTop100信息'
        self.sheet['A1'] = '排名'
        self.sheet['B1'] = '用户名'
        self.sheet['C1'] = '用户头像'
        self.sheet['D1'] = '用户博客网址'
        self.sheet['E1'] = '粉丝数'
        self.sheet['F1'] = '点赞数'
        self.sheet['G1'] = '上周排名'
        self.sheet['H1'] = '博客等级'
        self.sheet['I1'] = '排名时间'

    def __params(self, offset):
        self.offset = offset
        """构造请求参数"""
        self.params = {
     
            "username": "weixin_39190897",
            "page": str(self.offset),
            "size": "10"
        }

2、爬取网址：

    def spider(self):
        """
        构造 多页 爬取
        """
        for i in range(1, 11):
            self.__params(i)
            url = self.url + urlencode(self.params)
            r = requests.get(url, headers=self.header)
            if r.status_code == 200:
                r.encoding = r.apparent_encoding
                yield r.json()
            else:
                print('[info] request error ! the status_code is ' + r.status_code)
            time.sleep(0.5)

3、分析json包：

 def parse_json(self, r_json):
        """
        根据网站请求返回的json包 进行进一步分析
        """
        # 第一层
        first_data = r_json.get('data')
        if first_data:
            # 第二层
            list_data = first_data.get('list')
            if list_data:  # 判空
                for i in list_data:
                    rank = i.get("ranking")
                    head_image = i.get('avatar')
                    user_nickname = i.get('user_nickname')  # 用户名
                    username = i.get('username')  # 用户id
                    fans_num = i.get('fans_num')  # 粉丝
                    fav_num = i.get('fav_num')  # 获赞
                    last_rank = i.get('last_ranking')  # 上周排名
                    leave = i.get('profile_level').get('level')  # 博客等级
                    if rank and head_image and user_nickname and user_nickname and username and fans_num \
                            and fav_num and last_rank and leave:
                        # 这里保存数据 只是为了方便转换其他保存格式  仅仅是保存excel中用到列表
                        yield {
     
                            'rank': rank,
                            'user_nickname': user_nickname,
                            'head_image': head_image,
                            'username': 'https://blog.csdn.net/' + username,
                            'fans_num': fans_num,
                            'fav_num': fav_num,
                            'last_rank': last_rank,
                            'leave': leave
                        }

4、下载保存excel表格

    def down(self, item):
        """保存至excel表格"""
        now_time = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime())  #  时间
        leave_list = []
        for value in item.values():
            leave_list.append(value)
        leave_list.append(now_time)
        self.sheet.append(leave_list)

5、完整脚本：

# -*- coding :  utf-8 -*-
import requests
from urllib.parse import urlencode
from fake_useragent import UserAgent
import time
from openpyxl import Workbook

class CSDNSpider(object):
    """
     爬取csdn top 100 的各种信息
     url = 'https://blog.csdn.net/rank/writing_rank'
     ajax方式
    """

    def __init__(self):
        self.ua = UserAgent().chrome
        self.url = 'https://blog.csdn.net/api/WritingRank/weekList?'  # ajax 请求网址
        self.header = {
     
            'Referer': 'https://blog.csdn.net/weixin_39190897',
            "Upgrade-Insecure-Requests": "1",
            'User-Agent': self.ua
        }
        # 配置保存表格的基本
        self.workbook = Workbook()
        self.sheet = self.workbook.active
        self.sheet.title = 'CSDNTop100信息'
        self.sheet['A1'] = '排名'
        self.sheet['B1'] = '用户名'
        self.sheet['C1'] = '用户头像'
        self.sheet['D1'] = '用户博客网址'
        self.sheet['E1'] = '粉丝数'
        self.sheet['F1'] = '点赞数'
        self.sheet['G1'] = '上周排名'
        self.sheet['H1'] = '博客等级'
        self.sheet['I1'] = '排名时间'

    def __params(self, offset):
        self.offset = offset
        """构造请求参数"""
        self.params = {
     
            "username": "weixin_39190897",
            "page": str(self.offset),
            "size": "10"
        }

    def spider(self):
        """
        构造 多页 爬取
        """
        for i in range(1, 11):
            self.__params(i)
            url = self.url + urlencode(self.params)
            r = requests.get(url, headers=self.header)
            if r.status_code == 200:
                r.encoding = r.apparent_encoding
                yield r.json()
            else:
                print('[info] request error ! the status_code is ' + r.status_code)
            time.sleep(0.5)

    def parse_json(self, r_json):
        """
        根据网站请求返回的json包 进行进一步分析
        """
        # 第一层
        first_data = r_json.get('data')
        if first_data:
            # 第二层
            list_data = first_data.get('list')
            if list_data:  # 判空
                for i in list_data:
                    rank = i.get("ranking")
                    head_image = i.get('avatar')
                    user_nickname = i.get('user_nickname')  # 用户名
                    username = i.get('username')  # 用户id
                    fans_num = i.get('fans_num')  # 粉丝
                    fav_num = i.get('fav_num')  # 获赞
                    last_rank = i.get('last_ranking')  # 上周排名
                    leave = i.get('profile_level').get('level')  # 博客等级
                    if rank and head_image and user_nickname and user_nickname and username and fans_num \
                            and fav_num and last_rank and leave:
                        # 这里保存数据 只是为了方便转换其他保存格式  仅仅是保存excel中用到列表
                        yield {
     
                            'rank': rank,
                            'user_nickname': user_nickname,
                            'head_image': head_image,
                            'username': 'https://blog.csdn.net/' + username,
                            'fans_num': fans_num,
                            'fav_num': fav_num,
                            'last_rank': last_rank,
                            'leave': leave
                        }

    def down(self, item):
        """保存至excel表格"""
        now_time = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime())
        leave_list = []
        for value in item.values():
            leave_list.append(value)
        leave_list.append(now_time)
        self.sheet.append(leave_list)

    def main(self):
        """调用函数"""
        print('The spider is start!')
        for content in self.spider():
            for item in self.parse_json(content):
                self.down(item)

        self.workbook.save(filename='CSDNTop100.xlsx')
        self.workbook.close()
        print('The CSDNTop100 spider is over!')


a = CSDNSpider()
a.main()

此处代码中出现使用了 yield 的函数，属于Python生成器（generator），跟普通函数不同的是，生成器是一个返回迭代器的函数，只能用于迭代操作，更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中，每次遇到 yield 时函数会暂停并保存当前所有的运行信息，返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。调用一个生成器函数，返回的是一个迭代器对象。

更多 yield 关键词的理解可参考：python中yield的用法详解——最简单，最清晰的解释。

运行效果

在Pycharm中运行脚本：

脚本运行成功后在项目工程目录下自动生成 CSDNTop100.xlsx 文件：

最后就是见证奇迹的时刻，打开瞅瞅：

反爬技术

1、通过user-agent来控制访问

user-agent 能够使服务器识别出用户的操作系统及版本、cpu类型、浏览器类型和版本。很多网站会设置 user-agent 白名单，只有在白名单范围内的请求才能正常访问。所以在我们的爬虫代码中需要设置 user-agent 伪装成一个浏览器请求。有时候服务器还可能会校验 Referer，所以还可能需要设置 Referer (用来表示此时的请求是从哪个页面链接过来的)。

# 设置请求头信息
headers = {
     
        'Host': 'https://blog.csdn.net',
        'Referer': 'https://blog.csdn.net/weixin_43499626/article/details/85875090',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
    }
response = requests.get("http://www.baidu.com", headers=headers)

2、通过IP来限制

当我们用同一个ip多次频繁访问服务器时，服务器会检测到该请求可能是爬虫操作。因此就不能正常的响应页面的信息了。解决办法常用的是使用IP代理池。网上就有很多提供代理的网站。

proxies = {
     
  "http": "http://119.101.125.56",
  "https": "http://119.101.125.1",
}
response = requests.get("http://www.baidu.com", proxies=random.choices(proxies))

3、通过前端参数加密

某些网站可能会将参数进行某些加密，或者对参数进行拼接发送给服务器，以此来达到反爬虫的目的。这个时候我们可以试图通过js代码，查看破解的办法。这里就要请出一个大杀器：”PhantomJS“。PhantomJS是一个Python包，他可以在没有图形界面的情况下，完全模拟一个”浏览器“，js脚本验证什么的再也不是问题了。

4、通过robots.txt来限制爬虫

robots.txt是一个限制爬虫的规范，该文件是用来声明哪些东西不能被爬取。如果根目录存在该文件，爬虫就会按照文件的内容来爬取指定的范围。但是这实际上只是一个”君子协议“，遵守与否，都在于爬虫的编写者。

我的第一个完全使用AI编程开发小应用上线了思考在马桶上我的AI编程之旅 AI编程微信小程序人工智能
起因起因：家里的娃时间概念差，钟表认知不够，没事干就看平板，现在各类AI编程工具火热，让普通人也有了可以尝试做一些小玩意儿的机会目的：没有抱着什么太大的幻想，就是跑通下小程序应用开发的基本流程，踩下坑，娱乐为主，学习为主。使用工具：IDE工具：windsurf为主（刚开始的时候是白嫖cursor和windsurf，后面主要用winsurf，后面可以在展开聊下cursor和windsurf的对比）微
2025 AI对DevSecOps的影响及相关工具推荐 ai开发
数字经济时代，伴随着数字应用编程开发方式、应用协作发布方式、应用架构设计和基础设施运行环境的变化，我们熟知的软件供应链安全正向数字供应链跃迁式演进，数字供应链安全风险亦日趋严峻。为了应对覆盖全生命周期的数字应用安全风险，打造安全可信的数字供应链，各行业的企业组织正积极拥抱DevSecOps并付诸实践，通过一套全新的方法论及配套工具链将安全能力完整嵌入整个DevOps体系，在保证业务研发效能的同时能
visual studio 2022 激活码、激活教程、亲测可用
visualstudio2022（vs2022）是由微软官方出品的最新版本的开发工具包系列产品。它是一个完整的开发工具集，囊括了整visualstudio2022是一款由微软全新研发推出的编程开发软件，该软件能够为程序开发人员提供一个绝佳的IDE开发环境，可帮助用户高效率地杜绝错误代码，当用户输入错误代码的时候，系统即会自动将其标红，可完美支持C#、C++、Python、VisualBasic、N
键盘快捷键：提高工作效率与电脑操作的利器 wjs2024 开发语言
键盘快捷键：提高工作效率与电脑操作的利器在数字化时代，键盘快捷键成为了提高工作效率和优化电脑操作的重要工具。无论是日常办公、图像编辑、编程开发，还是游戏娱乐，掌握键盘快捷键都能带来极大的便利。本文将详细介绍键盘快捷键的概念、重要性、以及在不同应用场景中的具体应用。什么是键盘快捷键？键盘快捷键，也称为热键或快捷键，是指通过按下键盘上的一组键来完成特定命令或操作的方式。这些快捷键通常涉及同时按下多个键
Docker -- 编程开发C/C++ weixin_42500287 Linux docker
1C/C++1.1关于GCCGCC（GNUCompilerCollection）是一套由GNU开发的编程语言编译器，是一套以GPL及LGPL许可证所发行的自由软件，也是GNU计划的关键部分。GCC（特别是其中的C语言编译器）通常被认为是跨平台编译器的事实标准。GCC可处理C/C++，以及Fortran、Pascal、Object-C、Java、Ada等多种语言。1.1.1使用官方镜像将C/C++代
GNU工具集和MinGW 弘毅_Hao Linux/shell GNU工具集 MinGW
GNU工具集GNU工具集包含了一系列的基本工具和实用程序，这些工具为系统管理员、开发人员和普通用户提供了丰富的功能和工具支持。许多开源软件和项目都依赖于GNU工具集提供的稳定和强大的功能，因此GNU工具集的发展与完善对整个开源社区都具有重要意义。通过GNU工具集，用户可以在命令行下完成各种任务，如文件操作、进程管理、编程开发等，为用户提供了强大的工具支持。核心组成部分GNU工具集包含了许多不可或缺
Mac 安装Hadoop教程（HomeBrew安装）追光天使 macos hadoop 大数据
1.引言本教程旨在介绍在Mac电脑上安装Hadoop，便于编程开发人员对大数据技术的熟悉和掌握。2.前提条件2.1安装JDK想要在你的Mac电脑上安装Hadoop，你必须首先安装JDK。具体安装步骤这里就不详细描述了。你可参考Mac安装JDK8。2.2配置ssh环境在Mac下配置ssh环境，防止后面启动hadoop时出现Connectionrefused连接被拒绝的错误。sshlocalhost执
Java编程开发新手学习：数组方法的应用猜字母游戏 Java小辰
Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。Java技术具有卓越的通用性、高效性、平台移植性和安全性，广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网，同时拥有全球最大的开发者专业社群。给你学习路线：html-css-js-jq-javase-数据库-jsp-servlet-Struts2-hibernate-mybatis-spring4-springmv
java是最值得学习的编程语言吗？嘎嘣脆a
其实我们评价一种开发语言就像我们评价一个人一样，如果只是说他很好，最值得学习，这样的评价看起来就太笼统了，而且一点也不具有说服力，所以今天场长大大就把java做一场拟人化处理，想象我们面对的java是一个帅气的小伙子，当然你如果愿意也可以把她想象为一名阳光美少女，毕竟从Java的出生年纪看，她真的只是个20岁活力满满的阳光少女哟。**Java何许人也**Java是编程开发界的网红，最常见最熟悉的一
①flutter简介和环境构建① paiidds flutter
一、flutter简介1.flutter是什么？ flutter是一款接近原生安卓的移动应用程序开发框架,采用dart语言(强类型)开发，提高了丰富的UI和组件库,支持响应式编程、热加载程序(无需重启就能加载)。底层dart语言和java语言类似，具备面向对象编程开发的特性。flutter可以包含不同平台之间的差异，共同复用同一套代码，交付出具有原生体验的高性能不同平台应用。2.为什么要学习fl
Windows环境使用集成开发环境GoLand远程连接内网服务器远程开发学编程的小程 windows 服务器运维
文章目录前言1.安装配置GoLand2.服务器开启SSH服务3.GoLand本地服务器远程连接测试4.安装cpolar内网穿透远程访问服务器端4.1服务器端安装cpolar4.2创建远程连接公网地址5.使用固定TCP地址远程开发前言本文主要介绍在Windows环境如何下载安装GoLand，并通过SSH远程连接服务器，结合cpolar内网穿透工具实现远程编程开发。GoLand是由JetBrains推
适合编程初学者的开源云笔记系统（NodeJS版）蓝不蓝编程
目标为编程初学者打造入门学习项目，使用各种主流编程语言来实现。让想学编程的，一个都不落下。image上述基本涵盖了当前编程开发所有主流语言。左侧为前端版本：安卓、iOS、鸿蒙、Flutter、Vue、uni-app。右侧为服务器端版本：Java、Python、Go、PHP、NodeJS前端效果图image支持特性注册、登录云笔记增删改查支持mysql数据库开发工具下载VisualStudioCod
【产品经理】考证東方既白（积累版）产品经理
最重要的是项目经验，不过考证也算是锦上添花，没事可以看看。从工作经验看适合科目对于从事过相关工作的人员来说，更适合考与工作内容适配的科目，学习和考试都更得心应手，而且取得和工作岗位相对应的证书会更有利于职业发展。比如，软设适合从事软件编程开发的人员报考；从事过计算机网络系统相关工作的人员适合考网工；从事信息系统项目管理的管理人员或项目经理适合考集成；从事信息系统监理的适合考监理；从事IT运维、IT
Java | 如何利用AI给编程提效程序员影子 AI+编程实践 java 开发语言 AI编程 ai 语言模型
大家可以关注一下专栏，方便大家需要的时候直接查找，专栏将持续更新~大家好，我是程序员影子|全网同名一名致力于帮助更多朋友快速入门编程的程序猿一、引言AI已经频繁的出现在我们的生活中，那我们该如何更好的玩转AI+编程，提升自己的开发效率呢？本篇文章影子将为大家分享AI在编程开发中的提效，并以三大国产模型和Java语言作为例子，为大家带来实践分享。1.1AI编程助手的发展背景随着AI的快速发展，尤其是
Java关于空指针的防范与思考 wssisknight
前言对于编程开发者而言空指针异常是非常常见的，基本上各类编程语言都存在空指针异常，对于Java开发者而言，相信NullPointerException是大家再熟悉不过的。虽然空指针很常见，但是空指针对系统造成的危害却是不容忽视的，因此很多现代编程语言在语法上就对空指针进行了很多避免，比如Kotlin。但是对于Java语言有没有什么好的方式呢？空指针分析对于空指针的出现，其实一般可以归纳为以下几个原
java 课程签到管理系统Myeclipse开发mysql数据库web结构jsp编程servlet计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点java课程签到管理系统是一套完善的javaweb信息管理系统采用serlvet+dao+bean，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。java课程签到管理系统下载地址https://download.csdn.net
java 培训班预定管理系统Myeclipse开发mysql数据库web结构jsp编程servlet计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点java培训班预定管理系统是一套完善的javaweb信息管理系统采用serlvet+dao+bean，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。java培训班预定管理系统1下载地址https://download.csdn.
java 宠物医院系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点java宠物医院系统是一套完善的javaweb信息管理系统，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。javaWeb宠物医院管理系统1下载地址https://download.csdn.net/download/qq_412
java生态环境评价Myeclipse开发mysql数据库web结构java编程计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点java生态环境评价管理系统是一套完善的javaweb信息管理系统，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。javaweb生态环境评价系统下载地址https://download.csdn.net/download/qq_
使用Thonny搭建MicroPython 开发环境，简单易用，保姆级教程原子星物联网开发 python micropython python 单片机嵌入式硬件物联网
MicroPythonThonny开发环境搭建，简单易用，保姆级教程MicroPython为广大Python编程开发人员打开了通往单片机、物联网开发的大门，但是在开发工具方面却不是很给力，虽然VSCode的插件很多，但是针对MicroPython却不是很多，好用的也已经好久没有更新。这边文章就介绍另外一款简单易上手的开源MicroPython集成开发工具————thonny。当然，thonny也可
java SSM新闻管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计 qq_251836457 java类 java 数据库 myeclipse
一、源码特点javaSSM新闻管理系统是一套完善的web设计系统（系统采用SSM框架进行设计开发，spring+springMVC+mybatis），对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。javassm新闻管理系统下载地址https
java客运管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点java客运管理系统是一套完善的javaweb信息管理系统，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。javaWeb客运管理系统下载地址https://download.csdn.net/download/qq_412213
Python文件操作田阅川
前言文件的读写操作是一门编程开发语言的基础，Python内置了读写文件的函数，用法和C是兼容的。我们先解释一下文件读写的本质，在Linux中，分为普通文件和特殊文件，其中特殊文件是指操作系统将所有设备都作为文件来处理。我们这里处理的是普通文件，它是一组数据集合，存放在磁盘上。读操作也就是将磁盘中的内容读到内存中进行处理，写操作也就是将内存中的数据持久化到磁盘上。文件操作文件类型文本文件-这类文件以
新手程序员应该怎么选电脑？来自从业5年维修工程师的建议叩丁狼教育
原创2021-11-2509:59·叩丁狼教育科技新手程序员应该怎么选电脑？来自从业5年维修工程师的建议大家好，我是叩丁狼的彬辉老师。因为工作原因，经我手修好的电脑没有一千也有八百，关于编程开发对硬件的要求，也是了然于心。不管你是什么级别的程序员，选配置也是一件头疼的事，这里我给大家整理一些简单的配置参考，希望能帮到大家。其实电脑配置远不止这些，还有散热、主板、处理器、电源等等，这次主要提到对电脑
jsp课程教学管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点JSP课程教学管理系统是一套完善的javaweb信息管理系统，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。jsp课程教学管理系统1下载地址https://download.csdn.net/download/qq_412213
jsp计算机线上教学系统Myeclipse开发mysql数据库web结构java编程计算机网页项目 qq_251836457 java类 java 数据库 myeclipse
一、源码特点JSP计算机线上教学系统是一套完善的javaweb信息管理系统，对理解JSPjava编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql5.0，使用java语言开发。java计算机课程线上教学系统1下载地址https://download.csdn.net/download/qq_4
一款简洁高效的输入、截图、划词翻译软件 github程序员
大家好，我是Java陈序员。英语是我们程序员工作中经常会遇到的，无论是翻阅官方文档，还是编程开发都离不开英语。有时候，我们会为了一个变量名、方法名、类名苦思冥想，常常需要使用翻译软件来起一个贴切而优美的名字。今天，给大家介绍一个简洁高效的翻译软件，使用快捷键即可快速完成翻译功能！关注微信公众号：【Java陈序员】，获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。项目介绍TTime—
es6编码风格-js-v1.0.0 一点金光
---title:es6编码风格date:2018-06-0916:29:00updated:2018-06-1012:00:00categories:-前沿脚本-编程开发tags:-nodejs---块作用域01.let取代var02.在let和const之间，建议优先使用const，尤其是在全局环境，不应该设置变量，只应设置常量。（全局常量、线程安全）某字符串01.静态字符串一律使用单引号或反
Java基础之集合与泛型 Clf_忆笙
一、集合概述当我们在使用java进行编程开发时，经常会遇到一些需要集中存放的多个数据，这时我们可以选择“数组”或者“集合”，关于数组的知识可以参考上一篇文章，今天我们主要讲集合的使用。集合和数组既然都是容器，它们有什么区别呢？1、数组长度固定，集合长度可变。数组是静态的，一个数组实例具有固定的大小，一旦创建了就无法改变容量了，而且生命周期也是不能改变的，还有数组也会做边界检查，如果发现有越界现象，
编程开发｜解决问题的思路 QiuZH
##前沿经常感觉到自己解决问题速度好像比部分人快一些，不要脸的来总结一下自己解决问题的思路和方法，排名不分先后，适合你的才是最好的。看官，有啥觉得不妥之处或者有其他好的办法，底下评论走起。我个人博客主页：https://www.cnblogs.com/qiuzhaohai##第一种良好的代码规范良好的代码规范这个是我自己以往项目经验总结出来的，我经历过三四十个项目，自己从头负责到尾的项目也有八、九
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p