块上码

Python爬虫项目：年份筛选器

（有用的话，点个赞呗！ヽ(✿ﾟ▽ﾟ)ノ完整代码在最下面）

有些网站的分类方式太鸡肋了。

虽然能选择年份，或者靠关键字筛选图书，但是两者不能同时进行。

而常常能搜到很多在2010年，甚至更早出版的的老书，

显然，很多老书是跟不上时代的，我们可能并不想要。

因此，我决定编写一个爬虫程序筛选年份。

开始前的准备

我们要爬一个名叫“搬书匠”的网站

首先，明确目标

我们需要筛选两样东西：

1.书名

2.出版年份

所需参数

为了筛选上述两样东西，我们还需要明确我们的参数。

固定的参数：url

按需更改的参数：你可接受的最低年份、搜索的关键字、检索的页数（尾页）。

url特点

我们去搜索“Python datamining”，看看搬书匠的url会怎么变化？

url总体：

经过观察，我们发现四点：

1，第一部分是固定的

2，第二部分是变化的

第一页↓

第二页↓

3，其中的阿拉伯数字代表页数

4，我们搜索时输入的空格由+代替

开始编写！

（这里用面向对象的方法来编写，方便后期维护。）

创建一个YearAnalyzer类

其中url没有页码和搜索的关键字的部分，是我们固定的参数，一般不会去改它

因此我们把 url的部分设定为类属性。

将url分为两个部分是为了便于拼接我们的页码和搜索关键字。

（这段代码有一大坨请求头，可以忽略）

import requests
import re


class YearAnalyzer:
    url_1 = "http://www.banshujiang.cn/e_books/search/page/"
    url_2 = "?searchWords="
# 请求头太大坨了，放在这不美观。
# 有需要的话，请去文章最下面拿取
    headers = {}
# 对应上文url的两部分
    
    def __init__(self, page: int, year:int, search: str):
        self.trailer_page = page
        self.search = search
        self.year = year
        
# 分别是是尾页、搜索的关键字、可接受的最低年份

实例方法一：拼接url

说明

编写一个splice_url方法

将页码和搜索的关键字塞入url中

返回一个url_list，为爬虫提供url列表。

代码

    def splice_url(self):
        url_list = []
        for page in range(1, self.trailer_page + 1):
            str_page = str(page)
            url = ''.join([self.url_1, str_page, self.url_2, self.search])
            url_list.append(url)
        return url_list

实例方法二：采集所有书名和出版年份信息

说明

编写一个get_ori_name_year方法

使用requires库的get方法向网站发起请求，获取html码。

再用正则表达式提取所有的书名和对应年份。

这个方法只需要一个参数： url

print一下我们得到的响应，就会发现，每一本书的书名和出版日期都是放在一块的

因此可直接用zip函数把正则表达式返回的两个列表的元素拼接起来。

Python爬虫项目：年份筛选器_第1张图片

代码

    def get_ori_name_year(self, url_list):
        all_ori_name_year = []

        for url in url_list:
            response1 = requests.get(url, headers=self.headers)
            # 发起请求，获取响应
            response = response1.content.decode()
            # 解码响应
            ori_year_result = re.findall(r"出版年份.*?(\d+)", response)
            # 获取所有年份
            ori_name_result = re.findall(r'书名.*?href="/e_books.*?>(.*?)', response)
            # 获取所有书名
            ori_name_year = zip(ori_name_result, ori_year_result)
            # 因为正则表达式findall方法返回的是列表。
            # 所以可以用zip()函数把每一个书名和对应的年份拼接起来。
            list_ori_name_year = list(map(list, ori_name_year))
            # 因为zip函数返回的是一个对象，而直接用list方法的话
            # 得到的是[[(书名，年份)]]，会多一层列表，这样会让遍历变得麻烦
            # 因此这里用list(map(list, zip对象))的方法，将zip对象转化为列表。
            all_ori_name_year += list_ori_name_year
            # 将遍历的结果加入到总列表
            
        return all_ori_name_year
        # 返回一个嵌套了元组的列表 形如：[(书名，对应年份)]

实例方法三：筛选满足条件的书籍

说明

编写一个filter方法

遍历所有书名和年份

并写条件判断语句

代码

    def filter(self, ori_name_year):
        satisfied_name_li = []
        satisfied_year_li = []
        books_number = 0

        for (name, year) in ori_name_year:
            if int(year) >= int(self.satisfied_year):
                books_number += 1

# -----------------------------------------------------------------
                if books_number >= 2:
                    print(books_number, "books have been found!")
# 这部分代码只是为了看有多少本书满足条件，可写可不写
                else:
                    print(books_number, "book has been found!")
# -----------------------------------------------------------------

                satisfied_name_li.append(name)
                satisfied_year_li.append(year)

        satisfied_name_year = zip(satisfied_name_li, satisfied_year_li)

        return satisfied_name_year

实例方法四：将搜索结果保存为txt文件

说明

将所有满足条件的书名和年份写入文件

并保存在所在目录下

代码

   def save(self, satisfied_name_year):

        for name, year in satisfied_name_year:
        # 遍历所有筛出的书籍

            with open(f"{self.search.replace('+',' ')}最低{self.satisfied_year}年(搜索{self.trailer_page}页)结果.txt", 'a', encoding="UTF-8") as F:
            # 把文件名写好，方便看

                F.write("{0:<100}{1:<10}{2}".format(name, year, "\n"*3))
                # 用format函数，让写入的文段更美观
                print(name, "saved successfully!")
                # 输出所保存的书名
        if not satisfied_name_year:
            print("Books not found.")
            # 如果没有满足条件的书，则输出对应文本。

Main方法

说明

将各个实例方法组合起来

代码

    def Main(self):
        url_list = self.splice_url()
        # 获取url列表
        all_ori_name_year = self.get_ori_name_year(url_list)
        # 获取所有书名和年份
        satisfied_name_year = self.filter(all_ori_name_year)
        # 筛选出满足条件的书籍
        self.save(satisfied_name_year)
        # 保存文件

测试！

终于写完啦，现在让我们来测试一下吧！

（为了写文章，我把我原来写好的shi重构成了现在这样，

真是累死我了，不过看起来真的优雅许多）

定义一个对象，传入三个可以更改的参数

搜索关键词，检索的页数，最低年份

Analyzer = YearAnalyzer(search="Algorithm Python", page=20, year=2020)
Analyzer.Main()

效果展示

Python爬虫项目：年份筛选器_第2张图片

Python爬虫项目：年份筛选器_第3张图片

看起来很不错！

完整代码

import requests
import re


class YearAnalyzer:
    url_1 = "http://www.banshujiang.cn/e_books/search/page/"
    url_2 = "?searchWords="
    # 对应上文url的两部分
    headers = {
        "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
        "Accept-Encoding": "gzip, deflate",
        "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6",
        "Cache-Control": "max-age=0",
        "Connection": "keep-alive",
        "Cookie": "Hm_lvt_38a41a4c5062c2a88d0e6083f47105ab=1669429515,1669440146; Hm_lpvt_38a41a4c5062c2a88d0e6083f47105ab=1669448234",
        "Host": "www.banshujiang.cn",
        "Referer": "http://www.banshujiang.cn/e_books/search/page/2?searchWords=data+mining",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.56}"
               }


    def __init__(self, page: int, year: int, search: str):
        self.trailer_page = page
        self.search = search
        self.satisfied_year = year

    # 分别是是尾页、搜索的关键字、可接受的最低年份

    def splice_url(self):
        url_list = []
        for page in range(1, self.trailer_page + 1):
            str_page = str(page)
            url = ''.join([self.url_1, str_page, self.url_2, self.search])
            url_list.append(url)
        return url_list

    def get_ori_name_year(self, url_list):
        all_ori_name_year = []

        for url in url_list:
            response1 = requests.get(url, headers=self.headers)
            # 发起请求，获取响应
            response = response1.content.decode()
            # 解码响应
            ori_year_result = re.findall(r"出版年份.*?(\d+)", response)
            # 获取所有年份
            ori_name_result = re.findall(r'书名.*?href="/e_books.*?>(.*?)', response)
            # 获取所有书名
            ori_name_year = zip(ori_name_result, ori_year_result)
            # 因为正则表达式findall方法返回的是列表。
            # 所以可以用zip()函数把每一个书名和对应的年份拼接起来。
            list_ori_name_year = list(map(list, ori_name_year))
            # 因为zip函数返回的是一个对象，而直接用list方法的话
            # 得到的是[[(书名，年份)]]，会多一层列表，这样会让遍历变得麻烦
            # 因此这里用list(map(list, zip对象))的方法，将zip对象转化为列表。
            all_ori_name_year += list_ori_name_year
            # 将遍历的结果加入到总列表

        return all_ori_name_year
        # 返回一个嵌套了元组的列表 形如：[(书名，对应年份)]

    def filter(self, ori_name_year):
        satisfied_name_li = []
        satisfied_year_li = []
        books_number = 0

        for (name, year) in ori_name_year:
            if int(year) >= int(self.satisfied_year):
                books_number += 1

                # -----------------------------------------------------------------
                if books_number >= 2:
                    print(books_number, "books have been found!")
                # 这部分代码只是为了看有多少本书满足条件，可写可不写
                else:
                    print(books_number, "book has been found!")
                # -----------------------------------------------------------------

                satisfied_name_li.append(name)
                satisfied_year_li.append(year)

        satisfied_name_year = zip(satisfied_name_li, satisfied_year_li)

        return satisfied_name_year


    def save(self, satisfied_name_year):
        for name, year in satisfied_name_year:
            # 遍历所有筛出的书籍

            with open(f"{self.search.replace('+', ' ')}最低{self.satisfied_year}年(搜索{self.trailer_page}页)结果.txt", 'a',
                      encoding="UTF-8") as F:
                # 把文件名写好，方便看

                F.write("{0:<100}{1:<10}{2}".format(name, year, "\n" * 3))
                # 用format函数，让写入的文段更美观
                print(name, "saved successfully!")
                # 输出所保存的书名
        if not satisfied_name_year:
            print("Books not found.")

    def Main(self):
        url_list = self.splice_url()
        # 获取url列表
        all_ori_name_year = self.get_ori_name_year(url_list)
        # 获取所有书名和年份
        satisfied_name_year = self.filter(all_ori_name_year)
        # 筛选出满足条件的书籍
        self.save(satisfied_name_year)
        # 保存文件


Analyzer = YearAnalyzer(search="Algorithm Python", page=20, year=2020)
Analyzer.Main()

你可能感兴趣的:(爬虫,python,软件工程,开发语言,个人开发)

【概念】Node.js，Express.js MongoDB Mongoose Express-Validator Async Handler 一袋米扛几楼98 各类概念 node.js express javascript
1.Node.js定义：Node.js是一个基于ChromeV8引擎的JavaScript运行时环境，允许你在服务器端运行JavaScript代码。作用：它使得开发者可以使用JavaScript编写服务器端代码，从而实现前后端使用同一种语言。比喻：Node.js就像是“工厂的电力系统”，它为整个工厂（应用程序）提供动力（运行环境）。没有电力系统，工厂的机器（代码）就无法运转。特点：非阻塞I/O：N
文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
网络管理 Introducing Meraki – Your Complete Network Management S AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Meraki网络管理平台是一款专为企业级网络管理员设计的网络安全解决方案。它帮助用户轻松管理和监控其组织中的所有网络设备、VLANs及其设置。Meraki网络管理平台包括许多内置功能，如集中管理，安全，可视化分析等。此外，Meraki还提供强大的RESTAPI接口，开发者可以利用这些API来定制属于自己的应用。通过将现有工具、流程和工具合成为一体的网络管理解决方
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
CAD二次开发之图纸特性字段AcDbDatabaseSummaryInfo 我的sun&shine CAD二次开发开发语言 c++
一、CAD接口类AcDbDatabaseSummaryInfo接口函数acdbGetSummaryInfo(pDb,pSum);addCustomSummaryInfo(key,value);acdbPutSummaryInfo(pSum);二、使用方法1.实现功能：在一张图纸中定义好字段，插入到另外一张图中，对应的字段会更新值。原图纸需要将对应位置写入字段的表达式例如%%%%%%%%新图纸在创建
CAD开发经验总结我的sun&shine CAD二次开发 c++
作为一个拥有三年CAD二次开发经验的C++程序员，今天将积累的经验总结整理了一下，希望对二次开发人员有帮助，一个word文档，放到下载里面了，挣点积分，文档目录截个图
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
Hive常用函数 - abs Called_Kingsley Hive hive 函数
Hive常用函数-abs官方解释abs(x)-returnstheabsolutevalueofx个人理解就是返回函数括号内数字的绝对值。想要获取该数的绝对值的时候就用这个函数没错使用示例selectabs(-1);>1官方示例abs(x)-returnstheabsolutevalueofxExample:>SELECTabs(0)FROMsrcLIMIT1;0>SELECTabs(-5)FRO
SNMP协议以及JAVA实战代码展示 potato_h java
SNMP协议以及代码实现主要是为了实现：Java通过SNMP协议和交换机进行交互JAVA开发SNMP明细第一步：（1）首先安装SNMP服务。（控制面板→添加与删除工具→添加与删除组件→管理和监视工具→详细信息→选择“简单网络管理协议”→确定）。（2）启动snmp服务。（3）下载snmp4j.jar（4）新建项目，加如snmp4j.jar，编写代码编写的代码中需要的内容：（1）枚举网元类型（目前只有
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
JavaScript基础-DOM事件流難釋懷 javascript 开发语言
在Web开发过程中，理解和掌握DOM事件流是实现高效交互的关键。DOM事件流描述了当一个事件发生时，它在文档树中的传播路径。了解事件流的概念有助于我们更精确地控制事件处理逻辑，避免不必要的行为，并提升用户体验。本文将深入探讨DOM事件流的基本概念，包括事件捕获、目标阶段和事件冒泡，并通过示例展示如何应用这些知识。一、什么是DOM事件流？DOM事件流是指事件在整个页面结构中传播的过程。根据W3C标准
python之pyttsx3实现文字转语音播报 l8947943 python问题语音识别人工智能 pyttsx3 python朗读
1.pyttsx3是什么pyttsx3是Python中的文本到语音转换库，可以实现文本的朗读功能。2.pyttsx3的安装pipinstallpyttsx33.pyttsx3的demoimportpyttsx3pyttsx3.speak("Areyouok?")pyttsx3.speak("最近有许多打工人都说打工好难")戴上耳机直接跑即可。是不是很简单！那如果我们想对读音的速率，中英文问题进行自
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
Python报错解决：img2pdf.AlphaChannelError: Refusing to work on images with alpha channel 定星照空 python 人工智能
img2pdf.AlphaChannelError:Refusingtoworkonimageswithalphachannel-solved解决img2pdf模块不能上传含alpha通道透明度的图片的问题解决img2pdf模块PNG图片转PDF文件因alpha通道报错问题文章目录前言一、AlphaChannelError为什么出现？二、该种报错解决方法1.方法一：转化其他格式图片2.方法二：去除
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
Node.js系列（2）--性能优化指南一进制ᅟᅠ ‌‍‎‏ Node.js node.js 性能优化
Node.js性能优化指南⚡引言Node.js应用的性能优化是确保应用高效运行的关键。本文将深入探讨Node.js性能优化的各个方面，包括内存管理、CPU优化、I/O优化等，帮助开发者构建高性能的Node.js应用。性能优化概述Node.js性能优化主要包括以下方面：内存优化：内存泄漏检测、垃圾回收优化CPU优化：代码执行效率、异步处理、工作线程I/O优化：文件操作、网络请求、数据库访问缓存优化：
Spring Boot 事务详解 Dong雨 spring boot 后端 java
SpringBoot事务详解引言在现代应用程序中，事务管理是确保数据一致性和完整性的重要机制。SpringBoot提供了强大的事务管理功能，使得开发者可以轻松地定义和管理事务。本文将详细介绍SpringBoot中的事务管理，包括事务传播行为、事务属性以及声明式和编程式事务管理。声明式事务管理声明式事务管理是通过注解的方式来管理事务，最常用的注解是@Transactional。这种方式简单直观，适合
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
Ubuntu使用Docker部署Nginx并结合内网穿透实现公网远程访问鸭鸭渗透 eureka 云原生
目录1.安装Docker2.使用Docker拉取Nginx镜像3.创建并启动Nginx容器4.本地连接测试5.公网远程访问本地Nginx5.1内网穿透工具安装5.2创建远程连接公网地址5.3使用固定公网地址远程访问在开发人员的工作中，公网远程访问内网是其必备的技术需求之一。对于运维人员和开发者来说，能够通过公网远程访问内部的服务和应用，能够极大地提升工作效率和便利性。本文将介绍如何利用Ubuntu
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
Python编程：为什么使用同步原语林十一npc Python语言 python 开发语言
Python编程：为什么使用同步原语1.同步原语同步原语：计算机科学中用于实现进程或线程之间同步的机制。目的：提供一种方法来控制多个进程或线程的执行顺序，确保他们以一致的方式访问共享资源在多线程/多进程编程中，多个执行单元可能同时访问共享资源，导致竞态条件。同步原语通过协调执行顺序，确保数据一致性和操作原子性2.Python核心同步原语同步原语作用适用场景模块Lock（互斥锁）确保同一时间只有一个
kafka生产消息失败 ...has passed since batch creation plus linger time Lichenpar #记录BUG解决 kafka 网络安全 java
背景：公司要使用华为云的kafka服务，我负责进行技术预研，后期要封装kafka组件。从华为云下载了demo，完全按照开发者文档来进行配置文件配置，但是会报以下错误。org.apache.kafka.common.errors.TimeoutException:Expiring10record(s)fortopic-0:30015mshaspassedsincebatchcreationplusl
aws s3 java使用教程_在 Amazon S3 对象上执行操作 - 适用于 Java 的 AWS 开发工具包 weixin_42510731 aws s3 java使用教程
本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。在AmazonS3对象上执行操作AmazonS3对象表示一个文件或数据集合。每个对象必须驻留在一个存储桶中。注意上传对象使用AmazonS3客户端的putObject方法，并为其提供存储桶名称、键名称和要上传的文件。存储桶必须存在，否则将出现错误。导入importcom.amazonaws.AmazonServiceExc
python函数闭包和递归_闭包和递归_个人文章 - SegmentFault 思否 weixin_39830313 python函数闭包和递归
js变量的作用域:全局作用域(全局变量):在函数外面声明的变量**生命周期(变量从声明到销毁)：页面从打开到关闭.局部作用域(局部变量):在函数里面声明的变量**生命周：开始调用函数到函数执行完毕1.闭包使用介绍1.闭包介绍(closure)1.1闭包：是一个可以在函数外部访问函数内部变量的函数->闭包是函数1.2闭包作用：可以在函数外部访问函数内部变量->延长局部变量的生命周期1.3闭包语法：-
python函数闭包和递归_python函数基础3--闭包 + 递归 + 函数回调 weixin_39532019 python函数闭包和递归
一、闭包1.函数嵌套defouter():print("外层函数")definner():print("内层函数")returninner()outer()函数嵌套流程图2.闭包闭包的表现形式：函数里面嵌套函数，外层函数返回内层函数的函数名，这种情况就称之为闭包defouter():print("外层函数")definner():print("内层函数")returninnerret=outer(
如何在Spring Boot中设置HttpOnly Cookie以增强安全性遥不可及~~斌 spring boot 后端 java
引言在Web开发中，Cookie是用于在客户端和服务器之间传递信息的重要机制。然而，Cookie的安全性一直是一个备受关注的问题。特别是当Cookie中存储了敏感信息（如会话ID）时，如何防止这些信息被恶意脚本窃取就显得尤为重要。HttpOnly属性是增强Cookie安全性的一种有效手段。本文将详细介绍如何在SpringBoot中设置HttpOnlyCookie，并探讨其背后的安全机制。什么是Ht
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他