嗨！栗子同学

【Python实战】听书就用它了：海量资源随便听,内含几w书源,绝对精品哦~（好消息好消息）

前言

有温度有深度有广度就等你来关注哦~

所有文章完整的素材+源码都在

粉丝白嫖源码福利，请移步至CSDN社区或文末公众hao即可免费。

哈喽！我是栗子同学，继续更新——今天聊一聊“西马拉雅”。（谐音梗不然爬不了拉）

PS——小故事

“西马拉雅”——地球上最高大的山脉，8848 米的巅峰，几乎要碰触太空，75 座 7000 米级雪山，

俯瞰地球所有地方，平均海拔 4000 米的高原，垂直高度 5000 米的峡谷，孕育出世界上最多

样的动植物群落。搞错了，再来

今天讲的西马拉雅听书是一款手机听书软件，这货的好评是名不虚传的，分类明确的到了各个

领域，今天，小编就来用代码给大家扒一扒那些数据，让大家实现听书自由。

正文

一、运行环境

1）Python环境

环境： Python 3 、Pycharm、requests 、re 。re内置模块，安装好python环境就可以了。

（win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可

以切换国内镜像源)）

第三方库的安装：pip install + 模块名或者带镜像源 pip install -i pypi.douban.com/simple/ +模块名

2) 爬虫基本流程思路

一. 数据来源分析:

1. 明确需求: - 采集什么数据? 音频名字, 音频播放链接 url

2. 抓包分析, 分析我们想要数据内容, 它是来自于哪里抓包分析 --> 通过浏览器<谷歌>自带工

具: 开发者工具 - 打开开发者工具: F12 或者鼠标右键点击检查选择network - 刷新网页 --->

让本网页数据内容重新加载一遍 <可以看到相应的数据包> - 分析音频播放链接在什么地方点

击播放 ---> media 里面就有音频播放链接：

https://aod.cos.tx.xmcdn.com/group31/M00/21/93/wKgJX1mBk5uisCN6ARUZGpfUCIk519-aacv2-48K.m4a

- 继续分析这个音频播放链接是从什么地方生成的 ---> 生成数据包通过搜索

wKgJX1mBk5uisCN6ARUZGpfUCIk519-aacv2-48K

找到相应数据包音频数据包:

https://www.ximalaya.com/revision/play/v1/audio?id=45982639&ptype=1

通过两个音频数据包请求url地址对比 ---> 主要改变 ID

只要获取所有音频ID, 就可以获取所有音频播放链接 -

通过搜索 ID 找到ID所在的地方 ---> 在什么地方可以获取到所有音频ID

https://www.ximalaya.com/album/9723091 <音频列表页面>

目的: 获取音频播放链接 --> 音频数据包 ---> 需要传入音频ID  ---> 音频列表页面

二. 代码实现步骤:

基本四大步骤: 发送请求, 获取数据, 解析数据, 保存数据

1. 发送请求, 模拟浏览器对于音频列表页面发送请求
https://www.ximalaya.com/album/9723091 
2. 获取数据, 获取服务器返回响应数据开发者工具当中所看到 response

3. 解析数据, 提取我们想要的数据内容 - 音频名字 - 音频ID

4. 发送请求, 模拟浏览器对于音频数据包发送请求
https://www.ximalaya.com/revision/play/v1/audio?id=45982639&ptype=1 
5. 获取数据, 获取服务器返回响应数据开发者工具当中所看到 response

6. 解析数据, 提取我们想要的数据内容 - 音频url

7. 保存数据, 把数据内容保存本地。

二、代码展示

1）主程序

import requests
# 正则表达式模块 --> 内置模块 不需要安装
import re
"""
1. 发送请求, 模拟浏览器对于 音频列表页面 发送请求
    爬虫代码, 需要伪装一下
        不伪装, 可能会被反爬 --> 得不到数据, 或者得到数据不是你想要的内容
"""
# 音频列表页面
url = 'http://www.ximalaya.com/album/9723091'
# 伪装模拟 headers 请求头<字典数据类型>
headers = {
    # user-agent 用户代理, 表示浏览器基本身份信息
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
# 发送请求:
# 调用requests模块里面get请求方法, 对于url地址发送请求, 并且携带上headers请求头伪装, 最后用自定义变量response接受返回数据
response = requests.get(url=url, headers=headers)
#  response响应<>对象  200 状态码 表示请求成功
print(response)
"""
2. 获取数据, 获取服务器返回响应数据
    开发者工具当中所看到 response
        - response.text 获取响应文本数据
3. 解析数据, 提取我们想要的数据内容
    - 音频名字
    - 音频ID
正则表达式 --> re

调用re模块里面findall方法 --> 找到所有, 找到所有我们想要的数据内容
re.findall('匹配什么数据', '什么地方'): 从什么地方, 去匹配什么数据
    - .*? 表示匹配任意字符<除了\n换行符 回车>
    - \d+ 表示匹配0个或者多个数字
"""
# 音频名字
titles = re.findall('"tag":0,"title":"(.*?)","playCount"', response.text)
# 音频ID
audio_id_list = re.findall('"url":"/sound/(\d+)","duration"', response.text)
# for循环遍历, 把列表里面元素一个一个提取出来
for title, audio_id in zip(titles, audio_id_list):
    """
    4. 发送请求, 模拟浏览器对于 音频数据包 发送请求
        https://www.ximalaya.com/revision/play/v1/audio?id=45982639&ptype=1
    5. 获取数据, 获取服务器返回响应数据
        开发者工具当中所看到 response
        
        根据开发者工具当中的response的数据显示, 可以选择不同数据获取方式
        
    """
    # 字符串格式化方法 format 把 audio_id 传到 这个链接里面
    link = f'https://www.ximalaya.com/revision/play/v1/audio?id={audio_id}&ptype=1'
    # 发送请求
    response_1 = requests.get(url=link, headers=headers)
    # 获取数据 response.json() 获取响应json字典数据
    # print(response_1.json())
    """
    6. 解析数据, 提取我们想要的数据内容
        - 音频url
        根据字典取值: 键值对取值, 根据冒号左边的内容[键], 提取冒号右边的内容[值]
    7. 保存数据
    """
    audio_url = response_1.json()['data']['src']
    # 对于 音频链接 发送请求, 获取数据
    audio_content = requests.get(url=audio_url, headers=headers).content
    with open('data\\' + title + '.mp3', mode='wb') as f:
        f.write(audio_content)
    print(title, audio_url)

三、效果展示

1）展示效果1.

1）展示效果2.

总结

好啦！文章到这里就正式结束了哈——想我的话我们下期再见，记得三连啊哈~

✨完整的素材源码等：可以滴滴我吖！或者点击文末hao自取免费拿的哈~

推荐往期文章——

项目0.2 【Python实战】WIFI密码小工具，甩万能钥匙十条街，WIFI任意连哦~（附源码）

项目0.3 【Python实战】再分享一款商品秒杀小工具，我已经把压箱底的宝贝拿出来啦~

项目0.1 【Python抢票神器】火车票枪票软件到底靠谱吗？实测—终极攻略。

项目0.4 【Python实战】年底找工作，年后不用愁，多个工作岗位随你挑哦~

文章汇总——

Python文章合集 | (入门到实战、游戏、Turtle、案例等)

（文章汇总还有更多你案例等你来学习啦~源码找我即可免费！）

你可能感兴趣的:(Python爬虫系列,爬虫,Python,python,爬虫,喜马拉雅,听书网站,爬虫代码)

Python __init__.py 愚昧之山绝望之谷开悟之坡 python init
Python__init__.py作用详解尼古拉苏关注12018.06.1012:57:34字数745阅读45,278转载于：https://www.cnblogs.com/tp1226/p/8453854.html__init__.py该文件的作用就是相当于把自身整个文件夹当作一个包来管理，每当有外部import的时候，就会自动执行里面的函数。1.标识该目录是一个python的模块包（modul
uniapp uni-easyinput组件textarea属性去除在支付宝小程序右下角的数字统计独揽月下萤火√ uni-app 小程序前端 javascript 钉钉
问题描述：在使用uniapp的uni-easyinput组件的textarea时，编译到支付宝小程序时，右下角带有数字统计，有些时候是不需要的，找了很多方法，最终解决问题解决：使用show-count属性设为false就可以了，但是要注意，这个属性在uniapp的uni-easyinput组件中是没有的，所以需要修改uni-easyinput组件的源代码。
从零手撕 LLaMa3 项目爆火（图解+代码）机器学习社区大模型深度学习大模型算法人工智能 RAG 多模态大模型 Llama 面试题
节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。汇总合集《大模型面试宝典》(2024版)发布！一个月前，Meta发布了开源大模型llama3系列，在多个关键基准测试中优于业界SOTA模型，并在代码生成任务上全面领先。此后，开发
从零打造工业级智能二维码识别系统：基于PyQt5与ZXingCpp的实战指南蜡笔小新星 PyQt5 qt 开发语言 python 图像处理经验分享 pyqt 扫码读码解码
文章目录第一章：系统全景解析1.1实时识别工作流图解1.2界面布局与功能分区说明1.3代码文件结构树形图第二章：环境搭建与依赖管理2.1必需组件清单2.2虚拟环境配置步骤2.3摄像头硬件检测方法第三章：多线程视频采集3.1VideoThread类设计剖析3.2图像采集核心循环3.3线程安全停止机制3.4信号槽通信实例第四章：图像预处理流水线4.1预处理方法开关实现4.2自适应二值化算法4.3图像格
Linux: windows或者Ubuntu解压分卷压缩、解压zip、z01、z02 壹十壹 Linux linux ubuntu 运维
1windows系统：1.1使用WinRAR下载并安装WinRAR：WinRAR官方网站执行解压操作：找到包含.z01,.z02,…文件的文件夹。在.zip文件（主文件）或.z01文件上右键点击，选择“ExtractHere”（解压到此处）或“Extractto[文件夹名]”。WinRAR将会自动识别并解压所有分卷。2.2使用7-Zip下载并安装7-Zip：7-Zip官方网站执行解压操作：找到包含
Lombok：让 Java 代码更简洁优雅的神器 Kale又菜又爱玩 java 开发语言
Lombok：让Java代码更简洁优雅的神器1.Lombok简介在Java开发中，我们常常被大量重复的getter、setter、toString、equals和hashCode方法所困扰。这些样板代码（BoilerplateCode）不仅冗长，还降低了代码的可读性和维护性。Lombok作为一个轻量级Java库，能够自动生成这些方法，极大地提升了开发效率，让代码更加简洁优雅。1.1Lombok的引
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
Digicert SSL 证书 https
Digicert作为世界最早的证书品牌，是全球领先的数字安全解决方案提供商，Digicert在SSL证书领域具有显著的市场份额和影响力。DigicertSSL证书以其高度的安全性和可靠性赢得了全球用户的信赖。众多金融机构、政府机构、电子商务网站等关键领域都选择了DigicertSSL证书来保护其网络通信安全。一、基本功能加密通信：通过使用公钥加密技术，确保用户与网站之间的数据传输是安全的。身份验证
Git前言（版本控制） Starbright. Git git
1.Git目前世界上最先进的分布式版本控制系统。git官网：https://git-scm.com/2.版本控制2.1什么是版本控制版本控制(Revisioncontrol)是一种在开发的过程中用于管理我们对文件、目录或工程等内容修改历史，方便查看更改历史记录备份以便恢复以前的版本的软件工程技术。实现跨区域多人协同开发追踪和记载一个或者多个文件的历史记录组织和保护你的源代码和文档统计工作量并行开发
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
vscode 好用插件 yqcoder vscode ide 编辑器
一、通用效率类1.AutoRenameTag在编写HTML或XML代码时，当你修改一个标签的名称，它会自动同步修改对应的结束标签，节省了手动修改的时间，提高了代码的准确性和编写效率。2.BracketPairColorizer为代码中的括号对（如()、{}、[]）添加不同的颜色，让你可以更清晰地分辨嵌套的括号层次，尤其在处理复杂代码时，能有效减少因括号匹配错误导致的问题。3.CodeRunner支
数字IC前端设计究竟怎样？薪资前景如何？ IC观察者 fpga开发集成电路模拟IC 模拟版图模拟版图入门
数字ic前端岗位介绍：数字ic前端设计处于数字IC设计流程的前端，属于数字IC设计类岗位的一种。数字ic前端设计主要分成几种层次的设计：IPlevel，unitlevel，fullchip/SoClevel，gatelevel等。作为数字IC前端工程师，为了让写的RTL代码没有bug，会经常与验证工程师要求debugcase；为了了解芯片整体架构和功能属性，还要与架构工程师打交道；还要与后端工程师
程序员如何用DeepSeek让代码效率翻倍？这份实战手册请收好后端
最近公司新来的实习生小张让我眼前一亮，上周他只用三小时就完成了原本需要两天的工作量——优化一个老旧的后端接口。当我翻开他的代码才发现，这个00后小伙子的秘密武器居然是个叫DeepSeek的AI工具。你可能已经注意到，GitHub上越来越多的开源项目开始标注"DeepSeek适配"的字样。这个由中国团队自主研发的大模型，正在悄然改变程序员的工作方式。还记得去年调试分布式系统时的痛苦经历吗？当时我对着
ES6 Class 转 ES5 实现 Tiffany_Ho 前端 javascript es6
ES6示例代码classAnimal{constructor(name){this.name=name;}eat(){console.log(`${this.name}iseating`);}staticsleep(){console.log("Sleeping");}}classDogextendsAnimal{//原型链继承+静态方法继承constructor(name,breed){supe
ES6 解构赋值详解修己xj web es6 javascript es6
ES6是JavaScript语言的一次重大更新，引入了许多新特性和语法改进，其中解构赋值是一个非常实用和灵活的语法特性。它可以让我们从数组或对象中提取值，并赋给对应的变量，让代码变得更加简洁和易读。本文将深入探讨ES6解构赋值的语法、用法及其在实际开发中的应用。数组解构赋值数组解构赋值允许我们通过类似模式匹配的方式，从数组中提取值并赋给变量，即只要等会两边的变量模式相同，左边的变量就会被赋予对应的
设计一个优秀 API 的秘诀
设计一个优秀API的秘诀本指南深入探讨了顶级API设计，强调了它不仅仅是代码的集合。一个设计良好的API就像五星级礼宾服务，能够顺畅地引导用户达到他们的预期目标。拿起一杯咖啡，让我们一起探索创建一个功能强大、用户友好的API的秘诀吧！理解API基础第一步：拥抱REST-API设计的基础优秀API构建的基石是REST。RESTfulAPI使用HTTP方法（GET、POST、PUT、DELETE），与
Qt程序闪退如何查原因呢，闪退点不是自己应用代码 bug菌¹ #CSDN问答解惑(全栈版)全栈Bug调优(实战版)qt 数据库开发语言 c++
本文收录于《CSDN问答解惑-专业版》专栏，主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述 Qt程序闪退如何查原因呢，闪退点不是自己应用代码如图，因为是qt底层，这种闪退该怎么查原因和避免呢，现在遇到很多这种底层报错又没办法查代码如上问题有来自我自身项目
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
Python字符串操作 weixin_30871905 python
转自http://blog.chinaunix.net/u/19742/showart_382176.html#Python字符串操作'''1.复制字符串'''#strcpy(sStr1,sStr2)sStr1='strcpy'sStr2=sStr1sStr1='strcpy2'printsStr2'''2.连接字符串'''#strcat(sStr1,sStr2)sStr1='strcat'sSt
浏览器自动复制插件-速记超人记事本V1.0 铁头大蚂蚁 javascript 开发语言 ecmascript
有这么一个需求，就是经常要复制某些网站的资料存到word、txt、或者excel中反复切换浏览器比较麻烦，思索再三，开发了一个浏览器插件取名为“速记超人记事本”功能如下：当我复制网页内容的时候会自动存储到浏览器插件中，如图：记录的内容自动存储到插件中，可以删除，编辑搜索，也可以导出为excel,txt格式这样我们就可以直接愉快的ctrl+c了，待我复制完成后，一键导出就可以了之前做了个1.0版本，
vue + antd使用a-select的placeholder默认显示不生效 ai~yun antd vue.js javascript 前端前端框架
代码：<<
QOpenGLShaderProgram 对象阳光开朗_大男孩儿 OpenGL c++OpenGL
本篇文章是基于完整例子和调用关系qtOpenGL-CSDN博客补充疑惑说明，但单独观看也不影响理解。shaderProgram是一个QOpenGLShaderProgram对象，负责管理和使用OpenGL着色器程序。在OpenGL中，着色器是用来在图形渲染流水线中处理顶点和像素的程序，它们定义了如何绘制每个顶点和每个像素的颜色。具体来说，shaderProgram在这个代码中做的事情包括：1.加载
Ant design vue中的a-select在动态给option赋值之后，placeholder失效丑小鸭变黑天鹅 Vue日常总结 vue.js javascript ecmascript
Antdesignvue中的a-select在动态给option赋值之后，placeholder失效一、问题描述二、解决办法1、方法一（不推荐）2、方法二一、问题描述最近做一个项目，用到了a-select，placeholder出现了问题先看一下不起作用的代码<a-select-optionv-for="iteminallCollege":key
【UDS诊断（ClearDiagnosticInformation_0x84服务）测试用例CAPL代码全解析⑦】车端域控测试工程师测试用例汽车经验分享 CANoe 学习
ISO14229-1:2023UDS诊断【ClearDiagnosticInformation_0x84服务】_TestCase07作者：车端域控测试工程师更新日期：2025年03月11日关键词：UDS诊断协议、清除诊断信息服务、ClearDiagnosticInformation_0x84服务、ISO14229-1:2023TC84-007测试用例用例ID测试场景验证要点参考条款预期结果TC84
零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
ES6解构赋值详解漫天转悠 ES6 es6 前端 ecmascript
ES6解构赋值详解ES6解构赋值是JavaScript语言的一项强大特性，它允许从数组或对象中提取数据，并将其赋值给变量。这一特性不仅简化了代码，提高了可读性，还增强了代码的灵活性。本文将详细介绍ES6解构赋值的基本概念、语法、应用场景以及一些高级用法。1.基本概念解构赋值是对赋值运算符的扩展。它允许按照一定的模式，从数组或对象中提取值，并赋值给变量。这种语法使得从复杂数据结构中提取数据变得更加简
ES6解构语法详解勇敢小陈 javascript vue.js 前端 es6
ES6的解构语法简化了我们开发过程中复杂的取值过程，可能你在a.b.c.d的时候别人早就把值一开始就取出来了，使代码更加简洁。下面开始进行语法的详解。一、单层解构单层解构constearth={people:'人类',animal:'动物'}const{people,animal}=earthconsole.log(people,animal);//人类动物单层解构并更改变量名称consteart
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他