每天看一遍，防止恋爱&&堕落

《Python网络爬虫技术》读书笔记1

文章目录

使用Selenium爬取动态网页

部署Selenium
简答使用Selenium
页面等待
元素选取
页面操作

填充表单
执行JavaScript

模拟登陆

简单的处理验证码
代理
使用Requests库配置代理IP
用post方式进行登陆
使用cookie
一个综合的例子

终端协议分析

分析app抓包

设置Fiddler工具
设置Android系统的手机
打开对应的app

使用Selenium爬取动态网页

部署Selenium

请参考：
python+selenium 安装及部署

简答使用Selenium

打开一个网站后，在新开一个tab打开另外一个网站

#!/usr/bin/env python
# encoding: utf-8

import time
from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http://www.ptpress.com.cn/search/books')
browser.execute_script('window.open()')
print(browser.window_handles)
browser.switch_to_window(browser.window_handles[1])
browser.get('http://www.tipdm.com')
time.sleep(1)
browser.switch_to_window(browser.window_handles[0])
browser.get('http://www.tipdm.org')

页面等待

Selenium Webdriver提供两种类型的等待——隐式和显式。显式的等待使网络驱动程序在继续执行之前等待某个条件的发生。隐式的等待使WebDriver在尝试定位一个元素时，在一定的时间内轮询DOM

元素选取

在页面中定位元素有多种策略。Selenium库提供了如表所示的方法来定位页面中的元素，使用find_element进行元素选取。在单元素查找中使用到了通过元素ID进行定位、通过XPath表达式进行定位、通过CSS选择器进行定位等操作。在多元素查找中使用到了通过CSS选择器进行定位等操作

页面操作

填充表单

首先打开目标网页http://www.ptpress.com.cn/search/books，在chrome的F12中，按到对应元素的selector，这样才能在Selenium中进行操作

#!/usr/bin/env python
# encoding: utf-8

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()
driver.get('http://www.ptpress.com.cn/search/books')
wait = WebDriverWait(driver, 10)
# 等待确认按钮加载完成
confirm_btn = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '#app > div:nth-child(1) > div > div > div > button > i')))
# 填入文本框内容
search_text = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '#searchVal')))
# 填入文本框内容
search_text.send_keys("zengraoli")
# 单击搜索
confirm_btn.click()

效果如下

执行JavaScript

Selenium库中的execute_script方法能够直接调用JavaScript方法来实现翻页到底部、弹框等操作。比如在“http://www.ptpress.com.cn/search/books”网页中通过JavaScript翻到页面底部，并弹框提示爬虫

示例代码如下

#!/usr/bin/env python
# encoding: utf-8

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Chrome()
driver.get('http://www.ptpress.com.cn/search/books')
wait = WebDriverWait(driver, 10)
driver.execute_script('window.scrollTo(0, document.body.scrollHeight)')
driver.execute_script('alert("python爬虫")')

模拟登陆

简单的处理验证码

如果遇到输入验证码的登录，模拟登陆的思路大概为，通过找到验证码的图片，用PIL库显示出来，人工进行输入，再去提交处理

下面的代码实现了，获取验证码的图片然后进行显示

#!/usr/bin/env python
# encoding: utf-8

import requests                                   # 导入Requests库
from PIL import Image                             # 导入PIL库的Image模块

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) Chrome/65.0.3325.181'}
captcha_url = 'http://www.tipdm.org/captcha.svl'
response = requests.get(captcha_url, headers=headers)
with open('captcha.gif', 'wb') as f:
	f.write(response.content)
im = Image.open('captcha.gif')                        # 创建image对象
im.show()                                        # 显示图片，会在电脑上自动弹出
captcha = input('请输入验证码： ')
print(captcha)

显示的验证码如下

代理

每次输入验证码会比较麻烦，效率低下。而且当网站服务器多次对指定IP弹出验证码后，可能会封禁该IP，导致爬取无法进行。因此，使用代理IP的方法，使用多个IP切换跳过验证码，成为应对反爬虫的主要手段

获取代理IP的三种方式

VPN：是Virtual Private Network的简称，指专用虚拟网络。国内外很多厂商都提供VPN服务，可自动更换IP，实时性高，速度快，但价格较高，适合商用
IP代理池：指大量IP地址集。国内外很多厂商将IP做成代理池，提供API接口，允许用户使用程序调用，但价格也较高
ADSL宽带拨号：是一种宽带上网方式。特点是断开重连会更换IP，爬虫使用这个原理更换IP，但效率低，实时性差

使用Requests库配置代理IP

Requests库为各个发送请求的函数（get、post、put等）配置代理IP的参数是proxies，它接收dict。为保障安全性，一些代理服务器设置了用户名和密码，使用它的IP时需要带上用户名和密码，IP地址的基本格式如下

http://用户名:密码@服务器地址

一个示例

#!/usr/bin/env python
# encoding: utf-8

import requests

proxies = {'http': 'http://zeng:[email protected]:808'}
r = requests.get("http://www.tipdm.org", proxies=proxies)
print(r.status_code)

输入输出200即为访问成功

用post方式进行登陆

这是普通的方法，直接进行提交

#!/usr/bin/env python
# encoding: utf-8

import requests

data = {'username': 'pc2019', 'password': 'pc2019', 'captcha': 'begv'}
r = requests.post('http://www.tipdm.org/login.jspx', data=data)
print(r) # ，虽然200，但是不会有正确数据，因为验证码肯定是不对的

使用cookie

Cookie用于服务器端识别客户端，当发送请求的客户端享有同样的Cookie时，即可认定客户端是同一个。Requests库的会话对象Session能够跨请求地保持某些参数，比如Cookie，它令发送请求的客户端享有相同的Cookie，保证表单数据的匹配

data = {'username': 'pc2019','password':'pc2019','captcha':'begv'}
s = requests.session()
r = s.post('http://www.tipdm.org/login.jspx', data=data)
print(r)

一个综合的例子

结合上面的代码，用post进行登录后拿到cookie保存到文件中，再用这个cookie去访问会员中心，查看是否能正常使用cookie

#!/usr/bin/env python
# encoding: utf-8

import requests
from PIL import Image
# 导入cookiejar模块
from http import cookiejar

s = requests.Session()
# 创建LWPCookieJar对象，若Cookie不存在建立Cookie文件，命名为cookie
s.cookies = cookiejar.LWPCookieJar('cookie')

login_url = 'http://www.tipdm.org/login.jspx'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) Chrome/65.0.3325.181'}

def get_captcha():
    captcha_url = 'http://www.tipdm.org/captcha.svl'
    response = s.get(captcha_url, headers=headers)
    with open('captcha.gif', 'wb') as f:
        f.write(response.content)
    im = Image.open('captcha.gif')
    im.show()
    captcha = input('请输入验证码： ')
    return captcha

login_data = {'username': 'pc2019', 'password': 'pc2019', 'captcha': get_captcha()}
r = s.post(login_url, data=login_data, headers=headers)

# 测试是否成功登陆
print('发送请求后返回的网址为：', r.url)

# 保存cookie
s.cookies.save(ignore_discard=True, ignore_expires=True)

try:
    s.cookies.load(ignore_discard=True) # 加载保存的cookie文件
except:
    print('Cookie 未能加载！')

# 携带Cookie提交请求
member_center_url = "http://www.tipdm.org/member/index.jspx"
r = s.get(member_center_url, headers=headers)

# 测试是否成功登陆
print('发送请求后返回的网址为：', r.text) # 是否输出会员信息

终端协议分析

分析app抓包

设置Fiddler工具

打开fiddler的tools，选择options，选中“Decrypt HTTPS traffic”，Fiddler即可截获HTTPS请求，如下图所示

切换至“Connections”选项卡，选中“Allow remote computers to connect”，表示允许远程设备将HTTP/HTTPS请求发送到Fiddler，如下图所示。此处默认的端口号是8888，可以根据需求更改，但是需注意不能与已使用的端口冲突

设置Android系统的手机

访问pc的ip:8888，下载证书，完成后设置wifi的代理为pc的ip，端口为8888

打开对应的app

打开人民日报手机APP，在Fiddler工具的左侧栏找到人民日报APP的信息，每个Fiddler工具抓取到的数据包都会在该列表中展示，单击具体的一条数据包后，可以在右侧菜单上单击“Insepector”按钮查看数据包的详细内容。Fiddler工具的右侧栏主要分为请求信息（即客户端发出的数据）和响应信息（服务器返回的数据）两部分。在请求信息上，单击“Raw”按钮（显示Headers和Body数据），在响应信息单击“JSON”（若请求或响应数据是json格式，以json形式显示请求或响应内容），如下图所示

在Fiddler中得到GET请求的URL地址后，Chrome浏览器需要下载JSON-handle插件，才能看到返回的JSON格式的信息

你可能感兴趣的:(IT书籍读书笔记)

Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
SpringBoot+Mybatis 实现简单的学生书籍管理系统 Chronoluckyy spring boot mybatis 数据库
本文将介绍如何使用SpringBoot框架来构建一个简单的学生书籍管理系统，其中包括用户的注册和登录验证，并通过分层设计来实现系统的模块化和可维护性。一、准备工作1.使用Navicat创建数据库表2.导入依赖包和对应的数据库驱动在resources/application.propertiespom.xml下导入依赖包org.mybatis.spring.bootmybatis-spring-bo
基于STM32的智能图书馆管理系统 STM32发烧友 stm32 嵌入式硬件单片机
1.引言传统图书馆管理存在借还效率低、书籍定位困难等问题。本文设计了一款基于STM32的智能图书馆管理系统，通过RFID技术、智能导航与自助服务终端，实现图书精准管理，提升读者服务体验。2.系统设计2.1硬件设计主控芯片：STM32F429ZI，集成LCD控制器与硬件JPEG解码感知模块：RFID读写器（MFRC522）：识别图书标签红外传感器（E18-D80NK）：检测书籍存取状态重量传感器（H
《Spring实战》读书笔记-第3章高级装配 2401_89790580 spring oracle 数据库
Spring表达式语言在上一章中，我们看到了一些最为核心的bean装配技术。你可能会发现上一章学到的知识有很大的用处。但是，bean装配所涉及的领域并不仅仅局限于上一章所学习到的内容。Spring提供了多种技巧，借助它们可以实现更为高级的bean装配功能。在本章中，我们将会深入介绍一些这样的高级技术。本章中所介绍的技术也许你不会天天都用到，但这并不意味着它们的价值会因此而降低。3.1环境与prof
书籍-《机器人与智能自主系统：技术与应用（论文版）》机器人人工智能
书籍：RoboticsandSmartAutonomousSystems:TechnologyandApplications作者：RashmiPriyadarshini，RamMohanMehra，AmitSehgal，PrabhuJyotSingh出版：CRCPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器人与智能自主系统：技术与应用（论文版）》01书籍介绍本书详细探讨了机器
【深度学习入门：基于python的理论与实现读书笔记】第五章误差反向传播法 Bin二叉深度学习 python 人工智能
目录摘要第五章误差反向传播法简单层的实现乘法层的实现加法层的实现激活函数层的实现ReLU层Sigmoid层Affine层和Softmax层的实现Affine层Softmax-with-Loss层误差反向传播法的实现摘要该文章简要介绍了神经网络的误差反向传播法，省去了大量的推理过程，重点讲述了神经网络误差反向传播法的代码实现。第五章误差反向传播法反向传播就是从后到前局部计算偏导数并将其与从上游传来的
使用 LLM 实现的 RSS 个性信息推送，效果实测 day2
每天早上，我都会点开coze推送的RSS邮件，经常能找到感兴趣的有用信息。因为铺天盖地的deepseek，蹭热点的文章很多，我往往只瞄一眼标题今天出现了这么3条信息，实在开心嵌入式那条，原因是我最近笔记里写了nRF的开发配置，我正在被zephyr开发工具链折磨。工作记忆那一条，跟我最近《学习的门道》读书笔记有关隐私优先那一条，跟我跟xBeta讨论笔记工具有关每天推送的邮件让人期待的感觉真好。
读书笔记 - 代码整洁之道：程序员的职业素养天罚神读书笔记 java
读书笔记-代码整洁之道：程序员的职业素养第1章职业道德了解你的领域，每个专业软件开发人员必须精通的事项坚持学习练习辅导第2章说“不”对抗角色高风险时刻要有团队精神试试看消极对抗说"是"的成本如何写出好代码第3章说“是”承诺用语承诺识别缺乏承诺的征兆坚守原则第4章编码不要在疲劳的时候写代码不要在焦虑的时候写代码理性应对中断如何应对阻塞状态关于调试保持好节奏进度延迟加班帮助帮助他人接受他人的帮助辅导定
读书笔记 - 修改代码的艺术天罚神读书笔记 java
读书笔记-修改代码的艺术第1章修改软件第2章带着反馈工作系统变更方式反馈方式遗留代码修改方法第3章感知和分离伪协作程序模拟对象第4章接缝模型接缝第5章工具自动化重构工具单元测试用具第6章时间紧迫，但必须修改新生方法（SproutMethod）新生类（SproutClass）包装方法包装类装饰器模式第7章永远都无法完成的修改第8章如何添加新特性测试驱动开发测试驱动开发使用了下面这样的步骤：对于遗留代
iOS开发书籍推荐 - 《高性能 iOS应用开发》（附带链接）胖虎1 开发经验分享 ios iOS开发 iOS 高性能 iOS高级 iOS进阶
引言在iOS开发的过程中，随着应用功能的增加和用户需求的提升，性能优化成为了不可忽视的一环。尤其是面对复杂的界面、庞大的数据处理以及不断增加的后台操作，如何确保应用的流畅性和响应速度，成为开发者的一大挑战。《高性能iOS应用开发》这本书正是为了解决这些问题，提供了深入的性能优化指导。这本书不仅涵盖了从应用启动到界面渲染、从内存管理到多线程处理的各个性能优化方面，还通过具体的案例和实用的技巧，帮助开
关于DeepSeek与ChatGPT等模型的原始训练数据月光技术杂谈大模型初探 chatgpt deepseek 训练数据语料库 AI模型训练样本数据分类
DeepSeek与ChatGPT等模型的原始训练数据是否一样训练数据的相似性与差异性相似性：DeepSeek和ChatGPT等模型在训练数据上有一定的重叠。它们都使用了大量的公开互联网文本，包括网页内容、书籍、论文、社交媒体帖子等。这些数据为模型提供了广泛的知识基础和语言理解能力。差异性：DeepSeek更侧重于中文语境的优化，因此其训练数据中包含了更多的中文互联网内容，如新闻、论坛、百科等。而C
JavaScript结构型设计模式---外观模式安静一会儿 JavaScript 设计模式设计模式外观模式
参考书籍：JavaScript设计模式外观模式：为一组复杂的子系统接口提供一个更高级的统一接口，使更加容易的访问子系统对底层结构兼容性做封装functionaddEvent(dom,type,fn){//if(dom.addEventListener){dom.addEventListener(type,fn,false);//}elseif(dom.attachEvent){dom.attach
控制论的革命者：阿拉德时代智利的技术与政治 shenminyin 控制论社会主义科学技术史赛博历史传记
本书背景位于南美国家智利，版图形如窄条，夹在安第斯山脉与太平洋之间。1970年，智利选民选择了在萨尔瓦多·阿连德·戈森斯（SalvadorGuillermoAllendeGossens）的领导下通过民主道路进行社会主义变革。图书推荐书籍简介本书讲述了20世纪70年代智利阿连德政府时期，一场独特的技术与政治变革实验——Cybersyn项目。这是一个旨在通过控制论和计算机技术，建立覆盖全国的实时经济信
Effective Objective-C 2.0 读书笔记——内存管理（下）小鹿撞出了脑震荡 objective-c java 开发语言
EffectiveObjective-C2.0读书笔记——内存管理（下）在dealloc方法中只释放引用并解除监听对象在经历其生命期后，最终会为系统所回收，这时就要执行dealloc方法了。在每个对象的生命期内，此方法仅执行一次，也就是当保留计数降为0的时候。在这个方法之中，主要就是释放对象所拥有的引用。比如CoreFoundation对象就必须手工释放，因为它们是由纯C的API所生成的。在dea
开发书籍精选！！不可错过艾利克斯冰开发书籍
开发书籍精选！！不可错过https://mp.weixin.qq.com/s/DGupHJiFc5TlVMVUPncY_A
C++ primer plus C_VuI c++
C++primerplus(第六版）文章目录C++primerplus(第六版）梗概梗概编程世界日新月异，各种编程语言层出不穷，但C++始终凭借其高效、灵活和强大的性能在众多领域占据着重要地位。当我们决定踏入C++的学习领域时，一本好的教材就显得尤为关键。《C++PrimerPlus》正是这样一本兼具权威性和实用性的经典书籍，它陪伴了一代又一代的程序员成长。作为一名对C++充满热情的学习者，我在阅
书籍-《概率论I：随机变量与分布》概率人工智能
书籍：ProbabilityTheoryI:RandomVariablesandDistributions作者：AndreaPascucci出版：Springer编辑：陈萍萍的公主@一点人工一点智能书籍下载-《概率论I：随机变量与分布》01书籍介绍本书提供了概率论简洁而严谨的介绍。在处理这一主题的各种方法中，选择了基于测度理论的最现代方法：尽管这种方法需要更高的数学抽象和精密度，但对于更高级话题如
书籍-《控制理论的数学导论（第三版）》机器人数学
书籍：AMathematicalIntroductiontoControlTheory作者：ShlomoEngelberg出版：WorldScientificPublishingCompany编辑：陈萍萍的公主@一点人工一点智能下载：《控制理论的数学导论（第三版）》01书籍介绍本书在数学严谨性和工程应用之间达到了完美的平衡，有助于学生全面理解控制理论的数学和工程层面。本书不仅有效运用了MATLAB
书籍-《机器学习的秘密：它是如何工作的以及它对你的意义》机器学习深度学习人工智能
书籍：SecretsOfMachineLearning:HowItWorksAndWhatItMeansForYou作者：TomKohn出版：WorldScientificPublishingCoPteLtd编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习的秘密：它是如何工作的以及它对你的意义》01书籍介绍在众多关于机器学习和人工智能的技术文献及充满恐慌的书籍中，《机器学习的秘密》犹
书籍-《掌握Transformer：从BERT到大模型和Stable Diffusion（第二版）》
书籍：MasteringTransformers:TheJourneyfromBERTtoLargeLanguageModelsandStableDiffusion，2ndEdition作者：SavaşYıldırım，MeysamAsgari-Chenaghlu出版：PacktPublishing编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《掌握Transformer：从BERT到大模型
书籍-《四旋翼无人机的自适应混合控制》无人机机器人
书籍：AdaptiveHybridControlofQuadrotorDrones作者：NihalDalwadi，DipankarDeb，StepanOzana出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《四旋翼无人机的自适应混合控制》01书籍介绍本书详细探讨了尾座式四旋翼和双翼四旋翼型混合无人飞行器（UAV）的动力学特性，并在此基础上设计了多种非线性控制器，包括反步
揭秘！考 BDA 所需强度指南东总学长同济预备研0 数据分析信息可视化 python 求职招聘
宝子们，初级BDA我已顺利拿下～迫不及待来和大家分享热乎乎的备考历程，希望能给正在备考或打算考的小伙伴一些参考。我选择BDA数据分析师证书，是因为它由中国信息协会市场研究业分会&中经数（北京）数据应用技术研究院联合认证，对想进入数据分析行业、提升专业水平的人超有帮助！下面给大家分享我的学习攻略：业务知识（1周左右）深入了解业务知识，能为数据分析提供更深层次支持。推荐书籍《深入浅出数据分析》《精益数
计算机学习建议 qincjun 学习
对于现代得计算机开发者而言；最快的是要见到成效；这是一个功利性的社会；对于99%的人来说，先保证自己可以在社会上活下去才是最重要的；而不是追求梦想；一、职业Web前端：HTML、CSS、JavaScript、Vue3框架、React框架等；客户端：C#后端：(C语言、C++)或者Java数据库：MySQL之类的数据库操作；算法工程师：算法相关书籍；架构师：Linux相关；并做过前后端请一定要想好去
【转】时间序列分析——基于R，王燕 weixin_30780221 r语言
《时间序列分析——基于R》王燕，读书笔记笔记：一、检验：1、平稳性检验：图检验方法：时序图检验：该序列有明显的趋势性或周期性，则不是平稳序列自相关图检验：（acf函数）平稳序列具有短期相关性，即随着延迟期数k的增加，平稳序列的自相关系数ρ会很快地衰减向0（指数级衰减），反之非平稳序列衰减速度会比较慢构造检验统计量进行假设检验：单位根检验adfTest()——fUnitRoots包2、纯随机性检验、
raspberry pi_书评：“ Raspberry Pi for Secret Agents”的使用效果不佳 cuml0912 游戏 java 人工智能 python linux
raspberrypi许多父母在Opensource.com上看到我女儿的文章，并经常问我：“您是如何使您的女儿开始使用RaspberryPi的？”一切都从RaspberryPi作为圣诞节礼物开始，而我们以RaspberryPi教育手册作为指南开始。作为免费下载，这是一个很好的入门入门。然后我们转到其他书籍，例如《RaspberryPi入门》，我开始注意到一些模式。这些书经常一遍又一遍地涉及相同的
《构建之法》 –读书笔记 Lishq2004 读书笔记软件开发软件工程读书笔记构建
《构建之法》–读书笔记lishq为什么读这本书:这是一本非常接地气的讲《软件工程》的书，第一次了解到这本书是从豆瓣上看到，看了下密密麻麻的正面评论，觉得内容应该不错。翻阅了几个章节，发现干货确实挺多。为方便大家了解，摘抄作者简介以及部分书评如下。---------------------------------------------------------------------------
Java程序性能优化读书笔记（一）：Java性能调优概述 anxunnian1498 java 数据库操作系统
程序性能的主要表现点：执行速度：程序的反映是否迅速，响应时间是否足够短内存分配：内存分配是否合理，是否过多地消耗内存或者存在内存泄漏启动时间：程序从运行到可以正常处理业务需要花费多少时间负载承受能力：当系统压力上升时，系统的执行速度、响应时间的上升曲线是否平缓衡量程序性能的主要指标：执行时间：程序从运行到结束所使用的时间CPU时间：函数或者线程占用CPU的时间内存分配：程序在运行时占用内容的空间磁
C# 教程目录 .Net学习 C#教程 C#教程
之前有感于VB.Net书籍提供的学习内容要么很低级，要么很高级，缺少中间层级。低级的根本就不能带你进入编程的殿堂，知其然不知其所以然；而高级的你可能看看就倦怠了，因为太高深了，不易看懂。还没有开始就会打退堂鼓，因而制作了VB.Net的教程：《VB.Net循序渐进》（VB.NetStepByStep）。虽然就我个人而言，用惯了VB，但是无可否认的是C#的势头已经超越VB，作为程序员的我们一是需要与时
06 Django-orm-多表操作 lzplum619 Django Linux相关 django python
一创建模型实例：我们来假定下面这些概念，字段和关系作者模型：一个作者有姓名和年龄。作者详细模型：把作者的详情放到详情表，包含生日，手机号，家庭住址等信息。作者详情模型和作者模型之间是一对一的关系（one-to-one）出版商模型：出版商有名称，所在城市以及email。书籍模型：书籍有书名和出版日期，一本书可能会有多个作者，一个作者也可以写多本书，所以作者和书籍的关系就是多对多的关联关系(many-
读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读躺柒人工智能算法导读总结 AI
1.基本信息算法简史：从美索不达米亚到人工智能时代克里斯·布利克利著中信出版集团股份有限公司,2024年9月出版1.1.读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653÷186000≈27.77%1.2.读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱：超级平台、算法垄断与场景欺骗天才与算法：人脑与AI的数学思维算法图解1.3.笔记--章节对
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他