自学小白菜

python爬虫1：基础知识

python爬虫1：基础知识

前言

python实现网络爬虫非常简单，只需要掌握一定的基础知识和一定的库使用技巧即可。本系列目标旨在梳理相关知识点，方便以后复习。

目录结构

文章目录

- python爬虫1：基础知识
- - 1. 基础认知
  - - 1.1 什么是爬虫？
    - 1.2 爬虫可以做什么？
    - 1.3 爬虫的主要流程
    - 1.4 爬虫需要学习什么？
  - 2. 网页相关知识
  - - 2.1 html基础知识
    - 2.2 静态网页与动态网页
    - 2.3 常见的网页请求模式
  - 3. 其他基础知识
  - - 3.1 数据库
    - 3.2 代理
  - 4. 总结

1. 基础认知

1.1 什么是爬虫？

这里的爬虫，一般指的是网络爬虫，即可以自动去网络上爬取我们所需的内容的脚本程序，当然这里的自动其实是说你已经写好了程序。

1.2 爬虫可以做什么？

爬虫有一句很关键的话：所见即所得。意思是你自己能在网上看见的，就是可以爬取的内容。这里需要说明一下：一个网站，你是普通用户，那么你写的爬虫也是用你自己普通用户的身份，那么只能爬取普通用户可以看见的内容，那些vip用户的内容你无法爬取（如果想要爬取，要么换一个用户账号，要么嘿嘿嘿）。

1.3 爬虫的主要流程

主要流程如下：

1. 确定目标：确定要爬取的网页/网站
2. 请求网页以获取网页源码
3. 解析网页源码以获取所需的内容
4. 将获取的内容保存到我们的本地

1.4 爬虫需要学习什么？

如果你只是学来玩（我也是菜鸡），那么可以学习的内容其实不是很多，主要为：

前端的基础知识（主要了解html、简单了解css和js）
代理、ip池构建等基础知识也需要知道
python基础知识（这个肯定必须会）
requests请求库
lxml、bs4、pyquery、re解析库（一般会其中一两个即可，反正目的是相同的）
selenium库（动态处理必须会）
数据库基础，会点简单的MySQL数据库基础就行了，不需要多深入（其实大部分时候用不到）
scrapy这个爬虫框架看自己需求

嗯，学的东西不多，只有亿点点。

2. 网页相关知识

2.1 html基础知识

这里简单说明一下html的基础知识，主要是方便看后面教程时大家都懂。

首先，随便打开一个网页，鼠标右键，选择”查看源码“，你就可以html代码了：

可以发现一个最简单的事实：html代码都是类似于xxxx这样的形式，我们将它称之为标签，其可以分为两类：双标签或者单标签。双标签就是上图中那种，同一个名字会出现两次形成闭合，单标签自然只出现一次。

标签里面的字母自然具有其特殊意义。这里我肯定不会列完，只列几个最为重要的标签，也是爬虫时用到最多的标签：

a标签：超链接标签，即我们网页看到那种可以点击跳转的东东几乎都是a标签
- 它有一个重要属性，名为href，其包好的值就是跳转的链接

img标签：图像标签，即我们网页上看到的那些图片几乎都是img标签
- 它也有一个重要属性，即src，其包含了图片的下载地址

**其实，我们爬虫，爬取的就是网页中这些具有关键信息的代码内容，然后再去利用这些去获取所需。**比如我们获取图片，其实不是真的直接就把图片下载下来，而是先获取网页源码，接着获取图片链接，最后再去下载图片。

2.2 静态网页与动态网页

现在网页常见的有两类：

静态网页
- 即我们打开网页，它直接就加载完了的，不会说你滚轮往下滚，会不停加载内容
- 这类网页爬取较为简单，只要你能绕过反爬虫机制就可以了
动态网页
- 即我们打开网页，内容只加载了部分，你往下滑动，内容会不停更新，常见的网站比如百度图片之类的
- 这类网页爬取比较困难，绕过反爬虫机制只是必须的一步，还需要进行动态处理

2.3 常见的网页请求模式

最常见的两种请求方式：

GET请求
- 比如你搜索某个东西都是GET请求
- 其一般带有参数，比如百度搜索，你随便搜索一个，看看上面的网页链接，你会发现：
- 这时候，你就意识到：GET请求的参数都是透明的（这也是为什么不用于登录这样的表单页面的），并且参数前面一般带有一个标记字段，比如这里wd=xxxx。
POST请求
- 一般涉及到填写表单（登录之类的表单）都涉及到POST请求
- POST请求肯定是隐藏看不见的，但是你想找到你提交的登录表单还是可以的，只是比较麻烦
- 这里我举个例子，豆瓣登录，选择密码登录，随便输入一串，然后点击登录，不过在此时需要打开浏览器的”检查“功能（任何浏览器都有，但是可能名字不同，这里是Google），然后细心去找：

3. 其他基础知识

3.1 数据库

为什么需要学习数据库的基础知识，主要是方便管理爬取的内容/构建代理池。

但是，其实对于我们个人学习者来说，一般用不到数据库，普通的txt文件就够用了，因此学不学习还是看自己的需求。

3.2 代理

为什么需要代理？主要目的是提高爬取速度。因为爬虫对于大部分网站来说就是害虫，因此如果你的脚本程序不限制访问速度，那么容易被判断出来是一个爬虫，就会被短时间禁掉ip。这其实属于爬虫与反爬的斗争。

对于这个问题，我们可以构建代理池，即用网上别人提供的ip去访问，这样我们可以同时调用几百个ip去访问，即使一个ip一秒钟访问1次，那么速度也提升了。

网上有免费的代理网站，不过肯定没有付费爽，但是建议大家使用免费的。

4. 总结

好的，本篇文章主要梳理了一下学习爬虫的基础知识，并为大家介绍了主要用到的基础知识。下一篇就开始介绍python的请求库requests了。

你可能感兴趣的:(python爬虫系列,python,爬虫)

华为OD机试E卷 --连续字母长度--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 java python 华为od javascript c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定一个字符串，只包含大写字母，求在包含同一字母的子串中，长度第k长的子串的长度，相同字母只取最长的那个子串。输入描述第一行有一个子串(1<长度<=100)，只包含大写字母。第二行为k的值输出描述输出连续出现次数第k多的字母的次数。用例输入AAAAHHHBBCDHHHH3输出
【Flask】以一种访问权限不允许的方式做了一个访问套接字的尝试。ERROR conda.cli.main_run:execute(49): `conda run python 1.py` fail HEX9CF Flask python flask conda
问题描述当尝试启动Flask程序时，出现了启动失败的情况。fromflaskimportFlaskapp=Flask(__name__)@app.route('index.php')defhello():return"Helloworld"if__name__=='__main__':app.run(host='127.0.0.1',port=80)并给出了如下错误提示：*ServingFlask
Python3 字典：解锁高效数据存储的钥匙李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程实战趣味编程编程技巧
Python3字典：解锁高效数据存储的钥匙内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助读
Python 深度学习实战：生成对抗网络 AI天才研究院深度学习实战 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍生成对抗网络（GenerativeAdversarialNetwork，GAN）是近年来较火热的深度学习模型之一，其在图像合成、视频生成、文本数据生成等领域均取得了不俗的效果。与传统的机器学习模型不同，GAN可以生成真实有效的数据，无需人工标注数据。它由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器通过学习，根据噪声或随机变量（latentvar
(c/c++)——C++和python的异常处理想要躺平的一枚 C++python c语言 c++
目录一、C++的异常处理二、python的异常处理——自定义异常一、C++的异常处理C++中选择用throw来抛出异常，catch来捕捉异常和处理try{//可能发生异常的语句//throw异常对象}catch(类型1){//发生类型1异常时的处理代码}catch(类型2){//发生类型2异常时的处理代码}catch(...){//不管什么异常，都在这里统一处理。}throw抛出异常对象，异常对象
【自动化】使用PlayWright+代理IP实现多环境隔离青塬科技 Python
Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。对各种开发语言也有非常好的支持。常用的NodeJs、Java、python都有支持，且有丰富的文档参考。Python环境下的安装使用1、安装依赖库pipinstallplaywright2、安装
python3.10运行moviepy失败 fendouweiqian Python python
运行异常：Nomodulenamed‘moviepy.editor’python版本为：3.10.12修复方案：pipuninstallmoviepypipinstallmoviepy==1.0.3
【Origin+Python】使用External Python批量出图代码参考2 kkkkkkkkk_1201 绘图 python 开发语言
目录前情提要进阶代码1批量绘制曲线图2曲线图设置3批量绘制相同设置的曲线图去除水印前情提要基础教程见链接:【Origin+Python】使用ExternalPython批量出图代码参考这里主要介绍一些进阶代码以及使用盗版origin要如何去除水印的方法！#############################################################进阶代码########
Python面向对象编程：精雕细琢对象的“名片”——重写 `__str__()` 和 `__repr__()` 方法清水白石008 Python题库 python python 开发语言
Python面向对象编程：精雕细琢对象的“名片”——重写__str__()和__repr__()方法在Python中，当我们使用print()函数打印一个对象，或者在交互式解释器中直接输入对象并回车时，Python会尝试将该对象转换为字符串进行显示。这个转换过程涉及到两个特殊方法：__str__()和__repr__()。正确地重写这两个方法，可以让我们更好地控制对象的字符串表示形式，提高代码的可
origin软件有python好用吗_Origin 2021大大改进了与Python的交互 weixin_39922534
经常收到同学咨询如何在Origin中管理下载Python包的问题，可以翻看上期专栏Origin2021对使用Python编程进行了重大改进。这些改进主要包括：新的originpro程序包，可使用Python语言轻松访问Origin对象和数据Python代码编辑器IDE现支持自动补完和调试功能可通过脚本或图形用户界面来安装和管理Python包设置列值，拟合函数和文本对象中使用Python函数从Lab
origin和python有什么不同_python爬虫之git的使用（origin说明） weixin_39878760
1、首先我们回忆两个命令#gitremoteaddorigin远程仓库链接#gitpush-uoriginmaster我们一起看看这个命令，git是git的一级命令，push就是下载，-u应该使用用账户验证maser就是分支的名字(前面我们说过)，那么这个origin是个什么鬼？大家看看下面的这个5毛钱图，就能发现，其实origin就是远程仓库的名称。如果不相信在看看我的配置文件#vi.git/c
tensorflow对应的python版本_tensorflow + python + keras 版本对应关系 weixin_39912303
TensorFlow2.2tensorflow-2.2TensorFlow2.2.0+Keras2.3.1onPython3.7.TensorFlow2.1tensorflow-2.1TensorFlow2.1.0+Keras2.3.1onPython3.6.TensorFlow2.0tensorflow-2.0TensorFlow2.0.0+Keras2.3.1onPython3.6.Tenso
python中shutil.copyfile的用法_python shutil.copy()用法 weixin_39678103
shutil.copyfile(src,dst)：复制文件内容（不包含元数据）从src到dst。DST必须是完整的目标文件名;如果src和dst是同一文件，就会引发错误shutil.Error。dst必须是可写的，否则将引发异常IOError。如果dst已经存在，它会被替换。特殊文件，例如字符或块设备和管道不能使用此功能，因为copyfile会打开并阅读文件。src和dst的是字符串形式的路径名。
【爬虫】使用 Scrapy 框架爬取豆瓣电影 Top 250 数据的完整教程 m0_74825360 面试学习路线阿里巴巴爬虫 scrapy
前言在大数据和网络爬虫领域，Scrapy是一个功能强大且广泛使用的开源爬虫框架。它能够帮助我们快速地构建爬虫项目，并高效地从各种网站中提取数据。在本篇文章中，我将带大家从零开始使用Scrapy框架，构建一个简单的爬虫项目，爬取豆瓣电影Top250的电影信息。Scrapy官方文档：ScrapyDocumentation豆瓣电影Top250：豆瓣电影Top250本文的爬虫项目配置如下：系统：Windo
【Mac】Python相关知识经验水银嘻嘻 Python macos python 开发语言
一、给Python3安装第三方库mac下给Python3安装第三方库pillow，处理图片【安装方式】：终端中输入命令：python3-mpipinstallpillow按回车，等待pillow下载安装NOTE:其他模块同理，如pytesseract二、Python版本升级1.终端执行命令：brewinstallpython32.安装Python3版本成功后，系统默认的仍旧是之前的版本，注意不要去
Python shutil.copy 函数 song_cai_csdn python
shutil.copy(source-path,dest-path)source-path中包含目录，对导致IOError:[Errno13]Permissiondenied异常
（三）python网络爬虫（理论+实战）——爬虫与反爬虫阳光宅男xxb 30天学会python网络爬虫 python 大数据爬虫
系列文章目录（1）python网络爬虫—快速入门（理论+实战）（一）（2）python网络爬虫—快速入门（理论+实战）（二）序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能够轻而易举的，快速的，掌握爬虫的相关知识并熟练的使用它，避免浪费更多的无用时间，甚至走
（详细整理！！！！）Tensorflow与Keras、Python版本对应关系！！！今天不想Debug tensorflow keras 人工智能
小伙伴们大家好，不知道大家有没有被tensorflow框架困扰过今天我就给大家整理一下tensorflow和keras、python版本的对应关系大家这些都可以在官网找到，下面我把官网的连接给大家放在这里：在Windows环境中从源代码构建|TensorFlow(google.cn)但是为了方便大家，我给大家列在下面啦！！！下面这个是我给大家总结的（也是为我自己整理的，嘿嘿~~~）（然后后面我也把
华为OD机试E卷 --分苹果 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下
Package ‘importlib-metadata‘ requires a different Python: 3.6.10 not in ‘＞=3.7‘ zy_whynot python python 开发语言后端
报错ERROR:Package'importlib-metadata'requiresadifferentPython:3.6.10notin'>=3.7'WARNING:Youareusingpipversion20.0.2;however,version21.3.1isavailable.Youshouldconsiderupgradingviathe'/usr/local/bin/pytho
Python设计模式 - 工厂方法模式 mofei12138 设计模式 python python 设计模式工厂方法模式
定义工厂方法模式是一种创建型设计模式，它定义一个创建对象的接口，让其子类来处理对象的创建，而不是直接实例化对象。结构抽象工厂（Factory）：声明工厂方法，返回一个产品对象。具体工厂类都必须实现该方法。具体工厂（ConcreteFactory）：实现工厂方法以创建具体的产品对象。抽象产品（Product）：定义产品对象的接口。具体产品（ConcreteProduct）：实现产品接口的具体产品对象
正则表达式的艺术：轻松驾驭 Python 的 re 库傻啦嘿哟 mysql 数据库 java
目录一、正则表达式的基本概念二、Python的re库简介三、正则表达式的元字符四、正则表达式的贪婪与非贪婪模式五、实战案例六、总结正则表达式（RegularExpression）是文本处理中不可或缺的工具，它强大而灵活，能够帮助我们高效地匹配、查找、替换复杂的文本模式。Python的re库为我们提供了便捷的正则表达式操作接口。本文将带你领略正则表达式的艺术，通过简洁明了的代码和案例，轻松驾驭Pyt
python广告点击率预测_常见计算广告点击率预估算法总结 weixin_39850143 python广告点击率预测
欢迎大家前往腾讯云技术社区，获取更多腾讯海量技术实践干货哦~作者：导语：本文讨论了CTR预估模型，包括工业界使用比较广的比较经典模型和学术界最新的结合DeepLearning的一些工作。前言谈到CTR，都多多少少有些了解，尤其在互联网广告这块，简而言之，就是给某个网络服务使用者推送一个广告，该广告被点击的概率，这个问题难度简单到街边算命随口告诉你今天适不适合娶亲、适不适合搬迁一样，也可以复杂到拿到
python 菜单调用_Python Tkinter Menu菜单（窗口菜单和右键菜单）使用详解 weixin_39997311 python 菜单调用
Tkinter为菜单提供了Menu类，该类既可代表菜单条，也可代表菜单，还可代表上下文菜单（右键菜单）。简单来说，Menu类就可以搞定所有菜单相关内容。程序可调用Menu的构造方法来创建菜单，在创建菜单之后可通过如下方法添加菜单项：add_command()：添加菜单项。add_checkbutton()：添加复选框菜单项。add_radiobutton()：添加单选钮菜单项。add_separa
游戏引擎架构第二版中文pdf_Allen Kashiwa的游戏开发信息 weixin_39811166 游戏引擎架构第二版中文pdf
0本文首发于我的github和我的博客，欢迎大家与我交流。1基础知识与通用技能1.1语言相关1.1.1C/C++C++Primer1.1.2C#C#编程指南CLRviaC#（第4版）1.1.3LuaProgramminginLua1.1.4Python廖雪峰的Python教程1.2语言无关1.2.1算法算法图解DataStructureVisualizations算法可视化visualgoIntr
python菜单栏_(7)python tkinter-菜单栏 weixin_39625172 python菜单栏
importtkinterimporttkinter.messageboxdefbut():tkinter.Toplevel()root=tkinter.Tk()#root.title('GUI')#标题root.geometry('800x600')#窗体大小root.resizable(False,False)#固定窗体f=tkinter.Menu(root)#创建根菜单root['menu'
python的中文翻译-再聊聊Python中文社区的翻译 weixin_37988176
在写《学习Python，怎能不懂点PEP呢？》的时候，我已经发现国内的Python翻译环境不容乐观。这个结论可能不对，毕竟这几年Python大热，或许有不少优秀的翻译项目，只是我还不知道而已。不管如何，接着上一篇关于“Python学习资料汉化”的话题，今天，我们再聊聊Python中文社区的翻译话题。Python部落的翻译社很巧合的是，Python部落（公众号：Python程序员）刚刚低调地上线了“
【Python】 -- 趣味代码 - 圣诞树电科_银尘 Python趣味编程 python 开发语言
文章目录文章目录01圣诞树动图设计框架02圣诞树程序代码01圣诞树动图设计框架下面是对代码主要部分的详细解释：导入库：代码开始部分导入了turtle库，并给它起了别名t，同时导入了random库并给它起了别名r，以及time库。设置画布：使用screensize设置画布背景为黑色，title设置窗口标题为"圣诞快乐"，setup设置画布大小为800x800像素。设置画笔：pencolor设置画笔颜
如何解决Package ‘zipp’ requires a different Python: 3.5.2 not in '>=3.6 @_sunny_@ pip python tensorflow
如何解决Package‘zipp’requiresadifferentPython:3.5.2notin'>=3.6我出现这个问题是在我的服务器上，安装TensorFlow包的时候。原因就是Python的版本较低，Zipp的版本较高解决办法输入pip3list查看包的版本，然后将zipp包先卸载pip3uninstallzipp然后下载指定版本的Zipp包pip3installzipp==1.0.
python 爬虫4 - re模块（正则表达式） Shin zhong python 爬虫正则表达式 python
一、正则表达式1.概念正则表达式（RegularExpression，简称Regex）是一种用于匹配字符串的模式。它可以用来搜索、替换、验证文本中的特定模式。Python中的re模块提供了对正则表达式的支持。2.语法正则表达式的语法相对复杂，但理解其核心概念后，可以用非常简洁的方式来表达字符串匹配规则符号解释.匹配任意单个字符（除换行符）。^匹配字符串的开头。$匹配字符串的结尾。*匹配前面的字符0
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他