gxh_apologize

BeautifulSoup4介绍与登录知乎案例

一、BeautifulSoup4介绍

和lxml一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据
lxml 只会局部遍历，而Beautiful Soup 是基于HTML DOM的，会载入整个文档，解析整个DOM树，因此时间和内存开销都会大很多，所以性能要低于lxml
BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持 lxml 的 XML解析器
Beautiful Soup 3 目前已经停止开发，推荐现在的项目使用Beautiful Soup 4。使用 pip 安装即可：pip install beautifulsoup4
官方文档：http://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

二、使用

示例代码：

html = """
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <title>Insert title heretitle>
    head>

    <frameset rows="70%,*">
        <frame bordercolor="1" src="04_table.html" noresize="noresize" />
        <frameset cols="20%,*">
            <frame bordercolor="1" src="layout/b.html" noresize="noresize" />
            <frame bordercolor="1" noresize="noresize" name="content" />
        frameset>
    frameset>

    <body>
        <a href="http://www.baidu.com" class="hehe" id="link1">a>

    body>
html>
"""
bs=BeautifulSoup(html,"lxml")

1、四大对象种类，Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:

tag 它查找的是在所有内容中的第一个符合要求的标签

In [22]: bs.head
Out[22]: \n"text/html; charset=unicode-escape" http-equiv="Content-Type"/>\nInsert title here\n

In [23]: print type(bs.head)
'bs4.element.Tag'>

In [24]: bs.name
Out[24]: u'[document]'

In [25]: bs.head.name
Out[25]: 'head'

In [26]: bs.a.attrs
Out[26]: {'class': ['hehe'], 'href': 'http://www.baidu.com', 'id': 'link1'}

In [27]: bs.a['class']
Out[27]: ['hehe']

In [31]: bs.a['class']="haha" #修改属性

In [32]: bs.a['class']
Out[32]: 'haha'

In [33]: del bs.a['class']

In [34]: bs.a.attrs
Out[34]: {'href': 'http://www.baidu.com', 'id': 'link1'}

NavigableString


In [45]: bs.title.string   #.string获取标签内容
Out[45]: u'Insert title here'

In [46]: print type(bs.title.string)
<class 'bs4.element.NavigableString'>

BeautifulSoup

In [38]: bs.name
Out[38]: u'[document]'

In [39]: print type(bs.name)
'unicode'>

In [40]: bs.attrs
Out[40]: {}

In [41]: # 文档本身属性为空

Comment 是一个特殊类型的 NavigableString 对象，其输出的内容不包括注释符号

In [35]: bs.a.string #获取a标签内文字
Out[35]: u' hehehe '

In [36]: print type(bs.a.string)
<class 'bs4.element.Comment'>

2. 遍历文档树

直接子节点： .contents .children 属性
.content 属性可以将tag的子节点以列表的方式输出
.children 返回的是一个生成器对象

In [52]: bs.frameset.contents
Out[52]: 
[u'\n',
 "1" noresize="noresize" src="04_table.html"/>,
 u'\n',
 "20%,*">\n"1" noresize="noresize" src="layout/b.html"/>\n"1" name="content" noresize="noresize"/>\n,
 u'\n']

In [53]: bs.frameset.contents[3]
Out[53]: "20%,*">\n"1" noresize="noresize" src="layout/b.html"/>\n"1" name="content" noresize="noresize"/>\n

所有子孙节点: .descendants 属性，也需要遍历
节点内容：.string属性
如果tag只有一个 NavigableString 类型子节点,那么这个tag可以使用 .string 得到子节点。如果一个tag仅有一个子节点,那么这个tag也可以使用 .string 方法,输出结果与当前唯一子节点的 .string 结果相同。

通俗点说就是：如果一个标签里面没有标签了，那么 .string 就会返回标签里面的内容。如果标签里面只有唯一的一个标签了，那么 .string 也会返回最里面的内容

3、搜索文档树

find_all(name, attrs, recursive, text, **kwargs)
name参数可以传字符串、正则表达式、列表。
text 参数可以搜搜文档中的字符串内容，与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表

In [93]: bs.find_all('a')
Out[93]: [<a class="hehe" href="http://www.baidu.com" id="link1">a>]

In [94]: 

In [94]: bs.find_all(['a','title'])
Out[94]: 
[<title>Insert title heretitle>,
 <a class="hehe" href="http://www.baidu.com" id="link1">a>]

In [95]: 

In [95]: bs.find_all(id="link1")
Out[95]: [<a class="hehe" href="http://www.baidu.com" id="link1">a>]

In [96]: 

In [96]: bs.find_all(text="hehehe")
Out[96]: []

In [97]: bs.find_all(text="Insert title here")
Out[97]: [u'Insert title here']

In [98]: import re

In [99]: bs.find_all(text=re.compile("Insert title"))
Out[99]: [u'Insert title here']

4、select方式

In [83]: bs.select('title')  #通过标签名查找
Out[83]: [Insert title here]

In [84]: bs.select('.hehe')  #通过类名查找
Out[84]: ["hehe" href="http://www.baidu.com" id="link1">-- hehehe -->]

In [85]: bs.select('#link1')  #通过id查找
Out[85]: ["hehe" href="http://www.baidu.com" id="link1">-- hehehe -->]

In [86]: bs.select('head > title') #查找head标签下title标签
Out[86]: [Insert title here]

In [87]: bs.select('a #link1') #查找a标签中id为link1的
Out[87]: []

In [88]: bs.select('a  #link1') #查找a标签中id为link1的
Out[88]: []

In [89]: bs.select('a[herf="http://www.baidu.com"])  #通过属性查找
  File "", line 1
    bs.select('a[herf="http://www.baidu.com"])  #通过属性查找

^
SyntaxError: EOL while scanning string literal


In [90]: bs.select('a[herf="http://www.baidu.com"]')  #通过属性查找
Out[90]: []

In [91]: bs.select('a[href="http://www.baidu.com"]')  #通过属性查找
Out[91]: ["hehe" href="http://www.baidu.com" id="link1">-- hehehe -->]

In [92]: # 以上的 select 方法返回的结果都是列表形式，可以遍历形式输出，然后用 get_text() 方法来获取它的内容

三、登录知乎案例

这个案例登录知乎，并把主页保存html。
关于验证码，有一种是字母数字，是将图片保存到本地，手动输入的，比如：jk12，请看注释掉的代码。另一种是点击倒立的文字，也是保存到本地的，手动输入坐标，坐标是有规律的，详细请看代码注释，如果第一个第二个是倒立的请输入：2，23，46
下面案例如果测试的话有三处需要改的地方：你的账号、你的密码、你的主页。
当然可以选择把55-57行代码注释掉。

 1 # coding:utf-8
  2 
  3 from bs4 import BeautifulSoup
  4 import requests
  5 import time
  6 
  7 def captcha(captcha_data):
  8     with open("captcha.jpg","wb") as f:
  9         f.write(captcha_data)
 10     ''' 
 11     text=raw_input("请输入验证码：")
 12     return text 
 13     ''' 
 14     text=raw_input("请输入验证码个数以及坐标：")
 15     # 第一个坐标[23,23],第二个坐标[46,23]...
 16     arr=text.split(",") 
 17     if "1"==arr[0]:
 18         result='{"img_size":[200,44],"input_points":[[%s,23]]}' % int(arr[1])
 19     else:
 20         result='{"img_size":[200,44],"input_points":[[%s,23],[%s,23]]}' % (int(arr[1]),int(arr[2]))
 21 
 22     return result
 23 
 24 def zhihuLogin(): 
 25     # 构建一个Session对象，可以保存Cookie
 26     session=requests.Session()
 27 
 29     # get请求获取登录页面，找到需要的数据_xsrf,同时记录Cookie
 30     html=session.get("https://www.zhihu.com/#signin",headers=headers).text
 31 
 32     # 调用lxml解析库
 33     bs=BeautifulSoup(html,"lxml");
 34     # _xsrf作用是防止CSRF攻击(跨站请求伪造，也就是跨域攻击)
 35     # 跨域攻击通常通过利用Cookie伪装成网站信任的用户的请求，盗取用户信息、欺骗web服务器
 36     # 所以网站通过设置一个隐藏字段存放这个MD5字符串，用来校验用户Cookie和服务器Session
 37     _xsrf=bs.find("input",attrs={"name":"_xsrf"}).get("value")
 38 
 39     #captcha_url="http://www.zhihu.com/captcha.gif?r=%d&type=login"%(time.time()*1000)
 40     captcha_url="https://www.zhihu.com/captcha.gif?r=%d&type=login&lang=cn"%(time.time()*1000)
 41     captcha_data=session.get(captcha_url,headers=headers).content
 42     text=captcha(captcha_data)
 43 
 44     data={
 45         "_xsrf":_xsrf,
 46         "phone_num":"**你的账号**",
 47         "password":"**你的密码**",
 48         "captcha_type":"cn",
 49         "captcha":text
 50     }
 51 
 52     response=session.post("https://www.zhihu.com/login/phone_num",data=data,headers=headers)
 53     print response.text
 54 
 55     response=session.get("**你登录后的主页地址**",headers=headers)
 56     with open("my.html","w") as f:
 57         f.write(response.text.encode("utf-8"))
 58 
 59 if __name__=="__main__":
 60     zhihuLogin()

你可能感兴趣的:(Python学习笔记)

Python学习笔记-Day05 snape00
Python学习笔记Day_05-构造程序逻辑作者的话学完前面的几个章节后，我觉得有必要在这里带大家做一些练习来巩固之前所学的知识，虽然迄今为止我们学习的内容只是Python的冰山一角，但是这些内容已经足够我们来构建程序中的逻辑。对于编程语言的初学者来说，在学习了Python的核心语言元素（变量、类型、运算符、表达式、分支结构、循环结构等）之后，必须做的一件事情就是尝试用所学知识去解决现实中的问题
python学习笔记第5节-类和函数梁鋐俐
我们在前面的学习中学会了一个叫type（）的函数，用它来判断变量的类型，变量和它当下存储的数据绑定在一起。例如a=[4,5,6,7]print(type(a)）输出a=range（10，20，2）print（type（a））输出a=Trueprint（type（a））输出a={‘a54’：56}print（type（a））输出a={‘a54’，56}print（type（a））输出a=‘tyuio
Python学习笔记--列表、字典、集合、元组小黄酥 Python python 学习笔记
Python学习笔记43-列表#列表主要是用来存储多个数据.列表是有序的集合list_1=[]#创建一个空的列表list_2=[12,34,56,True,'abc']#创建一个列表#列表的访问，通过下标访问列表中的元素，下标默认从0开始，0表示第一个元素，-1表示最后一个元素list_3=[1,2,3,False,True,'abc']print(list_3[0])#1print(list_3
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python学习笔记（三）：列表的定义、访问及修改 RANDY_Sw Python入门 python
今天学习了有关列表的定义、访问及修改的方法，在此整理一下。列表的定义与访问name_list=['zhangsan','lisi','wangwu']#创建一个列表name_list[0]='xiaobai'#修改列表中的单个元素print(name_list)#遍历的方式打印列表1foriteminname_list:print(item)#遍历的方式打印列表2i=0foriinrange(le
Python学习笔记36：进阶篇(二十五)pygame的使用之事件监听控制切歌和暂停，继续播放明月望秋思学习 python pygame python 学习
前言基础模块的知识通过这么长时间的学习已经有所了解，更加深入的话需要通过完成各种项目，在这个过程中逐渐学习，成长。我们的下一步目标是完成pythoncrashcourse中的外星人入侵项目，这是一个2D游戏项目。在这之前，我们先简单学习一下pygame模块。私信我发送消息python资料，领取pythoncrashcourse中文版PDF。pygamePygame是一个开源的Python多媒体开发
python工资条教程_python学习笔记--工资条发放软件 weixin_39873191 python工资条教程
1#!/usr/bin/envpython2#-*-coding:UTF-8-*-3importsmtplib4fromemail.mime.textimportMIMEText5mailto_list=['[email protected]']#收件人(列表)6mail_host="smtp.163.com"#使用的邮箱的smtp服务器地址，这里是163的smtp地址7mail_user="[email protected]
Python学习笔记二(布尔值及类型检查) StaticKing Python入门 Python
字符串赋值与布尔值及类型检查布尔值(bool)假：False真：Truea1='a'a2='a'print(a1==a2)print(a1!=a2)TrueFalse布尔值也属于整型，True相当于1False相当于0print(True+
Python学习笔记_第八章：异常雨住多一横
什么是异常Python用异常对象来表示异常情况，遇到错误后会引发异常。如果异常对象未被处理或捕捉，程序就会用所谓的回溯终止执行按自己的方式出错raise语句使用一个类(Exception及其子类)或者类实例调用raise语句可以引发异常。Python内建异常可以在exceptions模块中找到，可以使用dir列出模块内容>>>dir(exceptions)['ArithmeticError','A
Python学习笔记之：本地文件的读取你怎么这么奇怪 Python学习笔记
读取文件#桌面上的第一个txtf=open(r"C:\Users\Administrator\Desktop\test.txt")print(f.read())以test.txt文件为例，该文件存储路径为桌面打印读取文件内容f.read()print(f.readline())读
python学习笔记五（面向对象实战版）小满胜万全 Python学习学习笔记
传送门：python及pycharm安装配置_pycharm和python配置-CSDN博客Python学习笔记（一）-CSDN博客Python学习笔记（二）-CSDN博客Python学习笔记三（面向对象）-CSDN博客Python学习笔记四（面向对象）-CSDN博客前言：在前面两章，我们学习了python的基本概念和一些重要的知识点，由于这个部分非常重要，而代码学习之道最重要的就是自己要动手写代
Python学习笔记一（基础知识）小满胜万全 Python学习学习 python
PS：这篇文章是以一个学习者的角度来汇总知识点以及教程，对于想学习Python的入门者也会比较友好，想学习python可以先收藏，我会慢慢持续更新。学艺不精，如有纰漏，敬请指正。需要安装配置python和Pycharm软件可以移步这篇文章，有详细的教程。传送门：python及pycharm安装配置-CSDN博客Python学习笔记（二）-CSDN博客Python学习笔记三（面向对象）-CSDN博客
Python学习笔记07 正文01 python 学习笔记
第十三章，面向对象初识对象生活中数据的组织学校开学，要求学生填写自己的基础信息，一人发一张白纸，让学生自己填我叫林军杰，今年31岁.来自山东省，我是男的，中国人内容混乱改为登记表，打印出来让学生自行填写：姓名林军杰姓别男国籍中国籍贯山东省年龄31整洁明了程序中数据的组织在程序中简单使用变量来记录学生信息student_1={"姓名"："周杰轮"，"性别"："男"，"国籍"："中国"，"籍贯"："台
Python学习笔记03 正文01 python 学习笔记
第五章、Python函数函数介绍函数函数：是组织好的，可重复使用的，用来实现特定功能的代码段name="itheima"length=len(name)print(length)输出结果：7为什么随时都可以使用len()统计长度？因为，len()是Python内置的函数：是提前写好的可以重复使用实现统计长度这一特定功能的代码段我们使用过的：input()、print()、str()、int()等都
Python学习笔记 —— 文件处理模块 miles-zh python python
Excel文件openpyxl读/写Excel文件，https://pypi.org/project/openpyxlxlwt创建Excel文件，设置单元格样式，https://pypi.org/project/xlwtxlrd读取Excel文件，https://pypi.org/project/xlrdxlutils修改Excel文件，https://pypi.org/project/xluti
【Python学习笔记】Python logging模块的学习 Augenstern K Python python 学习笔记
Pythonlogging模块基础介绍作用与功能基本用法引入模块创建并配置记录器的基本步骤代码演示日志级别日志消息格式用法介绍代码示例日志的输出位置代码示例日志记录的高级功能对日志记录进行过滤和处理在多个模块中使用同一个日志记录器总结当谈到日志记录时，logging库是Python中最常用的工具之一。它提供了许多功能和选项，使开发人员能够灵活地记录和管理应用程序的日志信息。引入logging作为P
Python学习笔记(1)——环境安装与变量 ThinkerChenYi python学习笔记 Python 学习笔记
python环境安装-python2还是python3python2只支持到2020年，并且python2和3有不少用法差异。要是刚学完python2不久就发现过时了这就很尴尬了，所以推荐使用python3-安装环境推荐：Anaconda+pychamAnaconda是一个python的科学计算包，python环境，常用模块以及工具都包含在里面，省心省力官网：https://www.anacond
2.25python笔记高阶编程 13351
@[TOC](2.25学堂在线python学习笔记高阶编程)#高阶编程1.利用二分法查找一个字符是否在某个字符串当中基线条件：当s=''时，返回False当len(s)=1且s==char时返回True当len(s)>1且s[mid]>char时，返回isIn(char,s[:mid])否则当s[mid]1:ifs[mid]>char:print(s)returnisIn(char,s[:mid]
Python学习笔记——逻辑运算符not,and,or phoebe’ python
运算优先级：not>and>or三个都从左往右解析，区别如下not：返回布尔型(TrueorFalse)>>>not7False>>>not0Trueand:有0(False)则返回0(False)，否则返回后一个变量(常数)>>>3and0and10>>>1and2and33>>>Falseand1Falseor:返回第一个不为0(False)的变量(常数)>>>FalseorTrueTrue>
python学习笔记——三目运算符与逻辑运算符 phily123 python学习笔记 python
一、三目运算符python中用ifelse来替代其他编程语言的？：三目运算符，并且用法不同。ifa>b:c=aelse:c=bpython中：c=aifa>belsebc语言中：c=a>b?a:b二、逻辑运算符python中逻辑运算符用andornot:20and10#结果是1020or10#结果是200or10#结果是10not10#结果是Falsenot0#结果是Truec语言中逻辑运算符用&
Python课后习题第十章水中小船
'''10-1Python学习笔记：在文本编辑器中新建一个文件，写几句话来总结一下你至此学到的Python知识，其中每一行都以“InPythonyoucan”打头。将这个文件命名为learning_python.txt，并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序，它读取这个文件，并将你所写的内容打印三次：第一次打印时读取整个文件；第二次打印时遍历文件对象；第三次打印时将各行存
python表示乘方的运算符_Python学习笔记Day3 - Python运算符 weixin_39684454 python表示乘方的运算符
1.Python类型转换常用数据类型转换2.Python算术运算符Python算术运算符2.1加法(+)运算符m=10n=97sum1=m+nx=7.2y=15.3sum2=x+yprint("sum1=%d,sum2=%.2f"%(sum1,sum2))运行结果：sum1=107,sum2=22.50拼接字符串当+用于数字时表示加法，但是当+用于字符串时，它还有拼接字符串(将两个字符串连接为一个
Python学习笔记之os.path.join() 爱叫啥叫啥去
路径拼接os.path.join()函数os.path.join()函数用于路径拼接文件路径os.path.join()函数中可以传入多个路径：a、会从第一个以"/"开头的参数开始拼接，之前的参数全部丢弃b、在上一种情况确保情况下，若出现"./"开头的参数，会从"./"开头的参数的上一个参数开始拼接join()函数语法：‘sep’.join(seq)参数说明：sep:分隔符。可以为空seq：要连接
python学习笔记--ifelse分支和循环结构用法,实现python猜数字游戏和冒泡排序大佬Sam
前言分支（if-else）和循环是每种编程语言必定存在的用法，这里记录下python中的分支结构和结构。结合之前学习的变量，类型，运算符，表达式，和分支，循环结构，练习写个猜数字游戏和冒泡排序。正文分支结构if语句的使用分支结构可以使用if、elif和else关键字。所谓关键字就是有特殊含义的单词，像if和else就是专门用于构造分支结构的关键字，很显然你不能够使用它作为变量名（事实上，用作其他的
【python学习笔记】：亚马逊的反爬虫机制姜子牙大侠 python python 爬虫开发语言
今天，来学习越过亚马逊的反爬虫机制，爬取想要的商品、评论等等有用信息。反爬虫机制但是，我们想用爬虫来爬取相关的数据信息时像亚马逊、TBao、JD这些大型的购物商城他们为了保护自己的数据信息，都是有一套完善的反爬虫机制的先试试亚马逊的反爬机制我们用不同的几个python爬虫模块，来一步步试探最终，成功越过反爬机制。一、urllib模块代码如下：#-*-coding:utf-8-*-importurl
python学习笔记之---三种引号的使用没有用户的名字 python学习笔记 python 学习笔记
三种引号，单引号’‘，双引号""，三引号’‘’‘’'（三个单引号组合）或者"“”“”"（三个双引号组合）一、一般情况下，三种引号等价print('这个单引号测试')print("这是双引号测试")print("""这是三引号测试""")二、特殊情况1、单引号：字符串中含有单引号时不能使用，需要转义2、双引号：字符串含有双引号的情况不能使用，需要转义错误写法：print("这是"双引号"测试")`正
python小结张叁疯_
本周整理了python学习笔记复习旧的，顺便整理新的，笔记分享在了有道云链接如下阿龙的python笔记都是基础知识，希望在今后能成体系，根据案例学python
python学习笔记------函数烟雨织轻愁学习笔记
函数介绍是组织好的，可重复使用的，用来实现特定功能的代码段函数定义def函数名（传入参数）：函数体return返回值参数不需要可省略，返回值不需要也可以省略先定义后调用函数的传入参数例如：defadd（x，y）：result=x+yprint（f"{x}+{y}的结果是：{result}"）在函数定义中，x、y为形参，表示函数声明将要使用两个参数，参数之间使用逗号进行分隔函数调用时，提供的数属于实
python学习笔记烟雨织轻愁学习笔记
字面量整数、浮点数和·现实中写法一致字符串加上双引号即可，例如："python代码"变量定义方式：变量名=变量的值（无需分号）数据类型print（type（"python代码"））即可输出类型名string_type=type（"python代码")接收类型名数据类型转换：int（x）、float（x）、str（x）标识符标识符：变量名字、方法的名字、类的名字等等标识符命名只允许数字、英文、中文、
Python学习笔记 -一到五赵唯一 Python编程秘籍 python 开发语言
第一阶段第一章python入门小技巧：上注释使用（ctrl+/）print("")输出的时候是，输出的就是“”内的内容如果是使用变量的话，不加””双引号，才可以输出变量的内容。eg：num=111而使用print("num")所输出的也就是num，调用变量不要加“”而且print是没有结果输出的，只是打印的功能；print("我","是")print可以多个输出内容中间用逗号隔开!!!（需要全部是
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他