Python 基于Selenium实现动态网页信息的爬取

一、Selenium介绍与配置

1.Selenium简介

Selenium 是ThoughtWorks专门为Web应用程序编写的一个验收测试工具。Selenium测试直接运行在浏览器中，可以模拟真实用户的行为。支持的浏览器包括IE(7、8、9)、Mozilla Firefox、Mozilla Suite等。这个工具的主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好地工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。

2. Selenium+Python环境配置

pip install selenium

二、网页自动化测试

1.启动浏览器并打开百度搜索

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('http://www.baidu.com/')

2.定位元素

在开发者工具中找到输入框

输入要查询的值并通过button点击事件实现

input_btn = web.find_element_by_id('kw')
input_btn.send_keys('原神', Keys.ENTER)

测试：

三、爬取动态网页的名人名言

1. 网页数据分析

在开发者工具中查看每一组名言（名言+名人）的位置：

现每一组名言都是在class="quote"的div中，并且没有其他class="quote的标签。

且名句在class="text"的标签中，作者在class="author"的small标签中。

2. 翻页分析

在开发者工具中查看Next翻页按钮

可发现Next按钮只有href属性，无法定位。但可以通过查找网页最后一个有aria-hidden属性的span标签，进行点击以跳转到下一页。

3.爬取数据的存储

爬取后的数据需要存储至csv文件中，编写代码如下：

with open('Saying.csv', 'w', encoding='utf-8')as fp:
    fileWrite = csv.writer(fp)
    fileWrite.writerow(['名言', '名人'])   
    fileWrite.writerows(sayingAndAuthor)
web.close()

4. 爬取数据

代码准备：

from selenium.webdriver import Chrome
import time
import csv

web = Chrome(r"D:\\DevTools\\Anaconda\\download\\Anaconda3\\Lib\\site-packages\\selenium\\webdriver\\chrome\\chromedriver.exe")

web.get('http://quotes.toscrape.com/js/')

sayingAndAuthor = []
n = 5
for i in range(0, n):
    div_list = web.find_elements_by_class_name('quote')
    for div in div_list:
        saying = div.find_element_by_class_name('text').text
        author = div.find_element_by_class_name('author').text
        info = [saying, author]
        sayingAndAuthor.append(info)
    print('成功爬取第' + str(i + 1) + '页')
    if i == n-1:
        break
    web.find_elements_by_css_selector('[aria-hidden]')[-1].click()
    time.sleep(2)

with open('Saying.csv', 'w', encoding='utf-8')as fp:
    fileWrite = csv.writer(fp)
    fileWrite.writerow(['名言', '名人'])   # 写入表头
    fileWrite.writerows(sayingAndAuthor)
web.close()

爬取结果：

四、爬取京东网站书籍信息

爬取某个关键字书籍的前三页书籍信息，本文以计算机图形学为例

1.进入网页并搜索计算机图形学

from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys

web = Chrome(r"D:\\DevTools\\Anaconda\\download\\Anaconda3\\Lib\\site-packages\\selenium\\webdriver\\chrome\\chromedriver.exe")


web.get('https://www.jd.com/')
web.maximize_window()
web.find_element_by_id('key').send_keys('计算机图形学', Keys.ENTER)  # 找到输入框输入，回车

成功。

2.网页分析

使用开发者工具可查看每一个商品信息的位置

发现每一个商品信息都存在于class包含gl-item的li中。因此获取该页面下所有li，由此爬取书籍信息（包括书名和价格）。

3.翻页

web.find_element_by_class_name('pn-next').click()  # 点击下一页

4.数据保存

with open('计算机图形学.csv', 'w', encoding='utf-8')as fp:
    writer = csv.writer(fp)
    writer.writerow(['书名', '价格', '作者', '出版社', '预览图片地址'])
    writer.writerows(all_book_info)

5.代码准备

from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
import time
from lxml import etree
import csv

web = Chrome(r"D:\\DevTools\\Anaconda\\download\\Anaconda3\\Lib\\site-packages\\selenium\\webdriver\\chrome\\chromedriver.exe")
web.get('https://www.jd.com/')
web.maximize_window()
web.find_element_by_id('key').send_keys('计算机图形学', Keys.ENTER)  


def get_onePage_info(web):
    web.execute_script('window.scrollTo(0, document.body.scrollHeight);')
    time.sleep(2)
    page_text = web.page_source

    # 进行解析
    tree = etree.HTML(page_text)
    li_list = tree.xpath('//li[contains(@class,"gl-item")]')
    book_infos = []
    for li in li_list:
        book_name = ''.join(
            li.xpath('.//div[@class="p-name"]/a/em/text()'))     # 书名
        price = '￥' + \
            li.xpath('.//div[@class="p-price"]/strong/i/text()')[0]   # 价格
        author_span = li.xpath('.//span[@class="p-bi-name"]/a/text()')
        if len(author_span) > 0:  # 作者
            author = author_span[0]
        else:
            author = '无'
        store_span = li.xpath(
            './/span[@class="p-bi-store"]/a[1]/text()')  # 出版社
        if len(store_span) > 0:
            store = store_span[0]
        else:
            store = '无'
        img_url_a = li.xpath('.//div[@class="p-img"]/a/img')[0]
        if len(img_url_a.xpath('./@src')) > 0:
            img_url = 'https' + img_url_a.xpath('./@src')[0]  # 书本图片地址
        else:
            img_url = 'https' + img_url_a.xpath('./@data-lazy-img')[0]
        one_book_info = [book_name, price, author, store, img_url]
        book_infos.append(one_book_info)
    return book_infos


def main():
    web = Chrome(
        r"D:\\DevTools\\Anaconda\\download\\Anaconda3\\Lib\\site-packages\\selenium\\webdriver\\chrome\\chromedriver.exe")

    web.get('https://www.jd.com/')
    web.maximize_window()
    web.find_element_by_id('key').send_keys('计算机图形学', Keys.ENTER)  # 找到输入框输入，回车
    time.sleep(2)
    all_book_info = []
    for i in range(0, 3):
        all_book_info += get_onePage_info(web)
        print('爬取第' + str(i+1) + '页成功')
        web.find_element_by_class_name('pn-next').click()  # 点击下一页
        time.sleep(2)
    with open('计算机图形学.csv', 'w', encoding='utf-8')as fp:
        writer = csv.writer(fp)
        writer.writerow(['书名', '价格', '作者', '出版社', '预览图片地址'])
        writer.writerows(all_book_info)

if __name__ == '__main__':
    main()

爬取结果

成功

五、总结

本文通过Selenium和webdrive等库，对动态网页的信息进行爬取。

以上就是Python 基于Selenium实现动态网页信息的爬取的详细内容，更多关于Python Selenium 网页信息爬取的资料请关注脚本之家其它相关文章！

你可能感兴趣的:(Python 基于Selenium实现动态网页信息的爬取)

uniapp [全端兼容] - 详细实现下拉菜单筛选效果功能，提供各种条件筛选场景单选、多选、日期时间、自定义插槽、排序上下箭头等（详细示例源代码，全平台兼容支持小程序、H5网站、app、nvue）王二红 +UniApp uni-app 下拉筛选菜单插件组件仿美团电商平台条件筛选效果 uniapp官方筛选下拉菜单下拉层级筛选功能新手详细示例代码教程下拉筛选面板条件筛选功能
前言如果您需要同类型，更美观且简洁的组件，请访问这篇文章。在uni-app（h5网页/小程序/安卓苹果app/nvue等）项目开发中，手机移动端下拉条件筛选菜单功能，下拉式筛选菜单面板，支持插槽自定义内容、单选列表、多选列表、多级联动、复杂级联列表、排序上下小三角等通用示例，带动画过渡效果，可根据需求自定义样式和修改展开收起动画、弹框样式等，uniappv2/v3均可使用，复制示例代码运行即可。如
如何使用Visual Studio Code+STM32Cube MX优雅的编写STM32程序（3）野生程序员-黎 STM32学习笔记 vscode
(在Windows10操作系统上，基于STM32CubeMXarm-gcc和Openocd)在上一篇文稿当中我们学会了如何用VisualStudioCode+STM32CubeMX在现有工程框架增加自己的代码，整体即不破坏原框架又让代码整洁美观。下面就以跑马灯的案例基础上增加Printf函数重定向，及浮点数的打印说明一：Printf函数重定向MY_Printf.c文件新增重定向函数：在MyAppl
arduino控制小车转向_舵机和舵机控制板 weixin_39875192 arduino控制小车转向 arduino舵机达180不到松下伺服电机pwm控制连线
在很多项目中需要用到舵机。比如机器人，伺服系统等方面。步进电机是可以设定转过多少角度，而舵机是可以设定转到的位置，可以说是指哪打哪，Arduino智能小车的前轮转弯系统便是用的这种原理，在工业上机器人上，舵机的应用更是不胜枚举。控制线用于传输角度控制信号。这个角度是由控制信号脉冲的持续时间决定的，这叫做脉冲编码调制(PCM)。舵机的控制一般需要一个20ms左右的时基脉冲，该脉冲的高电平部分一般为0
aes256加密_一款十分强大的文件加密解密工具 weixin_39553423 aes256加密 java md5加密解密工具类亿赛通文件解密工具
明天推荐预告：一款好用的手机端视频播放器！今天教程适合了解linux系统的你使用。在市场上能找到许多用来保护文件的文档加密工具。今天我们将讨论一款叫做“toplip”的命令行文件加密解密工具。它是一款使用AES256强大加密方法的自由开源的加密工具。它同时也使用了XTS-AES设计以保护你的隐私数据。它还使用了Scrypt，一种基于密码的密钥生成函数来保护你的密码免于暴力破解。优秀的特性相比于其它
python基于rsa的数字签名实现_OpenSSL和Python实现RSA Key数字签名和验证 weixin_39658019
OpenSSL和Python实现RSAKey数字签名和验证，基于非对称算法的RSAKey主要有两个用途，数字签名和验证(私钥签名，公钥验证)，以及非对称加解密(公钥加密，私钥解密)。本文提供一个基于OpenSSL命令行和Python的数字签名和验证过程的例子，另外会另起一篇使用OpenSSL和Python进行非对称加解密的例子。1.OpenSSL实现数字签名和验证1.1生成私钥生成2048bit的
python实现linux账号管理_linux——用户管理文强孙
1.用户基本概述1.什么是用户?用户指的是能够正常登录Linux或Windows系统(可以理解为你租了房子，能够正常入驻)F:那Linux与Windows系统的用户有什么区别?Q:本质都是登陆系统，只不过Linux支持多个用户同时登陆。F:难道Windows就不算多用户操作系统吗?Q:其实不是，在Windows系统中可以创建多个用户，但不允许同一时刻多个用户登陆系统，但Linux系统则允许同一时刻
c语言删除sqlite一行,SQLite Delete详解及实例代码玩代码的董大大 c语言删除sqlite一行
SQLiteDelete详解SQLite的DELETE查询用于删除表中已有的记录。可以使用带有WHERE子句的DELETE查询来删除选定行，否则所有的记录都会被删除。语法带有WHERE子句的DELETE查询的基本语法如下：DELETEFROMtable_nameWHERE[condition];您可以使用AND或OR运算符来结合N个数量的条件。实例假设COMPANY表有以下记录：IDNAMEAGE
pip3安装命令重复创建文件‘/tmp/pip-install-xxxxx/package‘失败潮易 pip
pip3安装命令重复创建文件'/tmp/pip-install-xxxxx/package'失败在遇到'pip3installcommandrepeatcreatesfile'错误时，通常是因为pip正在写入临时文件夹中，但是该文件夹已经被其他进程占用或者已被删除。解决这个问题需要确保没有其他进程使用这个临时文件夹，或者找到并删除这个文件夹。以下是一些可能的解决方案：1.确保没有其他进程使用这个临
如何指定复制自查询的列潮易 scikit-learn
如何指定复制自查询的列在Python中，我们可以使用pandas库来处理和处理数据。假设我们有一个DataFrame，其中包含一列"check_query"，我们想要复制这个列到一个新的列"new_column"，并且只保留指定的几列。以下是详细步骤和代码示例：```pythonimportpandasaspd#创建一个示例DataFramedf=pd.DataFrame({'A':[1,2,3]
QT核心模块QtCore功能详细说明，并给出测试代码（一）旭唐 qt 开发语言 QT Core
目录一.核心数据类型(CoreDatatypes)1、QString2、QByteArray3、QVariant4、QList,QVector,QMap,QHash,QSetQList:有序列表，支持重复元素。QVector高效的动态数组QMap:基于红黑树的有序映射容器QHash:基于哈希表的无序映射容器QSet:集合类，存储不重复的元素应用场景及比较5、QDate,QTime,QDateTim
Kubernetes基础体系架构入门学习笔记(一) 全栈工程师修炼指南云原生落地实用指南控制器大数据分布式 kubernetes 数据库
关注「WeiyiGeek」公众号将我设为「特别关注」，每天带你玩转网络安全运维、应用开发、物联网IOT学习！0x00基础简述1.发展经历描述:近些年由于Cloud云计算(公有云)以及大数据的发展促进了企业从传统转型到数字信息化再到上云,其中运维部署应用技术也从物理机转向虚拟化再转向了容器化，再说到如今的Kubernetes对容器资源的编排与控制,这也是本次学习的重中之重#公有云类型Infrastr
【C++】string类讲解：含常用接口使用及原理模拟实现 White の algo C++初阶 c++开发语言
目录string介绍为什么要学习string类？学习方法：auto和范围forauto概念及使用注意：范围forstring类常见接口说明构造函数析构函数size()和capacity()reserve()和resize()empty()和clear()operator[]和at()begin()、end()和rbegin()、rend()push_back()append()insert()op
机器学习之条件概率贾斯汀玛尔斯 2024最新深度学习算法机器学习人工智能
1.引言概率模型在机器学习中广泛应用于数据分析、模式识别和推理任务。本文将调研几种重要的概率模型，包括EM算法、MCMC、朴素贝叶斯、贝叶斯网络、概率图模型（CRF、HMM）以及最大熵模型，介绍其基本原理、算法流程、应用场景及优势。2.EM算法（Expectation-Maximization）2.1概述EM算法是一种用于含有隐变量或缺失数据的最大似然估计方法。其核心思想是交替执行期望（E）步骤和
【C++初阶】模板初阶 White の algo C++初阶 c++算法
前言在我们之前的学习中我们要实现一个交换函数，会这么写//voidSwap(int*x,int*y)voidSwap(int&x,int&y){inttmp=x;x=y;y=tmp;}这个函数可以实现int类型的变量进行交换，但要实现其他类型，如：double、float……等，便要使用函数重载，每当出现新的类型时就需要写一个新的对应函数，太麻烦了！哪有什么方法可以只用一个函数就可以实现都种不同类
万字长文总结多模态大模型后训练强化学习曾小健人工智能
万字长文总结多模态大模型后训练作者：yearn原文：https://zhuanlan.zhihu.com/p/31278114666本文介绍下我们对多模态alignment近期一系列进展的整理和总结大语言模型（LLMs）能够通过简单的提示完成多种任务，且无需进行任务特定的训练。然而，这些模型主要处理文本数据，对于多模态数据的处理存在局限。由于我们的世界本质上是多模态的，包括视觉、听觉和文本等数据，
奔驰引入人形机器人，释放AI机器人产业信号强化学习曾小健人工智能
奔驰引入人形机器人，释放AI机器人产业信号原创数字少年FrankFrank的神经网络2025年03月24日00:14日本Apptronik×Mercedes-Benz联手2024年3月15日，美国人形机器人公司Apptronik宣布与德国汽车巨头梅赛德斯-奔驰（Mercedes-Benz）达成合作协议，其研发的人形机器人Apollo将正式进入奔驰的制造车间，参与零部件搬运、组装配套及质量检测等环节
过程奖励模型PRM的定义和特点；过程奖励模型prm和orm结果奖励模型的区别和优劣是什么强化学习曾小健人工智能机器学习
过程奖励模型PRM的定义和特点过程奖励模型（ProcessRewardModel，简称PRM）是一种专注于对推理链中每一步进行评估和反馈的机制，旨在提高模型在复杂任务中的表现。其核心特点如下：细粒度反馈：PRM通过为推理链中的每一步分配奖励，提供即时的、详细的反馈，帮助模型识别并纠正错误，从而优化推理路径[11][17][20]。强化逻辑一致性：PRM模仿人类的逻辑推理方式，通过逐步监督确保推理过
EdDSA (Edwards-curve Digital Signature Algorithm)算法详解及python实现闲人编程密码学与信息安全算法 python 开发语言密码学加密解密 EDDSA
目录第一部分：EdDSA算法概述1.1什么是EdDSA？1.2EdDSA的数学原理1.3应用场景第二部分：EdDSA签名生成与验证流程2.1签名生成流程2.2签名验证流程第三部分：Python实现：EdDSA签名生成3.1安装依赖3.2EdDSA签名生成的Python实现3.3代码解释第四部分：Python实现：EdDSA签名验证4.1EdDSA签名验证的Python实现4.2代码解释第五部分：案
Qt-Q_ENUM宏和QMetaEnum类 mrbone11 Qt qt 开发语言 Q_ENUM QMetaEnum 枚举元对象系统
Q_ENUM是一个宏定义，它的作用是将一个枚举类型注册到元对象系统，从而能够通过QMetaEnum类获得一些关于enum类型的一些信息，例如获取enum类型的名称字符串，enum值和字符串互相转换，enum类型保存在QVariant中，enum值的个数，qDebug()打印enum值名称等等。用法：在一个继承于QObject的子类中声明enum，然后在定义后面使用Q_ENUM宏注册enum类型。如
CMake-环境变量介绍 mrbone11 CMake c++开发语言 cmake
文章目录作用域获取环境变量初始化查看特殊的环境变量环境变量类似普通变量，但也有些不同，如下：作用域在一个CMake进程中环境变量具有全局作用域获取环境变量使用ENV操作符获取环境变量，例如$ENV{}，通过if(DEFINEDENV{})或if(NOTDEFINEDENV{})判断是否有定义某个环境变量，注意判断语句里没有$符号，环境变量名字中的特殊符号要转义。例如：set(ProgramFile
数据结构中双向链表头插尾插与遍历节点拉梅洛. 数据结构链表
#include#include#include//定义节点类型typedefintdata_t;typedefstructnode{data_tdata;//以整型数据为例structnode*prev;//指向structnode点的指针structnode*next;//指向structnode点的指针}node_t;intdlist_create(node_t**,data_t);//函数
JavaScript Window Location 宇哥资料 JavaScript javascript 前端开发语言
window.location对象用于获得当前页面的地址(URL)，并把浏览器重定向到新的页面。WindowLocationwindow.location对象在编写时可不使用window这个前缀。一些例子：一些实例:location.hostname返回web主机的域名location.pathname返回当前页面的路径和文件名location.port返回web主机的端口（80或443）loca
建议收藏万字长文！嵌入式Linux系统移植原理与方法总结 Les maths linux ubuntu
Linux系统移植总结摘要本文是对整个Linux系统移植的讲解，适宜有一定基础的初学者进行复习，基本可以自己制作PCB之后自己根据这个方法烧写Linux系统，不涉及U-Boot与Linux的源码和编译流程的讲解（这东西后面再学没事的），只讲最实用的方法，如果你有跟着烧写过一遍Linux系统，那么本文会让你重新复习一遍整个流程，加深对Linux系统移植的理解与应用。OK！移植Linux之前我们需要先
代码随想录day8-统计字符数组中是子串前缀的个数凌凡天 javascript 开发语言 ecmascript
给你一个字符串数组words和一个字符串s，其中words[i]和s只包含小写英文字母。请你返回words中是字符串s前缀的字符串数目。一个字符串的前缀是出现在字符串开头的子字符串。子字符串是一个字符串中的连续一段字符序列。示例1：输入：words=["a","b","c","ab","bc","abc"],s="abc"输出：3解释：words中是s="abc"前缀的字符串为："a"，"ab"和
npm,pnpm设置淘宝镜像源以及还原为官方镜像源 L_！！！ NodeJs npm 前端 node.js
配置npm国内镜像(下载安装模块更快)#设置为淘宝镜像源npmconfigsetregistryhttps://registry.npmmirror.com#pnpm设置镜像源npmconfigsetregistryhttps://registry.npmjs.org/pnpm设置镜像源#查询当前使用的镜像源pnpmgetregistry#设置为淘宝镜像源pnpmconfigsetregistry
【产品小白】原型设计的进阶百事不可口y 产品经理的一步一步大数据产品经理人工智能产品运营学习
在原型设计中，普通和进阶之间的差距往往体现在“功能堆砌”与“认知减负”的转变上。从功能堆砌到认知减负的进阶，是产品设计从简单满足需求到真正提升用户体验的重要演变过程。一、功能堆砌与认知减负：概念对比功能堆砌普通产品经理在原型设计中，往往容易陷入“功能堆砌”的误区——不断添加新功能，试图覆盖所有可能的用户需求，但忽视了用户在实际使用中的体验和认知负担。功能堆砌虽然能短期内吸引眼球，但长远来看，会使界
PostgreSQL：GiST索引实现千万级IP库0.01毫秒检索伏羲栈数据库 postgresql tcp/ip 数据库
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
IDEA修改默认作者名称技术园地 IDEA
User:IDEA提示注释缺少@author信息，但自动设置后，名称不是我想要的默认名称，应该如何修改IDEA里默认的作者名称？Kimi:以下是几种修改IntelliJIDEA中默认作者名称的方法：###方法一：修改FileandCodeTemplates设置1.打开IntelliJIDEA，点击菜单栏的**File**->**Settings**（Windows/Linux）或**Intelli
C#单例模式 kylezhao2019 C#设计模式 c#单例模式
单例模式(Singleton),保证一个类仅有一个实例，并提供一个访问它的全局访问点。通常我们可以让一个全局变量使得一个对象被访问，但它不能防止你实例化对个对象，一个最好的办法就是，让类自身负责保护它的唯一实例。这个类可以保证没有其他实例可以被创建。并且它可以提供一个访问该实例的方法。Singleton类，定义一个GetInstance操作，允许客户访问它的唯一实例。GetInstance是一个静
《CKA/CKAD应试指南/从docker到kubernetes 完全攻略》学习笔记第3章部署kubernets集群 Aphelios· docker kubernetes 学习
目录3.1了解kubernetes3.2安装kubernetes3.2.1实验拓扑图及环境及准备设置3.2.3安装master3.2.4配置work加入集群3.2.5安装calico网络3.3安装后的设置3.3.1删除节点及重新加入3.3.2常见一些命令3.4设置metric-server监控pod及节点的负载3.5命名空间namespace3.6管理命名空间3.7安装一套v1.20.1版本的集群
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他