Rvest用R轻松抓网页数据
课程背景:本课程需要一点R语言基础,以及了解一点CSS选择器的知识,不过没有相关的知识同样也不需要担心,所有的背景知识都很简单
学完之后能够做什么:通过本课程知识的讲解,加上案例的分析,同学可以学会使用R语言快速的爬取网络上的数据
目录
什么是网络爬虫
为什么要爬取数据
准备工作
如何使用Rvest爬取网页
Rvest简介
Rvest API 介绍
Rvest API 详解
补充知识
完整案例
什么是网络爬虫
网络爬虫是将呈现在网页上以非结构格式(html)存储的数据转化为结构化数据的技术
非结构化的数据通过查看网页的源代码就可以看到:
结构化的数据通常就是,由行和列组成的数据,行代表观测,列代表特征或变量:
结构化数据
准备工作
下载相关的包
install.packages("rvest")
install.packages("tidyverse")
library(rvest)
library(tidyverse)
安装 Google Chrome 浏览器
要爬取网页上的数据,首先要知道的是,网页上的数据处于网页中的什么位置。那么如何去描述网页上的位置,可以通过 Xpath 和 selector
举一个例子:
CSS选择器 这个标题,在网页中的位置描述就是:
selector: #main > h2 > font > font
Xpath: //*[@id="main"]/h2/font/font
这个位置描述本质上可以通过观察网页的结构得出来,但是使用Google Chrome能够快速的获取数据的位置
Rvest 简介
rvest是R用户使用率最多的爬虫包,它简洁的语法可以解决大部分的爬虫问题。
基本使用方法:
- 使用read_html读取网页;
- 通过CSS或Xpath获取所需要的节点并使用html_nodes读取节点内容;
- 结合stringr包对数据进行清理。
Rvest API介绍
读取与提取:
- read_html() 读取html文档的函数
- html_nodes() 选择提取文档中指定元素的部分
- html_name() 提取标签名称;
- html_text() 提取标签内的文本;
- html_attr() 提取指定属性的内容;
- html_attrs() 提取所有的属性名称及其内容;
- html_table() 解析网页数据表的数据到R的数据框中;
- html_form() 提取表单。
乱码处理:
guess_encoding() 用来探测文档的编码,方便我们在读入html文档时设置正确的编码格式
repair_encoding() 用来修复html文档读入后的乱码问题
行为模拟:set_values() 修改表单
submit_form() 提交表单
html_session() 模拟HTML浏览器会话
jump_to() 得到相对或绝对链接
follow_link() 通过表达式找到当前页面下的链接
session_history() 历史记录导航工具
Rvest API 详解
- read_html 参数:
x 可以是url,本地路径,包含html的字符串,或者来自httr的请求如果x是URL参数就传递给GET()
encoding 文档的编码形式,查看iconvlist()有完整列表,他如果不能正确确定encoding方式可以尝试stri_enc_detect 使用这个函数来获取html数据
require(rvest)
HTML <- read_html(x = "https://hz.fang.anjuke.com/?from=navigation")
HTML
## {xml_document}
##
## [1] \n\n \n ...
以上就获取了猎聘网的html网页数据
- html_nodes 与html_node 参数:
x 一个xml_document数据
css, xpath 要收集的节点。传入XPath和selector,也可以使用浏览器Google Chrome辅助
image.png
网页
比如我们想获取楼盘名称,“东原旭辉璞阅”这个位置的数据,利用html_node
NAME <- HTML %>% html_nodes("#container > div.list-contents > div.list-results > div.key-list.imglazyload > div:nth-child(1) > div > a.lp-name > h3 > span")
NAME
## {xml_nodeset (1)}
## [1] 绿都鉴未来
这样我们就获得了对应位置的节点,想要得到对应节点的数据,使用html_text函数
NAME %>% html_text()
## [1] "绿都鉴未来"
到这里,就可以使用Rvest爬取简单的数据了
补充知识
包外API
head() 检查数据
as.numeric() 转化为数值型
gsub() 移除" “,”“,”“等
as.factor() 转化为因子
data.frame() 合并为数据框
trycatch() 错误处理
write.csv() 输出csv文件
file.download() 下载网络文件
read.table() 读取本地文件
10.save() 保存变量到本地
sapply() 向量化调用函数
12.iconv() 转化编码格式
13.rbind() 合并行
14.paste() 连接字符串,多用来生成有规律的链接地址
相关的 package
stringr 字符串处理
RSelenium 模拟网页操作,可抓取动态页面
17.ggplot2 数据可视化
18.magrittr 辅助rvest
使用技巧
获取特定序位的html标签,用到了magrittr包里的extract2函数。下面两行代码都可以获得该网页中第一个
标签
ateam %>% html_nodes("table") %>% extract2(1) %>% html_nodes("img")
ateam %>% html_nodes("table") %>%[[(1) %>% html_nodes("img")
%>%是管道操作符,意思是把左边的操作结果作为参数传递给右边的命令
需要换页的同类型页面的地址一般会有规律,找到规律后就可生成一系列地址
定位所需内容时,有时html_nodes+stringr更方便,不使用html_text
若爬取内容过多,可使用边爬边存或者分批处理等
案例1 – 爬取BOSS直聘请杭州,数据分析职位的数据
网址:https://www.zhipin.com/job_detail/?query=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90&scity=101210100&industry=&position=
网页:
image.png
BOSS
主要爬取四个字段:
- 职位名称
- 公司名称
- 薪资范围
- 地址,年限等信息
爬取此网页的信息
网页网址
url <- "https://www.zhipin.com/job_detail/?query=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90&scity=101210100&industry=&position="
# 获取网址
HTML <- read_html(url)
HTML
## {xml_document}
##
## [1] \n\n \n \n\n\n\n\n\n\n
你可能感兴趣的:(R 爬虫-Rvest)
- 下载Android源码
赛非斯
repoinit-uhttps://mirrors.tuna.tsinghua.edu.cn/git/AOSP/platform/manifest-bandroid-10.0.0_r411.首先下载repo:a)终端运行gitclonegit://codeaurora.org/tools/repo.gitb)mkdir~/binc)拷贝repo到~/bin下面,修改repo权限,chmoda+x~
- go-zero处理本地事务
年少~年
golanggolang后端
go-zero处理本地事务,sqlx.SqlConn提供了基础的事务机制,官方代码varconnsqlx.SqlConnerr:=conn.TransactCtx(context.Background(),func(ctxcontext.Context,sessionsqlx.Session)error{r,err:=session.ExecCtx(ctx,"insertintouser(id,n
- 第七章 索引及执行计划,存储引擎
执笔为剑
#MySQL运维篇编辑器mysql
第七章索引及执行计划,存储引擎1,索引及执行计划1,作用:提供类似书目录的作用,目的是优化查询2,所用的种类(根据算法)B树索引Hash索引R树FulltextGIS3,B树基于不同的查找算法分类介绍B-tree:在范围查询方面提供了更好的性能(>showengines;#存储引擎作用在表上,不同的表可能有不同的存储引擎mysql>select@@default_storage_engine;#查
- Windows Edge 兼容性问题修复
马卫斌 前端工程师
edge
当遇到MicrosoftEdge浏览器的兼容性问题时,您可以尝试以下几种解决方案:解决方案1:通过注册表编辑器禁用渲染器完整性检查针对一些特定情况,您可能需要关闭Edge浏览器的渲染器完整性检查以解决兼容性问题。按照以下步骤操作:1.按Win+R键打开“运行”对话框,输入regedit并回车打开注册表编辑器。2.导航至以下路径:计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Pol
- javascript实现SM2加密解密
人生在勤,不索何获
javascript前端jquery
前提JavaWeb环境前端代码window.sm2=function(t){functioni(e){if(r[e])returnr[e].exports;varn=r[e]={i:e,l:!1,exports:{}};returnt[e].call(n.exports,n,n.exports,i),n.l=!0,n.exports}varr={};returni.m=t,i.c=r,i.d=fu
- 华为广告打包报错,问题思考
学知识拯救世界
android华为
华为广告打包时报错fata日志不一样能反映出完整的错误日志信息,仅看fata日志具有误导性,有可能指向错误的方向。通过看完整的日志可见,错误的原因为Causedby:java.lang.ClassNotFoundException:com.huawei.hms.ads.base.R$dimenfata日志2024-03-2520:24:27.6743737-3737AndroidRuntimeus
- 2019年初三:4R沟通作业
岚妈成长历程
观察:亲爱的黎珊,我观察到你很在意身边的人对你说的语言感受:我感觉到难过、伤心需求:我渴望自己能管理好自己的情绪和分清这个界限请求:亲爱的黎珊,从现在开始你是否愿意将你听到不喜欢听到的话时,笑着去面对它们,好吗?
- matlab ICP配准高阶用法——统计每次迭代的配准误差并可视化
点云侠
matlab点云工具箱matlab开发语言计算机视觉线性代数算法
目录一、概述二、代码实现三、结果展示1、原始点云2、配准结果3、配准误差本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。一、概述 在进行论文写作时,需要做对比实验,来分析改进算法的性能,期间用到了迭代误差分布统计的比较分析,为直观表示配准误差,需要进行可视化
- Python爬虫-批量爬取星巴克全国门店
写python的鑫哥
爬虫案例1000讲python爬虫星巴克门店数据目标城市全国
前言本文是该专栏的第22篇,后面会持续分享python爬虫干货知识,记得关注。本文笔者以星巴克为例,通过Python实现批量爬取目标城市的门店数据以及全国的门店数据。具体的详细思路以及代码实现逻辑,跟着笔者直接往下看正文详细内容。(附带完整代码)正文地址:aHR0cHM6Ly93d3cuc3RhcmJ1Y2tzLmNvbS5jbi8=目标:获取星巴克全国门店数据(包含具体的门店信息,经度和纬度坐标
- C4D R20的体积建模体积生成如何使用?
小希爱分享
今天这篇文章里面,我们用到的一个非常重要的工具,一个小技巧就是C4DR20的这个版本里面新增的一个叫做体积建模。在这一栏里面,我相信很多同学用过C4D的人都已经知道这个东西,而且很多人很多都用过玩过,一个是体积生成一个是体积网格,这里的体积生成和体积网格,这俩工具是怎么来的呢?其实在以前的版本里面,如果说我们要去实现这种体积建模的效果的话,我们也是可以做到的,因为我们这里的有X-Particles
- Linux笔记之ldd命令详解
努力脱单的害羞男孩
Linux笔记linux笔记服务器
Linux笔记之ldd命令详解codereview!ldd是一个用于查看可执行文件或共享库所依赖的共享库的命令。它可以帮助你了解可执行文件或库与系统上安装的共享库之间的依赖关系。下面是ldd命令的详细解释:语法:ldd[选项][可执行文件或共享库]常用选项:-v:显示详细信息,包括符号版本信息。-u:显示未使用的直接依赖项。-d:执行数据重定位并报告缺失的对象。-r:执行数据和函数重定位,并报告缺
- 群买买写作营输出打卡Day6
辰辰不沉
阅读书籍《写作7堂课》字数:R:真正牛的人,一定有你不知道的技巧,而且你只要反复研究,就能发现他们写作或者进行其他工作的习惯思维。I:只有去主动学习、研究,牛人的写作,工作习惯思维才能会发现出来,甚至于被你掌握A1:之前请教人或者学习的时候,我往往会有一种想法,就是很想问出来别人的思路或者一些处理方法,觉得自己想法很好,如果懂得别人的想法可能是一劳永逸的方式,但是往往会碰壁或者理解消化不了。A2:
- 树莓派系统常用操作
疯狂的麦克斯_max
linuxubuntu
树莓派重装系统:使用DiskGenius:删除所有分区-》保存分区表-》快速分区-》确认:自定义1个分区、FAT32、去掉勾选(对齐分区到...)如果碰到这种情况锁该卷时发生错误错误5拒绝访问:window使用Win32DiskImager烧写sd卡出现:锁该卷时发生错误错误5拒绝访问:win+R输入diskpart输入listdiskselectdiskxclean树莓派开启vnc:sudora
- 762. Prime Number of Set Bits in Binary Representation
Nancyberry
DescriptionGiventwointegersLandR,findthecountofnumbersintherange[L,R](inclusive)havingaprimenumberofsetbitsintheirbinaryrepresentation.(Recallthatthenumberofsetbitsanintegerhasisthenumberof1spresentwh
- postgres数据库 查看数据表大小
MarcyTheLibrarian
linuxpgsql数据库postgresql
1查看某个数据库大小selectpg_database_size('【数据库名】');2查看多个数据库大小selectpg_database.datname,pg_size_pretty(pg_database_size(pg_database.datname))ASsizefrompg_database;3按顺序查看索引selectindexrelname,pg_size_pretty(pg_r
- Linux shell脚本切换为root用户执行命令
红色石榴
linux
首先安装expect。sudoaptinstallexpect创建shell脚本文件,示例内容如下:#!/usr/bin/expectspawnsurootexpect{"密码:"{send"00000\r"}"Password:"{send"000000\r"}}send"./user_app\r"expecteofexit其中,"000000\r"是root用户密码。send语句用于向终端传递
- Python - SFTP实现网络设备下载/上传
来看帽子变戏法
Pythonpython自动化
##利用Python实现设备的上传/下载importparamiko#引入模块fromdatetimeimportdatetimeimportospath_files=r"file"#定义一个路径ifnotos.path.exists(path_files):#判断当前路径下是否存在这个文件os.mkdir(path_files)#如果不存在则创建time_now=datetime.now()#获
- python基础教程-《Python基础教程(第3版)》PDF高清版
编程大乐趣
《python基础教程第3版》PDF高清版百度云资源,内涵教材源代码百度云链接:百度云盘提取码:7r7o编辑推荐久负盛名的Python入门经典,是非常优秀的基础教程,深入浅出,讲解到位。本书包括Python程序设计的方方面面:首先从Python的安装开始,随后介绍了Python的基础知识和基本概念,包括列表、元组、字符串、字典以及各种语句;然后循序渐进地介绍了一些相对高级的主题,包括抽象、异常、魔
- springboot项目学习-瑞吉外卖(1)
两仪式quq
springboot学习java瑞吉外卖
第一天任务如下:建立基本架构完成登录、退出功能注意:本博客没有使用网上教程里的mybatis-plus,使用的是mybatis;数据库连接池也没有使用教程里的druid,使用的是spring自带的连接池基本架构common包:存放的通用类R,用来给前端返回Json格式的数据config包:存放配置类,在今天的任务中主要解决静态资源路径映射问题controller包entity包:存放实体类mapp
- 强大的开源网络爬虫框架Scrapy的基本介绍(入门级)
铁松溜达py
爬虫scrapy前端测试工具css
Scrapy是一个强大的开源网络爬虫框架,用于从网站上抓取数据。它基于Twisted异步网络框架,可以高效地处理并发请求和数据处理。以下是Scrapy框架的一些重要特点和功能:1.**灵活的架构**:-Scrapy提供了灵活的架构,可以轻松地定义和定制爬虫逻辑、数据提取规则和数据处理流程。2.**高性能**:-Scrapy使用Twisted异步网络框架,能够高效地处理并发请求和数据处理,从而实现高
- mysql 查询阻塞
撸其修远兮
数据库mysql
SELECTp2.`HOST`被阻塞方host,p2.`USER`被阻塞方用户,r.trx_id被阻塞方事务id,r.trx_mysql_thread_id被阻塞方线程号,TIMESTAMPDIFF(SECOND,r.trx_wait_started,CURRENT_TIMESTAMP)等待时间,r.trx_query被阻塞的查询,l.lock_table阻塞方锁住的表,m.`lock_mode`
- 【RH134问答题】第十章 控制启动过程
不怕娜
服务器数据库网络
系列文章第一章提高命令行生产效率第二章计划将来的任务第三章调优系统性能第四章使用ACL控制对文件的访问第五章管理SELinux安全性第六章管理基本存储第七章管理逻辑卷第八章实施高级存储功能第九章访问网络附加存储目录系列文章请简要说明RHEL8的启动过程。系统重启和关机的命令分别是什么?Systemdtarget是什么?重置丢失的root密码需要哪些步骤?如何让系统日志在重启后持久保留?请简要说明R
- linux下自定义显示文件拷贝进度
王牧犊
Linuxlinux服务器运维
1.首先在终端中执行拷贝命令cp-a-r/path/to/source/./path/to/destination/2.打开新的终端执行进度显示命令bashprogress.sh/path/to/source//path/to/destination/source/3.j脚本"progress.sh"中内容如下#!/bin/bash#src_dir="/path/to/source/"src_di
- Kalman滤波参数、调整原则
Terry Cao 漕河泾
VSLAM人工智能算法
1.Q、P、R关系P的迭代为P=QTPQ;R为观测的协方差;状态延时高,说明收敛速度慢。估计参数P越大,收敛的越快。测量误差R越小,收敛的越快。调整这两个参数即可,从状态更新上说,测量误差越小,估计参数误差越大,说明我们越相信测量值,自然收敛的快。缺点就是会让系统变化过快,如果测量值更加不准,则精度会下降,系统不够稳定。2.K与Q、R关系k~Q/(R+Q)P0/(Q+R),收敛的快慢程度。总结下自
- 配音兼职渠道有哪些?配音兼职靠不靠谱?
配音新手圈
配音这个行业作为新媒体职业,随着大众越来越依赖有声书和平时有事没事就爱刷短视频网站,对于这方面的人员需求也越来越多,那作为一个喜爱配音的人,缺钱的时候如何去找这些渠道来赚取零用钱,又如何分辨这些渠道是否靠谱呢,跟着小编一起来看一下吧。一、配音兼职的渠道1.喜马拉雅FM:收入可以说的上是挺可观的了,如果去做有声书相关,时薪大概在80R上下,再加上流量提成,只不过有用户等级限制。2.微信公众号:如果常
- 【python】使用代理IP爬取猫眼电影专业评分数据
码银
网络python爬虫
前言我们为什么需要使用IP代理服务?在编写爬虫程序的过程中,IP封锁无疑是一个常见且棘手的问题。尽管网络上存在大量的免费IP代理网站,但其质量往往参差不齐,令人堪忧。许多代理IP的延迟过高,严重影响了爬虫的工作效率;更糟糕的是,其中不乏大量已经失效的代理IP,使用这些IP不仅无法绕过封锁,反而可能使爬虫陷入更深的困境。本篇文章中介绍一下如何使用Python的Requests库和BeautifulS
- 【5G NR 协议解读】3GPP TS 38.212 (R18) 复用和信道编码(一)
瑶光守护者
5G
前言本文基于3GPPTS38.212(R18)复用和信道编码协议。本文档规定了5GNR的编码、多路复用和物理信道映射。4映射到物理信道4.1上行链路表4.1-1规定了上行传输信道到其对应物理信道的映射。表4.1-2规定了上行控制信道信息到其对应物理信道的映射。Table4.1-1TrCHPhysicalChannelUL-SCHPUSCHRACHPRACHTable4.1-2Controlinfo
- 前端面试题 ===> 【HTML】
禁止摆烂-才浅
前端面试题前端html
HTML面试题总结1.对HTML语义化的理解去掉或者丢失样式的时候能够让页面呈现出清晰的结构;代码结构清晰,方便团队的管理和维护,并且语义化更具有可读性,减少差异化;提升用户体验;例如:title、alt用于解释名词或者图片信息、label标签的活用有利于SEO优化,提升搜索引擎排名;和搜索引擎建立良好沟通,有助于爬虫抓取更多的有效信息;爬虫依赖于标签来确上下文和关键字的权重;方便其他设备的解析(
- R语言microeco:一个用于微生物群落生态学数据挖掘的R包(构建microeco对象。
还是要前进啊
R语言r语言数据挖掘
我以前写过临床微生物组的文章,其中数据分析用过microeco包,在这里,将我学到的资源分享给大家。R语言microeco:一个用于微生物群落生态学数据挖掘的R包。主要功能R6类;分类群丰度图,维恩图,Alpha多样性,Beta多样性,差异丰度分析,环境数据分析,零模型分析,网络分析,功能分析。install.packages("microeco")library(microeco)library
- 什么是分布式搜索引擎
罗彬桦
分布式搜索引擎搜索引擎分布式
什么是分布式搜索引擎搜索引擎所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。分布
- java工厂模式
3213213333332132
java抽象工厂
工厂模式有
1、工厂方法
2、抽象工厂方法。
下面我的实现是抽象工厂方法,
给所有具体的产品类定一个通用的接口。
package 工厂模式;
/**
* 航天飞行接口
*
* @Description
* @author FuJianyong
* 2015-7-14下午02:42:05
*/
public interface SpaceF
- nginx频率限制+python测试
ronin47
nginx 频率 python
部分内容参考:http://www.abc3210.com/2013/web_04/82.shtml
首先说一下遇到这个问题是因为网站被攻击,阿里云报警,想到要限制一下访问频率,而不是限制ip(限制ip的方案稍后给出)。nginx连接资源被吃空返回状态码是502,添加本方案限制后返回599,与正常状态码区别开。步骤如下:
- java线程和线程池的使用
dyy_gusi
ThreadPoolthreadRunnabletimer
java线程和线程池
一、创建多线程的方式
java多线程很常见,如何使用多线程,如何创建线程,java中有两种方式,第一种是让自己的类实现Runnable接口,第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下:
1、通过实现Runnable接口方式 1 2
- Linux
171815164
linux
ubuntu kernel
http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/
安卓sdk代理
mirrors.neusoft.edu.cn 80
输入法和jdk
sudo apt-get install fcitx
su
- Tomcat JDBC Connection Pool
g21121
Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件,事实上DBCP已经被Hibernate 所抛弃,因为他存在很多问题,诸如:更新缓慢,bug较多,编译问题,代码复杂等等。
Tomcat Jdbc P
- 敲代码的一点想法
永夜-极光
java随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
- jvm指令集
程序员是怎么炼成的
jvm 指令集
转自:http://blog.csdn.net/hudashi/article/details/7062675#comments
将值推送至栈顶时 const ldc push load指令
const系列
该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用)
0x02 &nbs
- Oracle字符集的查看查询和Oracle字符集的设置修改
aijuans
oracle
本文主要讨论以下几个部分:如何查看查询oracle字符集、 修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。
一、什么是Oracle字符集
Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。它使数据库工具,错误消息,排序次序,日期,时间,货
- png在Ie6下透明度处理方法
antonyup_2006
css浏览器FirebugIE
由于之前到深圳现场支撑上线,当时为了解决个控件下载,我机器上的IE8老报个错,不得以把ie8卸载掉,换个Ie6,问题解决了,今天出差回来,用ie6登入另一个正在开发的系统,遇到了Png图片的问题,当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的,和FireBug一样,呵呵),这个问题就解决了,但稍微做了下这个问题的处理。
我们知道PNG是图像文件存储格式,查询资
- 表查询常用命令高级查询方法(二)
百合不是茶
oracle分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
- uploadify3.1版本参数使用详解
bijian1013
JavaScriptuploadify3.1
使用:
绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数,参数如下});
设置的属性:
id: jQuery(this).attr('id'),//绑定的input的ID
langFile: 'http://ww
- 精通Oracle10编程SQL(17)使用ORACLE系统包
bijian1013
oracle数据库plsql
/*
*使用ORACLE系统包
*/
--1.DBMS_OUTPUT
--ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用
--语法:DBMS_OUTPUT.enable(buffer_size in integer default 20000);
--DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
- 【JVM一】JVM垃圾回收日志
bit1129
垃圾回收
将JVM垃圾回收的日志记录下来,对于分析垃圾回收的运行状态,进而调整内存分配(年轻代,老年代,永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括:
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-XX:+PrintGCDateStamps
-Xloggc
-XX:+PrintGC
通
- Toast使用
白糖_
toast
Android中的Toast是一种简易的消息提示框,toast提示框不能被用户点击,toast会根据用户设置的显示时间后自动消失。
创建Toast
两个方法创建Toast
makeText(Context context, int resId, int duration)
参数:context是toast显示在
- angular.identity
boyitech
AngularJSAngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value
*
to be returned. 返回值: 传入的value 实例代码:
<!DOCTYPE HTML>
- java-两整数相除,求循环节
bylijinnan
java
import java.util.ArrayList;
import java.util.List;
public class CircleDigitsInDivision {
/**
* 题目:求循环节,若整除则返回NULL,否则返回char*指向循环节。先写思路。函数原型:char*get_circle_digits(unsigned k,unsigned j)
- Java 日期 周 年
Chen.H
javaC++cC#
/**
* java日期操作(月末、周末等的日期操作)
*
* @author
*
*/
public class DateUtil {
/** */
/**
* 取得某天相加(减)後的那一天
*
* @param date
* @param num
*
- [高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业
comsci
计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广.....
以后
- 分层查询(Hierarchical Queries)
daizj
oracle递归查询层次查询
Hierarchical Queries
If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause:
hierarchical_query_clause::=
start with condi
- 数据迁移
daysinsun
数据迁移
最近公司在重构一个医疗系统,原来的系统是两个.Net系统,现需要重构到java中。数据库分别为SQL Server和Mysql,现需要将数据库统一为Hana数据库,发现了几个问题,但最后通过努力都解决了。
1、原本通过Hana的数据迁移工具把数据是可以迁移过去的,在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了,最后不得不更改为clob。
2、在数据插入的时候有些字段特别长
- C语言学习二进制的表示示例
dcj3sjt126com
cbasic
进制的表示示例
# include <stdio.h>
int main(void)
{
int i = 0x32C;
printf("i = %d\n", i);
/*
printf的用法
%d表示以十进制输出
%x或%X表示以十六进制的输出
%o表示以八进制输出
*/
return 0;
}
- NsTimer 和 UITableViewCell 之间的控制
dcj3sjt126com
ios
情况是这样的:
一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多.
解决办法:
在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画
查找cell结束显示的代理
- MySql中case when then 的使用
fanxiaolong
casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人"
union
(select
pp.id as "主键",
pp.project_number as &
- Ehcache(01)——简介、基本操作
234390216
cacheehcache简介CacheManagercrud
Ehcache简介
目录
1 CacheManager
1.1 构造方法构建
1.2 静态方法构建
2 Cache
2.1&
- 最容易懂的javascript闭包学习入门
jackyrong
JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html
闭包(closure)是Javascript语言的一个难点,也是它的特色,很多高级应用都要依靠闭包实现。
下面就是我的学习笔记,对于Javascript初学者应该是很有用的。
一、变量的作用域
要理解闭包,首先必须理解Javascript特殊
- 提升网站转化率的四步优化方案
php教程分享
数据结构PHP数据挖掘Google活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率,这也是营销策略里最最重要的方面之一,并且也是网站综合运营实例的结果。文中分享了四大优化策略:调查、研究、优化、评估,这四大策略可以很好地帮助用户设计出高效的优化方案。
PHP开发的网站优化一个网站最关键和棘手的是,如何提高整体的转化率,这是任何营销策略里最重要的方面之一,而提升网站转化率是网站综合运营实力的结果。今天,我就分
- web开发里什么是HTML5的WebSocket?
naruto1990
Webhtml5浏览器socket
当前火起来的HTML5语言里面,很多学者们都还没有完全了解这语言的效果情况,我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术,以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法,从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里 的 WebSocket API:它可用于客户端、服
- Socket初步编程——简单实现群聊
Everyday都不同
socket网络编程初步认识
初次接触到socket网络编程,也参考了网络上众前辈的文章。尝试自己也写了一下,记录下过程吧:
服务端:(接收客户端消息并把它们打印出来)
public class SocketServer {
private List<Socket> socketList = new ArrayList<Socket>();
public s
- 面试:Hashtable与HashMap的区别(结合线程)
toknowme
昨天去了某钱公司面试,面试过程中被问道
Hashtable与HashMap的区别?当时就是回答了一点,Hashtable是线程安全的,HashMap是线程不安全的,说白了,就是Hashtable是的同步的,HashMap不是同步的,需要额外的处理一下。
今天就动手写了一个例子,直接看代码吧
package com.learn.lesson001;
import java
- MVC设计模式的总结
xp9802
设计模式mvc框架IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等,使客户机越
来越不堪重负,因此将系统的商业分离出来。单独形成一部分,这样三层结构产生了。
其中‘层’是逻辑上的划分。
三层体系结构是将整个系统划分为如图2.1所示的结构[3]
(1)表现层(Presentation layer):包含表示代码、用户交互GUI、数据验证。
该层用于向客户端用户提供GUI交互,它允许用户