卢子宁

爬虫基础笔记—urllib3库+baidu图片首页图片爬取

urllib3库

简介

urllib3 是一个基于python3的功能强大，友好的http客户端。越来越多的python应用开始采用urllib3.它提供了很多python标准库里没有的重要功能。

1.构造请求(request)

导入urllib3库

import urllib3

然后需要实例化一个PoolManager对象构造请求，这个对象处理了连接池和线程池的所有细节，所以我们不用自行处理。

http = urllib3.PoolManager()

用request()方法发送一个请求

r = http.request('GET', 'http://httpbin.org/robots.txt')
b'Uesr-agent:*\nDisallow: /deny\n'

可以用request（）方法发送任意http请求，我们发一个post请求

r = http.request(
    'POST',
    'http://httpbin.org/post',
    fields=('hello':'world')
)

2.Response content

http响应对象提供status,data和header等属性。

http = urllib3.PoolManager()
r = http.request('GET', 'http://httpbin.org/ip')
print(r.status)
print(r.data)
print(r.headers)

'''
运行结果
200
b'{\n  "origin": "221.178.125.122"\n}\n'
HTTPHeaderDict({'Date': 'Tue, 25 Feb 2020 12:00:23 GMT', 'Content-Type': 'application/json', 'Content-Length': '34', 'Connection': 'keep-alive', 'Server': 'gunicorn/19.9.0', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Credentials': 'true'})
'''

3.JSON content

返回的json格式数据可以通过json模块，load为字典数据类型。

import urllib3
import json

http = urllib3.PoolManager()
r = http.request('GET', 'http://httpbin.org/ip')
print(json.loads(r.data.decode('utf-8')))

'''
运行结果
{'origin': '221.178.125.122'}
'''

4.Binary content

响应返回的数据都是字节类型，对于大量的数据我们通过

stream来处理好：
http = urllib3.PoolManager()
r = http.request('GET', 'http://httpbin.org/bytes/1024',preload_content=False)

 for chunk in r.stream(32):
     print(chunk)

也可以当作一个文件对象来处理

http = urllib3.PoolManager()
r = http.request('GET', 'http://httpbin.org/bytes/1024',preload_content=False)

 for line in r:
     print(line)

5.proxies

可以利用ProxyManager进行http代理操作

proxy = urllib3.ProxyManager('http://180.76.111.69:3128')
res = proxy.request('get', 'http://httpbin.org/ip')
print(res.data)

6.Request data

a.Headers

request方法中添加字典格式的headers参数去指定请求头

http = urllib3.PoolManager()
r = http.request('GET', 'http；//httpbin.org/headers', headers={'key': 'value'})

print(json.loads(r,data,decode('utf-8')))

b.Query parameters

get，head，delete请求，可以通过提供字典类型的参数fields来添加查询参数。

http = urllib3.PoolManager()
r = http.request(
    'GET',
    'http://httpbin.org/get',
    fields={'arg': 'value'}
)
print(json.loads(r.data.decode(utf-8))['args'])

对于post和put请求，如果需要查询参数，需要通过url编码将参数编码正确个格式然后拼接到url中

import urllib3
import json
from urllib.parse import urlencode
http = urllib3.PoolManager()
encoded_args = urlencode({'args': 'value'})
url = 'http://httpbin.org/post?' + encode_args
r = http.request('POST', url)
print(json.loads(r.data.decode('utf-8'))['args'])

c.Form data

对于put和post请求，需要提供字典类型的参数field来传递form表单数据。

r = http.request('POST', 'http://httpbin/post',fields={'field: 'value'})
print(json.loads(r.data.decode('utf-8'))['form'])

d.JSON

当我们需要发送json数据时，我们需要在request中传入编码后的二进制数据类型的body参加数，并制定Content-type的请求头

http = urllib3.PoolManager()
data = {'attribute': 'value'}
encode_data = json.dumps(data).encode('utf-8')
r = http.request(
    'post'
    'http://httpbin.org/post',
    body=encoded_data,
    headers={'Content-Type': 'application/json'}
)
print(json.load(r.data.decode('utf-8'))['json'])

e.Files&binary data

对于文件上传，我们可以模仿浏览器表单的方式

with open('example.text') as f:
    file_data = f.read()
r = http.request(
    'POST',
    'http://httpbin.org/post',
    fields={
        'filefied':('example.txt', file_data),
})    
print(json.loads(r.data.decode('utf-8'))['files'])

对于二进制数据的上传，我们用指定body的方式，并设置Content-Type的请求头

http = urllib3.PoolManger()
with open('example.jpg','rb') as f:
    binary_data = f.read()
r = http.request(
    'post',
    'http://httpbin.org/post',
    body=binary_data,
    headers={'Content-Type':'image/jpeg'}
)
print(json.loads(r.data.decode('utf-8')))

7.爬虫一般开发流程

	a.找到目标数据
	b.分析请求流程
	c.构造http请求
	d.提取清洗数据
	e.数据持久化

案例：1.利用urllib3 下载百度图片首页所有图片，保存到当前文件夹下的imgs文件夹

import urllib3
import re
'''
下载百度首页所有图片
'''
# 1.寻找目标数据
page_url = 'https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%CD%BC%C6%AC&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111'
# 2.分析请求流程
# 图片是浏览器下载下来的
# 图片的url,会比图片更早的下载回来
# 下载html
http = urllib3.PoolManager()
res = http.request('GET', page_url)
html = res.data.decode('utf-8')     # 网页源码搜索charset，查看编码类型
# 提取url
img_urls = re.findall(r'"thumbURL":"(.*?)"', html)
# 加上headers伪装
header = {
    "Referer": "https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%CD%BC%C6%AC&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111"

}
# 遍历 下载
for index, img_url in enumerate(img_urls):
    img_res = http.request('GET', img_url, headers=header)
    # print(img_res.data)
    # 动态拼接文件名
    img_name = '%s.%s' % (index, img_url.split('.')[-1])
    with open(img_name, 'wb') as f:
        f.write(img_res.data)

你可能感兴趣的:(爬虫基础)

Python 爬虫基础教程——BeautifulSoup抓取入门（2）那个百分十先生
大家好，上篇推文介绍了BeautifulSoup抓取的一些基础用法，本篇内容主要是介绍BeautifulSoup模块的文档树使用以及实例。一、遍历文档树直接看代码吧frombs4importBeautifulSouphtml='python知识学堂Python知识学堂欢迎您'#上面是随便写的一个页面代码soup=BeautifulSoup(html,'lxml')#print(soup.prett
Python爬虫基础知识板栗妖怪 python 爬虫开发语言
(未完成)爬虫概念爬虫用于爬取数据，又称之为数据采集程序爬取数据来源于网络，网络中数据可以是有web服务器、数据库服务器、索引库、大数据等等提供爬取数据是公开的、非盈利。python爬虫使用python编写的爬虫脚本可以完成定时、定量、指定目标的数据爬取。主要使用多（单）线程/进程、网络请求库、数据解析、数据储存、任务调度等相关技术。爬虫和web后端服务关系爬虫使用网络请求库，相当于客户端请求，w
Python爬虫基础总结醉蕤 Python python 爬虫
活动地址：CSDN21天学习挑战赛学习的最大理由是想摆脱平庸，早一天就多一份人生的精彩；迟一天就多一天平庸的困扰。学习日记目录学习日记一、关于爬虫1、爬虫的概念2、爬虫的优点3、爬虫的分类4、重要提醒5、反爬和反反爬机制6、协议7、常用请求头和常用的请求方法8、常见的响应状态码9、url的详解二、爬虫基本流程三、可能需要的库四、小例1、requests请求网页2、python解析网页源码（使用Be
Python100个库分享第16个—sqlparse(SQL解析器) 一晌小贪欢 Python100个库分享 sql python 爬虫开发语言 python学习 python爬虫
目录专栏导读库的介绍库的安装1、解析SQL语句2、格式化SQL语句3、提取表名4、分割多条SQL语句实际应用代码参考：总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础
python+re正则表达式匹配指定10位整数 \ 小数 \ 整数一晌小贪欢 Python每日tips 自己的笔记 python 正则表达式 excel
目录专栏导读匹配整数(位数也可以指定)匹配10位数字匹配小数匹配数字总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击——>Python基础学习专栏求订阅<
使用requests做爬虫拿泥more Python 爬虫
文章目录爬虫基础requestsPythonFile(文件)方法open()file对象Python正则表达式数据解析验证码登录IP代理异步爬虫random笔记爬虫基础爬虫：模拟浏览器上网，抓取数据。www.baidu.com/robots.txt常用请求头User-AgentConnection：请求完毕后，是断开还是保持连接cookie:常用响应头Content-Type：服务器响应回客户端的
爬虫基础简介 xnhdbb 爬虫 python
爬虫基础简介爬虫的定义：通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程。爬虫的价值：-实际应用-就业爬虫的合法性：-在法律中不被禁止-具有违法风险爬虫带来的风险可以体现在如下2个方面：-爬虫干扰了被访问网站的正常运营-爬虫抓取了受到法律保护的特定类型的数据或信息如何在使用编写爬虫的过程中避免触犯法律：-时常优化自己的程序，避免干扰被访问网站的政策运行-在使用传播爬取到的数据时，审查
浅学爬虫-python爬虫基础 Jr_l 网络爬虫网络爬虫 python
介绍与应用Python爬虫是指利用Python编写程序从互联网上自动获取信息的技术。爬虫广泛应用于数据收集、价格监控、内容聚合、市场分析等领域。其基本原理是模拟浏览器发送HTTP请求获取网页数据，并通过解析HTML来提取所需的信息。基本工具Python中有许多强大的爬虫库，最常用的两个库是requests和BeautifulSoup。requests库:一个简单易用的HTTP库，用于发送HTTP请
爬虫技巧分享：掌握高效数据抓取的艺术 shiming8879 爬虫 python
爬虫技巧分享：掌握高效数据抓取的艺术在当今数据驱动的世界里，爬虫技术成为了获取网页信息、分析数据不可或缺的工具。无论是学术研究、市场调研，还是商业智能，爬虫都扮演着重要的角色。然而，要编写出高效、稳定的爬虫，并非易事。本文将为你分享一系列爬虫技巧，帮助你更好地掌握数据抓取的艺术。一、基础篇：构建稳健的爬虫基础选择合适的库和工具在开始编写爬虫之前，选择合适的库和工具至关重要。Python作为一门简洁
Python爬虫基础知识：从零开始的抓取艺术不知名靓仔 python 爬虫 php
在大数据时代，网络数据成为宝贵的资源，而Python爬虫则是获取这些数据的重要工具。本文旨在为初学者提供一份Python爬虫的入门指南，涵盖基础知识、常用库介绍、实战案例以及注意事项，帮助你快速上手，成为一名合格的“网络矿工”。一、Python爬虫概述1.1什么是爬虫？爬虫，也称为网络爬虫或蜘蛛，是一种自动抓取互联网信息的程序。它通过模拟人类浏览网页的行为，自动地遍历和抓取网络上的数据，常用于数据
多线程爬虫基础代码 ctrlCV工程师001 爬虫 python 开发语言
#导入线程模块importthreadingdefcoding():#定义coding函数，用于打印字符串"aaa"十次foriinrange(10):print("aaa")defac():#定义ac函数，用于打印字符串"bbbb"十次：forjinrange(10):print("bbbb")defmain():#定义main函数，用于创建并启动两个线程：#创建第一个线程，目标函数是codin
零基础如何高效的学习好Python爬虫技术？ IT青年
如何高效学习Python爬虫技术？大部分Python爬虫都是按“发送请求-获得页面-解析页面-抽取并储存内容”流程来进行抓取，模拟人们使用浏览器获取网页信息的过程。高效学习Python爬虫技术的步骤：1、学Python网络爬虫基础知识学Python网络爬虫时先了解Python基本常识，变量、字符串、列表、字典、元组、操控句子、语法等，把基础打牢，在做案例时能知道运用的是哪些知识点。此外还需求了解一
Python爬虫知识图谱极客代码玩转Python python 爬虫
下面是一份详细的Python爬虫知识图谱，涵盖了从基础入门到进阶实战的各个环节，涉及网络请求、页面解析、数据提取、存储优化、反爬策略应对以及法律伦理等多个方面，并配以关键点解析和代码案例，以供读者深入学习和实践。一、Python爬虫基础概念1.1网络爬虫简介-网络爬虫是一种自动浏览互联网上的信息资源，并按照一定规则抓取所需数据的程序或脚本。它模仿人类访问网页的行为，获取并解析网页内容。-作用：网络
爬虫实战1.2.3 爬虫基础-爬虫的基本原理罗汉堂主
本文转载：静觅»[Python3网络爬虫开发实战]2.3-爬虫的基本原理我们可以把互联网比作一张大网，而爬虫（即网络爬虫）便是在网上爬行的蜘蛛。把网的节点比作一个个网页，爬虫爬到这就相当于访问了该页面，获取了其信息。可以把节点间的连线比作网页与网页之间的链接关系，这样蜘蛛通过一个节点后，可以顺着节点连线继续爬行到达下一个节点，即通过一个网页继续获取后续的网页，这样整个网的节点便可以被蜘蛛全部爬行到
爬虫基础：Requests模块小白进城
Requests是基于Python开发的HTTP网络请求库。GET请求importrequestsurl="https://xxxx"response1=requests.get(url=url)response1.encoding=response1.apparent_encoding#转码print(response1.url)#请求地址print(response1.text)#内容的文本形
《Python 网络爬虫简易速速上手小册》第1章：Python 网络爬虫基础（2024 最新版）江帅帅《Python 网络爬虫简易速速上手小册》pytorch python 爬虫网络性能优化人工智能数据分析
文章目录1.1网络爬虫简介1.1.1重点基础知识讲解1.1.2重点案例：社交媒体数据分析1.1.3拓展案例1：电商网站价格监控1.1.4拓展案例2：新闻聚合服务1.2网络爬虫的工作原理1.2.1重点基础知识讲解1.2.2重点案例：股票市场数据采集1.2.3拓展案例1：博客文章抓取1.2.4拓展案例2：酒店价格监控1.3网络爬虫的法律与道德考量1.3.1重点基础知识讲解1.3.2重点案例：社交媒体数
【进阶】【Python网络爬虫】【15.爬虫框架】scrapy入门（附大量案例代码）（建议收藏） My.ICBM Python网络爬虫 python 爬虫 scrapy
Python网络爬虫基础一、爬虫框架1.什么是框架？2.初期如何学习框架？二、scrapy入门1.网络爬虫请求数据解析数据保存数据2.scrapy安装安装方式全局命令项目命令案例-scrapy下厨房网爬取settings.pyspidersblood.py案例-scrapy爬取哔哩哔哩网settings.pyitems.pypipelines.pyiderslibi.py-基于终端指令的持久化存储
爬虫：request、scrapy、scrapy-redis的爬虫流程，匹配机制：xpath、正则、css选择器，反爬虫策略 little star* python 网络中间件 python js
文章目录一、python、PHP、Java、C/C++爬虫的比较二、python爬虫基础知识1.抓取HTML页面2.解析响应页面的内容3.采集动态HTMLselenium操作cookie隐式等待和显示等待打开新窗口和切换页面：4.验证码处理5.scrapy框架（scrapy、pyspider）安装scrapy框架scrapy框架架构项目文件作用CrawlSpider爬虫使用twisted异步保存M
花瓣网美女图片爬取林小果1 python爬虫 python 爬虫网络爬虫
爬虫基础案例01花瓣网美女图片网站url：https://huaban.com图片爬取importrequestsimportjsonimportosres=requests.get(url="https://api.huaban.com/search/file?text=%E7%BE%8E%E5%A5%B3&sort=all&limit=40&page=1&position=search_pin
爬虫基础-前端基础小旺不正经 #爬虫爬虫前端
Html是骨骼、css是皮肤、js是肌肉，三者之间的关系可以简单理解为m(html)-v(css)-c(js)浏览器的加载过程构建dom树子资源加载-加载外部的css、图片、js等外部资源样式渲染-css执行DOM树ajax、json、xmlAJAX是一种在无需重新加载整个网页的情况下，能够更新部分网页的技术。AJAX=异步JavaScript和XML。AJAX是一种用于创建快速动态网页的技术。j
爬虫开发实战1.2.6 爬虫基础-Robots协议罗汉堂主
本文转载：静觅»[Python3网络爬虫开发实战]3.1.4-分析Robots协议利用urllib的robotparser模块，我们可以实现网站Robots协议的分析。本节中，我们来简单了解一下该模块的用法。Robots协议Robots协议也称作爬虫协议、机器人协议，它的全名叫作网络爬虫排除标准（RobotsExclusionProtocol），用来告诉爬虫和搜索引擎哪些页面可以抓取，哪些不可以抓
Python网络通信-python爬虫基础落樱坠入星野 python 爬虫开发语言笔记经验分享网络安全安全
Python网络通信1、requests模块的使用1.1、安装requests模块pipinstallrequests打开pycharm安装成功会提示successfully1.2、发送GET请求简单请求（以京东举例）#coding=utf-8importrequestsurl="http://www.jd.com"#直接请求res=requests.get(url)#获取响应体的内容data=r
python爬虫基础落樱坠入星野 python 爬虫开发语言经验分享笔记
python爬虫基础前言Python爬虫是一种通过编程自动化地获取互联网上的信息的技术。其原理可以分为以下几个步骤：发送HTTP请求：爬虫首先会通过HTTP或HTTPS协议向目标网站发送请求。这个请求包含了爬虫想要获取的信息，可以是网页的HTML内容、图片、视频等。接收响应：目标网站接收到请求后，会返回一个HTTP响应。这个响应包含了请求的数据，状态码、头部信息等。爬虫需要解析这个响应来获取所需的
python爬虫零基础学习之简单流程示例只存在于虚拟的King python 爬虫学习开发语言计算机网络学习方法
文章目录爬虫基础爬虫流程常用库爬虫示例Python技术资源分享1、Python所有方向的学习路线2、学习软件3、入门学习视频4、实战案例5、清华编程大佬出品《漫画看学Python》6、Python副业兼职与全职路线爬虫基础网络爬虫（WebCrawler），也称为网页蜘蛛（WebSpider），是一种用于自动获取网页内容的程序。爬虫的主要任务是从互联网上抓取网页内容，然后对其进行解析和提取有用的信息
python 爬虫基础 -- 综合示例午后阳光送给你 python python 爬虫
python爬虫基础–综合示例题目：爬取某网站提供ip地址，并测试其是否可用技术list：requestsreBeautifulSouptelnetlib用以测试ip地址是否可用打开待爬取数据的网站，按F12，查看我们要截取的数据的格式每一行数据中，我们只关心ip地址及其端口号。编写可能用到的正则表达式ex='(?P.*?)(?P.*?)(?P.*?)(?P.*?)(?P.*?)'regaxEx=
【头歌】——数据分析与实践-python-网络爬虫-Scrapy爬虫基础-网页数据解析-requests 爬虫-JSON基础くらんゆうき【头歌】——数据分析与实践答案数据分析 python 爬虫
【头歌】——数据分析与实践-python-网络爬虫-Scrapy爬虫基础-网页数据解析-requests爬虫-JSON基础Pandas初体验第1关爬取网页的表格信息第2关爬取表格中指定单元格的信息第3关将单元格的信息保存到列表并排序第4关爬取div标签的信息第5关爬取单页多个div标签的信息第6关爬取多个网页的多个div标签的信息Scrapy爬虫基础第1关Scarpy安装与项目创建第2关Scrap
Python爬虫基础教程——lxml爬取入门那个百分十先生
大家好，上次介绍了BeautifulSoup爬虫入门,本篇内容是介绍lxml模块相关教程，主要为Xpath与lxml.cssselect的基本使用。一、lxml介绍引用官方的解释：lxmlXML工具箱是C库libxml2和libxslt的Python绑定。它的独特之处在于它将这些库的速度和XML功能的完整性与本机PythonAPI的简单性结合在一起，该PythonAPI大多数都兼容，但优于著名的E
Python爬虫基础篇1 桔梗.py python 爬虫开发语言
Python-Crawler简介：在Http协议中，定义了八种请求方法。这里介绍两种常用的请求方法，分别是get请求和post请求。get请求：一般情况下，只从服务器获取数据下来，并不会对服务器资源产生任何影响的时候会使用get请求。post请求：向服务器发送数据（登录）、上传文件等，会对服务器资源产生影响的时候会使用post请求。以上是在网站开发中常用的两种方法。并且一般情况下都会遵循使用的原则
爬虫基础及Python环境安装明哥玩编程
前言：爬虫是Python最常见的开发项目，而爬虫本身的应用对象又是多种多样（文本、视频、图片、其它文件等等），本视频系列课程，我们将会拿出多个案例进行爬虫项目实战讲解，帮大家对爬虫项目进行实战，培养爬虫项目分析的实际过程。（本系列每个视频教程都将控制到5-6分钟左右）第一篇、爬虫基础及Python环境安装爬虫是什么：网络爬虫（又称为网页蜘蛛，网络机器人），是一种按照一定的规则，自动地抓取互联网信息
python爬虫基础--多线程--多进程--协程我还可以熬_ #python爬虫 python 爬虫开发语言
目录终于考完试了，自由了哈哈哈哈哈知识点回顾详看：python爬虫基础--json数据和jsonpath--多线程原理_我还可以熬_的博客-CSDN博客多线程多线程--方法版多线程--类版多进程multiprocessing模块Manager类，实现数据共享进程池的使用多进程--方法版多进程--进程池版协程安装第三方模块终于考完试了，自由了哈哈哈哈哈本来早该完成的这篇，然后期间考试，耽误了很久！！
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他