Golang爬虫框架 colly的使用

项目特性

清晰明了的API
速度快（每个内核上的请求数大于1K）
管理每个域的请求延迟和最大并发数
自动cookie和会话处理
同步/异步/ 并行抓取
高速缓存
自动处理非Unicode编码
支持Robots.txt
支持Google App Engine
通过环境变量进行配置
可拓展

安装colly

go get -u github.com/gocolly/colly

第一个colly 应用

package main

import (
	"fmt"
	"github.com/gocolly/colly"
)

func main() {
	c := colly.NewCollector()

	// goquery selector class
	c.OnHTML(".sidebar_link", func(e *colly.HTMLElement) {
		e.Request.Visit(e.Attr("href"))
/*		link := e.Attr("href")
		// Print link
		fmt.Printf("Link found: %q -> %s\n", e.Text, link)
		// Visit link found on page
		// Only those links are visited which are in AllowedDomains
		c.Visit(e.Request.AbsoluteURL(link))*/
	})

	c.OnRequest(func(r *colly.Request) {
		fmt.Println("url：",r.URL)
	})
	c.Visit("https://gorm.io/zh_CN/docs/")

}

回调函数的调用顺序

OnRequest 在请求之前调用
OnError 如果请求期间发生错误，则调用
OnResponseHeaders 在收到响应标头后调用
OnResponse 收到回复后调用
OnHTML OnResponse如果接收到的内容是HTML ，则在此之后立即调用
OnXML OnHTML如果接收到的内容是HTML或XML ，则在之后调用
OnScraped 在OnXML回调之后调用

实例

func collback()  {  // 添加回调 收集器
	c:= colly.NewCollector()
	c.OnRequest(func(r *colly.Request) {
		fmt.Println("请求前调用:OnRequest")
		// fmt.Println("Visiting", r.URL)
	})

	c.OnError(func(_ *colly.Response, err error) {
		fmt.Println("发生错误调用:OnReOnError")
		//log.Println("Something went wrong:", err)
	})

/*	c.OnResponseHeaders(func(r *colly.Response) {  //高版本已经不用了
		fmt.Println("Visited", r.Request.URL)
	})
*/
	c.OnResponse(func(r *colly.Response) {
		fmt.Println("获得响应后调用:OnResponse")
		//fmt.Println("Visited", r.Request.URL)
	})

	c.OnHTML("a[href]", func(e *colly.HTMLElement) {
		fmt.Println("OnResponse收到html内容后调用:OnHTML")
		//e.Request.Visit(e.Attr("href"))
	})

/*	c.OnHTML("tr td:nth-of-type(1)", func(e *colly.HTMLElement) {
		fmt.Println("First column of a table row:", e.Text)
	})*/

	c.OnXML("//h1", func(e *colly.XMLElement) {
		fmt.Println("OnResponse收到xml内容后调用:OnXML")
		//fmt.Println(e.Text)
	})

	c.OnScraped(func(r *colly.Response) {
		fmt.Println("结束", r.Request.URL)
	})
	c.Visit("https://gorm.io/zh_CN/docs/")

}

得到的:

colly 的配置

设置UserAgent

//设置UserAgent的两种方式：

/*	//方式一 :
    c2 := colly.NewCollector()
	c2.UserAgent = "xy"
	c2.AllowURLRevisit = true*/

/*  //方式二 :
	c2 := colly.NewCollector(
		colly.UserAgent("xy"),
		colly.AllowURLRevisit(),
	)*/

设置Cookie

	//设置cookie的两种方式
	//方式一：通过手动网页添加cookies
	c.OnRequest(func(r *colly.Request) {
		r.Headers.Add("cookie","_ga=GA1.2.1611472128.1650815524; _gid=GA1.2.2080811677.1652022429; __atuvc=2|17,0|18,5|19")
	})
	// 方式二 :通过url 添加cookies
	siteCookie := c.Cookies("url")
	c.SetCookies("",siteCookie)

HTTP配置

Colly使用Golang的默认http客户端作为网络层。可以通过更改默认的HTTP roundtripper来调整HTTP选项。

c := colly.NewCollector()
c.WithTransport(&http.Transport{
	Proxy: http.ProxyFromEnvironment,
	DialContext: (&net.Dialer{
		Timeout:   30 * time.Second,
		KeepAlive: 30 * time.Second,
		DualStack: true,
	}).DialContext,
	MaxIdleConns:          100,
	IdleConnTimeout:       90 * time.Second,
	TLSHandshakeTimeout:   10 * time.Second,
	ExpectContinueTimeout: 1 * time.Second,
}

colly页面爬取和解析

页面爬取和解析重点方法是 onHTML 回调方法

	c.OnHTML("a[href]", func(e *colly.HTMLElement) {
        fmt.Printf("e.Name:%v\n",e.Name)
		e.Request.Visit(e.Attr("href"))
	})




func html()  {
	c:= colly.NewCollector()
	c.OnHTML("#sidebar", func(e *colly.HTMLElement) {
		//fmt.Printf("e.Name:%v\n",e.Name) //名字
		//fmt.Printf("e.Text:%v\n",e.Text) //文本

		ret, _ := e.DOM.Html() // selector 选择器
		fmt.Printf("ret:%v\n",ret)
	})
	c.OnRequest(func(r *colly.Request) {
		fmt.Println("url：",r.URL)
	})
	c.Visit("https://gorm.io/zh_CN/docs/")
}

第一个参数是：goquery选择器，可以元素名称，ID或者Class选择器，第二个参数是根据第一个选择器获得的HTML元素结构如下：

colly框架重构爬虫

package main

import (
	"fmt"
	"github.com/gocolly/colly"
)

func main()  {
	c:= colly.NewCollector()
	c.OnHTML(".sidebar_link", func(e *colly.HTMLElement) {  // 左侧链接

		href := e.Attr("href")
		if href != "index.html"{
			c.Visit(e.Request.AbsoluteURL(href))
		}
	})
	c.OnHTML(".article-title", func(h *colly.HTMLElement) {  // 选择链接之后的标题
		title := h.Text
		fmt.Printf("title: %v\n",title)
	})
	c.OnHTML(".article", func(h *colly.HTMLElement) {  //内容
		content, _ := h.DOM.Html()
		fmt.Printf("content: %v\n",content)
	})
	c.OnRequest(func(r *colly.Request) {
		fmt.Println("url：",r.URL.String())
	})
	c.Visit("https://gorm.io/zh_CN/docs/")
}

到此这篇关于Golang爬虫框架 colly的使用的文章就介绍到这了,更多相关Golang colly内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

你可能感兴趣的:(Golang爬虫框架 colly的使用)

《伴时匣》app开发技术分享--用户登录（3）鸿蒙小林鸿蒙 harmonyos 端云一体化
技术栈Appgalleryconnect开发准备上一节我们实现了用户数据的提交，我们成功的实现了用户的注册，这一节我们就要根据提交的信息进行登陆验证，在登陆之后我们需要保存当前用户的信息，方便我们后续的使用。功能分析要实现登陆，首先我们需要拿到用户输入的内容，检测之后，我们实现用户的登陆，同时把用户登录成功后的数据存储起来，方便我们后续的使用功能开发我们先实现登陆相关的内容importprompt
探索工业自动化：C开发OPC Server开源项目推荐翟俭妙
探索工业自动化：C#开发OPCServer开源项目推荐去发现同类优质开源项目:https://gitcode.com/项目介绍在工业自动化领域，OPC（OLEforProcessControl）标准是实现设备间数据交换的关键技术。为了帮助开发者更轻松地进入这一领域，我们推荐一个由社区贡献的C#开发OPCServer开源项目。该项目不仅提供了完整的源码，还包含了详细的使用文档和配置指南，适用于32位
ThinkPHP框架深入解析与实战技巧 weixin_42613017
本文还有配套的精品资源，点击获取简介：《深入理解ThinkPHP框架》一文深入探讨了ThinkPHP这一广泛使用的PHPWeb开发框架。文章详细阐述了ThinkPHP的核心概念、设计模式、主要特点以及核心组件。此外，还提供了基于ThinkPHP的开发实践案例，包括常见应用场景、开发流程以及进阶话题，如模块化开发、错误处理、RESTfulAPI实现和调试工具的使用。读者将通过本文全面学习到如何高效运
【HarmonyOS NEXT】鸿蒙应用实现屏幕录制详解和源码
【HarmonyOSNEXT】鸿蒙应用实现屏幕录制详解和源码一、前言官方文档关于屏幕录制的API和示例介绍获取简单和突兀。使用起来会让上手程度变高。所以特意开篇文章，讲解屏幕录制的使用。官方文档参见：使用AVScreenCaptureRecorder录屏写文件(ArkTS)二、方案思路鸿蒙应用关于录制屏幕，官方提供了AVScreenCaptureRecorder进行屏幕录制的调用。分为以下几个步骤
JavaScript深入理解与实战：作业6详解红廉骑士兽
本文还有配套的精品资源，点击获取简介：本次作业深入探讨了JavaScript编程语言的基础语法、函数与闭包、对象与原型链、事件与DOM操作、异步编程、ES6新特性、框架与库的使用、性能优化以及调试与测试。JavaScript在Web开发中扮演关键角色，通过学习上述知识点，学生将能够提升Web应用开发技能，优化代码性能，并进行有效的代码调试与测试。1.JavaScript基础语法介绍与实战1.1Ja
HtmlEx：HTML高级开发与实战指南浮华ya
本文还有配套的精品资源，点击获取简介：HTML是创建网页的基础，而"HtmlEx"项目旨在提升开发者的HTML技能。内容包括HTML5新特性，CSS和JavaScript的深入集成，表单元素的使用和验证，多媒体支持，Web组件，SEO优化，无障碍性实践，HTML模板语言使用，以及与后端框架的集成。通过实践讲解，让开发者在网页开发中更加得心应手。1.HTML基本结构与元素1.1HTML文档结构解析H
爬虫基础-urllib库的使用 a little peanut Python3网络爬虫 python 爬虫开发语言
注：本文章为学习过程中对知识点的记录，供自己复习使用，也给大家做个参考，如有错误，麻烦指出，大家共同探讨，互相进步。借鉴出处：该文章的路线和主要内容：崔庆才（第2版）python3网络爬虫开发实战bytes类型：https://blog.csdn.net/apple_50618492/article/details/114677967python中文官网：https://docs.python.o
MyBatis注解开发增删改查基础篇 1加1等于 #SpringBoot spring boot
本文是MyBatis注解开发的基础篇，将通过实际场景，详细介绍MyBatis注解式开发的使用，这是MyBatis很强大的一个特性，可以直接在接口方法上定义SQL语句，从而实现数据库的增删改查操作。本文目录一、环境依赖二、创建对应实体类三、映射接口四、复杂查询与动态SQL一、环境依赖在开发之前，需要确保环境pom.xml中添加了MyBatis相关依赖。org.mybatis.spring.bootm
iOS14.6真机调试实战教程.zip Neo-ke
本文还有配套的精品资源，点击获取简介：iOS开发中真机调试是关键步骤，确保应用在真实设备上的兼容性和性能。本文深入探讨iOS14.6真机调试包的使用，介绍必要的调试工具和步骤。真机调试相较于模拟器调试更能贴近实际用户体验，涉及硬件特性、网络条件和电池状态等因素，为解决特定设备或系统版本问题提供关键帮助。开发者需理解安装描述文件、连接设备、配置Xcode和运行应用的具体操作，以在iOS14.6版本上
Golang基础笔记七之指针，值类型和引用类型后端go指针引用
本文首发于公众号：Hunter后端原文链接：Golang基础笔记七之指针，值类型和引用类型本篇笔记介绍Golang里的指针，值类型与引用类型相关的概念，以下是本篇笔记目录：指针值类型与引用类型内存逃逸减少内存逃逸的几种方案1、指针在计算机内存中，每个变量都存储在特定的内存地址上，而指针是一种特殊的变量，它存储的是一个变量的内存地址。我们可以通过指针访问变量的内存地址，也可以通过指针访问或修改这个变
OpenHarmony应用ServiceExtensionAbility的使用全村最肉的人 OpenHarmony常用技巧 OpenHarmony
文章目录概述环境一、创建ServiceExtensionAbility服务二、配置ServiceExtensionAbility服务三、应用特权配置1.提取当前设备系统中的特权配置文件install_list_capability.json，文件位于/etc/app/中2.在文档最下面添加应用的信息3.将特权配置文件install_list_capability.json推送回系统中，覆盖系统配置
springboot中@Transactional注解的使用风也温柔1 springboot spring boot 后端 java
1、引入依赖首先，确保你的SpringBoot项目中包含了对事务支持的依赖。对于大多数应用场景，SpringBoot会自动引入事务管理相关的依赖。但如果你需要手动添加，可以检查spring-boot-starter-data-jpa（针对JPA）或spring-boot-starter-jdbc（针对JDBC）等起步依赖是否已经存在于你的pom.xml或build.gradle文件中。2、使用@T
Python虚拟环境管理：conda、venv、pipenv三国杀 network爬虫 python conda 数据库 jupyter
Python虚拟环境管理：conda、venv、pipenv三国杀作为一名在Python生态系统中学习实践了六年的开发者，我深刻体会到了Python虚拟环境管理工具的重要性和复杂性。从最初接触virtualenv时的懵懂，到现在熟练使用conda、venv、pipenv等工具，每一次的学习和实践都让我对Python环境管理有了更深的理解。今天，我想和大家分享一下这几年来对这三个主流工具的使用心得，
zephyr OS 线程的使用
目录概述1线程的概念1.1线程定义1.2线程的本质定义1.3线程的核心组成要素1.4线程与进程的对比1.5线程在RTOS中的关键特性1.6线程的同步与通信1.7线程在嵌入式系统的特殊考量1.8多线程编程模型2ZephyrRTOS中线程2.1创建线程的步骤2.2ZephyrRTOS中线程定义2.3关键API函数2.4线程中的睡眠函数3线程应用实践3.1完整线程定义模板3.1.1源代码3.1.2关键细
Xilinx FPGA ICAP原语实现多重配置 whik1194 ISE Vivado MicroBlaze系列教程 FPGA xilinx ICAP Multiboot 多重配置
文章目录1.FPGA可以运行几个固件2.XilinxICAP原语简介3.ICAP原语模板的使用4.ICAP在Spartan-6上的使用5.ICAP在Kintex-7上的使用工程下载1.FPGA可以运行几个固件众所周知，常见的FPGA通常为SRAM结构，固件程序一般存放在外置的串行Flash中，比如SPIFlash，M25P16或N25Q128等。FPGA启动时，一般先从SPI起始地址开始加载数据到
电商用户行为可视化大屏--大数据项目
一．项目目的1.深入了解服务：用户的浏览路径、购买频率、商品评价等数据，能够精准地刻画用户画像。了解用户的年龄、性别、地域等基本信息，以及他们的兴趣爱好、消费习惯等更深入的特征，从而为个性化的营销和服务提供依据。2.优化用户体验：通过分析用户在页面之间的跳转时间、购物车的使用情况等，找出可能存在的流程不畅或设计不合理的地方。3.提高运营效率：对商品销售数据、库存数据等进行关联分析，有助于合理安排库
Golang Kratos 系列：业务分层的若干思考（二） TransPlus golang 开发语言后端
上一篇文章简单讨论了领域层在Kratos中的使用，主要涉及引入领域层，将数据层和业务层之间的解耦，接下来讨论一个稍微全面一点的例子，在此基础上引入外部Api（主要是易变部分）的领域层下的情况。我们同样可以通过依赖倒置和适配器模式实现统一治理：一、升级后的领域层架构internal/├──domain（biz）#核心领域层│├──user.go#用户聚合根│├──payment.go#支付领域服务接
探索GORM：Go语言中的开发友好型ORM库
探索GORM：Go语言中的开发友好型ORM库gormThefantasticORMlibraryforGolang,aimstobedeveloperfriendly项目地址:https://gitcode.com/gh_mirrors/gor/gorm在Go语言的生态系统中，有一颗璀璨的明星——GORM，为开发者们带来了高效且直观的对象关系映射（ORM）体验。这是一篇专为那些寻求数据库操作简便性
go中自动补全插件安装-gopls aliven1 golang 开发语言后端
vscode中安装gopls失败，导致go中代码无提示，无法自动补全引用环境变量中设置go的代理：setxGOPROXY“https://goproxy.cn,direct”goinstallgolang.org/x/tools/gopls@latest
Go语言中map[string]interface{} 和 map[string]string的区别 Code季风学习 golang 后端
在Go语言中，map[string]interface{}和map[string]string是两种不同类型的map，它们的主要区别在于值的类型以及这种差异带来的使用场景和灵活性的不同。1.值的类型map[string]interface{}：这里的interface{}表示Go中的空接口类型，它可以持有任何类型的值。这意味着你可以在同一个map中存储不同类型的数据。例如，一个键可以关联到一个字符
FlatBuffers（概念、原理及优势、在TS中的使用）前端杂货铺 TodoList 100个小知识 FlatBuffers JSON 序列化反序列化
个人简介个人主页：前端杂货铺‍♂️学习方向：主攻前端方向，正逐渐往全干发展个人状态：研发工程师，现效力于中国工业软件事业人生格言：积跬步至千里，积小流成江海推荐学习：前端面试宝典100个小功能Vue2Vue3Vue2/3项目实战Node.js实战Three.js个人推广：每篇文章最下方都有加入方式，旨在交流学习&资源分享，快加入进来吧文章目录介绍在Vue中使用FlatBuffersFlatBuff
第一节：kafka golang sarama初体验锅锅来了 Golang实战案例 kafka golang 运维开发
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、sarama是什么？typeClient：主要操作元数据typeClusterAdmin:二、小试牛刀1.创建项目2.创建kafka_client.go总结前言关于Kafka的开发库，以Java的居多，Golang语言的开发库，主要推荐的是sarama项目地址：https://github.com/IBM/sarama
React系统学习之路莲华君 react.js 学习前端
React系统学习之路学习目录第1章：React入门介绍React的基本概念和应用场景安装Node.js和npm创建第一个React应用React的JSX语法组件的基本结构和生命周期第2章：组件与状态管理函数组件与类组件的区别状态（State）和属性（Props）的使用受控组件与非受控组件高阶组件（HOC）的概念和实现使用ContextAPI进行跨层级状态传递第3章：ReactHooksuseSt
Windows 比较Excel文件助手阿富软件园电脑开源软件 windows
在日常工作中，Excel是处理数据的常用工具，软件下载地址安装包但面对两份相似的工作表，如何快速准确地找出它们之间的差异，常常让许多Excel新手感到头疼。不过，现在有一款专为Excel小白设计的辅助工具，能够轻松解决这一难题，堪称Excel小白的福音。这款工具的使用方法非常简单，用户只需直接导入两份需要对比的工作表，软件便会自动启动其强大的数据对比功能。它能够主动且精准地定位出两份工作表中不同数
C2远控篇&Golang&Rust&冷门语言&Loader加载器&对抗优势&减少熵值特征
#C2远控-ShellCode-认知&环境1.创建工程时关闭SDL检查2.属性->C/C++->代码生成->运行库->多线程(/MT)如果是debug则设置成MTD3.属性->C/C++->代码生成->禁用安全检查GS4.关闭生成清单属性->链接器->清单文件->生成清单选择否#C2远控-ShellCode-分析&提取ShellCode的本质其实就是一段可以自主运行的代码。它没有任何文件结构，它不
互换性与标准化念致达互换性与技术测量机电专业必修课程
互换性与标准化一、互换性定义分类作用主要内容二、标准化一、互换性定义机械产品中的同一规格的一批零件或部件，任取其中一件，不需作任何挑选、调整或辅助加工就能进行装配，并能保证满足机械产品的使用性能要求的一种特性。分类分类几何参数互换零部件的尺寸、形状、位置、表面质量等几何参数具有互换性功能互换零部件的物理性能、化学性能和力学性能具有互换性按互换性程度分：完全互换性（绝对互换性）零件在装配或更换时，不
MQ135在STM32中的使用 Ricardo.lucky STM32中的模块使用 stm32 嵌入式硬件单片机
一、简介MQ135气体传感器所使用的气敏材料是在清洁空气中电导率较低的二氧化锡(SnO2)。当传感器所处环境中存在污染气体时，传感器的电导率随空气中污染气体浓度的增加而增大。使用简单的电路即可将电导率的变化转换为与该气体浓度相对应的输出信号。MQ135传感器对氨气、硫化物、苯系蒸汽的灵敏度高，对烟雾和其它有害的监测也很理想。这种传感器可检测多种有害气体，是一款适合多种应用的低成本传感器。特点：在较
RecycleView实现 viewFlipper 广告条垂直滚动效果（仿叮咚买菜）鸿蒙小林安卓开发 java 技术支持安卓 java android android-studio
demo码云代码仓库实现效果viewFlipper的使用这里就不介绍了，想通过viewFlipper实现广告条滚动效果的可以去看git上的这个案例因为不是什么太难的功能就不对细节做太多的讲解了，代码里有我写好的注释，直接上代码view/***@authorwhl*Createdon:3/1/223:07PM*description*/publicclassUpRollRecyclerFragmen
使用Picgo+Cloudflare R2构建图床 Chrislime 云计算网络网络安全缓存
R2是Cloudflare推出的非结构性Objectstorage（对象存储）服务。本文将介绍我推荐R2的原因以及与Picgo联动的使用方式。为什么选择R2正如我在博客中多次提到，Cloudflare是一家服务范围遍及全球的网络资源供应商。因此对象存储自然也会成为其主打服务之一选择R2的理由有以下：10GB免费空间无流量费免费CDN节点及DDos防护服务国际化兼容S3无政治原因的审查得益于Clou
半导体器件仿真：光电器件仿真_（6）.光电二极管仿真 kkchenkx 信号仿真2 信号处理信息可视化
光电二极管仿真1.引言光电二极管是一种能够将光能转换为电能的半导体器件。在光通信、图像传感器、光检测器和太阳能电池等领域有广泛的应用。光电二极管的仿真可以帮助设计者了解器件的工作原理、性能参数以及优化设计。本节将详细介绍光电二极管的仿真原理和步骤，包括器件结构、物理模型、仿真软件的使用方法以及具体的仿真案例。2.光电二极管的基本结构和工作原理2.1器件结构光电二极管通常由一个PN结或PIN结组成。
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他