淮阴侯

记一次Go爬取小说

记一次Go定向爬虫

原始需求
分析
实战

Workers

BookerWorker
DirectoryWorker
ChapterWorker
PageWorker

main.go
执行结果

原始需求

原始需求：https://m.999xs.com/files/article/html/69/69208/index.html
在线看不方便，而且浏览器还有强制广告
ps: 在实战过程中，对m.999xs.com造成了非正常的访问，由此带来的服务端压力和问题在此说声Sorry。

分析

打开链接，我们发现一本被分成了很多章节，在菜单目录中20章节为一页。
每一章节又被分为多个子页。
分级关系描述如下：
page1,page2…->Chapter
Chapter1，Chapter2…(<=20)->Directory
Directory1,Directory2…->Book

实战

非常自然的，我们自顶向下的设计思路有出来了。

Workers

定义一个workers目录，按照分析过程中的层级关系，添加如下4个worker

BookerWorker

package workers

import (
	"io/ioutil"
	"log"
	"net/http"
	"os"
	"regexp"
	"strings"
)

/*
	Booker
	职责：
		1. 获取Title，书名即最终的文本文件名
		2. 初始化 DirectoryWorker
		3. 接收最终 DirectoryWorker 和 PageWorker 解析出来的内容，并生成文本文件
*/

/*
	BookWorker.Contents的描述
	[]byte					========>Chapter				========>每章中的内容，每个章节包含多页，在章节中合并，章节=章节名+页1+页2+...
	[][]byte				========>Directory				========>每个菜单目录，[章节1，章节2...]
	[][][]byte				========>Book					========>整本书，[目录1，目录2...]
*/

type BookWorker struct {
	DefaultUrl      string               //初始url，https://m.999xs.com/files/article/html/69/69208/index.html
	Contents        [][][]byte           //index页面获取到的html流,
	FileName        string               //书名
	PageContentChan chan PageContentItem //接收处理的Page结果
	Host            string
}

type PageContentItem struct {
	Content    []byte
	PageNum    int
	SubPageNum int
}

func (b *BookWorker) Run() error {
	defer log.Println("booker worker down")
	//initial Receiver
	downchan := make(chan int)
	go b.ReceiveContents(downchan)

	resp, err := http.DefaultClient.Get(b.Host + b.DefaultUrl)
	if err != nil {
		return err
	}
	buf, err := ioutil.ReadAll(resp.Body)
	if err != nil {
		return err
	}

	b.getTitle(buf)

	err = b.StartDirectoryWorker(buf, b.DefaultUrl)
	if err != nil {
		return err
	}
	close(b.PageContentChan)
	<-downchan

	return nil
}

func (b *BookWorker) getTitle(contents []byte) {
	//处理BookTitle
	titlepat := `id="bqgmb_h1">[\s\S]*`
	reg := regexp.MustCompile(titlepat)
	bytes := reg.Find(contents)
	b.FileName = strings.ReplaceAll(string(bytes), `id="bqgmb_h1">`, "")
	b.FileName = strings.ReplaceAll(b.FileName, ``, "")
	b.FileName = b.FileName + ".txt"
	log.Println("get book title:", b.FileName)
}

func (b *BookWorker) StartDirectoryWorker(currentContents []byte, url string) error {
	log.Println("start directory workers")
	defer log.Println("directory workers all done")
	directorynum := 0
	for {
		if currentContents == nil {
			break
		}
		d := DirectoryWorker{
			IndexUrl:     url,
			Contents:     currentContents,
			Host:         b.Host,
			DirectoryNum: directorynum,
		}
		d.Run(b.PageContentChan)

		nexturl, err := d.GetNextDirectoryUrl()
		if err != nil {
			return err
		}
		if nexturl == "#" || nexturl == "" {
			break
		}
		nexturl = strings.ReplaceAll(b.DefaultUrl, "index.html", nexturl)
		resp, err := http.DefaultClient.Get(b.Host + nexturl)
		if err != nil {
			return err
		}
		buf, err := ioutil.ReadAll(resp.Body)
		if err != nil {
			return err
		}
		url = nexturl
		currentContents = buf

		directorynum += 1
	}
	return nil
}

func (b *BookWorker) ReceiveContents(downchan chan int) {
	log.Println("start ReceiveContents")
	defer log.Println("ReceiveContents done")
	for item := range b.PageContentChan {
		if b.Contents[item.PageNum] != nil && b.Contents[item.PageNum][item.SubPageNum] != nil {
			log.Fatal(item.PageNum, item.SubPageNum, string(item.Content))
		}

		pagecont := b.Contents[item.PageNum]
		if pagecont == nil {
			pagecont = make([][]byte, 100)
		}

		pagecont[item.SubPageNum] = item.Content

		b.Contents[item.PageNum] = pagecont
	}

	b.Flush()
	downchan <- 1
}

func (b *BookWorker) Flush() {
	_ = os.Remove(b.FileName)
	file, err := os.Create(b.FileName)
	defer func() {
		file.Close()
	}()
	if err != nil {
		panic(err.Error())
	}
	for _, c := range b.Contents {
		for _, sc := range c {
			n, err := file.Write(sc)
			if err != nil {
				log.Fatal(err, n)
			}
		}
	}
}

DirectoryWorker

package workers

import (
	"log"
	"regexp"
	"strings"
	"time"
)

/*
	Directory 分页目录
	职责：
		1. 获取分页明细
		2. 初始化 ChapterWorker
*/
type DirectoryWorker struct {
	IndexUrl     string
	Contents     []byte
	Host         string
	DirectoryNum int
}

func getPageUrls(contents []byte) []string {
	//解析pages
	pagespat := `正文
[\S\s]*`
	reg := regexp.MustCompile(pagespat)
	bytes := reg.Find(contents)
	lipat := `href=\"[\w\"=\./]*\"`
	reg = regexp.MustCompile(lipat)
	lis := reg.FindAll(bytes, 100)
	pages := make([]string, len(lis))
	for index, li := range lis {
		pageurl := strings.Trim(string(li), `href="`)
		pageurl = strings.Trim(pageurl, `"`)
		pages[index] = pageurl
	}
	return pages
}
func (d *DirectoryWorker) Run(bookcontentchan chan PageContentItem) {
	log.Println("directory worker run", d.IndexUrl)
	defer log.Println("directory worker down", d.IndexUrl)

	pages := getPageUrls(d.Contents)
	subdownchan := make(chan int)
	subrutinenum := 0
	for index, p := range pages {
		//一个p表示一个章节，预计开20个p
		subrutinenum += 1
		go func(pu string) {
			chapter := ChapterWorker{
				Host:            d.Host,
				PageNum:         d.DirectoryNum,
				SubPageNum:      index,
				DownChan:        subdownchan,
				BookContentChan: bookcontentchan,
				IndexUrl:        pu,
			}
			chapter.Run() //go runtine开始执行，执行结束会自动关闭
		}(p)
		time.Sleep(time.Millisecond * 10)
	}
	//wait for chapter worker done
	for i := 0; i < subrutinenum; i++ {
		<-subdownchan
	}

}

func (d *DirectoryWorker) GetNextDirectoryUrl() (string, error) {
	pat := `[\s\S]*`
	reg := regexp.MustCompile(pat)
	bytes := reg.Find(d.Contents)
	reg = regexp.MustCompile(`[\s\S]*`)
	bytes = reg.Find(bytes)
	reg = regexp.MustCompile(`href="[#\w=\d_\.]*"`)
	bytes = reg.Find(bytes)
	lll := strings.Trim(string(bytes), `href="`)
	lll = strings.Trim(lll, `"`)
	return lll, nil
}

ChapterWorker

package workers

import (
	"io/ioutil"
	"log"
	"net/http"
	"strings"
	"time"
)

/*
	Chapter 章节
	职责：
		1. 解析Html页面内容，章节Title
		2. 解析NextPager Url
		3. 获取Page的文本内容,并合并成Chapter文本（包含Title），发送给BookWorker
*/

type ChapterWorker struct {
	Host            string
	PageNum         int
	SubPageNum      int
	IndexUrl        string
	DownChan        chan int
	BookContentChan chan PageContentItem
}

func (c *ChapterWorker) Run() {
	defer func() {
		c.DownChan <- 1 //当前goroutine结束
	}()
	log.Println("start chapter worker ", c.IndexUrl)
	defer log.Println("chapter worker done ", c.IndexUrl)

	url := c.IndexUrl
	chapcontent := make([]byte, 0)

	for {
		if !strings.Contains(url, "_") && url != c.IndexUrl {
			break
		}
		if c.IndexUrl == "" {
			panic("Invalid Index Url")
		}
		//获取Chapter Title
		resp, err := http.DefaultClient.Get(c.Host + url)
		if err != nil {
			panic(err.Error())
		}

		buf, err := ioutil.ReadAll(resp.Body)
		if err != nil {
			panic(err)
		}
		page := PageWorker{
			Contents: buf,
		}
		con, err := page.GetPageContent()
		if err != nil {
			panic(err)
		}

		if url == c.IndexUrl {
			title, err := page.GetPageTitle()
			if err != nil {
				panic(err)
			}
			con = append([]byte("\r\n\r\n【"+string(title)+"】\r\n\r\n"), con...)
		}
		chapcontent = append(chapcontent, con...)

		next, err := page.GetNextPageUrl()
		if err != nil {
			panic(err.Error())
		}
		url = next

		time.Sleep(time.Millisecond * 10)
	}
	c.BookContentChan <- PageContentItem{
		Content:    chapcontent,
		PageNum:    c.PageNum,
		SubPageNum: c.SubPageNum,
	}
}

PageWorker

package workers

import (
	"regexp"
	"strings"
)

/*
	Page 分页目录
	职责：
		1. 解析Html页面内容，获取文本
*/

type PageWorker struct {
	Contents []byte
}

func (p *PageWorker) GetPageContent() ([]byte, error) {
	pat := `[\S\s]*`
	reg := regexp.MustCompile(pat)
	bytes := reg.Find(p.Contents)
	htmlpat := `<[/]?[\s\w\"=]*>`
	htmlreg := regexp.MustCompile(htmlpat)
	sbytes := htmlreg.ReplaceAll(bytes, []byte("\n"))
	all := strings.ReplaceAll(string(sbytes), "　", "")
	all = strings.ReplaceAll(all, `手机\端 一秒記住『m.999xs.com』為您提\供精彩小說\閱讀`, "")
	all = strings.ReplaceAll(all, "sthuojia", "")
	all = strings.ReplaceAll(all, "travefj", "")
	all = strings.TrimSpace(all)
	return []byte(all), nil
}

func (p *PageWorker) GetPageTitle() ([]byte, error) {
	pat := `nr_title">[\S\s]*`)

	t := make([]rune, 0)
	for _, r := range []rune(title) {
		if r == rune('<') {
			break
		}
		t = append(t, r)
	}
	return []byte(string(t)), nil
}

func (p *PageWorker) GetNextPageUrl() (string, error) {
	pat := `[\S\s]*`
	reg := regexp.MustCompile(pat)
	bytes := reg.Find(p.Contents)
	pat = `下一章`
	reg = regexp.MustCompile(pat)
	bytes = reg.Find(bytes)
	pat = `href="[\S\s]*"`
	reg = regexp.MustCompile(pat)
	bytes = reg.Find(bytes)
	result := strings.ReplaceAll(string(bytes), "href=\"", "")
	result = strings.ReplaceAll(result, "\"", "")
	return result, nil
}

main.go

package main

import (
	"txtrobot/workers"
)

func main() {
	book := workers.BookWorker{
		DefaultUrl:      "/files/article/html/69/69208/index.html", //必须是小说的首页
		PageContentChan: make(chan workers.PageContentItem, 1000),  //带buffer的chan，有利于前台抓钱线程执行
		Host:            `https://m.999xs.com`,
		Contents:        make([][][]byte, 1000),
	}

	err := book.Run()
	if err != nil {
		panic(err)
	}
}

执行结果

2019/10/19 17:08:23 start ReceiveContents
2019/10/19 17:08:23 get book title: 秦苒程隽.txt
2019/10/19 17:08:23 start directory workers
2019/10/19 17:08:23 directory worker run /files/article/html/69/69208/index.html
....
2019/10/19 17:09:07 chapter worker done  /files/article/html/69/69208/48867262.html
2019/10/19 17:09:07 directory worker down /files/article/html/69/69208/index_27.html
2019/10/19 17:09:07 directory workers all done
2019/10/19 17:09:07 ReceiveContents done
2019/10/19 17:09:07 booker worker down

Process finished with exit code 0

你可能感兴趣的:(Go)

第四天旅游线路预览——从换乘中心到喀纳斯湖陟彼高冈yu 基于Google earth studio 的旅游规划和预览旅游
第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
怎么做才能真正限制塑料袋的使用？ BalNews
Environmentalpollutionisalwaysamajorlivelihoodissue.Morethanadecadeago,ourgovernmenthadintroducedapolicyaboutrestrictionsontheuseofplasticbags,wecallitrestrictionsontheuseofplasticbags.Butmorethan10ye
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
思考成长丁昆朋
这篇文章是加紧赶出来“应付”日更，一方面不想要再晚睡了；另一方面不想失去日更达人的称号，只能坐下来匆忙写下一点文字。既然标题是成长，先来总结一下这段时间的收获：1、整理箱子站着可以看电脑，坐着反而是一种享受，减少了坐着腰酸背痛的现象；2、使用讯飞输入法大大增加自己的输出量；3、Anaconda+“pythontutor.com"+Google算是简单入门python；4、英语的阅读文章能力、听力提
效率神器来了：AI工具手把手教你快速提升工作效能 kkai人工智能人工智能学习媒体 ai chatgpt
随着科技的进步，AI工具已经成为提升工作效率的关键手段。本文将介绍一些实用的AI工具和方法，帮助你自动化繁琐的重复性任务、优化数据管理、促进团队协作与沟通，并提升决策质量。背景：OOPAI-免费问答学习交流-GPT自动化重复性任务Zapier：Zapier可以自动化多个应用程序之间的工作流程。例如，它能自动将Gmail中的附件保存至GoogleDrive，或在你发布新文章时，自动分享至社交媒体平台
Ubuntu18.04 Docker部署Kinship(Django)项目过程 Dante617
1Docker的安装https://blog.csdn.net/weixin_41735055/article/details/1003551792下载镜像dockerpullprogramize/python3.6.8-dlib下载的镜像里包含python3.6.8和dlib19.17.03启动镜像dockerrun-it--namekinship-p7777:80-p3307:3306-p55
Golang语言基础知识点总结最帅猪猪侠 golang 开发语言后端
Golang语言基础知识点小总结1.go语言有两大类型：值类型：数值类型，bool，string，数组，struct结构体变量直接存储值，内存通常在栈中分配,修改值,不会对源对象产生影响引用类型：指针，slice切片，管道chan，map，interface变量存储的是一个地址，这个地址对应的空间才真正存储数据值，内存通常在堆上分配，当没有任何变量引用这个地址时，该地址对应的数据空间就成为一个垃圾
Go语言基础总结 Alice_小哪吒 Go学习笔记 golang 开发语言后端
一、Go语言结构包声明引入包函数变量语句&表达式注释下面简单给出hello.go文件。packagesrc/*定义包名*/import"fmt"/*引入包*/funchello(){/*函数*/fmt.Println("Hello,World!")/*语句&表达式*/fmt.Println("菜鸟教程：runoob.com")}二、Go语言基础语法Go程序可以由多个标记构成。可以是关键字、标识符、
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
【Golang】实现 Excel 文件下载功能 RumIV Golang golang excel 开发语言
在当今的网络应用开发中，提供数据导出功能是一项常见的需求。Excel作为一种广泛使用的电子表格格式，通常是数据导出的首选格式之一。在本教程中，我们将学习如何使用Go语言和GinWeb框架来创建一个Excel文件，并允许用户通过HTTP请求下载该文件。准备工作在开始之前，请确保您的开发环境中已经安装了Go语言和相关的开发工具。此外，您还需要安装GinWeb框架和excelize包，这两个包都将用于我
Dockerfile命令详解之 FROM 清风怎不知意容器化 java 前端 javascript
许多同学不知道Dockerfile应该如何写，不清楚Dockerfile中的指令分别有什么意义，能达到什么样的目的，接下来我将在容器化专栏中详细的为大家解释每一个指令的含义以及用法。专栏订阅传送门https://blog.csdn.net/qq_38220908/category_11989778.html指令不区分大小写。但是，按照惯例，它们应该是大写的，以便更容易地将它们与参数区分开来。(引用
8 冰鈊夢
transition动画transform.box{width:200px;height:200px;background-color:gold;margin:50pxauto0;transition:all1sease;}.box:hover{transform:translate(50px,50px);}.box2{width:200px;height:200px;background-col
golang 实现文件上传下载 wangwei830 go
Gin框架上传下载上传（支持批量上传）httpRouter.POST("/upload",func(ctx*gin.Context){forms,err:=ctx.MultipartForm()iferr!=nil{fmt.Println("error",err)}files:=forms.File["fileName"]for_,v:=rangefiles{iferr:=ctx.SaveUplo
使用selenium调用firefox提示Profile Missing的问题解决歪歪的酒壶 selenium 测试工具 python
在Ubuntu22.04环境中，使用python3运行selenium提示ProfileMissing，具体信息为：YourFirefoxprofilecannotbeloaded.Itmaybemissingorinaccessible在这个问题的环境中firefox浏览器工作正常。排查中，手动在命令行执行firefox可以打开浏览器，但是出现如下提示Gtk-Message:15:32:09.9
go基础知识归纳总结悟空丶123 golang 开发语言后端
无缓冲的channel和有缓冲的channel的区别？在Go语言中，channel是用来在goroutines之间传递数据的主要机制。它们有两种类型：无缓冲的channel和有缓冲的channel。无缓冲的channel行为：无缓冲的channel是一种同步的通信方式，发送和接收必须同时发生。如果一个goroutine试图通过无缓冲channel发送数据，它会阻塞，直到另一个goroutine从该
golang实现从服务器下载文件到本地指定目录余生逆风飞翔 golang 服务器开发语言
一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他