胖达团长

Go语言并发爬虫，爬取空姐网所有相册图片

转载地址：Go语言中文网

说到爬虫，不得不提到我自己写的《Python网络爬虫requests、bs4爬取空姐网图片》，可以在我的csdn看到这篇文章。这个爬虫很简洁，使用requests库发送http请求，使用bs4来解析html元素，获取所有图片地址。但是这个爬虫是单线程爬虫，速度太慢，一分钟只能爬下来300多张图片。所以，编写了Go语言的爬虫，亲测一分钟能爬下来800多张图片，速度提升了好几倍。先看一下效果图：

一、提取相册链接和下一页链接

1.1 提取相册链接

首先，我们查看一下空姐网的网页结构，找到每个人的相册页面。在kongjie.com里面随意翻翻，就能找到热门相册页面，如图：

分析一下该页面结构，提取出每个人的相册页链接。

可以看到，ul下面包含了很多个li元素，每个li元素就是每个人的相册，li元素图片上的链接就是每个人的相册链接。所以我们写出提取ul元素的正则表达式为：

// 用户相册块的正则表达式，用于从相册列表页提取出用户相册块，用户相册块中包含很多个用户的相册链接var peopleUlPattern = regexp.MustCompile(`(?s:.*?)(?s:(.*?))`)

然后从ul元素中提取所有相册链接，正则表达式为：

// 用户相册的正则表达式，用于从用户相册块提取出用户相册链接，然后就可以进入相册爬取图片了var peopleItemPattern = regexp.MustCompile(`(?s:.*?)(?s:.*?)`)

有必要说一下，正常情况下，点号"."能匹配除了换行符外的任意字符，但是在html匹配中有很多换行符，我们想让点号能匹配到换行符，我们需要使用"(?s:.)"的形式，(?s:.*?)就表示这后面的点号可以匹配换行符了。其中的.*后面接问号?就表示这是正则表达式的勉强型匹配模式。想要详细了解勉强型匹配模式的可以看这篇文章《Go语言进阶之路（八）：正则表达式》。

1.2 提取下一页链接

处理完一页之后需要翻到下一页，所以我们需要提取“下一页”的链接。我们看一下“下一页”所在的元素位置：

“下一页”这个链接在

元素里面的

的元素里的最后一个链接，而且“下一页”这个链接的class="nxt"。所以我们编写出正则表达式为：

// 下一个相册列表页链接的正则表达式，用于从相册列表页提取出下一页链接，翻页爬取var nextAlbumPageUrlPattern = regexp.MustCompile(`(?s:.*?)(?s:.*?)下一页`)

二、进入相册提取图片链接和下一张页面的链接

2.1 提取图片链接

相册能提取了之后，我们进入相册，提取图片链接和下一张图片页面的链接。先来看一下图片浏览页的结构。

可以看到，图片在

// 图片链接的正则表达式，用于从图片浏览页面的html内容中提取出图片链接，然后保存图片var imageUrlPattern = regexp.MustCompile(`(?s:.*?)

 
  同时，我们看到图片浏览页的链接地址中包含了uid和picid，那么，我们就可以在保存图片到本地时，使用uid+picid的方式保存文件名，这样爬取下来的图片就不会重名了。因此，我们提取uid和picid的正则表达式为： 
    
  // 用户id和图片id的正则表达式，用于从url中提取用户id和图片id，保存图片时这些id会拼接成图片名var uidPicIdPattern = regexp.MustCompile(`.*?uid=(\d+).*?picid=(\d+).*?`) 
    
  2.2 提取下一张图片浏览页的链接 
  我们在图片浏览页面提取了图片的url，那么浏览图片的时候翻到下一张，我们需要提取“下一张”的链接。看一下“下一张”的网页结构： 
   
  下一张这个链接在
元素下的最后一个超链接，超链接的几个属性为class="btn" title="下一张"，这样就很好提取了，我们写出提取的正则表达式为： 
   
  // 下一张图片所在的图片浏览页面的链接正则表达式，用于从图片浏览页面提取出下一页链接，翻页爬取var nextImagePageUrlPattern = regexp.MustCompile(`(?s:.*?)
 
  我们现在可以提取相册链接和图片链接了，所有正则表达式提取完毕，接下来就是开始爬取网页了。 
    
  三、爬取所有相册链接和翻页 
  先爬取所有相册并翻页。首先就是发起http请求，拿到相册列表页的html内容，提取所有相册链接。先来看一下http请求。 
    
  3.1 发起http请求并解析response 
  我们使用Go语言原生的http库来发起http请求。为了让我们的http请求更像是浏览器发出的，我们为Request添加header属性，设置一下UserAgent和Referer。该部分源代码如下： 
    
  定义header： 
  var headers = map[string][]string{
      "Accept":                    []string{"text/html,application/xhtml+xml,application/xml", "q=0.9,image/webp,*/*;q=0.8"},  "Accept-Encoding":           []string{"gzip, deflate, sdch"},  "Accept-Language":           []string{"zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4"},  "Accept-Charset":            []string{"utf-8"},  "Connection":                []string{"keep-alive"},  "DNT":                       []string{"1"},  "Host":                      []string{"www.kongjie.com"},  "Referer":                   []string{"http://www.kongjie.com/home.php?mod=space&do=album&view=all&order=hot&page=1"},  "Upgrade-Insecure-Requests": []string{"1"},  "User-Agent":                []string{"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"},} 
    
  设置header和发起http请求，我们封装成了getResponseWithGlobalHeaders函数： 
  func getReponseWithGlobalHeaders(url string) *http.Response {
      req, _ := http.NewRequest("GET", url, nil)  if headers != nil && len(headers) != 0 {
        for k, v := range headers {
          for _, val := range v {
            req.Header.Add(k, val)      }    }  }
  res, err := http.DefaultClient.Do(req)  if err != nil {
        panic(err)  }  return res
} 
  拿到response之后，我们需要对response进行解压缩，并做编码转换。网页返回是gzip压缩内容，Go语言http库拿到的response是没有帮我们做任何解析和转换的，因此，我们需要使用gzip库解压缩。网页返回的编码是gbk，我们需要转换成UTF-8编码，否则会出现乱码，匹配不到我们想要的内容。 
  这里，我们使用golang.org/x/net/html/charset和golang.org/x/text/transform进行编码转换。这两个包需要下载，可以使用 
   
  go get -t golang.org/x/net/html/charsetgo get -t golang.org/x/text/transform 
  下载这两个包。我们解压缩和转码的源代码如下，封装成getHtmlFromUrl函数： 
   
  func getHtmlFromUrl(url string) []byte {
      response := getReponseWithGlobalHeaders(url)
  reader := response.Body  // 返回的内容被压缩成gzip格式了，需要解压一下  if response.Header.Get("Content-Encoding") == "gzip" {
        reader, _ = gzip.NewReader(response.Body)  }  // 此时htmlContent还是gbk编码，需要转换成utf8编码  htmlContent, _ := ioutil.ReadAll(reader)
  oldReader := bufio.NewReader(bytes.NewReader(htmlContent))  peekBytes, _ := oldReader.Peek(1024)  e, _, _ := charset.DetermineEncoding(peekBytes, "")  utf8reader := transform.NewReader(oldReader, e.NewDecoder())  // 此时htmlContent就已经是utf8编码了  htmlContent, _ = ioutil.ReadAll(utf8reader)
  if err := response.Body.Close(); err != nil {
        fmt.Println("error happened when closing response body!", err)  }  return htmlContent}
 
    
  3.2 提取相册链接和翻页 
  拿到正常的http response之后，我们就开始提取相册链接和翻页处理了。 
  我们使用FindSubmatch匹配相册链接，提取里面匹配组所匹配到的内容。从《Go语言进阶之路（八）：正则表达式》文章中我们知道，FindSubmatch会提取正则表达式匹配到的第一个内容和匹配组的内容。 
    
  上文我们提到，peopleUlPattern是为了提取相册列表所在的ul元素的内容，这个ul元素里面包含了很多个相册链接。因此我们先提取ul元素： 
   
  // FindSubmatch查找正则表达式的匹配和所有的子匹配组，这里是查找当前页每个人的相册链接peopleListElement := peopleUlPattern.FindSubmatch(albumHtmlContent) 
  这里可以看到，如果当前页ul元素里面没有内容，那么我们就要翻到下一页继续提取。如果都没有“下一页”的链接，那么说明爬虫全部爬完了，可以结束了。 
  if len(peopleListElement) <= 0 {
      // 当前页没有相册  fmt.Println("no peopleListElement!, url=", nextUrl)  // 当前页所有用户相册链接解析完毕，翻到下一页  nextAlbumUrl := nextAlbumPageUrlPattern.FindSubmatch(albumHtmlContent)  if len(nextAlbumUrl) <= 0 {
        fmt.Println("all albums crawled!")    break  }  nextUrl = string(nextAlbumUrl[1])  continue} 
    
  提取了ul元素之后，我们就可以提取ul里面所有li元素中的相册链接了。从《Go语言进阶之路（八）：正则表达式》文章中我们知道，FindAllSubmatch会提取正则表达式匹配到的所有内容和所有匹配组的内容。这样我们就能够拿到ul里面所有的相册链接了。拿到相册链接后，我们把链接发送到imagePageUrlChan通道中，用于后文中使用goroutine并发爬取。 
  // 子匹配组是第二个元素。里面包含了很多用户的相册连接peopleUlContent := peopleListElement[1]peopleItems := peopleItemPattern.FindAllSubmatch(peopleUlContent, -1)if len(peopleItems) > 0 {
      for _, peopleItem := range peopleItems {
        if len(peopleItem) <= 0 {
          continue    }    // 找到了一个用户的相册链接，放入imagePageUrlChan中等待爬取    peopleAlbumUrl := strings.ReplaceAll(string(peopleItem[1]), `&`, "&")    imagePageUrlChan <- peopleAlbumUrl  }
} 
  当前页ul解析完毕之后，我们就翻页爬取下一页所有的相册链接。 
  // 当前页所有用户相册链接解析完毕，翻到下一页nextAlbumUrl := nextAlbumPageUrlPattern.FindSubmatch(albumHtmlContent)if len(nextAlbumUrl) <= 0 {
      fmt.Println("all albums crawled!")  break}nextUrl = strings.ReplaceAll(string(nextAlbumUrl[1]), `&`, "&")
fmt.Println(nextUrl) 
  这样，我们解析相册的源码就大功告成了： 
  // 解析出相册url，然后进入相册爬取图片func parseAlbumUrl(nextUrl string) {
      for {
        albumHtmlContent := getHtmlFromUrl(nextUrl)
    // FindSubmatch查找正则表达式的匹配和所有的子匹配组，这里是查找当前页每个人的相册链接    peopleListElement := peopleUlPattern.FindSubmatch(albumHtmlContent)    if len(peopleListElement) <= 0 {
          // 当前页没有相册      fmt.Println("no peopleListElement!, url=", nextUrl)      // 当前页所有用户相册链接解析完毕，翻到下一页      nextAlbumUrl := nextAlbumPageUrlPattern.FindSubmatch(albumHtmlContent)      if len(nextAlbumUrl) <= 0 {
            fmt.Println("all albums crawled!")        break      }      nextUrl = string(nextAlbumUrl[1])      continue    }
    // 子匹配组是第二个元素。里面包含了很多用户的相册连接    peopleUlContent := peopleListElement[1]    peopleItems := peopleItemPattern.FindAllSubmatch(peopleUlContent, -1)    if len(peopleItems) > 0 {
          for _, peopleItem := range peopleItems {
            if len(peopleItem) <= 0 {
              continue        }        // 找到了一个用户的相册链接，放入imagePageUrlChan中等待爬取        peopleAlbumUrl := strings.ReplaceAll(string(peopleItem[1]), `&`, "&")        imagePageUrlChan <- peopleAlbumUrl      }    }    // 当前页所有用户相册链接解析完毕，翻到下一页    nextAlbumUrl := nextAlbumPageUrlPattern.FindSubmatch(albumHtmlContent)    if len(nextAlbumUrl) <= 0 {
          fmt.Println("all albums crawled!")      break    }    nextUrl = strings.ReplaceAll(string(nextAlbumUrl[1]), `&`, "&")    fmt.Println(nextUrl)  }  close(imagePageUrlChan)} 
    
  四、进入爬取所有图片和翻页，保存图片 
  4.1 从图片浏览页链接解析出uid和picid 
  上文提到过，我们要保存图片到本地，同时保证图片名不重复，我们可以从图片浏览页链接中解析uid和picid作为文件名。我们在上文3.2中拿到imagePageUrlChan中的图片浏览页链接，从这个链接中解析即可。 
   
  // 从当前图片页面url中获取当前图片所属的用户id和图片iduidPicIdMatch := uidPicIdPattern.FindStringSubmatch(imagePageUrl)if len(uidPicIdMatch) <= 0 {
      fmt.Println("can not find any uidPicId! imagePageUrl=", imagePageUrl)  continue}uid := uidPicIdMatch[1]   // 用户idpicId := uidPicIdMatch[2] // 图片id
 
    
  4.2 进入相册爬取图片和翻到下一张 
  进入相册到达图片浏览页，可以提取出图片链接。我们先获取图片浏览页的html内容，从html里使用FindSubmatch提取图片src属性。 
  imagePageHtmlContent := getHtmlFromUrl(imagePageUrl)
// redis中不存在，说明这张图片没被爬取过exists := hexists("kongjie", uid+":"+picId)if !exists {
      // 获取图片src，即图片具体链接  imageSrcList := imageUrlPattern.FindSubmatch(imagePageHtmlContent)  if len(imageSrcList) > 0 {
        imageSrc := string(imageSrcList[1])    imageSrc = strings.ReplaceAll(string(imageSrc), `&`, "&")    saveImage(imageSrc, uid, picId)    hset("kongjie", uid+":"+picId, "1")  }}// 解析下一张图片页面的url，继续爬取nextImagePageUrlSubmatch := nextImagePageUrlPattern.FindSubmatch(imagePageHtmlContent)if len(nextImagePageUrlSubmatch) <= 0 {
      continue}nextImagePageUrl := string(nextImagePageUrlSubmatch[1])imagePageUrlChan <- nextImagePageUrl 
  可以看到，我们这里使用redis去重。如果redis中不存在这张图片的属性，则图片没有被爬取过，接下来就会调用saveImage函数来保存图片。如果redis中存在这个属性，那么这张图片就被爬取过，直接翻到下一页。 
  hexists源码如下： 
  // redis链接信息var redisOption = redis.DialPassword("flyvar")                      // redis密码var redisConn, _ = redis.Dial("tcp", "127.0.0.1:6379", redisOption) // 连接本地redis
// 串行访问redis，否则goroutine并发访问redis时会报错var redisLock sync.Mutex
func hexists(key, field string) bool {
      redisLock.Lock()  defer redisLock.Unlock()  exists, err := redisConn.Do("HEXISTS", key, field)  if err != nil {
        fmt.Println("redis hexists error!", err)  }  if exists == nil {
        return false  }  return exists.(int64) == 1} 
  这里我们使用了开源库redigo来访问redis。redigo可以使用 
    
  go get github.com/gomodule/redigo/redis 
  来下载。使用案例见https://github.com/pete911/examples-redigo。 
    
  4.3 保存图片 
  拿到图片src之后，就可以保存图片了。我们saveImage函数源码如下： 
  // 保存图片到全局变量saveFolder文件夹下，图片名字为“uid_picId.ext”。// 其中，uid是用户id，picId是空姐网图片id，ext是图片的扩展名。func saveImage(imageUrl string, uid string, picId string) {
      res := getReponseWithGlobalHeaders(imageUrl)  defer func() {
        if err := res.Body.Close(); err != nil {
          fmt.Println(err)    }  }()  // 获取图片扩展名  fileNameExt := path.Ext(imageUrl)  // 图片保存的全路径  savePath := path.Join(SaveFolder, uid+"_"+picId+fileNameExt)  imageWriter, _ := os.OpenFile(savePath, os.O_RDWR|os.O_CREATE|os.O_TRUNC, 0666)  length, _ := io.Copy(imageWriter, res.Body)  fmt.Println(uid + "_" + picId + fileNameExt + " image saved! " + strconv.Itoa(int(length)) + " bytes." + imageUrl)}
 
  五、创建goroutine并发爬取 
  5.1 并发爬取 
  我们使用单线程爬取所有相册链接，然后并发爬取每个相册里面的所有图片并保存。我们使用sync.WaitGroup等待所有goroutine爬取完成，源码如下： 
  var wg sync.WaitGroup
func main() {
      // 创建保存的文件夹  _, err := os.Open(SaveFolder)  if err != nil {
        if os.IsNotExist(err) {
          _ = os.MkdirAll(SaveFolder, 0666)    }  }
  // 开启CONCURRENT_NUM个goroutine来爬取用户相册中所有图片的动作  wg.Add(ConcurrentNum)  for i := 0; i < ConcurrentNum; i++ {
        go getImagesInAlbum()  }
  // 开启单个goroutine爬取所有用户的相册链接  parseAlbumUrl(startUrl)
  // 等待爬取完成  wg.Wait()}
 
  5.2 运行并查看结果 
  运行一下查看结果，跟文章开头的结果一致： 
   
  并发爬取运行起来比Python快多了！ 
  
   
  六、遇到的问题 
  6.1 http返回乱码 
  一开始直接使用原生http返回的response拿到body内容后，打印出来一直是乱码。发现空姐网返回的内容中Content-Type内容为text/html; charset=gbk，是GBK编码，需要转换到UTF-8才能进行正常处理。 
   
  参考了网上使用mahonia库和golang.org/x/text/encoding/simplifiedchinese库进行转换，一直没有解决。后来通过网上《golang http的动态ip代理、返回乱码解决》发现，空姐网返回的html header里面Content-Encoding为gzip内容，即返回内容是压缩过的，需要使用gzip库进行解压缩才能得到html内容。然后才能进行GBK转UTF-8的操作。 
    
  解压缩和GBK转换UTF-8的源码如下： 
  response := getReponseWithGlobalHeaders(url)
reader := response.Body// 返回的内容被压缩成gzip格式了，需要解压一下if response.Header.Get("Content-Encoding") == "gzip" {
      reader, _ = gzip.NewReader(response.Body)}// 此时htmlContent还是gbk编码，需要转换成utf8编码htmlContent, _ := ioutil.ReadAll(reader)
oldReader := bufio.NewReader(bytes.NewReader(htmlContent))peekBytes, _ := oldReader.Peek(1024)e, _, _ := charset.DetermineEncoding(peekBytes, "")utf8reader := transform.NewReader(oldReader, e.NewDecoder())// 此时htmlContent就已经是utf8编码了htmlContent, _ = ioutil.ReadAll(utf8reader) 
    
  项目源码在Github上，欢迎关注！https://github.com/ychenracing/GoApps/blob/master/src/KongjieSpider/main/kongjie.go


    
        你可能感兴趣的:(golang)
        
            
                
                    笋丁网页自动回复机器人V3.0.0免授权版源码
                        希希分享
软希网58soho_cn源码资源笋丁网页自动回复机器人
                        笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
                    
                    Golang语言基础知识点总结
                        最帅猪猪侠
golang开发语言后端
                        Golang语言基础知识点小总结1.go语言有两大类型：值类型：数值类型，bool，string，数组，struct结构体变量直接存储值，内存通常在栈中分配,修改值,不会对源对象产生影响引用类型：指针，slice切片，管道chan，map，interface变量存储的是一个地址，这个地址对应的空间才真正存储数据值，内存通常在堆上分配，当没有任何变量引用这个地址时，该地址对应的数据空间就成为一个垃圾
                    
                    golang获取用户输入的几种方式
                        余生逆风飞翔
golang开发语言后端
                        一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
                    
                    【Golang】实现 Excel 文件下载功能
                        RumIV
Golanggolangexcel开发语言
                        在当今的网络应用开发中，提供数据导出功能是一项常见的需求。Excel作为一种广泛使用的电子表格格式，通常是数据导出的首选格式之一。在本教程中，我们将学习如何使用Go语言和GinWeb框架来创建一个Excel文件，并允许用户通过HTTP请求下载该文件。准备工作在开始之前，请确保您的开发环境中已经安装了Go语言和相关的开发工具。此外，您还需要安装GinWeb框架和excelize包，这两个包都将用于我
                    
                    golang 实现文件上传下载
                        wangwei830
go
                        Gin框架上传下载上传（支持批量上传）httpRouter.POST("/upload",func(ctx*gin.Context){forms,err:=ctx.MultipartForm()iferr!=nil{fmt.Println("error",err)}files:=forms.File["fileName"]for_,v:=rangefiles{iferr:=ctx.SaveUplo
                    
                    golang实现从服务器下载文件到本地指定目录
                        余生逆风飞翔
golang服务器开发语言
                        一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
                    
                    【Golang】 Golang 的 GORM 库中的 Rows 函数
                        不爱洗脚的小滕
golang开发语言后端
                        文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
                    
                    【Golang】使用 Golang 语言和 excelize 库将数据写入Excel
                        不爱洗脚的小滕
golangexcel开发语言
                        文章目录前言一、Excelize简介二、代码实现1.获取依赖2.示例代码三、总结前言在数据处理和分析中，Excel作为一种常见的电子表格格式，被广泛应用于各种场景。然而，如何在Go语言中有效地处理Excel文件呢？在这篇博客中，我将介绍如何使用Go语言和excelize库将数据写入Excel文件。一、Excelize简介Excelize是一个用于读取和写入MicrosoftExcel™(XLSX)
                    
                    Go编程语言前景怎么样？参加培训好就业吗
                        QFdongdong

                        Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
                    
                    Go 面向包的设计和架构分层
                        云满笔记
golang架构directorylayoutsrcproject
                        标题Go面向包的设计和架构分层序前项目架构分层工具包项目应用项目cmd/internal/internal/pkg/pkg/vendor/面向包的设计和验证包的位置依赖包导入应用级别的策略数据的发送和接收错误处理测试捕获错误不建议的目录结论Go面向包的设计和架构分层序本篇内容主要讲解golang项目的面向包设计准则和基础的架构分层。信息来自原文ArdanLabs:Package-Oriented-
                    
                    Golang channel 死锁
                        羊城程序猿
golanggolang
                        死锁是指两个或两个以上的协程的执行过程中，由于竞争资源或由于彼此通信而造成的一种阻塞的现象，若无外力作用，他们将无法推进下去,以下是总结出来的几种死锁情况。1.死锁1：一个通道在一个主go程里同时进行读和写2.死锁2：go程开启之前使用通道3.死锁3：通道1中调用了通道2，通道2中调用通道14.死锁4：直接读取空channel的死锁5.死锁5：超过channel缓存继续写入数据导致死锁6.向已关闭
                    
                    golang学习笔记--MPG模型
                        xxzed
golang#学习笔记学习笔记golang
                        MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
                    
                    Golang Channel
                        PandaSkr
golang
                        Channel解析1.Channel源码分析1.1Channel数据结构typehchanstruct{qcountuint//channel的元素数量dataqsizuint//channel循环队列长度bufunsafe.Pointer//指向循环队列的指针elemsizeuint16//元素大小closeduint32//channel是否关闭0-未关闭elemtype*_type//元素类
                    
                    [Golang] goroutine
                        沉着冷静2024
Golanggolang后端
                        [Golang]goroutine文章目录[Golang]goroutine并发进程和线程协程goroutine概述如何使用goroutine并发进程和线程谈到并发，大多都离不开进程和线程，什么是进程、什么是线程？进程可以这样理解：进程就是运行着的程序，它是程序在操作系统的一次执行过程，是一个程序的动态概念，进程是操作系统分配资源的基本单位。线程可以这样理解：线程是一个进程的执行实体，它是比进程粒
                    
                    golang-101-hacks(3)——包
                        _羊羽_

                        注：本文是对golang-101-hacks中文翻译,原文地址在“Go”中，包分为两种类型:(1)main包:用于生成可执行的二进制文件，main函数是程序的入口点。下面以helllo.go为例:packagemainimport"greet"funcmain(){greet.Greet()}(2)其他类型的包也可以在细分成两类:库文件包:用来生成可以被其他人重用的目标文件。如greet.go这个
                    
                    golang面试题 001
                        Jay_hj11
golang面试Golanggolang后端数据结构开发语言面试
                        001gochannelclose后读的问题golangchannel关闭后，其中剩余的数据，是可以继续读取的。请看下面的测试例子。创建一个带有缓冲的channel，向channel中发送数据，然后关闭channel，最后，从channel中读取数据，输出结果。packagemainimport"fmt"//gochannelclose后读的问题funcmain(){ch:=make(chanst
                    
                    golang文件相对路径问题
                        jzpfbpx
golang开发语言后端
                        目录结构2.具体代码：constdataFile="../data/data.json"_,fileName,_,_:=runtime.Caller(1)dataPath:=path.Join(path.Dir(fileName),dataFile)fmt.Println(dataPath)//openfilefile,err:=os.Open(dataPath)iferr!=nil{log.Fa
                    
                    golang文件相对路径问题
                        jzpfbpx
golang开发语言后端
                        1.目录结构2.具体代码：constdataFile="../data/data.json"_,fileName,_,_:=runtime.Caller(1)dataPath:=path.Join(path.Dir(fileName),dataFile)fmt.Println(dataPath)//openfilefile,err:=os.Open(dataPath)iferr!=nil{log.
                    
                    go 语言常见问题（4）
                        jzpfbpx
golang开发语言后端
                        31.go语言编程的好处是什么编译和运行都很快。在语言层级支持并行操作。有垃圾处理器。内置字符串和maps。函数是go语言的最基本编程单位。32.说说go语言的select机制select机制用来处理异步IO问题select机制最大的一条限制就是每个case语句里必须是一个IO操作golang在语言级别支持select关键字33.解释一下go语言中的静态类型声明静态类型声明是告诉编译器不需要太多的
                    
                    golang中创建协程以及协程间的相互通信
                        忍界英雄
golang开发语言
                        golang中创建协程以及协程间的相互通信。在golang中创建协程在Go语言中，使用协程来实现并发模型。协程是Go语言的并发执行单元，它比传统的线程更轻量级，允许我们并发执行多个任务。Go会在内部使用一组线程来运行创建的协程，并在这些线程之间高效地分配协程执行，这样可以在不增加太多操作系统线程的情况下执行大量的协程。在golang中，我们可以方便的使用gofunc(){}()语句用于启动一个新的
                    
                    golang学习笔记14——golang性能问题的处理方法
                        GoppViper
golang学习笔记golang学习笔记编程语言golang性能性能优化后端
                        推荐学习文档基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码？golang学习笔记05——golang协程池，怎么实现协程池？golang学习笔
                    
                    golang学习笔记15——golang依赖管理方法
                        GoppViper
golang学习笔记golang学习笔记编程语言golang依赖管理源代码管理后端
                        推荐学习文档golang应用级os框架，欢迎star基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码？golang学习笔记05——golang协
                    
                    golang学习笔记12——Go 语言内存管理详解
                        GoppViper
golang学习笔记golang学习笔记编程语言golang内存管理内存优化后端
                        推荐学习文档golang应用级os框架，欢迎star基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码？golang学习笔记05——golang协
                    
                    golang学习笔记02——gin框架及基本原理
                        GoppViper
golang学习笔记golang学习笔记ginhttp
                        目录1.前言2.必要的知识3.路由注册流程3.1核心数据结构3.2执行流程3.3创建并初始化gin.Engine3.4注册middleware3.5注册路由及处理函数（1）拼接完整的路径参数（2）组合处理函数链（3）注册完成路径及处理函数链到路由树3.6服务端口监听4.请求处理5.请求绑定和响应渲染5.1.请求绑定5.2响应渲染结束语1.前言gin框架是golang中比较常见的web框架，截止到目
                    
                    Golang学习路线图及go-starter.md
                        knight11112
golang开发语言后端
                        Golang学习路线图及go-starter.md背景为什么要学习golang最早接触golang是因为对区块链感兴趣，因为golang的并发和内置的网络库还有大公司的支持，先天比较适合区块链，很多著名的框架都是golang写，比如geth再后来，到新加坡Shopee工作，技术栈从Java切换成了golang，更要好好学习golang的语言特性了如下是之前列的一个学习路线图1.数据类型（含stru
                    
                    Go的学习路线
                        JSU-YSJ
Golang基础学习golang学习开发语言
                        Golang简介go语言Go（又称Golang）是Google的RobertGriesemer，RobPike及KenThompson开发的一种静态强类型、编译型语言。Go语言语法与C相近，但功能上有：内存安全，GC（垃圾回收），结构形态及CSP-style并发计算。为什么要学习Go现有的编程语言风格各异，不能完全的运动好电脑的硬件，不高效，及各种优势于一身的语言Golang(谷歌创建)兼容静态编
                    
                    计算机毕业设计选题推荐-基于Python框架项目推荐（中）
                        计算机毕设大佬
Java毕设实战项目Python毕设实战项目爬虫+大数据毕设实战项目python计算机毕业设计django计算机毕业设计如何选题25届计算机毕业设计如何选题计算机毕业设计选题推荐24届计算机毕设选题推荐
                        博主介绍：✌十余年IT大项目实战经验、在某机构培训学员上千名、专注于本行业领域✌技术范围：Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫+大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战项目。主要内容：系统功能设计、开题报告、任务书、系统功能实现、功能代码讲解、答辩PPT、文档编写、文档修改、文档降重、一对一辅导答辩。获取源码可以联系
                    
                    golang学习笔记11——Go 语言的并发与同步实现详解
                        GoppViper
golang学习笔记golang学习笔记编程语言golang并发goroutine后端
                        推荐学习文档golang应用级os框架，欢迎star基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码？golang学习笔记05——golang协
                    
                    golang-阅读雨痕大神的Go语言学习笔记的心得
                        炒股养惠
golang学习之旅go
                        golang-阅读雨痕大神的Go语言学习笔记的心得第一章概述1.1go与java中的局部变量初始化问题1.2golang中实现生产者消费者模型，利用管道进行数据通信第二章类型2.1类型推断的使用注意2.2常量与变量的区别2.3常量的值类型省略2.4go的枚举2.5常量和变量到底有什么区别2.6go基本类型2.7go引用类型2.7.1go中new与make的区别第一章概述1.1go与java中的局部
                    
                    golang学习笔记16——golang部署与运维全攻略
                        GoppViper
golang学习笔记golang学习笔记后端持续部署源代码管理
                        推荐学习文档golang应用级os框架，欢迎star基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码？golang学习笔记05——golang协
                    
                                web报表工具FineReport常见的数据集报错错误代码和解释
                                    老A不折腾
web报表finereport代码可视化工具
                                    在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 
  
NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 
NS_LayerReport_MultiDs=错误代码
                                
                                Java的WeakReference与WeakHashMap
                                    bylijinnan
java弱引用
                                    首先看看 WeakReference 
 
wiki 上 Weak reference 的一个例子： 
 
 

	public class ReferenceTest {
	public static void main(String[] args) throws InterruptedException {
 
            WeakReference r = new Wea
                                
                                Linux——（hostname）主机名与ip的映射
                                    eksliang
linuxhostname
                                    一、 什么是主机名 
无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的； 
主机名是用于什么的呢？ 
答：在一个局域网中，每台机器都有一个主
                                
                                oracle 常用技巧
                                    18289753290

                                    oracle常用技巧   ①复制表结构和数据     create table  temp_clientloginUser   as     select distinct userid from tbusrtloginlog   ②仅复制数据   如果表结构一样   insert into  mytable  select  * &nb
                                
                                使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException
                                    酷的飞上天空
exception
                                    有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 
com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
                                
                                IT系统分析师如何学习大数据
                                    蓝儿唯美
大数据
                                    我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系 统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
                                
                                spring学习——简介
                                    a-john
spring
                                    Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 
 
为了降低Java开发的复杂性，
                                
                                自定义颜色的xml文件
                                    aijuans
xml
                                    <?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
                                
                                运营到底是做什么的？
                                    aoyouzi
运营到底是做什么的？
                                    文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
                                
                                js面向对象类和对象
                                    百合不是茶
js面向对象函数创建类和对象
                                    接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言 但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下  ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似 
  
下面介绍一些js的类和对象的创建的技术 
  
一:类和对
                                
                                web.xml之资源管理对象配置 resource-env-ref
                                    bijian1013
javaweb.xmlservlet
                                    resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 
<resource-env-ref>
    <resource-env-ref-name>资源名</resource-env-ref-name>
    <resource-env-ref-type>查找资源时返回的资源类
                                
                                Create a composite component with a custom namespace
                                    sunjing

                                    https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace 
  
When you developed a composite component the namespace you would be seeing would 
                                
                                【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter
                                    bit1129
mongodb
                                     一、复本集为什么要加入Arbiter这个角色   回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。   什么是Artiber？   An arbiter does 
not have a copy of data set and 
cannot become a primary. Replica sets may have arbiters to add a 
                                
                                Javascript开发笔记
                                    白糖_
JavaScript
                                     
 获取iframe内的元素 
 
通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
                                
                                Web浏览器Chrome打开一段时间后，运行alert无效
                                    bozch
Webchormealert无效
                                    今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。 
试了试其他浏览器，发现都是没有问题的。 
开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。 
这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了 就关闭浏览器重启。 
  
结果就好了，这也太怪异了。难道是cho
                                
                                编程之美-高效地安排会议 图着色问题 贪心算法
                                    bylijinnan
编程之美
                                    

import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Random;

public class GraphColoringProblem {

	/**编程之美 高效地安排会议 图着色问题 贪心算法
	 * 假设要用很多个教室对一组
                                
                                机器学习相关概念和开发工具
                                    chenbowen00
算法matlab机器学习
                                    基本概念： 
机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。 
它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。 
 
开发工具 
M
                                
                                [宇宙经济学]关于在太空建立永久定居点的可能性
                                    comsci
经济
                                     
       大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 
 
       所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
                                
                                oracle 11g database control 证书错误
                                    daizj
oracle证书错误oracle 11G 安装
                                    oracle 11g database control 证书错误  
 
win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面 
 
解决办法： 
 
是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
                                
                                Java I/O之用FilenameFilter实现根据文件扩展名删除文件
                                    游其是你
FilenameFilter
                                    在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。 
在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。        1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16 
                                
                                C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例
                                    dcj3sjt126com
carray
                                    # include <stdio.h>

int main(void)
{
	
	int a[5] = {1, 2, 3, 4, 5};
		//a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4]
	
	int i;

	for (i=0; i<5; ++i)
		printf("%d\n",
                                
                                PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。 就是 唯一 且 不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引
                                    dcj3sjt126com
primary
                                    PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。 就是 唯一 且 不能为空。INDEX 索引，普通的UNIQUE 唯一索引。 不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号   INT会员姓名  
                                
                                java集合辅助类 Collections、Arrays
                                    shuizhaosi888
CollectionsArraysHashCode
                                      
Arrays、Collections 
  
1 ）数组集合之间转换 
    public static <T> List<T> asList(T... a) {
        return new ArrayList<>(a);
    } 
     a）Arrays.asL
                                
                                Spring Security（10）——退出登录logout
                                    234390216
logoutSpring Security退出登录logout-urlLogoutFilter
                                           要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
                                
                                透过源码学前端 之 Backbone 三 Model
                                    逐行分析JS源代码
backbone源码分析js学习
                                    Backbone 分析第三部分  Model 
概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里， 
但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件， 
如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。 
                                
                                SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter
                                    乒乓狂魔
springMVC
                                    这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 
 
HttpMessageConverter接口介绍： 
 

public interface HttpMessageConverter<T> {

	/**
	 * Indicate
                                
                                分布式基础知识和算法理论
                                    bluky999
算法zookeeper分布式一致性哈希paxos
                                       
分布式基础知识和算法理论 
BY [email protected] 
本文永久链接：http://nodex.iteye.com/blog/2103218 
  
在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
                                
                                Android Studio的.gitignore以及gitignore无效的解决
                                    bell0901
androidgitignore
                                    　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 
　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了 
　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store 
                                
                                成为高级程序员的10个步骤
                                    tomcat_oracle
编程
                                    What 
软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 
  
Why 
 
  得到更多的报酬！因为你的薪水会随着你水平的提高而增加  
  提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进  
  历经更大的挑战。随着你的成长，各种影响力也会提高。  
                                
                                mongdb在linux下的安装
                                    xtuhcy
mongodblinux
                                    一、查询linux版本号： 
lsb_release -a  
LSB Version:    :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.