GuoRu2977228610

Tmall爬虫实战记录

Tmall爬虫工作笔记

我们的这个爬虫功能是爬取店铺所有商品。

一、流程分析

输入搜索店铺的名称抓取搜索结果（包含了一些店铺推荐商品）
获取店铺id（通过推荐商品来获取）
获取店铺商品总页数
获取店铺每页的产品url
获取产品详情数据
获取商品评论

二、代码部分

1.店铺抓取

1.1目标url分析

search_url = 'https://list.tmall.com/search_product.htm?q=三只松鼠&type=p&spm=a220m.8599659.a2227oh.d100&from=mallfp..m_1_searchbutton&searchType=default&style=w'

分析：注意我们的红色部分是我们需要输入的店铺名称。

1.2抓取过程

（1）在谷歌浏览器我们登录我们的tmall，淘宝

（2）打开Tmall的店铺搜索界面（https://list.tmall.com/search_product.htm?q=kindle&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest）

（3）自行打开抓包工具进行分析（在此不多赘述，下面直接说结果）

（4）店铺的搜索结果在当前url中包含，所以我们就选择这个url进行爬取

（5）构造请求包

这一步是为今后爬取其他页面奠定基础，所以需要仔细设计请求包。

class request_url(object):
    """请求网页，以及反爬处理"""
    def __init__(self,url):
        self.url = url

我们编写一个类用来处理在请求页面的过程中的各种问题。接下里我们构造请求头。（这里我犯了一个错误，用的网页版tmall来分析，用的移动端的请求头，当headers为pc版时，下面的代码会提取不到信息。）

import random


class request_url(object):
    """请求网页，以及反爬处理"""

    def __init__(self, url):
        self.url = url

    def construct_headers(self):
        agent = ['Dalvik/2.1.0 (Linux; U; Android 10; Redmi K30 5G MIUI/V11.0.11.0.QGICNXM)',
                 'TBAndroid/Native',
                 'Mozilla/5.0 (Linux; Android 7.1.1; MI 6 Build/NMF26X; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/6.2 TBS/043807 Mobile Safari/537.36 MicroMessenger/6.6.1.1220(0x26060135) NetType/WIFI Language/zh_CN',
                 ]
        with open('cookie/search_cookie.txt', 'r') as f:
            cookie = f.readline()
        self.headers = {
            'user-agent': random.choice(agent),
            'cookie': cookie,
            'Connection': 'close',
            # 'referer': 'https://detail.tmall.com/item.htm?spm=a220m.1000858.1000725.1.48c37111IiH0Ml&id=578004651332&skuId=4180113216736&areaId=610100&user_id=2099020602&cat_id=50094904&is_b=1&rn=246062bfaa1943ec6b72afcd1ff3ded8',
        }

较上一步我们构造construct_headers方法来构造请求头。

agent	存有我们的各种请求头，自己可以在网上搜一些添加进去
cookie	cookie是我在当前项目的文件夹下创建了一个cookie文件夹来存放search_cookie

接下来写请求方法。

import requests
import random
from lxml import etree
from fake_useragent import UserAgent
import time


class request_url(object):
    """请求网页，以及反爬处理"""

    def __init__(self, url):
        self.url = url

    def construct_headers(self):
        agent = ['Dalvik/2.1.0 (Linux; U; Android 10; Redmi K30 5G MIUI/V11.0.11.0.QGICNXM)',
                 'TBAndroid/Native',
                 'Mozilla/5.0 (Linux; Android 7.1.1; MI 6 Build/NMF26X; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/6.2 TBS/043807 Mobile Safari/537.36 MicroMessenger/6.6.1.1220(0x26060135) NetType/WIFI Language/zh_CN',
                 ]
        with open('cookie/search_cookie.txt', 'r') as f:
            cookie = f.readline()
        self.headers = {
            'user-agent': random.choice(agent),  # 随机选择一个请求头部信息
            'cookie': cookie,
            'Connection': 'close',
            # 'referer': 'https://detail.tmall.com/item.htm?spm=a220m.1000858.1000725.1.48c37111IiH0Ml&id=578004651332&skuId=4180113216736&areaId=610100&user_id=2099020602&cat_id=50094904&is_b=1&rn=246062bfaa1943ec6b72afcd1ff3ded8',
        }

    def request(self):
        self.construct_headers()
        response = requests.get(self.url,headers=self.headers)
        xml = etree.HTML(response.text)  # 转换成xml,为了使用xpath提取数据
        return response.text,xml


def mainRquest(url):
    RU = request_url(url)
    response,xml = RU.request()
    return response,xml

至此我们的请求包初步构造完成，然后我们将这个python文件命名为Elements.py

（6）店铺搜索结果爬取

首先创建一个名为Tmall.py的文件。

我们在这个文件中还是构造一个类来爬取Tmall。

from Elements import mainRquest


class Tmall():

    def __init__(self):
        self.search = input('请输入店铺名：')
        self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)

    # 1.0搜索店铺
    def shop_search(self):
        response,xml = mainRquest(self.url)
        print(response)


def main():
    tmall = Tmall()
    tmall.shop_search()


if __name__ == '__main__':
    main()

执行结果：

下一步我们利用xpath，或者正则表达式进行内容筛选。

from Elements import mainRquest


class Tmall():

    def __init__(self):
        self.search = input('请输入店铺名：')
        self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)

    # 1.0搜索店铺
    def shop_search(self):
        response,xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        print(title)


def main():
    tmall = Tmall()
    tmall.shop_search()


if __name__ == '__main__':
    main()

执行结果：

['kindle官方旗舰店', '天猫国际进口超市', '锦读数码专营店', '苏宁易购官方旗舰店', '天佑润泽数码专营店', 'boox曼尼金专卖店', 'kindle海江通专卖店', '洋桃海外旗舰店', '志赟数码专营店', '天猫国际小酒馆']

（7）店铺产品基本信息抓取

经过小编的分析，我们会发现店铺产品的链接就在：

我们点击这个url就到达：

把网页往下滑，会有第几页，我们紧接着点击第几页，便可以进行翻页，然后我们观察网址的变化：

https://list.tmall.com/search_shopitem.htm?spm=a220m.1000862.0.0.6135657ffcj9sU&s=60&style=sg&sort=s&user_id=2099020602&from=_1_&stype=search#grid-column # 第二页

https://list.tmall.com/search_shopitem.htm?spm=a220m.1000862.0.0.3822657f0J7RJx&s=120&style=sg&sort=s&user_id=2099020602&from=_1_&stype=search#grid-column # 第三页

分析url我们发现，我们可以通过构造url来爬取店铺所有的产品。那接下来让我们来写代码吧！

第一步在上一个店铺搜索结果获取中，我们需要提取出user_id。

# 1.0搜索店铺
    def shop_search(self):
        response,xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        user_id = re.findall('user_id=(\d+)',response)
        print(user_id)

运行结果：

['2099020602', '2549841410', '3424411379', '2616970884', '3322458767', '3173040572', '2041560994', '2206736426581', '2838273504', '2200657974488']

我们接下里要把这些爬下来的数据先创建一个变量存起来。（为了避免每次都要输入，小编在举例中将q=kindle写死）

from Elements import mainRquest
import re


class Tmall():

    def __init__(self):
        # self.search = input('请输入店铺名：')
        # self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)
        self.url = 'https://list.tmall.com/search_product.htm?q=kindle&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'
        self.shop_dict = {}  # 用于存储店铺的信息

    # 1.0搜索店铺
    def shop_search(self):
        response, xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        user_id = re.findall('user_id=(\d+)', response)
        assert (len(title) == len(user_id) and len(title) != [])  # 确保我们的提取到了数据，若没有将会报错
        self.shop_dict['shopTitle'] = title
        self.shop_dict['userId'] = user_id
        print('\r1.0店铺搜索结果处理完成！', end='')


def main():
    tmall = Tmall()
    tmall.shop_search()


if __name__ == '__main__':
    main()

2.店铺内的商品抓取

在上面我们得到了店铺的userid，以及店铺的名称。接下来我们要利用userid来抓取店铺内的商品。

先来分析一下url：

https://list.tmall.com/search_shopitem.htm?spm=a220m.1000862.0.0.48813ec6huCom4&s=60&style=sg&sort=s&user_id=765321201&from=_1_&stype=search#grid-column

spm	作用不明，可有可无
s	当前页面展示的第一个商品是店铺内第几个商品，用于翻页，间隔60
sort	排序，s是默认排序

其他暂且不分析，等后面用到再说，接下来构造店铺商品url。

from Elements import mainRquest
import re


class Tmall():

    def __init__(self):
        # self.search = input('请输入店铺名：')
        # self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)
        self.url = 'https://list.tmall.com/search_product.htm?q=kindle&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'
        self.shop_dict = {}  # 用于存储店铺的信息

    # 1.0搜索店铺
    def shop_search(self):
        response, xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        user_id = re.findall('user_id=(\d+)', response)
        assert (len(title) == len(user_id) and len(title) != [])  # 确保我们的提取到了数据，若没有将会报错
        self.shop_dict['shopTitle'] = title
        self.shop_dict['userId'] = user_id
        print('\r1.0店铺搜索结果处理完成！', end='')
    
    # 2.0抓取店铺所有产品基本信息。
    def all_product(self):
        for id in self.shop_dict['userId']:
            url = 'https://list.tmall.com/search_shopitem.htm?' \
                  'spm=a220m.1000862.0.0.48813ec6huCom4' \
                  '&s=0&style=sg&sort=s&user_id=%s&from=_1_&stype=search#grid-column'%(id)


def main():
    tmall = Tmall()
    tmall.shop_search()


if __name__ == '__main__':
    main()

经过我多次实验发现在访问店铺内所有商品的信息时容易出现反爬，每次cookie会发生变化，因此我使用了pyautogui来打开浏览器访问所有产品页面，利用fiddler抓包保存到本地，在进行一次提取。

fiddler下载地址：链接：https://pan.baidu.com/s/1PqAOVO4Vwujf8loT37z4Tg
提取码：x0zm

fiddler抓包的配置教程请自行搜索，很多的，实在不会请私信我。

请在fiddler文件所在目录创建一个response.txt文件

操作截图：

下一步打开fiddler，打开FiddlerScript，转到beforeresponse，添加如下代码。

        if (oSession.fullUrl.Contains("tmall.com/search_shopitem"))
        {
            oSession.utilDecodeResponse();
            var fso;
            var file;
            fso = new ActiveXObject("Scripting.FileSystemObject");
            //文件保存路径，可自定义
            file = fso.OpenTextFile("response.txt",8 ,true, true);
            file.writeLine(oSession.GetResponseBodyAsString());
            file.close();
        }

记得保存脚本。

我们打开一个网站测试一下：https://list.tmall.com/search_shopitem.htm?spm=a220m.1000862.0.0.48813ec6huCom4&s=0&style=sg&sort=s&user_id=2099020602&from=_1_&stype=search#grid-column

记得登录你的tmall账号

测试后你的response.txt中会保存有：

在这里我们完成了对店铺所有产品的数据抓取，接下来进行提取：

（1）创建一个functions.py用于存储我们自定义的包。

（2）在functions.py中创建自动打开tmall店铺所商品的函数GetAllProduct()。

def GetAllProduct(url):
    import pyautogui
    import time
    # 在运行本程序之前打开fiddler（配置完成的）
    time.sleep(2)  # 因为程序启动需要时间，在此等待2秒，防止出错。
    x, y = 710, 1070  # 这是我的谷歌浏览器的在屏幕上的位置。
    pyautogui.moveTo(x, y)
    time.sleep(1)
    pyautogui.click()  # 左击
    time.sleep(1)
    x, y = 700, 70  # 这是谷歌浏览器的网址输入栏的位置，每台电脑略有不同，请自行测试。
    pyautogui.moveTo(x + 100, y)
    pyautogui.click()
    time.sleep(1)
    pyautogui.write(url, interval=0.01)  # 在地址栏中输入url，0.01是输入速度
    pyautogui.press('enter')  # 按回车
    time.sleep(5)  # 根据自己的网速自行调节速度
    # 切换回程序运行界面
    pyautogui.keyDown('alt')
    pyautogui.press('tab')
    pyautogui.keyUp('alt')

（3）response.txt读取与提取，创建函数GetResponseHtml()。

# url = 'https://list.tmall.com/search_shopitem.htm?spm=a220m.1000862.0.0.48813ec6huCom4&s=0&style=sg&sort=s&user_id=2099020602&from=_1_&stype=search#grid-column'
def GetAllProduct(url):
    import pyautogui
    import time
    # 在运行本程序之前打开fiddler（配置完成的）
    time.sleep(2)  # 因为程序启动需要时间，在此等待2秒，防止出错。
    x, y = 710, 1070  # 这是我的谷歌浏览器的在屏幕上的位置。
    pyautogui.moveTo(x, y)
    time.sleep(1)
    pyautogui.click()  # 左击
    time.sleep(1)
    x, y = 700, 70  # 这是谷歌浏览器的网址输入栏的位置，每台电脑略有不同，请自行测试。
    pyautogui.moveTo(x + 100, y)
    pyautogui.click()
    time.sleep(1)
    pyautogui.write(url, interval=0.01)  # 在地址栏中输入url，0.01是输入速度
    pyautogui.press('enter')  # 按回车
    time.sleep(5)  # 根据自己的网速自行调节速度
    # 切换回程序运行界面
    pyautogui.keyDown('alt')
    pyautogui.press('tab')
    pyautogui.keyUp('alt')


# 将保存的数据读取并处理
def GetResponseHtml():
    from lxml import etree

    def check_charset(file_path):
        # 此函数有用于防止数据编码出错，小编在这入坑几个小时
        import chardet
        with open(file_path, "rb") as f:
            data = f.read(4)
            charset = chardet.detect(data)['encoding']
        return charset

    your_path = r'D:\编程工具大全\独家汉化Fiddler5.0.20182\Fiddler5.0.20182\response.txt'  # response.txt的路径
    with open(your_path, 'r+', encoding=check_charset(your_path)) as f:
        data = f.read()
        html = etree.HTML(data)  # 转换成html
        with open('data/response.txt', 'a+') as q:  # 这是我对抓取到的response.txt进行一个备份，可有可无
            q.write(data)
        f.truncate(0)  # 清除response.txt中的内容

    return data, html

（4）打开Tmall.py，创建方法self.all_product()，利用正则、xpath提取数据。

from Elements import mainRquest
from functions import GetAllProduct
from functions import GetResponseHtml
import re
import time


class Tmall():

    def __init__(self):
        # self.search = input('请输入店铺名：')
        # self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)
        self.url = 'https://list.tmall.com/search_product.htm?q=手机&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'
        self.shop_dict = {}  # 用于存储店铺的信息
        self.product_list = []

    # 1.0搜索店铺
    def shop_search(self):
        response, xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        user_id = re.findall('user_id=(\d+)', response)
        assert (len(title) == len(user_id) and len(title) != [])  # 确保我们的提取到了数据，若没有将会报错
        self.shop_dict['shopTitle'] = title
        self.shop_dict['userId'] = user_id
        print('\r1.0店铺搜索结果处理完成！', end='')

    # 2.0抓取店铺所有产品基本信息。
    def all_product(self):
        for id in self.shop_dict['userId']:  # 店铺所有产品url构造
            url = 'https://list.tmall.com/search_shopitem.htm?' \
                  'spm=a220m.1000862.0.0.48813ec6huCom4' \
                  '&s=0&style=sg&sort=s&user_id=%s&from=_1_&stype=search#grid-column' % (id)

            GetAllProduct(url)  # 自动打开构造的地址，
            response, html = GetResponseHtml()

            self.price = re.findall('¥(.*?)', response)
            self.Msell = re.findall('月成交(\d+)笔', response)
            self.product_title = html.xpath('//p[@class="productTitle"]/a/@title')
            self.product_url = html.xpath('//p[@class="productTitle"]/a/@href')
            if self.price == []:
                print(response)
            else:
                print(self.product_title)
                print(self.price)
                print(self.Msell)
                print(self.product_url)
            time.sleep(20)  # 用于测试，防止运行过快，后面会删掉。


def main():
    tmall = Tmall()
    tmall.shop_search()
    tmall.all_product()


if __name__ == '__main__':
    main()

接下来要做的是爬取商品详情页面的信息。

（1）在cookie文件夹下面创建一个product_cookie.txt的文件；

（2）定义一个新的方法get_product_imformation()；

（3）构造url，看代码。

（4）请求，提取信息。

from Elements import mainRquest
from functions import GetAllProduct
from functions import GetResponseHtml,Replace,Compound
import re
import time


class Tmall():

    def __init__(self):
        # self.search = input('请输入店铺名：')
        # self.url = 'https://list.tmall.com/search_product.htm?q=%s&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'%(self.search)
        self.url = 'https://list.tmall.com/search_product.htm?q=手机&type=p&style=w&spm=a220m.1000858.a2227oh.d100&xl=kindle_2&from=.list.pc_2_suggest'
        self.shop_dict = {}  # 用于存储店铺的信息
        self.product_list = []

    # 1.0搜索店铺
    def shop_search(self):
        response, xml = mainRquest(self.url)
        title = xml.xpath('//div[@class="shop-title"]/label/text()')
        user_id = re.findall('user_id=(\d+)', response)
        assert (len(title) == len(user_id) and len(title) != [])  # 确保我们的提取到了数据，若没有将会报错
        self.shop_dict['shopTitle'] = title
        self.shop_dict['userId'] = user_id
        print('\r1.0店铺搜索结果处理完成！', end='')

    # 2.0抓取店铺所有产品基本信息。
    def all_product(self):
        print('2.0开始')
        for id in self.shop_dict['userId']:  # 店铺所有产品url构造
            url = 'https://list.tmall.com/search_shopitem.htm?' \
                  'spm=a220m.1000862.0.0.48813ec6huCom4' \
                  '&s=0&style=sg&sort=s&user_id=%s&from=_1_&stype=search#grid-column' % (id)

            GetAllProduct(url)  # 自动打开构造的地址，
            response, html = GetResponseHtml()

            self.price = re.findall('¥(.*?)', response)  # 价格
            self.Msell = re.findall('月成交(\d+)笔', response)  # 月销量
            self.product_title = html.xpath('//p[@class="productTitle"]/a/@title')  # 产品名称
            self.product_url = html.xpath('//p[@class="productTitle"]/a/@href')  # 产品链接
            if self.price == []:
                print(response)
            else:
                print(self.product_title)
                print(self.price)
                print(self.Msell)
                print(self.product_url)
            yield

    # 3.0 产品详情数据抓取 
    def get_product_imformation(self):
        print('3.0开始')
        # 构造url
        self.product_detail = []
        for purl in self.product_url:
            url = 'https:' + purl
            print(url)
            # 请求，下面的代码是我自己写的，你们可以根据需求自己写提取式子，
            response,html = mainRquest(url)
            self.brand = re.findall('li id="J_attrBrandName" title=" (.*?)">',response)
            self.para = html.xpath('//ul[@id="J_AttrUL"]/li/text()')

            specification = html.xpath('//table[@class="tm-tableAttr"]/tbody/tr/th/text()')
            stitle = html.xpath('//table[@class="tm-tableAttr"]/tbody/tr[@class="tm-tableAttrSub"]/th/text()')
            sanswer = html.xpath('//table[@class="tm-tableAttr"]/tbody/tr/td/text()')
            if specification != []:
                self.sparadict = Compound(specification,sanswer,stitle)
            time.sleep(10)




def main():
    tmall = Tmall()
    tmall.shop_search()
    for i in tmall.all_product():
        tmall.get_product_imformation()


if __name__ == '__main__':
    main()

（5）过滑块更新cookie。

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul