luslin

python3 学习 Scrapy框架的使用

#1、架构介绍
#Engine。引擎，处理整个系统的数据流、触发事务，是整个框架的核心
#item。项目，它定义了爬取结果的数据结构，爬取的数据会被赋值成Item对象
#Scheduler。调度器，接受引擎发过来的请求并将其加入队列中，在引擎再次请求时将请求提供给引擎
#Downloader。下载器，下载网页内容，并将网页内容返回给蜘蛛
#Spiders。蜘蛛，其内容定义了爬取的逻辑和网页的解析规则，它主要负责解析响应内容并生产提取结果和新的请求
#Item Pipeline 项目管道，负责处理由蜘蛛从网页中抽取的项目，它的主要任务是清洗、验证和存储数据。
#Downloader Middlewaress. 下载器中间件，位于引擎和蜘蛛之间的钩子框架，主要处理引擎与下载器之间的请求及响应
#Spider Middlewares 蜘蛛中间件，位于引擎和蜘蛛之间的钩子框架，主要处理向蜘蛛输入的响应和输出结果及新的请求

# Scrapy 入门

#在cmd中进入一个文件夹，然后输入 scrapy startproject tutorial,这个命令会创建一个tutorial的文件夹，文件夹结构如下：
'''
scrapy.cfg    #Scrapy 部署时的配置文件，定义了项目的配置文件，部署相关信息等内容
tutorial    #项目的模块，需要从这里引入
_init_.py
items.py    #Item的定义，定义爬取的数据结构
middlewares.py  #Middlewares的定义，定义爬取时的中间件
pipelines.py    #piplines的定义，定义数据管道
settings.py     #配置文件
spiders         #放置Spiders的文件夹
_init_.py
'''

#创建Spider

#spider是自己定义的类，Scrapy用它来从网页里爬取内容，并解析抓取的结果。不过这个类必须继承Scrapy提供的Spider类scrapy.Spider,还要定义Spider的名称和起始请求，以及怎样处理爬取后的结果的方法

#也可以使用命令行来创建一个Spider。比如，要生成Quotes这个Spider，可以执行如下命令：

#cd tutorial
#scrapy genspider qutotes qutotes.toscrape.com

#进入刚创建的tutorial文件夹，执行genspider命令，第一个参数是Spider的名称，第二个参数是网站域名，执行完毕后spiders文件夹中多了一个quotes.py文件，内容如下：
'''
# -*- coding: utf-8 -*-
import scrapy


class QuotesSpider(scrapy.Spider):
 name = 'quotes'
 allowed_domains = ['quotes.toscrape.com']
 start_urls = ['http://quotes.toscrape.com/']

 def parse(self, response):
 pass
'''
#这里有三个属性—name、allowed_domins、start_urls 还有一个方法parse
#name：每个项目唯一的名字，用来区分不同的Spider
#allowed_domains：它是允许爬取的域名，如果初始或后续的的请求连接不是这个域名下的，则请求连接会被过滤掉 #start_urls，它包含了Spider在启动时爬取的爬取的url列表，初始请求是用它来定义的
#parse，它是spider的一个方法，负责解析返回的响应、提取数据或者进一步生成要处理的请求

#创建item

#Item是保存数据的容器，它使用的方法与字典类似，，不过Item添加了额外的保护机制，可以避免拼写或者定义字段错误
#创建Item类需要继承自scrapy.Item类，并且定义类型为scrapy.Field的字段。观察目标网站，发现能提取的内容有text,author,tags
# 定义Item，此时将item修改如下：
'''
import scrapy

class TutorialItem(scrapy.Item):
 # define the fields for your item here like:
 # name = scrapy.Field()
 text = scrapy.Field()
 author = scrapy.Field()
 tags = scrapy.Field()
 pass
'''

#解析Response

#前面我们看到，parse()方法的参数response是stat_urls里面的连接爬取后的结果。所以在pars（）方法中，我们可以直接对response变量包含的内容进行解析，比如说浏览器请求结果的源代码，或者进一步分析源代码内容，或者找出结果中的连接而得到下一个请求 #首先看网页结构，每一页都有多个class为quote的区块，每个区块内都包含text、author、tags。那么我们先找出所有的quote，然后提取每一个quote中的内容，这里讲parse（）方法内容修改如下
'''
def parse(self,response):
 quotes = response.css('.quote')
 for quote in quotes:
 text = quote.css('.text::text').extract_first()
 author = quote.css('.author::text').extract_first()
 tags = quote.css('.tags .tag::text').extract()
'''

#使用Item

# 上文定义了Item，Item可以理解为一个字典，不过在声明时需要实例化。然后依次用刚才解析的结果赋值Item的每一个字段，最后将Item返回即可

#QuotesSpider改写如下：
'''
# -*- coding: utf-8 -*-
import scrapy
from tutorial.items import TutorialItem

class QuotesSpider(scrapy.Spider):
 name = 'quotes'
 allowed_domains = ['quotes.toscrape.com']
 start_urls = ['http://quotes.toscrape.com/']

 def parse(self, response):
 quotes = response.css('.quote')
 for quote in quotes:
 item = TutorialItem()
 item['text'] = quote.css('.text::text').extract_first()
 item['author'] = quote.css('.author::text').extract_first()
 item['tags'] = quote.css('.tags .tag::text').extract()
 yield item
'''

#后续Request
 #上面的操作实现了从初始页面抓取内容。那么下一页的内容该如何抓取呢？这就需要从当前页面中找到信息来生成下一个请求，然后在下一个请求中再找到信息来生成下一个请求。这样循环往复迭代，从而实现整站的爬取。
 #构造请求时需要用到scrapy.Request,这里我们传递两个参数—url和callback
 #url：它请求的下一个连接的地址
 #callback：它是回调函数。当指定了该回调函数的请求完成后，获取到响应，引擎会将该响应作为参数传递给这个回调函数。回调函数进行解析或生成下一个请求，在parse（）方法后追加如下代码
'''
 next = response.css('.pager .next a::attr("href")').extract_first()
 url = response.urljoin(next)
 yield scrapy.Request(url=url, callback=self.parse)
'''

#运行
#进入目录，运行
# scrapy crawl quotes

#保存到文件
# scrapy crawl quotes -o quotes.json   或quotes.csv 或quotes.xml 或quotes.pickle 或quotes.marshal
#或者进行远程输出ftp     scrapy crawl quotes -o ftp://[email protected]/path/to/quotes.csv

#使用Item Pipeline
#如果想进行更复杂的操作，如将结果保存到MongDB数据库，或者筛选某些有用的Item，我们可以通过Item Pipeline来实现

#Item Pipeline作为项目管道，当Item生成后，它会自动被送到Item Pipleline进行处理，我们常用Item Pipeline来做如下操作
#清理HTML数据
#验查爬取数据，检查爬取字段
#查重并去掉重复内容
#将爬取结果保存到数据库
#要实现Item Pipeline 很简单，只需要定义一个类并实现process_item()方法即可。启动Item Pipeline后，Item Pipeline会自动调动process_item()方法，并返回数据，数据类型必须是字典或者Item对象，或者抛出DropItem异常

#process_item()方法有两个参数，item是每次Spider生成的Item，第二个参数是Spider的实例化对象 #接下来我们实现一个process_item()方法，将item传入字典中长度大于30的数据截成30并在后面加上......
#接下来我们将处理后的item存入MongoDB中，定义另外一个Pipeline。同样在pipelines文件内，我们实现另一个类MongoPipeline，内容如下:
#还需要将settings.py文件中这部分进行改写
'''
# Configure item pipelines
# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
ITEM_PIPELINES = { 'tutorial.pipelines.TutorialPipeline': 300, 'tutorial.pipelines.MongoPipeline':400 } MONGO_URI = 'localhost'
MONGO_DB = 'quotes' ''' ''' import pymongo class TutorialPipeline(object): def __init__(self): self.limit = 30 def process_item(self, item, spider):        #接下来我们实现一个process_item()方法，将item传入字典中长度大于30的数据截成30并在后面加上...... if item['text']: if len(item['text']) > self.limit: item['text'] = item['text'][:self.limit].rstrip() + '......' return item else: return DropItem('Missing Text') #没有文本抛出异常 class MongoPipeline(object): def __init__(self,mongo_uri,mongo_db): self.mongo_uri = mongo_uri self.mongo_db = mongo_db @classmethod def from_crawler(cls,crawler):
 return cls(
 mongo_uri=crawler.settings.get('MONGO_URI'),
 mongo_db = crawler.settings.get('MONGO_DB')
 )
 def open_spider(self,spider):
 self.client = pymongo.MongoClient(self.mongo_uri) #连接MongoDB
 self.db = self.client[self.mongo_db] #创建数据库
 def process_item(self,item,spider):
 name = item.__class__.__name__
 self.db[name].insert(dict(item))
 return item
 def close_spider(self,spider):
 self.client.close()
'''

下面是各个文件中代码情况：
items.py:

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# https://doc.scrapy.org/en/latest/topics/items.html

import scrapy
 class TutorialItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() text = scrapy.Field() author = scrapy.Field() tags = scrapy.Field() pass

middlewares.py文件没有更改内容
pipelines.py文件内容：

# -*- coding: utf-8 -*-

# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html

import  pymongo
class TutorialPipeline(object):
    def __init__(self):
        self.limit = 30
    def process_item(self, item, spider):        #接下来我们实现一个process_item()方法，将item传入字典中长度大于30的数据截成30并在后面加上......
        if item['text']:
            if len(item['text']) > self.limit:
                item['text'] = item['text'][:self.limit].rstrip() + '......'
            return item
        else:
            return DropItem('Missing Text') #没有文本抛出异常
class MongoPipeline(object):
    def __init__(self,mongo_uri,mongo_db):
        self.mongo_uri = mongo_uri
        self.mongo_db = mongo_db
    @classmethod
    def from_crawler(cls,crawler):
        return cls(
            mongo_uri=crawler.settings.get('MONGO_URI'),
            mongo_db = crawler.settings.get('MONGO_DB')
        )
    def open_spider(self,spider):
        self.client = pymongo.MongoClient(self.mongo_uri)     #连接MongoDB
        self.db = self.client[self.mongo_db]                  #创建数据库
    def process_item(self,item,spider):
        name = item.__class__.__name__
        self.db[name].insert(dict(item))
        return item
    def close_spider(self,spider):
        self.client.close()

settings文件内容：

# -*- coding: utf-8 -*-

# Scrapy settings for tutorial project
#
# For simplicity, this file contains only settings considered important or
# commonly used. You can find more settings consulting the documentation:
#
# https://doc.scrapy.org/en/latest/topics/settings.html
# https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
# https://doc.scrapy.org/en/latest/topics/spider-middleware.html

BOT_NAME = 'tutorial'

SPIDER_MODULES = ['tutorial.spiders']
NEWSPIDER_MODULE = 'tutorial.spiders'


# Crawl responsibly by identifying yourself (and your website) on the user-agent
#USER_AGENT = 'tutorial (+http://www.yourdomain.com)'

# Obey robots.txt rules
ROBOTSTXT_OBEY = True

# Configure maximum concurrent requests performed by Scrapy (default: 16)
#CONCURRENT_REQUESTS = 32

# Configure a delay for requests for the same website (default: 0)
# See https://doc.scrapy.org/en/latest/topics/settings.html#download-delay
# See also autothrottle settings and docs
#DOWNLOAD_DELAY = 3
# The download delay setting will honor only one of:
#CONCURRENT_REQUESTS_PER_DOMAIN = 16
#CONCURRENT_REQUESTS_PER_IP = 16

# Disable cookies (enabled by default)
#COOKIES_ENABLED = False

# Disable Telnet Console (enabled by default)
#TELNETCONSOLE_ENABLED = False

# Override the default request headers:
#DEFAULT_REQUEST_HEADERS = {
# 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
# 'Accept-Language': 'en',
#}

# Enable or disable spider middlewares
# See https://doc.scrapy.org/en/latest/topics/spider-middleware.html
#SPIDER_MIDDLEWARES = {
# 'tutorial.middlewares.TutorialSpiderMiddleware': 543,
#}

# Enable or disable downloader middlewares
# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
#DOWNLOADER_MIDDLEWARES = {
# 'tutorial.middlewares.TutorialDownloaderMiddleware': 543,
#}

# Enable or disable extensions
# See https://doc.scrapy.org/en/latest/topics/extensions.html
#EXTENSIONS = {
# 'scrapy.extensions.telnet.TelnetConsole': None,
#}

# Configure item pipelines
# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
ITEM_PIPELINES = {
    'tutorial.pipelines.TutorialPipeline': 300,
    'tutorial.pipelines.MongoPipeline':400
}
MONGO_URI = 'localhost'
MONGO_DB = 'quotes'

# Enable and configure the AutoThrottle extension (disabled by default)
# See https://doc.scrapy.org/en/latest/topics/autothrottle.html
#AUTOTHROTTLE_ENABLED = True
# The initial download delay
#AUTOTHROTTLE_START_DELAY = 5
# The maximum download delay to be set in case of high latencies
#AUTOTHROTTLE_MAX_DELAY = 60
# The average number of requests Scrapy should be sending in parallel to
# each remote server
#AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
# Enable showing throttling stats for every response received:
#AUTOTHROTTLE_DEBUG = False

# Enable and configure HTTP caching (disabled by default)
# See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
#HTTPCACHE_ENABLED = True
#HTTPCACHE_EXPIRATION_SECS = 0
#HTTPCACHE_DIR = 'httpcache'
#HTTPCACHE_IGNORE_HTTP_CODES = []
#HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'

quotes.py文件内容：

# -*- coding: utf-8 -*-
import scrapy
from tutorial.items import TutorialItem

class QuotesSpider(scrapy.Spider):
    name = 'quotes'
    allowed_domains = ['quotes.toscrape.com']
    start_urls = ['http://quotes.toscrape.com/']

    def parse(self, response):
        quotes = response.css('.quote')
        for quote in quotes:
            item = TutorialItem()
            item['text'] = quote.css('.text::text').extract_first()
            item['author'] = quote.css('.author::text').extract_first()
            item['tags'] = quote.css('.tags .tag::text').extract()
            yield item

        next = response.css('.pager .next a::attr("href")').extract_first()
        url = response.urljoin(next)
        yield scrapy.Request(url=url, callback=self.parse)

最后执行 scrapy crawl quotes命令：
我用的是adminMongo可视化工具，使用前还得先连接到创建的数据库才能看到数据

云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
屯垦塔里木札记（50）师市轮训连队（村）两委600余人悲惨的骆驼
2022年6月7日，兵团一师阿拉尔市连队（村）两委集中轮训班第六期正式开课。为进一步加强基层连队（村）两委对党的方针，路线、政策的学习理解，传承三五九旅精神，贯彻兵团高质量发展理念，强力推动连队（村）两委在乡村振兴过程中治理效能，依法依规行政，服务职工群众的能力，师市已举办6期轮训班。为期10天的培训，相继邀请兵团和一师党校讲师，一师组织部、统战部、政法委、人社局，民政局、司法局、公安局、农业农村
XSS Payload 学习浏览器解码菜鸟一个昂 servlet
目录问题一：问题二：问题三：问题四：问题五：问题六：问题七：问题八：问题九：问题十：问题十一：问题十二：问题十三：问题十四：问题十五：问题一：无法弹窗原因：urlcode无法识别协议（javascript:）html解码顺序：1、html实体编码2、urlcode编码3,unicode编码问题二：可以弹窗首先先HTML实体编码解码，得到href中为URL，URL模块可识别为javascript协议
浏览器解码过程分析
浏览器解码过程分析前言在学习xss漏洞的过程中我发现一个问题，当我想绕过过滤机制时，可以采用编码的方式进行绕过这种方法，但是并不是每一种编码格式都能绕过，需要不停的尝试才行，这样过于浪费时间。后来我发现浏览器与服务器数据传输过程中有好几种编码格式，不同的编码格式有着不同的解析引擎，作为一个浏览器，在解析一篇HTML文档时主要有三个处理过程：HTML解析，URL解析和JavaScript解析。每个解
1-----------10号韩媛媛个人总结我是你的媛
个销:18件数:37单笔2.3客单价:6171字头5.0个人总结:刚来的时候状态很好，很积极，这几天有一些累，实在是状态不好，每天积极接顾客，但是刚开始沟通不太方便，自己需要赶快调整，积极，正面的去冲刺下半个月。再就是货品，货品现在已经熟悉了，下半个月加油。每天学习02好的动作，才不白来。再就是货品方面单笔太低，应该达3，单价不高，所以分值低，所以我接下来就是高金，目标很明确，提升分值。
浅学——心理学基础 Ciudadnatal
心理学基础三大思维模式1.从直觉思维到理性思维。三只猴子的实验，人类的传统延续有相通之处，一方面我们为了生存，我们头脑你保存了无数规则和思维方式。另一方面，我们很少去探究每一条规则背后的逻辑和适用情景。学习心理学的最重要的目的之一，就是让我们学会对传统、对权威、对惯例保持疑问，学会刨根问底地去追问为什么。2.从自我中心思维到开放思维。由于大脑不完备的进化和发育，给我们带来的自我为中心的思维模式。指
从XSS Payload学习浏览器解码 caker丶 XSS-labs XSS xss 学习 javascript
从XSSPayload学习浏览器解码HTML解析URL解析JavaScript解析案例解析总结作为一个浏览器在解析一篇HTML文档时主要有三个处理过程，每个解析器负责解码和解析HTML文档中它所对应的部分，下面我将按照解码顺序依次讲解。HTMl解析URL解析JavaScript解析HTML解析一个HTML解析器作为一个状态机，它从输入流中获取字符并按照转换规则转换到另一种状态。在解析过程中，任何时
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
2020年3月2号阴星期日 4f2e
今天早上起来，儿子已经起来在学习了，女儿从六天起来看手机到了十点多还看我就再也忍不住了拿了个衣架准备要揍女儿，女儿就跑去卫生间吧们给反锁了大概有十几分钟，我就说好吧那就出来接受个小惩罚倒立十几分钟我要洗脸刷牙女儿就去倒立了她也挺棒的自己就翻上去了我偷看有么有反上倒立，我一看女儿已经倒立在哪里了，还是很棒的吗，平时都要我帮她才能倒立起来今天居然自己可以做到了，我在心里么么的想你都能自己做到的希望你以
2021-07-24 心花怒放心理咨询
【学习内容】沟通的基本训练。沟通基本训练之接受批评法。沟通的基本训练之一分为二法。【我的收获】增加了某项知识，刷新了某项认知，启发了某个思路...聆听对方的需要。复述语言。肢体+语气。精简说话。精简要点+核对。能够使来访者被理解被看见。接受批评法。一个有效的改善受到批评后所遗留的负面情绪的方法。就是给自己安装一个程序。我们有力量去应对。甚至把负面信息转化为正面信息。【我可以这样用】我将如何运用这个
配音必学的伪音，到底怎么练？零基础配音学习教程配音新手圈
声优都是伪音大佬！相信大家都听过这句话吧！而伪音，也就是“伪装的声音”比如美女伪装出正太音，大叔伪装出萝莉音！可以说伪音是优秀配音演员的必备技能！那伪音究竟怎么练习呢？一起来看看吧！不同音色发音特点01、萝莉音音调较高，鼻音较重，嗓子较尖细，可以糅合一些港台腔02、少女音说话的语气充满活力，整体语调上扬，咬字发音很清脆03、正太音音调拉高，嗓子压低，在少女音的基础上加上刚硬、活力的感觉04、御姐音
input标签和label标签实现单选按钮大风过岗
input标签和label实现单选按钮关于label标签的使用：label可以配合input标签使用：用法：标签的for属性应当与input元素的id属性相同。例如：Malelabel标签的作用：label元素不会向用户呈现任何特殊效果。不过，它为鼠标用户改进了可用性。如果您在label元素内点击文本，就会触发此控件。就是说，当用户选择该标签时，浏览器就会自动将焦点转到和标签相关的表单控件上。
此生无悔？是人就会后悔！腐朽的灵魂
我可能有抑郁症了，常常都会感觉到自己想放弃，可是我的睿智告诉我，这是错误的。其实就是太贫穷了，然后又总是想太多，导致自己出现故障。以前总是静静的看书，现在只想睡觉，以前总是努力坚持，现在常常找借口。虽然我是个废宝宝，但是真的好讨厌这样的我……现在歌曲也不能让我快乐了，游戏也不能让我快乐，而学习……我开始讨厌了。怎么可以，怎么可能，怎么会讨厌ヽ(≧Д≦)ノ。学习让人快乐，为什么我感觉不到了，是因为我
2018-10-21 林艳的
公司：38磁疗饰品--林艳--378期反省一组塾生439期志工，【日精进打卡第172天】【知-学习】《六项精进》大纲诵读0遍，共134遍；《六项精进》通篇诵读0遍，共1遍；《大学》诵读0遍，共113遍，《英语》诵读0遍，共8遍，抄0遍，共5遍；《昨今明日诗》诵读1遍，共16遍/抄0遍，共1遍，《准提咒》诵读0遍，共230遍；抄准提咒12遍，共1290遍；《心经》诵读0遍，共108遍/抄2遍，共19
Flutter -- Provider在实际项目中的使用 MrLinWX flutter flutter dart android ios
Provider是一个状态管理的类，可以根据实际运用中对某个Widget进行刷新，这个功能的运用比setstate好得多，setstate是对整个树进行刷新，也就是app所在当前页的刷新，而Provider却可以对页面中的一小部分进行刷新，可以大大节省app的消耗。下面简单介绍下我们实际项目中对Provider的运用。1、自定义一个ChangeNotifier类classModifyTextNot
2018-09-14 9b7b83ee0c03
2018.09.14親愛的家人們，晚上好！我是刘永波我是一個激情、大爱、有擔當的男人！我在湖北武汉今天是2018年9月14日我們的口號是：TA28，能量大爆發我們的願景是:我/我們承諾創造一個激情、大愛、付出的世界我們的團歌是:迎著風我们的九字箴言是：有我在！28在！冠军在！一、表现成果1,个大家一起，着手汉川2,晚上陪家人小孩二、体验感受1,心态放轻松，抓住好机会，积极的心态。三、学习行的通的是
存档python爬虫、Web学习资料
1python爬虫学习学习Python爬虫是个不错的选择，它能够帮你高效地获取网络数据。下面为你提供系统化的学习路径和建议：1.打好基础首先要掌握Python基础知识，这是学习爬虫的前提。比如：变量、数据类型、条件语句、循环等基础语法。列表、字典等常用数据结构的操作。函数、模块和包的使用方法。文件读写操作。推荐通过阅读《Python编程：从入门到实践》这本书或者在Codecademy、LeetCo
第13天 | openGauss逻辑结构：表管理1 yBmZlQzJ openGauss oracle 数据库
接着昨天继续学习openGauss,今天是第13天了。今天学习内容是学习openGauss表的创建、搜索路径和访问方法。老规矩，先登陆墨天轮为我准备的实训实验室root@modb:~#su-ommomm@modb:~$gsql-r作业要求1.创建一个表（默认，不指定模式），查看该表在那个模式下omm=#createtabletesttable(colvarchar(100));omm=#CREAT
金型人格的修炼蒋沅臻_cb46
姓名～沅臻【日精进打卡第46天】【知～学习】1.耳语练习30分钟NG2.有声阅读文章1篇OK3.看书30分钟OK4.运动30分钟NG5.扫除整理OK【行～实践】一、修身：（对自己个人）1、找爸爸好处第16天。二、齐家：（对家庭和家人）今天上课，没有接到弟弟的电话。三、建功：（对工作）1、经营者传习之旅第一天，今天接受的信息有点多，需要花时间好好消化。2、找到了金型人格的修炼方向。｛积善｝：发愿从2
pyside6使用1 窗体、信号和槽
一、概要由于作者前期很多年都在使用C++和Qt框架进行项目的开发工作，故可以熟练的使用Qt框架。Qt框架在界面设计以及跨平台运用方面，有着巨大的优势，而界面设计恰恰是python的短板，故使用pyside6实现python和Qt的互补。1.1pyside6安装更新pip工具：pipinstall--upgradepip命令行执行如下指令：pipinstallpyside6-ihttps://pyp
20210515成长日记 samantha
1.呼吸法。2.柠檬水，西芹汁，果汁。3.小米粥午餐。4.拆书法学习1）本周的学习,我的目标是什么?了解拆书法,学会拆读一本书。2)整个听课和作业完成的过程中发生了什么?a.听着老师的讲课和完成作业,一层层升级了自己的拆书思维。打开了新的思维,不正确的学习方式让我产生焦虑,追逐干货。大量的听课追逐干货,如果能把这些学到的用到极致就是最大的成长和收获。听课的过程中有陷入知识为中心的思维而去记录老师说
学习PET亲子沟通课第18课：怎样才能让孩子更亲近你刘小小乐乐
美国婚姻辅导专家查普曼博士:总结了爱一个人有五种方式，它们是：肯定的言辞，精心的时刻，礼物，身体的接触，服务的行动。这五种爱的方式称为五种爱语，爱的语言。孩子是爱的五项全能，没有他不擅长的爱语。第18课作业:1.写出家里每一个人的主要爱语。并试一试用这种方式去爱他们一个星期，观察他们的反应以及你们关系的变化。老公:服务的行动，肯定的言辞女儿:肯定的言辞，精心的时刻，礼物，身体的接触。2.你打算以后
跟剽悍一只猫学习收获之知识创富财务自由的社群运营人苏宝
001找一个细分领域，然后在这个领域内做到擅长，做到专业，然后慢慢成为第一。002不断输出自己做到的心得，通过创作内容、提供咨询，创建社群等方式赚钱，提升能力。003帮你的客户成长，帮他们赚到。004注重自己的信誉，专业能力和经验，不断修炼。
7.22学习感悟唐醋里脊学习算法
数组（单一性，有序性，连续性基于内存空间）1）一维数组，定义数据类型都能行除了（void）2）数组内[]元素至少有一个。3）一维数组的引用4）定义这一行只表示类型说明符。5）数组的数组名代表数组的首元素地址6）数组不能整体赋值7）数组小的比数组大的位置靠前（有序性）8）数组的越阶访问。9）计算数组中元素的个数。（1）逆序（2）选择排序：在合适的数组位置上放上合适的数（3）冒泡排序：相邻两个元素核心
如何获取Cookie？？念君思宁 Java注意 java要笑着学 java 开发语言后端 ide
在学习Servlet的时候，我们便学习过如何获取Cookie，我们来回顾以下吧！@RestController@RequestMapping("/param")publicclassParamController{//如何获取Cookie@RequestMapping("/getCookie")publicStringgetCookie(HttpServletRequestrequest){Coo
mysql学习记录7.22 woshishui68892
记录一下在学习mysql时避免忘记的内容。日期计算MySQL提供了一些函数，可用于对日期执行计算，例如，计算年龄或提取部分日期。要确定您的每只宠物几岁，请使用该TIMESTAMPDIFF()功能。它的参数是要表示结果的单位，以及两个日期之间的差值。以下查询为每只宠物显示出生日期，当前日期和年龄（以年为单位）。一个别名（age）是用来制造最终输出列标签更有意义。SELECTname,birth,CU
逻辑函数汤汤grace
打卡第13天今天学习的是逻辑函数看似简单，实则里面蕴含着千万种可能，怎么选怎么用，IF配什么更简单高效，这都是学问。而且这个还要充分的开动小脑筋才能想出来。逻辑值TRUE,FALSE,不难理解，一真一假，平时考试也常遇见这两个大侠，但是，到了EXCEL,他们可会各种变身。比如，True*1,在单元格就会返回“1”，而False*1,就会返回"0".再来谈谈跟逻辑值有关系的函数And：所有条件都为T
305李03days作业#裂变实验室# 李_d891
A账号大数据里加的人B账号精筛选一遍的客户C账号vip客户深度信任客户今天事情有点多，没有好好学习，明天重新写一个补到新作业里。
生活是个大坑 2019_ddd4
早上看到浙大学霸密密麻麻的时间安排表，很受震撼！向他学习。问自己有什么,凭什么可以不够努力。十年是一个坎，07年毕业，2017年一个大坎，差点跨掉，虽然走过去了，但付出了极其惨重的代价！年轻的时候真的是自以为是，被社会大学好好给你上了一课后，摔得够痛，心有余悸。所以我给自己只剩十年的时光，2027年，希望也能平安度过！世上有另外一个世界吗？我是敬畏的。世上有心怀报复的人吗？有，所以面对它，凡事谨慎
python+playwright 学习-91 cookies的获取保存删除相关操作上海-悠悠 playwright python
前言playwright可以获取浏览器缓存的cookie信息，可以将这些cookies信息保存到本地，还可以加载本地cookies。获取cookies相关操作在登录前和登录后分别打印cookies信息，对比查看是否获取成功。fromplaywright.sync_apiimportsync_playwrightwithsync_playwright()asp:browser=p.chromium.
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

python3 学习 Scrapy框架的使用

你可能感兴趣的:(python3 学习 Scrapy框架的使用)