Python新世界

python Scrapy 从零开始学习笔记（一）

Scrapy 官方网址： https://docs.scrapy.org/en/latest/

Scrapy 中文网址： https://scrapy-chs.readthedocs.io/zh_CN/latest/index.html

Scrapy 框架

很多人学习python，不知道从何学起。
很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。
很多已经做案例的人，却不知道如何去学习更加高深的知识。
那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！
QQ群：1097524789

Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。
框架的力量，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片，非常之方便。
Scrapy 使用了 Twisted ['twɪstɪd] (其主要对手是Tornado)异步网络框架来处理网络通讯，可以加快我们的下载速度，不用自己去实现异步框架，并且包含了各种中间件接口，可以灵活的完成各种需求。

Scrapy架构图(绿线是数据流向)：

Scrapy Engine(引擎) : 负责 Spider 、 ItemPipeline 、 Downloader 、 Scheduler 中间的通讯，信号、数据传递等。
Scheduler(调度器) : 它负责接受 引擎 发送过来的Request请求，并按照一定的方式进行整理排列，入队，当 引擎 需要时，交还给 引擎 。
Downloader（下载器） ：负责下载 Scrapy Engine(引擎) 发送的所有Requests请求，并将其获取到的Responses交还给 Scrapy Engine(引擎) ，由 引擎 交给 Spider 来处理，
Spider（爬虫） ：它负责处理所有Responses,从中分析提取数据，获取Item字段需要的数据，并将需要跟进的URL提交给 引擎 ，再次进入 Scheduler(调度器) ，
Item Pipeline(管道) ：它负责处理 Spider 中获取到的Item，并进行进行后期处理（详细分析、过滤、存储等）的地方.
Downloader Middlewares（下载中间件） ：你可以当作是一个可以自定义扩展下载功能的组件。
Spider Middlewares（Spider中间件） ：你可以理解为是一个可以自定扩展和操作 引擎 和 Spider 中间 通信 的功能组件（比如进入 Spider 的Responses;和从 Spider 出去的Requests）

以上是 Scrapy 的架构图，从流程上看还是很清晰的，我就只简单的说一下，首先从红色方框的 Spider 开始，通过引擎发送给调度器任务，再将请求任务交给下载器并处理完后返回结果给 Spider，最后将结果交给关到来处理我们的结果就可以了。

上面的话可能还是会有些拗口，在接下来我们会一点点进行剖析，最后会发现利用 Scrapy 框架来做爬虫是如此简单。

Scrapy的安装

windows 安装 pip install scrapy

Mac 安装 sudo pip install scrapy

pip 升级 pip install --upgrade pip

本人目前使用的是Mac电脑，目前使用的是 python3 版本，内容上其实都大同小异，如遇系统或版本问题可及时联系，互相学习！

安装完成后我们在终端输出 Scrapy 即可安装是否成功：

新建项目

在 Scrapy 安装成功之后，我们就需要用它来开发我们的爬虫项目了，进入自定义的项目目录中，运行下列命令：

scrapy startproject spiderDemo

运行上面的命令行就会在我们项目目录下生成一下目录结构：

下面来简单介绍一下各个主要文件的作用：

scrapy.cfg ：项目的配置文件
scrapyDemo/ ：项目的Python模块，将会从这里引用代码
scrapyDemo/items.py ：项目的目标文件
scrapyDemo/middlewares.py ：项目的中间件文件
scrapyDemo/pipelines.py ：项目的管道文件
scrapyDemo/settings.py ：项目的设置文件
scrapyDemo/spiders/ ：存储爬虫代码目录

接下来我们对各文件里的内容简单说一下，里面的代码目前都是最简单的基本代码，在接下来做案例的时候我们会再有针对地对文件做一下解释。

其中的 __init_.py 文件内容都是空的，但是却不能删除掉，否则项目将无法启动。

spiderDemo/items.py

 1 # -*- coding: utf-8 -*-
 2 
 3 # Define here the models for your scraped items
 4 #
 5 # See documentation in:
 6 # https://docs.scrapy.org/en/latest/topics/items.html
 7 
 8 import scrapy
 9 
10 
11 class ScrapydemoItem(scrapy.Item):
12     # define the fields for your item here like:
13     # name = scrapy.Field()
14     pass

该文件是用来定义我们通过爬虫所获取到的有用的信息，即 scrapy.Item

scrapyDemo/middlewares.py

  1 # -*- coding: utf-8 -*-
  2 
  3 # Define here the models for your spider middleware
  4 #
  5 # See documentation in:
  6 # https://docs.scrapy.org/en/latest/topics/spider-middleware.html
  7 
  8 from scrapy import signals
  9 
 10 
 11 class ScrapydemoSpiderMiddleware(object):
 12     # Not all methods need to be defined. If a method is not defined,
 13     # scrapy acts as if the spider middleware does not modify the
 14     # passed objects.
 15 
 16     @classmethod
 17     def from_crawler(cls, crawler):
 18         # This method is used by Scrapy to create your spiders.
 19         s = cls()
 20         crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
 21         return s
 22 
 23     def process_spider_input(self, response, spider):
 24         # Called for each response that goes through the spider
 25         # middleware and into the spider.
 26 
 27         # Should return None or raise an exception.
 28         return None
 29 
 30     def process_spider_output(self, response, result, spider):
 31         # Called with the results returned from the Spider, after
 32         # it has processed the response.
 33 
 34         # Must return an iterable of Request, dict or Item objects.
 35         for i in result:
 36             yield i
 37 
 38     def process_spider_exception(self, response, exception, spider):
 39         # Called when a spider or process_spider_input() method
 40         # (from other spider middleware) raises an exception.
 41 
 42         # Should return either None or an iterable of Request, dict
 43         # or Item objects.
 44         pass
 45 
 46     def process_start_requests(self, start_requests, spider):
 47         # Called with the start requests of the spider, and works
 48         # similarly to the process_spider_output() method, except
 49         # that it doesn’t have a response associated.
 50 
 51         # Must return only requests (not items).
 52         for r in start_requests:
 53             yield r
 54 
 55     def spider_opened(self, spider):
 56         spider.logger.info('Spider opened: %s' % spider.name)
 57 
 58 
 59 class ScrapydemoDownloaderMiddleware(object):
 60     # Not all methods need to be defined. If a method is not defined,
 61     # scrapy acts as if the downloader middleware does not modify the
 62     # passed objects.
 63 
 64     @classmethod
 65     def from_crawler(cls, crawler):
 66         # This method is used by Scrapy to create your spiders.
 67         s = cls()
 68         crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
 69         return s
 70 
 71     def process_request(self, request, spider):
 72         # Called for each request that goes through the downloader
 73         # middleware.
 74 
 75         # Must either:
 76         # - return None: continue processing this request
 77         # - or return a Response object
 78         # - or return a Request object
 79         # - or raise IgnoreRequest: process_exception() methods of
 80         #   installed downloader middleware will be called
 81         return None
 82 
 83     def process_response(self, request, response, spider):
 84         # Called with the response returned from the downloader.
 85 
 86         # Must either;
 87         # - return a Response object
 88         # - return a Request object
 89         # - or raise IgnoreRequest
 90         return response
 91 
 92     def process_exception(self, request, exception, spider):
 93         # Called when a download handler or a process_request()
 94         # (from other downloader middleware) raises an exception.
 95 
 96         # Must either:
 97         # - return None: continue processing this exception
 98         # - return a Response object: stops process_exception() chain
 99         # - return a Request object: stops process_exception() chain
100         pass
101 
102     def spider_opened(self, spider):
103         spider.logger.info('Spider opened: %s' % spider.name)

该文件为中间件文件，名字后面的s表示复数，说明这个文件里面可以放很多个中间件，我们用到的中间件可以在此定义

spiderDemo/pipelines.py

 1 # -*- coding: utf-8 -*-
 2 
 3 # Define your item pipelines here
 4 #
 5 # Don't forget to add your pipeline to the ITEM_PIPELINES setting
 6 # See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html
 7 
 8 
 9 class ScrapydemoPipeline(object):
10     def process_item(self, item, spider):
11         return item

该文件俗称管道文件，是用来获取到我们的Item数据，并对数据做针对性的处理。

scrapyDemo/settings.py

 1 # -*- coding: utf-8 -*-
 2 
 3 # Scrapy settings for scrapyDemo project
 4 #
 5 # For simplicity, this file contains only settings considered important or
 6 # commonly used. You can find more settings consulting the documentation:
 7 #
 8 #     https://docs.scrapy.org/en/latest/topics/settings.html
 9 #     https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
10 #     https://docs.scrapy.org/en/latest/topics/spider-middleware.html
11 
12 BOT_NAME = 'scrapyDemo'
13 
14 SPIDER_MODULES = ['scrapyDemo.spiders']
15 NEWSPIDER_MODULE = 'scrapyDemo.spiders'
16 
17 
18 # Crawl responsibly by identifying yourself (and your website) on the user-agent
19 #USER_AGENT = 'scrapyDemo (+http://www.yourdomain.com)'
20 
21 # Obey robots.txt rules
22 ROBOTSTXT_OBEY = True
23 
24 # Configure maximum concurrent requests performed by Scrapy (default: 16)
25 #CONCURRENT_REQUESTS = 32
26 
27 # Configure a delay for requests for the same website (default: 0)
28 # See https://docs.scrapy.org/en/latest/topics/settings.html#download-delay
29 # See also autothrottle settings and docs
30 #DOWNLOAD_DELAY = 3
31 # The download delay setting will honor only one of:
32 #CONCURRENT_REQUESTS_PER_DOMAIN = 16
33 #CONCURRENT_REQUESTS_PER_IP = 16
34 
35 # Disable cookies (enabled by default)
36 #COOKIES_ENABLED = False
37 
38 # Disable Telnet Console (enabled by default)
39 #TELNETCONSOLE_ENABLED = False
40 
41 # Override the default request headers:
42 #DEFAULT_REQUEST_HEADERS = {
43 #   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
44 #   'Accept-Language': 'en',
45 #}
46 
47 # Enable or disable spider middlewares
48 # See https://docs.scrapy.org/en/latest/topics/spider-middleware.html
49 #SPIDER_MIDDLEWARES = {
50 #    'scrapyDemo.middlewares.ScrapydemoSpiderMiddleware': 543,
51 #}
52 
53 # Enable or disable downloader middlewares
54 # See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
55 #DOWNLOADER_MIDDLEWARES = {
56 #    'scrapyDemo.middlewares.ScrapydemoDownloaderMiddleware': 543,
57 #}
58 
59 # Enable or disable extensions
60 # See https://docs.scrapy.org/en/latest/topics/extensions.html
61 #EXTENSIONS = {
62 #    'scrapy.extensions.telnet.TelnetConsole': None,
63 #}
64 
65 # Configure item pipelines
66 # See https://docs.scrapy.org/en/latest/topics/item-pipeline.html
67 #ITEM_PIPELINES = {
68 #    'scrapyDemo.pipelines.ScrapydemoPipeline': 300,
69 #}
70 
71 # Enable and configure the AutoThrottle extension (disabled by default)
72 # See https://docs.scrapy.org/en/latest/topics/autothrottle.html
73 #AUTOTHROTTLE_ENABLED = True
74 # The initial download delay
75 #AUTOTHROTTLE_START_DELAY = 5
76 # The maximum download delay to be set in case of high latencies
77 #AUTOTHROTTLE_MAX_DELAY = 60
78 # The average number of requests Scrapy should be sending in parallel to
79 # each remote server
80 #AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
81 # Enable showing throttling stats for every response received:
82 #AUTOTHROTTLE_DEBUG = False
83 
84 # Enable and configure HTTP caching (disabled by default)
85 # See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
86 #HTTPCACHE_ENABLED = True
87 #HTTPCACHE_EXPIRATION_SECS = 0
88 #HTTPCACHE_DIR = 'httpcache'
89 #HTTPCACHE_IGNORE_HTTP_CODES = []
90 #HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'

该文件为我们的设置文件，一些基本的设置需要我们在此文件中进行配置，如我们的中间件文件当中的两个类 ScrapydemoSpiderMiddleware，ScrapydemoDownloaderMiddleware 在 settings.py 中就能找到。

在 settings 文件中，我们常会配置到如上面的字段如：ITEM_PIPELINES（管道文件），DEFAULT_REQUEST_HEADERS（请求报头），DOWNLOAD_DELAY（下载延迟）

，ROBOTSTXT_OBEY（是否遵循爬虫协议）等。

本章我们就先简单的介绍一下 scrapy 的基本目录，下一章我们来根据 scrapy 框架实现一个爬虫案例。

很遗憾的说，推酷将在这个月底关闭。人生海海，几度秋凉，感谢那些有你的时光。

手艺人土狼豆
土狼手艺人，现在越来越少了。代替手艺人的是机器。机器实现了产业化规模化。但是机器代替不人的那份情意。一件物品，不单是本身的价值。而是它内在的涵养和追求得完美主义。现在的高科技很多，但它就是做不出老祖宗留下的东那点物品。
【做好当下事】晨萱的后花园
有时候有些事情你不去做，永远不知道自己的潜能在哪里，2020年重点将自己的个人能力放在提升成长上面，分为三个方面！一、演讲目前在这方面做的还不是很优秀，还不能做到，开口就来。二、写作写作目前谈不上，最多只是一个记录的习惯，坚持让自己的输入倒逼自己输出。三、德行每天有意识的反思自己的身，语，意！
每个人心中都应该有个夏摩山谷雁旋
图片发自App安妮宝贝是很多人喜欢的作家，但是我并没有读过她的作品，除了《夏摩山谷》。我于是在网上查了下她的简介。1998年署下笔名安妮宝贝，开始在网络上写作，发表《告别薇安》、《七年》、《七月和安生》，并成名。2014年6月，安妮宝贝在她个人的微博上宣布，“安妮宝贝”改笔名为“庆山”。她的作品主要以流浪、宿命、漂泊为题材，描写现代都市人的生活及精神状况。初看这本书的封面，清淡温煦，一侧书边伸出两
所思所想羽_6715
1.时常在思考一个问题，如果我们现在活在一个梦里会怎么样，我们在梦中过着平凡的一生。然后在某天惊醒，发现我们所思所想不过是梦一场。2.每次看小说，如果是悲剧，喜欢先看结局，如果结局能够接受，再看中间的部分，害怕结局不好，在过程中被虐。如果我从生命开始，我就知道了自己的结局，那我会怎样度过。3.朋友说，我们不管怎么选择，都殊途同归，最终都是一杯黄土，那么短短的一辈子，我们为什么不按照自己喜欢的样子度
599元就能给你一款小程序？发财北小程序
现在各大平台是不是总能看到“599即可开发一款小程序”这类相似的广告？上一篇我总结了一下开发一款小程序大概的成本，今天，我就解读一下所谓的低成本小程序：“599元做个小程序”——这样的宣传在互联网上并不少见，尤其对初创企业、小商家来说，低价的吸引力不言而喻。但面对这样的报价，不少人心里会打鼓：这个价格真的可信吗？能做出满足需求的小程序吗？其实，低价背后往往藏着复杂的逻辑，既不能一概而论“可信”，也
老板让我介绍一下公司发财北小程序产品运营内容运营矩阵大数据
11年深耕，从源头定义系统开发的“放心之选”在数字经济加速奔跑的今天，一套稳定、高效、贴合业务的系统，早已成为企业破局增长的“核心引擎”。而选择什么样的开发伙伴，直接决定了这套引擎的“动力上限”。我们，一家拥有11年系统开发经验的源头开发商，始终坚信：真正的技术服务，不仅要“能做”，更要“做好”“做透”。全场景覆盖，从需求到落地无缝衔接11年的行业浸润，让我们深谙不同企业的数字化痛点。无论是想抢占
开发小程序到底需要投入多少？发财北营销小程序产品运营
想开发小程序，却被价格搞得一头雾水？今天就给大家详细剖析下开发个小程序到底要多少钱✨开发方式决定基础价格-模板开发：最具性价比的选择，价格通常在1500-6000元左右。开发周期短，能快速上线。但功能和设计相对固定，个性化程度低，就像买了个精装修的样板房，格局基本不能大改。适合展示类的基础需求，如简单的企业介绍小程序。-SaaS模式：按年收费，费用从几千元到几万元不等。提供一站式解决方案，部署和维
《认知觉醒•开启自我改变的原动力》第30天P196～205 正念阳光
❤️只学让自己触动的在阅读时，我唯一要做的事情就是：寻找触动点。我会在触动自己的地方做标记，在空白处写下大量能联想到的思考，书读完之后，我会放上几天，然后问自己：“这本书最触动自己的是哪个点？”这个点可以是一个理论、一个案例，甚至是一句话，只要它真正触动我，并能让我发生真实的改变，我就认为这本书超值了，至于其他，忘记就忘记了，我一点也不觉得可惜。而作者的知识体系和框架，又与我何干呢？❤️触动点。联
Python 报错：ModuleNotFoundError: No module named ‘Crypto‘
Crypto报错解决方案Python报错：ModuleNotFoundError:Nomodulenamed'Crypto'前言问题解决方案Python报错：ModuleNotFoundError:Nomodulenamed‘Crypto’前言Crypto是一个加密模块，它包含了多种加密算法，如AES、DES、RSA等。它不是Python标准库的一部分，需要使用pip安装。pycrypto和Cry
【WPF】自定义ScrollViewer中遇到的Name坑——“Name=PART_XXX” _hmdyc WPF
项目中遇到自定义ScrollViewer的需求，修改滑块样式，隐藏滑块边框。实现该功能的代码很容易找到，但是我在实现过程中遇到这样一个问题：鼠标无法拖动滑块。代码如下（修改后）：<ScrollBarx:Name="PART_VerticalScrollBar"HorizontalAlignment="Right"Maximum="{TemplateBindingScrollableHeight}"
【C#】C# 事件两次 -= 会怎么样？
在C#中，事件（event）的+=和-=运算符用于添加和移除事件处理器（delegate）。以下是两次-=和+=的具体行为：两次-=（移除）示例代码：MyEvent-=Handler;MyEvent-=Handler;行为：第一次-=：如果Handler存在于事件列表中，它会被移除一次。第二次-=：如果此时Handler已不在事件中，则不会抛异常，也不会有任何效果。✅是安全的，即使事件处理器已经不
祥汇决赛预备群龙祥免费荐股有猫腻，参加爱心慈善会CTB慈善投票不能提现可处理！反诈宣传中
自古有句话讲得好“人善被欺、马善被骑”，现如今也是被骗子利用到了极致，人善就真该被欺骗吗？最近狡猾的骗子们就利用到了这点，利用同情心、爱心去进行诈骗，宣传公益捐款、爱心慈善打比赛来骗取资金！民丰书院假冒杨伟民打字慈善投票的名义行骗现在杀猪盘套路已经更新，俗话说舍不得孩子套不住狼，为你套路你的大资金，骗子煞会苦心。前期送一万体验金让你操作，还故意让你提现到账。但是你大资金一旦进入就各种借口不让提现。
【新书】《重活一世，老公如愿追求真爱却后悔了小说》叶北川王乐欢重活一世，老公如愿追求真爱却后悔了小说全文全章节阅读花朵文库
【新书】《重活一世，老公如愿追求真爱却后悔了小说》叶北川王乐欢重活一世，老公如愿追求真爱却后悔了小说全文全章节阅读主角配角：叶北川王乐欢小说别名：和叶北川在回去离婚的飞机上，我们双双遇难。飞机失事前他说：“如果能重来，我要和王乐欢结婚，和她在一起，我才感觉到生命是鲜活的。”和叶北川在回去离婚的飞机上，我们双双遇难。飞机失事前他说：“如果能重来，我要和王乐欢结婚，和她在一起，我才感觉到生命是鲜活的。
观心自在爱分享 235 菲儿_bd75
宇宙法则：（接前一天的分享）三、缘起定律：宇宙万事万物万法皆是相互缘起，互为因缘，因加缘就等于果，这就是缘起规律，比如我们的氧气，氧原子是个元素，它并不是气体，但是两个氧原子就变成了氧气，当两个氧原子在一起就缘起了我们呼吸的这个气体，而当三个氧原子在一起的时候就缘起了臭氧，就有臭味。缘起很不可思议，比如我们吃饭需要各种营养，不能只吃单一的食物，摄取单一的营养是不健康的，很不健康，这也是缘起，那人，
在 WPF 启动界面中心加载 GIF 动图上元星如雨 C#&Godot wpf
在WPF启动界面中心加载GIF动图在WPF启动界面中心加载GIF动图可以通过多种方式实现。下面我将提供一个完整的解决方案，包括使用第三方库和纯WPF实现两种方法。方法一：使用WpfAnimatedGif库（推荐）这是最简单可靠的方法，使用专门处理GIF动画的库。实现步骤：安装NuGet包Install-PackageWpfAnimatedGif创建启动窗口(SplashScreen.xaml)在代
我那年才十八岁四季红小龙
记得17岁那年，第一次和她接吻，快亲上的时候，她突然说等一下，我就纳闷了，她要干嘛?只见她小心翼翼地从兜里拿出三个糖，就上好佳那种圆的，草莓苹果和荔枝味的，她让我挑一个喜欢的，我指了一下那个荔枝的，然后问她干嘛?她二话不说，马上撕开糖纸，就把那颗糖给吃了，然后一把扯过我的脖子，我俩就接吻了，全程一股荔枝味。后来她跟我说，人生那么长，我没有自信能让你记住我，但是你既然喜欢吃荔枝味的糖我只能让你记住我
广州最全亲子鉴定收费费用标准大全(附2024年最新报价）中量国鉴
广州亲子鉴定收费多少钱？在广州办理亲子鉴定时，费用是一个重要的因素，广州市亲子鉴定费用在2000-4500元左右。然而，亲子鉴定的费用因地区、鉴定机构、鉴定类型、参与人数及是否需要加急等多种因素而有所不同。因此，了解这些影响因素对估算费用至关重要。以下是对亲子鉴定费用的详细分析。广州亲子鉴定中心：182-1818-9078(点击预约)广州亲子鉴定多少钱?广州市亲子鉴定费用在2000-4500元左右
【甲烷数据集】Sentinel-5P 卫星获取的全球甲烷数据集-TROPOMI L2 CH₄ WW、forever 数据集 sentinel
目录数据概述传感器&卫星信息监测目标：甲烷（CH₄）数据产品内容空间与时间覆盖云筛选与协同观测技术文档资源数据下载Python代码绘制CH4数据参考数据概述Sentinel-5PrecursorLevel2Methane(TROPOMIL2CH₄)数据集是由欧洲哥白尼计划的Sentinel-5P卫星获取的，用于监测大气中的甲烷浓度。数据集名称：Sentinel-5PrecursorLevel2Me
走进5G时代的音视频开发 Linux高级开发 IT
音频的基础知识1采样和采样频率：现在是数字时代，在音频处理时要先把音频的模拟信号变成数字信号，这叫A/D转换。要把音频的模拟信号变成数字信号，就需要采样。一秒钟内采样的次数称为采样频率2采样位数/位宽：数字信号是用0和1来表示的。采样位数就是采样值用多少位0和1来表示，也叫采样精度，用的位数越多就越接近真实声音。如用8位表示，采样值取值范围就是-128~127，如用16位表示，采样值取值范围就是-
WPF——为ListBox的Items设置布局面板 Paddi_z WPF C#wpf c#xaml listbox
自定义ListBox的控件面板在默认情况下，ListBox的子项目显示类似于默认的StackPanel，在水平方向为Strench垂直方向进行堆叠.而有时候，为了控制子元素的布局方式，需要自定义ListBox的内部面板，例如为了实现下面的效果可以看到，上面采用的是双列布局，实际上用的是UniformGrid控件作为ListBox的内部面板，因此，对于绑定的数据集合，就相当于是在一个UniformG
时间根本用不过来 30度以南
学了一上午的英语做了一下午的图书馆骑个车回来已经8:30本来想工作结果已经11点了真的忙忙的没有时间思考人生很好
WPF——专用枚举器ListBox和ComboBox 寒冰屋 CSharp.NET wpf
目录介绍提供了什么本地定义的枚举器代码EnumItemList集合和EnumItem集合项附加属性使用代码结束语下载控件-141.8KB介绍几天前，我发布了这篇文章，其中描述了一种创建可观察的枚举器值集合的方法，以供在WPF应用程序中使用。在本文中，我将把这个想法带入一个更高的逻辑层次——创建专用于允许选择枚举器值的列表控件。最初的想法是为控件提供对C＃中任何System枚举器的支持。这当然足够了
LangChain 源码剖析（二）：LangChain 流程编排的核心骨架——Chain 基类源码剖析 ATM006 人工智能 langchain 大模型 Agent
每一篇文章都短小精悍，不啰嗦。在LangChain框架中，Chain是连接各种组件（模型、工具、数据库等）的核心骨架，负责将多个步骤按逻辑串联成可执行的工作流。无论是简单的「提问-回答」流程，还是复杂的「检索-思考-工具调用」pipeline，都依赖Chain基类提供的基础能力。本文将从架构设计、核心功能到实现细节，全面解析这一基类的设计智慧。一、架构定位：为什么需要Chain基类？Chain基类
MetaGPT源码剖析（一）：MetaGPT框架下的多智能体协作项目——software_company.py ATM006 开源Agent框架机器智能人工智能大模型源码剖析 Agent MetaGPT
每一篇文章都短小精悍，不啰嗦。software_company.py这段代码是一个基于Typer构建的命令行工具，用于启动MetaGPT框架下的多智能体协作项目（比如生成软件项目、完成开发任务等）。它就像一个"项目启动器"，允许用户通过命令行参数配置项目需求、资源投入等，进而调度不同角色的智能体（如产品经理、架构师、工程师等）协同工作。一、代码整体功能与定位从架构视角看，这段代码是MetaGPT框
京东返利app叫什么?京东返现的软件叫什么名字? 古楼
随着科技的发展和互联网的普及，网上购物已经成为了人们日常生活中不可或缺的一部分。在众多电商平台上，京东作为我国知名的企业之一，吸引了大量消费者。而在京东购物，您是否想过有一种方式可以让您在享受优惠的同时还能拿到返利呢？今天，就让我来为您揭秘京东返利App的秘密！我们要明确一点：京东返利App并不是京东官方推出的。那么，这个神秘的App究竟是什么呢？月入十万必看！都在挣钱！推荐几个月入几千到几万的靠
Java 重写(Override)与重载(Overload) 啊玄呐
重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。方法的重写规则：▣参数列表必须完全与被重写方法的相同。▣返回类型与被重写方法的返回类型可以不相同，但是必须是父类返回值的派生类▣访问权限不能比父类中被重写的方法的访问权限更低。例如：如果父类的一个方法被声明为public，那么在子类中重写该方法就不能声明为protected。▣父类的成员方法只能
历史悬疑之阿房宫是不是项羽烧的叶之林
大家好我是叶之林，今天为大家，了解，分析，阿房宫是不是项羽烧的，喜欢的话点点关注，谢谢史书记载，西楚霸王项羽进入咸阳后，看到如此奢华的秦朝暴君享乐之所，心中大怒，一把火烧了阿房宫。从此人们一直认为阿房宫是项羽烧的，但现在不断有人指出，项羽烧的是秦始皇在咸阳的宫室建筑，而不是阿房宫，项羽究竟有没有烧阿房宫呢，如果没有烧过，那规模宏大的阿房宫又到那里去了，为何消失了呢？唐代著名诗人杜牧在(阿房宫赋)中
欧米茄海马300复刻表多少钱(海马300复刻表价格一览表) 潮品会
欧米茄海马300系列腕表作为欧米茄品牌的经典之作，凭借其卓越的品质、精湛的工艺和时尚的设计，一直备受钟表爱好者的青睐。然而，正品海马300的价格往往较为昂贵，因此，市场上出现了各种复刻表，以满足不同消费者的需求微信:52226813(下单赠送精美礼品)那么，欧米茄海马300复刻表到底多少钱呢？一、价格区间概述欧米茄海马300复刻表的价格因材质、工艺、功能以及复刻程度的不同而有所差异。一般来说，复刻
威海可以做正规亲子鉴定机构大全(附2024权威中心机构名单) 国医基因周主任
威海哪里可以做亲子鉴定？威海市环翠区和平路70号可以做亲子鉴定，为了方便快速找到威海亲子鉴定机构地址，小编特意整理了威海亲子鉴定机构名单供您参考，共有14家正规鉴定机构，排名不分先后。机构推荐如下：注：各鉴定机构的鉴定类别不一样。威海国医基因DNA亲子鉴定中心：威海市环翠区和平路70号威海亲子鉴定机构：1、威海国医基因DNA亲子鉴定中心机构地址：威海市环翠区和平路70号业务范围：个人（隐私）亲子鉴
C# 上位机开发进阶：利用 WinForms 与 WPF 创建智能化工业控制系统威哥说编程 c#wpf 开发语言
随着工业自动化和智能制造的不断发展，上位机系统作为人与机器之间的重要桥梁，已成为工业控制系统中不可或缺的一部分。在上位机系统开发中，C#提供了强大的开发框架，尤其是WinForms和WPF，两者在创建高效、智能化的工业控制系统中扮演着重要角色。本文将深入探讨如何利用C#中的WinForms和WPF构建智能化的工业控制系统，从界面设计、实时数据处理、设备通信协议到性能优化的全面技术方案，助力开发者提
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

python Scrapy 从零开始学习笔记（一）

Scrapy 框架

Scrapy架构图(绿线是数据流向)：

Scrapy的安装

新建项目

你可能感兴趣的:(python Scrapy 从零开始学习笔记（一）)