我是一片小树叶

Python开发简单爬虫

慕课网上《Python开发简单爬虫》课程个人总结笔记，侵删。
慕课网视频课程链接：https://www.imooc.com/learn/563

一、课程介绍

开发轻量级爬虫（不需要登陆的静态网络）
内容包含：爬虫简介、爬虫简单架构
架构三大模块：URL管理器、网页下载器、网页解析器
完整示例：爬取百度百科Python词条相关的1000个页面数据

二、爬虫简介及爬虫的技术价值

2.1 爬虫是什么？
自动抓取互联网信息的程序

2.2 爬虫技术的价值？
互联网数据，为我所用。
做出产品：新闻聚合阅读器、爆笑故事APP等

三、简单爬虫架构

3.1 Python爬虫架构
包含：爬虫调度端、URL管理器、网页下载器、网页解析器
爬虫调度端：启动爬虫、调度爬虫、监视爬虫
URL管理器：未爬虫的URL和已爬虫的URL的管理
网页下载器：从URL管理器中取出未爬虫的URL，网页下载存储成字符串
网页解析器：解析字符串得到价值信息，得到新的URL添加到URL管理器

3.2 Python爬虫架构的动态运行流程
调度器询问URL管理器是否有待爬取的YRL，返回是和否
如果是，则取出一个待爬取的URL，传送给下载器
下载器下载完毕后，将URL内容传给调度器
调度器将URL内容传给解析器解析URL内容
解析器解析完毕后，将价值数据和新URL列表返回给调度器
调度器手机价值数据给应用，并新增URL到待爬取URL

四、URL管理器和实现方法

4.1 Python爬虫URL管理
管理待抓取的URL集合和已抓取的URL集合
防止重复抓取和循环抓取

URL管理器支持以下功能：
添加新URL到待爬取集合中
判断待添加URL是否在容器中
判断是否还有待爬取URL
获取待爬取URL
将URL从待爬取移动到已爬取

4.2 Python爬虫URL管理器的实现方式
内存：Python、set()
关系数据库：MySQL、urls
缓存数据库：redis、set

五、网页下载器和urlib2模块

5.1 Python爬虫网页下载器简介
将互联网上URL对应的网页下载到本地的工具
将URL对应的互联网以HTML下载到本地存储成本地文件
下载器种类：urllib2、requests

5.2 Python爬虫urlib2下载器网页的三种方法
方法一：urllib2.urlopen(url)
方法二：data、http header
方法三：HTTPCookieProcessor

5.3 Python爬虫urlib2实例代码演示
已修改为python3.x的代码

# _*_ coding:utf8 _*_

import urllib.request
import http.cookiejar

url = "http://www.baidu.com"

print ('first way')
response1 = urllib.request.urlopen(url)
print (response1.getcode())
print (len(response1.read()))

print ('second way')
request = urllib.request.Request(url)
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(url)
print (response2.getcode())
print (len(response2.read()))

print ('third way')
cj = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print (response3.getcode())
print (len(response3.read()))
print (cj)
print (response3.read())

六、网页解析器和BeautifulSoup第三方模块

6.1 Python爬虫网页解析器简介
从网页中提取有价值数据的工具
以下载好的Html网页字符串为输入，获取价值数据和新URL列表
类型：正则表达式（模糊匹配）、html.parser、BeautifulSoup、lxml（结构化解析）
结构化解析：DOM（Document Object Model）树

6.2 BeautifulSoup模块介绍和安装
Python第三方库，用于从HTML;或XML中提取数据
官网：https://www.crummy.com/software/BeautifulSoup/
安装：pip install beautifulsoup4
测试：import bs4

6.3 BeautifulSoup的语法
创建BeautifulSoup对象、搜索节点find_all与find、访问节点名称属性文字

 Python 
节点名称：a
节点属性：href='123.html'
节点属性：class='article_link'
节点内容：Python

语法：

1、创建BeautifulSoup对象
    from bs4 import BeautifulSoup
    soup = BeautifulSoup(
                         html_doc,               #HTML文档字符串
                         'html.parser'           #HTML解析器
                         from_encoding='utf8'    #HTML文档的编码
                         )


2、搜索节点（find_all,find）
    #方法：find_all(name,attrs,string)

    #查找所有标签为a的节点
    soup.find_all('a')

    #查找所有标签为a，连接符合/view/123.htm形式的节点
    soup.find_all('a',href='/view/123.htm')
    soup.find_all('a',href=re.compile(r'/view/\d+\.htm))

    #查找所有标签为div，class为abc，文字为Python的节点
    soup.find_all('div',class_='abc',string='Python')


3、访问节点信息
    #得到节点：Python

    #获取查找到的a节点的标签名称
    node.name

    #获取查找到的a节点的href属性
    node['href']

    #获取查找到的a节点的链接文字
    node.get_text()

6.4 BeautifulSoup实例测试

# _*_ coding:utf8 _*_

from bs4 import BeautifulSoup
import re

html_doc = """
The Dormouse's story

The Dormouse's story

Once upon a time there were three little sisters; and their names were
Elsie,
Lacie and
Tillie;
and they lived at the bottom of a well.

...
"""

soup = BeautifulSoup(html_doc,'html.parser',from_encoding='utf-8')

print ('get all links')
links = soup.find_all('a')
for link in links:
    print (link.name,link['href'],link.get_text())


print ('get link of lacie')
link_node = soup.find('a',href='http://example.com/lacie')
print (link_node.name,link_node['href'],link_node.get_text())


print ('regular match')
link_node = soup.find('a',href=re.compile(r"ill"))
print (link_node.name,link_node['href'],link_node.get_text())

print ('get text of p')
p_node = soup.find('p',class_="title")
print (p_node.name,p_node.get_text())

七、实战演练-爬取百度百科1000个页面的数据

7.1 Python爬虫实例-分析目标
流程：确定目标、分析目标、编写代码、执行爬虫
分析目标：URL格式、数据格式、网页编码

目标：百度百科Python词条相关词条网页-标题和简介
入口页：https://baike.baidu.com/item/Python/407313
URL格式：/item/源代码/3969
数据格式：***
简介：***
页面编码：UTF-8

7.2 调度程序

class SpiderMain(object):
    def __init__(self):
        self.urls = UrlManager()
        self.downloader = HtmlDownloader()
        self.parser = HtmlParser()
        self.outputer = HtmlOutputer()
    def craw(self,root_url):
        count = 1
        self.urls.add_new_url(root_url)
        while self.urls.has_new_url():
            try:
                new_url = self.urls.get_new_url()
                print ('craw %d: %s' % (count,new_url))
                html_cont = self.downloader.download(new_url)
                new_urls,new_data = self.parser.parse(new_url,html_cont)
                self.urls.add_new_urls(new_urls)
                self.outputer.collect_data(new_data)
                if count == 1000:
                    break
                count = count + 1
            except:
                print ('craw failed')
        self.outputer.output_html()


if __name__ == "__main__":
    root_url = "https://baike.baidu.com/item/python/407313"
    obj_spider = SpiderMain()
    obj_spider.craw(root_url)

7.3 URL管理器

class UrlManager(object):
    def __init__(self):
        self.new_urls = set()
        self.old_urls = set()
    def add_new_url(self,url):
        if url is None:
            return
        if url not in self.new_urls and url not in self.old_urls:
            self.new_urls.add(url)
    def add_new_urls(self,urls):
        if urls is None or len(urls) == 0:
            return
        for url in urls:
            self.add_new_url(url)
    def has_new_url(self):
        return len(self.new_urls) != 0
    def get_new_url(self):
        new_url = self.new_urls.pop()
        self.old_urls.add(new_url)
        return new_url

7.4 HTML下载器html_downloader

class HtmlDownloader(object):
    def download(self,url):
        if url is None:
            return None
        response = urllib.request.urlopen(url,timeout=1)
        if response.getcode() != 200:
            return None
        return response.read()

7.5 HTML解析器html_parser

class HtmlParser(object):
    def _get_new_urls(self,page_url,soup):
        new_urls = set()
        #/%s/%d
        links = soup.find_all('a',href=re.compile(r"/item/%"))
        for link in links:
            new_url = link['href']
            new_full_url = urllib.parse.urljoin(page_url,new_url)
            new_urls.add(new_full_url)
        return new_urls
    def _get_new_data(self,page_url,soup):
        res_data = {}
        #url
        res_data['url'] = page_url
        # Python
        title_node = soup.find('dd',class_="lemmaWgt-lemmaTitle-title").find("h1")
        res_data['title'] = title_node.get_text()
        #
        summary_node = soup.find('div',class_="lemma-summary")
        res_data['summary'] = summary_node.get_text()
        return res_data
    def parse(self,page_url,html_cont):
        if page_url is None or html_cont is None:
            return
        soup = BeautifulSoup(html_cont,'html.parser',from_encoding='utf-8')
        new_urls = self._get_new_urls(page_url,soup)
        new_data = self._get_new_data(page_url,soup)
        return new_urls,new_data

7.6 HTML输出器

class HtmlOutputer(object):
    def __init__(self):
        self.datas = []
    def collect_data(self,data):
        if data is None:
            return
        self.datas.append(data)
    def output_html(self):
        fout = open('output.html','w',encoding="utf-8")
        fout.write("")
        fout.write("")
        fout.write("")
        #ascii
        for data in self.datas:
            fout.write("")
            fout.write("" % data['url'])
            fout.write("" % data['title'])
            fout.write("" % data['summary'])
            fout.write("")
        fout.write("%s %s %s
")
        fout.write("")
        fout.write("")
        fout.close()

7.7 开始运行爬虫和爬取结果展示

八、课程总结

简单爬虫架构
URL管理器
网页下载器，urllib2
网页解析器，BeautifulSoup
实战编写爬取百度百科页面

复杂爬虫：
需登录、验证码、Ajax、服务器防爬虫、多线程、分布式

九、总代码

参见：https://blog.csdn.net/qq_30534935/article/details/94015953

你可能感兴趣的:(Python学习初涉)

《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
2021年2月21日 1000天演讲打卡第52天乒乓球巅峰_时刻
哈喽大家好，我是嘟嘟，今天是2021年2月21日，也是我1000天演讲打卡第52天，今天我要与大家探讨的主题关于乒乓球。乒乓球，是我目前和小伙伴们最喜欢的一项运动，记得第一次打乒乓球的时候，还是4年前与姥姥娱乐，当时姥姥姥爷来深圳了，这边没有朋友，所以他们每天都会去打乒乓球，有一次我初于好奇心，找他们打了几局，打完下来我大汗淋漓，可心中觉得乒乓球比篮球好多了，也是从那是开始，我要求与姥姥姥爷一起打
现代汉语粗糙版文学史与经典学习搬运工
第十六章文学史与经典文学史的兴起在西方,虽然从亚里士多德开始,在人类的著述中已经可以找到文学史概念与写作方式的萌芽,但是,人们一般认为17世纪后期到18世纪是现代文学史写作真正开始的时期。长达百年波及整个欧洲的“古今之争”孕育出文学研究的历史意识,现代意义上的文学史观念在这场影响深远的论争中初见端倪。从18世纪晚期到19世纪初,由于席勒、弗·施莱格尔和赫尔德等人的介入,文学史研究逐渐变得复杂和成熟
一个纯真姑娘被现实社会磨灭了热情幽律
每个初入社会的人，都是满怀憧憬，热情对待这个社会，可往往都是被回馈以欺骗，恐吓，磨灭了热情。我的一个朋友，小吴，来自安徽的姑娘，初出校门，来到这座南方经济发达的城市，善良单纯，待人对事充满了朝气与热情。当时小吴所在的房产中介公司有一位女客户，是退休教师，谈吐方面能感觉得到很有素质，和她先生想要买房，小吴接待的。了解情况后，客户感觉经济方面还是有点压力的，所以委托小吴先帮她卖自己的旧房，周转开来再买
炒币好还是挖矿好？区块链大社会
炒币好还是挖矿好？相信这个问题对于很多初入行的朋友来说是个不小的问题，小编也经常会被问到类似问题。为此，本文专门针对这个问题做一下分析，供各位朋友们参考。在比特币世界里，有些非常有意思的比喻，像挖金子一样“挖”比特币叫做“挖矿”，挖比特币的人被称为“矿工”，而用于“挖”比特币的电脑被称为“矿机”。而“炒币”就像炒股，直接在交易平台购买数字货币进行交易，不需要“挖”，只要将法币兑换成某种数字货币，再
晨间日记时光分拣机
一日一诗赠别（一）唐-杜牧娉娉袅袅十三余，豆蔻梢头二月初。春风十里扬州路，卷上珠帘总不如。https://mp.weixin.qq.com/s/DRQzfcPvFkcGBBOR06PbEw图片发自App
2021-01-06 如鱼饮水2020
中原焦点团队网络初23期坚持分享第186天，约练第36场，本周4，咨14（20210106）生物钟自然醒，一看有个九点的约练，只有半小时，风一样解决起床、早餐、买菜日常必修课。准点进入约练房间。聊点什么呢，还是聊点自己内心抵触当来访者的话题，想看看两位老师会怎样帮忙梳理，不想当来访者的来访者。诉说自己从小父母宠爱，老公溺宠，不知天高地厚，也不知人情世故，更不知道察言观色，一直活在自己的世界里。被宠
服了我的一根筋公木白
以前朋友说我一根筋，还有的说我是棒槌，实心眼的，听了我呵呵一笑，照常行事。年龄越大，越苦恼于我的一根筋，在我的思维模式里，所有的事情都是直线，点对点，没有曲折，没有迂回，对事的态度非黑及白，没有灰色地带。如果想好了一件事，脑子里只有这一件事，或者说遇事想好了解决办法，即使在执行过程中有更好的，也会自动忽略，还一直初在原定思维里。这种情况不只发生一两次，遇事不知变通，也不知道拐弯，总是过后才发觉本可
做有良心的教育——读《怎样教语文》今日所感瑾言_lw999
“精彩的课堂教学应该是展示一个过程，而不是展示一个结果。”初读之时，没有太多感触；反复嚼读，心中波澜起伏。脑中突然冒出“”做有良心的教育”这一想法来，我又是否做到了有良心的教育呢？课堂之上，某个同学回答不出问题，我耐心地引导他了吗？教学效果不好之时，我深刻地反省自己了吗？学生的冲突与矛盾，我又是否打开了他们的心结？让他们不再有怨恨呢？我是教学生有了好的成绩还是培养了他的能力呢？诸多问题，一时涌现在
我们毕业分别四十年！关东老叟
我们毕业分别四十年了，时光茬冉，我们都成了爷爷、奶奶。还记得我们初入学时住校的那栋楼吗？还记得“摇橹扬帆过走廊“吗？还记得”校长的妹妹——路滑“吗？我们相识在那栋楼里，宿舍虽然简陋，但我们对门住着，就像温馨的大家庭。还记得食堂吃饭的情景吗？一下课我们都匆匆去食堂，拿着吃饭的小盆，手里捏着饭票，排队等待给我们打饭。老师讲课的场面也许没有记住多少，但我们还是学到了许多知识。课余操场上我们打过羽毛球，踢
韩愈《题榴花》：倾听花落的声音墙头草说
无论有没有人欣赏，时节一到，花儿自然就会开放，这是自然的规律。但是多情的人们总以为花儿是为自己而开，于是在赏花之时，或惊叹于造化之功，或沉醉于迷人花香，或伤悼于满地落红……唐代诗人韩愈在观赏石榴花时，也生发出深沉的感慨，于是写下了《题榴花》一诗，原文如下：五月榴花照眼明，枝间时见子初成。可怜此地无车马，颠倒青苔落绛英。“五月榴花照眼明”，五月如火的石榴花映入眼帘格外鲜明。五月份，正是石榴花开得正盛
陈悦 | 科学学的起源及其发展斐夷所非 science history 科学学
作者|陈悦20世纪初，随着科学技术的迅猛发展和科学社会学的兴起，科学学逐渐得到关注和研究。经过百年的发展，科学学正成为一门重要的交叉学科，对科技发展和社会进步产生了深远影响。面对百年未有之大变局加速演进，尤其是世界各国都把目光聚焦于科技，希望通过科技创新找到适应变局的出路时，科学学更凸显其必要性。因此，《世界科学》杂志开设“科学学探索”栏目。一方面，促进更多的人加入科学学的研究和讨论中，深入探讨科
2023-10-26 Eltonpeople
文化通史121今日启发：Elton:第八章中世文化的初兴第一节幕府体制与公武二元文化的确立镰仓幕府在日本历史上，平安时代末期，出现平氏和源氏两大武士集团。首先平氏取代贵族而获得了政权，但仍沿袭贵族政治。平氏与源氏两大武士集团之间不断发生战争。源赖朝于1180年奉以仁王之旨令，举兵讨伐平氏，经过富士川、一谷、坛浦等战役，最终推翻了平氏政权。源赖朝夺取政权后，在地方领主的武力支持下，在镰仓地方初步建立
2022-11-17 珍惜dxz
中原焦点团队网络初、中级28期杜小珍坚持分享第534天坚持读书第436天读《建构解决之道》收获:当情况变更糟时的可贵应对1.当情况变得更糟时，咨询师必须问明详情，了解让他们变差的情况与因素。咨询师需以尊重地态度倾听与接纳当事人描述一些突如其来的其他事件如何影响他们的生活，并多加援用“应对问句”，将会非常重要而有用。同时，咨询师还需要用开放的心去关注当事人在处理这些情境时，是否有与过去不同之处。2.
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
06月04日或许你也这样想
躺下来就已经是凌晨了，感觉真的很疲惫，还有好多好多被交代的任务没完成，大脑混乱眼皮也不听使唤耷拉下来，黑眼圈也不知道掉到哪里去了…只感觉一身的疲惫，作为一个心思敏感的职场小白我真的觉得这段时间身体是如此的煎熬精神是如此的压抑，晚上回来从八点多加班到十一点多，一整天都对着电脑脸也开始变得蜡黄剪了短发头发也油的更快了，说话也变得如此的小心翼翼，这应该是初入职场正常的状态吧，这个时候就愈发需要陪伴和沟通
《心毒》‖邪恶的人性好似一剂毒药那花评书
《心毒》是一部刑侦小说，作者初禾也是一位高人气原创作者，在她细腻的笔触之下，不论是小说情节还是人物都显得紧凑而饱满。本书分为两起案件，一起名为“红颜”，一起名为“知己”。第一案红颜中讲到，在某个城市边缘的穷人区发现一位女性受害者，她离奇又蹊跷的受害场景，让当时的办案人员都唏嘘不已，紧接着引出了本书的男主角花崇和柳至秦这对“柳暗花明”组合。看过刑侦小说的朋友都知道，接下来的情节就是侦破案件的过程，同
2023-09-15 莲子心茶
小含因流感发烧四天都没上学，担心她跟不上，便提出18:00-18:30替她补半小时的课。可调节设备、课上互动，竟是讲到了7点半，后面我调控智能手表，竟到了21:30。再后来，学生肠胃炎打吊针，他妈妈说遇上学校的同学，也是同样再打吊针，便问：饭菜不是学校饭堂做的么，怎么我孩子说外边公司承包？饭堂为了能给扩大的声源提供场所，假期开始装修，至今还未完工。因此开学初是由公司外包的饭菜。我将这事报给了级长。
中原焦点团队范利娜焦点初16 坚持分享第1017天 2022-3-26约练78次娜_2c8d
家长培养孩子的最重要就是让孩于与我们保持独立，帮助他们成为一个独立的个体，有一天，当他们离开我们的时候，能自己独当一面。我们希望不要把孩子当成自己翻版或者延伸，而是一个独立的人，与我们有着不同性情，不同品味，不同感知、不同期望，不同梦想的个体。如何帮助他们成为一个自立的人？让他们自己做自己的事情，让他们亲自经历各种问题带来的挣扎，让他们在自己的错误中得到成长。
少年游慢断红尘
家村春二月，绿柳垂丝嫩怯。仙蕊飞香，朝云凝碧，临台榭。神女吹箫曲，酒醉红羞发。云雨天涯，少年得趣时节。梦里春风彻。龙卧山间岩穴。暖律初催，飞空腾越，迎仙客。同探花门处，一跃超宵阁。便趁涛波，尾梢溅行飞沫。
天空之美—寻找校花之漫漫长路陌离_0f58
校花，一个让人听到就心潮澎湃的词语。寻找校花之路漫漫，愿初心不负，亦如初恋人生若只如初见，何事秋风悲画扇人生若只如初见，何事秋风悲画扇初见是惊鸿一瞥，南柯一梦是你。初见是惊鸿一瞥，南柯一梦是你。等待是山重水复，怦然心动是你。等待是山重水复，怦然心动是你。相遇是柳暗花明，如梦初醒是你。相遇是柳暗花明，如梦初醒是你。重逢是始料未及，别来无恙是你。重逢是始料未及，别来无恙是你。颜如舜华，气若幽兰颜如舜华
中原焦点团队张俊功初24、中24持续分享第439天，约练总计75次（2022.4.23） 5d4750373a7c
训人最好不要有第三人在场，人都顾全面子，面子下不去，他会起反感。做事要考虑长远，考虑利他，利益社会，利益众人，不能只为私利。劝人为善是言教，与人为善事身教。能将自己所做的错事讲出来，并加以改正，就是不知耻。这是勇，勇往直前。
碎语我的故事不要钱
图片发自App你之所以还没有变成孙悟空，是因为你还没有遇到那个给你三颗痣的人。曾几何时，开始细数生辰？回忆总是在雨后，潮湿的教学楼，还有多少路要走？我该如何遗忘？在这思念和回忆交织的地方。奈何那短长情丝，剪不断还生发是空空荡荡，却嗡嗡作响念初，如故。念初？如故？？该隐瞒的事总清晰，千言万语只能无语有生之年狭路相逢终不能幸免悲哀是真的泪是假的，本来没因果你在南在北？遇见多少归人？摔碎几盏茶杯？待历经
《快穿: 大佬心尖宠又要作妖了》梨初许言全文在线阅读（完整版）云轩书阁
《快穿:大佬心尖宠又要作妖了》梨初许言全文在线阅读（完整版）主角：梨初许言简介：我穿越了，但是我给人当了四年舔狗才想起这事。一朝恢复记忆，我一心只想搞钱，至于太子？我可去你的吧！关注微信公众号【旺精灵】去回个书號【9524】，即可阅读【快穿大佬心尖宠又要作妖了】小说全文！第18章：梨初心道不好，抬头望向江星竹，果然对方脸色阴沉，又难过，手不安的捏着她衣裙。目光可怜。梨初安抚的摸摸他脑袋，对着玉佩回
2021-12-01 MA马
中原焦点团队网初26期马红2021--12--1日坚持分享第302天例外及正向经验的重视，促进来访者正向的自我意识。也就是说，SFBT重视例外经验的开发，将能增加来访者的自我效能、自我肯定、胜任感等赋能感，并且改变来访者内在的主管知觉，对自己产生合理的、全面的、正向的评估，甚至带出自己是能够独立、能够保护自己、能够改变环境的意愿，信心与动力。
node初奶瓶SAMA
www.nodejs.org下载nodejs的安装文件,然后就直接下一步，下一步，下一步傻瓜式安装（打开命令符widow+r输入cmd）node-v查单当前node的版本号安装nodejs时，会自动安装npm包管理工具npm-v查看npm的版本可以直接在黑窗口中输入node然后点击回车以后，就可以输入javascripnt的代码了既然在浏览器鼠标右键中console和在黑窗口中输入node点击回车
中原焦点团队张俊功初24、中24持续分享第319天挑战约练第七期第组周第1次共9次，总计54次（2021.12.7） 5d4750373a7c
筑基第十五讲：复听：尊重：确认来访者知觉就是最大的尊重。尊重是一视同仁的，共情是因人而异的。在他的世界他是对的。关注到人本身，而不是关注问题。尊重的意义：建立良好关系的基础。尊重也是一种信任。无条件的接纳。接纳未知欣赏好奇。平等。无条件接纳：接纳是接纳他的情感而非认同他的行为。接纳并非对恶习无动于衷。具体化：时间、地点、人物、事件、感受、重要他人…顺势而为，镜中花水中月。助人之前先敲敲门。和孩子相
日记——我的歌单静若小猴
又到一年一度大数据汇总的时候了，听歌已经成为很多人生活里的一种乐趣。春夏秋冬，我们都有自己喜欢的歌，歌词歌曲唱出沃尔玛你的心声。还记得大学时候最喜欢听的《春天里》，我有一天单曲回放了30遍，总觉得听着仿佛看到自己声音。还有的歌，初听不知曲中意，再听已经是曲终人，听着歌流泪，听着歌入睡……还记得那些年少的故事吗，总觉得自己才是故事外的人，却不是自己已经入歌。一段时间会喜欢一个人的音乐，一段时间会沉静
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他