红色枫叶海

requests、selenium、xpath、bs4的使用以及爬取实例

使用requests三方库

requests三方库是初学者最常用的一个库。

常用的几种方法

1、get：传递请求；在get(url,headers)是最基本的传入参数。
2、text：读取服务器的响应内容。
3、encoding：查看当前网页的编码方式。
4、content：二进制响应内容。当我们读取图片等非文本内容的常用读取方式。
5、json：返回网页的jison格式的数据。
staus_code：响应状态码。

更详细的requests库的使用可查看该链接：requests三方库使用

代码实例

利用requests库以及正则表达式爬取豆瓣250上的电影名，链接。以第一部电影肖申克的救赎为例

"""
import requests  # 导入requests
import re   # 导入正则表达式
url = "https://movie.douban.com/top250"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/92.0.4515.131 Safari/537.36'
}
resp = requests.get(url=url, headers=headers)  # 请求网页
print(resp.text)   # 获取网页的相应内容
with open('豆瓣电影.html', 'wb') as file:
    file.write(resp.content)    # 将二进制响应写入一个html文件中，避免后期访问网页过度被封ip

with open('豆瓣电影.html','r',encoding='utf-8')as file:
    content = file.read()  # 读取写入的网页响应内容

re_str = ''  # 括号表示分组,括号里的内容就是我们需要的
result = re.search(re_str,content)   
print(result.span())   # 输出找到的字符串的起始与终止的下标位置，元组形式
print(result.group(1))  # 将分组的内容输出，0表示全部输出，否则按位置输出，1就是第一个分组
print(result.group(2))
print(result.groups())   # 将所有分组内容以元组形式输出


results = re.findall(re_str,content)  # 将匹配的所有内容以列表输出
for result in results:
	print(result)


# 查找下一个
result1 = re.search(re_str,content[10002:])
print(result1.groups())

爬取多页链家二手房信息

代码中的方法基本可囊括初学者爬取网页的大多数方法，大部分方法和上面的代码大致相同，只是加入循环进行多页爬取。在进行多页爬取是可以发现换页是网址是发生有规则变换，可根据网址的变化进行访问多页数据。

"""
import re

import requests
pages = 2
for page in range(1,pages+1):
    url = f'https://cd.lianjia.com/ershoufang/pg{page}/'

    headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/92.0.4515.131 Safari/537.36'
    }   # headers可以在网页的检查源代码中找到
    resp = requests.get(url=url, headers=headers)
    # with open(f'{page}.html','w',encoding='utf-8')as file:
    #     file.write(resp.text)
    content = resp.text
    pattern1 = 'data-is_focus="" data-sl="">(.+?)'    # 取标题
    pattern2 = 'data-el="region">(.+?)\s+\s+(-)\s+ \
               'href=".+?" ' \
               'target="_blank">(.+?)'    # 取地址
    pattern3 = '(\d+?|\d+\.\d+?)(万) \
               'class="unitPrice" data-hid="\d+?" data-rid="\d+?" ' \
               'data-price="\d+?">(.+?)'      # 取总价和价格

# 将找到的信息存入列表
    result1 = re.findall(pattern1, content)  
    result2 = re.findall(pattern2, content)
    result3 = re.findall(pattern3, content)
    address = []
    prices = []
    # 爬取到的信息不是完整的需要后期调整
    for i in result2:
        a = ''.join(i)
        address.append(a)

    for i in result3:
        a = ''.join(i)
        prices.append(a)
    print(len(result1), len(address), len(prices))
    information = []
    for i in range(len(result1)):
        information.append(result1[i] + ', ' + address[i] + ', ' + prices[i])

    print(information)

bs4讲解

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。

详情点击：bs4详细讲解

直接代码讲解

这里需要一些HTML知识，读者自行学习，或者了解父子类等一些调用的知识就够了。

import bs4   # 导入bs4库，需要下载

# bs4:全称：beautiful soup 4。可以从HTML或者从XML中提取数据

html = """
The Dormouse's story

The Dormouse's story
Once upon a time there were three little sisters; and their names were
,
Lacie and
Tillie;
and they lived at the bottom of a well.
...
"""
soup = bs4.BeautifulSoup(html, 'lxml')    # lxml是一种格式，BeautifulSoup（）相当于一个修饰方法，把字符串转换为lxml格式
# print(soup)
# print(type(soup))   # 

# 格式化代码，把格式不规范的HTML转换成规范的
print(soup.prettify())

# 输出head包含内容
print(soup.head)

# 打印标签：只打印第一个标签内容
print(soup.head.title)
print()

# 打印标签内容4种方法
print(soup.head.title.string)  # The Dormouse's story

print(soup.head.title.get_text())  # The Dormouse's story

print(soup.head.title.text)  # The Dormouse's story

print(soup.head.title.contents)  # ["The Dormouse's story"]

# 选择标签内容方法
# select：使用id，class，标签，属性，父子，后代，兄弟，相邻兄弟等选择器取选择标签，返回结果：列表
# select_one：使用id，class，标签，属性，父子，后代，兄弟，相邻兄弟等选择器取选择标签，返回结果：select结果中的第一个元素

p_list = soup.select('body > p')
print(p_list)

p_list1 = soup.select('body>.title')
print(p_list1)

p = soup.select_one('body>p')
print(p)

爬取中国新闻网当天的热点新闻

import datetime  # 导入时间库
import re

import bs4
from 爬虫请求网页模板 import response   # 自己封装的一个请求网页的函数

i = datetime.datetime.now()     # 获取现在当前时刻的时间
now_time = str(i.month)+'-'+str(i.day)    # 将当天的月和天以字符串形式拼接，形如：8-19

pages = 10  # 页数，当天新闻不止一页
for page in range(1,pages+1):

    url = f'https://www.chinanews.com/scroll-news/news{page}.html'   # 换页时网址的变换规律
    resp = response(url)	# 请求网页
    resp.encoding = 'utf-8'    # 更改编码方式
    content = resp.text    # 返回网页响应的内容
    # print(content)
    soup = bs4.BeautifulSoup(content, 'lxml')    # 修饰
    # print(type(soup))
    news_lists = soup.select('#content_right > div.content_list > ul > li')   # select方法将li标签所有的内容拿出来
  
    for news_list in news_lists:   # type: bs4.element.Tag
        kind = news_list.select_one('li>.dd_lm>a')  # 将li标签下新闻类型取出
        content = news_list.select_one('li>.dd_bt>a')  # 取标题
        news_time = news_list.select_one('li>.dd_time')   # 取时间

        if news_time:
            news_time = str(news_time.text)
            news_time1 = re.findall('(\d{1,2}-\d{1,2})',news_time)   # 利用正则表达式将时间中的月数天数取出
            if news_time1[0] == now_time:    #判断当前月数天数和新闻的是否一致，一致则输出当天的新闻
                print(kind.text,content.text,news_time,sep='  ')


# 大致输出前几行
体育  “钢铁教练”金甲洙：心怀一方热爱 以中国为家  8-22 16:41
视频  猎人变身大山守护者：学会与野生动物和谐相处  8-22 16:39
国际  法国马赛接连发生两起枪击事件至少造成3人死亡  8-22 16:39
视频  海南大熊猫兄弟8岁生日会：吃五彩冰蛋糕 泡花瓣浴  8-22 16:38

selenium库的使用

Selenium是一个用于测试网站的自动化测试工具，支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器，同时也支持phantomJS无界面浏览器。

详情可点击：selenium

在使用selenium库时，我们需要下载一个webdriver驱动文件，当然，下载的驱动得看我们使用的浏览器，一般推荐使用谷歌浏览器。Chromedrive驱动
使用方法：
第一种：将下载的exe驱动放在与当前的py文件同一个目录下，调用代码是：

wb = selenium.webdrive.Chrome(chromedriver.exe)

第二种：配置环境变量，将exe文件放在与谷歌浏览器chrome.exe所在的文件目录之下，然后将路径添加到我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path中，这种方法不一定全都能成功，调用：

wb = selenium.webdrive.Chrome()

定为元素方式

定位一个元素定位多个元素含义
find_element_by_id find_elements_by_id 通过元素id定位
find_element_by_name find_elements_by_name 通过元素name定位
find_element_by_xpath find_elements_by_xpath 通过xpath表达式定位
find_element_by_link_text find_elements_by_link_tex 通过完整超链接定位
find_element_by_partial_link_text find_elements_by_partial_link_text 通过部分链接定位
find_element_by_tag_name find_elements_by_tag_name 通过标签定位
find_element_by_class_name find_elements_by_class_name 通过类名进行定位
find_elements_by_css_selector find_elements_by_css_selector 通过css选择器进行定位

定位一个元素	定位多个元素	含义
find_element_by_id	find_elements_by_id	通过元素id定位
find_element_by_name	find_elements_by_name	通过元素name定位
find_element_by_xpath	find_elements_by_xpath	通过xpath表达式定位
find_element_by_link_text	find_elements_by_link_tex	通过完整超链接定位
find_element_by_partial_link_text	find_elements_by_partial_link_text	通过部分链接定位
find_element_by_class_name	find_elements_by_class_name	通过标签定位
find_element_by_class_name	find_elements_by_class_name	通过类名进行定位
find_element_by_css_selector	find_elements_by_css_selector	通过css选择器进行定位

import time

from selenium import webdriver

# selenium 自动化测试
url = 'https://blog.csdn.net/qq_51136340/article/details/119696458?spm=1001.2014.3001.5501'
url2 = 'https://www.baidu.com/'
url3 = 'https://www.taobao.com'
# 创建浏览器对象
b = webdriver.Chrome()
# 设置浏览器窗口大小,分辨率
# b.set_window_size(1920,1080)

# 设置全屏
b.maximize_window()

# 请求链接
b.get(url)
b.get(url2)
b.get(url3)

# 后退  返回到上一个点击的链接
b.back()
time.sleep(1)

# 前进
b.forward()
time.sleep(1)

# 打印网页源码
print(b.page_source) # str--->bs4

# 设置滚动条 原点在左上角
max_y = 10000
y = 0
while y<=max_y:
    b.execute_script(f'window.scrollTo(0,{y})')
    y += 500
    time.sleep(1)

# 通过元素定位爬取需要的
contents = b.find_element_by_id('content_right')
print(contents.text)

news_title = b.find_element_by_class_name('dd_bt')
print(news_title.text)
news_href = b.find_element_by_css_selector('#content_right > '
     'div.content_list > ul > li:nth-child(1) > div.dd_bt>a').get_attribute('href')
print(news_href)


time.sleep(1)

# 关闭浏览器，close关闭当前所在标签页，quit关闭所有标签页
# 浏览器打开时会产生垃圾缓存，close只关闭，不执行清理缓存操作，quit关闭的同时会清理缓存
b.close()
b.quit()

通过selenium自动登录淘宝

import time

import selenium.webdriver as wb

url1 = 'https://www.taobao.com/'
url2 = 'https://www.baidu.com/'
url3 = 'https://yys.163.com/'

# 创建设置对象
options = wb.ChromeOptions()
# 不加载图片
# options.add_argument('blink-settings=imagesEnabled=false')
# 创建对象
b =  wb.Chrome(options=options)
b.get(url1)

# 打开新的标签页
b.execute_script('window.open()')
# print(b.window_handles)
# 切换标签页
b.switch_to.window(b.window_handles[1])
b.get(url2)
# 打开新标签
# b.execute_script('window.open()')
# 切换选项卡
# b.switch_to.window(b.window_handles[2])

# b.get(url3)
time.sleep(1)

# 切换选项卡
b.switch_to.window(window_name=b.window_handles[0])

# 登录,找到登录位置点击
b.find_element_by_class_name('h').click()
b.find_element_by_class_name('icon-qrcode').click()

# 隐式等待：全局等待
b.implicitly_wait(15)
# 检测信息是否被加载，就是是否扫描二维码
b.find_element_by_class_name('site-nav-login-info-nick ')
# 获取Cookie
Cookie = b.get_cookies()
print(Cookie)
# 将cookie写入文件
with open('Cookies.txt','w',encoding='utf-8')as file:
    file.write(str(Cookie))

b.quit()

改进版

# 导入按键事件
from selenium.webdriver.common import keys
from Tools.i18n.pygettext import safe_eval
from selenium import webdriver

url = 'https://www.taobao.com/'

with open('Cookies.txt','r')as file:
    cookie = file.read()

new_cookie = safe_eval(cookie)

b = webdriver.Chrome()   # 加载

# 防止selenium被监测
# 先修改js，再加载js   不需要更改，只对淘宝有用
b.execute_cdp_cmd(
    "Page.addScriptToEvaluateOnNewDocument",
    {
        "source": "Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"
    }
)

# 先访问一次再访问一次
b.get(url)
for i in new_cookie:
    # 传入的键所对应值不能是False
    if i['secure']:
        b.add_cookie(i)

# 再访问一次
b.get(url)
# b.quit()

# 定位搜索框
search = b.find_element_by_id('q').send_keys('三只松鼠大礼包')
# 定位搜索按钮
enter = b.find_element_by_class_name('tb-bg').send_keys(keys.Keys.ENTER)

# 滚动进度条
max_y = 5000
y = 0
while y<=max_y:
    b.execute_script(f'window.scrollTo(0,{y})')
    y += 1000
    time.sleep(2)

print(b.page_source)   # 打印源码

通过手动在终端输入账号密码登录

import getpass
import time

from selenium import webdriver
import requests
import lxml
from selenium.webdriver.common.by import By

from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait

# 创建设置对象
options = webdriver.ChromeOptions()
# 避免终端下执行代码报错
options.add_experimental_option("excludeSwitches", ['enable-automation', 'enable-logging'])
# 不加载图片, 提升速度
# options.add_argument('blink-settings=imagesEnabled=false')

url = 'https://www.taobao.com'
wb = webdriver.Chrome(options=options)

# 隐式等待
wb.implicitly_wait(10)


# 防止被检测
wb.execute_cdp_cmd(
    "Page.addScriptToEvaluateOnNewDocument",
    {
        "source": "Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"
    }
)

wb.get(url)
wb.find_element_by_class_name('h').click()
# wb.find_element_by_class_name('icon-qrcode').click()


user = input('请输入账号：')
password = getpass.getpass('请输入密码：')
# 输入账号
wb.find_element_by_id('fm-login-id').send_keys(user)
# 输入密码
wb.find_element_by_id('fm-login-password').send_keys(password)

# 登录
wb.find_element_by_class_name('fm-button').click()

# 显示等待
WebDriverWait(wb, 20).until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,
                                                              '#J_SiteNavLogin > div.site-nav-menu-hd > div.site-nav-user > a'),
                                                             '再见来不及挥手740959626'))  	# 检测是否出现账户名

# 搜索商品
wb.find_element_by_id('q').send_keys('月饼')
wb.find_element_by_id('q').send_keys(Keys.ENTER)

# time.sleep(2)
wb.quit()

xpath解析

# xpath查找xml文档的语言
# xml用来存储和传输数据的，
import lxml
from lxml import etree
"""lxml专门处理xml和html数据的三方库
        etree.XML():专门将xml格式的字符串转换成_Element对象，可以方便使用xpath方法
        etree.HTML():专门将HTML格式的字符串转换成_Element对象，可以方便使用xpath方法
"""
xml_str = """
1
    永辉超市2
    中国3
    四川成都4
    肖家河大厦5
    
        
        
        
    6
    
        
        
    7
    
         烟
    8

"""
root = etree.XML(xml_str)   # type: lxml.etree._Element
print(root)
"""
1、xpath语法：
    / -表示根节点
    // -表示文档的任意节点
    . -表示当前节点
    .. -当前节点的父节点
    @ -表示节点属性
2、实例
    /supermarket-表示提取根节点supermarket的所有子节点
    supermarket-表示提取supermarket子节点
    //name-表示提取文档中的所有name节点
    /supermarket/goodsList/goods/@name-提取supermarket根节点中的goodsList子节点的goods子节点的name属性
3、未知节点
    * -提取当前位置所有后代节点
    //* -提取当前位置下的所有后代节点
    node()-提取当前位置的任何类型的子节点
    
4、谓语
    /supermarket/address[1]-提取根节点下第一个address子节点
    /supermarket/address[@name]-取根节点下有name属性的所有address节点
    /supermarket/address[@name="one"] -提取根节点下name等于one的address子节点
    /supermarket/address[last()-1]- 提取根节点下倒数第二个address子节点

5、取内容
    /text()-取节点内容
    /@name - 取节点中name属性
"""
# print(root.xpath('/supermarket/text()'))
# print(root.xpath('//name/text()'))
# print(root.xpath('/supermarket/goodsList/goods/@count'))
# print(root.xpath('/supermarket/name/text()'))
# print(root.xpath('*'))
# print(root.xpath('//*/text()'))
# print(root.xpath('node()'))
print(root.xpath('/supermarket/address[1]/text()'))
print(root.xpath('/supermarket/address[@name]/text()'))
print(root.xpath('/supermarket/address[@name="one"]/text()'))
print(root.xpath('/supermarket/address[last()-1]/text()'))

实战

链家二手房信息爬取并且存入csv文件

from lxml import etree
import requests
import lxml
import csv
from 爬虫请求网页模板 import response

url = 'https://cd.lianjia.com/ershoufang/'
resp = response(url)
# with open('链家二手房.html','w',encoding='utf-8')as file:
#     file.write(resp.text)
with open('链家二手房.html', 'r', encoding='utf-8')as file:
    content = file.read()

root = etree.HTML(content)  # type: lxml.etree._Element
# print(root)

# 标题
title = root.xpath('/html/body/div[@class="content "]/'
            'div[1]/ul/li/div[@class="info clear"]/div[@class="title"]/a/text()')
# 链接
href = root.xpath('//ul[@class="sellListContent"]/li/div[@class="info clear"]/div[@class="title"]/a/@href')

# 地址
address1 = root.xpath('//ul[@class="sellListContent"]/li/div[@class="info clear"]/'
                     'div[@class="flood"]/div[@class="positionInfo"]/a[1]/text()')

address2 = root.xpath('//ul[@class="sellListContent"]/li/div[@class="info clear"]/'
                     'div[@class="flood"]/div[@class="positionInfo"]/a[2]/text()')
address=[]
for info in zip(address1,['-'for i in range(30)],address2):
    address.append(''.join(info).replace(' ',''))
# print(address)
# 总价
total_price = root.xpath('/html/body/div[@id="content"]/div[@class="leftContent"]/'
                         'ul[@class="sellListContent"]/li[@class="clear LOGVIEWDATA LOGCLICKDATA"]/'
                         'div[@class="info clear"]/div[@class="priceInfo"]/div[@class="totalPrice"]/span/text()')

# 单价
unit_price = root.xpath('/html/body/div[@id="content"]/div[@class="leftContent"]/'
                         'ul[@class="sellListContent"]/li[@class="clear LOGVIEWDATA LOGCLICKDATA"]/'
                         'div[@class="info clear"]/div[@class="priceInfo"]/div[@class="unitPrice"]/span/text()')
# 具体情况
infomation = root.xpath('/html/body/div[@id="content"]/div[@class="leftContent"]/'
                         'ul[@class="sellListContent"]/li[@class="clear LOGVIEWDATA LOGCLICKDATA"]/'
                         'div[@class="info clear"]/div[@class="address"]/div[@class="houseInfo"]/text()')
# print(infomation)

# 写入csv文件
with open('链家二手房.csv','w',encoding='utf-8',newline='')as file:
    writer = csv.writer(file)
    writer.writerow(['标题','链接','地址','详细信息','总价(万元)','单价'])
    for row in range(len(title)):
        writer.writerow([title[row],href[row],address[row],infomation[row],total_price[row],unit_price[row]])

    print('写入完成')

Obsidian 与其他生产力工具集成 MaximusCoder 大学经验分享 Obsidain
介绍Obsidian是一款功能强大的笔记和知识管理工具，但与其他生产力工具集成时，其真正潜力才会得到释放。通过将Obsidian与Todoist、Google日历等应用程序连接起来，您可以创建一个无缝的工作流程，从而提高您的工作效率并确保您的所有任务和信息都同步。本文探讨如何将Obsidian与各种生产力工具集成，以构建一个有凝聚力和高效的生产力系统。1.将Obsidian与Todoist整合To
Cherno C++学习笔记 P53 模板 14_11 Cherno C++学习学习笔记 c++
这篇文章我们会讲一下C++模板，这个是一个非常有意思的且有用的东西，我们平时使用的STL其实就是基于模板编写的。它几乎就像一个宏，可以去做我们想做的任何事情。模板也可以称其为泛型，但是它比泛型要强大得多。模板是一个非常非常大的话题，所以这里我们只会讲解它简单的应用。它的本质是可以根据我们自己的用途，为其定义一个模板，然后编译器会根据我们给出的规则来帮助我们编写代码，可以让我们省去很多麻烦。所以使用
整理了一些上课学dw的笔记臨鱼羡上天计算机软件资料 dw资料 dw总结整理
整理了一下上课学dw的资料第一章：网页概述怎样查看网页的源代码：在网页的空白处右击，选择查看源代码，就可以看到网页的HTML代码文件，若表示是用HTMLS版本开发的网站。网页的相关概念：IP地址是：主机66.124.34.560-255之间域名：对应IP地址的www.sdcit.cnURL：网页的地址http://www.sdcit.cn/xyzx/jindex.htmlhttp:传输协议。HTM
《CPython Internals》阅读笔记：p151-p151 python
《CPythonInternals》学习第9天，p151-p1510总结，总计1页。一、技术总结无。二、英语总结(生词：1)1.marshal(1)marshalingMarshallingormarshaling(USspelling)istheprocessoftransformingthememoryrepresentationofanobjectintoadataformsuitablef
《CPython Internals》阅读笔记：p118-p150 python
《CPythonInternals》学习第8天，p118-p150总结，总计33页。一、技术总结补充一些本人整理的关于Context-FreeGrammar(CFG)的知识。1.symbol(符号)Amathematicalsymbolisafigureoracombinationoffiguresthatisusedtorepresentamathematicalobject（符号是一个数字或数
《CPython Internals》阅读笔记：p97-p117 python
《CPythonInternals》学习第7天，p97-p117总结，总计21页。一、技术总结1.词法分析(lexicalanalysis)根据《Compilers-Principles,Techniques,andTools》(《编译原理》第2版)第5页：Thefirstphaseofacompileriscalledlexicalanalysisorscanning.Thelexcicalan
《CPython Internals》阅读笔记：p96-p96 python
《CPythonInternals》学习第6天，p96-p96总结，总计1页。一、技术总结1.parser-tokenizerp92,Creatingaconcretesyntaxtreeusingaparser-tokenizer,orlexer.p96,CPythonhasaparser-tokenizermodule,writteninC.当做这在92页提到parser-tokenizer的
大数据学习笔记——zookeeper在hadoop集群中的作用鹅鹅鹅呢 java hadoop 大数据学习 tcp/ip tomcat
zookeeper主要是用来搭建高可用的Hadoop集群，即HighAvailability，简称(HA)测试中集群是可以不需要高可用的，即使用一个namenode即可。但是在生产环境中为了提高集群的可靠性，需要增加一个namenode备用，当active的namenode挂了之后，系统会启动standby的namenode。这就需要zookeeper监控namenode的状态。
笔记：vue 打包忽略部分文件检查。 apgk1 vue 笔记 vue
在需要忽略的文件中加入/*eslint-disable*/1.js文件首行直接加入/*eslint-disable*/2.vue文件script中加入/*eslint-disable*/3.配置文件进行配置看大佬文章。vue中指定文件或文件夹忽略eslint
读《javaScript高级程序设计－第6章》之继承 javascript
读这篇之前，最好是已读过我前面的关于对象的理解和封装类的笔记。第6章我一共写了3篇总结，下面是相关链接：读《javaScript高级程序设计－第6章》之理解对象读《javaScript高级程序设计－第6章》之封装类一、原型链原型链最简单的理解就是：原型对象指向另一个构造函数的实例。此时的原型对象包括一个指向另一个原型的指针，相应的，另一个原型中的constructor指向另一个构造函数。这种关系层
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
读书笔记|《遇见孩子，遇见更好的自己》5 抹茶社长
为人父母意味着放弃自己的过去，不要对以往没有实现的心愿耿耿于怀，只有这样，孩子们才能做回自己。985909803.jpg孩子在与父母保持亲密的同时更需要独立，唯有这样，孩子才会成为孩子，父母才会成其为父母。有耐心的人生往往更幸福，给孩子留点余地。认识到养儿育女是对耐心的考验。为失败做好心理准备，教会孩子控制情绪。了解自己的底线，说到底线，有一点很重要，父母之所以发脾气，真正的原因往往在于他们自己，
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio