疯狂成瘾者

python笔记爬虫

目录标题

request库
- request库的get方法
- Response对象的属性
- - http状态码
  - Response的编码
- request异常
- 爬取网页的通用代码框架
- Requests库的7个主要方法
- HTTP协议
- 网络图片格式
- 例子
- - 第一周单元三实例二
  - - 对网络爬虫的限制
    - 用程序模拟浏览器对亚马逊进行请求
  - 第一周单元三实例三
  - - 对百度
    - 对360
  - 第一周单元三实例四
beautiful soup
- beautiful soup库
- - 例子（demo）
  - 解析器
- beautiful soup库的基本元素
- - 将demo进行解析
  - - 例子
  - 标签树形结构
  - 标签树下行遍历
  - - 代码
  - 标签树上行遍历
  - 标签树平行遍历
  - - 代码1
    - 代码2
  - prettify方法
  - bs4库的编码
- 信息标记形式
- - xml
  - json
  - yaml
  - 例子
  - find_all
  - - name
    - attrs
    - recursive
    - string
    - 扩展方法
实例
- 大学排名
html
- html例子1：
- html例子2：
- - 表格1：
  - 表格2：(加入边框，边框数字可变）
下划线，换行，加粗，斜体
图片
- div

request库

request库的get方法

统一资源定位符（Uniform Resource Locator）”简称为URL。URL是web页的地址。

Response对象的属性

http状态码

r.status_code
http状态码

HTTP响应状态码

Response的编码

request异常

爬取网页的通用代码框架

import requests
def getHTMLText(url):
 try:
  r = requests.get(url, timeout=30)
  r.raise_for_status()  # 如果状态不是200，引友HTTPError异吊
  r.encoding = r.apparent_encoding
  return r.text
 except:
  return "产生异常"
if __name__=="__main__":
 url ="http://www.baidu.com"
 print(getHTMLText(url))

Requests库的7个主要方法

HTTP协议

HTTP, Hypertext Transfer Protocol,超文本传输协议。

操作功能

网络图片格式

例子

第一周单元三实例二

import requests
r = requests.get("https://www.amazon.cn/gp/product/B01M8L5Z3Y")
print(r.status_code)
print(r.encoding)
r.encoding =r.apparent_encoding
print(r.text)

对网络爬虫的限制

两种方法：
1.通过roborts协议
2。通关判断对网站的http头来查看你的网站是否是一个爬虫引起的

用程序模拟浏览器对亚马逊进行请求

import requests
r = requests.get("https://www.amazon.cn/gp/product/B01M8L5Z3Y")
# print(r.status_code)
# print(r.encoding)
# r.encoding =r.apparent_encoding
# print(r.text)
# print(r.request.headers)
kv={'user-agent':'Mozilla/5.0'}
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
r=requests.get(url, headers=kv)
print(r.status_code)

最终代码

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
    kv={'user-agent':'Mozilla/5.0'}
    r=requests.get(url, headers=kv)
    r.raise_for_status()
    r.encoding =r.apparent_encoding
    print(r.text[1000:2000])
except:
    print("爬取失败")

第一周单元三实例三

对百度

import requests
keyword = "Python"
try:
    kv = {'wd':keyword}
    r = requests.get("http://www.baidu.com/s", params=kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

对360

import requests
keyword = "Python"
try:
    kv = {'q':keyword}
    r = requests.get("http://www.so.com/s", params=kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

第一周单元三实例四

存入图片

import requests
path ="D:/abc.jpg"
url="https://img-blog.csdnimg.cn/9d499349bd444682b2cd1e8a0b459369.png"
r=requests.get(url)
print(r.status_code)
with open(path,'wb') as f:
    print(f.write(r.content))
    f.close()

名字为abc：

最终代码：

import requests
import os
url="https://img-blog.csdnimg.cn/9d499349bd444682b2cd1e8a0b459369.png"
root="D://pics//"
path =root +url.split('/')[-1]
try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r=requests.get(url)
        with open (path, 'wb') as f:
            f.write (r.content)
            f.close()
            print("文件保存成功")
    else:
        print("文件已存在")
except:
    print("爬取失败")

直接访问网站

import requests
r=requests.get("http://www.baidu.com")
print(r.status_code)
r.encoding ='utf-8'
print(r.text)

更改表头访问网站

import requests
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62"
}
response = requests.get("https://movie.douban.com/top250", headers=headers)
print(response.status_code)

beautiful soup

import requests
r = requests.get( "http://python123.io/ws/demo.html")
print(r.text)

beautiful soup库

例子（demo）

import requests
r = requests.get( "http://python123.io/ws/demo.html")
print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
print(soup.prettify())

解析器

beautiful soup库的基本元素

将demo进行解析

例子

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
print(soup.title)
tag = soup.a
print(tag)

标签树形结构

<html><head><title>This is a python demo page</title></head>
<body>
<p class="title"><b>The demo python introduces several python courses.</b></p>
<p class="course">Python is a wonderful general-purpose programming language. You can learn Python from novice to professional by tracking the following courses:
<a href="http://www.icourse163.org/course/BIT-268001" class="py1" id="link1">Basic Python</a> and <a href="http://www.icourse163.org/course/BIT-1001870001" class="py2" id="link2">Advanced Python</a>.</p>
</body></html>

标签树下行遍历

\n也是一个节点

代码

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
# print(soup.head)
# print(soup.head.contents)
# print(soup.body.contents)
# print(len(soup.body.contents))
print(soup.body.contents[1])

标签树上行遍历

标签树平行遍历

代码1

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
# print(soup.a.next_sibling)
# print(soup.a.next_sibling.next_sibling)
print(soup.a.previous_sibling)

代码2

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
# print(soup.a.next_sibling)
for sibling in soup.a.next_siblings:
    print(sibling)

prettify方法

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
#用html进行解析
# print(soup.a.next_sibling)
# print(soup.a.prettify())#将soup中的a标签进行prettify处理

bs4库的编码

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
# soup = BeautifulSoup(demo,"html.parser")
soup = BeautifulSoup("中文
","html.parser")
#用html进行解析
print(soup.p.prettify())#将soup中的p标签进行prettify处理

自动加入换行符

信息标记形式

xml

HTML格武也是XML格武这—个类别的

json

需要用双引号表达它的类型

yaml

用无类型键值对表示的

例子

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
for link in soup.find_all('a'):
    print(link.get('href'))

find_all

name

1.找在列表中包含在这个文件中包含所有a标签

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
print(soup.find_all('a'))

2.我们即希望查找a标签和b标签

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# print(soup.find_all('a'))
print(soup.find_all(['a','b']))

3.如果我们给出的标签是true，将显示当前soup的所有标签信息

import requests
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# print(soup.find_all('a'))
# print(soup.find_all(['a','b']))
for tag in soup.find_all(True):
    print(tag.name)

4.我们希望只显示其中以b开头的标签，包扩b和body标签

使用正则表达式库

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
for tag in soup.find_all(re.compile('b')):
    print(tag.name)

attrs

1.我们查找p标签中包含course字符串的信息

给出了带有course属性值的p标签

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# for tag in soup.find_all(re.compile('b')):
print(soup.find_all('p','course'))

2.我们以查找lD属性等于link1的值作为查找元素

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# for tag in soup.find_all(re.compile('b')):
print(soup.find_all(id='link1'))

3.我们以查找lD属性等于link的值作为查找元素

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
print(soup.find_all(id=re.compile('link')))

recursive

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# print(soup.find_all('a'))
print(soup.find_all('a',recursive=False))

string

1.我们看到我们检索Python时，回以把这个页面中所有在字特串检索出来

import requests
import re
r = requests.get( "http://python123.io/ws/demo.html")
# print(r.text)
demo=r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")
# print(soup.find_all(string = "Basic Python"))
print(soup.find_all(string=re.compile("Python")))

扩展方法

实例

大学排名

html

html例子1：

<html><head><title>This is a python demo page</title></head>
<body>
<p class="title"><b>The demo python introduces several python courses.</b></p>
<p class="course">Python is a wonderful general-purpose programming language. You can learn Python from novice to professional by tracking the following courses:
<a href="http://www.icourse163.org/course/BIT-268001" class="py1" id="link1">Basic Python</a> and <a href="http://www.icourse163.org/course/BIT-1001870001" class="py2" id="link2">Advanced Python</a>.</p>
</body></html>

html例子2：

<!DOCTYPE HTML>
<html>
  <head>
      <title>这里是一个标题</title>
  </head>
  <body>
    <h1>我是一个一级标题</h1>
    <p>这是一<i>个文本</i>段落<b>这是一个文本</b>段落
    </p>
    <p>这是<u>一个文</u>本段落<br></br>这是一个文本段落
    </p>
    <img src="https://img-blog.csdnimg.cn/ffae8ffb0b724cecadd9a8692ce2338e.png">
    <br></br>
    <img src="https://img-blog.csdnimg.cn/ffae8ffb0b724cecadd9a8692ce2338e.png" width="500px">
       <br></br>
    <a href="https://space.bilibili.com/523995133" target="_self">我的主页</a>
      <br></br>
    <a href="https://space.bilibili.com/523995133" target="_blank">我的主页</a>
    新建网站
  <h1>我是一个一级标题示例一</h1>
    <div style="background-color: red;">
        <p>这是一<i>个文本</i>段落<b>这是一个文本</b>段落
        </p>
        <p>这是<u>一个文</u>本段落<br></br>这是一个文本段落
        </p>
    </div>
  <h1>我是一个一级标题示例二</h1>
     <p>这是一<i>个文本</i>段落<b>这是一个文本</b>段落
     </p>
     <p>这是一<span style="background-color: aqua;">个文本</span>段落
     <br></br>
         这是一<span style="background-color: violet;">个文本</span>段落
     </p>
  </body>
</html>

添加链接：
我的主页

我的主页
当前网站

我的主页
新建网站

有序列表：

语文
数学
英语

无序列表：

语文
数学
英语

https://s.taobao.com/search?q=书包

表格1：

表头1	表头2
111	222
333	444

表格2：(加入边框，边框数字可变）

表头1	表头2
111	222
333	444

下划线，换行，加粗，斜体

我是一个一级标题

我是一个三级标题

我是一个六级标题

这是一个文本段落这是一个文本段落

这是一个文本段落
这是一个文本段落

图片

原图片：

修改大小的图片1：

修改大小的图片2：(后续研究）

div

我是一个一级标题

这是一个文本段落这是一个文本段落

这是一个文本段落
这是一个文本段落

Ruff：Python圈的最快代码分析工具！ BbflNim python macos 前端
随着后端开发的不断发展，代码分析工具成为了开发者们必备的利器之一。在Python圈中，Ruff已经崭露头角，成为了性能最快的代码分析工具。本文将介绍Ruff的特点以及如何使用它来优化Python代码。Ruff是一个基于Python的代码分析工具，它专注于提供快速而准确的代码分析和性能优化。Ruff的设计目标是通过静态分析和动态追踪相结合的方式，帮助开发者发现代码中的瓶颈，并提供针对性的优化建议。下
Flask与FastAPI对比选择最佳Python Web框架的指南一键难忘 python flask fastapi Flask
Flask与FastAPI对比选择最佳PythonWeb框架的指南在现代的Web开发中，Python的Web框架为开发者提供了多种选择，其中Flask和FastAPI是目前最流行的两个框架。Flask因其简洁、灵活和轻量而广受欢迎，而FastAPI凭借其高性能和异步支持，逐渐成为了越来越多开发者的首选。在这篇文章中，我们将深入比较Flask与FastAPI，分析它们的特点、优势和适用场景，并帮助你
Python - pyautogui库模拟鼠标和键盘执行GUI任务 Ethel L 自动化测试 python
安装库：pipinstallpyautogui导入库：importpyautogui获取屏幕尺寸：s_width,s_height=pyautogui.size()获取鼠标当前位置：x,y=pyautogui.position()移动鼠标到指定位置（可以先使用用上一个函数调试获取当前位置参数再使用）：pyautogui.moveTo(x,y)#x,y是屏幕上的坐标鼠标点击：pyautogui.cl
python的ruff简单使用 golemon. Python python 开发语言
Ruff是一个用Rust编写的高性能Python静态分析工具和代码格式化工具。它旨在提供快速的代码检查和格式化功能，同时支持丰富的配置选项和与现有工具的兼容性。ruff是用rust实现的pythonLinter&Formatter。安装：condainstall-cconda-forgeruff#pippipinstallruff它可以作为代码检查工具和代码格式化工具使用运行代码检查ruffche
【问题】升级指定conda虚拟环境的python到指定版本 Jackilina_Stone 【EH】报错处理人工智能 python linux 问题
1背景当前conda环境的名字为python38，进入环境python38命令如下：condaactivatepython382升级python到3.10版本condainstallpython=3.103查看python版本
python字典从头到尾_从头到尾开发并销售python API weixin_26750481 python 人工智能
python字典从头到尾IrecentlyreadablogpostaboutsettingupyourownAPIandsellingit.我最近阅读了一篇有关设置和销售自己的API的博客文章。Iwasquiteinspiredandwantedtotestifitworks.Injust5daysIwasabletocreateanAPIfromstarttoend.SoIthoughtIsh
python实例化类的存储内存地址_【JVM之内存与垃圾回收篇】对象实例化内存布局与访问定位... 学姐吖
对象实例化内存布局与访问定位从各自具体的内存分配上来讲new的对象放在堆中对象所属的类型信息是放在方法区的方法当中的局部变量放在栈空间这new的对象怎么把三块粘合到一起就是这章的内容了对象实例化面试题美团：对象在JVM中是怎么存储的？对象头信息里面有哪些东西？蚂蚁金服：二面Java对象头有什么？从对象创建的方式和步骤开始说对象创建方式new：最常见的方式，单例类中调用getInstance的静态类
虚拟环境的python升降级办法 @@wo python 开发语言
首先先进入自己建的虚拟环境中1.将python=3.12版本降级为3.7版本condainstall-ypython=3.72.升级办法condaupdatepython3.查看当前python版本办法python--version4.新建虚拟环境办法condacreate-npyupmaskpython==3.8pyupmask可换为自己想建的环境名,版本可变5.进入虚拟环境condaactiv
自动生成关于软件程序开发的100个文件并可提供下载入口唐城 postgresql 数据库人工智能电脑机器人
创建一个包含100个关于软件程序开发的文件并提供下载入口是一个庞大的任务，因为这需要编写大量的代码、文档和示例。不过，我可以提供一个大致的框架和指导，帮助你生成这些文件，并说明如何设置下载入口。文件生成思路编程语言文件：每种主流编程语言（如Python、Java、C++、JavaScript等）的HelloWorld程序。数据结构示例（链表、树、图等）。算法实现（排序、搜索等）。项目模板：Web项
python中import库出现路径问题邻家的狗2 python
运行prepro_vocab.py文件，由于需要导入common文件夹下的chem.py中的类，出现找不到模块的问题。解决方法common文件夹和prepro_vocab.py的父目录同级，如果将prepro_vocab.py的父目录的父目录的路径加入到环境变量中，就可以导入common模块了。importsyssys.path.append(os.path.dirname(os.path.dir
Python第三阶段学习 Django day08 MetalTrader Tude-Py django python
《DjangoWeb框架教学笔记》目录文章目录《DjangoWeb框架教学笔记》目录文件上传Django中的用户认证(使用Django认证系统)auth基本模型操作:auth扩展字段电子邮件发送项目部署uWSGI网关接口配置(ubuntu18.04配置)nginx及反向代理配置nginx配置静态文件路径404/500界面邮件告警文件上传文件上传必须为POST提交方式表单中文件上传时必须有带有enc
第 11 课 Python 多线程嵌入式老牛 Python入门开发语言 python
1.进程与线程进程就是程序执行的载体，我们打开的每个软件、游戏，执行的每一个Python脚本都是启动一个进程。线程是进程中执行运算的最小单位，是进程中的一个实体，是被系统独立调度和分派的基本单位。例如车间的生产是一个进程，那每个流水线就是它的一个线程。线程自己不拥有系统资源，只拥有一点在运行中必不可少的资源，但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程，
【笔记】架构上篇Day9b 六张图，带你回顾架构师的六条生存法则 gikod 系统架构笔记架构
六张图，带你回顾架构师的六条生存法则简介：包含模块一架构师的六大生存法则-模块小结：这些生存法则的逻辑是什么？&六张图，带你回顾架构师的六条生存法则2024-08-2922:40:12你好，我是辰洋，是《郭东白的架构课》的负责人。这是我们在这个专栏的第一次正式会面，你可能会觉得与我有些陌生。不过从我的眼光来看，对于专栏里的每一行字、每一个案例，对于在认真学习、留言打卡的你，我都太熟悉了。好了，感性
如何在QGIS中安装Python第三方库朗道十戒 QGIS python 开发语言
目录1.在QGIS安装目录下，找到Windows批处理文件OSGeo4W。2.双击运行该批处理文件，然后使用pipinstall命令安装相应的第三方库。3.在QGISPythonConsole控制平台就可以运行anacondajupyternotebook的脚本了。1.在QGIS安装目录下，找到Windows批处理文件OSGeo4W。2.双击运行该批处理文件，然后使用pipinstall命令安装相
【Python无敌】在 QGIS 中使用 Python 唐城 AI-毕业设计全套唐城江湖风雨-Java 唐城奇妙之旅-GIS python linux 开发语言
QGIS中有Python的运行环境，可以很好地执行各种任务。这里的问题是如何在Jupyter中调用QGIS的功能。首先可以肯定的是涉及到GUI的一些任务是无法在Jupyter中访问的，这样可以用的功能主要是地处理工具。按如下方式进行了尝试。原想使用gdal:hillshade，但是始终无法成功（这个运行失败需要重启内核）。后来参考【清华大学对应镜像】QGIS+Conda+jupyter玩转Pyth
史上最全Python程序结构！！！色厉胆薄李富贵儿 python
1顺序结构1.1顺序结构含义顾名思义，在Python中，顺序结构就是指按照代码的顺序依次执行每个语句或操作的程序结构。顺序结构中的代码按照它们在源代码中出现的顺序依次执行，没有条件或循环来改变执行顺序。1.2顺序结构代码讲解1.2.1傻瓜式代码a=10print(f"此时a的值为：{a}")a=20print(f"此时a的值为：{a}")a=30print(f"此时a的值为：{a}")a=40pr
Python进阶——项目构建、Python 项目结构。只存在于虚拟的King python 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、模块二、模块搜索路径三、导入模块四种方法四、包五、发布模块1.创建setup.py2.构建模块3.生成发布压缩包六、发布模块1.创建setup.py2.构建模块3.生成发布压缩包六、项目结构关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python
python - pip install 不同 python 版本 yuxuac Python
py-2-mpipinstallSomePackage#defaultPython2py-2.7-mpipinstallSomePackage#specificallyPython2.7py-3-mpipinstallSomePackage#defaultPython3py-3.4-mpipinstallSomePackage#specificallyPython3.4https://stacko
Python的第三方库pandas y_bccl27 Python python
1.pandas的介绍pandas是Python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发团队继续开发和维护，属于PyData项目的一部分。pandas最初被作为金融数据分析工具而开发出来，因此pandas为时间序列分析提供了很好的支持。pandas的名称来自于面板数据（pan
前端导出Excel实践：探索xlsl的实现方式 linwu-hi 前端 excel 状态模式 javascript ecmascript typescript
点击在线阅读，体验更好链接现代JavaScript高级小册链接深入浅出Dart链接现代TypeScript高级小册链接linwu的算法笔记链接前言最近写管理端的需求，发现有一个excel导出的需求，本来是后端同学负责，但是因为他们太忙了，把这块任务交给前端了，起初产品觉得前端实现不了，一听这话，这我哪里受得了，赶紧写了个demo给她看，前端是可以实现的。enen,产品看了直夸牛逼接下来，我来分享导
Zynq UltraScale+ MPSoC 在linux系统运行R5 裸机程序 remoteproc - R5 愧莫佳话 linux arm
参考文章：ultrascale学习笔记之remoteproc启动R5ZYNQUltraScale+MPSoCLinux+ThreadXAMP玩法ZynqUltraScale+MPSoC包含Cortex™-A53处理器和Cortex™-R5实时处理单元。移植完Linux系统，在系统上同时运行A53和R5应用程序，重点是修改R5程序的起始地址。vitis创建A53应用程序可以参考之前的文章R5程序可以
pip安装依赖时，报错：python版本不对应的问题不吃饭不睡觉w pip python conda
问题发生： pipinstall-rrequirements.txt解决方案：pipinstall-rrequirements.txt-ihttps://mirrors.aliyun.com/pypi/simple转载：ERROR:Nomatchingdistributionfoundfortb-nightly原因与解决方法-付杰博客(fujieace.com)
pip install命令 | 多版本python | 指定版本 Monica Bing python sklearn 开发语言
需要先把python37下的python.exe文件重命名为python37，即可用python37的指令调用该版本python。python37-mpipinstallscikit-learn==0.21.3-ihttp://pypi.douban.com/simple/--trusted-hostpypi.douban.com指定版本python+指定版本库+换源python37-mpipin
学习笔记-UE4创建地形以及混合地形材质 y18679399101 ue4 学习材质
做前须知使用版本为4.26.2切为中文版一，创建地形1.选择‘模式’下的‘地形’，设置好你想要的参数，点击‘创建’2.‘世界大纲视图’里选择你创建好的地形，选择‘材质’赋予给‘地形’下的‘地形材质’（记得退出地形模式）二，混合地形材质1.准备你的‘纹理贴图’3.右键新建一个‘材质’球，把你需要的‘纹理贴图’拖进刚刚创建的‘材质’球里，并创建一个地形混合节点（LandscapeLayerBlend）
【Matlab笔记_13】matlab如何删除某一行数据科熊小猪 Matlab matlab 笔记开发语言
1.使用矩阵（Matrix）：如果数据是一个矩阵，可以使用索引来删除某一行。假设有一个名为data的矩阵，并且要删除第rowIndex行，可以使用以下代码：data(rowIndex,:)=[];2.使用表格（Table）：如果数据是一个表格，可以使用removevars函数来删除指定的行。假设有一个名为dataTable的表格，要删除第rowIndex行，可以使用以下代码：dataTable(r
用Pygame zero (pgzero)开发游戏(带例子） lanhai_201011 pygame 游戏 python
1.用python开发游戏很方便。Pygame是一个非常好用的游戏开发库。而在此之上的pygamezero库更为游戏开发提供了更好的环境。Pygamezero对于游戏制作新手来说是一个绝佳的模块。它是pygame的简化版，隐藏了pygame中一些比较复杂的功能，更容易上手。它不仅包含一些对新手很有用的工具，对于要开发精彩游戏的人来说，也足够强大。2.pygame和pygamezero的安装首先，要
【python】import自定义的py文件 rhythmcc python 开发语言
使用以下代码将项目根目录导入路径之后，在import自己写的py文件在项目下运行的py文件，不论放在哪里，访问的第一目录都是项目的根目录开始，用.一步步点到自己想要的py文件#引入文件目录设置importsysimportos#添加项目文件根目录到系统路径module_path=os.path.abspath('SCAU_JWC_2024_09_20')sys.path.append(module
python import自己创建的.py文件-python 将自己写的py文件作为模块导入 weixin_39888268
在实战中我们往往需要导入自己写的一个.py文件，而且不是在当前目录下的文件，是不是可以作为模块直接import过来呢？并不是，我们必须让Python解释器能够找到你写的模块。主要有以下两种方法。1.sys.path.append()告知解释器假设我们自己的python文件名为inferSingleDocVec.py，那么这个文件可以作为一个模块被引入，现在Python解释器并不知道我写了这么一个文
flask操作数据库骑台风走 flask(更订中)flask python 后端
1.环境安装1.python3.852.模块pip3installflask-ihttps://pypi.douban.com/simplepip3installpymysql-ihttps://pypi.douban.com/simplepip3installflask-script-ihttps://pypi.douban.com/simplepip3installflask-sqlalche
python导入自定义py文件 hutaotaotao python基础和进阶 python 开发语言
目录1.导入当前目录下的py文件2.导入当前目录下某个文件夹里的py文件3.导入上级目录下某个文件夹里的py文件1.导入当前目录下的py文件比如写了一个tool_func.py，里面放了一些工具函数，将其放在主函数代码main.py的同级目录下#file:tool_func.pydefget_second_max_value(data:list):iflen(data)==0:returnNone
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

python笔记爬虫

目录标题

request库

request库的get方法

Response对象的属性

http状态码

Response的编码

request异常

爬取网页的通用代码框架

Requests库的7个主要方法

HTTP协议

网络图片格式

例子

第一周单元三实例二

对网络爬虫的限制

用程序模拟浏览器对亚马逊进行请求

第一周单元三实例三

对百度

对360

第一周单元三实例四

beautiful soup

beautiful soup库

例子（demo）

解析器

beautiful soup库的基本元素

将demo进行解析

例子

标签树形结构

标签树下行遍历

代码

标签树上行遍历

标签树平行遍历

代码1

代码2

prettify方法

bs4库的编码

信息标记形式

xml

json

yaml

例子

find_all

name

attrs

recursive

string

扩展方法

实例

大学排名

html

html例子1：

html例子2：

表格1：

表格2：(加入边框，边框数字可变）

下划线，换行，加粗，斜体

我是一个一级标题

我是一个三级标题

我是一个六级标题

图片

div

我是一个一级标题

你可能感兴趣的:(笔记,python)