空城机

python爬虫系列——开始入土（一）

python系列——开始入土（一）

- 避免爬虫违法
- 爬虫在使用场景中的分类
- - 通用爬虫
  - 聚焦爬虫
  - 增量式爬虫
- 爬虫与反爬虫
- - 反爬机制
  - 反反爬策略
  - robots.txt协议
- 常用的请求头和响应头
- - 请求头
  - - User-Agent
    - Connection
  - 响应头
  - - Content-Type
- requests模块
- - 爬取搜狗制定词条对应的搜索结果页面（简易网页采集器）
  - 破解百度翻译

之前我也写了有关爬虫的博客，可以参考：
爬虫IP代理池代码记录

python爬虫爬网络小说

python爬虫练习爬取信息

python爬虫实验浏览量——凉凉

爬虫（爬取网页、模拟浏览器、设置超时、HTTP请求）

避免爬虫违法

时常的优化自己的程序，避免干扰被访问网站的正常运行
在使用，传播爬取到的数据时，审查抓取到的内容，如果发现涉及到用户隐私商业机密等敏感内容需要及时停止爬取或传播

爬虫在使用场景中的分类

通用爬虫

抓取系统重要组成部分，抓取的是一整张页面数据

聚焦爬虫

建立在通用爬虫基础之上。抓取的是页面中特定的局部内容

增量式爬虫

检测网站中数据更新的情况。只会抓取网站中最新更新出来的内容

爬虫与反爬虫

反爬机制

门户网站，可以通过制定相应的策略或者技术手段，防止爬虫程序进行网站数据的爬取

反反爬策略

爬虫程序可以通过制定相关的策略或者技术手段，破解门户网站中具备的反爬机制，从而可以获取门户网站信息

robots.txt协议

君子协议。规定了网站中哪些数据可以被爬虫爬取，哪些数据不可以被爬取

可以在网站名称之后输入/robots.txt，可以进行查看该网站的robots协议

常用的请求头和响应头

请求头

User-Agent

请求载体的身份标识，比如谷歌浏览器

Connection

请求完毕后，是断开连接还是保持连接

响应头

Content-Type

服务器响应回客户端的数据类型

requests模块

python中原生的一款基于网络请求的模块，功能非常强大，简单快捷，效率极高

作用：模拟浏览器发送请求

使用步骤：

指定url
发起请求
获取响应数据
持久化存储

下载：pip install requests

例子：

import requests

# 下载一个网页

url = 'http://www.linlida.com/0_646/'
# 模拟浏览器发送HTTP请求
response = requests.get(url)
response.encoding='gbk'
print(response.encoding)
# print(response.text)
# 持久化存储
with open('./requestsDemo.html', 'w', encoding='utf-8') as fp:
    fp.write(response.text)

效果：

爬取搜狗制定词条对应的搜索结果页面（简易网页采集器）

代码：

import requests
import random

# UA 伪装
# User-Agent(请求载体):门户网站的服务器会检测对于请求的载体身份表示,如果检测到请求的载体身份为某一款浏览器,当前的请求一定是正常的请求
user_agent_list=[
            'Mozilla/5.0(compatible;MSIE9.0;WindowsNT6.1;Trident/5.0)',
            'Mozilla/4.0(compatible;MSIE8.0;WindowsNT6.0;Trident/4.0)',
            'Mozilla/4.0(compatible;MSIE7.0;WindowsNT6.0)',
            'Opera/9.80(WindowsNT6.1;U;en)Presto/2.8.131Version/11.11',
            'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER',
            'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)',
            'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.4.3.4000 Chrome/30.0.1599.101 Safari/537.36',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60',
            'Opera/8.0 (Windows NT 5.1; U; en)',
            'Mozilla/5.0 (Windows NT 5.1; U; en; rv:1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.50',
            'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; en) Opera 9.50',
            'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:34.0) Gecko/20100101 Firefox/34.0',
            'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.57.2 (KHTML, like Gecko) Version/5.1.7 Safari/534.57.2',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36',
            'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
            'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER',
            'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)',
            'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0',
            'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SV1; QQDownload 732; .NET4.0C; .NET4.0E; SE 2.X MetaSr 1.0)',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36'
        ]

if __name__ == '__main__':
    url = 'https://www.sogou.com/web'
    # 处理url携带参数，封装到字典中
    kw = input('输入搜索内容: ')
    param = {
     
        'query': kw
    }
    header = {
     
        'User-Agent': random.choice(user_agent_list)
    }
    # 对指定的url发起的请求对应的url是携带参数的，并且请求过程中处理了参数
    response = requests.get(url, param, headers=header)
    page_text = response.text
    fileName = kw + '.html'
    with open(fileName, 'w', encoding='utf-8') as fp:
        fp.write(response.text)
    print(fileName, '保存成功')

效果：

破解百度翻译

分析：每次输入内容后，页面都会局部刷新，经过network分析后，发现是sug互相传递，发送ajax请求

代码：

import requests
import random
import json

user_agent_list=[
            'Mozilla/5.0(compatible;MSIE9.0;WindowsNT6.1;Trident/5.0)',
            'Mozilla/4.0(compatible;MSIE8.0;WindowsNT6.0;Trident/4.0)',
            'Mozilla/4.0(compatible;MSIE7.0;WindowsNT6.0)',
            'Opera/9.80(WindowsNT6.1;U;en)Presto/2.8.131Version/11.11',
            'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER',
            'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)',
            'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.4.3.4000 Chrome/30.0.1599.101 Safari/537.36',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60',
            'Opera/8.0 (Windows NT 5.1; U; en)',
            'Mozilla/5.0 (Windows NT 5.1; U; en; rv:1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.50',
            'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; en) Opera 9.50',
            'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:34.0) Gecko/20100101 Firefox/34.0',
            'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.57.2 (KHTML, like Gecko) Version/5.1.7 Safari/534.57.2',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36',
            'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
            'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER',
            'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)',
            'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0',
            'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SV1; QQDownload 732; .NET4.0C; .NET4.0E; SE 2.X MetaSr 1.0)',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36'
        ]

if __name__ == '__main__':
    post_url = 'https://fanyi.baidu.com/sug'
    # post请求参数处理
    data = {
     
        'kw': 'cat'
    }
    header = {
     
        'User-Agent': random.choice(user_agent_list)
    }
    response = requests.post(post_url, data, headers=header)
    # 获取响应数据： json()方法返回的是obj对象 (如果确认响应数据是json类型的，才可以使用json()方法)
    page_json = response.json()
    print(page_json)
    # 持久化存储
    fp = open('./cat.json','w', encoding='utf-8');
    json.dump(page_json, fp=fp, ensure_ascii=False)
    print('cat.json保存成功')

你可能感兴趣的:(python,python,后端,爬虫)

青少年编程与数学 02-008 Pyhon语言编程基础 04课题、开始编程明月看潮生编程与数学第02阶段青少年编程 python 编程与数学开发语言 pycharm
青少年编程与数学02-008Pyhon语言编程基础04课题、开始编程一、Hello,World!步骤1:打开你的Python环境步骤2:编写代码步骤3:运行程序步骤4:看到结果解释代码二、使用PyCharm步骤1:安装PyCharm步骤2:创建新项目步骤3:创建Python文件步骤4:编写代码步骤5:运行程序步骤6:保存程序三、代码调试步骤1:打开或创建一个Python文件步骤2:设置断点步骤3:
python和C++联合编程 pumpkin84514 python相关 python c++开发语言
将Python和C++结合起来编程可以充分利用Python的易用性和C++的高性能。为什么要结合Python和C++编程？Python具有简洁的语法和强大的库支持，非常适合快速开发和数据处理。然而，Python在某些计算密集型任务上的性能不如C++。通过将这两种语言结合，可以既享受Python的便利，又获得C++的高性能。主要方法和工具使用ctypes：允许Python调用C函数库。使用cffi：
【2024年华为OD机试】(B卷,100分)- 热点网站统计（Java & JS & Python&C/C++）妄北y 华为od java javascript 矩阵 c语言 python
一、问题描述题目描述企业路由器的统计页面需要动态统计公司访问最多的网页URL的TopN。设计一个算法，能够高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字：如果是URL，代表一段时间内的网页访问。如果是数字N，代表本次需要输出的TopN个URL。输入约束：总访问网页数量小于5000个，单网页访问次数小于65535次。网页URL仅由字母、数字和点分隔符组成，且长度小于等于127字节
初识Node.js：入门指南与核心特性解析 Singe.Chen JavaScript node.js
引言Node.js是一种基于ChromeV8引擎构建的JavaScript运行环境，它允许开发者使用JavaScript进行服务器端编程。自2009年发布以来，Node.js因其高效的性能和广泛的应用而迅速成为后端开发的热门选择。本文将介绍Node.js的基本概念、安装和使用方法，并探讨其核心特性如事件驱动和非阻塞I/O，提供一些简单的代码示例，帮助初学者快速入门。Node.js的基本概念Node
Python和C++混合编程源代码分析硬件测试 C++11基础和特性 python c++开发语言
Python与Cython和C++混合编程指南在现代软件开发中，结合使用多种编程语言可以充分利用各自的优势。Python以其简洁易用和广泛的生态系统而著名，而Cython和C++则在性能优化和系统级编程方面表现出色。本文将详细介绍如何实现Python与Cython、Python与C++的混合编程，解释像NumPy这样的库是如何利用C/C++实现高性能的，并提供最佳实践与示例。目录概述Python与
全国青少年编程等级考试python一级真题2020年12月（含题库答题软件账号）程序猿下山
青少年软件编程（Python）等级考试试卷（一级）分数：100题数：37一、单选题(共25题，每题2分，共50分)二、判断题(共10题，每题2分，共20分)三、编程题(共2题，共30分)三、如何开通使用登录网址（PC端）：http://www.123lex.top/pstuLogin.aspx?sID=M03K登录网址（手机端）：www.123lex.top/examt/exam_Login.as
python openpyxl包excel 绘制线性图表呜呜呜小吴莫哭 python 仿真 excel 可视化 python
https://openpyxl.readthedocs.io/en/stable/charts/line.html说明：来自英文手册未翻译LineChartsLinechartsallowdatatobeplottedagainstafixedaxis.Theyaresimilartoscattercharts,themaindifferenceisthatwithlinechartseachd
python编程一级_青少年编程等级考试Python编程一级试卷 weixin_39635373 python编程一级
《青少年编程等级考试Python编程一级试卷》由会员分享，可在线阅读，更多相关《青少年编程等级考试Python编程一级试卷（9页珍藏版）》请在人人文库网上搜索。1、一、单项选择题（共20题，每题2.5分，共50分）1.运行下方代码段，输出的是（）。printa*3Aa3B3aCaaaDaaa2.下列表示为变量c赋值10的语句是（）。Ac10BIntc10Cvarc10DVariablec103.下
python创建excel图表_Python:使用图表创建Excel工作表 weixin_39546312 python创建excel图表
它有点复杂(和/或邪恶)，但类似的东西可以跨平台(包括在Linux下)使用JPype来包装SmartXLSExcelJava库。此示例使用SmartXLS中的简单图表创建(在Charts/ChartSample.class中)示例。#!/usr/bin/envpythonimportosimportos.pathimportjpype#orwhereveryourjavaisinstalledos
VSCode提示pylint isnot installed weixin_30838921 开发工具 python
1.下载所需扩展在https://www.lfd.uci.edu/~gohlke/pythonlibs/中下载所需扩展，我下载的是：pylint-2.1.1-py2.py3-none-any.whl。2.在CMD中执行命令在CMD中执行如下命令：pip3installpylint-2.1.1-py2.py3-none-any.whlC:\Users\Downloads>pip3installpyl
PennyLane 开源项目教程龚翔林Shannon
PennyLane开源项目教程pennylanePennyLaneisacross-platformPythonlibraryfordifferentiableprogrammingofquantumcomputers.Trainaquantumcomputerthesamewayasaneuralnetwork.项目地址:https://gitcode.com/gh_mirrors/pe/pen
五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的开源库（一）由数入道深度学习开源人工智能
在开发中，有一些开源库可以实现不同类型的推理，包括逻辑推理、概率推理、图推理、基于深度学习的推理等。以下是五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的现成开源库，它们各自的功能、特点和适用场景的详细介绍，并进行对比分析。1.逻辑推理推理：PyDatalog库介绍：PyDatalog是一个Python的逻辑编程库，它将逻辑编程的功能引入到Python中，提供了在Python中进行规则
python openpyxl三行代码将列表数据依次加入excel单元格并生成图表轩哥啊哈OvO Python #openpyxl python pygame numpy scrapy pip
OpenPyXLOpenPyXl几乎可以实现所有的Excel功能，而且接口清晰，文档丰富，学习成本相对较低。安装用pip安装pipinstallopenpyxl使用使用python的openpyxl模块，可以非常方便的将列表或元组数据依次加入excel单元格，可竖排也可横排，以下代码为最简单的横排：fromopenpyxlimportWorkbookl=123,154,165,144,265,36
vscode python pylint 问题汇总解决嘉禾天成
目录一、问题类型：二、解决问题2.1、Unabletoimport'xxx'pylint2.2、Noname'xxx'inmoudle'xxx'2.3、Accesstomemberxxxbeforedefinitionpylint!!!!本文章长期更新!!!!一、问题类型：1、Unabletoimport'xxx'pylint2、Noname'xxx'inmoudle'xxx'3、Accessto
主流编程语言的优劣分析及学习建议我的青春不太冷学习 java 开发语言 android 经验分享笔记
不同语言的特性主流编程语言的优劣分析及学习建议1.Python优点缺点学习建议适用于哪些人？2.JavaScript优点缺点学习建议适用于哪些人？3.Java优点缺点学习建议适用于哪些人？4.C++优点缺点学习建议适用于哪些人？5.Swift优点缺点学习建议适用于哪些人？结论主流编程语言的优劣分析及学习建议对于年轻人或者即将开始编程学习的人来说，选择一门合适的编程语言至关重要。不同的编程语言有各自
「Python系列」Python random模块、hashlib模块 ·零落· Python入门到掌握 python 开发语言 random
文章目录一、Pythonrandom模块1.`random.random()`2.`random.uniform(a,b)`3.`random.randint(a,b)`4.`random.randrange(start,stop,step)`5.`random.choice(seq)`6.`random.shuffle(seq)`7.`random.sample(seq,k)`8.`random
python round函数_python中round函数如何使用 weixin_39823017 python round函数
round函数很简单，对浮点数进行近似取值，保留几位小数。比如>>>round(10.0/3,2)3.33>>>round(20/7)3第一个参数是一个浮点数，第二个参数是保留的小数位数，可选，如果不写的话默认保留到整数。这么简单的函数，能有什么坑呢？1、round的结果跟python版本有关我们来看看python2和python3中有什么不同：$pythonPython2.7.8(default
python中round的用法_python中如何使用round函数 weixin_39754831 python中round的用法
在python3中，round（1.0/2.0）得到的是1，而在python2中，round（1.0/2.0）得到的是0$pythonPython2.7.8(default,Jun182015,18:54:19)[GCC4.9.1]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>round(0.5)1
python实现先来先服务_Python基础并发编程——进程 weixin_39568653 python实现先来先服务
一、进程的基础知识1、理论基础知识顾名思义，进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。进程的概念起源于操作系统，是操作系统最核心的概念，也是操作系统提供的最古老也是最重要的抽象概念之一。操作系统的其他所有内容都是围绕进程的概念展开的。PS：即使可以利用的cpu只有一个（早期的计算机确实如此），也能保证支持（伪）并发的能力。将一个单独的cpu变成多个虚拟的cpu（多道技术：时间多路复
基于Tomcat构建LNMT架构的网站并实现Session保持 weixin_33795833 后端 java 前端 ViewUI
基于Tomcat构建LNMT架构的网站并实现Session保持-小小忍者-51CTO技术博客简介LNMT=Linux+Nginx+MySQL+Tomcat；Tomcat服务器是一个免费的开放源代码的Web应用服务器，属于轻量级应用服务器；在中小型系统和并发访问用户不是很多的场合下被普遍使用，是开发和调试JSP程序的首选；架构需求Tomcat实现JSP动态请求解析的基本架构说明：由后端Tomcat负
python round函数用法 ncst Python python
round()方法返回x的小数点四舍五入到n个数字。语法以下是round()方法的语法：round(x[,n])参数x–这是一个数值表达式n–这也是一个数值表达式返回值该方法返回x的小数点四舍五入到n个数字例子下面的例子显示了round()方法的使用print“round(80.23456,2):“,round(80.23456,2)print“round(100.000056,3):“,roun
Python Excel页眉页脚设置详解 nuclear2011 Python Excel python Excel页眉和页脚 Excel奇偶页不同页眉和页脚 Excel第一页不同页眉和页脚插入图片到Excel页眉和页脚添加页码到Excel表格
目录什么是Excel中的页眉和页脚？使用工具使用Python在Excel中插入页眉和页脚使用Python在Excel中为页眉和页脚添加图片使用Python在Excel中为奇偶页插入不同的页眉和页脚使用Python在Excel中为第一页插入不同的页眉和页脚本文介绍如何使用Python在Excel中设置和自定义页眉和页脚。内容包括插入基础页眉和页脚、在页眉和页脚中添加图片、为奇偶页设置不同的页眉和页脚
Python入门进阶：68 个 Python 内置函数详解 Ndk开发校长程序员 python windows 开发语言
3.数学运算abs()返回绝对值divmode()返回商和余数round()四舍五入pow(a,b)求a的b次幂,如果有三个参数.则求完次幂后对第三个数取余sum()求和min()求最小值max()求最大值print(abs(-2))#绝对值:2print(divmod(20,3))#求商和余数:(6,2)print(round(4.50))#五舍六入:4print(round(4.51))#5p
使用Python中的random模块生成随机数 code_welike python 开发语言 Python
随机数在计算机编程中经常被用到，可以用于模拟实验、生成随机数据等各种场景。Python提供了random模块，其中包含了生成随机数的函数和方法。本文将介绍random模块的基本用法，并提供一些示例代码。首先，我们需要导入random模块，可以使用以下代码实现：importrandom一旦导入了random模块，我们就可以使用其中的函数和方法来生成随机数了。下面是一些常用的函数和方法：random.
random（随机数） MoRanzhi1203 python
random（随机数）Python的random库是用于生成随机数的标准库。它提供了各种功能，可以产生伪随机数、随机选择元素、打乱序列等。importrandom该模块实现了各种分布的伪随机数生成器。对于整数，从范围中有统一的选择。对于序列，存在随机元素的统一选择、用于生成列表的随机排列的函数、以及用于随机抽样而无需替换的函数。在实数轴上，有计算均匀、正态（高斯）、对数正态、负指数、伽马和贝塔分布
Python 内置函数 round() 详解嘻嘻爱编码 Python从入门到放弃 1024程序员节 python 开发语言
在Python编程中，round()函数是一个非常实用的内置函数，用于对数字进行四舍五入。无论是在数据处理、财务计算还是科学计算中，round()函数都能帮助我们得到所需的精确值。本文将详细介绍round()函数的用法和注意事项。1.round()函数的基本语法round(number,ndigits=None)参数说明number:要四舍五入的数字，可以是整数或浮点数。ndigits:可选参数，
LeetCode刷题 | Day 2 最长严格递增或递减子列表（Longest Increasing or Decreasing SubList）上坤 LeetCode刷题 leetcode 算法最长递增子列表动态规划 Python C++dynamic programming
LeetCode刷题|Day2最长严格递增或递减子列表（LongestIncreasingDecreasingSubList）文章目录LeetCode刷题|Day2最长严格递增或递减子列表（LongestIncreasingDecreasingSubList）前言一、题目概述二、解题方法2.1动态规划思想2.1.1思路讲解2.1.2伪代码+逐步输出示例2.1.3Python代码如下2.1.4C++
python资本市场财务数据分析_Python对股票财务数据进行可视化分析 weixin_39834984
对股票财务数据进行分析是非常必要，但因股票数据量很大，单凭浏览网页或在软件客户端查看是非常浪费精力的一件事，通过Python进行网页数据提取，将财务数据图表化会更加直观。以下代码在Python3.6环境下通过：注：使用注意，将此代码保存为一个文本文件扩展名为.py，在这个文件同目录下建立二个子目录：数据-分析、数据-下载，也可以更改代码中的路径，否则运行时会报错。importmatplotlib.
Python虚拟环境介绍 weixin_34150224 python 操作系统
在使用Python语言的时候我们使用pip来安装第三方包，但是由于pip的特性，系统中只能安装每个包的一个版本。但是在实际项目开发中，不同项目可能需要第三方包的不同版本，Python的解决方案就是虚拟环境。顾名思义，虚拟环境就是虚拟出来的一个隔离的Python环境，每个项目都可以有自己的虚拟环境，用pip安装各自的第三方包，不同项目之间也不会存在冲突。创建虚拟环境需要一些工具，本文将会介绍这些工具
【面试常问之python】python中的面试常考知识点欢喜躲在眉梢里-柚子面试经验分享 servlet
目录1、list（列表）和tuple（元组）的区别？2、什么是pep8，pep8能说出几点？3、Python内存管理4、Python常用模块有哪些能不能说一下怎么使用用来干过什么？5.Python中的多进程和多线程都使用什么模块？6.Python的GIL是什么7.什么是协程8.Flask和django的区别9.项目相关流程虚拟环境requestsss对象使用模块10.深浅拷贝原理现象11.Pyth
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他