Python 学习者

Python并发编程之Futures

不论是哪一种语言，并发编程都是一项非常重要的技巧。比如我们上一章用的爬虫，就被广泛用在工业的各个领域。我们每天在各个网站、App上获取的新闻信息，很大一部分都是通过并发编程版本的爬虫获得的。

正确并合理的使用并发编程，无疑会给我们的程序带来极大性能上的提升。今天我们就一起学习Python中的并发编程——Futures。

区分并发和并行

我们在学习并发编程时，常常会听到两个词：并发(Concurrency)和并行(Parallelism)这两个术语。这两者经常一起使用，导致很多人以为他们是一个意思，其实是不对的。

首先要辨别一个误区，在Python中，并发并不是只同一时刻上右多个操作(thread或者task)同时进行。相反，在某个特定的时刻上它只允许有一个操作的发生，只不过线程或任务之间会相互切换直到完成，就像下面的图里表达的

在上图中出现了task和thread两种切换顺序的不同方式。分别对应了Python中并发两种形式——threading和asyncio。

对于线程，操作系统知道每个线程的所有信息，因此他会做主在适当的时候做线程切换，这样的好处就是代码容易编写，因为程序员不需要做任何切换操作的处理；但是切换线程的操作，有可能出现在一个语句的执行过程中( 比如X+=1)，这样比较容易出现race condiiton的情况。

而对于asyncio，主程序想要切换任务的时候必须得到此任务可以被切换的通知，这样一来就可以避免出现上面的race condition的情况。

至于所谓的并行，只在同一时刻、同时发生。Python中的multi-Processing便是这个意思对应多进程，我们可以这么简单的理解，如果我们的电脑是8核的CPU，那么在运行程序时，我们可以强制Python开启8个进程，同时执行，用以加快程序的运行速度。大概是下面这个图的思路

对比看来，并发通常用于I/O操作频繁的场景。比方我们要从网站上下载多个文件，由于I/O操作的时间要比CPU操作的时长多的多，这时并发就比较适合。而在CPU使用比较heavy的场景中，为了加快运行速度，我们会多用几台机器，让多个处理器来运算。

还记得以前写了个博客总结过：在Python中的多线程是依靠CPU切换上下文实现的一种“伪多线程”，在进行大量线程切换过程中会占用比较多的CPU资源，而在进行IO操作时候（不论是在网络上进行数据交互还是从内存、硬盘上读写数据）是不需要CPU进行计算的。所以多线程只适用于IO操作密集的环境，不适用于计算密集型操作。

并发编程之Futures

单线程于多线程性能比较

我们下面通过一个实例，从代码的角度来理解并发编程中的Futures，并进一步比较其于单线程的性能区别

假设我们有个任务，从网站上下载一些内容然后打印出来，如果用单线程的方式是这样实现的

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333 
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
import requests
import time

def download_one(url):
    resp = requests.get(url)
    print('Read {} from {}'.format(len(resp.content),url))

def download_all(urls):
    for url in urls:
        download_one(url)

def main():
    sites = [
        'https://en.wikipedia.org/wiki/Portal:Arts',
        'https://en.wikipedia.org/wiki/Portal:History',
        'https://en.wikipedia.org/wiki/Portal:Society', 
        'https://en.wikipedia.org/wiki/Portal:Biography',
        'https://en.wikipedia.org/wiki/Portal:Mathematics',
        'https://en.wikipedia.org/wiki/Portal:Technology',
        'https://en.wikipedia.org/wiki/Portal:Geography',
        'https://en.wikipedia.org/wiki/Portal:Science',
        'https://en.wikipedia.org/wiki/Computer_science',
        'https://en.wikipedia.org/wiki/Python_(programming_language)',
        'https://en.wikipedia.org/wiki/Java_(programming_language)',
        'https://en.wikipedia.org/wiki/PHP',
        'https://en.wikipedia.org/wiki/Node.js',
        'https://en.wikipedia.org/wiki/The_C_Programming_Language',
        'https://en.wikipedia.org/wiki/Go_(programming_language)' 
    ]

    start_time = time.perf_counter()

    download_all(sites)
    end_time = time.perf_counter()

    print('Download {} sites in {} seconds'.format(len(sites),end_time-start_time))


if __name__ == '__main__':
    main()

这是种最简单暴力最直接的方式：

先遍历存储网站的列表

对当前的网站进行下载操作

当前操作完成后，再对下一个网站进行同样的操作，一直到结束。

可以试出来总耗时大概是2s多，单线程的方式简单明了，但是最大的问题是效率低下，程序最大的时间都消耗在I/O等待上（这还是用的print，如果是写在硬盘上的话时间会更多）。如果在实际生产环境中，我们需要访问的网站至少是以万为单位的，所以这个方案根本行不通。

接着我们看看多线程版本的代码

import concurrent.futures
import requests
import threading
import time

def download_one(url):
    resp = requests.get(url).content
    print('Read {} from {}'.format(len(resp),url))

def download_all(sites):
    with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
        executor.map(download_one,sites)

def main():

    sites = [
    'https://en.wikipedia.org/wiki/Portal:Arts',
    'https://en.wikipedia.org/wiki/Portal:History',
    'https://en.wikipedia.org/wiki/Portal:Society', 
    'https://en.wikipedia.org/wiki/Portal:Biography',
    'https://en.wikipedia.org/wiki/Portal:Mathematics',
    'https://en.wikipedia.org/wiki/Portal:Technology',
    'https://en.wikipedia.org/wiki/Portal:Geography',
    'https://en.wikipedia.org/wiki/Portal:Science',
    'https://en.wikipedia.org/wiki/Computer_science',
    'https://en.wikipedia.org/wiki/Python_(programming_language)',
    'https://en.wikipedia.org/wiki/Java_(programming_language)',
    'https://en.wikipedia.org/wiki/PHP',
    'https://en.wikipedia.org/wiki/Node.js',
    'https://en.wikipedia.org/wiki/The_C_Programming_Language',
    'https://en.wikipedia.org/wiki/Go_(programming_language)' 
    ]
    
    start_time = time.perf_counter()
    download_all(sites)
    # for i in sites:
    end_time = time.perf_counter()
    
    # print('Down {} sites in {} seconds'.format(len(sites),end_time-start_time))

if __name__ == '__main__':
    main()

这段代码的运行时长大概是0.2s，效率一下提升了10倍多，可以注意到这个版本和单线程的区别主要在下面：

def download_all(sites):
    with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
        executor.map(download_one,sites)

在上面的代码中我们创建了一个线程池，有5个线程可以分配使用。executer.map()与以前将的Python内置的map()函数，表示对sites中的每一个元素并发的调用函数download_one()函数。

顺便提一下，在download_one()函数中，我们使用的requests.get()方法是线程安全的(thread-safe)，因此在多线程的环境下，它也可以安全使用，并不会出现race condition（条件竞争）的情况。

另外，虽然线程的数量可以自己定义，但是线程数并不是越多越好，以为线程的创建、维护和删除也需要一定的开销。所以如果设置的很大，反而会导致速度变慢，我们往往要根据实际的需求做一些测试，来寻找最优的线程数量。

当然，我们也可以用并行的方式去提高运行效率，只需要在download_all()函数中做出下面的变化即可

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333 
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
def download_all(sites):
    with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
    with concurrent.futures.ProcessPoolExecutor() as executor:   #这个方法可以改成并行
        executor.map(download_one,sites)

在需要改的这部分代码中，函数ProcessPoolExecutor()表示创建进程池，使用多个进程并行的执行程序。不过，这里通常省略参数workers，因为系统会自动返回CPU的数量作为可以调用的进程数。

就像上面说的，并行方式一般用在CPU密集型的场景中，因为对于I/O密集型操作多数时间会用于等待，相比于多线程，使用多进程并不会提升效率，反而很多时候，因为CPU数量的限制，会导致执行效率不如多线程版本。

到底什么是Futures？

Python中的Futures，位于concurrent.futures和asyncio中，他们都表示带有延迟的操作，Futures会将处于等待状态的操作包裹起来放到队列中，这些操作的状态可以随时查询。而他们的结果或是异常，也能在操作后被获取。

通常，作为用户，我们不用考虑如何去创建Futures，这些Futures底层会帮我们处理好，我们要做的就是去schedule这些Futures的执行。比方说，Futures中的Executor类，当我们中的方法done()，表示相对应的操作是否完成——用True表示已完成，ongFalse表示未完成。不过，要注意的是done()是non-blocking的，会立刻返回结果，相对应的add_done_callback(fn)，则表示Futures完成后，相对应的参数fn，会被通知并执行调用。

Futures里还有一个非常重要的函数result()，用来表示future完成后，返回器对应的结果或异常。而as_completed(fs)，则是针对给定的future迭代器fs，在其完成后，返回完成后的迭代器。

所以也可以把上面的例子写成下面的形式：

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333 
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
def download_all(sites):
    with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
        to_do = []
        for site in sites:
            future = executor.submit(download_one,site)
            to_do.append(site)

        for future in concurrent.futures.as_completed(to_do):
            future.result()

这里，我们首先用executor.submit()，将下载每个网站的内容都放进future队列to_do里等待执行。然后是as_completed()函数，在future完成后输出结果

不过这里有个事情要注意一下：future列表中每个future完成的顺序和他在列表中的顺序不一定一致，至于哪个先完成，取决于系统的调度和每个future的执行时间。

为什么多线程每次只有一个线程执行？

前面我们讲过，在一个时刻下，Python主程序只允许有一个线程执行，所以Python的并发，是通过多线程的切换完成的，这是为什么呢？

这就又和以前讲的知识串联到一起了——GIL（全局解释器锁），这里在复习下：

事实上，Python的解释器并不是线程安全的，为了解决由此带来的race condition等问题，Python就引入了GIL，也就是在同一个时刻，只允许一个线程执行。当然，在进行I/O操作是，如果一个线程被block了，GIL就会被释放，从而让另一个线程能够继续执行。

总结

这节课里我们先学习了Python中并发和并行的概念

并发——通过线程(thread)和任务(task)之间相互切换的方式实现，但是同一时刻，只允许有一个线程或任务执行

并行——多个进程同时进行。

并发通常用于I/O频繁操作的场景，而并行则适用于CPU heavy的场景

随后我们通过一个下载网站内容的例子，比较了单线程和运用FUtures的多线程版本的性能差异，显而易见，合理的运用多线程，能够极大的提高程序运行效率。

我们还大致了解了Futures的方式，介绍了一些常用的函数，并辅以实例加以理解。

要注意，Python中之所以同一时刻只允许一个线程运行，其实是由于GIL的存在。但是对于I/O操作而言，当其被block的时候，GIL会被释放，使其他线程继续执行。

【python】协程（coroutine） atwdy Python python coroutine 协程 asyncio
协程（coroutine）可以理解为一个可以中途暂停保存当前执行状态信息并可以从此处恢复执行的函数，多个协程共用一个线程执行，适合执行需要“等待”的任务。所以严格意义上，多个协程同一时刻也只有一个在真正的执行，因为线程是任务调度的基本单位。注意这里的执行指的是占用CPU计算，不包括等待阻塞等场景。python中实现协程的标准库是asyncio，标准库的实现中大致可以由底层到顶层分为下面几个对象：c
基于阿里云调用deepseek大模型 atwdy 大模型 deepseek deepseek-r1 deepseek API 阿里云
文章目录1.单轮对话2.多轮对话参考文档选择需要调用的模型，每个模型的详细信息中会有API示例（deepseek-r1），需要做的就是申请自己的APIkey就行了，过程中可能需要实名认证。python中安装OpenAISDK：pipinstallopenai。安装后如果出现ImportError，可能是python的版本低了，升级下版本。当前测试环境是Python3.9.7，openai==1.6
01计算机视觉学习计划依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图
python-Scrapy爬虫框架介绍（整个数据的流程） onesalatree Scrapy框架爬虫 python 软件框架爬虫 scrapy
python-Scrapy爬虫框架介绍随着在家的线上教育的进行，课程的深入学习，所要学习的内容和作业也在不断的增多，所以没有过多的自己的时间去学习新的爬虫知识，但疫情逐渐的在好转，我也很是期待开学的那一天，毕竟线上教育的效果没有在学校的更为显著，主要是老师们录课很辛苦今天我想和兄弟们分享一下Scrapy爬虫的原理，也是自己最近刚学习的，有什么不足的地方兄弟们可以评论你或者私信喔。Python爬虫的
Conda操作使用教程迷鹿鹿鹿鹿鹿 conda
声明：该文章仅为学习使用，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！如有侵权，请私信联系本人删帖！Conda操作使用教程Conda是一个开源的包管理和环境管理工具，支持多种编程语言（以Python为主）。它能够帮助用户快速安装、运行和更新软件包，并创建相互隔离的虚拟环境，避免项目之间的依赖冲突。目录Conda的安装基础命令虚拟环境管理包管理环境导出与共享常见问题总结一、安装1
使用 Dlib 库进行人脸检测和人脸识别萧鼎 python基础到进阶教程计算机视觉人工智能 python 人脸识别人脸检测
使用Dlib库进行人脸检测和人脸识别什么是Dlib？Dlib是一个广泛使用的C++库，提供了多种用于机器学习和计算机视觉的工具。它包含了人脸检测、人脸识别、物体检测、图像处理等功能。Dlib具有高效、易用的Python接口，因此它也被广泛应用于Python中进行深度学习和计算机视觉任务。安装Dlib首先，我们需要在Python环境中安装Dlib库。你可以通过pip进行安装：pipinstalldl
Python图形界面开发：PyQt与Tkinter对比分析萧鼎 python基础到进阶教程 python pyqt 数据库
Python图形界面开发：PyQt与Tkinter对比分析图形用户界面（GUI）是应用程序中不可或缺的一部分，可以帮助用户更直观地与程序进行交互。Python拥有许多开发GUI的库，其中PyQt和Tkinter是最受欢迎的两个选择。本篇博客将从功能、易用性、性能、社区支持、学习曲线等角度对比分析这两个库，并通过一个简单的实战项目帮助你更直观地理解它们的差异。一、PyQt与Tkinter简介1.Py
网页自动化测试和爬虫：Selenium库入门与进阶萧鼎 python基础到进阶教程爬虫 selenium 测试工具
网页自动化测试和爬虫：Selenium库入门与进阶在现代Web开发和数据分析中，自动化测试和数据采集成为了开发流程中的重要部分。Python的Selenium库是一种强大的工具，不仅用于网页自动化测试，也在网页爬虫中得到了广泛的应用。本文将带你从Selenium的基础用法入手，逐步深入到进阶技巧，帮助你轻松应对网页自动化任务。一、Selenium简介与安装Selenium是一个浏览器自动化工具，可
Python中的PDF处理工具：PyPDF2和ReportLab使用指南萧鼎 python基础到进阶教程 python pdf pypdf2 reportlab
Python中的PDF处理工具：PyPDF2和ReportLab使用指南在日常工作和项目中，PDF文件处理是个常见需求，不论是合并报告、加密文档、填充表单，还是生成发票。Python中有许多用于操作PDF文件的库，其中PyPDF2和ReportLab是两个广泛使用的工具：前者用于PDF文档的读取和修改，后者用于从头生成PDF文件。在这篇博客中，我们将介绍如何使用PyPDF2和ReportLab完成
DevOps落地实践点滴和踩坑记录-(1) xuhss_com 计算机 devops 运维计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统记录初衷本人一直在从事企业内DevOps落地实践的工作，走了不少弯路，也努力在想办法解决面临的问题，期间也经历过不少人和事
一文读懂！OpenCV 实时人脸识别从 0 到 1，小白也能轻松实操的超详细教程（完整教程及源码） AI_DL_CODE opencv 人工智能计算机视觉人脸识别
摘要：本文围绕使用OpenCV实现实时人脸识别展开。从环境搭建入手，详细介绍Python及相关库的安装。数据准备环节涵盖收集、标注及预处理步骤。深入阐述特征提取、模型训练方法，包含传统与深度学习方式，还介绍OpenCV预训练模型的使用与评估。详细讲解实时识别过程，包括打开摄像头、逐帧处理及结果显示优化。针对复杂场景，提出光照、姿态、遮挡等问题的解决办法及模型更新维护策略。通过丰富代码示例与解释，助
Python爬虫丨批量下载必应4K壁纸凌小添 Python爬虫项目 python 爬虫开发语言
1.项目背景经常用电脑的朋友应该会发现，电脑锁屏页面是微软必应每天更新的精美壁纸，偶尔还能看到一些十分惊艳的壁纸，于是我去寻找如何下载他们，我在GitHub上闲逛时，还真发现一个自动归档这些壁纸的仓库。该项目由GitHub用户niumoo维护，项目地址：niumoo/bing-wallpaper。该项目每天自动归档必应首页美图！但当我点开README.md时，发现仓库仅保存图片Markdown索引
练习题：70 狐凄练习算法
Python题目题目编写一个函数，接受两个参数，进行除法运算，如果除数为0，使用try-except语句捕获异常并返回错误信息。题目分析需求理解本题要求使用Python编写一个函数，该函数接收两个参数，对这两个参数进行除法运算。在运算过程中，需要考虑除数为0的特殊情况，当除数为0时，不能让程序崩溃，而是要使用try-except语句捕获异常，并返回相应的错误信息。关键知识点函数定义：在Python
Python OCR库：自动化测试验证码识别神器！测试大大怪 python ocr selenium appium 功能测试测试用例测试工具
在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库，包括pyocr、pytesseract和python-tesseract、EasyOCR。本文将对它们进行比较，并提供一些示例代码来演示它们在实际接口自动化工作中的应用。1、pyocrPyOCR是一
python量化交易——金融数据管理最佳实践——使用qteasy大批量自动拉取金融数据 QTEASY量化交易 qteasy 量化交易 python python 金融量化交易
文章目录使用数据获取渠道自动填充数据QTEASY数据拉取功能数据拉取接口`refill_data_source()`数据拉取API的功能特性多渠道拉取数据实现下载流量控制实现错误重试日志记录其他功能qteasy是一个功能全面且易用的量化交易策略框架，Github地址在这里。使用它，能轻松地获取历史数据，创建交易策略并完成回测和优化，还能实盘运行。项目文档在这里。使用qteasy,您可以非常容易地在
初学者如何用 Python 写第一个爬虫？陆鳐LuLu python 爬虫开发语言
编写第一个Python爬虫并不难，以下是一个简单的步骤指南，帮助从零开始。1.安装必要的库首先，你需要安装requests和BeautifulSoup这两个库。requests用于发送HTTP请求，BeautifulSoup用于解析HTML内容。pipinstallrequestsbeautifulsoup42.导入库在你的Python脚本中导入所需的库。importrequestsfrombs4
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe statistics.insight 数据科学持续学习机器学习数据挖掘数据分析人工智能 python
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe目录python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库#python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库importpandasaspdimportnumpyasnp#不显示关于在切片副本上设
第十五届蓝桥杯python组 Rainbow一定行蓝桥杯python组蓝桥杯
填空题试题A:拼正方形【问题描述】小蓝正在玩拼图游戏，他有7385137888721个2×2的方块和10470245个1×1的方块，他需要从中挑出一些来拼出一个正方形，比如用3个2×2和4个1×1的方块可以拼出一个4×4的正方形，用9个2×2的方块可以拼出一个6×6的正方形，请问小蓝能拼成的最大的正方形的边长为多少。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数
python中的numpy库有什么优缺点_python中关于numpy库的介绍 weixin_34938347
1.Numpy是什么？NumPy(NumericalPython的缩写)是一个开源的Python科学计算库。使用NumPy，就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数，涵盖线性代数运算、傅里叶变换和随机数生成等功能。这个库的前身是1995年就开始开发的一个用于数组运算的库。经过了长时间的发展，基本上成了绝大部分Python科学计算的基础包，当然也包括所有提供Python接口的深
Python 记录日志报警的方式 Tipriest_ Python学习 python 前端 logging 报警 alarm mail
在Python标准库中，可以列举出如下常见场景日志报警解决方案：方案1：简单日志告警（推荐基础方案）importloggingdefsend_alert(message):logging.error(f"ALERT:{message}")#可扩展：同时写入文件/发送到日志服务器#配置日志格式logging.basicConfig(level=logging.ERROR,format='%(asct
python numpy学习黄小猿 python numpy meshgrid
目录np.meshgridnp.where1.np.meshgrid可以生成一对协调的点，x=np.arange(-5,5,1)y=np.arange(-5,5,1)xx,yy=np.meshgrid(x,y,sparse=True)xx#输出：array([[-5,-4,-3,-2,-1,0,1,2,3,4]])yy#输出：array([[-5],[-4],[-3],[-2],[-1],[0],
栈的应用--括号匹配(python篇) Nanhuiyu 数据结构python描述 python pycharm 数据结构
这篇文章将使用python实现栈的应用之括号匹配首先，明确需求，需求是：1,通过控制台输入一串字符串，判断是否全为括号；2,将括号分为左括号和右括号；3,创建一个栈，将左括号入栈，同时从字符串中取出右括号，进行匹配，若匹配成功，则该左括号出栈，否则右括号入新栈；4,当字符串匹配完成时，对两个栈的长度进行匹配，若长度相等且为零，则表示匹配成功，若长度相等且不为零，则对栈内元素进行匹配，若重新匹配使得
conda的作用一只积极向上的小咸鱼 conda
一概览Conda是一个开源的包管理和环境管理工具，主要用于Python及其他编程语言的依赖管理和环境隔离。它的核心作用有以下几点：1.包管理可以安装、更新、卸载Python及其依赖包（类似于pip）。支持多语言（不仅限于Python，还支持C/C++,R,Ruby,Lua等）。依赖自动管理，能解决复杂的库依赖问题，例如：condainstallnumpypandas2.环境管理允许创建多个独立的虚
python如何获取期权行情数据 python自动化工具量化投资 python 区块链开发语言
最近几天股指期权日内趋势比较明显，但是期权行情数据不易获得，好在akshare库为提供了一个便捷的途径来获取期权行情数据。本文将介绍如何使用Python和akshare库来获取交易所金融期权标的物当日行情数据、返回品种所有合约以及期权行情分钟数据。1.获取上海证券交易所金融期权标的物当日行情数据需要导入akshare库，并使用ak.option_finance_sse_underlying函数来获
HTML：Web 开发的基石烂蜻蜓 HTML 前端 html html5 css
在互联网的广袤世界里，网页构成了信息交互的主要界面。无论是新闻资讯、电商购物，还是社交娱乐，每一个网页背后，都离不开HTML这一关键技术的支撑。对于渴望投身Web开发领域的新手而言，HTML无疑是开启大门的第一把钥匙。一、HTML是什么HTML，全称超文本标记语言（HyperTextMarkupLanguage），它并非传统意义上的编程语言，而是一种标记语言。其核心功能是通过一系列特定的标签（ta
多版本Python共存后端架构魔法构筑者 python 开发语言 Python
多版本Python共存Python是一种非常流行的编程语言，有许多不同版本的Python可供使用。在某些情况下，您可能需要在同一台计算机上安装多个版本的Python，以便能够运行不同版本的Python脚本或应用程序。本文将介绍如何在Windows和Linux操作系统上安装和配置多个Python版本。Windows系统在Windows上安装多个Python版本非常容易。您可以从Python官方网站下
2024年Python最新蓝桥杯基础练习全解答案+解析共17题 python，三年经验Python开发面经总结 2401_84139963 程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
jetson xavier nx conda create --n yourname python=3.6报错 aqzengkuasheng conda 计算机视觉目标检测 pytorch 边缘计算
Preparingtransaction:doneVerifyingtransaction:doneExecutingtransaction:doneERRORconda.core.link:_execute(699):Anerroroccurredwhileinstallingpackage‘https://mirrors.bfsu.edu.cn/anaconda/pkgs/free::open
C、C++ 与 C# 的区别及应用场景 xl.liu c语言 c++c#
C、C++与C#的区别及应用场景随着信息技术的快速发展，编程语言的选择对于项目成功至关重要。C、C++和C#是三种广泛使用的编程语言，它们各自具有独特的特点和适用领域。本文将基于当前IT行业的发展趋势，探讨这三种语言之间的主要差异，以及它们各自的优缺点和应用场景。IT行业的现状和发展趋势在当今的IT行业中，云计算、大数据、人工智能（AI）以及物联网（IoT）等技术正在引领新一轮的技术革新。这些技术
解析Python网络爬虫：核心技术、Scrapy框架、分布式爬虫（期末重点题目）一口酪 python scrapy
第一章网络爬虫又称网页蜘蛛或（网络机器人）网络爬虫能够按照一定的（规则），自动请求万维网站并提取网络数据爬虫是手动请求万维网网站且提取网页数据的程序。（×）爬虫爬取的是网站后台的数据。（×）通用爬虫用于将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。（√）简答题：简述通用爬虫和聚焦爬虫。1.通用爬虫又称全网爬虫，主要用于将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。聚焦网络爬
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh ickes@192.168.27.211 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

Python并发编程之Futures

你可能感兴趣的:(python,编程语言)