使用Python中的线程进行网络编程的入门教程

引言

对于 Python 来说，并不缺少并发选项，其标准库中包括了对线程、进程和异步 I/O 的支持。在许多情况下，通过创建诸如异步、线程和子进程之类的高层模块，Python 简化了各种并发方法的使用。除了标准库之外，还有一些第三方的解决方案，例如 Twisted、Stackless 和进程模块。本文重点关注于使用 Python 的线程，并使用了一些实际的示例进行说明。虽然有许多很好的联机资源详细说明了线程 API，但本文尝试提供一些实际的示例，以说明一些常见的线程使用模式。

全局解释器锁 (Global Interpretor Lock) 说明 Python 解释器并不是线程安全的。当前线程必须持有全局锁，以便对 Python 对象进行安全地访问。因为只有一个线程可以获得 Python 对象/C API，所以解释器每经过 100 个字节码的指令，就有规律地释放和重新获得锁。解释器对线程切换进行检查的频率可以通过 sys.setcheckinterval() 函数来进行控制。

此外，还将根据潜在的阻塞 I/O 操作，释放和重新获得锁。有关更详细的信息，请参见参考资料部分中的 Gil and Threading State 和 Threading the Global Interpreter Lock。

需要说明的是，因为 GIL，CPU 受限的应用程序将无法从线程的使用中受益。使用 Python 时，建议使用进程，或者混合创建进程和线程。

首先弄清进程和线程之间的区别，这一点是非常重要的。线程与进程的不同之处在于，它们共享状态、内存和资源。对于线程来说，这个简单的区别既是它的优势，又是它的缺点。一方面，线程是轻量级的，并且相互之间易于通信，但另一方面，它们也带来了包括死锁、争用条件和高复杂性在内的各种问题。幸运的是，由于 GIL 和队列模块，与采用其他的语言相比，采用 Python 语言在线程实现的复杂性上要低得多。
使用 Python 线程

要继续学习本文中的内容，我假定您已经安装了 Python 2.5 或者更高版本，因为本文中的许多示例都将使用 Python 语言的新特性，而这些特性仅出现于 Python2.5 之后。要开始使用 Python 语言的线程，我们将从简单的 "Hello World" 示例开始：
hello_threads_example

    import threading
    import datetime
    
    class ThreadClass(threading.Thread):
     def run(self):
      now = datetime.datetime.now()
      print "%s says Hello World at time: %s" % 
      (self.getName(), now)
    
    for i in range(2):
     t = ThreadClass()
     t.start()

如果运行这个示例，您将得到下面的输出：

   # python hello_threads.py 
   Thread-1 says Hello World at time: 2008-05-13 13:22:50.252069
   Thread-2 says Hello World at time: 2008-05-13 13:22:50.252576

仔细观察输出结果，您可以看到从两个线程都输出了 Hello World 语句，并都带有日期戳。如果分析实际的代码，那么将发现其中包含两个导入语句；一个语句导入了日期时间模块，另一个语句导入线程模块。类 ThreadClass 继承自 threading.Thread，也正因为如此，您需要定义一个 run 方法，以此执行您在该线程中要运行的代码。在这个 run 方法中唯一要注意的是，self.getName() 是一个用于确定该线程名称的方法。

最后三行代码实际地调用该类，并启动线程。如果注意的话，那么会发现实际启动线程的是 t.start()。在设计线程模块时考虑到了继承，并且线程模块实际上是建立在底层线程模块的基础之上的。对于大多数情况来说，从 threading.Thread 进行继承是一种最佳实践，因为它创建了用于线程编程的常规 API。
使用线程队列

如前所述，当多个线程需要共享数据或者资源的时候，可能会使得线程的使用变得复杂。线程模块提供了许多同步原语，包括信号量、条件变量、事件和锁。当这些选项存在时，最佳实践是转而关注于使用队列。相比较而言，队列更容易处理，并且可以使得线程编程更加安全，因为它们能够有效地传送单个线程对资源的所有访问，并支持更加清晰的、可读性更强的设计模式。

在下一个示例中，您将首先创建一个以串行方式或者依次执行的程序，获取网站的 URL，并显示页面的前 1024 个字节。有时使用线程可以更快地完成任务，下面就是一个典型的示例。首先，让我们使用 urllib2 模块以获取这些页面（一次获取一个页面），并且对代码的运行时间进行计时：
URL 获取序列

    import urllib2
    import time
    
    hosts = ["http://yahoo.com", "http://google.com", "http://amazon.com",
    "http://ibm.com", "http://apple.com"]
    
    start = time.time()
    #grabs urls of hosts and prints first 1024 bytes of page
    for host in hosts:
     url = urllib2.urlopen(host)
     print url.read(1024)
    
    print "Elapsed Time: %s" % (time.time() - start)

在运行以上示例时，您将在标准输出中获得大量的输出结果。但最后您将得到以下内容：

    Elapsed Time: 2.40353488922

让我们仔细分析这段代码。您仅导入了两个模块。首先，urllib2 模块减少了工作的复杂程度，并且获取了 Web 页面。然后，通过调用 time.time()，您创建了一个开始时间值，然后再次调用该函数，并且减去开始值以确定执行该程序花费了多长时间。最后分析一下该程序的执行速度，虽然“2.5 秒”这个结果并不算太糟，但如果您需要检索数百个 Web 页面，那么按照这个平均值，就需要花费大约 50 秒的时间。研究如何创建一种可以提高执行速度的线程化版本：
URL 获取线程化

     #!/usr/bin/env python
     import Queue
     import threading
     import urllib2
     import time
     
     hosts = ["http://yahoo.com", "http://google.com", "http://amazon.com",
     "http://ibm.com", "http://apple.com"]
     
     queue = Queue.Queue()
     
     class ThreadUrl(threading.Thread):
     """Threaded Url Grab"""
      def __init__(self, queue):
       threading.Thread.__init__(self)
       self.queue = queue
     
      def run(self):
       while True:
        #grabs host from queue
        host = self.queue.get()
      
        #grabs urls of hosts and prints first 1024 bytes of page
        url = urllib2.urlopen(host)
        print url.read(1024)
      
        #signals to queue job is done
        self.queue.task_done()
     
     start = time.time()
     def main():
     
      #spawn a pool of threads, and pass them queue instance 
      for i in range(5):
       t = ThreadUrl(queue)
       t.setDaemon(True)
       t.start()
       
      #populate queue with data  
       for host in hosts:
        queue.put(host)
      
      #wait on the queue until everything has been processed   
      queue.join()
     
     main()
     print "Elapsed Time: %s" % (time.time() - start)

对于这个示例，有更多的代码需要说明，但与第一个线程示例相比，它并没有复杂多少，这正是因为使用了队列模块。在 Python 中使用线程时，这个模式是一种很常见的并且推荐使用的方式。具体工作步骤描述如下：

创建一个 Queue.Queue() 的实例，然后使用数据对它进行填充。
将经过填充数据的实例传递给线程类，后者是通过继承 threading.Thread 的方式创建的。
生成守护线程池。
每次从队列中取出一个项目，并使用该线程中的数据和 run 方法以执行相应的工作。
在完成这项工作之后，使用 queue.task_done() 函数向任务已经完成的队列发送一个信号。
对队列执行 join 操作，实际上意味着等到队列为空，再退出主程序。

在使用这个模式时需要注意一点：通过将守护线程设置为 true，将允许主线程或者程序仅在守护线程处于活动状态时才能够退出。这种方式创建了一种简单的方式以控制程序流程，因为在退出之前，您可以对队列执行 join 操作、或者等到队列为空。队列模块文档详细说明了实际的处理过程，请参见参考资料：

join()
保持阻塞状态，直到处理了队列中的所有项目为止。在将一个项目添加到该队列时，未完成的任务的总数就会增加。当使用者线程调用 task_done() 以表示检索了该项目、并完成了所有的工作时，那么未完成的任务的总数就会减少。当未完成的任务的总数减少到零时，join() 就会结束阻塞状态。

使用多个队列

因为上面介绍的模式非常有效，所以可以通过连接附加线程池和队列来进行扩展，这是相当简单的。在上面的示例中，您仅仅输出了 Web 页面的开始部分。而下一个示例则将返回各线程获取的完整 Web 页面，然后将结果放置到另一个队列中。然后，对加入到第二个队列中的另一个线程池进行设置，然后对 Web 页面执行相应的处理。这个示例中所进行的工作包括使用一个名为 Beautiful Soup 的第三方 Python 模块来解析 Web 页面。使用这个模块，您只需要两行代码就可以提取所访问的每个页面的 title 标记，并将其打印输出。
多队列数据挖掘网站

import Queue
import threading
import urllib2
import time
from BeautifulSoup import BeautifulSoup

hosts = ["http://yahoo.com", "http://google.com", "http://amazon.com",
    "http://ibm.com", "http://apple.com"]

queue = Queue.Queue()
out_queue = Queue.Queue()

class ThreadUrl(threading.Thread):
  """Threaded Url Grab"""
  def __init__(self, queue, out_queue):
    threading.Thread.__init__(self)
    self.queue = queue
    self.out_queue = out_queue

  def run(self):
    while True:
      #grabs host from queue
      host = self.queue.get()

      #grabs urls of hosts and then grabs chunk of webpage
      url = urllib2.urlopen(host)
      chunk = url.read()

      #place chunk into out queue
      self.out_queue.put(chunk)

      #signals to queue job is done
      self.queue.task_done()

class DatamineThread(threading.Thread):
  """Threaded Url Grab"""
  def __init__(self, out_queue):
    threading.Thread.__init__(self)
    self.out_queue = out_queue

  def run(self):
    while True:
      #grabs host from queue
      chunk = self.out_queue.get()

      #parse the chunk
      soup = BeautifulSoup(chunk)
      print soup.findAll(['title'])

      #signals to queue job is done
      self.out_queue.task_done()

start = time.time()
def main():

  #spawn a pool of threads, and pass them queue instance
  for i in range(5):
    t = ThreadUrl(queue, out_queue)
    t.setDaemon(True)
    t.start()

  #populate queue with data
  for host in hosts:
    queue.put(host)

  for i in range(5):
    dt = DatamineThread(out_queue)
    dt.setDaemon(True)
    dt.start()


  #wait on the queue until everything has been processed
  queue.join()
  out_queue.join()

main()
print "Elapsed Time: %s" % (time.time() - start)

如果运行脚本的这个版本，您将得到下面的输出：

 # python url_fetch_threaded_part2.py 

 [Google]
 [Yahoo!]
 [Apple]
 [IBM United States]
 [Amazon.com: Online Shopping for Electronics, Apparel,
 Computers, Books, DVDs & more]
 Elapsed Time: 3.75387597084

分析这段代码时您可以看到，我们添加了另一个队列实例，然后将该队列传递给第一个线程池类 ThreadURL。接下来，对于另一个线程池类 DatamineThread，几乎复制了完全相同的结构。在这个类的 run 方法中，从队列中的各个线程获取 Web 页面、文本块，然后使用 Beautiful Soup 处理这个文本块。在这个示例中，使用 Beautiful Soup 提取每个页面的 title 标记、并将其打印输出。可以很容易地将这个示例推广到一些更有价值的应用场景，因为您掌握了基本搜索引擎或者数据挖掘工具的核心内容。一种思想是使用 Beautiful Soup 从每个页面中提取链接，然后按照它们进行导航。

总结

本文研究了 Python 的线程，并且说明了如何使用队列来降低复杂性和减少细微的错误、并提高代码可读性的最佳实践。尽管这个基本模式比较简单，但可以通过将队列和线程池连接在一起，以便将这个模式用于解决各种各样的问题。在最后的部分中，您开始研究如何创建更复杂的处理管道，它可以用作未来项目的模型。参考资料部分提供了很多有关常规并发性和线程的极好的参考资料。

最后，还有很重要的一点需要指出，线程并不能解决所有的问题，对于许多情况，使用进程可能更为合适。特别是，当您仅需要创建许多子进程并对响应进行侦听时，那么标准库子进程模块可能使用起来更加容易。有关更多的官方说明文档，请参考参考资料部分。

【Spring Boot 实现 PDF 导出】 web14786210723 面试学习路线阿里巴巴 spring boot pdf 后端
SpringBoot实现PDF导出在SpringBoot应用程序中实现PDF导出功能，可以选择多种库和技术栈。每种方法都有其优缺点，适用于不同的场景。以下是四种常见的方式：iText、ApachePDFBox、JasperReports和Thymeleaf+FlyingSaucer。我将详细对比这些方法，并提供相应的代码示例。1.iText优点:丰富的API:支持复杂的PDF操作，如加密、数字签名
DeepSeek自研AI芯片，AI算力新变革？人工智能深度学习机器学习算法
最近，DigiTimes的一份报告让AI圈炸开了锅：DeepSeek正全力开发专有AI芯片。有消息称，DeepSeek已开启大规模半导体设计人才招聘，种种迹象表明，其自研芯片计划已从设想步入实质推进阶段。AI算力告急，成本掣肘发展当下，AI技术迅猛发展，从科研领域的复杂模型训练，到日常生活里智能语音助手的实时交互，算力成了决定AI发展的关键因素。作为大模型领域的后起之秀，DeepSeek对计算资源
基于图像处理的裂缝检测与特征提取机器懒得学习图像处理计算机视觉人工智能
一、引言裂缝检测是基础设施监测中至关重要的一项任务，尤其是在土木工程和建筑工程领域。随着自动化技术的发展，传统的人工巡检方法逐渐被基于图像分析的自动化检测系统所取代。通过计算机视觉和图像处理技术，能够高效、精确地提取裂缝的几何特征，如长度、宽度、方向、面积等，从而为工程质量评估提供数据支持。本文将详细介绍一段用于裂缝检测与特征提取的Python代码，重点讲解其实现的核心算法与关键步骤，分析其应用场
《DNK210使用指南 -CanMV版 V1.0》第四十七章 MNIST实验嵌入式编程开源产品程序员
第四十七章MNIST实验1）实验平台：正点原子DNK210开发板2）章节摘自【正点原子】DNK210使用指南-CanMV版V1.03）购买链接：https://detail.tmall.com/item.htm?&id=7828013987504）全套实验源码+手册+视频下载地址：http://www.openedv.com/docs/boards/k210/ATK-DNK210.html5）正点
OSPF协议五种网络类型中DR和BDR选举说明路星辞* 网络网络智能路由器运维 ospf
OSPF协议五种网络类型中DR和BDR选举说明OSPF链路类型有3种：点到点，广播型，NBMA(非广播-多路访问网络（Non-BroadcastMultipleAccess，NBMA）)。在3种链路类型上扩展出5种网络类型：点到点，广播，NBMA，点到多点，虚链路。其中虚链路较为特殊，不针对具体链路，而NBMA链路对应NBMA和点到多点两种网络类型。以上是RFC的定义，在Cisco路由器的实现上，
快速排序_详解快速排序算法网站推广优化yetaoaiueo 排序算法算法
快速排序（Quicksort），计算机科学词汇，适用领域Pascal，c++等语言，是对冒泡排序算法的一种改进。快速排序的排序流程快速排序算法通过多次比较和交换来实现排序，其排序流程如下：(1)首先设定一个分界值，通过该分界值将数组分成左右两部分。(2)将大于或等于分界值的数据集中到数组右边，小于分界值的数据集中到数组的左边。此时，左边部分中各元素都小于分界值，而右边部分中各元素都大于或等于分界值
Flink 源码笔记03—StreamGraph到JobGraph 董嘻嘻 Flink源码笔记 flink java big data
文章目录简介入口函数traverseStreamGraphAndGenerateHashesgenerateDeterministicHashgenerateUserSpecifiedHashsetChainingisChainable简介JobGraph可以认为是StreamGraph的优化图，它将一些符合特定条件的operators合并成一个operatorchain，以减少数据在节点之间序列
浅谈十大源码交易平台，找源码不走弯路 17源码网游戏源代码管理
大家好啊，作为一名经历了无数代码风风雨雨的资深老码农，今天我就来跟你们聊聊十大源码交易平台。这可是我多年经验的结晶，希望你们能从中找到自己需要的宝贝。七爪网：七爪网，这名字很生动。七爪网提供各种类型的源码，包括游戏源码、分销商城源码、小程序源码等等，简直是码农的百宝箱。不管你是初学者还是经验丰富的老鸟，总能在这里找到适合的资源。而且，七爪网还提供详细的使用教程和技术支持，真是想得太周到了。86资源
Python 函数-调用函数赔罪 Python 系统学习 python 开发语言
目录抽象调用函数数据类型转换练习小结我们知道圆的面积计算公式为：S=πr2当我们知道半径r的值时，就可以根据公式计算出面积。假设我们需要计算3个不同大小的圆的面积：r1=12.34r2=9.08r3=73.1s1=3.14*r1*r1s2=3.14*r2*r2s3=3.14*r3*r3当代码出现有规律的重复的时候，你就需要当心了，每次写3.14*x*x不仅很麻烦，而且，如果要把3.14改成3.14
Python数据容器（dict字典、set集合）张小生180 python 开发语言
dic字典dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度。字典的创建使用大括号{}包含键值对，并用冒号:分隔键和值，形成键:值对。字典的特性唯一键：字典中的每个键都必须是唯一的。值可以取任何数据类型，如字符串，数字，元组。无序（Python3.6之前的版本）：在Python3.6之前的版本中，字典是无序的。但从Python3.7
探索大数据处理：利用 Apache Spark 解锁数据价值 Echo_Wish 实战高阶大数据 apache spark 大数据
探索大数据处理：利用ApacheSpark解锁数据价值大家好，我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天，我们来聊聊如何利用ApacheSpark进行大规模数据处理。ApacheSpark作为一个快速、通用的集群计算框架，以其出色的性能和丰富的API，成为大数据处理的利器。那么，ApacheSpark究竟如何帮助我们高效处理海量数据？接下来，让我们一起深入探讨。一、ApacheS
VTK知识学习（32）-图像运算无所谓จุ๊บ VTK 学习 VTK
1、数学运算vklmageMathematics提供了基本的一元和二元数学操作。根据不同的操作，需要一个或者两个输入图像。二元数学操作要求两个输入图像具有相同的像素数据类型和颜色组分。当两个图像大小不同时，输出图像的范围为两个输入图像范围的并集，并且原点和像素间隔与第一个输入图像保持一致。privatevoidTestMathematics(){//绘制一个暗红色矩形vtkImageCanvasS
自定义Agent组件三月七꧁ ꧂ langchain+llm python 开发语言 microsoft gpt langchain javascript 前端
文章目录ReActAgent的实践工具组件和工具包组件工具组件的类型一个Agent组件由两部分组成：tools（代理可以使用的工具)和AgentExecutor(决定采取哪种行动)。下面逐一介绍如何创建自定义Agent组件。Tool、AgentExecutor和BaseSingleActionAgent是从LangChain.agents模块中导人的类，用于创建自定义Agent组件和too
Agent组件入门示例三月七꧁ ꧂ langchain+llm 前端语言模型 javascript microsoft 人工智能 gpt llama
文章目录Agent组件的类型Agent组件的应用Agent组件的多功能性安装openai和LangChain库。pip-qinstallopenaipipinstallLangChain 设置谷歌搜索的API密钥，以及设置OpenAI的密钥。os.environ["OPENAIAPIKEY"]="填人你的密钥"os.environ["SERPAPIAPIKEY"]="填人你的谷歌搜索
[论文阅读] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution qianx77 论文阅读 pytorch 论文阅读人工智能计算机视觉
文章目录一、前言二、主要贡献三、Introduction四、Methodology4.1Motivation：4.2FrameworkOverview.**一、前言通信作者是香港理工大学&OPPO研究所的张磊教授，也是图像超分ISR的一个大牛了。论文如下SeeSR:TowardsSemantics-AwareReal-WorldImageSuper-Resolution[paper][code]二
iQOO neo 5精简内置组件 weixin_38627000 安卓智能手机安卓
无他！系统自带了太多组件，都用不到，连打开都不曾打开过。下午整理一篇精简组件的列表，各自按照各自的需要进行精简哦。别盲目跟风，要不然手机使用会出问题。精简步骤使用任意刷机工具，开启手机的开发权限，然后adb连接删除组件列表如下：pmuninstall--user0com.android.VideoPlayervivoi视频pmuninstall--user0com.vivo.browservivo
rabbitmq3.5.1 原理和集群安装「已注销」大数据网络运维
参考http://dl528888.blog.51cto.com/2382721/1864895http://kaibinyuan.blog.51cto.com/7304008/1610110原因：最近有一个异步需要使用消息队列，或许最终会选择阿里的rocketmq性能单台TPS基本上是在2000-3000左右最新rabbitmq版本是3.6.2yum安装配置文件RPM-/etc/rabbitmq
java实现数据上传到接口,Java 导入数据到Excel并提供文件下载接口梨漾 java实现数据上传到接口
依赖net.sourceforge.jexcelapijxl2.6.12复制代码我们需要用到jxl包的类，而jxl.jar正是操作excel表格的工具类库，除了jxl以外，poi包也是一个操作excel的类库。而对比两个包，jxl更适用与数据量大的情况，而poi在数据量不高(大约5000以内)时，效率较高，但占用内存大，更容易内存溢出。测试数据privateintid;privateStringn
RabbitMQ，RocketMQ，Kafka 消息模型对比分析 Java架构设计 java Java程序员消息模型开发语言程序人生
消息模型消息队列的演进消息队列模型早期的消息队列是按照”队列”的数据结构来设计的。生产者（Producer）产生消息，进行入队操作，消费者（Consumer）接收消息，就是出队操作，存在于服务端的消息容器就称为消息队列。当然消费者也可能不止一个，存在的多个消费者是竞争的关系，消息被其中的一个消费者消费了，其它的消费者就拿不到消息了。发布订阅模型如果一个人消息想要同时被多个消费者消费，那么上面的队列
Spring Boot整合RabbitMQ Java架构设计 Java程序员经验分享程序人生 Java架构 spring boot
应用场景1.异步处理场景：用户注册完成后，需要发注册成功的邮件和短信，传统的做法有两种：串行的方式：将注册信息写入数据库后，发送注册成功的邮件，邮件发送成功后，再发送注册成功的短信。以上三个任务全部完成后才将注册成功的信息返回给客户端。存在的问题是：邮件和短信并不是必须的，它只是一个通知，串行的方式会让客户端等待没有必要等待的时间。并行的方式：将注册信息写入数据库后，同时发送注册成功的邮件和短信。
批量更新 AWS ECS Fargate 服务：自动化平台版本升级 ivwdcwso 开发运维 aws 自动化云计算 Fargate ecs
在使用AWSECSFargate时，我们经常会收到平台版本更新的通知。为了确保我们的服务运行在最新的平台版本上，我们需要更新所有受影响的任务。本文将介绍如何使用Python和AWSSDK(boto3)来批量更新ECSFargate服务，自动化这一过程。背景AWSFargate会定期发布新的平台版本，以提供新功能和进行例行维护。当新版本发布时，AWS会通知用户在特定日期之前更新他们的任务。虽然AWS
ubuntu20 安装RabbitMq 帅的没朋友~ #Linux System ubuntu rabbitmq
一：安装erlang1.执行以下命令来确保所有系统软件包都是最新的sudoaptupdatesudoaptupgrade2.将存储库添加到您的Ubuntu系统echo"debhttps://packages.erlang-solutions.com/ubuntufocalcontrib"|sudotee/etc/apt/sources.list.d/erlang-solution.list3.使用
【学习笔记】Python基础-字典Dict和Set和List与Str扩展法迪 Python基础 python hashmap Dict set list
Dict使用大括号围起来，这里提供一种键值对的list表示方法1.Dict{}2.List[]3.turple()实例代码#!/usr/bin/envpython3#-*-coding:utf-8-*-#字典dict类似Java的HashMap#Dict{}#List[]#turple()mDict={"Lava":90,"Huawei":100,"Sony":60}print(mDict['La
数仓_数据口径 TTXS123456789ABC #XM1离线数仓_金融零售大数据
数仓_数据口径数据口径含义数据口径包含口径收敛数据口径含义在数据仓库（数仓）中，数据口径是指在数据统计和分析过程中，对数据的定义、计算方法、范围和标准等方面的详细规定。它确保了数据的一致性和准确性，避免因统计标准不一致导致的数据误解和混淆。数据口径包含具体来说，数据口径包括以下几个方面：数据定义：明确指标的具体含义。例如，“用户注册数”指的是在某一定时间内通过平台注册的新用户数量。计算方法：规定如
flink核心特性 24k小善 flink 大数据 java 架构
ApacheFlink核心特性详解一、流处理与批处理的统一Flink的核心设计理念之一是将流处理和批处理统一在一个框架中。这种统一性使得Flink在处理实时数据和批量数据时具有高度的灵活性和一致性。1.流处理与批处理的统一计算引擎流处理作为批处理的特例：Flink将批处理视为有限流（FiniteStream），从而实现了流处理和批处理的统一。统一API：Flink提供了DataStream和Dat
flink反压详解 24k小善 flink 架构大数据 AI编程
Flink背压/反压（Backpressure）详解在ApacheFlink中，背压（Backpressure）是一个常见的性能问题，通常表现为数据流在某些节点处积压，导致整体处理速度下降甚至停滞。背压的发生可能源于硬件资源限制、任务逻辑复杂性、数据分布不均或外部系统瓶颈等因素。本文将从多个角度详细讲解Flink的背压问题，包括其成因、影响以及解决方案。一、什么是Flink背压？背压是指在数据流处
【隐私保护】身份认证的基本概念小oo呆【隐私保护】【学习心得】密码学安全隐私保护
在之前的文章中有提到认证技术，那么之前提到的认证技术和身份认证技术有什么不同呢？身份认证技术的到底是什么呢？如果想更系统的学习身份认证建议把之前的文章看看：【密码学】密码协议【密码学】密码协议的分类：②认证协议我认为认证技术是一个更广的概念，它指的是在计算机网络中确认操作者身份的过程以及确保数据完整性和来源可靠性的方法。也就是认证技术要认证三个东西：消息认证（验证消息的完整性）、数据源认证（验证消
深度求索-DeepSeek-R1本地部署指南 0小和尚化缘12 个人开发
1、参考：部署指南2、参考：deepseek本地部署只需三步DeepSeek本地部署只需三步：1、安装运行环境：安装Ollama：Ollama官网：官网2、下载模型：参数越大，需要物里硬件越多3、安装部署前端交互程序：都是现成的开源架构
CHRONOS - 新闻时间线摘要小众AI AI开源服务器人工智能 AI编程
CHRONOS是一种新颖的基于检索的时间线摘要（TLS）方法，通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。为开放域TLS构建了一个最新的数据集，它在大小和时间线持续时间方面都超过了现有的公共数据集。⚗️OPEN-TLS数据集我们发布了用于开放域时间线摘要的Open-TLS数据集。目标新闻查询以以下格式显示，地面实况时间线按以下格式显示：news_keywords.pydat
十四、Flink源码阅读--JobGraph生成过程灰二和杉菜 Apache Flink Flink JobGraph生成源码分析
上篇分析了client整个提交任务过程，最终提交的是一个JobGraph对象，那么是如何从jar或sql任务转为JobGraph的呢，这篇我们仔细研究一下,版本为1.6.3源码分析上篇我们介绍client端提交任务最终会到到ClusterClient.run()方法，就在这个方法中封装了JobGraph的步骤。publicJobSubmissionResultrun(FlinkPlancompil
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

使用Python中的线程进行网络编程的入门教程

你可能感兴趣的:(使用Python中的线程进行网络编程的入门教程)