游骑小兵

【Python爬虫】提升爬虫的速度

提升爬虫的速度

提升爬虫的速度，主要有三种方法：多线程爬虫、多进程爬虫和多协程爬虫。

1.并发和并行，同步和异步

并发（concurrency）：是指在一个时间段内发生若干事件的情况；

并行（parallelism）：是指在同一个时刻发生若干事件的情况。

同步：就是并发或并行的各个任务不是独立运行的，任务之间有一定的交替顺序；

异步：则是并发或并行的各个任务可以独立运行，一个任务的运行不受另一个任务影响。

2.多线程爬虫

多线程爬虫是以并发的方式执行的，多个线程并不能真正的同时执行，而是通过进程的快速切换加快网络爬虫速度的。

Python本身的设计对多线程的执行有所限制。在设计之初，为了数据安全所做的决定设置有GIL（Global Interpreter Lock，全局解释器锁）。在Python中，一个线程的执行过程包括获取GIL、执行代码直到挂起和释放GIL。

每次释放GIL锁，线程之间都会进行锁竞争，而切换线程会消耗资源。由于GIL锁的存在，Python里一个进程永远只能同时执行一个线程，这就是在多核CPU上Python的多线程效率不高的原因。

Python的多线程对于IO密集型代码比较友好，网络爬虫能够在获取网页的过程中使用多线程，从而加快速度。

单线程爬虫：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : Promoting.py
@Author: Xinzhe.Pang
@Date  : 2019/7/10 23:12
@Desc  : 
"""
import requests
import time

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()
for eachone in link_list:
    try:
        r = requests.get(eachone)
        print(r.status_code, eachone)
    except Exception as e:
        print('Error:', e)
end = time.time()
print('串行的总时间：', end - start)

Python中使用多线程的两种方法：

（1）函数式：调用_thread模块中的start_new_thread()函数产生新线程。（注意：是一个下划线）

（2）类包装法：调用Threading库创建线程，从threading.Thread继承。

thread提供了低级别、原始的线程，相比于threading模块，功能还是比较有限的。threading模块提供了Thread类来处理线程。包括以下方法：

run()：表示线程活动的方法
start()：启动线程方法
join([time])：等待至线程中止，阻塞调用线程直至线程的join()方法被调用为止
isAlive()：返回线程是否是活动的。
getName()：获取线程名
setName()：设置线程名

threading的一个简单例子：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiThread02.py
@Author: Xinzhe.Pang
@Date  : 2019/7/10 23:34
@Desc  : 
"""
import threading
import time


class myThread(threading.Thread):
    def __init__(self, name, delay):
        threading.Thread.__init__(self)
        self.name = name
        self.delay = delay

    def run(self):
        print("Starting " + self.name)
        print_time(self.name, self.delay)
        print("Exiting " + self.name)


def print_time(threadName, delay):
    counter = 0
    while counter < 3:
        time.sleep(delay)
        print(threadName, time.ctime())
        counter += 1


threads = []
# 创建新线程
thread1 = myThread("Thread-1", 1)
thread2 = myThread("Thread-2", 2)

# 开启新线程
thread1.start()
thread2.start()

# 添加线程到线程列表
threads.append(thread1)
threads.append(thread2)

# 等待所有线程完成
for t in threads:
    t.join()

print("Exiting Main Thread")

简单的多线程爬虫：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiThread03.py
@Author: Xinzhe.Pang
@Date  : 2019/7/10 23:42
@Desc  : 
"""
import threading
import requests
import time

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()


class myThread(threading.Thread):
    def __init__(self, name, delay):
        threading.Thread.__init__(self)
        self.name = name
        self.delay = delay

    def run(self):
        print("Starting " + self.name)
        print_time(self.name, self.delay)
        print("Exiting " + self.name)


def print_time(threadName, delay):
    for i in range(delay[0], delay[1] + 1):
        try:
            r = requests.get(link_list[i], timeout=20)
            print(threadName, r.status_code, link_list[i])
        except Exception as e:
            print(threadName, 'Error:', e)


thread_list = []
delay_list = [(0, 200), (201, 400), (401, 600), (601, 800), (801, 1000)]

# 创建新线程
for i in range(1, 6):
    thread = myThread("Thread-" + str(i), delay_list[i - 1])
    thread.start()
    thread_list.append(thread)

# 等待所有线程完成
for thread in thread_list:
    thread.join()

end = time.time()
print('简单多线程爬虫的总时间为：', end - start)
print("Exiting Main Thread")

使用Queue的多线程爬虫。Python的Queue模块中提供了同步的、线程安全的队列类，包括FIFO队列Queue、LIFO队列LifoQueue和优先级队列PriorityQueue。代码如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiThread04Queue.py
@Author: Xinzhe.Pang
@Date  : 2019/7/10 23:57
@Desc  : 
"""
import threading
import requests
import time
import queue as Queue

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()


class myThread(threading.Thread):
    def __init__(self, name, delay):
        threading.Thread.__init__(self)
        self.name = name
        self.delay = delay

    def run(self):
        print("Starting " + self.name)
        while True:
            try:
                print_time(self.name, self.delay)
            except:
                break
        print("Exiting " + self.name)


def print_time(threadName, delay):
    url = delay.get(timeout=2)
    try:
        r = requests.get(url, timeout=20)
        print(delay.qsize(), threadName, r.status_code, url)
    except Exception as e:
        print(delay.qsize(), threadName, url, 'Error:', e)


threadList = ["Thread-1", "Thread-2", "Thread-3", "Thread-4", "Thread-5"]
workQueue = Queue.Queue(1000)
threads = []

# 创建新线程
for tName in threadList:
    thread = myThread(tName, workQueue)
    thread.start()
    threads.append(thread)

# 填充队列
for url in link_list:
    workQueue.put(url)

# 等待所有线程完成
for t in threads:
    t.join()

end = time.time()
print('Queue多线程爬虫的总时间为：', end - start)
print("Exiting Main Thread")

结果比对发现，使用Queue方法比之前的简单多线程爬虫方法时间短，可见Queue方法能够增加抓取的效率。

3.多进程爬虫

多线程爬虫并不能充分发挥多核CPU的资源。多进程爬虫则可以利用CPU的多核，进程数取决于计算机CPU的处理器个数。在Python中，如果要用多进程，就需要用到multiprocessing这个库。

使用multiprocessing库有两种方法，一种是使用Process+Queue的方法，另一种是使用Pool+Queue的方法。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiProcess01.py
@Author: Xinzhe.Pang
@Date  : 2019/7/11 22:01
@Desc  : 
"""
from multiprocessing import Process, Queue
import time
import requests

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()


class MyProcess(Process):
    def __init__(self, q):
        Process.__init__(self)
        self.q = q

    def run(self):
        print("Starting ", self.pid)
        while not self.q.empty():
            crawler(self.q)
        print("Exiting ", self.pid)


def crawler(q):
    url = q.get(timeout=2)
    try:
        r = requests.get(url, timeout=20)
        print(q.qsize(), r.status_code, url)
    except Exception as e:
        print(q.qsize(), url, 'Error: ', e)


if __name__ == '__main__':
    ProcessName = ["Process-1", "Process-2", "Process-3"]
    workQueue = Queue(1000)

    # 填充队列
    for url in link_list:
        workQueue.put(url)

    for i in range(0, 3):
        p = MyProcess(workQueue)
        p.daemon = True
        p.start()
        p.join()

    end = time.time()
    print('Process + Queue多进程爬虫的总时间为：', end - start)
    print('Main process Ended!')

Pool可以提供指定数量的进程供用户调用。当有新的请求提交到Pool中时，如果池还没有满，就会创建一个新的进程用来执行该请求；但如果池中的进程数已经达到规定的最大值，该请求就会继续等待，直到池中有进程结束才能够创建新的进程。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiProcess02.py
@Author: Xinzhe.Pang
@Date  : 2019/7/11 22:11
@Desc  : 
"""
from multiprocessing import Pool, Manager
import time
import requests

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()


def crawler(q, index):
    Process_id = 'Process-' + str(index)
    while not q.empty():
        url = q.get(timeout=2)
        try:
            r = requests.get(url, timeout=20)
            print(Process_id, q.qsize(), r.status_code, url)
        except Exception as e:
            print(Process_id, q.qsize(), url, 'Error: ', e)


if __name__ == '__main__':
    manger = Manager()
    workQueue = manger.Queue(1000)

    # 填充队列
    for url in link_list:
        workQueue.put(url)
    pool = Pool(processes=3)
    for i in range(4):
        pool.apply_async(crawler, args=(workQueue, i))

    print("Started processes")
    pool.close()
    pool.join()

    end = time.time()
    print('Pool + Queue多进程爬虫的总时间为：', end - start)
    print('Main process Ended!')

注意：通过pool.apply_async创建非阻塞进程，也就是说不需要等到进程运行完成就可以添加其他继承了，如果要使用阻塞方法，可以将其改成pool.apply即可。阻塞方法一定要等到某个进程执行完才会添加另一个进程。

4.多协程爬虫

协程（Coroutine）是一种用户态的轻量级线程，在程序级别模拟系统级别用的进程。在一个进程中，一个线程通过程序的模拟方法实现高并发。

使用协程主要有三个好处：1.单线程，少了上下文切换，所以系统消耗很小；2.方便切换控制流，能保存上一次调用时的状态（所有局部状态的一个特定组合）;3.高扩展性和高并发性。

缺点：1.协程本质是一个单线程，不能同时使用单个CPU的多核，需要和进程配合才能运行在多CPU上；2，有长时间阻塞的IO操作时不要用协程，因为可能会阻塞整个程序。

在Python的协程中可以使用gevent库。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File  : MultiCoroutine.py
@Author: Xinzhe.Pang
@Date  : 2019/7/11 22:25
@Desc  : 
"""
import gevent
from gevent.queue import Queue, Empty
import time
import requests

from gevent import monkey  # 把下面有可能有IO操作的单独做上标记

monkey.patch_all()  # 将IO转为异步执行的函数

link_list = []
with open('alexa.txt', 'r') as file:
    file_list = file.readlines()
    for eachone in file_list:
        link = eachone.split('\t')[1]
        link = link.replace('\n', '')
        link_list.append(link)

start = time.time()


def crawler(index):
    Process_id = 'Process-' + str(index)
    while not workQueue.empty():
        url = workQueue.get(timeout=2)
        try:
            r = requests.get(url, timeout=20)
            print(Process_id, workQueue.qsize(), r.status_code, url)
        except Exception as e:
            print(Process_id, workQueue.qsize(), url, 'Error: ', e)


def boss():
    for url in link_list:
        workQueue.put_nowait(url)


if __name__ == '__main__':
    workQueue = Queue(1000)

    gevent.spawn(boss).join()
    jobs = []
    for i in range(10):
        jobs.append(gevent.spawn(crawler, i))
    gevent.joinall(jobs)

    end = time.time()
    print('gevent + Queue多协程爬虫的总时间为：', end - start)
    print('Main Ended!')

gevent库中的monkey能把可能有IO操作的单独做上标记，将IO变成可以异步执行的函数。

多协程爬虫能够很好地支持高并发的工作。

参考资料：《Python网络爬虫从入门到实践》

Caused by: java.lang.ClassNotFoundException: org.springframework.data.repository.config.BootstrapMod... weixin_30444105 开发工具 java 数据库
1、起因，启动SpringBoot2.0的时候报了这个错误。说找不到类，咱也是刚学SpringBoot2.0，咱也不懂，咱也不知道问谁，研究一翻，找不到原因就百度了。参考链接：https://blog.csdn.net/sswqzx/article/details/87432287报错如下所示：1"C:\ProgramFiles\Java\jdk1.8.0_161\bin\java.exe"-ea
Python Cookbook-2.10 处理字符串中的 zip 文件我不会编程555 #Python学习 python 开发语言
任务程序接收到了一个字符串，其内容是一个zip文件，需要读取这个zip文件中的信息。解决方案应对这种问题，采用Python标准库的cStringIO模块的拿手好戏:importcStringIO，zipfileclassZipString(ZipFile):def__init__(self,datastring):ZipFile.__init__(self,cStringIO.StringIO(d
基于YOLOv5、FaceNet与KNN的人脸识别系统 reset2021 人脸识别系统 YOLO facenet knn 人脸检测
步骤1：环境配置安装依赖库：安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集：收集训练用的多个人脸图像（每个用户至少几十张）将图像按用户分类存放在data/train/user1,user2等文件夹中步骤2：训练YOLO模型配置YOLO数据集：创建一个data.yaml文件，配置您的数据集路径和标签train:./data/train/images/v
mongodb的并发优化 hzulwy 数据库数据库
MongoDB的锁模式MongoDB的锁设计MongoDB的高性能表现离不开它的多粒度锁机制。多粒度主要可以针对不同层级的数据库对象进行枷锁，通过避免全局性的互斥来提升并发能力。从整个数据库层面看，MongoDB的并发锁的分层如下图所示：从上往下是一个逐步细分的关系，分别为Global(全局)、Database(数据库)、Collection(集合)、Document(文档)。需要说明的是，mon
Docker部署 MongoDB及常用命令 KawYang docker mongodb
docker部署dockerrun-d\--namemongo\-eMONGO_INITDB_ROOT_USERNAME=root\-eMONGO_INITDB_ROOT_PASSWORD=123456\-p27017:27017\-v./local-mongo-data:/data/db\mongo:latest或者编写docker-compose.yaml文件。如下：version:'3.1'
Python Django系列—入门实例(二) Doker数码品牌 Python python django 开发语言
数据库配置现在，打开mysite/settings.py。这是个包含了Django项目设置的Python模块。默认情况下，DATABASES配置使用SQLite。如果你是数据库新手，或者只是想尝试Django，这是最简单的选择。SQLite包含在Python中，因此你不需要安装任何其他东西来支持数据库。然而，当你开始第一个真正的项目时，你可能希望使用像PostgreSQL这样更具扩展性的数据库，以
网络安全之攻防笔记--通用安全漏洞SQL注入&sqlmap&Oracle&mongodb&DB2 Dawndddddd web安全笔记安全 sql
通用安全漏洞SQL注入&sqlmap&Oracle&mongodb&DB2数据库类型ACCESS特性没数据库用户没数据库权限没数据库查询参数没有高权限注入说法暴力猜解，借助字典得到数据注入方式联合注入偏移注入表名列名猜解不到偏移注入MySQL低权限常规注入高权限常规注入文件读取load_file文件写入intooutfile权限原因&判断代码连接用户决定查询函数user（）其他database()
钉钉小程序-三级联动选择地区组件似月是你前端小程序
钉钉小程序三级联动上次发布的钉钉小程序三级联动，在真机上测试不管用，自己写了个组件1.select.axml=index}}"data-type="{{index}}"onTap="nav_typ">{{item.text}}{{item.name}}2.select.acss.scroll-item{
YashanDB加密方法数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...存储加密YashanDB支持表空间级和列级的数据透明加密（TDE，TransparentDataEncryption）。表空间透明加密在数据库写入表空间存储介质时自动加密，从存储读取至数据库buffer内时解密，加解密过程对应
Test the complete case xing2516 Python Python自动化 python
Testthecompletecasepython写的一段由pytest测试框架/allure报告框架/parameters数据驱动组成的完整案例代码目录结构project/├──test_cases/│├──__init__.py│└──test_math_operations.py#测试用例├──test_data/│└──math_data.json#测试数据└──pytest.ini#py
ABAP DELETE内表，只删除当前循环的那一行 1314lay_1007 SAP ABAP 总结 ABAP
ABAPDELETE内表，只删除当前循环的那一行，使用DELETE内表名文章目录说明程序说明程序REPORTZ_TEST_1008.DATA:GS_DATATYPEZTESTLHY,GT_DATATYPETABLEOFZTESTLHY.DATA:GT_DATA1TYPETABLEOFZTESTLHY.SELECT*FROMZTESTLHYINTOTABLE@GT_DATA.MOVEGT_DATAT
ABAP内表两种DELETE方式的性能比较程序员在路一... SAP ABAP SAP ABAP 数据库
ABAP内表两种DELETE方式的性能比较以代码实例为参考：REPORTZDELETE_COMPARE.PARAMETERS:numtypeiOBLIGATORYDEFAULT100.types:beginofty_product,idtypecomm_product-product_id,texttypestring,endofty_product.data:lt_producttypeSTAN
利用python进行数据分析（重点、易忘点）---第五章Pandas基础学习 tenderjets 利用python进行数据分析 pandas
之前看的pandas的教材和课程里，内容参差不齐，实际使用很少的方法的内容有点多，导致很乱而且记不住那么多，这个帖子尽量用最少的文字，最精炼的语言来总结比较实用的方法，内容主要来源于《利用python进行数据分析》。1.创建Series直接给列表，加index。obj=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])也可以用字典sdata={'O
UE_C++ —— Gameplay Tags 挨代码 UE #CPP c++UE
目录一，DefiningGameplayTagsAddingTagsinProjectSettingsImportingTagsfromDataTableAssetsDefiningTagswithC++二，UsingDefinedGameplayTagsApplyingTagstoObjectsEvaluatingTagswithConditionalFunctions三，AdvancedTop
UE_C++ —— Logging in Unreal 挨代码 UE #CPP c++UE
目录一，UE_LOGLogVerbosityConsoleCommandsLoggingFundamentalDataTypesDefineYourOwnLogCategory二，UE_LOGFMTOn-screendebugmessages日志是一种非常实用的调试工具，可以详细说明代码当前的执行逻辑；可以检查函数之间传递的数据值，并报告潜在的问题；引擎中的日志提供了多种方法，来有序记录运行时特定
UE_C++ —— Delegates 挨代码 UE #CPP c++UE
目录一，DeclaringDelegates二，BindingDelegatesPayloadData三，ExecutingDelegates四，ExampleUsage委托是一种泛型且类型安全的方式，可在C++对象上调用成员函数；委托可动态绑定到任意对象的成员函数，之后在该对象上调用函数，即使调用者不知对象类型；委托可很安全复制；也可以利用值传递委托，但这样操作需要在堆上分配内存，因此通常并不推
Java多数据源的三种实现方式黑尾土拨鼠 java spring 数据库 java 开发语言数据库
文章目录1、什么时候会用到多数据源（MultipleDataSources）1.1、多数据源具体含义1.2、为什么需要多数据源2、Java中实现多数据源的三种方式2.1基于Spring提供的AbstractRoutingDataSource2.1.1创建一个DynamicDataSource类2.1.2配置数据源2.1.3自定义注解，便于区别不同数据源2.1.4Service通过注解设置数据源2.
Python如何在指定行追加内容 Red丶哞 Python 运维
Python如何在指定行追加内容在处理文本文件时，有时我们需要在特定行后追加内容。本文将介绍如何使用Python在指定行追加内容，并提供一个实际的代码示例。问题描述假设我们有一个名为data.txt的文本文件，内容如下：第一行第二行第三行第四行我们希望在第二行后追加一行内容“这是新增的一行”。最终结果应该是：第一行第二行这是新增的一行第三行第四行方案概述解决这个问题的基本思路是：读取文件内容并存储
python绘图之二维核密度图 pianmian1 python 开发语言
二维核密度图能够直观地呈现两个变量之间的联合分布情况。通过平滑的密度曲线，可以观察数据的集中趋势、离散程度以及是否存在多峰等特征。本节学习使用python绘制二维核密度图importseabornassnsimportmatplotlib.pyplotasplt#加载seaborn自带的保险数据集insurance=sns.load_dataset('tips')#注意：seaborn中没有直接的
Java 拷贝文件内容冰糖心书房 Java 开发
说明：把d盘下a.txt中的内容复制到e盘下e.txt文件中privatestaticvoidcopyDataBase(){try{Filef1=newFile("d:/a.txt");Filef2=newFile("e:/e.txt");InputStreamin=newFileInputStream(f1);OutputStreamout=newFileOutputStream(f2);byt
Oracle 19C RU补丁升级，从19.7to19.25 -单机莳花微语 Oracle 数据库 oracle
1.环境信息：角色数据库IP地址数据库版本数据库名称源端单实例172.30.21.19119.7hfzcdb2.安装准备用rman备份数据库，再备份下oracle目录：命令：tarzavforacle.tar/oracle19.25版本关于19C的补丁内容：Oracle19CGridDatabaseReleaseUpdate19.25.0Patch3691259715-Oct-2024Oracle
Oracle 19C DataGuard GAP 修复过程（RECOVER STANDBY DATABASE FROM SERVICE）莳花微语 Oracle oracle 数据库 ADG
1.介绍DGGAP顾名思义就是：DG不同步，当备库不能接受到一个或多个主库的归档日志文件时候，就发生了GAP。那么，如果遇到GAP如何修复呢？DGGAP主要分为以下两类情况：主库归档日志存在，可以通过配置FetchArchiveLog(FAL)参数，自动解决归档GAP；主库归档日志丢失，需要人工干预来修复；不同Oracle版本的GAP修复方式也不尽相同，下面分别介绍不同版本的方式！11G的处理步骤
c++ mfc调用UpdateData(TRUE)时，发生异常澄澈天空 mfc c++
1.UpdateData()介绍UpdateData()函数是MFC的窗口函数，是用来刷新数据的。有以下两种调用状态：UpdateData(TRUE)：把当前界面上控件中的值更新到绑定的变量中去。UpdateData(FALSE)：把绑定变量中的数据更新到控件中去。2.调用时发生如下异常的解决方法DebugAssertionFailed!1）排除控件禁用或不存在、不可用等情况；2）检查调用方式，是
c++ 把byte[]中的数据写入bin\txt文件中澄澈天空 c++MFC C++文件操作二进制文件文本文件内存管理
1.保存bin文件intsize=1000;BYTE*data=newBYTE[size];memset(data,0,size);CStringPath=_T("..\test.bin");FILE*file1;if(_wfopen_s(&file1,Path.GetBuffer(),_T("wb+"))==0){fwrite(data,1,size,file1);fclose(file1);}
Python中的len()函数用法 wildgeek python 网络开发语言
本文围绕Python中的len()函数展开详细介绍，内容涵盖以下方面：len()函数基础：len()是Python的内置函数，用于返回对象包含的项目数量，可作用于多种内置数据类型（如字符串、列表、元组、字典、集合等）以及部分第三方类型（如NumPy数组、pandas的DataFrame）。对于内置类型使用len()较直接，对于自定义类可通过实现.len()方法扩展其对len()的支持，且len()
MySQL的Binlog解析枯河垂钓 MySQL日志文件 mysql 服务器
查看当前主服务器（Master）的二进制日志（BinaryLog）状态SHOWMASTERSTATUS基于位点解析mysqlbinlog--start-position=4--stop-position=1248mysql-bin.000001>/data/01.sql基于时间解析mysqlbinlog--start-datetime="2025-02-2321:00:00"/data/mysql
当Docker网络抽风时，如何优雅地摔键盘（并悄悄修好它）以琦琦为中心 docker 网络容器
title:“️当Docker网络抽风时，如何优雅地摔键盘（并悄悄修好它）”author:“Cjs”date:“2025-2-23”当你的容器们开始玩"失联游戏"时…ERROR:Couldnotconnecttodatabase容器A："嘿兄弟你在哪？"容器B："我在192.168.9.2啊！"宿主机："你们说的这个ip...我根本不认识啊！"经典崩溃现场：容器间突然开始"量子通信"（时通时不通）
常用设计模式（embeded Qt） m0_55576290 Balance 设计模式 qt java
常用设计模式：观察者模式（ObserverPattern）应用场景：传感器数据更新、UI状态同步。实现方式：通过QT的信号槽机制（本质是发布-订阅模式）自动实现。例如：connect(sensor,&Sensor::dataUpdated,uiWidget,&UIWidget::updatePlot);策略模式（StrategyPattern）应用场景：动态切换动平衡算法（如影响系数法、试重法等）
Windows Server 2025 OVF (2025 年 2 月更新) - VMware 虚拟机模板 windows-server
WindowsServer2025OVF(2025年2月更新)-VMware虚拟机模板WindowsServer2025Datacenterx64OVF,updatedFeb2025(sysin)请访问原文链接：https://sysin.org/blog/windows-server-2025-ovf/查看最新版。原创作品，转载请保留出处。作者主页：sysin.org现在都是自动sysprep的
uniapp实现移动端剪切板小功能聂聂脸 uni-app
在制作移动端支付的项目时用到了剪切板这个功能，uniapp中想要实现这个功能会有一个问题。uni.setClipboardData(OBJECT)这个方法是用来设置系统剪贴板的内容，这个方法里的object的参数data，是放我们需要设置的内容。当然一般可以在success里打印来看内容是否已经在剪切板里，但不仅有success回调函数，fail回调函数也是可以检测（检测内容没有在剪切板中）。un
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str