weixin_30480651

多任务的爬虫

1.多线程的方法使用

在python3中，主线程主进程结束，子线程，子进程不会结束

为了能够让主线程回收子线程，可以把子线程设置为守护线程,即该线程不重要，主线程结束，子线程结束.

t1 = threading.Thread(targe=func,args=(,))
t1.setDaemon(True)
t1.start() #此时线程才会启动

2.队列模块的使用

from queue import Queue
q = Queue(maxsize=100)
item = {}
q.put_nowait(item) #不等待直接放，队列满的时候会报错
q.put(item) #放入数据，队列满的时候回等待
q.get_nowait() #不等待直接取，队列空的时候会报错
q.get() #取出数据，队列为空的时候会等待
q.qsize() #获取队列中现存数据的个数 
q.join() #队列中维持了一个计数，计数不为0时候让主线程阻塞等待，队列计数为0的时候才会继续往后执行
q.task_done() 
# put的时候计数+1，get不会-1，get需要和task_done 一起使用才会-1

3.多线程实现思路剖析

把爬虫中的每个步骤封装成函数，分别用线程去执行
不同的函数通过队列相互通信，函数间解耦

代码如下:

# coding=utf-8
import requests
from lxml import etree
from queue import Queue
import threading
import time

class QiuBai:
    def __init__(self):
        self.temp_url = "http://www.qiushibaike.com/8hr/page/{}"
        self.headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36"}
        self.url_queue = Queue()
        self.html_queue = Queue()
        self.content_list_queue = Queue()

    def get_url_list(self):
        # return [self.temp_url.format(i) for i in range(1,14)]
        for i in range(1,14):
            self.url_queue.put(self.temp_url.format(i))

    def parse_url(self):
        while True:
            url = self.url_queue.get()
            response = requests.get(url,headers=self.headers)
            print(response)

            if response.status_code != 200:
                self.url_queue.put(url)
            else:
                self.html_queue.put(response.content.decode())
            self.url_queue.task_done()  #让队列的计数-1

    def get_content_list(self):#提取数据
        while True:
            html_str = self.html_queue.get()
            html = etree.HTML(html_str)
            div_list = html.xpath("//div[@id='content-left']/div")
            content_list = []
            for div in div_list:
                item = {}
                item["user_name"] = div.xpath(".//h2/text()")[0].strip()
                item["content"] = [i.strip() for i in div.xpath(".//div[@class='content']/span/text()")]
                content_list.append(item)
            self.content_list_queue.put(content_list)
            self.html_queue.task_done()

    def save_content_list(self): #保存
        while True:
            content_list = self.content_list_queue.get()
            for content in content_list:
                # print(content)
                pass
            self.content_list_queue.task_done()

    def run(self):#实现做主要逻辑
        thread_list = []
        #1. 准备url列表
        t_url = threading.Thread(target=self.get_url_list)
        thread_list.append(t_url)
        #2. 遍历发送请求，获取响应
        for i in range(3):
            t_parse = threading.Thread(target=self.parse_url)
            thread_list.append(t_parse)
        #3. 提取数据
        t_content = threading.Thread(target=self.get_content_list)
        thread_list.append(t_content)
            #4. 保存
        t_save = threading.Thread(target=self.save_content_list)
        thread_list.append(t_save)

        for t in thread_list:
            t.setDaemon(True) #把子线程设置为守护线程
            t.start()

        for q in [self.url_queue,self.html_queue,self.content_list_queue]:
            q.join() #让主线程阻塞，等待队列计数为0


if __name__ == '__main__':
    t1 = time.time()
    qiubai = QiuBai()
    qiubai.run()
    print("total cost:",time.time()-t1)

多进程程的方法使用

from multiprocessing import Process
t1 = Process(targe=func,args=(,))
t1.daemon = True  #设置为守护进程
t1.start() #此时线程才会启动

多进程中队列的使用

多进程中使用普通的队列模块会发生阻塞，对应的需要使用multiprocessing提供的JoinableQueue模块，其使用过程和在线程中使用的queue方法相同.

代码如下:

# coding=utf-8
import requests
from lxml import etree
# from queue import Queue
# import threading
from multiprocessing import Process
from multiprocessing import JoinableQueue as Queue
import time

class QiuBai:
    def __init__(self):
        self.temp_url = "http://www.qiushibaike.com/8hr/page/{}"
        self.headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36"}
        self.url_queue = Queue()
        self.html_queue = Queue()
        self.content_list_queue = Queue()
        self.proxies = {"http":"http://58.247.179.94:8060"}

    def get_url_list(self):
        # return [self.temp_url.format(i) for i in range(1,14)]
        for i in range(1,14):
            self.url_queue.put(self.temp_url.format(i))

    def parse_url(self):
        while True:
            url = self.url_queue.get()
            response = requests.get(url,headers=self.headers,proxies=self.proxies)
            print(response)

            if response.status_code != 200:
                self.url_queue.put(url)
            else:
                self.html_queue.put(response.content.decode())
            self.url_queue.task_done()  #让队列的计数-1

    def get_content_list(self):#提取数据
        while True:
            html_str = self.html_queue.get()
            html = etree.HTML(html_str)
            div_list = html.xpath("//div[@id='content-left']/div")
            content_list = []
            for div in div_list:
                item = {}
                item["user_name"] = div.xpath(".//h2/text()")[0].strip()
                item["content"] = [i.strip() for i in div.xpath(".//div[@class='content']/span/text()")]
                content_list.append(item)
            self.content_list_queue.put(content_list)
            self.html_queue.task_done()

    def save_content_list(self): #保存
        while True:
            content_list = self.content_list_queue.get()
            for content in content_list:
                # print(content)
                pass
            self.content_list_queue.task_done()

    def run(self):#实现做主要逻辑
        thread_list = []
        #1. 准备url列表
        t_url = Process(target=self.get_url_list)
        thread_list.append(t_url)
        #2. 遍历发送请求，获取响应
        for i in range(13):
            t_parse = Process(target=self.parse_url)
            thread_list.append(t_parse)
        #3. 提取数据
        t_content = Process(target=self.get_content_list)
        thread_list.append(t_content)
        #4. 保存
        t_save = Process(target=self.save_content_list)
        thread_list.append(t_save)

        for process in thread_list:
            process.daemon = True #把子线程设置为守护线程
            process.start()

        for q in [self.url_queue,self.html_queue,self.content_list_queue]:
            q.join() #让主线程阻塞，等待队列计数为0


if __name__ == '__main__':
    t1 = time.time()
    qiubai = QiuBai()
    qiubai.run()
    print("total cost:",time.time()-t1)

通过线程池实现更快的爬虫

1. 线程池使用方法介绍

1.实例化线程池对象

 from multiprocessing.dummy import Pool
 pool = Pool(process=5) #默认大小是cup的个数

2. 把从发送请求，提取数据，到保存合并成一个函数，交给线程池异步执行

使用方法pool.apply_async(func)

 def exetute_requests_item_save(self):
     url = self.queue.get()
     html_str = self.parse_url(url)
     content_list = self.get_content_list(html_str)
     self.save_content_list(content_list)
     self.total_response_num +=1

 pool.apply_async(self.exetute_requests_item_save)

3.添加回调函数

通过apply_async的方法能够让函数异步执行，但是只能够执行一次

为了让其能够被反复执行，通过添加回调函数的方式能够让_callback 递归的调用自己

同时需要指定递归退出的条件.

def _callback(self,temp):
     if self.is_running:
          pool.apply_async(self.exetute_requests_item_save,callback=self._callback)

 pool.apply_async(self.exetute_requests_item_save,callback=self._callback)

4.确定程序结束的条件程序在获取的响应和url数量相同的时候可以结束

while True: #防止主线程结束
     time.sleep(0.0001)  #避免cpu空转，浪费资源
     if self.total_response_num>=self.total_requests_num:
         self.is_running= False
         break
 self.pool.close() #关闭线程池，防止新的线程开启
# self.pool.join() #等待所有的子线程结束

2. 使用线程池实现爬虫的具体实现

# coding=utf-8
import requests
from lxml import etree
import time
from queue import Queue
from multiprocessing.dummy import Pool

class QiuBai:
    def __init__(self):
        self.temp_url = "http://www.qiushibaike.com/8hr/page/{}"
        self.headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36"}
        self.queue = Queue()
        self.pool= Pool(5)
        self.is_running = True
        self.total_request_num = 0
        self.total_response_num =0
        self.proxies = {"http":"http://58.247.179.94:8060"}


    def get_url_list(self):
        for i in range(1,14):
            self.queue.put(self.temp_url.format(i))
            self.total_request_num += 1

    def parse_url(self,url):
        # response = requests.get(url,headers=self.headers,proxies=self.proxies)
        response = requests.get(url,headers=self.headers)
        print(response)
        return response.content.decode()

    def get_content_list(self,html_str):#提取数据
        html = etree.HTML(html_str)
        div_list = html.xpath("//div[@id='content-left']/div")
        content_list = []
        for div in div_list:
            item = {}
            item["user_name"] = div.xpath(".//h2/text()")[0].strip()
            item["content"] = [i.strip() for i in div.xpath(".//div[@class='content']/span/text()")]
            content_list.append(item)
        return content_list

    def save_content_list(self,content_list): #保存
        for content in content_list:
            # print(content)
            pass

    def _execete_request_content_save(self):  #进行一次url地址的请求，提取，保存
        url = self.queue.get()
        html_str = self.parse_url(url)
        #3. 提取数据
        content_list = self.get_content_list(html_str)
        #4. 保存
        self.save_content_list(content_list)
        self.total_response_num +=1

    def _callback(self,temp):
        if self.is_running:
            self.pool.apply_async(self._execete_request_content_save,callback=self._callback)


    def run(self):#实现做主要逻辑
        #1. 准备url列表
        self.get_url_list()
        for i in range(3): #设置并发数为3
            self.pool.apply_async(self._execete_request_content_save,callback=self._callback)

        while True:
            time.sleep(0.0001)
            if self.total_response_num>= self.total_request_num:
                self.is_running = False
                break


if __name__ == '__main__':
    t1 = time.time()
    qiubai = QiuBai()
    qiubai.run()
    print("total cost:",time.time()-t1)

3. 使用协程池实现爬虫的具体实现

# coding=utf-8
import gevent.monkey
gevent.monkey.patch_all()

from gevent.pool import  Pool
import requests
from lxml import etree
import time
from queue import Queue
# from multiprocessing.dummy import Pool

class QiuBai:
    def __init__(self):
        self.temp_url = "http://www.qiushibaike.com/8hr/page/{}"
        self.headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36"}
        self.queue = Queue()
        self.pool= Pool(5)
        self.is_running = True
        self.total_request_num = 0
        self.total_response_num =0
        self.proxies = {"http":"http://58.247.179.94:8060"}


    def get_url_list(self):
        for i in range(1,14):
            self.queue.put(self.temp_url.format(i))
            self.total_request_num += 1

    def parse_url(self,url):
        # response = requests.get(url,headers=self.headers,proxies=self.proxies)
        response = requests.get(url,headers=self.headers)
        print(response)
        return response.content.decode()

    def get_content_list(self,html_str):#提取数据
        html = etree.HTML(html_str)
        div_list = html.xpath("//div[@id='content-left']/div")
        content_list = []
        for div in div_list:
            item = {}
            item["user_name"] = div.xpath(".//h2/text()")[0].strip()
            item["content"] = [i.strip() for i in div.xpath(".//div[@class='content']/span/text()")]
            content_list.append(item)
        return content_list

    def save_content_list(self,content_list): #保存
        for content in content_list:
            # print(content)
            pass

    def _execete_request_content_save(self):  #进行一次url地址的请求，提取，保存
        url = self.queue.get()
        html_str = self.parse_url(url)
        #3. 提取数据
        content_list = self.get_content_list(html_str)
        #4. 保存
        self.save_content_list(content_list)
        self.total_response_num +=1

    def _callback(self,temp):
        if self.is_running:
            self.pool.apply_async(self._execete_request_content_save,callback=self._callback)


    def run(self):#实现做主要逻辑
        #1. 准备url列表
        self.get_url_list()
        for i in range(3): #设置并发数为3
            self.pool.apply_async(self._execete_request_content_save,callback=self._callback)

        while True:
            time.sleep(0.0001)
            if self.total_response_num>= self.total_request_num:
                self.is_running = False
                break


if __name__ == '__main__':
    t1 = time.time()
    qiubai = QiuBai()
    qiubai.run()
    print("total cost:",time.time()-t1)

转载于:https://www.cnblogs.com/yinjiangchong/p/9440168.html

深度优先搜索和广度优先搜索详细解析和区别潇杨爱吃粉深度优先宽度优先算法数据结构
一、深度优先搜索（DFS）1.核心思想像探险家走迷宫，遇到岔路就选一条路走到头，无路可走时返回上一个岔路口换另一条路。2.实现方式数据结构：栈（Stack，先进后出）或递归（隐式栈）遍历顺序：纵向深入，优先访问最深层的节点3.图解示例假设有以下树结构：A/\BC/\/DEFDFS遍历顺序（从根节点A出发）：A→B→D→E→C→F4.代码实现（Python）defdfs(graph,start):s
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
linux,ubuntu下source、sh、bash、./执行脚本的区别初识-CV linux Ubuntu Ubuntu source sh bash ./
ubuntu下source、sh、bash、./执行脚本的区别source命令用法sourceFileName作用:在当前bash环境下读取并执行FileName中的命令。该filename文件可以无"执行权限"注:该命令通常用命令“.”来替代。如:source.bash_profile..bash_profile两者等效。source(或点)命令通常用于重新执行刚修改的初始化文档。source命
户储EMS开发|工商业储能EMS/户储EMS/EMS能源管理系统作用与功能|储能ems排名|SmartEMS3823型工商业/户储EMS系统分布式DTU/分散式DTU配电终端能源
户储EMS开发|工商业储能EMS/户储EMS/EMS能源管理系统作用与功能|储能ems排名|SmartEMS3823型工商业/户储EMS系统一：名词解释及背景EMS能量管理系统EMS（EnergyManagementSystem，能源管理系统）是储能系统的总体决策系统。能源管理系统包括电网级能源管理系统和微电网级能源管理系统。储能系统中主要的EMS系统是微电网层面。EMS作为支撑储能系统的信息管理
Webrtc音频技术（未完）会头痛的可达鸭 WebRTC webrtc
一、概述1、架构上图中发送方（或叫上行、TX）将从MIC采集到的语音数据先做前处理，然后编码得到码流，再用RTP打包通过UDPsocket发送到网络中给对方。接收方（或叫下行、RX）通过UDPsocket收语音包，解析RTP包后放入jitterbuffer中，要播放时每隔一定时间从jitterbuffer中取出包并解码得到PCM数据，做后处理后送给播放器播放出来。二、NetEQ1、简介netEQ是
深度优先搜索（DFS）完全解析：从原理到 Java 实战 my_realmy Java基础知识深度优先 java 算法
深度优先搜索（DFS）完全解析：从原理到Java实战@TOC作为一名程序员，你是否遇到过需要在复杂的图结构中寻找路径、检测环，或者进行树遍历的问题？深度优先搜索（Depth-FirstSearch,DFS）作为一种经典的图遍历算法，能够轻松应对这些场景。在CSDN社区中，技术文章的受欢迎程度往往取决于内容的实用性、代码的可读性以及图文结合的讲解方式。因此，本文将为你带来一篇深入浅出、图文并茂、代码
云服务器linux下配置springboot项目启动、停止、重启脚本努力的Andy 脚本 linux 运维服务器
目录为什么要配置启动脚本？配置脚本一、选择一个文件夹新建一个XXX.sh文件（xxx可以命名为项目名称，新建.sh.conf等文件用到的是vi指令）二、进入如下页面，按下键盘i键进入insert模式三、insert如下配置（只需修改APP_NAME内容为自己想要启动的jar包）四、脚本代码解释：linux下脚本测试1、启动测试2、查看状态3、停止测试4、重启测试为什么要配置启动脚本？一般情况下我们
本地锁 vs 分布式锁详解重生之我在成电转码 java 系统锁分布式锁
一、什么是本地锁？本地锁（LocalLock）指的是单机环境下使用Java/JVM自带的锁机制，实现线程之间的互斥和同步。✅本地锁的常见实现：锁类型说明synchronizedJVM内置，修饰方法或代码块，重量级锁，自动释放ReentrantLockJUC提供，支持可重入、可中断、公平锁、Condition等StampedLock支持读写锁和乐观读，适合读多写少场景ReadWriteLock读写分
Apache Tomcat默认文件漏洞 m0_67401606 java tomcat apache servlet 后端
ApacheTomcat默认文件漏洞一、概要漏洞描述：默认错误页面，默认索引页面，示例JSP和/或示例servlet安装在远程ApacheTomcat服务器上。应删除这些文件，因为它们可能有助于攻击者发现有关远程Tomcat安装或主机本身的信息。漏洞风险：中修复建议：删除默认索引页并删除示例JSP和servlet。按照Tomcat或OWASP说明更换或修改默认错误页面。二、解决办法1、直接删除do
2025年渗透测试面试题总结-某四字大厂实习面试复盘一面二面三面（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全 web安全红蓝攻防 python
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录一面1.数组和链表各自的优势和原因2.操作系统层面解析和进程3.线程和进程通信方式及数据安全问题4.线程和多进程的选用场景及原因5.SQL注入绕WAF方式6.FUZZ绕WAF的payload长度通常是多少7.不查资料直接写IPv4正则regex8.Fastjson反序
【Apache Tomcat信息泄露漏洞】猫饭_ACE 业务所需 tomcat apache java
一、漏洞详情ApacheTomcat是一个流行的开源Web服务器和Java代码的Servlet容器。9月28日，Apache发布安全公告，公开披露了Tomcat中的一个信息泄露漏洞（CVE-2021-43980）。由于某些Tomcat版本中的阻塞式读写的简化实现导致存在并发错误（极难触发），可能使客户端连接共享一个Http11Processor实例，导致响应或部分响应被错误的客户端接收，造成信息泄
Ubuntu下通过.sh文件同时启动多个程序系列3—gnome-terminal简单使用说明 JANGHIGH Ubuntu ROS bash linux
gnome-terminal简单使用说明gnome-terminal使用基本用法启动后自动执行命令废弃命令提示：~~-x和-e解释~~如何使用.bashrc里的内容gnome-terminal使用基本用法1.gnome-terminal命令用于打开一个新的终端，直接在命令行$gnome-terminal就可以打开一个新的终端，有一些常用参数：2.打开后自动最大化$gnome-terminal--m
java面试题,什么是动态代理？、动态代理和静态代理有什么区别？说一下反射机制？JDK Proxy 和 CGLib 有什么区别？动态代理的底层述雾学java java 开发语言 java面试题反射 java核心基础
什么是动态代理？动态代理是在程序运行期，动态的创建目标对象的代理对象，并对目标对象中的方法进行功能性增强的一种技术。在生成代理对象的过程中，目标对象不变，代理对象中的方法是目标对象方法的增强方法。可以理解为运行期间，对象中方法的动态拦截，在拦截方法的前后执行功能操作。动态代理的常见使用场景有：统计每个api的请求耗时；统一的日志输出；校验被调用的api是否已经登录和权限鉴定；SpringAOP。动
网络编程、URI和URL的区别、TCP/IP协议、IP和端口、URLConnection 述雾学java Java核心基础 tcp/ip java java基础网络编程
DAY12.1Java核心基础网络编程在互联网时代，网络在生活中处处可见，javaWeb占据了很大一部分那如何实现javaWeb编程呢？Web编程就是运行在同一个网络下面的终端，使得它们之间可以进行数据传输计算机网络基本知识计算机网络是通过硬件设施，传输媒介把不同物理地址上的计算机网络进行连接，形成一个资源共享和数据传输的网络系统两台终端进行连接需要遵守规定的网络协议语法：数据信息的结构语义：描述
储能EMS dongzengwu 网络运维服务器
储能EMS5.1系统网络结构储能EMS应用层通过与PCS的交互实现有功功率控制、无功功率控制、黑启动控制、调峰调频等储能特色功能，可以满足绝大多数储能项目的功能需求，实现储能经济利用提供了完善的、可实话的技术手段。系统结构示意图如下图所示：功能参数储能EMS系统包含运行监测、故障告警、参数设置、数据报表、曲线显示以及应用工具主要检测信息包含：储能电池信息、电量信息、功率曲线、PCS总充电量放电量和
Rasa Webchat：开源聊天机器人组件乌昱有Melanie
RasaWebchat：开源聊天机器人组件rasa-webchatAfeature-richchatwidgetforRasaandBotfront项目地址:https://gitcode.com/gh_mirrors/ra/rasa-webchatRasaWebchat是一个开源项目，旨在为Rasa或Botfront开发的虚拟助手提供在任意网站上部署的聊天窗口组件。该项目主要使用JavaScri
【MySQL】插入查询结果，聚合函数熙曦Sakura MySQL mysql 数据库
6.5插入查询结果语法：INSERTINTOtable_name[(column[,column...])]SELECT...案例：删除表中的的重复记录，重复的数据只能有一份--创建原数据表CREATETABLEduplicate_table(idint,namevarchar(20));QueryOK,0rowsaffected(0.01sec)--插入测试数据INSERTINTOduplica
PyCharm v2024.3.5 强大的Python IDE工具支持M、Intel芯片 2401_89264762 python ide pycharm
PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。应用介绍PyCharm是由JetBrains打造的一款PythonIDE，VS2010的重构插件Resharper就是出自
PTA团体程序设计天梯赛-练习集51-55题 β添砖java c++算法开发语言
L1-051打折去商场淘打折商品时，计算打折以后的价钱是件颇费脑子的事情。例如原价￥988，标明打7折，则折扣价应该是￥988x70%=￥691.60。本题就请你写个程序替客户计算折扣价。输入格式：输入在一行中给出商品的原价（不超过1万元的正整数）和折扣（为[1,9]区间内的整数），其间以空格分隔。输出格式：在一行中输出商品的折扣价，保留小数点后2位。输入样例：9887输出样例：691.60#in
ESP32学习 -从STM32工程架构进阶到ESP32架构古希腊掌握嵌入式的神学习 stm32 架构 esp32
ESP32与STM32项目文件结构对比解析以下是对你提供的ESP32项目文件结构的详细解释，并与STM32（以STM32CubeIDE为例）的常见结构进行对比，帮助你理解两者的差异：1.ESP32项目文件解析文件/目录作用STM32对应或差异settingsIDE（如VSCode或Eclipse）的用户配置文件，存储个性化设置。STM32CubeIDE中类似配置存储在.settings目录或IDE
贪心算法（10）（java）跳跃游戏奋进的小暄贪心算法 java 游戏
题目：给定一个长度为n的0索引整数数组nums。初始位置为nums[0]。每个元素nums[i]表示从索引i向前跳转的最大长度。换句话说，如果你在nums[i]处,你可以跳转到任意nums[i+j]处:1.0=n-1)//判断是否以经跳到最后一个位置{returnret;}for(inti=left;i<=right;i++)//更新下一层最右端点{maxPos=Math.max(maxPos,n
技术革命、需求升级与商业生态迭代——基于开源AI大模型与智能商业范式的创新研究说私域人工智能开源小程序微信零售
摘要：本文以技术哲学与商业生态系统理论为分析框架，通过质性研究与案例分析法，系统阐释第三次与第四次科技革命如何通过技术范式创新引发用户需求跃迁，进而驱动商业生态系统的结构性变革。研究聚焦开源AI大模型、AI智能名片、S2B2C商城及小程序源码等前沿技术工具，解构其如何重构"技术赋权-需求进化-商业物种爆发"的价值传导链条。研究发现：技术革命通过创造新需求空间、重构价值网络拓扑结构、降低创新参与门槛
npm 命令使用文档喆星时瑜安装部署前端 npm 前端 node.js
目录简介安装与配置基础命令依赖管理版本控制脚本管理包发布高级命令配置管理最佳实践常见问题1.简介npm(NodePackageManager)是Node.js的官方包管理工具，提供：130万+开源包的注册表访问依赖解析与版本管理项目脚本自动化私有包管理能力完整的包生命周期管理2.安装与配置2.1安装Node.js#通过官方安装包https://nodejs.org#验证安装node-vnpm-v2
ubuntu中source bash sh的区别阿斯顿的风格 ubuntu bash linux
source与.（点命令）作用与特点执行方式：两者都用于在当前shell环境中执行指定脚本文件的命令，而不是启动一个新的子shell。效果：脚本中对环境变量、函数、当前目录等所做的修改会直接影响当前shell环境。这对于设置环境变量、加载配置等场景非常有用。语法区别：sourcescript.sh是Bash及部分其他shell中的内置命令。.script.sh（点命令）是POSIX标准规定的，在所
30天搭建消防安全培训小程序 mon_star° 小程序微信小程序微信公众平台
一、功能需求搭建一款消防安全培训答题小程序，大体上实现功能如下：1.重要消防相关信息发布提醒；2.培训课程库播放，文档的，加视频的；3.题库、考试单选、多选、判断三类题；4.考试成绩查询、输出表单；5.单次培训：限时内完成，签到（手签名），限时内完成考试；二、项目结构使用微信开发者工具创建一个新的小程序项目，项目结构大致如下：pages├──index//首页，显示重要信息提醒├──course/
oceanbase 是不是架构比较复杂和mysql对比分析 hxsln11 金融数据库 oceanbase 架构 mysql
我先来分析用户的需求。用户的问题是关于OceanBase和MySQL的架构复杂度对比，并希望了解两者在架构上的具体差异。这是一个技术性较强的问题，用户可能是数据库开发者、架构师或者对分布式数据库感兴趣的学习者。结合上下文，用户之前已经提到过OceanBase的学习曲线较陡峭，可能是因为其分布式架构的复杂性，所以这次的问题很可能是想进一步明确OceanBase和MySQL在架构上的具体差异，以及为什
编写脚本在Linux下启动、停止SpringBoot工程流烟默系统运维 Linux全面入门 linux spring boot shell
【1】启动命令nohupjava-jaryour-application.jar>/dev/null2>&1&>/dev/null2>&1：这条命令将标准输出和标准错误都重定向到/dev/null，这意味着它们不会输出到控制台或任何文件。这样做是因为我们希望所有日志都由Logback处理并写入到配置文件中指定的日志文件里。然而，如果你想要保留控制台输出（例如，对于调试目的），你可以省略这部分重定向
kvm虚拟机的基本使用千航@abc kvm虚拟化 linux centos 运维 kvm 虚拟化 virsh
[root@kvm~]#virshdestroy虚拟机名#关闭虚拟机[root@kvm~]#virshundefine虚拟机名#删除虚拟机[root@kvm~]#virshstart虚拟机名#开启虚拟机[root@kvm~]#virshconsole虚拟机名#登录虚拟机[root@kvm~]#virshlist--all#显示所有虚拟机[root@kvm~]#virshconsole虚拟机名#连接
SvelteKit 最新中文文档教程（6）—— 状态管理冴羽yayujs Svelte 中文文档前端 javascript 前端框架 vue.js react svelte sveltekit
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
MTK ADSP yyc_audio 嵌入式硬件
MTK音频硬件概念AFE：音频前端硬件audiofrontendhwAFEMEMIF(FE):PCMDMA,memoryread/writeAudiointerconnection:connectionfabricforaudiosubmodule。核心路由器件。负责FE和BE之间的连接和路由。DAI(BE):DigitalAudioI/F,eTDM/I2S/DMIC.–EnhancedTDM,c
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地