win_lin

多进程支持高并发

例子参考高性能流媒体服务器SRS：https://github.com/winlinvip/simple-rtmp-server

多进程结构是实现那些服务内容不相关的服务器的os层面的自然抽象。

1. 容错：若系统在提供服务时，服务单元之间界限清晰没有或很少交互（例如浏览两个不相关的网页），而服务单元有很大可能出错，希望出错时不影响其他单元。

2. 高性能：服务器若支持多CPU或超线程，多线程无法完全利用机器性能，多进程则可以让服务器满载。

最近使用多进程开发流媒体服务器，性能很不错，预计能支持1000个客户端并发播放1000kbps，能跑到千兆网的极限。参考这篇文章：http://blog.csdn.net/winlinvip/article/details/7840285 。

支持高并发的多进程服务器，应遵循以下设计要点：

并非每个connection新建一个进程，这样支持的并发并不高。
每个进程处理多个connection，使用event-base来管理这些连接。
master由信号驱动，worker由epoll驱动（当然信号会让epoll_wait返回）。
多进程用来利用多CPU硬件，所以按照业务边界来划分进程，或者就按CPU个数配置。
若有特殊业务逻辑，譬如chrome的站点抽象，多进程有提高系统容错性的优点。
每个connection的fd（socket）使用非阻塞方式（即异步方式，参考 http://blog.csdn.net/winlinvip/article/details/7843000 ）。
每个进程是单线程的：event-based, non-blocking, async-io 这些足以避免多线程。
关键点就是尽量使用异步。

关于chrome的多进程结构的背景：

http://blog.chromium.org/2008/09/multi-process-architecture.html

http://www.charlesreis.com/research/publications/eurosys-2009-talk.pdf?attredirects=0

总结如下：

1. 应该对系统分析，先搞清楚系统的目标，根据目标划分边界，再设计系统结构。
例如浏览器模型中，多进程模型分为：核心进程(存储，网络，UI)、插件进程、展现进程（DOM，JS引擎，HTML展示）。
这样设计的原因在于对于浏览器系统的分析————系统的边界可以定义在相关的页面，即将可相互操作的页面分为Site组。
区分系统边界的原因在于浏览器的实际问题“网页和脚本极易出错导致崩溃“、”加载速度随网页增多变慢“。
所以，先应分析系统的主要设计目标（要解决的问题），然后分析边界（可分解的子系统），最后才能设计系统的结构（进程的模型之类的）。
插件进程作为单独进程的原因，也是由系统的目标决定的：插件在边界上很明显，独立于HTML展现，而且也有崩溃的可能性。
核心进程一旦崩溃，整个系统也就崩溃了，所以核心进程的边界是也避开那些容易崩溃的系统（譬如把插件独立出去）。
2. 系统的目标和内涵：稳定性，性能。
稳定性：包括容错性，内存管理，可问责性。
容错性：即某个子系统崩溃时是否能不影响其他系统。譬如某个页面崩溃是否其他页面还能不受影响。
可问责性：即当系统出问题时，是否能快速定位是某个子系统，并采取措施解决问题。譬如，当浏览器占用过多资源时(内存泄漏啦之类)，是否能快速找到出问题的页面，关闭它解决问题。
内存管理：是否能汇报各个子系统的内存使用情况，内存泄漏时是否能重启或关闭子系统解决问题。
性能：包括实时性，吞吐速度，多CPU加速。
实时性：即系统对于用户的响应是否实时。譬如，A页面现在很慢，但用户在B页面中操作是否能实时响应。
吞吐速度：当任务增多时系统的整体吞吐能力。譬如，开很多个页面，系统是否还能性能良好。
多CPU加速：系统是否能利用多CPU的服务器加速。譬如，是否能利用24CPU的机器能力，还是说24CPU能力和4CPU能力一样？
3. 多进程架构会占用更多内存。
4. Chrome其实支持单进程和多进程结构。

nginx也是多进程，虽然单个进程也可以支持高并发，但在实际服务器上，一般还是会使用多进程——这也是为什么用多进程的原因之一。参考nginx的系统结构一文：http://www.aosabook.org/en/nginx.html （我的朋友雷总分享给我的好东西，感谢他）。

参考《Unix环境高级编程》中对fork的总结，即多进程的使用场景：

fork有两种用法：
(1) 一个父进程希望复制自己，使父、子进程同时执行不同的代码段。父进程侦听请求，当请求到达时，父进程fork子进程处理此请求，父进程继续侦听下一个请求。
(2) 一个进程要执行一个不同的程序。这对shell是常见的情况。在这种情况下，子进程在从fork返回后立即调用exec。

其实也提到了服务器的应用。可见网络服务器使用多进程是有很长历史了。

两个多进程服务器原型：http://blog.csdn.net/winlinvip/article/details/7764526

linux多进程服务器真的很给力，赞一个！

写了一个原型，让服务器保持10200个稳定连接的原型。

开启了15个worker进程（伺服进程）：
ps -axf
1540 ? Ss 0:00 /usr/sbin/sshd
1959 ? Ss 0:00 \_ sshd: winlin [priv]
1961 ? S 0:00 \_ sshd: winlin@pts/0
1962 pts/0 Ss 0:00 \_ -bash
30127 pts/0 S+ 0:00 \_ ./multiple_process multi
30128 pts/0 S+ 0:00 \_ ./multiple_process multi
30129 pts/0 S+ 0:00 \_ ./multiple_process multi
30130 pts/0 S+ 0:00 \_ ./multiple_process multi
30131 pts/0 S+ 0:00 \_ ./multiple_process multi
30132 pts/0 S+ 0:00 \_ ./multiple_process multi
30133 pts/0 S+ 0:00 \_ ./multiple_process multi
30134 pts/0 S+ 0:00 \_ ./multiple_process multi
30135 pts/0 S+ 0:00 \_ ./multiple_process multi
30136 pts/0 S+ 0:00 \_ ./multiple_process multi
30137 pts/0 S+ 0:00 \_ ./multiple_process multi
30138 pts/0 S+ 0:00 \_ ./multiple_process multi
30139 pts/0 S+ 0:00 \_ ./multiple_process multi
30140 pts/0 S+ 0:00 \_ ./multiple_process multi
30141 pts/0 S+ 0:00 \_ ./multiple_process multi
30142 pts/0 S+ 0:00 \_ ./multiple_process multi

process #30128 serving 387 clients
process #30129 serving 732 clients
process #30130 serving 1020 clients
process #30131 serving 443 clients
process #30132 serving 437 clients
process #30133 serving 434 clients
process #30134 serving 883 clients
process #30135 serving 678 clients
process #30136 serving 958 clients
process #30137 serving 329 clients
process #30138 serving 758 clients
process #30139 serving 1020 clients
process #30140 serving 1020 clients
process #30141 serving 411 clients
process #30142 serving 690 clients
共有10200个client。

开启了10个程序，每个建立1020个连接：
[1] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[2] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[3] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[4] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[5] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[6] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[7] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[8] Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[9]- Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &
[10]+ Running ./test_client 127.0.0.1 1990 1020 > /dev/null 2>&1 &

该模型能保持稳定的10200个连接，由于每个进程只支持1024个fd(可设置)，所以每个进程限定最多连接为1020个fd。

//multiple_process.cpp

#include 
#include 
#include 
#include 
#include 
using namespace std;

// for socket
#include 
#include 
#include 
// for select
#include 
// for process control
#include 
#include 

int prepare_server_socket(int server_port){
    int server_fd = socket(AF_INET, SOCK_STREAM, 0);
    if(server_fd == -1){
        cout << "init socket error" << endl;
        exit(1);
    }
    cout << "socket init success" << endl;
    
    int reuse_socket = 1;
    if(setsockopt(server_fd, SOL_SOCKET, SO_REUSEADDR, &reuse_socket, sizeof(int)) == -1){
        cout << "reuse socket error" << endl;
        exit(1);
    }
    cout << "socket set to reuse success" << endl;
    
    struct sockaddr_in addr;
    memset(&addr, 0, sizeof(sockaddr_in));
    addr.sin_family = AF_INET;
    addr.sin_port = htons(server_port);
    addr.sin_addr.s_addr = INADDR_ANY;
    if(bind(server_fd, (const struct sockaddr*)&addr, sizeof(addr)) == -1){
        cout << "bind socket error" << endl;
        exit(1);
    }
    cout << "socket bind success" << endl;
    
    if(listen(server_fd, 10) == -1){
        cout << "listen socket error" << endl;
        exit(1);
    }
    cout << "socket listen success" << endl;
    
    return server_fd;
}

bool can_socket_read(int socket_fd, int timeout_ms){
    fd_set set;
    FD_ZERO(&set);
    FD_SET(socket_fd, &set);
    
    timeval timeout;
    timeout.tv_sec = 0;
    timeout.tv_usec = timeout_ms * 1000;
    
    if(select(socket_fd + 1, &set, NULL, NULL, &timeout) == -1){
        cout << "select socket error " << endl;
        exit(1);
    }
    
    if(!FD_ISSET(socket_fd, &set)){
        return false;
    }
    
    return true;
}

vector clients;
void process_cycle(int server_fd){
    cout << "process #" << getpid() << " accept and process client from socket " << server_fd << endl;
    
    while(true){
        // accept
        while(clients.size() < 1020){
            if(!can_socket_read(server_fd, 500)){
                break;
            }
            
            //cout << "get a client, accept it" << endl;
            int client_fd = accept(server_fd, NULL, 0);
            if(client_fd == -1){
                cout << "failed to accept client" << endl;
                exit(1);
            }
            //cout << "accept client success: #" << client_fd << endl;
            clients.push_back(client_fd);
        }
        // process: PING.
        if(true){
            vector::iterator ite;
            for(ite = clients.begin(); ite != clients.end(); ite++){
                int client_fd = *ite;
                
                if(!can_socket_read(client_fd, 1)){
                    continue;
                }
            
                char buf[1024];
                if(recv(client_fd, buf, sizeof(buf), 0) <= 0){
                    cout << "read client error, exit" << endl;
                    exit(1);
                }
                //cout << "process #" << getpid() << " (" << clients.size() << " clients) recv from client: " << buf << endl;
                if(send(client_fd, buf, strlen(buf), 0) <= 0){
                    cout << "send data error, exit" << endl;
                    exit(1);
                }
            }
        }
        cout << "process #" << getpid() << " serving " << clients.size() << " clients" << endl;
    }
}

void start_worker_process(int server_fd, int process_num){
    for(int i = 0; i < process_num; i++){
        pid_t pid = fork();
        // child process
        if(pid == 0){
            process_cycle(server_fd);
            exit(0);
        }
        // parent process
        else if(pid == -1){
            cout << "fork child process error" << endl;
            exit(1);
        }
        else{
            cout << "fork child process success: #" << pid << endl;
        }
    }
}

int main(int argc, char** argv){
    if(argc <= 3){
        cout << "usage: " << argv[0] << "    " << endl
            << "port: the port to listen at" << endl
            << "single_process_mode: whether use the single process mode" << endl
            << "num_of_processes: if multiple processes mode, how many process we will create" << endl
            << "for example: " << argv[0] << " 1990 false 15" << endl;
        exit(1);
    }
    int server_port = atoi(argv[1]);
    char* single_process_mode = argv[2];
    int num_of_processes = atoi(argv[3]);
    bool is_single_process = !strcmp(single_process_mode, "true");
    cout << "[config] " << (is_single_process? "single process" : "multiple processes") << " mode, " 
        << "listening at " << server_port
        << ", create " << num_of_processes << " worker processes" << endl;
    
    char* server_ip = argv[1];
    cout << "[remark] multiple processes prototype. " << endl
        << "[remark] master process listen to get a socket fd(file descriptor), worker process accept and serve client." << endl
        << "[remark] this prototype also show the architecture swithing between multiple and single process." << endl;
    
    // master process: bind and listen.
    int server_fd = prepare_server_socket(server_port);
    
    // worker process: accept and process.
    if(is_single_process){
        process_cycle(server_fd);
    }
    else{
        start_worker_process(server_fd, num_of_processes);
    }
    
    for(int i = 0; i < num_of_processes; i++){
        int status = 0;
        pid_t pid = waitpid(-1, &status, 0);
        cout << "child process #" << pid << " terminated" << endl;
    }
    
    cout << "server terminated" << endl;
    close(server_fd);
    
    return 0;
}

// test_client.cpp

#include 
#include 
#include 
#include 
#include 
using namespace std;

#include 
#include 
#include 
#include 

int main(int argc, char** argv)
{
    if(argc <= 3){
        cout << "usage: " << argv[0] << "    " << endl
            << "server_ip: the ip of server to connect" << endl
            << "server_port: the port of server to connect" << endl
            << "num_of_clients: how many client we will start" << endl
            << "for example: " << argv[0] << " 127.0.0.1 1990 1020" << endl;
        exit(1);
    }
    char* server_ip = argv[1];
    int server_port = atoi(argv[2]);
    int num_of_clients = atoi(argv[3]);
    
    vector clients;
    for(int i = 0; i < num_of_clients; i++){
        int client = socket(AF_INET, SOCK_STREAM, 0);
        if(client == -1){
            cout << "create socket error" << endl;
            exit(1);
        }
        cout << "create socket success" << endl;
        
        sockaddr_in addr;
        memset(&addr, 0, sizeof(addr));
        addr.sin_family = AF_INET;
        addr.sin_port = htons(server_port);
        addr.sin_addr.s_addr = inet_addr(server_ip);
        
        if(connect(client, (const struct sockaddr*)&addr, sizeof(addr)) == -1){
            cout << "connect to server error" << endl;
            exit(1);
        }
        cout << "connect server success" << endl;
        
        clients.push_back(client);
    }
    
    const char msg[] = "hello, this is client";
    char buf[1024];
    memset(buf, 0, sizeof(buf));
    memcpy(buf, msg, sizeof(msg));
    
    while(true){
        for(vector::iterator ite = clients.begin(); ite != clients.end(); ite++){
            int client = *ite;
            
            if(send(client, buf, sizeof(msg), 0) < 0){
                cout << "send error" << endl;
                exit(1);
            }
            if(recv(client, buf, sizeof(buf), 0) < 0){
                cout << "recv error" << endl;
                exit(1);
            }
            cout << "recv from server: " << buf << endl;
            
            sleep(3);
        }
        
        sleep(120);
    }
    
    return 0;
}

c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
第九十章真情溪境
图片发自App图片发自App和雏田在一起的日子真的很开心。姐姐永远是最亲的最真的。佐助总来捣乱。小樱准备一盆水泼佐助。想到恋爱通告亦菲被泼水不免高兴。亦菲是最美的。没想到她也会有这种遭遇。也许不需要赚那么多钱。和家人在一起的日子真好。却轻易破碎。雏田的话语温软，依稀在耳边。她的微笑纯美温柔。喜欢温柔的哥哥，雏田就是这样啊。不知道雏田是喜欢男生还是女生。我都支持。过去门当户对。现在自由恋爱。想永远和
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
但行好事，莫问前程浅草拾光
鸿星尔克被冲上了热搜，他可能做梦也没有想到自己的一个善举便迎来了他的春天。在这次河南救灾中很多明星企业都纷纷捐款，而一个快被人遗忘的品牌掏出了自己的家底。在自己年利润是亏损2.28亿的时候还大方的捐了五千万物资。热心的网友纷纷留言，大家都跑去直播间支持国货，去实体店买鞋子。以至于订单爆满，仓库清空。老板劝大家理性消费，大家反而更冲动。就是这样一种热情，这样一种情怀，感动了平凡的你我。大家都说华夏儿
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
简单说说关于shell中zsh和bash的选择秋刀prince MacOS 小猿们的开发日常 bash
希望文章能给到你启发和灵感～如果觉得文章对你有帮助的话，点赞+关注+收藏支持一下博主吧～阅读指南开篇说明一、基础环境说明1.1硬件环境1.2软件环境二、什么是shell、bash、zsh?2.1bash2.2zsh三、选择Bash还是Zsh？四、一些常见问题开篇说明本篇主要简单说明一下，shell中bash和zsh的区别和选择；我们经常会把这两个搞混，不知道什么时候用哪一个，以及怎么使用；一、基础
“愿你，戒酒也戒她。” 钟斯
你以荨麻疹为幌子，向全世界宣布，从今以后你不能再喝酒了，你要戒酒。你的朋友们，觉得你的健康最重要，所以大力支持，商量着以后谁都不能再劝你酒。可是，你转身就在夜深人静时独自痛饮，然后在意识涣散中发了疯地想她。你知道这样不对，但你难以自制。我一直觉得，你是那种“衣履风流，潇洒潇洒去了”的人，所以，当你跟我说你难受的时候，我还是有一些诧异的。我不知道，什么样的事情能让如此洒脱的你难受。当我问及的时候，你
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
python批量读取tiff文件_Python Pillow批量转换tif格式到jpg weixin_39557797
最近因为想要整下网站的壁纸，从网站下载了别人整理好的合集压缩包，解压之后，却发现里面的文件都是tif的，tif格式网站和电脑都不认的，根本不能作壁纸。这时候，就需要转换图片格式了，首先我找了几款转换格式的软件，发现效果都不好，要不是不支持tif格式，要不就是转换出来的图片糊的不行。最终，还是决定用Python的Pillow库来写一个脚本，完成这个任务。下面是整个的小脚本----importosim
利用python实现图片格式之间的相互转换难得北窗高卧 python 开发语言
一、概要图片一般有多种格式，常见的图片格式包括：JPEG（.jpg或.jpeg）：一种广泛使用的有损压缩格式，适用于摄影图像和网页上的图片。PNG（.png）：一种无损压缩格式，支持透明度和更好的图像质量，常用于图标、图形和需要透明背景的图片。该图片是4通道的，外加一个透明通道。如截屏GIF（.gif）：一种支持动画和透明度的格式，常用于简单的动画和图标。BMP（.bmp）：一种无损格式，存储图像
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
python获取子进程返回值_Python对进程Multiprocessing子进程返回值 weixin_39752157 python获取子进程返回值
在实际使用多进程的时候，可能需要获取到子进程运行的返回值。如果只是用来存储，则可以将返回值保存到一个数据结构中；如果需要判断此返回值，从而决定是否继续执行所有子进程，则会相对比较复杂。另外在Multiprocessing中，可以利用Process与Pool创建子进程，这两种用法在获取子进程返回值上的写法上也不相同。这篇中，我们直接上代码，分析多进程中获取子进程返回值的不同用法，以及优缺点。初级用法
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
《驴友的朝圣》065 户外运动论坛，论户外运动之现在与未来经典老表
十几年来，我国户外运动蓬勃发展，已经形成全民参与热情。各类户外运动项目和形式层出不穷。各种户外运动装备产品花样百出。看着形势一派大好。但是，在这大好形势之下，仍存在着诸多的发展瓶颈及安全与管理问题，需要提请重视。为此，江城登山协会在本地召开了“户外运动论坛”，邀请市内户外运动俱乐部及体育系统领导一起研讨本地区户外运动发展的可持续性。2019年6月1日，论坛在世贸万锦大酒店的支持下，在其三层会议大厅
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

多进程支持高并发

你可能感兴趣的:(多进程支持高并发)