Baoshan-Hobbit

从并发到分布式系统和web应用

文章目录

- [本人github上tcp reactor server的实现](https://github.com/Baoshan-Hobbit/reactor_server)
1. 并发
- 1.1 并发与并行
- 1.2 软件系统运行的指标
- 1.3 实现并发的技术
- 1.4 多线程同步
- - 1.4.1 原子操作: 不可中断的一个或一系列操作
  - 1.4.2 互斥锁与条件变量
2. 分布式系统
- 2.1 为什么需要分布式系统?
- 2.2 分布式存储引擎
- 2.3 分布式计算框架
3. web服务器
- 3.1 什么是web应用?
- 3.2 C/S与B/S的区别?
- 3.3 前端与后端到底是什么?
- 3.4 对server的理解
- 3.5 影响web应用并发数的因素有哪些?如何优化?

本人github上tcp reactor server的实现

1. 并发

1.1 并发与并行

并发指的是程序在一段时间内可服务多个用户,可通过多进程或多线程实现.
并行是对计算需求提出的,指的是同一时刻可同时处理的任务数,与cpu的核心数相等

1.2 软件系统运行的指标

吞吐量(批处理,高吞吐,高延迟): 单位时间内处理的请求数,吞吐量时系统的综合指标,硬件
层面的cpu/磁盘/网络的任何一种都有可能称为瓶颈,软件层面的数据库,代码逻辑也对吞吐量
造成影响

I/O密集型应用: 非常消耗I/O资源,很少使用cpu资源,典型代表是web应用
计算密集型应用: 非常消耗cpu资源,很少使用I/O资源,典型代表是机器学习算法的训练
响应时间(实时处理,低吞吐,低延迟): 单个请求从发出请求到收到响应消耗的时间,一般使用
平均响应时间(所有用户的总响应时间 / 用户数)
并发数: 系统能同时承受的最大用户数
QPS: querys per second,反映了服务器接受请求的能力,有可能一个网页的请求发送了多个
query
TPS: trasactions per second,反映了服务器处理完整请求的能力,如一个完整网页(包括多个
请求)从请求到返回算做一个事务

以饭店为例,小王从烹饪学校学成归来,自己开了一家小饭店,

由于资金有限,一开始只有他一个人单干,招呼,点菜,做菜,端菜,结账统统一个人来,为了避免
顾客等待,他一次只服务一个顾客,当前一个顾客酒足饭饱后才开始接待第二个顾客,因此大家
觉得去他家吃一顿饭等待的时间太长了(等待时老板还不搭理你),因此客流量惨淡.小王反思后
决定提高自己的业务水平,很快他干活儿麻溜了许多,顾客的响应时间大幅降低,小店的吞吐量
也上去了,并发数增加. --> 单线程reactor server
一个月后,小王干活的速度再也提不上去了,他想了想,给一个顾客做饭时却耽误了接待下一个
顾客,白白丢了生意,因此他拉来自己的妻子帮他当服务员,负责招呼,点菜,端菜,结账等,而他
则专职做菜.这样对顾客请求的响应和处理分隔开,可以同时进行(处理前一个顾客的请求时
不影响招呼下一个顾客),这样虽然顾客从进店到吃完离开总的时间虽然没变,但是进店就能响应
自己对点菜的需求(虽然还是得等),顾客的体验变好(响应了一部分请求),因此店里的客流量
开始增加(老板的厨艺还是不错的,值得等待).顾客感受到的响应时间(只是部分请求的响应,
实际总的响应时间并无改变)变短,店里吞吐量不变,并发数增加
小王的夫妻店生意越来越好,但是顾客的最长响应时间(最后一个光临的顾客)也随之增加(假设
妻子点菜等不花时间,最长响应时间=前面等待顾客数 * 小王做菜的时间),因为小王的做菜速度
已经达到了极限.小王于是招了一个厨师,做菜的速度快了一倍,响应时间减半,吞吐量翻番,并发
数翻番 --> 工作者线程池reactor server
顾客越来越多,妻子甚至也忙不过来了,因此小王决定让妻子专门负责在前台招呼顾客,负责分配
座位,结账,另外招聘了3个服务员负责点菜,端菜,顾客的总响应时间和店里的吞吐量并无变化,
但是顾客感受到的响应时间减少,并发数增加 --> 多reactor server

总结:

吞吐量只与工作者的处理能力相关,这里的处理能力可以是cpu(计算密集型)也可以是磁盘/网络
I/O, 对计算密集型任务增加线程数可近似成倍增加处理能力,对I/O密集型任务增加线程无济于
事,因为线程和进程都是相对于cpu而言的,他们占用的是cpu时间
总响应时间(一个用户完整的访问请求,即事务)与吞吐量成反比,分离对用户请求的接受/响应和
对请求的处理可减少用户感知的响应时间,提高系统的并发数
若要提高并发数的同时不至于使用户的请求等待处理的时间过长根本上还是得提高工作者的
处理能力,对于I/O密集型应用,可考虑加入缓存减小I/O的响应时间

常见软件系统的分类:

对响应时间敏感的系统,如web应用,在线交易系统

 设计目标: 给定响应时间阈值尽可能少的使用系统资源                         
 解决方法: 共享资源,异步实现对请求的响应和处理                            
 典型代表: 使用工作者线程池的reactor模式设计的web服务器

对吞吐量敏感的系统,如批处理系统

 设计目标: 给定资源阈值尽可能减小响应时间                                 
 解决方法: 充分利用资源,独占式处理加快响应                                
 典型代表: hadoop

1.3 实现并发的技术

a) 多进程: 可充分利用多核,资源隔离(一个进程挂掉其他进程不受影响),易于调试,编程简单
b) 多线程: 可充分利用多核,共享资源方便(一个线程挂掉整个程序玩儿完),难以调试,编程复杂

多核机器作为server提供服务的典型模式:

只有一个单线程的进程: 不可伸缩,不能发挥多核机器的计算能力
只有一个多线程的进程

 + 模式1的简单多份拷贝,前提是能使用多个tcp port对外提供服务                
 + 主进程 + worker进程,主进程绑定到一个tcp port

含有多个单线程的进程
含有多个多线程的进程

必须使用单线程的场景:

程序可能会调用fork(), [待学习]
限制程序的cpu使用率,如监控其他进程的状态的进程,避免过分的抢夺系统的计算资源.
如在一个8核的机器上,单线程程序最高cpu使用率也只有12.5%,只占一个核

I/O密集型任务: 单线程即可,因为增加进程或线程只能加快计算速度,不能加快I/O

计算密集型任务: 推荐多进程,原因如下:

多进程在多核上可实现并行
多进程资源隔离,只需要对数据切分然后分别独立处理即可(map, reduce),不需要太多的
数据共享
多进程编程简单,调试简单
多线程共享资源,还需要额外增加同步机制
多线程编程复杂,调试复杂
当然也可以使用多个进程,在单个进程内使用多线程

适合多线程的场景需要满足的要求:

使用目的: 用于对响应时间敏感的系统,保证响应时间的前提下使用共享资源的方法尽可能减少对
服务器内存资源的占用.保证响应时间的方式是使得对请求的响应(I/O线程)和对请求的
处理(工作线程)相互重叠,异步处理

多核cpu机器
应用关注响应时间
线程需要共享数据且需要修改
事件有优先级差异,可使用专门的线程处理高优先级时间 [待学习]
应用需要异步操作,如logging
程序可伸缩,应当能够享受增加cpu数目带来的好处
具有可预测的性能,随着负载增加,性能缓慢下降,超过某个临界点后急速下降,线程数据不随
负载变化
多线程能清晰的划分功能,使得每个线程的逻辑比较简单,任务单一,便于编程

以linux服务器集群为例:
8个计算节点,1个控制节点.机器的配置相同.双路四核cpu,千兆以太网互联,编写一个简单的集群
管理软件,由三个程序组成:
1) 运行在控制节点的master,负责监视并控制整个集群的状态
2) 运行在每个计算节点的slave,负责启动和终止job,并监控本机的资源
3) 给用户的client命令行工具,用于提交job

client命令行工具: 交互式程序,提交命令的输入和提交的实际运行异步,使用2个线程
slave: 看门狗进程,负责启动别的job进程,必须是单线程,且其不应该占用太多的cpu资源,适合
单线程
master:
1) 独占8核机器,应当充分利用cpu资源
2) master应当快速响应slave的请求,关注响应时间
3) 集群的状态可完全放入内存中,状态可共享可变
4) master监控的事件有优先级区别
5) master使用多个I/O线程来处理与8个slave之间的TCP连接可降低延迟
6) master需要异步的往本地磁盘写log,logging library有自己的I/O线程
7) master可能要读写数据库,数据库连接这个第三方library可能有自己的线程
8) master可服务于多个client,多个I/O线程可降低用户的响应时间

则master可开启9个线程:
+ 4个与slave通信的I/O线程
+ 2个与client通信的I/O线程
+ 1个logging线程
+ 1个数据库I/O线程

总结:
多线程服务器中的线程一般分为3类:
1) I/O线程: 主循环是I/O Multiplexing,等待在select/poll/epoll系统调用上,也处理定时事件
2) 计算线程: 主循环是阻塞队列,等待在条件变量上,一般位于线程池中
3) 第三方库使用的线程,如logging, DataBase Connection
server一般不会频繁创建和终止线程,一般使用线程池

1.4 多线程同步

1.4.1 原子操作: 不可中断的一个或一系列操作

硬件级别的原子操作
a) 单处理器系统: 能够在单条指令中完成的操作称为原子操作,因为中断只发生在指令边缘
b) 多处理器系统(SMP: Symmetric Multi-Processor): x86平台在指令执行期间对总线加锁
linux内核提供的原子操作接口
软件级别的原子操作的实现依赖于硬件原子操作的支持
a) 对整数操作: atomic_t use_cnt; atomic_set(&use_cnt, 2); atomic_add(3, &use_cnt);等
b) 对位操作: unsigned long word = 0; set_bit(0, &word); clear_bit(5, &word);
change_bit(4, &word);(翻转第4位)等
c++11提供的原子操作接口
a) 通过atomic类模板定义
b) c++11定义了统一的接口,要求编译器产生平台(cpu,如x86_64, ARM)相关的原子操作的具体
实现,接口的成员函数包括读load(), 写store(), 交换exchange()
为什么要关注原子操作?
a) 软件层面的锁机制也是通过原子操作实现的
b) 原子操作对并发编程很重要,使用互斥锁可以将多部操作变为原子操作,保证这些操作要么
全执行,要么全不执行
c) 简单的场景如计数器可以不用锁,直接使用原子操作

为什么在临界区代码段前后分别加锁和解锁就能保证对共享资源的互斥访问?

临界区代码访问了共享资源
加锁的本质是对一个大家约定好的全局变量赋值,通过值的状态来决定当前进程的行为,以
互斥锁为例,如果该全局变量值为1,则当前进程进入睡眠,不再往下执行代码,否则,当前进程
修改该值为1,执行临界区的代码,其他进程看到值为1后就遵守约定进入睡眠,当前进程执行
完毕后修改该全局变量的值为0,其他进程就可以对该全局变量做修改,即上锁.这样实现了对
共享资源的互斥访问.加锁和释放锁本质上都是对全局变量的修改,需要使用原子操作保证该
修改在一条指令中完成

附注:

编程语言: 本质上是一套规则的集合,方便程序员编写这些规则组成的文本,即程序代码
编译器: 本质上是一个翻译工具,将程序代码翻译为cpu可以理解的二进制代码;

  以C语言的编译器为例,完成翻译需要2样东西:                                 
   a) C语言到汇编语言的映射规则(编译器实现,相当于把规则落实了)              
   b) 汇编指令(二进制指令的助记符)到二进制指令的对应规则,cpu平台不同,该规则可能也不同,
      因此需要知道当前cpu的指令结构(cpu提供),如在8086 CPU下,jmp对应的指令为11011001

操作系统: 本质上也是在cpu上运行的应用程序,只是其功能特化为对硬件资源的管理和对其他
应用程序的调度,因此由编程语言编写,由于编译器也是一种应用程序,因此也需要操作系统的
管理和调度,在操作系统提供的环境中执行,接受操作系统的领导
为什么汇编语言比C语言更快?
理论上是一样快的,只是由于采用了编译器的自动翻译,原本只需要2句指令就能完成的任务现在
可能需要10句,指令增多了,cpu执行的时间也更长了

1.4.2 互斥锁与条件变量

互斥锁解决的问题
互斥锁是为了解决不同线程对同一共享资源的访问冲突问题,至少有一个线程会修改该共享资源,
加上互斥锁后,保证线程对该共享资源的独占,避免其他线程的干扰.只要有写需求都可以使用
互斥锁

为什么不同的线程会访问同一个共享资源?

在实际编程中为了充分利用多核优势,加快程序执行速度,多个线程执行相同的代码段,
该代码段包含对共享资源的访问
多个线程各自使用自己的代码段,但这些代码段中都包含对同一个共享资源的额访问

互斥锁mutex的工作机制

对互斥量加锁后,任何其他试图对互斥量再次加锁的线程将会阻塞(睡眠)直到当前线程释放该
互斥锁;
如果释放互斥锁时有多个线程阻塞,所有阻塞线程都会变为就绪状态,由cpu的调度算法决定
哪一个线程可以获得锁,其他线程仍然阻塞

条件变量解决的问题

条件变量设计到至少两种角色: 生产者(一定是写)和消费者(不一定写,也可能只读),两者
通过一个全局变量通信,且消费者只有全局变量满足一定条件时才开始消费
要保证生产和消费的互斥,使用互斥锁完全可满足要求,生产时加锁,消费时也加锁,但在生产
的前期阶段,条件未满足时,消费者仍然需要频繁的加锁解锁,造成cpu资源的浪费
条件变量可使得定制的条件不满足时,线程阻塞在该条件变量上,避免了cpu资源的浪费

条件变量的工作机制

int product_count;                                                          
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;                          
pthread_cond_t cond = PTHREAD_COND_INITIALIZER; 

void Producer() {                                                           
  while (1) {                                                               
    prepare to increase product_count;                                      
                                                                            
    pthread_mutex_lock(&mutex); // 修改product_count前加锁                  
    ++product_count;                                                        
    pthread_mutex_unlock(&mutex); // 修改后解锁                             
                                                                            
    pthread_cond_signal(&cond); // 发出信号                                 
                                                                            
    sleep(rand() % 3);                                                      
  }                                                                         
}

void Consumer() {                                                                                                                                                                                       
  while (1) {                                                               
    pthread_mutex_lock(&mutex);                                             
                                                                            
    // 检测条件                                                             
    while (product_count < 10)                                              
      // 条件不满足,则释放锁,阻塞,为原子操作                                
      // 条件满足,则唤醒,上锁,非原子操作                                    
      pthread_cond_wait(&cond, &mutex);                                     
                                                                            
    --product_count;                                                        
                                                                            
    pthread_mutex_unlock(&mutex);                                           
                                                                            
    sleep(rand() % 3)                                                       
  }                                                                         
}

为什么使用while循环?

使用while循环不是占用cpu忙等,因为pthread_cond_wait本身就是系统调用,当条件不满足时
阻塞(睡眠),不需要程序自己用while实现等待的效果;
当条件满足时pthread_cond_wait包含2条操作:
a) 从条件变量的阻塞队列唤醒当前线程
b) 对共享资源上锁
这2条操作并非是原子操作,因此当唤醒后上锁前其他线程可能已经修改了共享资源(迅速完成了
上锁,消费,释放锁的操作),导致条件不再满足,但当前线程对此不知情,依然正常完成了上锁,
准备消费,然而此时条件已经改变,因此只能重新检测条件是否满足,避免在条件改变时错误
的进行消费

为什么pthread_cond_wait在条件不满足时执行原子操作而条件满足时执行非原子操作?

条件不满足时的阻塞应当时把当前线程放到cond的阻塞队列中,要保证先进先出的顺序,
不能让两个线程乱序插入阻塞队列,即要保证线程A先发现条件不满足,则必须先进入阻塞队列
反例: 线程A先检测到条件不满足,反而后进入条件变量的阻塞队列
t0, t1, t2, t3 t4 t5
A lock cond wrong,unlock sleep
B lock cond wrong,unlock sleep
条件满足时阻塞队列中的所有线程均被唤醒,而此时共享资源未被锁定,所有线程均接受操作
系统的调度准备上锁,如果唤醒和上锁为原子操作,若唤醒是同时发生的,则谁也别想得到锁,
若唤醒并非严格同时,则最快被唤醒的必然得到锁,排除了操作系统调度的可能性

为了允许操作系统的调度,上锁前如果有其他操作,这些操作一定不能是原子的;
为保证条件变量阻塞队列的先进先出,条件不满足时的操作被设计成原子的,即可看为一条指令,
虽然条件满足或不满足都有2步指令,在设计时却将其封装为一条语句主要是方便条件不满足时
的原子操作,但也隐藏了条件满足时的非原子操作,需要程序员自己留意唤醒后上锁前条件可能
被破坏的可能,用while循环来补救

条件变量与信号量的区别

信号量与条件变量的功能相同,都是为了满足"条件满足时再唤醒"的需求
信号量只能使用"计数条件",且条件满足只是意味着计数值>0
条件变量可以使用各种自定义条件,更加灵活,事实上可使用条件变量实现信号量

死锁,活锁和饥饿,优先级反转

死锁是两个线程相互占有对方持有的锁,谁也不让谁,彼此等待对方释放锁而僵死
活锁是两个线程都想获得一个锁,同时发出请求,发生碰撞,之后一直尝试请求-碰撞…
饥饿是一个线程始终无法被cpu调度,
如操作系统调度时,优先级低的线程运气一直比较差始终无法获得锁
或条件变量的阻塞队列其中一个线程被唤醒时,老是有新的线程进入,某个运气不好的线程一直
不能被唤醒
优先级反转: 使用锁时出现的调度顺序与优先级不一致的现象: 高优先级任务被低优先级的
任务阻塞,导致高优先级任务迟迟得不到调度,但其他中等优先级的任务却能抢到cpu资源,好像
中优先级任务比高优先级任务有更高的优先权

举例:
三个线程, thread_1(高), thread_2(中), thread_3(低)
t0: thread_3 运行,获得共享资源的锁
t1: thread_2抢占thread_3运行, thread_3睡眠, 但thread_3并未释放锁
t2: thread_1抢占thread_2运行, thread_2睡眠
t3: thread_1需要获得锁,但锁被thread_3持有,且thread_3睡眠,无法释放锁,因此thread_1
睡眠
t4: thread_2和thread_3就绪,因为thread_2优先级更高,因此thread_2被调度运行,thread_1
需要等待thread_2运行完毕且thread_3释放锁后才能运行

分析: thread_1等待低优先级的thread_3释放锁合情合理,但还需要等待thread_2运行完毕就
不合理了,其产生原因是锁等待和操作系统根据优先级的调度之间产生的冲突

解决:
a) 优先级继承,t3时刻thread_1需要获得锁时将thread_3的优先级提升到与thread_1一致
则t4时刻thread_3先被调度执行,thread_3释放锁后,恢复原有的优先级
b) 优先级上限: 给进入临界区的线程都设置为最高优先级,离开后再恢复,直接消除了占有
共享资源时其他进程抢占的可能性

解决死锁:
1) 一次获得所有锁(原子操作)
2) 约定获得锁的顺序
解决活锁: 引入随机性,如sleep(rand()%3)
解决饥饿: 公平锁?

2. 分布式系统

2.1 为什么需要分布式系统?

解决2个问题:

单台机器算的慢,哪怕多进程,多线程,协程全用上 --> 分布式计算框架
单台机器存不下 --> 分布式存储引擎(引擎实际上也是框架,提供解决特定业务问题的通用模板)
本质是分治方法的应用,先做切分,然后再汇总

2.2 分布式存储引擎

文件累积总量过大,无法放在单台服务器上 --> 以文件为单位,分散存储到多台服务器上

存在问题:
数据分布不均衡,文件大小的差距很大,如何才能合理分配到不同服务器上?

若分配时将当前文件大小和所有服务器上的剩余空间大小作比较,选择一个剩余空间最大的服务器,
则空间分配不灵活,且服务器存储空间有浪费:
机器A和B分别剩余200G和100G的空间,先来了一个80G的文件,放到A上,但再来一个150G的,就放不下
了,其实应当把80G放到B上,把150G放到A上,但没人能未卜先知

问题的本质: 文件大小和服务器剩余存储空间的不匹配

解决:
a) 服务器剩余存储空间的不均衡: 操作系统已经解决,读写文件均通过block的方式处理
b) 文件大小的不均衡: 模仿操作系统,以固定大小切分文件,同时维护文件与文件块实际存储位置的
映射的元信息,提供文件读写服务,如HDFS的NameNode和DataNode

分布式存储只有分,没有合

存储的优化,如何才能存的好?
存的好指的是量大又省钱
a) 删数据: 如没有时效性的数据,临时数据/中间结果,同样数据不同业务都有一份
b) 减副本: 临时数据的副本没必要那么多
c) 文件的处理: 压缩,压缩速度和压缩比的权衡,切分,文件格式
d) 分层存储: 不同热度的数据存储在不同介质中,如从热到冷依次存放在内存,SSD硬盘, SATA硬盘

性能指标:
1) 可用性: 机器(单节点)的物理故障无法避免,保障服务不间断只能增加副本
2) 一致性: 主从的数据一致性和时效性
3) 扩展性: 如何实现逻辑分区,逻辑分区和物理节点的映射才能较少增删节点带来的数据移动
如果有查询需求(分布式数据库),如何实现对各种查询模式(范围查询,连表查询等)的快速响应

2.3 分布式计算框架

计算的分治以存储的分治为前提,存储不考虑业务,计算面向业务,需要考虑切分后并行计算结果的合并;

典型的计算遵循map-reduce模式,mapper之间互不干扰,并行处理,对每个block执行map操作,mapper的
个数与block的个数相等,reducer需要对切分后并行计算得到的结果按照业务逻辑做归并,即将属于同一类
的结果归类处理,属于同一类的mapper输出shuffle到一个reducer中处理,reducer的个数即为输出文件的
个数,根据业务逻辑来确定,对mapper的输出划分类别使用partition来完成,partition的个数与reducer的个数
相等

计算的优化,如何才能算得好?
计算与业务相关,需要业务自身考虑优化,通用的计算框架的优化集中于对资源的调度上,即resource
manager,如 YARN, K8S
同样的机器大家共享,采用多租户的方式,有利于减少机器资源的浪费,提升了整体资源利用率,但个体的
独立性受到影响,因此需要合理的资源调度保证个体对资源的需求

解决:
隔离: 计算资源以pool为单位,每个业务可以租用不超过最大配额的计算资源,配额由业务线负责人商定
–> 为避免长期占用资源不归还,设计强杀策略
–> 配额已定,都提交任务,如何为不同的任务分配资源: capacity scheduler, fair scheduler等
调度器

[linux的调度策略]

[YARN的调度策略]

3. web服务器

3.1 什么是web应用?

web应用指的是符合B/S架构的应用程序, B: browser, S: server,与传统的 C/S(client/server)架构的区别
是与用户交互的程序特化为浏览器,通过HTTP协议与server通信;

浏览器:

实现HTTP协议的客户端部分(基于TCP socket?),用于向server发送请求,获取返回的HTTP响应
解析器,解析从server收到的HTML页面,渲染后展示给用户

3.2 C/S与B/S的区别?

B/S架构其实是C/S架构的一种,只是B/S可以实现平台无关,无论是windows, linux, android, apple只要有
浏览器即可被用来运行web应用程序
而C/S架构一般是平台相关的,对每个平台都需要至少重新开发一遍前端;
C/S架构更加灵活,如可以根据业务需求实现自己的应用层协议,不一定限制于HTTP协议,如QQ, 网易云,
爱奇艺等,android, apple等移动应用(android开发其实属于前端开发),windows, ubuntu等桌面版应用
都属于C/S架构

3.3 前端与后端到底是什么?

前端负责与用户交互,提供网页,app等可视化界面,接受用户输入并向server发起请求(HTTP或其他应用层
协议),向用户返回从server接收的内容(通过HTTP或其他应用层协议);
前端开发可分为web前端开发(面向浏览器)和客户端开发(面向不同的操作系统,桌面版,移动版)

以web前端为例,需要用到的技术有html, css, javascript及与js相关的技术(如ajax),框架(如react, vue),
js用来处理与用户的交互;
ajax是一种无需加载整个网页的情况下更新部分网页的技术,即只向server请求网页中的一部分数据;
js只是填充了发送请求的内容,实际发送是由浏览器完成的;
前端框架提供了前端业务开发的通用模板,简化程序开发;
web前端技术只是用来实现业务逻辑的,并不关心如何发送HTTP请求(网络IO);
浏览器可认为是提供了html, css, js等运行的环境

vue等框架实现了MVVM(较古老的还有MVC)等设计模式的前端框架,V(View)可理解为html, M(Model)可理解为
从用户接收准备向server提交的数据或从server接收准备填充到view的数据,VM(view model)提供了view向
model和model向view的自动双向数据更新,无需再手工操作control

后端负责接收用户发起的请求,经过业务逻辑处理后(可能需要读写数据库),给用户返回数据

web后端技术并不关系如何接受用户发起的请求和如何返回数据(网络IO),只是用来实现业务逻辑;
接受请求和返回数据由http server实现,比http client复杂得多,需要解决并发问题;

大多数业务逻辑计算任务很少,多为数据的读写,基本都会涉及与数据库的交互,处理的大部分都是文本数据;
为了更清晰的划分职责,方便server端业务逻辑代码的复用,server分为2种: web服务器和应用服务器

web服务器: 只负责接收http请求,返回html格式的响应结果(网络IO),并不关系如何产生响应内容,
若用户请求的是静态页面,直接从服务器的文件目录中取出该页面(文件)返回;
若用户请求的是执行一个动作,则将该请求转发给应用服务器,并向其索要处理结果,然后将处理
结果嵌入到html页面中,发给用户
常见的web服务器: ngix, apache
应用服务器: 只负责接收从web服务器转发过来的动作请求,然后调用运行在其上的业务处理逻辑,获得处理
结果,发送给web服务器;
因此应用服务器一般使用与业务逻辑相同的编程语言实现,使用该编程语言封装与web服务器
交互的数据协议,如HTTP,实现该数据协议的request和response对象,根据请求的动作不同,如
http的get,post,put,delete,分发到不同的handle中处理,在handle中取参数实现业务逻辑,如
对数据库的增删改查,并通过数据协议发送出去,因此应用服务器一般都实现了web服务器的功能
常见的应用服务器: tomcat, jetty

为什么需要区分web服务器和应用服务器?
为了解耦,使得业务逻辑代码可以在多端复用,解除与html的强绑定;
应用服务器相当于提供了方法调用,其业务处理逻辑可被不同的调用者请求,可以是使用HTTP协议的web服务器
,也可以是使用其他协议的调用者,如来自andrioid客户端的调用,来自windows客户端的调用
前后端分离
前端代码(包括html,css,js)存储在web服务器中,运行在用户的浏览器中,需要用户发起一个http请求从web
服务器获取;
前端追求: 页面表现,速度流畅,兼容性,用户体验
后端代码存储且运行在应用服务器中,负责实现业务逻辑;
后端追求: 三高(高并发,高可用,高性能),安全,存储

前后端耦合
前后端耦合指的是前端代码与后端代码混合在一起,目的是通过java代码运行后产生视图发送给用户,类似js的
功能,负责与用户的交互,只是运行在server端,可提供较复杂的交互,如查询数据库,在与浏览器之间传输时jsp
源码是不可见的,而js代码是浏览器直接download下来的,是可见的.jsp不使用web服务器,只有应用服务器,
1. 将java代码填充进html中运行后发送给用户,典型的jsp页面,jsp是servlet的一种,运行时需要首先转化为
  servlet, servlet只是定义了一个接口,该接口能解析html;
2. 把html嵌入进java代码中,运行后发送给用户,典型的servlet模式;

==前后端耦合的例子==:                                                         
 java后端分为三层: 控制层(controller), 业务层(service), 持久层(dao)        
 控制层: 负责接受参数,调用业务层,封装数据,路由,渲染到jsp页面               
 jsp页面使用各种标签(jstl/el/struts等)或手写java表达式将后台的数据展现出来(视图层)

存在问题:

没必要在服务器端关心视图(用户看到什么页面),视图的渲染应当利用用户的资源
无web服务器,动态资源和静态资源耦合,并发量增大时,对应用服务器的资源消耗比较大,应用服务器的i/o
很容易成为瓶颈
第一次请求jsp,必须在应用服务器中编译成servlet,响应慢
每次请求jsp都是访问servlet再用输出流输出的html页面,效率比直接使用html低
jsp中有众多的标签,表达式,前端工程师修改页面时费劲
jsp中动态内容很多时,加载慢
前端工程师需要配置java的开发环境

前后端耦合时开发流程:

产品经理,领导,客户提需求
UI做设计图
前端工程师做出html页面
后端工程师将html页面套成jsp页面
集成出现问题
前端返工
后端返工
二次集成
集成成功
交付

前后端耦合的请求方式:

在已接收的jsp页面中客户端请求
server的servlet或controller接收请求
调用service, dao代码完成业务逻辑
返回jsp
jsp在客户端展现动态的效果
后端实现mvc,c(控制路由),m(业务逻辑),v(渲染视图),后端任务重

前后端分离:
将前端代码和后端代码完全分离,通过约定好的的restful接口通信(web服务器转发用户的请求调用应用服务
器中的业务逻辑),数据格式一般采用json,调用方式一般采用ajax

前后端分离的开发流程:

产品经理,领导,客户提需求
UI做设计图
前后端约定接口,参数
前后端并行开发(即使需求变了,只要接口参数不变,不用两边都改代码)
前后端集成
前端页面调整
集成成功
交付

前后端分离的请求方式:

在已接收的html页面中客户端请求
web服务器接收请求
web服务器转发请求到应用服务器
应用服务器调用业务逻辑,返回json结果给web服务器
web服务器将结果填充进html中发送给客户端
前端(web服务器)实现control, view,后端(应用服务器)实现model(业务逻辑),前端任务重
现在前端框架中的mvc, mvvm等模式中的m并不严格,其实是指应用服务器返回的结果,而非业务逻辑

前后端分离对并发的支持:
大量并发浏览器请求 --> web服务器集群 --> 应用服务器集群 --> 文件/数据库/缓存/消息队列服务器集群

restful api是什么?
restful api定义了前后端交互(web服务器与应用服务器)的接口形式(不是客户端与前端/web服务器交互的接口
url),通过http的方式请求,使用动词+名词的组合,动词表示动作,名词表示资源的表现形式(包括路径),类似RPC?
(thrift等)

REST: representation state transfer

资源: 网络上的一个具体信息,与uri一一对应

uri: uniform resource identifier,能唯一标识一个资源,详细的路径信息
url: uniform resource location,统一资源定位符,可能只包含名字,无法获知路径

represetation: 资源的表现层,即资源的表现形式,图片可以有jpg,也可以有png格式
state transfer: 状态转移,资源的状态发生变化,作用于资源的具体表现形式
restful 规定的语义: POST: 增 DELETE: 删 PUT: 改 GET: 查

3.4 对server的理解

为什么像mysql, redis都提供了自己的server?

因为他们是数据库,完全独立于业务逻辑,必须为业务逻辑提供一种调用方式来完成对数据库的操作;
业务逻辑代码使用数据库自己的数据操作规则,如SQL语句,需要将其放在数据库中执行,因此必须有种通信机制使得
在业务逻辑中创建的sql语句能够传输到数据库中执行,数据库server提供了这种机制,本质上server都只处理网络
IO,封装请求和响应,调度处理函数,不同的server使用的应用层协议会有所不同,根据实际需求来定;
web服务器是应用服务器的client, 应用服务器是数据库服务器的client

使用者的编程语言与其使用的server之间的关系?

诸如mysql等数据库的server,client向其发出请求,server内部完全自己处理请求,获得结果后封装成响应
发送给client,server的处理使用自己的编程语言,与client的编程语言完全解耦,只需要提供结果即可
形如应用服务器这样的server除了能够接受请求,返回响应之外,其handle函数需要实现业务逻辑,需要程序员
自己去实现该业务逻辑,本质上是一套框架,与业务逻辑共用一套编程语言
形如ngix这样的web服务器由于其只负责静态页面的返回,来了一个请求,要么直接去文件目录下取html返回,
要么转发该请求给应用服务器,收到应用服务器处理后的结果后再装填进html或者直接返回给用户(如ajax),
并不涉及handle函数,只有网络IO,因此可当做一个独立的软件来使用,只要在规定的目录下放上html,css,js
文件即可

综上,如果一个server可以设计成与其使用者的开发语言无关的,必须是如下2种情况的一种:
- server只负责网络IO,并无handle这样的计算过程
- server有handle函数,但是其使用者不需要知道具体的实现,只关心取到结果
如果server与使用者的开发语言无关,使用者需要配置server,改改参数啥的,美其名曰优化;
如果server与使用者的开发语言信管,使用者需要实现server的handle函数,完成具体的业务逻辑,美其名曰部署

client的编程语言和server的编程语言之间的关系?
完全可以不同,因为client和server规定了通信的协议,如HTTP, thrift, protobuffer,
通信协议本质上是约定好数据格式以及对数据进行的操作,双方约定好能彼此解析即可,
通信协议与语言无关,client和server可使用各自的语言

常用server的网络IO模型:
reactor模式: 基于IO复用的单线程事件轮询实现读写 + 工作者线程池,详见 2.1节小王开店的例子

为什么很少看到使用c++实现的应用服务器,即使用c++来开发web后端?

web应用在client和server间传输的基本都是文本(字符串)
c++对字符串的支持极其垃圾

+ 只支持ascii码字符,不支持任何其他编码方式,如unicode, utf-8,中文怎么表示?   
+ std::string只是对字符数组的封装,字符的本质还是字节,还能使用下标访问,越界访问怎么办
+ 想做一下字符串的切分和拼接都很费劲,没有内置函数

3.5 影响web应用并发数的因素有哪些?如何优化?

并发数: 服务器的可用资源 / 单个请求耗费的资源
提高并发数需要开源节流,
开源: 增加服务器的可用资源 or 更高效的利用服务器的资源
节流: 减少单个请求耗费的资源

服务器的可用资源:

cpu并发处理能力: 假设16核cpu,以多线程的方式执行业务逻辑,每个请求耗费的cpu时间为20ms,则1s内可接受
的并发数为1000/20*16=800
提高并发数可以
a) 换用更多核心数的cpu
b) 换用单核运算速度更快的cpu
内存: 假设总的内存大小为8G,每个请求耗费的内存空间为20M,则可同时应对的并发数为 8*1024/20=408
网络带宽: 假设上下行总带宽为100M,单个请求耗费的带宽为1M,则可同时应对的并发数为 100/1=100
磁盘IO速度: 假设单个请求需要读取10M文件,磁盘的IO速度为100M/s,则1s内可应对的并发数为 100/10=10

优化方法一: 增加服务器的可用资源                                            
  a) 更快的cpu,更多核心的cpu,更大的内存,更快的磁盘,更宽的网络带宽(经费在燃烧)
  b) 分担流量压力,增加服务器个数,美其名曰水平扩展,或负载均衡

对服务器资源的利用方式:

不同的业务类别对服务器的要求不同,如文件下载,图片下载需要定制更高效的压缩方式,不同的服务存放在
同一台服务器上,互相耦合,服务器众口难调,配置优化困难
热点数据放在数据库中是对磁盘操作,速度比较慢
服务器的多核处理能力需要得到充分的利用
一个请求需要与多个系统交互,有些交互用户不需要关心,可异步执行
数据库的读写彼此耦合
代码中有耗时的或耗费内存的逻辑或语句,可以优化

优化方式二: 更高效的利用服务器资源                                          
  a) 水平扩展,使用多个服务器,每个服务器处理一类业务,专司其职                
  b) 数据库分库分表,每个库或每个表专司其职                                  
  c) 增加缓存,存放热点数据                                                  
  d) 使用多进程,多线程或协程                                                
  e) 使用消息队列异步更新用户不关心的系统                                   
  f) 数据库读写分离                                                         
  g) 优化代码逻辑,优化代码语句

单个请求耗费的资源

每次都请求完整的html页面,有些元素不发生变化,没必要更新
http请求每次都是发起请求,等待结果,收到响应三步,如果有些数据可以直接使用上次收到的数据,没必要
更新或者有必要更新但是发起请求后发现和后端的结果和上次一致,那么后端也不用再响应
图片,文件等体积较大,可考虑压缩传输,节省带宽
将服务器放在离用户更近的地方,节省传输时间

优化方式三: 减少单个请求耗费的资源                                                                                                                                                                      
  a) ajax提交,只请求需要更新的数据                                          
  b) 使用浏览器缓存机制                                                     
  c) 压缩文件                                                               
  d) 使用CDN

你可能感兴趣的:(并发编程,web开发,分布式)

PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
慢速连接攻击是什么？慢速连接攻击怎么防护？快快小毛毛网络 ddos 服务器
慢速连接攻击（SlowConnectionAttack），又称慢速攻击（SlowlorisAttack），是一种网络攻击技术，旨在通过占用服务器上的所有可用连接资源来使其无法响应正常请求。与传统的拒绝服务（DoS）和分布式拒绝服务（DDoS）攻击不同，慢速攻击并不依赖于发送大量数据包来消耗带宽，而是利用HTTP、TCP或SSL等协议的特性，通过发送大量不完整的请求或缓慢发送数据来占用服务器资源，使
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Gobelieve 架构 weixin_34099526 数据库 golang json
Gobelievegithub地址声明:转简书JackieF的文章,为了自己方便copy了一份,加一些自己的东西.链接：https://www.jianshu.com/p/8121d6e85282IMCore主要分三大块:im客户连接服务器（可分布式部署，暂无负载均衡模块)imr路由查询服务器（主要解决im分布式部署的问题）ims存储服务器(主从部署)基础模块1.数据包协议包：header(12)
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
机电综合管理系统架构小熊coder 机载系统系统架构
文章目录一、机电综合管理系统架构1.系统概述2.架构层次3.核心组件二、余度管理1.余度概述2.硬件冗余3.软件冗余4.通信冗余三、总线架构1.MIL-STD-1553B总线2.ARINC429总线3.ARINC629总线4.AFDX/ARINC664总线四、未来发展趋势1.分布式架构2.高速网络3.智能化与自动化结语机电综合管理系统（ElectromechanicalManagementSyst
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
什么是 PHP? 为什么用 PHP? 谁在用 PHP? m0_37438181 永远学习 php 开发语言
一、什么是PHP？PHP（HypertextPreprocessor，超文本预处理器）是一种广泛应用于Web开发的通用开源脚本语言。PHP主要用于服务器端编程，可以嵌入HTML中，与数据库进行交互，生成动态网页内容。它具有以下特点：简单易学：语法相对简单，容易上手，对于初学者来说是一个不错的选择。跨平台性：可以在多种操作系统上运行，如Windows、Linux、Unix等。丰富的函数库：提供了大量
SpringBoot2：web开发常用功能实现及原理解析-整合EasyExcel实现Excel导入导出功能生产队队长 Spring All excel spring boot
1、工程包结构主要是这5个Java类2、导入EasyExcel包这里同时贴出其他相关springboot的基础包org.springframework.bootspring-boot-starter-weborg.springframework.bootspring-boot-devtoolsruntimetrueorg.springframework.bootspring-boot-config
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen