项目整理

1 基于Thrift的RPC框架的开发和维护
- 项目介绍
- RPC及实现RPC需要的技术
- - 1 动态代理
  - 2 序列化和反序列化
  - 3 NIO通信组件
  - 4 注册中心
- 为什么使用RPC
- - RPC和HTTP
- Thrift简介
- Thrift整体架构
- Thrift 三大重要组件：Transport、Protocol和 Server
- - 传输方式Transport
  - 传输协议Protocol（编码方式）
  - - 二进制协议 VS 文本协议
  - 服务模型Server（Java）
  - - 1 TSimpleServer模式
    - 2 TNonblockingServer模式
    - 3 THsHaServer模式（半同步半异步）
    - 4 TThreadPoolServer模式
    - 5 TThreadedSelectorServer模式
  - 服务模型Server（Python）
  - - 1 TSimpleServer
    - 2 TThreadPoolServer
2 数仓
- 数据仓库概念
- 数仓分层概念
- 数据仓库的输入数据源和输出系统
- 维、维度、维度表和事实表
- - 0 来自知乎的一个简单解释
  - 1 维
  - 2 维度
  - 3 维度表
  - 4 事实表
  - 5 星型模式结构示意图
- 数据湖 VS 数据仓库
- - 1 本质区别
  - 2 存储位置
  - 3 数据源
  - 4 用户
  - 5 数据质量
  - 6 数据模式
  - 7 敏捷扩展性
  - 8 应用
2 基于Spring Boot的个人博客系统
- 项目介绍
3 基于Servlet和JSP的网上书城
- 0 项目介绍
- 1 什么是Servlet
- 2 Tomcat容器等级
- 3 手工编写一个Servlet
- 4 测试题
- 5 Servlet执行流程
- 6 Servlet生命周期
- 7 Tomcat装载Servlet的三种情况
- 8 Servlet与JSP的区别
- 9 Spring MVC和Servlet
- 10 转发和重定向的区别
- Servlet是线程安全的吗？
4 僵尸企业画像及分类
5 降低汽油精制过程中的辛烷值损失模型
6 天然气股份有限公司场站智能化分析及控制软件开发
- 异常检测研发目标
- 异常检测设计方案
- - 单点检测
  - 多点检测

1 基于Thrift的RPC框架的开发和维护

项目介绍

公司项目整体架构是基于分布式的：以Java集成各功能模块作为客户端，以Python提供机器学习算法支持作为服务端，以RPC保证高效稳定通信。Thrift作为一种典型的CS结构，且支持跨语言，故以此进行RPC开发。在Thrift的技术选型上，使用TFramedTransport作为传输方式、TCompactProtocol作为传输协议（编码方式），TForkingServer作为服务模型；同时，为了保证服务的稳定性，客户端启用一个心跳机制来维护长连接，服务端建立一个管理进程监测维护各服务进程。

分布式系统是由一组通过网络进行通信、为了完成共同的任务而协调工作的计算机节点组成的系统。

RPC及实现RPC需要的技术

RPC（Remote Procedure Call Protocol，远程过程调用协议）：是一种通过网络从远程服务器上请求服务，而不需要了解底层网络技术的协议；RPC使得客户端在远程调用时，能够像本地调用一样方便，而感知不到远程调用的逻辑；
关键技术包括：通信协议、序列化、接口描述、服务框架、性能和语言支持等；
RPC可以使用TCP作为传输协议，也可以使用HTTP（如gRPC），但一般都是TCP；
RPC = socket + 动态代理

动态代理发生在服务调用方，RPC 框架需要解决的是：像调用本地接口一样调用远程接口。于是如何组装数据报文、如何经过网络传输发送至服务提供方，以及如何屏蔽远程接口调用的细节，便是动态代理需要做的工作。

1 动态代理

动态代理用于生成客户端存根、服务端存根，当调用 RPC 远程接口时，实际是调用了它的代理类，再由代理类使用 Socket 技术向远程接口发送请求信息;
一般这个代理过程可以使用 JDK 提供的原生代理方式，也可以使用开源的 CGLib 代理;

一个完整的RPC架构包含5个核心组件，分别是：客户端、客户端存根、网络传输模块、服务端存根、服务端：

客户端（Client）：服务调用方；
客户端存根（Client Stub）：存放服务端的地址信息，将客户端的请求参数打包成网络消息，再通过网络传输发送给服务方；
网络传输模块（Network Service）：底层传输，可以是TCP或HTTP；
服务端存根（Server Stub）：接收客户端发送过来的请求消息并进行解包，然后再调用本地服务进行处理；
服务端（Server）：服务的真正提供者；

2 序列化和反序列化

在网络信息传输中，所有数据都会被转换为字节码进行传送；
RPC在调用的过程中，需要把接口的入参和出参通过序列化转化成字节码和反序列化为对象，也就是编码和解码操作；
比较常用的开源的序列化方式有JSON、Protobuf等，当然也可以用Java自带的序列化方式，但这个过程非常耗时，所以一般不会使用；

3 NIO通信组件

在RPC通信实现方案中，需要考虑并发性能问题，非常重要的一环是需要考虑I/O的选择。传统阻塞式的IO显然是不合适的，因此需要非阻塞IO，即NIO；
但实现NIO通信比较复杂，也容易出错，所以在RPC通信中一般都会选择Netty作为NIO的通信组件；

4 注册中心

在 NIO 的通信中，接口提供方需要把接口注册到一个中心，在接口调用方调用服务时，需要从注册中心获取接口的提供方，其中最核心的信息就是IP+端口号;
拿到提供方信息后进行 socket 连接操作，接下来就可以通信了;
注册中心通常会选择ZooKeeper，但也可以使用其他方式，如Redis;
注册中心可以缺失，如果接口调用方知道接口提供方的IP+端口号，就可以直接调用，而不需要向注册中心去查询。直接调用的优点就是直接且易于维护，缺点则是不够灵活，如果服务的地址改变了，我们需要手动修改服务提供的地址，而不能动态地实时地去获取；

为什么使用RPC

RPC要解决的两个问题：

解决分布式系统中，服务之间的调用问题。
远程调用时，要能够像本地调用一样方便，让调用者感知不到远程调用的逻辑。

RPC和HTTP

HTTP是RPC的一种；
HTTP是在接口不多、系统与系统交互较少的情况下，解决信息孤岛初期使用的一种通信手段，接口可能返回一个JSON字符串或XML文档，然后客户端再去处理这个返回的信息。优点就是简单直接、开发方便；
如果一个系统内部子系统较多、接口非常多，RPC框架的优势就显示出来了：1 RPC用到了动态代理模式，能解耦服务；2 RPC调用是面向服务的封装，针对服务的可用性和效率等都做了优化（传输方式、传输协议、服务模型等），单纯使用HTTP调用则缺少了这些特性；3 RPC框架一般都有注册中心，有丰富的监控管理、发布和下线接口等；4 长连接：不必每次通信都要像HTTP一样去3次握手，减少了网络开销；

Thrift简介

Thrift是用于实现RPC通信的一种框架，支持跨语言，包括C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, JavaScript, Node.js, Smalltalk, OCaml, Delphi等；
Thrift是一种典型的CS（客户端/服务端）结构，客户端和服务端可以使用不同的语言开发。既然客户端和服务端能使用不同的语言开发，就一定要有一种中间语言来关联客户端和服务端的语言，这种语言就是IDL（Interface Description Language）；

Thrift整体架构

业务逻辑层是用户实现的业务逻辑；
代码框架层是根据Thrift定义的服务接口描述文件生成的客户端和服务器端代码框架；
数据读写操作层是根据Thrift文件生成代码实现数据的读写操作；
以下是Thrift的传输协议、传输方式以及底层的IO通信，使用Thrift可以很方便地定义一个服务并且选择不同的传输协议和传输方式；

Thrift 三大重要组件：Transport、Protocol和 Server

传输方式Transport

TSocket：阻塞型socket，用于客户端，采用系统函数read和write进行读写数据；
TNonblockingServerSocket：非阻塞型socket，用于服务端，accept到的socket类型都是TSocket；
TBufferedTransport和TFramedTransport：非阻塞有缓存，均继承TBufferBase，调用下一层TTransport类进行读写操作，结构非常相似。但TFramedTransport以帧为传输单位，帧结构为：4字节+传输字符串，4字节用来存储传输字符串的长度，该字符串才是真正需要传输的数据，因此TFramedTransport每传一帧都要比TBufferedTransport和TSocket多传4字节；
TFileTransport：以文件形式进行传输；

传输协议Protocol（编码方式）

Thrift传输协议总体上可划分为二进制（binary）和文本（text）传输协议两大类，一般在生产环境中使用二进制类型的传输协议（相比于文本和JSON传输效率更高）。

TBinaryProtocol：使用二进制编码格式进行数据传输，Thrift的默认协议；
TCompactProtocol：压缩的二进制编码格式，使用高效率的、密集的二进制编码格式进行数据传输；
TJSONProtocol：使用JSON数据编码格式进行数据传输，在网络中以文本方式传输，易于抓包分析和理解；
TDebugProtocol：使用text编码格式进行数据传输，可读性强，常用于编码人员测试；

二进制协议 VS 文本协议

二进制协议：没有冗余字段、传输高效、方便解析（固定长度，并且可以直接比较字节），缺点就是定义的比较死，哪个位置有哪些东西，是什么意义都是定义死的，场景单一；
文本协议：直观、描述性强、容易理解、便于调试，缺点就是冗余数据较多，不适宜传输二进制文件（如图片等），解析复杂（需要进行字符串比较）；
应用场景：1 高效传输和数据安全，使用二进制协议；2 便于调试和命令较少（如即时通讯软件），使用文本协议；

服务模型Server（Java）

1 TSimpleServer模式

TSimpleServer的工作模式下只有一个工作线程，循环监听新请求的到来并完成对请求的处理，它只是在简单的演示时候使用；
TSimpleServer的工作模式采用最简单的阻塞IO，实现方法简洁明了，便于理解，但是一次只能接收和处理一个socket连接，效率比较低，主要用于演示Thrift的工作过程，在实际开发过程中很少用到它。

2 TNonblockingServer模式

TNonblockingServer也是单线程工作，但是该模式采用NIO的方式，所有的socket都被注册到selector中，在一个线程中通过selector循环监听所有的socket；每次selector结束时，处理所有的处于就绪状态的socket：对于监听到的socket产生一个新业务socket并将其注册到selector中，对于有数据到来的socket进行数据读取操作，对于有数据发送的socket进行数据发送操作。

TNonblockingServer模式优点：

相比于TSimpleServer效率提升主要体现在IO多路复用上，TNonblockingServer采用非阻塞IO，同时监控多个socket的状态变化。

TNonblockingServer模式缺点：

TNonblockingServer模式在业务处理上还是采用单线程顺序来完成，在业务处理比较复杂、耗时的时候，例如某些接口函数需要读取数据库执行时间较长，此时该模式效率也不高，因为多个调用请求任务依然是一个接一个顺序执行。

3 THsHaServer模式（半同步半异步）

THsHaServer类是TNonblockingServer类的子类，TNonblockingServer模式中，采用一个线程来完成对所有socket的监听和业务处理，造成了效率的低下，THsHaServer模式的引入则是部分解决了这些问题。THsHaServer模式中，引入一个线程池来专门进行业务处理。

THsHaServer的优点：

与TNonblockingServer模式相比，THsHaServer在完成数据读取之后，将业务处理过程交由一个线程池来完成，主线程直接返回进行下一次循环操作，效率大大提升。

THsHaServer的缺点：

主线程需要完成对所有socket的监听以及数据读写的工作，当并发请求数较多，且发送数据量较大时，监听socket上新连接请求不能被及时接收。

4 TThreadPoolServer模式

TThreadPoolServer模式采用阻塞socket方式工作，主线程负责阻塞式监听是否有新socket到来，业务处理交由一个线程池来处理。

TThreadPoolServer模式优点：

线程池模式中，数据读取和业务处理都交由线程池完成，主线程只负责监听新连接，因此在并发量较大时新连接也能够被及时接收。线程池模式比较适合服务器端能预知最多有多少个客户端并发的情况，这时每个请求都能被业务线程池及时处理，性能也非常高。

TThreadPoolServer模式缺点：

线程池模式的处理能力受限于线程池的工作能力，当并发请求数大于线程池中的线程数时，新请求也只能排队等待。

5 TThreadedSelectorServer模式

TThreadedSelectorServer模式是目前Thrift提供的最高级的模式，它内部有如下几个部分构成：

一个AcceptThread线程对象，专门用于处理监听socket上的新连接；
若干个SelectorThread线程对象专门用于处理业务socket的网络I/O操作，所有网络数据的读写均是由这些线程来完成；
一个负载均衡器SelectorThreadLoadBalancer对象，主要用于AcceptThread线程接收到一个新socket连接请求时，决定将这个新连接请求分配给哪个SelectorThread线程；
一个ExecutorService类型的工作线程池，在SelectorThread线程中，监听到业务socket中有调用请求过来，则将请求读取之后，交给ExecutorService线程池中的线程完成此次调用的具体执行；

TThreadedSelectorServer模式中有一个专门的线程AcceptThread用于处理新连接请求，因此能够及时响应大量并发连接请求；另外它将网络I/O操作分散到多个SelectorThread线程中来完成，因此能够快速对网络I/O进行读写操作，能够很好地应对网络I/O较多的情况；TThreadedSelectorServer对于大部分应用场景性能都不会差，因此，如果实在不知道选择哪种工作模式，使用TThreadedSelectorServer就可以。

链接: Python服务端源码解析.

服务模型Server（Python）

1 TSimpleServer

TSimpleServer的工作模式采用最简单的阻塞IO，实现方法简洁明了，便于理解，但是一次只能接收和处理一个socket连接，效率比较低。

源码分析

设置TServerSocket的listen()方法启动连接监听；
以阻塞的方式接受客户端的连接请求，每进入一个连接即为其创建一个TSocket对象（封装socket连接）；
为客户端创建输入传输通道对象、输出传输通道对象、输入协议对象和输出协议对象；
processor对象为服务模型创建之前创建的，用来处理具体的业务请求；

2 TThreadPoolServer

服务启动时先创建好self.threads个线程，每个线程负责从队列clients中获取客户端连接TSocket对象。而主线程负责accept客户端的连接并创建TSocket对象，放入clients队列。

3 TNonblockingServer
类似于Java版Thrift中的THsHaServer，思路是服务启动时创建threads个线程负责处理task队列中的任务消息。而主线程利用I/O多路复用技术将准备好的可读消息放入task队列供业务线程处理，同时在处理结束后可写时直接将结果返回给客户端。

4 TForkingServer VS TProcessPoolServer

由于Python的GIL锁，所以Python没有真正的多线程，无法实现并行运作，多任务场景下效率低下，因此引入了两个多进程模型；
其中TForkingServer，服务端每次监听到client请求，会os.fork一个子进程进行业务处理；

TProcessPoolServer服务启动时创建指定个数的进程；

2 数仓

数据仓库概念

1 概念

数据仓库（Data Warehouse）通常指一个数据库环境，而不是一件产品，它提供用户用于决策支持的当前的和历史数据，这些数据在传统的数据库中通常不方便得到；
数据仓库是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合；
通常用于辅助决策支持；

2 特点

2.1 面向主题

操作型数据库中的数据针对事务处理任务，各个业务系统之间彼此分离，而数据仓库中的数据按照一定的主题域进行组织；
主题是个抽象概念，指用户使用数据仓库进行决策时所关心的重点领域，如顾客/供应商/产品等；
一个主题通常与多个操作型数据库相关；

2.2 集成

操作型数据库通常与某些特定的应用相关，数据库之间相互独立，且往往是异构的；
而数据仓库中的数据是在原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的，因此必须消除源数据中的不一致性，以保证数据仓库内的信息是关于整个企事业单位一致的全局信息；
即存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义；

2.3 相对稳定

操作型数据库中的数据通常实时更新，数据根据需要及时发生变化；
数据仓库中的数据主要用作决策分析，涉及的数据操作主要是查询和定期更新，一旦某个数据加载到数据仓库以后，一般情况下将作为数据档案长期保存，几乎不再做修改和删除操作；
即数据仓库中通常有大量的查询操作及少量定期的更新操作；

2.4 反映历史变化

操作型数据库主要关心当前某一时间段内的数据，而数据仓库中的数据通常包含较久远的历史数据；
因此数仓中通常包括一个时间维，以便研究趋势和变化；
数仓系统通常记录了一个单位从过去某一时期到目前的所有时期的信息，通过这些信息，可以对单位的发展历程和未来趋势作出定量分析和预测；

数据集市则是一种微型的数据仓库，通常有更少的数据，更少的主题区域，更少的历史数据，部门级的，一般只能为某个局部范围内的管理人员服务；

数据仓库是企业级的，能为整个企业各个部门的运行提供决策支持手段；

数仓分层概念

ods：operation data store原始数据层，数据保持原貌不做处理；
dwd：data warehouse detail明细数据层，结构和粒度与原始表保持一致，对ods层数据进行清洗（去除空值，脏数据）；
dws：data warehouse service数据服务层，数据轻度汇总；
ads：application data store 数据应用层，为各种统计报表提供数据；

数仓为什么要分层

把复杂问题简单化：把一个复杂的任务分解成多个步骤来完成，每一层只处理单一的步骤，比较简单，并且方便定位问题；
减少重复开发：通过中间层数据，能够极大地减少重复计算，增加一次计算结果的复用性；
隔离原始数据：使真实数据与统计数据解耦开；

数据仓库的输入数据源和输出系统

输入系统：埋点产生的用户行为数据、JavaEE后台产生的业务数据；
输出系统：报表系统、用户画像系统、推荐系统；

维、维度、维度表和事实表

0 来自知乎的一个简单解释

1 维

维是关于一个组织想要记录的视角或观点。

参考: 维的百度百科.

2 维度

维度是对数据进行分析时采取的一个角度。比如分析产品销售情况，可以按类别来分析，也可以按区域来分析，于是类别和区域就构成了两个维度；
每个维度可以有子维度；

3 维度表

维度表是对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息；
维度表和事实表通过主键和外键联系在一起，形成星型，也称为“星型模式”；
对层次复杂的维，为避免冗余数据占用过大的存储空间，可以使用多个表描述，即“雪花型模式”；
维度表示例（产品维度表）：Prod_ID,Product_Name,Category,Color,Size,Price

特性：

记录数少，上千左右；
大多是文字信息；
信息具有层次结构；
只有一个主键；
信息可修改；

4 事实表

事实表用来存储数据和维关键字，是依据某些维度数据聚合后生成的结果表；
事实表示例：

特性：

大量数据行，存储TB级；
主要是数值，少量文字或多媒体；
有和维度表连接的外键；
主要是静态数据和聚集数据；

5 星型模式结构示意图

数据湖 VS 数据仓库

1 本质区别

数据湖和数据仓库是存储大数据的两种不同策略；
最本质的区别是：数据仓库中存储的都是结构化数据，需要提前设计好模式（schema）；而数据湖可以存储结构化和非结构化的数据，无法预先定义好结构；

2 存储位置

数据仓库要有结构，大部分都是基于关系型模型；
而数据湖通常位于分布式存储如Hadoop或类似的大数据存储中；

3 数据源

数据仓库的数据很多时候是从OLTP应用的结构化数据库中提取的，用于支持内部的业务部门（销售、市场、运营等）进行业务分析；
数据湖的数据来源可以是结构化的，也可以是非结构化的，例如：业务系统数据库、IOT设备、社交媒体、移动APP等；

4 用户

数据仓库主要是对业务系统对大量业务数据进行统计分析，所以会应用数据分析的部门是数据仓库的主要用户，例如：销售部、市场部、运营部、总裁办等；
数据湖中的数据都是原始数据，是未经整理的，更适合数据科学家，通过应用模型、技术发掘数据中的价值，去解决企业中的业务问题；

5 数据质量

数据仓库非常重视数据质量，数据都是经过处理的，像数据中台有很大一块是数据质量管理、数据资产管理等；
数据湖中数据可靠性较差，这些数据可能是任意状态、任意形态的数据；

6 数据模式

数据仓库在数据写入前就要定义好模式（schema），例如：先建立模型、建立表结构，然后导入数据，我们称之为write-schema；
数据湖中的数据没有没有模式，直到用户要访问数据、使用数据才会建立schema，我们称之为read-schema；

7 敏捷扩展性

数据仓库的模式一旦建立，如果重新调整模式，往往代价很大，牵一发而动全身，所有相关的ETL程序可能都需要调整；
而数据湖非常灵活，可以根据需要重新配置结构或者模式；

8 应用

数据仓库一般用于做批处理报告、BI、可视化等；
数据湖主要用于机器学习、预测分析、数据探索和分析；

2 基于Spring Boot的个人博客系统

项目介绍

项目介绍：个人博客系统包含前台管理和后台管理两部分。前台管理的核心功能包括：文章分页展示、文章详情查看、文章评论管理；后台管理的核心功能包括：系统数据展示、文章发布、文章修改、文章删除；同时，对系统前后台用户登录管理进行了统一实现。
软件环境：前端使用Spring Boot支持的模板引擎Thymeleaf+jQuery完成页面信息展示，后端使用Spring MVC+Spring Boot+MyBatis框架进行整合开发。

3 基于Servlet和JSP的网上书城

0 项目介绍

项目介绍：网上书城包含面向用户和面向管理员两部分。面向用户的部分包括：首页、用户注册、购物、提交订单、付款等模块；面向管理员的部分包括：图书管理、物流管理等模块。
软件环境：Servlet、JSP、Tomcat、MySQL等。

1 什么是Servlet

Servlet是一个Java类，是在服务器上运行以处理客户端请求并作出响应的程序。

2 Tomcat容器等级

Tomcat容器分四个等级，Servlet容器管理Context容器，一个Context对应一个Web工程。

3 手工编写一个Servlet

继承HttpServlet；
重写doGet()或doPost()方法；
在web.xml中注册Servlet；
部署运行；

4 测试题

假设在helloapp应用中有一个HelloServlet类，它在 web.xml文件中的配置如下:

 <servlet>   
  <servlet-name>HelloServlet</servlet-name>    
  <servlet-class>org.javathinker.HelloServlet</servlet-class>
 </servlet>  
<servlet-mapping>   
  <servlet-name>HelloServlet</servlet-name>  
  <url-pattern>/hello</url-pattern>
</servlet-mapping>

那么在浏览器端访问HelloServlet的URL是什么?

答：http://localhost:8080/helloapp/hello
解析：localhost是服务器主机名，也可以是IP地址127.0.0.1；8080是tomcat服务器的端口号；helloapp是web工程的上下文地址ContextRoot（一般情况下与web工程名一致）；最后是标签中的内容。

5 Servlet执行流程

6 Servlet生命周期

初始化阶段：调用构造方法创建Servlet实例，然后调用init()方法，在整个生命周期内，init()只被调用一次；
响应客户端请求阶段：调用service()方法。由service()方法根据提交方式选择执行doGet()或者doPost()方法；
终止阶段：服务器关闭时，调用destroy()方法。在调用 destroy() 方法之后，servlet 对象被标记为垃圾回收；

架构图

下图展示了一个典型的 Servlet 生命周期方案。

第一个到达服务器的 HTTP 请求被委派到 Servlet 容器；
Servlet 容器在调用 service() 方法之前加载 Servlet；
然后 Servlet 容器处理由多个线程产生的多个请求，每个线程执行一个单一的 Servlet 实例的 service() 方法；

7 Tomcat装载Servlet的三种情况

Servlet容器启动时自动装载某些Servlet，实现它只需要在web.xml中的之间添加如下代码：1，数字越小优先级越高；
Servlet容器启动后，客户端首次向Servlet发送请求；
Servlet类文件被更新后，会自动重新装载Servlet；

8 Servlet与JSP的区别

Servlet是一个Java类，是在服务器上运行以处理客户端请求并作出响应的程序；
JSP是一种动态页面技术，它的主要目的是将表示逻辑从Servlet中分离出来；
SUN 公司推出 JSP 技术的同时，也推出了两种 Web 应用程序的开发模式。即 JSP+JavaBean 和 Servlet+JSP+JavaBean；
JSP+JavaBean 中 JSP 用于处理用户请求，JavaBean 用于封装和处理数据。该模式只有视图和模型，一般把控制器的功能交给视图来实现，适合业务流程比较简单的 Web 程序。JSP+JavaBean 模式在一定程度上实现了 MVC，即 JSP 将控制层和视图层合二为一，JavaBean 为模型层；

Servlet+JSP+JavaBean 中 Servlet 用于处理用户请求，JSP 用于数据显示，JavaBean 用于数据封装，适合复杂的 Web 程序。Servlet+JSP+JavaBean很好地实现了MVC，即Servlet担当控制层，JSP为视图层，JavaBean为模型层；

9 Spring MVC和Servlet

Spring MVC简化了写Servlet类，由一个前端调度器接收所有请求，后台写相应的Controller就好，而Servlet就是一个请求一个映射一个Servlet。

10 转发和重定向的区别

forward（转发）

是服务器请求资源，服务器直接访问目标地址的URL，把那个URL的响应内容读取过来，然后把这些内容再发给浏览器，浏览器根本不知道服务器发送的内容从哪里来的，因为这个跳转过程是在服务器实现的，并不是在客户端实现的，所以客户端并不知道这个跳转动作，所以它的地址栏还是原来的地址。

redirect（重定向）

是服务端根据逻辑,发送一个状态码,告诉浏览器重新去请求那个地址.所以地址栏显示的是新的URL.

转发是服务器行为，重定向是客户端行为。

区别：

从地址栏显示来说

forward是服务器请求资源，服务器直接访问目标地址的URL，把那个URL的响应内容读取过来，然后把这些内容再发给浏览器，浏览器根本不知道服务器发送的内容从哪里来的，所以它的地址栏还是原来的地址；
redirect是服务端根据逻辑发送一个状态码，告诉浏览器重新去请求某个地址.，所以地址栏显示的是新的URL；
从数据共享来说

forward：转发页面和转发到的页面可以共享request里面的数据；
redirect：不能共享数据；
从运用地方来说

forward：一般用于用户登陆的时候,根据角色转发到相应的模块；
redirect：一般用于用户注销登陆时返回主页面和跳转到其它网站等；

从效率来说

forward：高；
redirect：低；

Servlet是线程安全的吗？

Servlet不是线程安全的，多线程的读写会导致数据不同步的问题。

4 僵尸企业画像及分类

僵尸企业是指缺乏盈利能力却能够以低于市场最优利率成本获得信贷资源，依靠外界输血而缺乏自生能力的企业。僵尸企业是我国经济结构转型时期面临的一个棘手问题，既影响经济效率，也蕴含金融风险，处理这一问题首先需要对僵尸企业进行识别和分类；
项目最终目标是要实现单个企业画像和批量企业画像的功能。单个画像模块主要描述对单个企业画像信息的特征数据进行分析；批量画像模块是在单个画像的基础上进行的，用户通过将批量数据导入系统中，然后进行批量数据分析；
画像算法采用了PCA+XGBoost算法。通过PCA（主成分分析）得到了特征项；接着，将根据特征项重新整理的数据放入XGBoost模型中进行训练，不断调整参数，使得验证集有一个比较高的准确率；

5 降低汽油精制过程中的辛烷值损失模型

辛烷值是反映汽油燃烧性能的最重要指标，现有技术在对催化裂化汽油进行脱硫和降烯烃过程中，普遍降低了汽油辛烷值。辛烷值每降低1个单位，相当于损失约150元/吨。由于炼油工艺过程的复杂性以及设备的多样性，它们的操作变量繁多（数百个）且之间具有高度非线性和相互强耦联的关系，因此考虑用非线性的机器学习算法模型来建模；
方案主要利用了机器学习技术来解决化工过程建模问题，先通过PCA降维寻找影响辛烷值损失值的最重要的30个变量，然后建立基于XGBoost的辛烷值损失预测模型，从而为汽油化学工艺提供参考；

6 天然气股份有限公司场站智能化分析及控制软件开发

异常检测研发目标

故障检测系统将从以下几个方面为天然气储运场站的生产和储运提供技术支持：
（1）对场站安全态势进行全方位刻画。目前，公司对场站的各种设备进行了实时检测，在生产过程中利用计算机控制系统收集了计量设备、分离设备和压缩机组等生产设备的运行状态，故障检测系统将对这些数据进行清洗、挖掘和分析，以实现对场站安全态势的全方位刻画；
（2）对场站安全态势进行预测。天然气场站的储运数据具有动态性、非线性和随机性等复杂特性，故障检测系统将结合机器学习、过程检测等技术对数据进行科学建模，预测可能出现的故障；
（3）降低场站事故发生率。在对安全态势合理预测的基础上，预知可能出现的故障，及时检查清除故障，保证天然气生产和储运的平稳运行，降低因天然气运行设备老化、损坏、维护不及时等原因造成的事故发生率。

异常检测设计方案

异常检测系统的主要功能在于高效评价设备运行工况，预先发现运行故障，快速定位故障原因，为提高场站生产管理的安全级别提供决策依据。设计方案主要结合了机器学习、大数据管理、过程检测等技术，此外还参考了天然气领域的相关知识。

具体来说，就是对单个传感器得到的数据和多个传感器得到的数据采用不同的模型进行处理。其中，使用LSTM模型对单点数据进行处理，判断该变量是否产生故障；使用BP神经网络对多点支路数据进行故障检测，判断该多点支路是否有故障产生。

单点检测

单点是指单个传感器检测点，单点异常检测实际上是对一维时间序列上的异常点进行检测。

由于天然气数据不是一个纯粹的随机时间序列，它的时间序列可能存在某种长期依赖关系，而LSTM模型可以捕捉到这种长期依赖关系，因此考虑建立LSTM模型进行天然气数据的单点故障检测。

LSTM，即长短期记忆网络，是为了解决一般的RNN（循环神经网络）存在的长期依赖问题而专门设计出来的，适合于处理和预测时间序列中间隔和延迟非常长的重要事件。

（1）数据预处理

首先从CSV文件中提取出需要进行异常检测的一维时间序列，然后对数据进行z-score标准化，即0均值标准化，将数据变换为均值为0、标准差为1的标准正态分布。

（2）划分训练集、验证集和测试集

将处理后的数据按照7：2：1的比例将数据划分为训练集、验证集和测试集。

（3）设定模型参数

（4）训练模型

将处理后的数据加载到pandas的数据框架中，它将输出 ( N, W, F ) 三维numpy数组，其中N表示训练数据中的序列数，W表示序列长度，F表示每个序列的特征数；然后将数组馈送进LSTM模型中。

（5）通过模型进行预测

LSTM模型使用训练集数据的第一部分（滑动窗口大小）初始化一次训练窗口，预测出单个点的值，然后不断移动滑动窗口去预测下一个点的值。以此类推，LSTM模型可以预测出一个完整的时间序列。

（6）异常检测与判定

将预测出来的数据和真实的测试集数据进行对比，比较数据的真实值是否在其预测值的三倍标准差内，如果在，则表明该数据为正常数据，否则该数据为异常数据。

多点检测

多点是指多个传感器检测点。

使用BP神经网络做多点故障检测：通过研究实测数据，利用采集的压力、温度及时间点等数据在BP神经网络中进行训练学习和预测评估。

你可能感兴趣的:(后端开发知识点汇总,http,java,python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
Git常用命令－修改远程仓库地址猿大师 Linux Java git java
查看远程仓库地址gitremote-v返回结果originhttps://git.coding.net/＊＊＊＊＊.git(fetch)originhttps://git.coding.net/＊＊＊＊＊.git(push)修改远程仓库地址gitremoteset-urloriginhttps://git.coding.net/＊＊＊＊＊.git先删除后增加远程仓库地址gitremotermori
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

项目整理

目录

1 基于Thrift的RPC框架的开发和维护

项目介绍

RPC及实现RPC需要的技术

1 动态代理

2 序列化和反序列化

3 NIO通信组件

4 注册中心

为什么使用RPC

RPC和HTTP

Thrift简介

Thrift整体架构

Thrift 三大重要组件：Transport、Protocol和 Server

传输方式Transport

传输协议Protocol（编码方式）

二进制协议 VS 文本协议

服务模型Server（Java）

1 TSimpleServer模式

2 TNonblockingServer模式

3 THsHaServer模式（半同步半异步）

4 TThreadPoolServer模式

5 TThreadedSelectorServer模式

服务模型Server（Python）

1 TSimpleServer

2 TThreadPoolServer

2 数仓

数据仓库概念

数仓分层概念

数据仓库的输入数据源和输出系统

维、维度、维度表和事实表

0 来自知乎的一个简单解释

1 维

2 维度

3 维度表

4 事实表

5 星型模式结构示意图

数据湖 VS 数据仓库

1 本质区别

2 存储位置

3 数据源

4 用户

5 数据质量

6 数据模式

7 敏捷扩展性

8 应用

2 基于Spring Boot的个人博客系统

项目介绍

3 基于Servlet和JSP的网上书城

0 项目介绍

1 什么是Servlet

2 Tomcat容器等级

3 手工编写一个Servlet

4 测试题

5 Servlet执行流程

6 Servlet生命周期

7 Tomcat装载Servlet的三种情况

8 Servlet与JSP的区别

9 Spring MVC和Servlet

10 转发和重定向的区别

Servlet是线程安全的吗？

4 僵尸企业画像及分类

5 降低汽油精制过程中的辛烷值损失模型

6 天然气股份有限公司场站智能化分析及控制软件开发

异常检测研发目标

异常检测设计方案

单点检测

多点检测

你可能感兴趣的:(后端开发知识点汇总,http,java,python)