了依李

浅谈hive及理论

为什么使用它

Hive会把sql语句转换成mr,如果单独写mr的过程很复杂

它是什么

Hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并可以使用sql语句查询

架构图

组件介绍

用户接口:Cli,Client和WebGUI,其中最常用的是cli,cli启动的时候会同时启动一个hive副本,client是hive客户端,用户连接到hiveServer.在启动client模式的时候,需要指出hiveServer所在的节点,并且在该节点启动hiveServer.WUI是通过浏览器也能访问Hive
Metastore:元数据包括表名,表所属数据库,拥有者,列,字段,类型等存储到数据库表中-mysql
Complier:编译器.optimizer:优化器. executor:解释器,完成sql查询语句存储到hdfs上,并在随后有mapperreduce调用执行
Hive的客户端连接服务器走的是thrift协议
JDBC/ODBC是hive的java实现
Hive与hadoop的关系:hive利用hdfs存储数据,利用mapperreduce查询分析数据

优缺点

优点:1.简单易上手,提供了类似sql的查询语句2.可扩展,为大数据集设计了计算能力(mr作为计算引擎,hdfs作为存储系统)3,多接口,可通过beeline,JDBC,thrift
缺点:1.hive的效率比较低(mr)2.不支持更新,删除,插入
应用场景:1.数据挖掘-用户行为分析2.非实时分析-日志分析,文本分析3数据汇总-每天点击情况,流量统计

OLAP和OLTP

联机分析处理(OLAP,On-line Analytical Processing),数据量大,DML少。使用数据仓库模板
联机事务处理(OLTP,On-line Transaction Processing),数据量少,DML频繁,并行事务处理多,但是一般都很短。使用一般用途或事务处理模板。
决策支持系统(DDS,Decision support system),典型的操作是全表扫描,长查询,长事务,但是一般事务的个数很少,往往是一个事务独占系统
对比:

hive建模理论

名词解释:

DSS:(decision-support system)决策支持系统
ODS,Operational Data Store:操作数据源
DW:数据仓库;data warehourse
DM:数据集市(Data Market)
Dws:data warehouse service 服务数据层
Dwd:data warehouse detail 细节数据层
Dwb:data warehouse base基础数据层
OLAP:联机分析处理(On-Line Analysis Processing)
OLTP:联机事务处理(On-Line Transaction Processing)
事实表(fact)
维度表dimension

数据仓库的发展历程

数据仓库概念最早可追溯到20世纪70年代,希望提供一种架构将业务处理系统和分析处理分为不同的层次
20世纪80年代,建立TA2(Technical Architectue2)规范,该明确定义了分析系统的四个组成部分:数据获取,数据访问,目录,用户服务;
1988年,IBM第一次提出信息仓库的概念:一个结构化的环境,能支持最终用户管理其全部的业务,并支持信息技术部门保证数据质量:抽象出基本组件:数据抽取,转换,有效性验证,加载,cube开发等,基本明确了数据仓库的基本原理,框架结构,以及分析系统的主要原则
1991年,Bill Inmon出版提出了更具体的数据仓库原则:
数据仓库是面向主题的
集成的
包含历史的
不可更新的
面向决策支持的
面向全企业的
最精细的数据存储
数据快照式的数据获取
尽管有些理论目前仍有争议,但凭借此书获取”数据仓库之父”的殊荣
Bill Inmon主张自上而下的建设企业数据仓库,认为数据仓库是一个整体的商业智能系统(BI)的一部分.一家企业只有一个数据仓库,数据集市的信息来源出版数据仓库,在数据仓库中,信息存储符合三范式,大致结构:

Ralph KimBall出版,主张自下而上的建议数据仓库,极力的推崇建立数据集市,认为数据仓库是企业内所有数据集市(模块)的集合,信息总是被存储在多维模型中,其思路:

两种思路和在实的操作中都很信成功的完成项目将会,直到最终Bil Inmon提出了新的BI架构
CIF(Corporation Information Factory),把数据集合包含了进来.CIF的核心是将数据框架划分为不同的层次以满足不同的场景的需求.比如常见的ODS,DW,DM等,每层根据实际场景采用的建设方案, 改思路也是目前的数据仓库建设的架构指南,但自上而下还是自下而上的进行数据仓库建设,并未统一

数据仓库建模的目标

访问性能:能够快速查询所需的数据,减少数据IO
数据成本:减少不必要的数据冗余,实现计算结果数据利用,降低大数据系统中的存储成本和计算成本
使用效率:改善用户应用体验,提高使用数据的效率
数据质量:改善数据统计口径的不一致性,减少数据计算错误的可能性,提供高质量,一致的数据访问平台
So:大数据的数据仓库建模需要通过建模的方法更好的组织,存储数据,以便在性能,成本,效率和数据质量之间找到最佳的平衡点

四种模型

er实体模型–关系模式范式

关系数据库设计时,遵照一定的规范要求,目的在于降低数据的冗余性和数据的一致性,目前业界范式有:第一范式:(1NF),第二范式:(2NF),第三范式:(3NF),巴斯-科德范式(BCNF),第四范式(4NF),第五范式(5NF)
第一范式:列都应该是原子性的,即数据表的每一列都是不可侵害(不可拆分)的原子数据项
第二范式在1NF的基础上,实体的属性完全依赖于主键,不能存在仅依赖主键字一部分的属性(复合主键)
第三范式(3NF)在2NF的基础上,任何非主属性不依赖于其它非主属性(除了主键以外,列与列之间不能有依赖关系)
在信息系统中,将事务(事件,现象)抽象为”实体”,”属性”,”关系”来表示数据关联和事物描述;实体:entity,关系,relationship,这种对数据的抽象建模通常被称为ER实体关系模型;
实体:通常为参与到过程中的主体,客观存在的,比如:商品,仓库,货拉,汽车(此实体非数据库的实体表)
属性:对主体的描述,修改即为属性,比如商品的属性有商品名称,颜色,尺寸,重量,产地等;
关系:ER图,(实体用矩形表示,关系用菱形表示,属性使用椭圆表示)
应用场景
1.ER模型是数据库设计的理论基础,当前几乎所有的OLTP系统设计都采用ER模型建模的方式
2.Bill Inom提出的数据仓库理论,推荐采用ER关系模型进行建模
3.BI架构提出分层架构,数据仓库底层的ods,dwd多采用ER关系建模就行设计
4.ER模型建模标准:尽量的避免数据冗余

维度模型

Ralph Kimball推崇数据集市的集合为数据仓库,同时也提出了对数据集市的维度建模,将数据仓库中的表分为事实表和维度表两种类型
1.事实表
在ER模型中抽象出了有实体,关系,属性三种类别,在现实世界中,每一个操作型事件,基本都是发生在实体之间,伴随着这种操作事件的发生,会产生可度量的值,而这个过程就产生了一个事实表,存储了每一个可度量的事件
2.维度表
维度:顾名思义,看待事物的角度.比如从颜色,尺寸的角度来比较手机的外观,从cpu,内存等较比较手机的性能
维度表一般为单一主键,在ER模型中,实体为客观存在的事物,会带有自己的描述性属性,属性一般为文本性,描述性这些描述被称为维度表;
比如商品,单一主键;商品id,属性包括产地,颜色,材质,尺寸,单价等会,但并非属性一定是文本,比如单价,尺寸,均为数值型描述性的,日常主要的维度抽象包括:时间维度表,地理区域维度表等.
星型:
雪花型:
雪花模型和星型模型对比:
1.冗余:雪花模型符合业务逻辑设计,采用3NF设计,有效降低数据冗余;星形模型的维度表设计不符合3NF,反规范化,维度表之间不会直接相关,特殊部分存储空间
2.性能:雪花模型由于存在维度间的关系,采用3NF降低冗余,通常在使用过程中,需要连接更多的维度表,导致性能偏低;星形模型反三范式,采用降维的操作将维度整合,以存储空间为代价有效降低维度表连接数,性能较雪花模型高;
3.ETL(数据清洗):雪花模型符合业务ER模型设计原则,在ETL过程相对简单,但是由于阶段性模型的限制,ETL任务并行化较低;星形模型在设计维度表时反范式设计,所以在ETL过程中整合业务数据到维度表有一定难度,但是由于避免阶段性维度,可并行化处理
维度建模源自数据集市,主要面向分析场景
数据仓库建模
主流的OLAP引擎底层数据模型
如何决择:
牺牲时间换取空间;采用雪花模型
牺牲空间换取时间:采用星形模型(尽可能把所有的关联关系都放到一张表中)

dataVault模型

Data Vault是在ER模型的基础上衍生而来,模型设计的初识是有效的组织基础数据,使之易扩展,灵活的应对业务的变化,同时强调历史性,可追溯性和原子性,不要求对数据进行过度的一致性处理,并非针对分析场景设计
Data Vault模型是一种中心辐射式模型,其设计的重点围绕着业务键的集成模式,这些业务键是存储在多个系统中的,针对各种信息的键,用于定位和唯一标识记录或数据线
包含三种结构:
1.中心表-hub;唯一业务键的列表,唯一标识企业实际业务,企业的业务主体集合
2.链接表-link:表示中心表之间的关系,通过链接表串联整个企业的业务关联关系
3.卫星表–satallite:历史的描述性数据,数据仓库中数据的真正载体
Data vault模型更容易设计,ETL过程中更易配置化实现,hub想像成人体的骨架,link就是连接骨架的韧带组织,satalite就是骨架上的血肉
dataVult是对ER模型更近一步的规范化,由于对数据的拆解和更偏向于基础数据组织,在处理分析类场景时相对复杂,适合数据仓库的低层构建,目前实际应用场景较少

anchor模型

anchor是对dataVault模型做了更近一步的规范处理,初识是为了设计高度可扩展的模型,核心思想就是所有的扩展只添加不修改,于是设计出模型基本变成了k-v结构的模型,模型范式达到了6NF
Map模型
由于过度规范化,使用中牵涉到太多的join操作,目前木有实际案例,仅作了解

建模总结

以上为四种基本的建模方法:当前主流的建模方法为:ER模型(主要应用于数据库),维度模型(主要应用于数据仓库)
ER模型常用于OLTP数据库建模,应用到构建数据仓库时更偏重数据整合,站在企业整体考虑,将各个系统的数据按相似性一致性,合并处理,为数据分析,决策服务,但并不便于直接用来支持分析.
问题:
1.需要全面梳理企业所有的业务和数据流
2.实施周期长
3.对建模人员要求高
4.尽量避免数据冗余(不要吝惜表的数量);联合查询;(记录少)
维度模型
维度建模是面向分析场景而生,针对分析场景构建数据仓库模型;重点关注快速,灵活的解决分析需求,同时能够提供大规模数据的快速响应性能.针对性强,主要应用于数据仓库构建和OLAP引擎低层数据模型
不需要完整的梳理企业业务流程和数据
实施周期根据主题边界而定,容易快速实现demo
尽量要冗余,因为数据仓库(hive)后面是hdfs,硬盘空间无上限;推荐使用星形模型,可以使用雪花模型,但是层级不要太多;

数据仓库模型的选择是灵活的,不局限于某一种模型方法
数据仓库的设计也是灵活的,以实际需求场景为导向
模型设计兼顾灵活性,可扩展,面对终端用户透明性
模型设计要考虑技术可靠性和实现成本
按照实效性,数据划分为:
①离线:数据延迟时间天级别,一般今天处理t-n天的数据,所以日常所说的数据仓库按照时间分;延迟1天,也称作t+1天
②准实时:数据延迟时间小时级别,一般今天处理h-n小时的数据,通常准实时
③实时:数据延迟级别为毫秒,秒级别,可以理解为当前处理当前时间时刻的数据.
实时场景:
1.个性化推荐
1.1实时:用户实时信息,比如位置,设备,当前会话浏览情况,最近的浏览
1.2离线:商品关联关系,用户相似性特征,位置偏好,设备偏好,关联偏好
2.用户画像
2.1实时:实时位置标注,当前偏好标注,当前设备标注
2.2离线:常驻位置,稳定偏好,常用设备,消费水平等标签
3.风控
3.1反欺诈,防刷单,薅羊毛等
3.2实时:用户位置,ip,设备,通讯录等
3.3离线:风险区域,风险用户,风险设备,多头等

大数据领域内,数据仓库的建设解决根本的应用问题

实效性高 业务灵活,多变 数据源多样性 数据质量参差不齐 应用场景复杂

针对各种问题和场景,在做技术造型和低层技术架构的时候需要考虑

梳理业务和响应的应用场景 需要处理的数据源的种类,类型,数据量 对实效性要求 对灵活性要求 对性能要求 对成本要求

误区

技术万能论 盲目崇拜新技术 脱离业务 一劳永逸 脱离业务场景的架构就是耍流氓

对大数据体系下基础建设的工作,主要有:

1.大数据基础平台维护,基础运维,优化;不过渡关注业务,数据内容本身,重点是集群的稳定性,性能,易用性,技术上会涉及底层源码,比如:hadoop,spark,hbase等,大数据底层框架的维护用户,–神秘但重要的底层建设者
2.大数据生态开发,工程性开发,应用相关开发:关注业务逻辑或者特定应用场景,不关注或仅关注特定的数据内容,大数据部分特定场景的应用开发,不会涉及过多的低层技术,多为大数据基本框架的使用者,用各种技术服务于业务场景,比如推荐系统开发,olap引擎,反作弊等业务应用场景----无所不能的大数据开发者
3.数据仓库,数据内容建设,开发:”大数据”真正的建设者,负责企业整体的数据资产建设和管理,负责数据治理体系,构建高质量,一致性,规范化的数据平台,关注企业整体业务情况和数据内容本身,对数据,业务有较高的敏感性,是所谓人工智能,自动驾驶等一切数据应用的底层基础数据建设者

注:总结简单望包涵,如有问题,可以一起讨论,谢谢

vue3大屏可视化项目，包含地图，各种图表，全屏适配方案 m0_74825526 javascript 开发语言 ecmascript
项目设计1.始终满屏适配，这种方案一般用在屏幕变化不会特别的大项目，项目基本上不会用在比例非常不协调的大屏，设计图按1920*1080标准电脑屏幕比，所用的屏幕也基本在这个比例左右2.涉及图表知识点简单，主要有自定义色系，环形图，堆叠柱状图，折线图3.使用高德地图标点做中间地图满屏适配方案实现思路1宽度使用vw，高度使用vh，严格按照设计图换算，并且留出缓冲空间2具体算法，设计图为1920_108
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
EL表达式与JSTL标签库详解秦老师Q JavaWeb基础 java
前言本章主要学习EL表达式与JSTL标签库，用于简化JSP数据操作。收录JavaWeb基础系列，该系列主要学习JavaWeb开发原生框架、Servlet、JSP、request请求对象、response响应对象、Session会话对象、Filter过滤器、EL表达式、JSTL标签库、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标一、EL表达式1.概念2.语法3.示例4.EL
MySQL第一章 dos窗口mysql命令合集(超详细!!!)一篇就够了秦老师Q MySQL数据库基础 mysql adb 数据库 database
前言：本章节主要学习MySQL数据库在dos窗口下的基础命令，sql语句等相关知识点，收录于MySQL基础系列，该系列主要讲解MySQL数据库dos命令/sql约束/sql语句/sql连接查询等相关知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标：1连接Mysql1.1连接本机上的MYSQL1.2连接远程主机上的MYSQL1.3退出MYSQL命令2修改密码2.1给root加个密码ab122
JavaWeb开发 - Filter过滤器详解秦老师Q JavaWeb基础 java web java-ee
前言本章节主要学习JavaWeb开发中的Filter过滤器技术，收录于JavaWeb基础专栏，该专栏主要学习JavaWeb开发原生框架、Servlet、JSP、请求对象、响应对象、Session会话对象、Filter过滤器、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标1.概念2.Filter介绍3.入门案例4.验证登录案例4.1登录代码4.2过滤器验证内容1.概念Filt
FastAPI 中间件使用：CORS 与 GZip 压缩 LensonYuan python学习教程 fastapi 中间件 GZip CORS 跨域访问
FastAPI中间件详解：CORS与GZip压缩在FastAPI中，中间件（Middleware）是一种强大的工具，用于在请求和响应之间执行全局性任务。本文将深入探讨两个常用的中间件：CORSMiddleware和CustomGZipMiddleware，并通过丰富的示例和知识点，帮助你全面掌握它们的使用场景和实现原理。1.什么是中间件？中间件是一种在请求到达应用程序之前或响应返回客户端之前执行的
Java实现简易的学生管理系统杰仔正在努力 Java java idea
Java实现简易的学生管理系统文章目录Java实现简易的学生管理系统前言一、如何实现二、实现的方法（示意图）三、开始实现3.1定义类3.2定义主界面3.3实现添加功能3.4实现查询功能3.5实现删除功能3.6实现修改功能四、完整代码五、总结前言该项目主要是作为新手快速上手实操，围绕面向对象所学知识实现学生管理系统的增删改查功能，所使用的知识点主要是面向对象的三大特征使用的方法、判断语句、构造方法等
✨探究✨进程最大可以打开多少个文件 linuxlinux运维运维
大家好，我是半夏之沫一名金融科技领域的JAVA系统研发我希望将自己工作和学习中的经验以最朴实，最严谨的方式分享给大家，共同进步写作不易，期待大家的关注和点赞关注微信公众号【技术探界】前言原本是想搞清楚一台服务器最多能建立多少个连接，在学习的过程中，发现能建立多少个连接受多个因素影响，其中一个因素就是进程最大可打开文件数，我在自行查阅资料加请教专门搞容器的同事后，感觉这个知识点有点意思，故撰写此文以
Java中private和static同时使用会出现什么情况？乐悠小码 java 开发语言 jvm
引言这几天在学习单例设计模式（后面会出一期包含23种设计模式介绍的博客）的时候发现了一段代码privatestaticSinglesingle;当时我就在想，这个private和static一起用的话外界想要访问这个成员变量到底是能不能访问到呢？当时在学习Java基础的时候也没有仔细研究过这里，下面就详细的来解释一下，把这块空缺的知识点补上！private的作用private作为权限修饰符，用来声
【HarmonyOS】开启沉浸式（全屏）并动态获取窗口规避区的信息 m0_5南风 harmonyos 华为
鸿蒙开启沉浸式（全屏）并动态获取窗口规避区的信息动态获取窗口规避区的信息在移动端开发中至关重要，它能够提升用户体验，通过确保应用在不同设备和屏幕尺寸下合理利用可用空间，避免内容被状态栏或导航栏遮挡。此外，这种技术支持响应式设计，使得页面布局能够根据设备状态自动调整，适应小屏和分屏模式，确保信息的可见性和可访问性，从而解决了布局错位和内容遮挡的问题。知识点setWindowLayoutFullScr
# RAG 框架 | 技术栈 #一文读懂Xinference架构！优秀开源项目技术栈分析向日葵花籽儿 RAG 优秀开源项目技术栈分析架构人工智能 AIGC RAG
这是原文内容这是知识点解读一、概述Xinference是一个利用actor编程框架Xoscar来管理机器、设备和模型推理进程的系统。每个actor都是模型推理的基本单元，可以集成多种推理后端。它支持多种推理引擎和硬件，并且具有异步和非阻塞的特性。RESTfulAPI：使用FastAPI实现，提供了一个示例API/status对应函数get_status。命令行：通过Click实现，允许用户在终端与
Python实现Windows定时关机，面试必备知识点总结 2301_82241698 2024年程序员学习 python windows 面试
os.popen(‘at22:30shutdown-s’)调用cmd，执行命令。而其中的22和30是等待用户输入的数据。因此，应该用两个lineEdit中获取到的合法数字替换对应的h和m。用到获取lineEdit内容的方法：h=self.lineEdit.text()m=self.lineEdit_2.text()然后以h，m替换执行命令中的时，分.接着就是pushButton的部分了。为push
【JavaWeb阶段学习】三步学会JDBC知识点 ss273 java 学习 mysql java
(❁´◡`❁)您的点赞➕评论➕收藏⭐是作者创作的最大动力支持我：点赞+收藏⭐️+留言目录1、JDBC基础JDBC数据库连接JDBC实现增删改查JDBC代码规范化2、结果集2.1、结果集光标与元数据3、预处理4、sql查询继续巩固练习1.查出至少有一个员工的部门，显示部门编号/部门名称/部门位置/部门人数2.列出所有员工的姓名及其直接上级的姓名3.列于受雇日期早于直接上级的所有员工的编号/姓名/部门
vue-router 3.X 讲解故梦867 前端八股总结 vue.js 前端 javascript
vue-router3.X讲解最近小哆啦在学习之余，发现自己在vue-router中有好多不了解的知识点，小哆啦决定梳理一遍vue-router参考资料：VueRouter(vuejs.org)说起前端路由有些朋友可能会问什么是路由？何为前端路由？小哆啦查阅资料之后发现其实最开始提出路由这个概念的是后端，是来跟后端服务器进行交互的一种方式，通过不同的路径，来请求不同的资源，请求不同的页面是路由的其
《进阶篇第9章》学习vuex知识点后练习：把求和案例改成getters
@[toc]效果展示：注意点1：问题：如何实现“当前和为奇数再加”？答案：incrementOdd(){if(this.sum%2){this.sum+=this.n}}注意点2:问题：select下拉框默认为1时，点击加号没问题，但是下拉框选中为2时，n值变成字符串了，不应该是数字类型名吗？旧代码：无论设置value="1"还是value=1都无效当前求和为：{{sum}}123答案：因为没设置
Java HTTP POST请求工具方法详解：架构、实践与最佳实践（可变参数）码农阿豪@新空间代码工作室好“物”分享 java http 架构
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务)个人邮箱：[[email protected]]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
Redis过期策略内存淘汰机制、持久化、备份与恢复、事务、管道技术、发布与订阅等知识点详解 ziania_cumt Redis redis 中间件
缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题缓存雪崩我们可以简单的理解为：由于缓存挂掉或原有缓存失效，(例如：我们设置缓存时采用了相同的过期时间，在同一时刻出现大面积的缓存过期)，所有原本应该访问缓存的请求都去查询数据库了，而对数据库CPU和内存造成巨大压力，严重的会造成数据库宕机。从而形成一系列连锁反应，造成整个系统崩溃。解决办法：Redis高可用；限流降级：通过加锁或者队列来控制读数
Spring中的@Cacheable 注解基本知识点码农研究僧 Java spring java 后端 Cacheable
目录前言1.基本知识2.实战详解前言找工作，来万码优才：#小程序://万码优才/r6rqmzDaXpYkJZF对于Java的基本知识推荐阅读：java框架零基础从入门到精通的学习路线附开源项目面经等（超全）【Java项目】实战CRUD的功能整理（持续更新）1.基本知识@Cacheable是Spring提供的注解，用于声明一个方法的返回结果会被缓存当方法被调用时，Spring会先检查缓存中是否存在该
解锁面向对象编程：Python 类与对象详解 Yui_ python python 开发语言笔记学习
大家好，我是Yui_如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如有不懂，可以随时向我提问，我会全力讲解~如果感觉博主的文章还不错的话，希望大家关注、点赞、收藏三连支持一下博主哦~！你们的支持是我创作的动力！我相信现在的努力的艰辛，都是为以后的美好最好的见证！人的心态决定姿态！欢迎讨论：如有疑问或见解，欢迎在评论区留言互动。点赞、收藏与分享：如觉得这篇文章对您有帮助，请点赞、收藏并
初始JavaEE篇 —— 文件操作与IO 我要学编程(ಥ_ಥ) JavaEE java-ee java 开发语言文件操作 IO
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程程(ಥ_ಥ)-CSDN博客所属专栏：JavaEE目录文件介绍Java标准库中提供操作文件的类文件系统操作File类的介绍File类的使用文件内容操作二进制文件的读写操作文本文件的读写操作文件介绍文件分为两种：一种是狭义上的文件；另一种是广义上的文件。狭义的文件就是指机器上存储数据的地方，在电脑上面，C盘、D盘这些就可以称为文件；而广
Bitmap 和布隆过滤器傻傻分不清？你这不应该啊
大家好，我是小富～有个兄弟私下跟我说，他在面试狗东时，有一道面试题没回答上来：Redis的Bitmap和布隆过滤器啥区别与关系？其实就是考小老弟对这两种工具的底层数据结构是否了解，不算太难的题。不过，bitmap和布隆过滤器在大数据量和高并发业务的使用频率不低，知识点应该掌握下，既然问了那咱们简单的梳理下它们的底层原理、应用场景以及它们之间的关联。BitmapRedis中的Bitmap（位图）是一
面试官桀桀一笑：请手写一个Promise.all（判断是不是Promise、js抛出错误）
前言本文如标题，回顾三个知识点判断是不是Promisejs抛出错误的类型手写Promise.all判断是不是Promise方式一Object.prototype.toString.call代码如下：//p存在，且对象原型上是PromisefunctionisPromise(p){returnp&&Object.prototype.toString.call(p)==="[objectPromise
【C++BFS算法】909. 蛇梯棋|2019 闻缺陷则喜何志丹算法 c++宽度优先力扣蛇梯棋蛇梯子
本文涉及知识点C++BFS算法LeetCode909.蛇梯棋给你一个大小为nxn的整数矩阵board，方格按从1到n2编号，编号遵循转行交替方式，从左下角开始（即，从board[n-1][0]开始）的每一行改变方向。你一开始位于棋盘上的方格1。每一回合，玩家需要从当前方格curr开始出发，按下述要求前进：选定目标方格next，目标方格的编号在范围[curr+1,min(curr+6,n2)]。该选
【matlab】matlab知识点及HTTP、TCP通信 WXG1011 matlab 算法
1、矩阵运算点乘：对于两个同维度的向量，点乘结果是这两个向量对应分量的乘积之和。点除：是指对两个数组的对应元素进行除法运算。点幂：表示元素对元素的幂运算。>>A=[1,2,3;4,5,6];B=[1,1,1;2,2,2]>>D1=B.*AD1=12381012>>D2=B./AD2=1.00000.50000.33330.50000.40000.3333>>D3=B.^AD3=1111632642
jpa知识点 The_Best_Hacker Jpa 分页
1.分页publicstaticPageRequestof(intpage,intsize,Directiondirection,String...properties){returnof(page,size,Sort.by(direction,properties));}官方API说明:since2.0,useof(...)instead,2.0版本后,使用of(...)方法代替PageRequ
网络安全、Web安全、渗透测试之笔经面经总结网络安全Ash web安全安全
本篇文章涉及的知识点有如下几方面：1.什么是WebShell?2.什么是网络钓鱼？3.你获取网络安全知识途径有哪些？4.什么是CC攻击？5.Web服务器被入侵后，怎样进行排查？6.dll文件是什么意思，有什么用？DLL劫持原理7.0day漏洞8.Rootkit是什么意思9.蜜罐10.ssh11.DDOS12.震网病毒：13.一句话木马14.Https的作用15.手工查找后门木马的小技巧16.描述O
数据结构知识点 *TQK* 编程语言知识点数据结构算法
【1】栈（stack）C++标准库提供了std::stack模板类，用于实现栈的功能。std::stack是基于其他容器（如std::vector、std::deque或std::list）实现的适配器类。std::stack可以使用不同的底层容器来实现，如std::vector、std::deque或std::list。默认情况下，std::stack使用std::deque作为底层容器，但你可
Maven 知识点总结技术人Q java maven
文章目录核心点：Maven能做什么？Maven的安装1、安装2、配置文件Maven的概念1、坐标：通过坐标唯一定位2、scope依赖范围3、maven的传递性依赖性质4、optional可选依赖5、exclusion排除依赖6、properties归类依赖7、优化依赖Maven基本使用1、常用命令仓库1、Maven仓库2、仓库的分类3、本地仓库4、远程仓库5、如何配置指定远程仓库6、如何通过用户名
如何最小改变架构，快速实现流控的？（第34讲） 58沈剑架构
《架构师之路：架构设计中的100个知识点》34.快速流控传统架构，为何不是默认流控的？站点与服务，服务与服务上下游之间，一般如何采用两种通讯模式：其一，RPC直接调用。其二，MQ推送模式。画外音：这也是MQ的默认模式。这两种模式，都可能造成流量冲击：流量从端到站点，到服务，到数据库，流量会一路透传下来，引发雪崩。举个秒杀业务的栗子。1.上游：端上发起抢购操作；2.下游：完成秒杀业务逻辑（库存检查，
Maven常见知识点一五三微月知识点 Maven Java 程序员面试
一、Maven有哪些优点和缺点优点如下：简化了项目依赖管理：易于上手，对于新手可能一个"mvncleanpackage"命令就可能满足他的工作便于与持续集成工具（jenkins）整合便于项目升级，无论是项目本身升级还是项目使用的依赖升级。有助于多模块项目的开发，一个模块开发好后，发布到仓库，依赖该模块时可以直接从仓库更新，而不用自己去编译。maven有很多插件，便于功能扩展，比如生产站点，自动发布
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST