鸭梨山大哎

大数据面试题总结

一美团

自我介绍一下？
介绍一下最近的项目？
目前在研究什么技术？
如何判定一个表是事实表还是维度表？
维度表示你要对数据进行分析时所用的一个量, 比如你要分析产品销售情况, 你可以选择按类别来进行分析,或按区域来分析. 这样的按…分析就构成一个维度。前面的示例就可以有两个维度：类型和区域。另外每个维度还可以有子维度（称为属性），例如类别可以有子类型，产品名等属性。下面是两个常见的维度表结构：

产品维度表：Prod_id, Product_Name, Category, Color, Size,Price 
时间维度表：TimeKey, Season, Year, Month, Date

而事实表是数据聚合后依据某个维度生成的结果表。它的结构示例如下：

销售事实表：Prod_id(引用产品维度表), TimeKey(引用时间维度表), SalesAmount(销售总量，以货币计), Unit(销售量)

上面的这些表就是存在于数据仓库中的。从这里可以看出它有几个特点：

维度表的冗余很大，主要是因为维度一般不大(相对于事实表来说的)，而维度表的冗余可以使事实表节省很多空间。

事实表一般都很大，如果以普通方式查询的话，得到结果一般发的时间都不是我们可以接受的。所以它一般要进行一些特殊处理。如SQL Server 2005就会对事实表进行如预生成处理等。

维度表的主键一般都取整型值的标志列类型，这样也是为了节省事实表的存储空间。

数据建模过程说一下？
三范式知道吗，说一下？
数据仓库模型建设可以使用范式建模吗，你是怎么看的？
缓慢变化维处理方式？
大宽表的优点与缺点？
拉链表的实现逻辑说一下？
Mapreduce执行流程说一下？
Shulffle过程瓶颈在哪里，你会怎么解决？
你刚说到会有小文件和数据倾斜，这个怎么处理？
空值key加随机数是一种数据倾斜解决方案，如果有单个key是热点值呢？又如果有多个key是热点值呢？用参数和代码分别怎么解决？
Kylin调优？
Kylin的优点和缺点？
Kylin的rowkey如何设计？
Kylin的cuboid,cube和segment的关系？
一张hive宽表有5个维度，kylin构建cube的时候我选了4个维度，我select *的时候会有几个维度字段？
其他olap工具有了解过吗？
Flink savepoint和checkpoint？
Flink算子记得哪些？
Flink map和flatmap比较？
flink双流join说一下?
flink两段提交原理说一下?
你们数仓用的是hive还是spark，你平常怎么选择？
Hive优化说一下
用你最熟悉的编程语言(java,python,scala)写一个二分查找(牛客网在线写)
订单表，t_order, 字段，user_id，order_id，ctime(10位时间戳)，city_id，sale_num，sku_id(商品)
问题:20201201至今每日订单量top10的城市及其订单量(订单量对order_id去重)(在线写)
你有什么想问我的吗？

二网易

你为什么想换工作？
你最近的项目是做了什么？
你觉得这个项目你们遇到的最大的挑战是什么？
你们开发规范是怎样的？
你们公司有哪些主题？
日志采集有没做过？
流量域一般怎么做？
路径分析怎么做？
如果你的代码运行很慢，你会怎么开始排查？
你们数据量大概有多大？
你还有什么想问我的吗？

三网易

spring AOP应用场景
分布式锁的几种实现方式
一个文件只有一行，但是这行有100G大小，mr会不会切分，我们应该怎么解决
hdfs HA机制，一台namenode宕机了，joualnode，namenode，edit.log fsimage的变化
你们数仓怎么分层的以及各层主要做了什么
你们主题是怎么划分的，举个例子
如何判断一个模型的好坏
rowkey一般如何设计，你项目中是如何设计的
你们需求的开发流程是什么样的
kylin熟吗？kylin你一般怎么调优
两个数 a=3,b=5,如何不使用中间变量不使用函数的情况下调换他们
hive开发过程中，你一般会怎么调优
hive的执行计划有看过吗，你一般会关注哪几个点
hive底层运行mr或者spark程序的时候语法树说一下
ETL过程中，你们数据质量是怎么保证的
datax源码有没有看过
用phenix和es作为hbase二级索引的区别，最新的hbase已经支持二级索引了，你清楚吗？
你有什么问题想问我吗

四美团

开场问项目情况，叙述一遍做过的项目。
项目是否搭建数仓？（我做的是银行数仓，但是当时懵了，一直说做的数据集市）
主题域是怎么划分的？
脏数据怎么处理？
举例：客户等级这个属性是怎么加工的？比如金卡、银卡等，怎么划分？（个人感觉是面试官想要问我明细层数据是怎么处理的，而我理解成具体的这件事，这件事没啥划分的。。。银行怎么定义我们就怎么取）
怎么进行数据建模？存款、贷款等业务。
hive的优化
mapreduce的具体流程
mr中join操作的具体原理
数据倾斜的处理方式
有没有用过udf函数，自定义函数分为几种？
怎么从一个字符串中把数字拆出来？
hbase有了解吗，原理是什么。hbase的优化怎么做
spark的原理和优化
spark和mr的区别
mysql中B树和B+树的原理和区别
java的快排算法实现
kylin的原理和优化。
为什么kylin的维度不建议过多
实时数据是否有了解，过程是什么
三范式
星型建模和雪花建模的区别
mysql事务锁有几种，分别是什么
storm是否有了解
如何计算新用户和老用户？
sql题：给定一个表temp,字段是 user_id,clo1,col2…col12 12各字段代表12个月电费，求最终结果展现:user_id,month,money

五微店

数据模型如何构建的，星型、雪花、星座的区别和工作中如何使用；
如何优化整个数仓的执行时长，比如7点所有任务跑完，如何优化到5点；
数据倾斜，遇到哪些倾斜，怎么发现的？怎么处理的？；
如何保证数据质量；
如何保证指标一致性；
了解onedata吗，说说你的理解；
数据漂移如何解决；
实时场景如何解决的；

9、拉链表如何设计，拉链表出现数据回滚的需求怎么解决。

六阿里

自我介绍；
平台选型依据；
数仓分层、模型、每层都是做什么的？为什么这么做？
交叉维度的解决方案？
数据质量如何保证（DQC）？
任务延迟如何优化（SLA）？
聊一下数据资产。
spark streaming如何保证7*24小时运行机制？
spark streaming是Exactly-Once吗？
如果让你设计实时数仓你会如何设计，为什么？
聊聊hive的执行引擎，spark和mr的区别？
hive的jion底层mr是如何实现的？
指标如何定义？
sql问题：连续活跃n天用户的获取；数据倾斜的sql如何优化；数据量大的sql如何优化？
你有什么问我的吗？

七蚂蚁

和一面一样自我介绍；
因为简历上写有大数据平台选型，所以问选型的依据，不同大数据平台的优缺点；
数据仓库主题的划分，参考Teradata的LDM模型；
Kimball和Inmon的相同和不同；
数据质量管理、数据治理有什么好的方案？知识库管理有什么好的思路？血缘关系图。
元数据管理相关问题，集群存储不够了，需要清理不需要的任务和数据该怎么做？
业务库2亿数据入仓的策略，一次全量，之后每次增量；
什么场景会出现数据倾斜，怎么解决？比如select user_id,count(1) from table group by user_id,其中某些user_id的访问量很大，查询不出结果该怎么办？
sql里面on和where有区别吗？
还有一个sql问题，忘掉了；
聊一下技术架构，整个项目每个环节用的什么技术这个样子；
hive、hbase、spark。。。。这些大数据组件，熟悉哪个或者哪些？我说hive和hbase，对方就问hive和hbase的原理，差异等问题；
有没有实时数仓的经验，数据实时入仓思路，canal；
你对当前的项目组有没有什么自己的看法、意见或者需要改进的地方，这个改进对你有没有什么影响
ods的增量能否做成通用的？
公共层和数据集市层的区别和特点？
用mr实现用户pv的top10？
map输入数据，将数据转换成（用户，访问次数）的键值对，然后reduce端实现聚合，并且将结果写入用户、访问次数的实体类，并且实现排序，最后的结果做一个top10的筛选
sql问题，连续几天活跃的用户？
使用row number排序，然后时间-排序字段，减的结果分组，相同的就是连续的
从原理上说一下mpp和mr的区别
对了中间还有问数仓数据的输出主要是哪些还有数仓的分层；

八蚂蚁

两轮技术面、一轮人事面
手写sql问题：连续活跃…
left semi join和left join区别；
维度建模和范式建模的区别；
埋点的码表如何设计；
数据倾斜（hive+spark）；
group by为什么要排序；
集市层和公共层的区别；
缓慢变化维的处理方式；
boss问了jvm、堆栈；
说说印象最深的一次优化场景，hive常见的优化思路；
数据质量相关；
说说你从0-1搭建数仓都做了什么？你觉得最有挑战的是什么？
你有什么问题问我。

九蚂蚁
SQL笔试题

题目1

背景说明：

以下表记录了用户每天的蚂蚁森林低碳生活领取的记录流水。

table_name：user_low_carbon

seq（key） user_id data_dt low_carbon

流水号用户日期减少碳排放（g）

xxxxx01 u_001 2017/1/1 10

xxxxx02 u_001 2017/1/2 150

xxxxx03 u_001 2017/1/2 110

xxxxx04 u_001 2017/1/2 10

xxxxx05 u_001 2017/1/4 50

xxxxx06 u_001 2017/1/4 10

xxxxx07 u_001 2017/1/6 45

xxxxx08 u_001 2017/1/6 90

xxxxx09 u_002 2017/1/1 10

xxxxx10 u_002 2017/1/2 150

xxxxx11 u_002 2017/1/2 70

xxxxx12 u_002 2017/1/3 30

xxxxx13 u_002 2017/1/3 80

xxxxx14 u_002 2017/1/4 150

xxxxx14 u_002 2017/1/5 101

xxxxx15 u_002 2017/1/6 68

xxxxx16 u_002 2017/1/6 120

蚂蚁森林植物换购表，用于记录申领环保植物所需要减少的碳排放量

table_name: plant_carbon

plant_id plant_name low_carbon

植物编号植物名换购植物所需要的碳

p001 梭梭树 17900

p002 沙柳 19680

p003 樟子树 146210

p004 胡杨 215680

1、蚂蚁森林植物申领统计

问题：假设2017年1月1日开始记录低碳数据（user_low_carbon），假设2017年10月1日之前满足申领条件的用户都申领了一颗p004-胡杨，剩余的能量全部用来领取“p002-沙柳” 。

统计在10月1日累计申领“p002-沙柳” 排名前10的用户信息；以及他比后一名多领了几颗沙柳（加分选项，可不做）。

得到的统计结果如下表样式：

user_id plant_count less_count(比后一名多领了几颗沙柳)

u_101 1000 100

u_088 900 400

u_103 500 …

2、蚂蚁森林低碳用户排名分析

问题：查询user_low_carbon表中每日流水记录，条件为：用户在2017年，连续三天（或以上）的天数里，每天减少碳排放（low_carbon）都超过100g的用户低碳流水。

需要查询返回满足以上条件的user_low_carbon表中的记录流水。例如用户u_002符合条件的记录如下，因为2017/1/2~2017/1/5连续四天的碳排放量之和都大于等于100g：

seq（key） user_id data_dt low_carbon

xxxxx10 u_002 2017/1/2 150

xxxxx11 u_002 2017/1/2 70

xxxxx12 u_002 2017/1/3 30

xxxxx13 u_002 2017/1/3 80

xxxxx14 u_002 2017/1/4 150

xxxxx14 u_002 2017/1/5 101

题目2

学校的期末考试结束后，考试成绩被存储在一张表中TableA中，包含信息：sn(学号）, sourse(课程)，score(成绩)。班主任想做如下统计：

1、统计每个学生的总分，排名，当前排名与下一名次总分差（如：第n名总分-第n+1名总分，即为分差）；

2、统计英语（sourse=ENG）挂科（score<60)，但是总分排名进入前20%的学生名单以及他们的总分成绩；

3、统计至少两门科目满分（score=100)的同学中，总分排名第二的学生的学号；

题目3

计算90分位。有10000个用户，每个用户有user_id，和不同的交易量trd_cnt。

求：按照交易量从大到小排序，选出最少的、能占总体交易量90%的用户id（这些用户交易量占整体交易量的90%）。

十蚂蚁

设计并实现一个简易的缓存框架，要求支持并发的读写和LRU缓存淘汰算法，并考虑性能
编写一个程序，开启3个线程，

这3个线程的ID分别为A、B、C，3个线程交替打印1-100的整数，要求输出结果有序,

样例Sample:

Thread1: 1

Thread2: 2

Thread3: 3

Thread1: 4

Thread2: 5

Thread3: 6

…

Thread3: 99

Thread1: 100

遍历一个二叉树，打印出该路径中每个节点数字的和与给定目标值一致的有效路径。

有效路径：从根节点到叶节点的路径。

给定一个二叉树 :

 1

/ \

2 4

/ \

2 3

目标值= 5时返回结果：

1 2 2

1 4

使用两个栈来实现队列的一些操作。

队列应支持push(element)，pop() 和 top()，其中pop是弹出队列中的第一个(最前面的)元素。

pop和top方法都应该返回第一个元素的值。

样例：比如push(1), pop(), push(2), push(3), top(), pop()，你应该返回1，2和2

要求：仅使用两个栈来实现它，不使用任何其他数据结构，push，pop 和 top的复杂度都应该是均摊O(1)的

比较一个源字符串和一个目标字符串，

如果在源字符串中包含目标字符串全部字符，输出所包含的第一个最小子串；

如果不存在，输出空。

：样例

source = “BPDAUNZHGAHSIWBADNC”，target = “BDN” 满足要求的解 “BADN”

要求：时间复杂度为O(n^2)

十一贝壳
1、你们这边数据量有多少呢，就是从ods到ads层一共多少数据量？

2、拉链表如果有一天的数据错了，比如说到12月15号，但是发现11月10号拉链的数据错了，导致后续拉链的结果都错了，这个应该怎么修正

拉链表的回滚问题，网上找答案

3、Parquet和Orc和Rc的比较？

4、列式存储是什么？行数比较大的情况，比如说上亿，那么列式存储是怎么做的？列式存储是为了解决什么问题？

5、dwd层有多少张表，每张表多少数据量

6、null值怎么打散，打散的伪代码或者sql

使用concat，split

7、如果一张表的某个字段作为join的字段，但是这个字段有倾斜的非常厉害，比如性别这个字段，有男1000万个，女5万，这时候数据倾斜如何解决？

8、一个SQL在MR中经过哪些过程，比如说

select a.id, b.id

from a

join b

on a.id = b.id

在MR中是怎么join的，left join在MR中是怎么实现的？

9、Kylin的构建过程是怎么样的

10、Kylin维度优化有几种类型

比如说强制维度，层级维度

11、Kylin的构建算法

逐层构建，快速构建

12、HBase的Rowkey优化

有多个维度，怎么设计Rowkey才能查询的快（就是维度要体现到Rowkey的设计里面）

比如有如下维度

year

month

day

省

市

事业部

大区

分行

工号

RowKey应该怎么排序呢，我把什么放在前面，有什么通用的原则吗，这样设计之查询速度能快呢？

十二字节

sparkstreaming的书写结构
rdd、ck、cache
topn的具体步骤
怎么可以实现在一小时topn的固定窗口情况下，0-10、0-20也会有结果的显示
架构？
怎样建模？
一天多少任务，多少表
什么技术进行存储
内外部表的区别、优缺点
数据存在hdfs上回有压缩吗？有什么优缺点？
hdfs为什么会比较厌恶小文件
数据源是来自于哪里
flume会不会丢数据
数据倾斜问题
二次聚合对uv的话有没有什么问题
二面：
数仓的搭建
分工角色
分层怎么分的
sqoop怎么解决数据变动的问题
维度退化具体的内容
每天的数据量
你们有主题的概念吗？
主题的划分原则
7日的留存率怎么求？
有一些任务需要回溯，就是比如说历史时间需要重新执行，有遇到这种情况吗？
核心指标都有哪些？
怎么保证每天能在固定的时间数据产出？
数仓建模的方式？
模型的选取？
stage的划分依据？
shuffle什么原因引起的？
哪一些算子会引起shuffle？
怎么识别抖音种的大学生用户？用什么数据识别

十三虾皮

什么RDD可以用repartition？
coaldesce shuffle为true
flume断点续传多久保留一次offset
整个flume有使用高可用吗？怎么配置高可用？
对kafka有一定了解吗？
能大致说一下kafka的写流程吗？
ack的情况
kafka的最终文件夹存储方式是什么样子的？
kafka为什么可以快速根据分区和offset找到我们的数据记录？
索引文件中是怎么记录这些消息的？
消费者组的概念怎么理解？
kafka的选举机制？
azkaban怎么调度的？
hive做过哪些参数的优化？
mapjoin有什么缺点？
分桶表分区表区别？各自的优点？
大表join分桶的原因？
join的时候依照哪一个关键字？对字段有没有限制？
怎么把表分桶的？join的时候分桶的key不同怎么办？
数据倾斜怎么解决？distinct数据倾斜怎么办？
sparkstreaming的ck有什么好处？
ck、persist、cache分别有什么区别？
怎么定义算子是转换算子还是行动算子？（怎么知道这个算子是行动算子？）
有状态缓存的算子？
怎么实时查看用户访问数？这种实时变动的需求怎么实现？
flink的ck了解吗？可以说一下大致流程吗？
如果有多个barrier对齐时，有一两个一直没到该怎么处理？有没有情况下不进行等待对齐？
窗口和wm的关系
窗口的状态数据什么时候清楚？
HDFS中datanode之间怎么保证备份数量的同步？
2NN的作用？高可用中的standby namenode的作用？
怎么进行故障转移的?

十四字节

编程算法题：

a. 将字符串进行编码，如aabbcc编码成a_2_b_2_c_2；b. 将输入的UNIX路径格式化，如/a/b/./…/c，格式化为/a/c

建立数据仓库的一般流程，你的思路是什么；
写hive sql题，以及进行hive sql优化的思路；
对spark/spark streaming的原理了解，以及优化的思路；
对项目相关的一些问题；

数据清洗做过没？

离线方面碰到什么困难

数据倾斜怎么优化

spark的数据倾斜

小文件优化的原理

Spark的源码，例如：框架层面、算子具体实现

Spark什么时候用到内存，什么用到磁盘

算子collect分为

Spark堆内内存和堆外内存的区别，什么时候用到堆内，什么时候用到堆外

堆内内存

堆内内存的大小，由 Spark 应用程序启动时的 –executor-memory 或 spark.executor.memory 参数配置。Executor 内运行的并发任务共享 JVM 堆内内存，这些任务在缓存 RDD 数据和广播（Broadcast）数据时占用的内存被规划为存储（Storage???，而这些任务在执行 Shuffle 时占用的内存被规划为执行（Execution）内存，剩余的部分不做特殊规划，那些 Spark 内部的对象实例，或者用户定义的 Spark 应用程序中的对象实例，均占用剩余的空间。不同的管理模式下，这三部分占用的空间大小各不相同。

堆外内存

为了进一步优化内存的使用以及提高 Shuffle 时排序的效率，Spark 引入了堆外（Off-heap）内存，使之可以直接在工作节点的系统内存中开辟空间，存储经过序列化的二进制数据。

堆外内存意味着把内存对象分配在Java虚拟机的堆以外的内存，这些内存直接受操作系统管理（而不是虚拟机）。这样做的结果就是能保持一个较小的堆，以减少垃圾收集对应用的影响。

2张大表，超过几百G，join优化，按照什么条件区分区

1.对RDD进行repartition重分区

先依据Executor数和内存情况估算出对RDD分为多少个partition比较合适，因为一个partition对应一个task，会分发给一个Executor的core去执行运算操作。

所以首先对RDD进行重分区，将数据打散。

2.采用mapPartition算子，一次性处理一个分区的数据

在这一步进行group by操作，将相同key的value值进行加和

reduceByKey算子，对不同的key进行聚合

经过上面的重分区，以及预聚合（group by，func加和），此时reduce端的计算压力就小了很多

归并排序，将2个数组合并到一个数组，并排好序

十五丰巢
第一面是技术人员面:一般就对着你的简历问,挨着问,实时方面比较关心Flink,他们实时就用Flink,spark基本没问有点难,但是面试小哥人很好,不懂可以请教,现场教学

1.JVM原理,GC回收机制,hashMap底层原理

2.hadoop的组件,各自的作用,SecondNode的作用

3.es的倒排索引原理

4.看过什么框架的源码,选取一个简单讲解一下 (我讲的MR,我感觉他更想听Flink)

5.Flink有哪些窗口,介绍一下区别?会话窗口关闭是什么控制得(我不会,他说是nameSpace,源码里展示了的)

6.flink的提交方式?(一脸懵逼,我说的是打jar包上传,打jar包之后给运维上线,然后用指令进行提交,

他给我分享的是丰巢已经做了自己的Flink提交平台,虽然还不完善,但是一些基本的功能都能实现了,比如说提交,我直呼贵公司nb)

7.Flink的编程模型

8.Flink的状态有了解吗?有哪些?

9.Kafka读数据的原理(二分法的那个 )

10.scala的尾递归知道吗?(一脸懵逼)

十六 vivo

自我介绍
数仓为什么是五层？(简历上写五层)
dwd,dws,dwt之间有什么区别？
dwd的表是全量的吗？为什么？
有一个订单表记录，根据你的数仓结构，说说怎么求出用户最近7天的最后一次下单记录？
hive去重的几种方法？
为什么要升级成Flink？(简历上写的)
为什么Flink可以处理乱序，给了个关注和取消的场景，问你如何实现最终一致性问题！
说说SparkStreaming和Flink的区别？
说说Flink的精准一次性！
开始我提问

总结：该面试官属于我回答什么就问什么类型，且行且珍惜

十七华为
1.Flink的指标

2.Flink怎么对接ES

自带的，创建ES对象，addSink(ES对象）

3.Flink遇到的问题

a：运行一段时间后发觉报错

报错信息： Size of the state is larger than the maximum permitted memory-backed state. Size=7061809 , maxSize=5242880 . Consider using a different state backend, like the File System State backend.

然后就修改了状态后端：为FS

b：长时间运行后，多次重启

报错信息：Could not materialize checkpoint

通过查询HDFS的日志后发现是路径配置错误了

错误的配置



  dfs.namenode.name.dir

  /mnt/hadoop/dfs/name

正确的配置



  dfs.namenode.name.dir

  file:/mnt/hadoop/dfs/name

c:背压问题

产生背压的时候常常出现在热门活动中，短时间内流量陡增导致数据的堆积，系统整体的吞吐量无法提升。

ss和flink的区别：

Spark Streaming 在原有的架构上加入了一个 RateController，利用的算法是 PID，需要的反馈数据是任务处理的结束时间、调度时间、处理时间、消息条数，这些数据是通过 SparkListener 体系获得，然后通过 PIDRateEsimator 的 compute 计算得到一个速率，进而可以计算得到一个 offset，然后跟限速设置最大消费条数比较得到一个最终要消费的消息最大 offset。

Flink 背压是 jobmanager 针对每一个 task 每 50ms 触发 100 次 Thread.getStackTrace() 调用，求出阻塞的占比

4.使用ES遇到的瓶颈

5.Mysql的索引结构和同步机制

同步机制原理：

主库开启binary log，开启后每一次操作更新、修改、删除等都会记录在案，所以从库的同步过程其实就是获得这些过程，然后将现场还原，就达到了数据同步的目的。

Slave的线程分成两个线程，一个做binlogs的同步(我们称为IO线程)，一个做还原现场的工作(我们称为SQL线程)

索引结构b+树：平衡多叉数，有索引页和叶子页，B+数的高度一般2-4层，只有叶子节点有数据，其他的都是索引，（快，小）

B+树索引可以分为聚集索引和辅助索引。

聚集索引就是按照每一张表的主键构造一颗B+树，同时叶子节点中存放的即为整张表的行记录数据，也将聚集索引的叶子节点称为数据页。聚集索引的这个特征决定了索引组织表中的数据是索引的一部分。同B+树的数据结构一样，每个数据页都是通过一个双向链表来进行链接的。

由于实际的数据页只能按照一棵B+树的进行排序，因此每张表只能拥有一个聚集索引。

事务：原子性一致性持久性隔离性

隔离级别：读未提交，读已提交，可重复读，串行化四个！默认是可重复读

二、事务的并发问题

1、脏读：事务A读取了事务B更新的数据，然后B回滚操作，那么A读取到的数据是脏数据

2、不可重复读：事务 A 多次读取同一数据，事务 B 在事务A多次读取的过程中，对数据作了更新并提交，导致事务A多次读取同一数据时，结果不一致。

3、幻读：系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级，但是系统管理员B就在这个时候插入了一条具体分数的记录，当系统管理员A改结束后发现还有一条记录没有改过来，就好像发生了幻觉一样，这就叫幻读。

6.JVM的内存模型

方法区：常量池，字节码

堆：初始化对象，成员变量，数组

栈：由栈帧，调用方法就压栈，8大基本数据类型

本地方法栈：主要为Native方法服务

程序计数器：记录当前线程执行的行号

7.新生代GC什么时候触发

新生代内存不够用时候发生 MGC 也叫 YGC，JVM 内存不够的时候发生 FGC

8.新生代交换区？？？

9.谈谈java设计模式

10.多线程下单例模式的实现

饿汉天生线程安全

懒汉双null volatile singleton 和 syn（singleton3）

11.StackOverflowError和OutofMemoryError出现场景及怎么解决

递归->迭代尾递归 | 数据倾斜->hash打乱二次聚合

12.说说Zookeeper的Pzxos算法

Paxos：

是一致性算法，然后没了

13.谈谈你知道的分布式缓存算法

LRU

14.一天可以搭建flink集群并且把业务迁移过去么

给钱就做

十八袋鼠云

Flink的join相关的源码你看过吗？
CheckPoint源码和算法有了解过吗？
Yarn的源码和参数配置相关的源码细节你知道吗？
Flink On Yarn 之后 Yarn 会发生什么变化，源码里面的细节你知道吗？
Flink中状态相关的源码你知道吗？比如可以修改状态大小，取出状态的值进行修改，再放回去，等其他状态相关的操作？
Flink的为算子提供的状态的源码你看过吗？
kafka分区数和Flink的并行度关系，这方面的源码你看过吗？

你可能感兴趣的:(面试,面试,大数据)

python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
Day_11 ROC_bird.. 算法
面试题16.15.珠玑妙算-力扣（LeetCode）/***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*///下标和对应位置的值都一样，answer[0]+1,对应位置的值猜对了，但是下标不对，answer[1]+1int*masterMind(char*solution,char*guess,int*returnSiz
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Java -jar 如何在后台运行项目 vincent_hahaha
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>说到运行jar包通常我们都会以下面的方式运行:java-jarspringboot-0.0.1-SNAPSHOT.jar这样运行的话会有一个问题，就是我们一关闭当前窗口就会停止运行项目，要想解决这个问题，就需要在后台运行。nohupjava-jarbabyshark-0.0.1-SNAPSHOT.jar >log.file 2>&
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
【Kubernetes】常见面试题汇总（十一） summer.335 Kubernetes kubernetes 容器云原生
目录33.简述Kubernetes外部如何访问集群内的服务？34.简述Kubernetesingress？35.简述Kubernetes镜像的下载策略？33.简述Kubernetes外部如何访问集群内的服务？（1）对于Kubernetes，集群外的客户端默认情况，无法通过Pod的IP地址或者Service的虚拟IP地址：虚拟端口号进行访问。（2）通常可以通过以下方式进行访问Kubernetes集群
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
华雁智科前端面试题因为奋斗超太帅啦前端笔试面试问题整理 javascript 开发语言 ecmascript
1.var变量的提升题目：vara=1functionfun(){console.log(b)varb=2}fun()console.log(a)正确输出结果：undefined、1答错了，给一个大嘴巴子，错误答案输出结果为：2,1此题主要考察var定义的变量，作用域提升的问题，相当于varaa=1functionfun(){varbconsole.log(b)b=2}fun()console.l
保研日记--哈工大威海计算机学院 faaarii 保研
传送门保研日记--中国海洋大学计算机系保研日记--中国人民大学信息学院（人大信院）保研日记--北京交通大学计算机学院保研材料模板（自我介绍，个人简历，个人陈述，推荐信）哈工大威海计算机学院这次夏令营给我的感觉非常的朴素，哈哈哈哈营员就有四个群，985/211、双一流、双非、四非？？没有宣讲会、见面会，在面试开始之前放了一个简短的宣传片。（傲娇，绝对不整那些花里胡哨的哈哈哈）面试有三组老师，分别问你
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
自动化测试工程师面试，常问的问题有哪些？自动化测试老司机软件测试测试工程师自动化测试面试职场和发展软件测试 selenium 测试工具 android 测试工程师
自动化测试工程师面试是非常重要的环节，面试官会通过一系列的问题来评估候选人的技能和经验。下面是一些常见的问题，以及如何详细而规范地回答这些问题的建议。1.请介绍一下你的自动化测试经验。回答这个问题时，可以从项目经验、使用的自动化测试工具、编写的测试脚本等方面来介绍自己的经验。重点强调你在自动化测试领域的技能和擅长的领域。2.你在自动化测试中使用的编程语言是什么？为什么选择这种语言？回答这个问题时，
中年女人的危机南溪_e428
今天看了篇文章，就是说女人过了四十，还要换工作吗？确实是现实，有很多的单位公司在面试的时候，都会问你有几个孩子，还会打算生二胎吗？有的还会直接要求你说，希望入职的最近一年里，不要生孩子，单位也有单位的难处啊！尽管说，面试官也同样会是女人，这个话题是不可避免的啊！后来有的单位就变得聪明了，不在招收年龄偏大的员工，一般都是招年龄相对小的，而且还是以男性员工为主的，除非没办法才会招极个别的女工，这就是现
前端CSS面试常见题剑亦未配妥前端面试前端 css 面试
边界塌陷盒模型有两种：W3C盒模型和IE盒模型，区别在于宽度是否包含边框定义：同时给兄弟/父子盒模型设置上下边距，理论上边距值是两者之和，实际上不是注意：浮动和定位不会产生边界塌陷；只有块级元素垂直方向才会产生margin合并margin计算方案margin同为正负：取绝对值大的值一正一负：求和父子元素边界塌陷解决父元素可以通过调整padding处理；设置overflowhidden，触发BFC子
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl