react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考

本期作者盛鑫晶(大圣) 开课吧Web专家讲师/前百度和360前端架构师，8年前端开发经验，精通Vue/React、源码架构、小程序、移动端和Nodejs整个前端技术栈，对前端萌新如何快速进阶有丰富的经验，业内少有既精通技术又精通授课的大咖。前几天看到一个文章，感触很深： 《字节跳动面试官：请你实现一个大文件上传和断点续传》 | 原作者：yeyan1996 | 原链接：https://url.cn/5h66afn 作者从0实现了大文件的切片上传，断点续传，秒传，暂停等功能，深入浅出的把这个面试题进行了全面的剖析。彩虹屁不多吹，我决定蹭蹭热点，录录视频，把作者完整写代码的过程加进去，并且接着这篇文章写，所以请看完上面的文章后再食用，我做了一些扩展如下: 作者从0实现了大文件的切片上传，断点续传，秒传，暂停等功能，深入浅出的把这个面试题进行了全面的剖析。彩虹屁不多吹，我决定蹭蹭热点，录录视频，把作者完整写代码的过程加进去，并且接着这篇文章写，所以 请看完上面的文章后再食用 ，我做了一些扩展如下:

「1」计算 hash耗时的问题，不仅可以通过 web-workder，还可以参考 React的 FFiber架构，通过requestIdleCallback来利用浏览器的空闲时间计算，也不会卡死主线程。

「2」文件 hash的计算，是为了判断文件是否存在，进而实现秒传的功能，所以我们可以参考布隆过滤器的理念, 牺牲一点点的识别率来换取时间，比如我们可以抽样算hash

「3」文中通过 web-workder让 hash计算不卡顿主线程，但是大文件由于切片过多，过多的 HTTP链接过去，也会把浏览器打挂 (我试了4个G的，直接卡死了)，我们可以通过控制异步请求的并发数来解决，我记得这也是头条的一个面试题。

「4」每个切片的上传进度不需要用表格来显示，我们换成方块进度条更直观一些(如图)。

「5」并发上传中，报错如何重试，比如每个切片我们允许重试两次，三次再终止。

「6」由于文件大小不一，我们每个切片的大小设置成固定的也有点略显笨拙，我们可以参考TCP协议的慢启动策略，设置一个初始大小，根据上传任务完成的时候，来动态调整下一个切片的大小，确保文件切片的大小和当前网速匹配。

「7」小的体验优化，比如上传的时候。

「8」文件碎片清理。

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第2张图片

已经存在的秒传的切片就是绿的，正在上传的是蓝色的，并发量是4，废话不多说，我们一起代码开花。

01 时间切片计算文件hash

其实就是 time-slice 概念， React 中 Fiber 架构的核心理念，利用浏览器的空闲时间，计算大的diff过程，中途有任何的高优先级任务，比如动画和输入，都会中断diff任务，虽然整个计算量没有减小，但是大大提高了用户的交互体验。这可能是最通俗的 React Fiber(时间分片) 打开方式。(https://juejin.im/post/5dadc6045188255a270a0f85)

window.requestIdleCallback()方法将在浏览器的空闲时段内调用的函数排队。这使开发者能够在主事件循环上执行后台和低优先级工作 requestIdelCallback执行的方法，会传递一个 deadline参数，能够知道当前帧的剩余时间，用法如下：

requestIdelCallback(myNonEssentialWork);

function myNonEssentialWork (deadline) {

// deadline.timeRemaining()可以获取到当前帧剩余时间

// 当前帧还有时间并且任务队列不为空

while(deadline.timeRemaining() > 0&& tasks.length > 0) {

doWorkIfNeeded();

}

if(tasks.length > 0){

requestIdleCallback(myNonEssentialWork);

}

deadline的结构如下：

interfaceDealine{

didTimeout: boolean// 表示任务执行是否超过约定时间

timeRemaining(): DOMHighResTimeStamp// 任务可供执行的剩余时间

}

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第4张图片

该图中的两个帧，在每一帧内部， TASK 和 redering 只花费了一部分时间，并没有占据整个帧，那么这个时候，如图中 idle period 的部分就是空闲时间，而每一帧中的空闲时间，根据该帧中处理事情的多少，复杂度等，消耗不等，所以空闲时间也不等。而对于每一个 deadline.timeRemaining() 的返回值，就是如图中， IdleCallback 到所在帧结尾的时间(ms级)。我们接着之前文章的代码，改造一下 calculateHash

async calculateHashIdle(chunks) {

returnnewPromise(resolve => {

const spark = newSparkMD5.ArrayBuffer();

let count = 0;

// 根据文件内容追加计算

const appendToSpark = async file => {

returnnewPromise(resolve => {

const reader = newFileReader();

reader.readAsArrayBuffer(file);

reader.onload = e => {

spark.append(e.target.result);

resolve();

};

});

};

const workLoop = async deadline => {

// 有任务，并且当前帧还没结束

while(count < chunks.length && deadline.timeRemaining() > 1) {

await appendToSpark(chunks[count].file);

count++;

// 没有了计算完毕

if(count < chunks.length) {

// 计算中

this.hashProgress = Number(

((100* count) / chunks.length).toFixed(2)

);

// console.log(this.hashProgress)

} else{

// 计算完毕

this.hashProgress = 100;

resolve(spark.end());

}

window.requestIdleCallback(workLoop);

};

window.requestIdleCallback(workLoop);

});

},

计算过程中，页面放个输入框，输入无压力，时间切片的威力。

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第5张图片

上图是 React15和 Fiber架构的对比，可以看出下图任务量没变，但是变得零散了，不混卡顿主线程。

02 抽样hash

计算文件 md5值的作用，无非就是为了判定文件是否存在，我们可以考虑设计一个抽样的 hash，牺牲一些命中率的同时，提升效率，设计思路如下：

「1」文件切成2M的切片。 「2」第一个和最后一个切片全部内容，其他切片的取首中尾三个地方各2个字节。 「3」合并后的内容，计算 md5，称之为 影分身Hash 「4」这个 hash的结果，就是文件存在，有小概率误判，但是如果不存在，是100%准的的，和布隆过滤器的思路有些相似，可以考虑两个 hash配合使用。 「5」我在自己电脑上试了下1.5G的文件，全量大概要20秒，抽样大概1秒还是很不错的，可以先用来判断文件是不是不存在。 「6」我真是个小机灵。

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第6张图片

抽样md5:

1028.006103515625ms

全量md5: 21745.13916015625ms

async calculateHashSample() {

returnnewPromise(resolve => {

const spark = newSparkMD5.ArrayBuffer();

const reader = newFileReader();

const file = this.container.file;

// 文件大小

const size = this.container.file.size;

let offset = 2* 1024* 1024;

let chunks = [file.slice(0, offset)];

// 前面100K

let cur = offset;

while(cur < size) {

// 最后一块全部加进来

if(cur + offset >= size) {

chunks.push(file.slice(cur, cur + offset));

} else{

// 中间的前中后去两个字节

const mid = cur + offset / 2;

const end = cur + offset;

chunks.push(file.slice(cur, cur + 2));

chunks.push(file.slice(mid, mid + 2));

chunks.push(file.slice(end - 2, end));

}

// 前取两个字节

cur += offset;

}

// 拼接

reader.readAsArrayBuffer(newBlob(chunks));

reader.onload = e => {

spark.append(e.target.result);

resolve(spark.end());

};

});

}

03 网络请求并发控制

大文件 hash计算后，一次发几百个 http请求，计算哈希没卡，结果 TCP建立的过程就把浏览器弄死了，而且我记得本身异步请求并发数的控制，本身就是头条的一个面试题。

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第7张图片

思路其实也不难，就是我们把异步请求放在一个队列里，比如并发数是3，就先同时发起3个请求，然后有请求结束了，再发起下一个请求即可，思路清楚，代码也就呼之欲出了。

我们通过并发数max来管理并发数，发起一个请求 max--，结束一个请求 max++即可。

+async sendRequest(forms, max=4) {

+ returnnewPromise(resolve => {

+ const len = forms.length;

+ let idx = 0;

+ let counter = 0;

+ const start = async()=> {

+ // 有请求，有通道

+ while(idx < len && max > 0) {

+ max--; // 占用通道

+ console.log(idx, "start");

+ const form = forms[idx].form;

+ const index = forms[idx].index;

+ idx++

+ request({

+ url: '/upload',

+ data: form,

+ onProgress: this.createProgresshandler(this.chunks[index]),

+ requestList: this.requestList

+ }).then(() => {

+ max++; // 释放通道

+ counter++;

+ if(counter === len) {

+ resolve();

+ } else{

+ start();

+ }

+ });

+ }

+ start();

+ });

+}

async uploadChunks(uploadedList = []) {

// 这里一起上传，碰见大文件就是灾难

// 没被hash计算打到，被一次性的tcp链接把浏览器搞挂了

// 异步并发控制策略，我记得这个也是头条一个面试题

// 比如并发量控制成4

const list = this.chunks

.filter(chunk => uploadedList.indexOf(chunk.hash) == -1)

.map(({ chunk, hash, index }, i) => {

const form = newFormData();

form.append("chunk", chunk);

form.append("hash", hash);

form.append("filename", this.container.file.name);

form.append("fileHash", this.container.hash);

return{ form, index };

})

- .map(({ form, index }) =>

- request({

- url: "/upload",

- data: form,

- onProgress: this.createProgresshandler(this.chunks[index]),

- requestList: this.requestList

- })

- );

- // 直接全量并发

- awaitPromise.all(list);

// 控制并发

+ const ret = awaitthis.sendRequest(list,4)

if(uploadedList.length + list.length === this.chunks.length) {

// 上传和已经存在之和等于全部的再合并

awaitthis.mergeRequest();

}

},

话说字节跳动另外一个面试题我也做出来的，不知道能不能通过他们的一面。

04 慢启动策略实现

TCP拥塞控制的问题：(https://www.zhihu.com/question/58517416/answer/158142955) 其实就是根据当前网络情况，动态调整切片的大小： 「1」 chunk 中带上 size 值，不过进度条数量不确定了，修改 createFileChunk ，请求加上时间统计) chunk 中带上 size 值，不过进度条数量不确定了，修改 createFileChunk ，请求加上时间统计) 「2」比如我们理想是30秒传递一个。 「3」初始大小定为1M，如果上传花了10秒，那下一个区块大小变成3M。 「4」如果上传花了60秒，那下一个区块大小变成500KB 以此类推。 「5」并发+慢启动的逻辑有些复杂，我自己还没绕明白，囧所以先一次只传一个切片，来演示这个逻辑，新建一个 handleUpload1函数。

async handleUpload1(){

// @todo数据缩放的比率可以更平缓

// @todo 并发+慢启动

// 慢启动上传逻辑

const file = this.container.file

if(!file) return;

this.status = Status.uploading;

const fileSize = file.size

let offset = 1024*1024

let cur = 0

let count =0

this.container.hash = await this.calculateHashSample();

while(cur

// 切割offfset大小

const chunk = file.slice(cur, cur+offset)

cur+=offset

const chunkName = this.container.hash + "-"+ count;

const form = newFormData();

form.append("chunk", chunk);

form.append("hash", chunkName);

form.append("filename", file.name);

form.append("fileHash", this.container.hash);

form.append("size", chunk.size);

let start = newDate().getTime()

await request({ url: '/upload',data: form })

const now = newDate().getTime()

const time = ((now -start)/1000).toFixed(4)

let rate = time/30

// 速率有最大2和最小0.5

if(rate<0.5) rate=0.5

if(rate>2) rate=2

// 新的切片大小等比变化

console.log(`切片${count}大小是${this.format(offset)},耗时${time}秒，是30秒的${rate}倍，修正大小为${this.format(offset/rate)}`)

// 动态调整offset

offset = parseInt(offset/rate)

// if(time)

count++

}

调整下slow 3G网速看下效果：

切片0大小是1024.00KB,耗时13.2770秒，是30秒的0.5倍，修正大小为2.00MB

切片1大小是2.00MB,耗时25.4130秒，是30秒的0.8471倍，修正大小为2.36MB

切片2大小是2.36MB,耗时14.1260秒，是30秒的0.5倍，修正大小为4.72MB

05 进度条优化

这就属于小优化了，方便我们查看存在的文件区块和并发数，灵感来自于硬盘扫描。

class="cube-container" :style="{width:cubeWidth+'px'}">

class="cube"

v-for="chunk in chunks"

:key="chunk.hash">

:class="{

'uploading':chunk.progress>0&&chunk.progress<100,

'success':chunk.progress==100

}"

:style="{height:chunk.progress+'%'}"

>

v-if="chunk.progress>0&&chunk.progress<100" style="color:#F56C6C;">

.cube-container

width 100px

overflow hidden

.cube

width 14px

height 14px

line-height 12px;

border 1px solid black

background #eee

float left

>.success

background #67C23A

>.uploading

background #409EFF

// 方块进度条尽可能的正方形切片的数量平方根向上取整控制进度条的宽度

cubeWidth(){

returnMath.ceil(Math.sqrt(this.chunks.length))*16

},

效果还可以再看一遍?

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考_第8张图片

06 并发重试+报错

「1」请求出错.catch 把任务重新放在队列中。 「2」出错后progress设置为-1 进度条显示红色。 「3」数组存储每个文件hash请求的重试次数，做累加比如 [1,0,2],就是第0个文件切片报错1次，第2个报错2次。 「4」超过3的直接 reject 首先后端模拟报错：

if(Math.random()<0.5){

// 概率报错

console.log('概率报错了')

res.statusCode=500

res.end()

return

}

async sendRequest(urls, max=4) {

- returnnewPromise(resolve => {

+ returnnewPromise((resolve,reject) => {

const len = urls.length;

let idx = 0;

let counter = 0;

+ const retryArr = []

const start = async()=> {

// 有请求，有通道

- while(idx < len && max > 0) {

+ while(counter < len && max > 0) {

max--; // 占用通道

console.log(idx, "start");

- const form = urls[idx].form;

- const index = urls[idx].index;

- idx++

+ // 任务不能仅仅累加获取，而是要根据状态

+ // wait和error的可以发出请求方便重试

+ const i = urls.findIndex(v=>v.status==Status.wait || v.status==Status.error )// 等待或者error

+ urls[i].status = Status.uploading

+ const form = urls[i].form;

+ const index = urls[i].index;

+ if(typeof retryArr[index]=='number'){

+ console.log(index,'开始重试')

+ }

request({

url: '/upload',

data: form,

onProgress: this.createProgresshandler(this.chunks[index]),

requestList: this.requestList

}).then(() => {

+ urls[i].status = Status.done

max++; // 释放通道

counter++;

+ urls[counter].done=true

if(counter === len) {

resolve();

} else{

start();

}

- });

+ }).catch(()=>{

+ urls[i].status = Status.error

+ if(typeof retryArr[index]!=='number'){

+ retryArr[index] = 0

+ }

+ // 次数累加

+ retryArr[index]++

+ // 一个请求报错3次的

+ if(retryArr[index]>=2){

+ return reject()

+ }

+ console.log(index, retryArr[index],'次报错')

+ // 3次报错以内的重启

+ this.chunks[index].progress = -1// 报错的进度条

+ max++; // 释放当前占用的通道，但是counter不累加

+

+ start()

+ })

}

start();

}

如图所示，报错后会区块变红，但是会重试。

07 文件碎片清理

如果很多人传了一半就离开了，这些切片存在就没意义了，可以考虑定期清理，当然，我们可以使用node-schedule来管理定时任务。

比如我们每天扫一次 target，如果文件的修改时间是一个月以前了，就直接删除把。

// 为了方便测试，我改成每5秒扫一次，过期1钟的删除做演示

const fse = require('fs-extra')

const path = require('path')

const schedule = require('node-schedule')

// 空目录删除

function remove(file,stats){

const now = newDate().getTime()

const offset = now - stats.ctimeMs

if(offset>1000*60){

// 大于60秒的碎片

console.log(file,'过期了，浪费空间的玩意，删除')

fse.unlinkSync(file)

}

async function scan(dir,callback){

const files = fse.readdirSync(dir)

files.forEach(filename=>{

const fileDir = path.resolve(dir,filename)

const stats = fse.statSync(fileDir)

if(stats.isDirectory()){

return scan(fileDir,remove)

}

if(callback){

callback(fileDir,stats)

}

})

}

// * * * * * *

// ┬ ┬ ┬ ┬ ┬ ┬

// │ │ │ │ │ │

// │ │ │ │ │ └ day of week (0 - 7) (0 or 7 is Sun)

// │ │ │ │ └───── month (1 - 12)

// │ │ │ └────────── day of month (1 - 31)

// │ │ └─────────────── hour (0 - 23)

// │ └──────────────────── minute (0 - 59)

// └───────────────────────── second (0 - 59, OPTIONAL)

let start = function(UPLOAD_DIR){

// 每5秒

schedule.scheduleJob("*/5 * * * * *",function(){

console.log('开始扫描')

scan(UPLOAD_DIR)

})

}

exports.start = start

开始扫描

/upload/target/625c.../625c...-0过期了，删除

/upload/target/625c.../625c...-1过期了，删除

/upload/target/625c.../625c...-10过期了，删除

/upload/target/625c.../625c...-11过期了，删除

/upload/target/625c.../625c...-12过期了，删除

08 后续扩展和思考

留几个思考题，下次写文章再实现方便继续蹭热度：

requestIdleCallback兼容性，如何自己实现一个。
1. react也是自己写的调度逻辑，以后有机会写个文章介绍。
2. React自己实现的requestIdleCallback。
并发+慢启动配合。
抽样hash+全量哈希+时间切片配合。
大文件切片下载
1. 一样的切片逻辑，通过axios.head请求获取content-Length。
2. 使用http的Range这个header就可以切片下载了，其他逻辑和上传差不多。
小的体验优化
1. 比如离开页面的提醒等等小tips。
慢启动的变化应该更平滑，比如使用三角函数，把变化率平滑的限制在0.5~1.5之间。
websocket推送进度。

代码

前半段抄袭了 @yeyan1996的代码，后面代码主要为了讲明思路，实现的比较粗糙，求轻喷https://github.com/shengxinjing/upload

参考资料

(https://juejin.im/post/5da14778f265da5bb628e590 https://juejin.im/post/5dff8a26e51d4558105420ed https://juejin.im/post/5dadc6045188255a270a0f85 https://juejin.im/post/5ce60f8ce51d4510bf1d65ea (https://developer.mozilla.org/zh-CN/docs/Web/API/Window/requestIdleCallback) https://www.zhihu.com/question/58517416/answer/158142955) https://zhuanlan.zhihu.com/p/20810469 http://www.zhangyunling.com/702.html 关于开课吧 数字化人才教育平台开课吧已获5.5亿独立融资，领跑新职业教育赛道，现已累积学员超过500万。我们整合了全球知名度IT和互联网企业一线师资，提供Java，Web前端，数据分析，Python，人工智能，产品运营，智能物联等技术课程。您将与国内外知名院校的毕业生及各大厂的职场精英，共同探索计算机科学带来的世界变革。 ?点一下，报名Vue3.0源码进阶提升训练营

CentOS 网络接口配置文件配置示例及详解「已注销」 Linux 基础 linux centos 服务器
在CentOS中，网络配置文件一般为/etc/sysconfig/network-scripts/ifcfg-设备名称，比如ifcfg-eth0、ifcfg-ens32、ifcfg-enp8s0等。配置文件示例（假设网卡设备为ens32）：#安装后默认配置，动态获取IP地址TYPE=Ethernet#网络类型。Ethernet、IPsec等类型，默认类型为Ethernet（以太网）PROXY-ME
远程控制中如何修改Linux系统名移动文件进入vim修改文件内容蛋挞小丸子 linux
1.打开Linux系统的命令端口。vim输入hostname查看系统名称2.短暂修改系统名称。输入hostname（名称）然后退出系统输入exit重新登录linux系统再次输入hostname即可查看修改的系统名称3.永久修改系统名称。输入hostnamectlset-hostname(想要的系统名称）重启系统后仍是修改后的名称4.输入hostnamectlstatus查看系统名称如何创建文档和内
Neuron协议网关的北向应用插件开发神一样的老师工业互联网网络华为云物联网
目录概述指令处理层开发应用层开发.open.close.init.uninit.start.stop.setting.request插件设置文件适配华为的思路概述最近研究了一段时间的Neuron协议网关，前面的博文也提到它虽然能够把数据发到华为的IoT平台上，但是不支持华为的物模型，都是以自己的数据形式发送的。如果想支持华为的模型，就必须开发北向应用插件。今天就学习一下相关的开发。北向应用开发主要
【日记星球第90篇】——充实的居家生活神秘园的简书
2020年2月26日星期三（阴）图片发自App最近几天进入忙碌状态，网上办公之余，今天继续收拾书房几个整理箱，终于把书柜抽屉接近填满，为了每个抽屉必须留有余地还要重新调整一下。很多文件资料还没时间分类取舍。感恩爱人每天做那么好吃的饭菜，想少吃都忍不住。中午又做了香喷喷的炒米饭和萝卜汤，还有花生米凉拌海带，让我总是边吃边赞。午休醒来水果时间，吃了一个可爱的小橙子，按照新方法切掉两边后直接用手剥开，果
小程序使用iconfont的方法. adustdu2015
1.方法：在阿里巴巴图标库下载下来以后，将iconfont.ttf转换即可。转换地址：https://transfonter.org/这里贴一个简单的步骤：image.pngimage.pngimage.png将css文件在外部引入所要用的.wxss文件中即可（@import‘../../lib/style/lib.wxss’;）最后，就可以使用啦：.icon:after{font-family:
CFIX（Samba）服务的使用心飞扬Q apache mysql 数据库
Samba是在Linux和UNIX系统上实现SMB协议的一个免费软件，由服务器及客户端程序构成。SMB（ServerMessagesBlock，信息服务块）是一种在局域网上共享文件和打印机的一种通信协议，它为局域网内的不同计算机之间提供文件及打印机等资源的共享服务。SMB协议是客户机/服务器型协议，客户机通过该协议可以访问服务器上的共享文件系统、打印机及其他资源。通过设置“NetBIOSoverT
catkin_make中CMake Error解决方案 FL17171314 机器人自动驾驶人工智能
catkin_make在ROS（RobotOperatingSystem）开发环境中主要作用在于编译和构建ROS软件包，确保开发者能够顺利地将编写的代码转换为可执行文件和其他必要的内容，以便在ROS平台上运行节点或程序。1.检查ROS工作空间ROS使用工作空间（Workspace）来组织和管理不同的软件包。当执行catkin_make命令时，它会首先检查ROS工作空间的状态，确保所有必要的文件和目
catkin_ws的作用 FL17171314 机器人自动驾驶人工智能
catkin_ws在ROS（RobotOperatingSystem，机器人操作系统）中扮演着重要的角色，它是ROS用户的工作空间，主要用于存放与ROS项目相关的开发文件。catkin_ws的作用主要体现在以下几个方面：组织结构化：catkin_ws包含了源文件空间（通常为catkin_ws/src）、编译空间（通常为catkin_ws/build）和开发空间（通常为catkin_ws/devel
Android Data Binding数据绑定详解（基础篇） e电动小马达e Android
文章导航AndroidDataBinding数据绑定详解（基础篇）AndroidDataBinding数据绑定详解（进阶篇）简介在2015年的谷歌IO大会上，AndroidUIToolkit团队发布了DataBinding框架，将数据绑定引入了Android开发。以后可以直接在layout布局xml文件中绑定数据了，无需再findViewById然后手工设置数据了。官方文档说明构建环境使用之前，需
ESXi分享一波许可证，先到先得-真实有效北陌宝宝工具安装包 linux 容器
今天安装了一个ex，想着使用更方便，安装部分省去---有需要可以留言，我在补充，主要说下许可问题镜像下载地址：通过百度网盘分享的文件：EX-VMvisor-Installer-6.7.0.x86_64.iso链接：https://pan.baidu.com/s/1GDUAkEWpZ4MtCmQVMczU4w提取码：beim官网下载地址：下载ESXi安装程序(vmware.com)先给大家一波许可码
2019-11-12 忠余
《六项精进》349期打卡660天姓名:周忠余扬州市方圆建筑工程有限公司【日精进打卡第660天】第349期努力一组【知～学习】《六项精进》5遍共3235遍《大学》5遍共3235遍【经典名句分享】真抓实干，埋头苦干。【行～实践】一、修身：（对自己个人）1、背诵《六项精进》《大学》。二、齐家：（对家庭和家人）1、早起做早餐。三、建功：（对工作）1、阅读海伦项目的合同条款，查找相关文件，找寻海伦项目止亏的
Clickhouse篇之数据的备份与恢复听说唐僧不吃肉 Clickhouse clickhouse 数据库
Clickhouse数据的备份与恢复要备份ClickHouse数据库中的数据表，你可以使用ClickHouse提供的BACKUP和RESTORE功能，或者通过手动备份文件系统中的数据目录来实现。以下是两种常用的方法：方法一：使用BACKUP和RESTORE功能从ClickHouse21.8版本开始，支持BACKUP和RESTORE命令。以下是备份和恢复的步骤：1.备份数据库备份整个数据库BACKU
代码随想录打卡第五十八天 zengy5 代码随想录刷题流程算法 c++leetcode 开发语言
代码随想录–图论部分day58图论第八天文章目录代码随想录--图论部分一、卡码网117--软件构建二、卡码网47--参加科学大会一、卡码网117–软件构建代码随想录题目链接：代码随想录某个大型软件项目的构建系统拥有N个文件，文件编号从0到N-1，在这些文件中，某些文件依赖于其他文件的内容，这意味着如果文件A依赖于文件B，则必须在处理文件A之前处理文件B（0#include#include#incl
python csv文件创建时间_更高效的Python CSV文件导出 weixin_39622084 python csv文件创建时间
在上一篇文章，我介绍了CSV是什么？CSV有哪些优点？如何使用等等？并且最后我们用一个例子简单讲解了如何使用Python模块CSV进行导出后缀为.csv的文本文件。其实例子用于异步导出数据文件是够了，但工作中我们可能还需要结合我们Web框架进行更复杂的CSV导出。所以今天我们的目的就是结合PythonDjango框架进行分享CSV导出的另外一种方式。安装依赖这里面我们需要安装一个第三方包djang
python Django +Vue实现多文件异步上传离光头还差半个光头 python vue.js upload post
pythonDjango+Vue实现多文件异步上传刚接触python不久，接到个需求需要多文件上传，在网上找了很多，有讲理论的，有讲实现的，但我花了很长时间，才从这些文章中搞懂这个问题，我们来个直接粗暴的，上代码，部分解释加在代码上html首页letapp=newVue({el:'#app',data:{fileList:[],},methods:{fileChange:function(e){t
@Value注解@Value("#{}")和@Value("${}")的区别一块自由的砖
@Value("#{}")@Value("#{}")表示SpEl表达式通常用来获取bean的属性，或者调用bean的某个方法。当然还有可以表示常量@Value("#{1}")//number相当于赋值1privateintnumber;@Value("${}")@Value("${}")可以获取对应属性文件中定义的属性值。假如我有一个application.properties文件里面配置了：we
Obsidian 0x03：Obsidian 常用插件 Kevin骑熊猫打老虎笔记工具其他
文章目录Obsidian常用插件设置附件文件夹路径删除笔记中不再使用的图片的遗留附件文件表格记录阅读位置在文件列表显示文件夹中包含的笔记数目最近打开文件格式转换样式全文检索绘图笔记特征检索其他常用插件Obsidian常用插件设置附件文件夹路径名称用途CustomAttachmentlocation像typora一样在路径中使用变量${filename}设置附件文件夹名直接写${filename}比
java8 探讨与分析匿名内部类、lambda表达式、方法引用的底层实现罗蜜斯丹 java学习 Java8 lambda
问题解决思路：查看编译生成的字节码文件本文本来我是发布在博客园，现在移植到CSDN；原文链接文章目录测试匿名内部类的实现小结测试lambda表达式小结测试方法引用小结三种实现方式的总结对于lambda表达式，为什么java8要这样做？理论上的性能实测的性能总结思路一：编译javacfileName.java反编译javap-v-pfileName.class;这一步可以看到字节码。思路二：运行阶段
搭建selenoid环境野生猕猴桃 selenoid selenoid-ui 远程浏览器
1、拉取浏览器镜像dockerpullselenoid/vnc:chrome_103.02、拉取selenoid-ui容器镜像dockerpullaerokube/selenoid-ui:1.10.43、拉取selenoid容器镜像dockerpullaerokube/selenoid4、编写配置文件vi/selenoid/config/browsers.jsonvolumes可以做容器路径映射，
BeautifulSoup：Python网页解析库详解零度° python beautifulsoup python
BeautifulSoup是一个Python库，用于从HTML或XML文件中提取数据。它能够通过简单的方法处理复杂的HTML文档，并且很容易就能找到你需要的标签和数据。BeautifulSoup的主要特点易于使用：BeautifulSoup提供了简洁的API来提取HTML标签。灵活：可以与lxml、html5lib或html.parser等解析器一起使用。强大：支持导航、搜索、修改解析树等功能。常
linux系统管理实例,电脑系统知识：Linux系统管理文件和目录命令图文通俗实例详解... weixin_39838231 linux系统管理实例
1.1pwd命令该命令的英文解释为printworkingdirectory(打印工作目录)。输入pwd命令，Linux会输出当前目录。1.2cd命令cd命令用来改变所在目录。cd/转到根目录中cd~转到/home/user用户目录下cd/usr转到根目录下的usr目录中-------------绝对路径cdtest转到当前目录下的test子目录中-------相对路径1.3ls命令ls命令用来查
mybatis 八股文 szc1767 八股文 mybatis java 开发语言
目录重点mybatis如何防止sql注入#和$的区别mybatis一级缓存、二级缓存为什么说Mybatis是半自动ORM映射工具？它与全自动的区别基础什么是MyBatis谈谈你为什么用MyBatis，有什么优点MyBatis有哪些缺点如何获取自动生成的主键属性名和字段名不一致的情况MyBatis中用到了哪些设计模式映射文件中处理CRUD操作的标签以外还有哪些标签？MyBatis中的分页使用Mapp
Python使用pyhive库远程操作hive的配置和使用玩家_名狱 Python学习大数据 python 数据库 hive
请先安装好hive，林子雨老师的配置方法，该配置方法是可以配置成功的，请注意配置hive-site.xml文件的时候，里面添加的信息都是在标签里的尾部添加配置hive环境到hive安装的conf目录下，把hive-env.sh.template复制一份并改名为hive-env.shcd/usr/local/hive/conf/cphive-env.sh.templatehive-env.sh然后配
hadoop日志文件静听山水 Spark hadoop
路径：/opt/homebrew/Cellar/hadoop/3.4.0/libexec/logs从你提供的输出信息来看，你正在查看Hadoop的日志文件目录(logs目录)。这里列出了Hadoop各个组件的日志文件。下面是对这些日志文件的解释：日志文件列表SecurityAuth-xiaokkk.audit:安全日志文件，记录了与安全相关的审计事件。hadoop-xiaokkk-datanode
centos修改、保存文件的详细步骤 X先生_未知数的X
【一】修改文件如果是使用普通用户登录的，需要先切换到管理员用户，打开终端，输入：su，接着按提示输入密码即可；然后使用命令进入需要修改文件的所在目录，常用的几个命令如下：①cd+目录名②cd+空格（退回上级目录）③cd+空格+/（退回最高级目录）接着使用命令：vi+文件名命令，打开文件，然后输入命令：/+要修改的关键词，查找到要修改的内容，然后使用命令进入【文本输入模式】，常用的命令如下：①a在光
1.2如何整理电脑文件夹和桌面？和盼妈一起学阅读
【高效省时36计·第1.2讲课后实践】这是2018年12月4日“崔律精时力之高效省时36计”系列第1.2讲的课后实践。动手调整电脑文件夹与电脑桌面。1.我在本讲中的收获：1）电脑文件夹新知1：最多四层（从前没有明确最多要几层，虽然没有特别多的层次）。硬盘分区-一级文件夹-二级文件夹-三级文件夹-文档新知2：原则MECE的运用：各层分级遵循MECE原则,相互独立，完全穷尽。新知3：一级文件夹，原则上
python连接hive--Pyhive Elvis_hui hive hive python sql
Pyhive安装包pipinstallsaslpipinstallthriftpipinstallthrift-saslpipinstallPyHive#安装对应的包sasl可能会报错#下载sasl文件sasl下载执行语句第一种frompyhiveimporthivedefselect_pyhive(sql):#创建hive连接conn=hive.Connection(host='##',port
1.5编程基础之循环控制01:求平均年龄来吗？？？ c++算法开发语言
班上有学生若干名，给出每名学生的年龄（整数），求班上所有学生的平均年龄，保留到小数点后两位。、#include//头文件usingnamespacestd;//不用说intmain(){intn,s,sum=0;//创建变量，n表示输入几次，s是重复出入的变量，sum是把所有年龄加起来的变量cin>>n;//输入for(inti=0;i>s;//每次输入年龄sum+=s;//输入的年龄加在sum里
C/C++ 编译过程概述梦星辰. C/C++算法编程基础 c语言 c++开发语言
C/C++的编译过程可以分为四个主要阶段：预处理、编译、汇编和链接1.预处理（Preprocessing）预处理阶段由预处理器完成，主要是对源代码文件进行一些替换操作，常见的预处理任务包括：宏替换：展开源代码中的宏定义，如#definePI3.1415926。头文件包含：用实际的头文件内容替换#include指令，例如#include或#include"myheader.h"。条件编译：根据预处理
Qt调用外部exe并嵌入到Qt界面中（验证成功的成功） mengzhi啊 qt
http://t.csdnimg.cn/CDsqQ原作者在这里本文章主要介绍如何用Qt调用其他应用的exe,并将窗口嵌入到Qt界面中。很多人查到的代码都能成功的将exe调用起来，但是嵌入不到窗口中。主要有两种原因，现在从头到尾的梳理一下。1.主要代码1.1启动exe//包含头文件#include//启动软件QProcess*m_process=newQProcess;m_process->star
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

react 文件 md5_字节跳动面试题 | 大文件上传和断点续传的几点思考

01 时间切片计算文件hash

02 抽样hash

03 网络请求并发控制

04 慢启动策略实现

05 进度条优化

06 并发重试+报错

07 文件碎片清理

08 后续扩展和思考

代码

参考资料

你可能感兴趣的:(react,文件,md5)