Thinker_serious

自动监控备份系统--项目详情

自动监控备份系统

源码地址：https://github.com/JustDocat/project-for-backup

项目性能测试：https://blog.csdn.net/Thinker_serious/article/details/99954314

项目功能介绍

项目环境搭建

客户端

运行环境：windows10
开发软件：VS2013 X64平台

服务端

运行环境：CentOS7
内核版本：3.10.0-862
开发软件：vim、gcc (GCC) 5.3.1 20160406、makefile
依赖库：httplib、boost库-64位、zlib库

httplib--用于搭建http服务端与客户端
boost库--用于文件相关的检测
zlib库--用于对文件进行压缩存储

项目模块划分

客户端

对指定目录进行监控，检测哪些文件需要备份
对需要备份的文件进行上传

服务端

对客户端上传的文件进行备份
通过网页能够向用户展示文件列表
通过网页向用户提供文件下载的功能
能够对不经常下载的文件进行压缩存储，节约磁盘空间

具体模块实现与代码解析

客户端

一、读取备份信息记录，获取已有备份信息，避免重复上传
二、检测目录中的文件信息
三、判断文件是否需要上传备份
四、上传备份
五、记录文件备份信息

一、每次客户端启动时，读取备份信息记录，获取已有备份信息
备份信息格式为"filename etag"

bool GetBackupInfo() {
		// 备份信息记录格式
		// filename1 etag\n
		// filename2 etag\n
		
		// #define CLIENT_BACKUP_INFO_FILE "back.list"
		// back.list为备份记录文件
		// namespace bf=boost::filesystem;
		bf::path path(CLIENT_BACKUP_INFO_FILE);	// 创建path对象
		if (!bf::exists(path)) {
			std::cerr << "list file " << path.string() << " is not exists" << std::endl;
			return false;
		}
		int64_t fsize = bf::file_size(path);
		if (fsize == 0) {
			std::cerr << "have no backup info" << std::endl;
			return false;
		}

		std::string body;
		body.resize(fsize);
		std::ifstream file(CLIENT_BACKUP_INFO_FILE, std::ios::binary);
		if (!file.is_open()) {
			std::cerr << "list file open error" << std::endl;
			return false;
		}
		file.read(&body[0], fsize);
		if (!file.good()) {
			std::cerr << "read list file body error" << std::endl;
			return false;
		}
		file.close();

		std::vector<std::string> list;
		boost::split(list, body, boost::is_any_of("\n"));
		// 将整个文件按照"\n"进行分割
		for (auto& e : list)
		{
			size_t pos = e.find(" ");
			if (pos == std::string::npos) {
				continue;
			}
			std::string key = e.substr(0, pos);
			std::string val = e.substr(pos + 1);
			_backup_list[key] = val;
		}
		return true;
	}

功能实现流程

0. 需要先知道文件中的备份信息格式为 "filename etag\n"
1. 第一次启动客户端，备份文件不存在，需要创建back.list文件
2. 不是第一次启动时，先打开back.list文件读取其中的内容，获取备份记录
3. 定义string对象body，将文件中的内容读取到body中
4. 创建一个vector数组，将每个文件的备份信息分割开保存在vector中
5. 遍历vector按" "进行分割，文件的filename当作key，etag信息当作value保存在unordered_map中
6. 此时，已经备份过的文件保存在map中了，查询map即可知道文件是否备份

使用的依赖库接口

bf::exists(path); // path文件是否存在
bf::file_size(path); // path文件的大小
boost::split(list, body, boost::is_any_of("\n")); // 将body中的内容以"\n"分割，加入到list中

二、检测目录中的文件信息

// 将文件中的信息加载到map中
bool AddBackInfo(const std::string& file) {
		// etag = "mtime-fsize"
		std::string etag;
		if (GetFileEtag(file, etag) == false) {
			return false;
		}

		_backup_list[file] = etag;
		return true;
}
// 目录监控
bool BackupDirListen(const std::string& path) {
		bf::path file(path);
		
		// 文件迭代器
		bf::directory_iterator item_begin(file);
		bf::directory_iterator item_end;
		for (; item_begin != item_end; ++item_begin) {
			if (bf::is_directory(item_begin->status())) {
				BackupDirListen(item_begin->path().string());
				continue;
			}
			// FileIsNeedBackup文件是否需要备份
			if (FileIsNeedBackup(item_begin->path().string()) == false) {
				continue;
			}
			std::cerr << "file:[" << item_begin->path().string() << " need backup" << std::endl;
			// PutFileData上传文件数据
			if (PutFileData(item_begin->path().string()) == false) {
				std::cerr << "PutFileData false" << std::endl;
				continue;
			}
			// AddBackInfo添加备份信息
			AddBackInfo(item_begin->path().string());
		}
		return true;
	}

功能实现流程

1. 使用boost库中的文件迭代器遍历监控目录
2. 如果迭代器遍历到的时目录，则递归遍历子目录
3. 遍历到的文件，取出文件的文件名，看是否需要备份
4. 如果遍历到的文件需要备份，则上传备份，否则跳过当前文件
5. 上传的文件成功后，添加上传备份信息到map中，防止重复上传

使用的依赖库接口

bf::directory_iterator item_begin(file); // 监控目录下的迭代器开始位置
bf::directory_iterator item_end; // 监控目录下的迭代器结束位置
bf::is_directory // 判断当前遍历的文件是否是目录

三、判断文件是否需要上传备份

// etag格式hex-hex 两个16进制的数字
bool GetFileEtag(const std::string& file, std::string& etag) {
		bf::path path(file);
		if (!bf::exists(path)) {
			std::cerr << "get file " << file << " etag error" << std::endl;
			return false;
		}
		int64_t fsize = bf::file_size(path);
		int64_t mtime = bf::last_write_time(path);

		std::stringstream tmp;
		tmp << std::hex << fsize << "-" << std::hex << mtime;
		etag = tmp.str();
		// std::cout << "GetEtag information : " << tmp.str() << std::endl;
		return true;
}

bool FileIsNeedBackup(const std::string& file) {
		std::string etag;
		if (GetFileEtag(file, etag) == false) {
			return false;
		}
		auto it = _backup_list.find(file);

		if (it != _backup_list.end() && it->second == etag) {
			return false;
		}
		return true;
}

功能实现流程

0. etag信息为文件大小 --- 文件最后一次修改时间
1. 获取遍历到文件的etag信息，etag信息为两个16进制的数字
2. 在unordered_map中查找遍历到的文件，判断之前是否上传过
3. 如果查找到当前文件，对比etag信息是否相同
4. etag信息相同，说明不需要备份，如果etag信息不相同或文件查找不到则需要备份

使用的依赖库接口

bf::exists // 文件是否存在
bf::file_size // 文件大小
bf::last_write_time // 文件最后一次修改时间

四、上传备份

// 上传，线程的创建
bool PutFileData(const std::string& file) {
		// 按分块大小 RANGE_MAX_SIZE(10M) 对文件进行分块传输
		// 通过获取分块传输是否成功判断整个文件是否上传成功
		// 选择多线程处理

		// 1. 获取文件大小
		std::cerr << "PutFileData()" << std::endl;
		int64_t fsize = bf::file_size(file);
		if (fsize <= 0) {
			std::cerr << "file " << file << "unnecessary backup" << std::endl;
		}
		// 2. 计算总共需要分多少块，得到每块大小以及起始位置
		// 3. 循环创建线程，在线程中上传文件数据
		int count = (int)(fsize / RANGE_MAX_SIZE);
		std::vector<ThrBackUp> thr_res;
		std::vector<ThrBackup> thr_list;
		std::cerr << "file:[" << file << "] fsize:[" << fsize << "] count:[" << count + 1 << "]" << std::endl;
		for (int i = 0; i <= count; ++i)
		{
			int64_t range_start = i * RANGE_MAX_SIZE;
			int64_t range_end = (i + 1) * RANGE_MAX_SIZE - 1;
			if (i == count) {
				range_end = fsize - 1;
			}
			int64_t range_len = (range_end - range_start + 1);
			// 直接使用线程，参数不能全部传递过去，分装线程
			ThrBackUp backup_info(file, range_start, range_len);
			thr_res.push_back(backup_info);
			
		}
		for (int i = 0; i <= count; ++i) {
			thr_list.push_back(std::thread(thr_start, &thr_res[i]));
		}

		// 4. 等待所有线程退出，判断文件上传结果
		bool ret = true;
		for (int i = 0; i <= count; ++i) {
			thr_list[i].join();
			if (thr_res[i]._res == true) {
				continue;
			}
			ret = false;
		}
		// 5. 上传成功，则添加文件的备份信息记录
		if (ret == false) {
			return false;
		}
		std::cerr << "file:[" << file << "] backup success" << std::endl;
		return true;
}

// 启动线程开始上传
static void thr_start(ThrBackUp* backup_info) {
		std::cerr << "into thread" << std::endl;
		backup_info->Start();
}

// 线程类
class ThrBackUp {
private:
	std::string _file;
	int64_t _range_start;
	int64_t _range_len;
public:
	bool _res;
public:
	ThrBackUp(const std::string& file, int64_t start, int64_t len) 
		: _res(true)
		, _file(file)
		, _range_start(start)
		, _range_len(len)
	{}
	void Start() {
		// 获取文件的range分块

		std::ifstream path(_file, std::ios::binary);
		if (!path.is_open()) {
			std::cerr << "range backup file " << _file << std::endl;
			_res = false;
			return;
		}
		// 跳转到range的起始位置
		path.seekg(_range_start, std::ios::beg);
		std::string body;
		body.resize(_range_len);
		// 读取文件中的range分块的数据
		path.read(&body[0], _range_len);
		if (!path.good()) {
			std::cerr << "read file " << _file << " range data failed" << std::endl;
			_res = false;
			return;
		}
		path.close();

		std::cerr << "read over" << std::endl;

		// 上传range数据
		bf::path name(_file);
		// 组织上传的url路径 method url version
		// PUT /list/filename HTTP/1.1
		std::string url = BACKUP_URI + name.filename().string();
		// 实例化一个httplib的客户端对象
		httplib::Client cli(SERVER_IP, SERVER_PORT);
		// 定义http请求的头信息
		httplib::Headers hdr;
		hdr.insert(std::make_pair("Content-Length", std::to_string(_range_len)));
		std::stringstream tmp;
		tmp << "bytes=" << _range_start << "-" << (_range_start + _range_len - 1);
		hdr.insert(std::make_pair("Range", tmp.str().c_str()));
		// 通过实例化的client向服务端发送PUT请求
		auto rsp = cli.Put(url.c_str(), hdr, body, "text/plain");
		if (rsp && rsp->status == 200) {
			std::stringstream ss;
			ss << "backup file [" << _file << "] range:[" << _range_start << "-" << _range_len << "] backup success" << std::endl;
			std::cout << ss.str();
		}
		else {	
			std::cerr << "rsp put error" << std::endl;
			_res = false;
		}
		
	}

};

功能实现流程

0. 每个分块的大小 #define RANGE_MAX_SIZE (10 << 20) = 10M
1. 获取文件大小，计算需要的分块，每个分块启动一个线程上传，至少一个线程
2. 将创建的线程类对象加入vector中，方便循环启动
3. 遍历vector，循环启动线程开始上传
4. 将启动的线程加入等待的vector中，方便等待，判断返回值，看是否上传成功
5. 每个线程将数据写入body中组织一个HTTP客户端，将分块开始位置，正文大小写入头信息中
6. 客户端调用PUT方法，将正文数据上传，等待服务端返回的状态码，如果状态码为200则上传成功，否则上传失败，等待下次上传
7. 循环判断每一个线程是否上传成功，只要有一个线程上传失败，则整个文件上传失败，不进行上传成功记录；如果上传成功，则添加上传备份信息

使用的依赖库接口

httplib::Client cli(SERVER_IP, SERVER_PORT); // 实例化http客户端
httplib::Headers hdr; // 定义http的头信息
cli.Put(url.c_str(), hdr, body, "text/plain"); // 客户端的上传操作

五、记录文件备份信息

bool SetBackupInfo() {
		std::string body;
		for (auto& e : _backup_list)
		{
			body += e.first + " " + e.second + "\n";
		}
		std::ofstream file(CLIENT_BACKUP_INFO_FILE, std::ios::binary);
		if (!file.is_open()) {
			std::cerr << "open list file error" << std::endl;
			return false;
		}
		file.write(&body[0], body.size());
		if (!file.good()) {
			std::cerr << "set backup info error" << std::endl;
			return false;
		}
		return true;
	}

功能实现流程

1. 取出map中保存好的文件备份信息，保存到body中
2. 打开备份文件，将body写入，将备份信息记录在文件中

服务端

一、httplib服务器实现对文件的上传存储功能
二、httplib服务器实现向用户展示文件列表的功能
三、httplib服务器实现对文件下载功能
四、压缩存储模块对不经常访问的文件进行压缩存储，删除原有文件

文件的安全操作类向服务端提供的接口

文件列表获取
文件数据获取
文件数据存储

文件的安全操作类向压缩模块提供的接口

检测指定目录，对不经常访问的文件进行压缩存储

一、httplib服务器实现对文件的上传存储功能

static void PutFileData(const Request &req, Response &rsp){
      std::cerr<< "backup file " << req.path << std::endl;
      if(!req.has_header("Range")) {
        rsp.status = 400;
        return;
      }
      std::string range = req.get_header_value("Range");
      std::cout << range << std::endl;
      int64_t range_start;

	  // RangeParse:计算上传的文件数据的分块开始位置与分块大小
      if(RangeParse(range, range_start)== false) {
        rsp.status = 400;
        std::cerr << "RangeParse() error" << std::endl;
        return;
      }
      std::string realpath = SERVER_BASE_DIR + req.path;
      // 压缩类给服务端提供的文件存储接口
      cstor.SetFileData(realpath, req.body, range_start);
    }
    // 计算文件的开始位置与文件大小
static bool RangeParse(std::string& range, int64_t &start) {
      // Range: bytes=start-end
      size_t pos1 = range.find("=");
      size_t pos2 = range.find("-");
      std::cout << pos1 << "-" << pos2 << std::endl;
      if(pos1 == std::string::npos || pos2 == std::string::npos) {
        std::cerr << "range:[" << range << "] format error";
        return false;
      }
      std::stringstream rs;
      rs << range.substr(pos1 + 1, pos2 - pos1 - 1);
      rs >> start;
      return true;
    }
// Compress类提供的文件存储接口
 bool SetFileData(const std::string& file, const std::string& body, const int64_t offset) {
      int fd = open(file.c_str(), O_CREAT|O_WRONLY, 0664);
      if(fd < 0) {
        std::cerr << "open file " << file << " error" << std::endl;
        return false;
      }
      flock(fd, LOCK_EX);
      lseek(fd, offset, SEEK_SET);
      int ret = write(fd, &body[0], body.size());
      if(ret < 0) {
        std::cerr << "store file" << file << " data error" << std::endl;
        flock(fd, LOCK_UN);
        return false;
      }
      flock(fd, LOCK_UN);
      close(fd);
      AddFileRecord(file, "");
      return true;
}

 bool AddFileRecord(const std::string& file, const std::string& gzip) {
      pthread_rwlock_wrlock(&_rwlock);
      _file_list[file] = gzip; 
      pthread_rwlock_unlock(&_rwlock);
      std::cerr << file << "-" << gzip << std::endl;
      return true;
}

功能实现流程

0. range分块的格式range=start-end
1. 判断上传的PUT请求的头部中是否包含range分块信息，若没有返回400状态码
2. 取出分块开始的位置，组织文件路径和名称，传入压缩类提供给服务端的接口中
3. 只写方式打开传入路径下的文件，如果不存在就创建
4. 对文件进行加锁操作，防止多线程导致文件存储出错
5. 跳转读写位置进行写入，写入完成后，解锁，将文件信息写入unordered_map中保存
6. 对map的读取、写入需要加读写锁进行保证安全

调用接口解析

req为http客户端发来的请求信息，rsp为服务端对客户端的响应
req.has_header("range"); // 判断头信息中是否含有range信息
req.get_header_value("range"); // 获取range信息
flock(); // 文件锁，可以加LOCK_SH共享锁，与读写锁特性相同；LOCK_EX互斥锁；LOCK_UN解锁
_list_file // unordered_map保存文件的压缩信息，这里还没有压缩，所以不需要添加压缩包名称

二、httplib服务器实现向用户展示文件列表的功能

// 获取文件列表
    static void GetFileList(const Request &req, Response &rsp){

      std::vector<std::string> list;
      cstor.GetFileList(list);
      std::string body;
      body += "
";
      for(auto& e : list)
      {
        bf::path path(e);
        
        std::string file = path.filename().string();
        std::string uri = "/list/" + file;

        body += "";

        body += "";

        body += file; 
        body += "";
        body += "
";

        // "filename
"
      }
      body += "
";
      rsp.set_content(&body[0],"text/html");
      return;
}

// 向外提供获取文件列表功能
    bool GetFileList(std::vector<std::string>& list) {
      pthread_rwlock_rdlock(&_rwlock);
      for(auto& e : _file_list) {
        list.push_back(e.first);
      }
      pthread_rwlock_unlock(&_rwlock);
      return true;
}

功能实现流程

1. 定义vector用于保存文件名称
2. 文件有可能被压缩，所以遍历监控目录，不能获取全部文件。所以遍历map，map中保存着所有的文件以及对应压缩文件信息
3. 取出map中所有的first，添加到vector中
4. 服务端将所有的文件组织为一个HTML页面响应给客户端，向用户展示文件列表

调用接口解析

rsp.set_content // 为响应设置正文数据

三、httplib服务器实现对文件下载功能

static void GetFileData(const Request &req, Response &rsp){
      std::string realpath = SERVER_BASE_DIR + req.path;
      std::string body;

      cstor.GetFileData(realpath, body);
      rsp.set_content(body, "text/plain");
}

// 压缩类向服务端提供的文件下载接口
bool GetFileData(std::string& file, std::string& body) {
      if(bf::exists(file)) {
        // 1. 非压缩文件获取
        GetNormalFile(file, body);
      }else {
        // 2. 压缩文件获取
        // 获取压缩包名称 gzip

        std::cerr << "i find file: "<< file << std::endl;
        std::string gzip;
        GetFileGzip(file, gzip);
        std::cerr << "GetFileGzip: gzip: " << gzip << std::endl;
        UnCompressFile(gzip, file);
        GetNormalFile(file, body);
      }
      return true;
}

// 获取文件压缩后的名称
bool GetFileGzip(std::string& file, std::string& gzip) {
      std::cerr <<"file - gzip: " <<file << _file_list[file] <<  std::endl;
      pthread_rwlock_rdlock(&_rwlock);

      auto it = _file_list.find(file);
      if(it == _file_list.end()) {
        pthread_rwlock_unlock(&_rwlock);
        return false;
      }
      gzip = it->second;

      pthread_rwlock_unlock(&_rwlock);
      return true;
}

// 获取未压缩文件数据
bool GetNormalFile(std::string& name, std::string& body) {
      int64_t fsize = bf::file_size(name);
      body.resize(fsize);

      int fd = open(name.c_str(), O_RDONLY);
      if(fd < 0) {
        std::cerr << "open file " << name << " failed" << std::endl;
        return false;
      }

      flock(fd, LOCK_SH);
      int ret = read(fd, &body[0], fsize);
      flock(fd, LOCK_UN);

      if(ret != fsize) {
        std::cerr << "get file " << name << " body error" << std::endl;
        close(fd);
        return false;
      }
      close(fd);
      return true;
}

// 解压缩
bool UnCompressFile(std::string& gzip, std::string& file) {
      int fd = open(file.c_str(), O_CREAT|O_WRONLY, 0664);
      if(fd < 0) {
        std::cerr << "open file " << file << "failed" << std::endl;
        return false;
      }
      gzFile gf = gzopen(gzip.c_str(), "rb");
      if(gf == NULL) {
        std::cerr << "open gzip " << gzip << " failed" << std::endl;
        close(fd);
        return false;
      }
      int ret;
      char buf[1024];
      flock(fd, LOCK_EX);
      while((ret = gzread(gf, buf, 1024)) > 0) {
        int len = write(fd, buf, ret);
        if(len < 0) {
          std::cerr << "get gzip data failed" << std::endl;
          gzclose(gf);
          close(fd);
          flock(fd, LOCK_UN);
          return false;
        }
      }
      flock(fd, LOCK_UN);
      gzclose(gf);
      close(fd);
      unlink(gzip.c_str());
      return true;
}

功能实现流程

1. 服务端根据客户端请求，组织一个请求路径
2. 先遍历未压缩目录，看是否被压缩，如果没有压缩，直接进行数据读取
3. 打开文件，将数据读取到body中，使用body将数据返回
4. 对于压缩文件需要，先解压缩，先获取需要文件的对应压缩包名称
5. 遍历_file_list找到当前文件对应的压缩包名称，需要使用读写锁，保证线程安全
6. 使用zlib库中提供的接口，定义操作句柄，打开压缩文件，将文件读取到正常文件中保存，删除压缩文件
7. 重复未压缩文件获取步骤，获取文件数据
8. 将body设置为响应正文，响应给客户端进行下载

调用接口解析

rsp.set_content // 设置响应正文，且只能设置一次
bf::exists // 判断文件是否存在
gzFile gf // 定义一个压缩文件的文件句柄
gzopen("rb") // 打开一个压缩文件，以只读二进制流打开
gzread // 读取压缩文件数据，数据还原的过程由这个接口自己实现
gzclose // 关闭压缩文件描述符

四、压缩存储模块对不经常访问的文件进行压缩存储，删除原有文件

	// 对热度低的文件进行压缩存储
    // 因为压缩存储时流程是死循环，因此需要启动线程
    bool LowHeatFileStore() {
      // 1. 获取记录信息
      GetListRecord();
      while(1) {
        // 2. 目录检测，文件压缩存储
          // 2.1 获取list目录下文件名称
          // 2.2 判断文件是否需要压缩存储
          // 2.3 对文件进行压缩存储
        DirectoryCheck();
        // 3. 存储记录信息 
        SetListRecord();
        sleep(3);

      }
      return true;
    }
    
    // 获取文件的压缩信息
    bool GetListRecord() {
      // filename gzipfilename\n
      bf::path name(RECORD_FILE);
      if(!bf::exists(name)) {
        std::cerr << "record file is not exists" << std::endl;
        return false;
      }
      std::ifstream file(RECORD_FILE,std::ios::binary);
      if(!file.is_open()) {
        std::cerr << "open record file error" << std::endl;
        return false;
      }
      int64_t fsize = bf::file_size(name);
      std::string body;
      body.resize(fsize);
      file.read(&body[0], fsize);
      if(!file.good()) {
        std::cerr << "record file body read error" << std::endl;
        return false;
      }
      file.close();

      std::vector<std::string> list;
      boost::split(list, body, boost::is_any_of("\n"));
      for(auto& e : list) {
        // filename gzipname
        size_t pos = e.find(" ");
        if(pos == std::string::npos) {
          continue;
        }
        std::string key = e.substr(0, pos);
        std::string val = e.substr(pos + 1);
        _file_list[key] = val;
      }
      return true;
    }
    
    // 2. 每次压缩存储完毕，都要将列表信息，存储到文件中
    bool SetListRecord() {
      std::stringstream tmp;
      for(auto& e : _file_list) {
        tmp << e.first << " " << e.second << "\n";
      }

      std::ofstream file(RECORD_FILE, std::ios::binary|std::ios::trunc);
      if(!file.is_open()) {
        std::cerr << "record file open error" << std::endl;
        return false;
      }
      file.write(tmp.str().c_str(), tmp.str().size());
      if(!file.good()) {
        std::cerr << "recode file write body error" << std::endl;
        return false;
      }
      file.close();
      return true;
    }
    
	// 目录检测，获取目录中的文件名
    // 1. 判断文件是否需要压缩存储
    // 2. 文件压缩存储
    bool DirectoryCheck() {
      if(!bf::exists(UNGZIPFILE_PATH)) {
        bf::create_directory(UNGZIPFILE_PATH);
      }
      bf::directory_iterator item_begin(UNGZIPFILE_PATH);
      bf::directory_iterator item_end;
      for(; item_begin != item_end; ++item_begin) {
        if(bf::is_directory(item_begin->status())) {
          continue;
        }
        std::string name = item_begin->path().string();

        if(IsNeedCompress(name)) {
          std::string gzip = GZIPFILE_PATH +  item_begin->path().filename().string() + ".gz";
          CompressFile(name, gzip);
          AddFileRecord(name, gzip);
        }
      }
      return true;
    }
    
	// 2.2. 判断文件是否需要压缩存储
    bool IsNeedCompress(std::string& file) {
      struct stat st;
      if(stat(file.c_str(), &st) < 0) {
        std::cerr << "get file:[" << file << "] stat error" << std::endl;
        return false;
      }
      time_t cur_time = time(NULL);
      time_t acc_time = st.st_atime;
      if((cur_time - acc_time) < HEAT_TIME) {
        return false;
      }
      return true;
    }
    
    // 2.3. 对文件进行压缩存储
    bool CompressFile(std::string& file, std::string& gzip) {
      int fd = open(file.c_str(), O_RDONLY);
      if(fd < 0) {
        std::cerr << "com open file:[" << file << "] error" << std::endl;
        return false;
      }
      gzFile gf = gzopen(gzip.c_str(), "wb");
      if(gf == NULL) {
        std::cerr << "com open gzip:[" << gzip << "] error" << std::endl;
        return false;
      }
      int ret;
      char buf[1024];
      flock(fd, LOCK_SH);
      while((ret = read(fd, buf, 1024)) > 0) {
        gzwrite(gf, buf, ret);
      }
      flock(fd, LOCK_UN);
      close(fd);
      gzclose(gf);
      unlink(file.c_str());
      // 文件正在被系统或其他进程使用时无法删除
      return true;
    }

功能实现流程

0. 压缩文件记录格式 filename gzipname\n
1. 获取文件压缩信息
2. 打开压缩记录文件，将数据读取到body中，根据"\n"进行分割，存储在vector中，分割字符串存储在map中，存储的格式为filename->gzipname
3. 启动线程对文件进行循环监控，判断文件是否需要压缩存储
4. 遍历未压缩目录，对目录下每一个文件进行判断是否超时未访问
5. 使用Linux下的接口stat获取文件的最后一次访问时间，使用当前时间-最后一次访问时间，若大于设定的低热度时间，就判定未需要压缩的文件，否则跳过
6. 打开一个压缩文件，将文件中的数据读取到buf中，再将buf中的数据写入压缩文件中，压缩过程由gzwrite完成
7. 压缩完成后，将源文件删除，并将源文件与压缩文件的对应关系记录在map中
8. 将map中保存的文件对应信息写入压缩信息文件中，下一次服务端启动时，源文件与压缩文件的对应关系可以直接读取，如果没有记录，下一次启动，之前压缩后的文件就找不到了

调用接口解析

bf::create_directory // boost库中创建目录接口，未压缩文件与压缩文件不保存在一起
stat // Linux下的接口，用于获取文件的最后一次访问时间
gzwrite // 写入压缩文件中，压缩的过程由接口中的代码完成
unlink // Linux下的接口，用于删除一个文件，如果文件正在被使用，则报错退出

源码地址：https://github.com/JustDocat/project-for-backup

可扩展的功能

文件的上传信息，与压缩信息的备份信息，可保存在数据库中
可以使用安全的https进行数据传输
在极端条件下(文件的大小未发生改变，文件的修改日期也没有发生改变)，则不会上传，可以使用摘要技术，扫描全文，内容改变则进行上传

项目性能测试地址：https://blog.csdn.net/Thinker_serious/article/details/99954314

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
快乐春节 Lilywo
春节肯定是大多小朋友都喜欢的节日吧，因为春节的娱乐项目可多啦，下面我就带大家去看一看某些娱乐项目吧！第一件肯定就是穿新衣啦！因为辞旧迎新，一年过去了，要迎来新的一年。所以过年穿新衣也是一项习俗吧；第二件，收压岁钱。压岁钱大家都知道吧，过年的时候，小朋友们肯定都会受到大人们的压岁钱吧，对啦！大家知道为什么亲人们会给我们压岁钱呢？答案是因为亲人们希望我们在新的一年里可以健健康康、平平安安，幸福福的生活
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
基于STM32的汽车仪表显示系统：集成CAN、UART与I2C总线设计流程极客小张 stm32 汽车嵌入式硬件物联网单片机 c语言
一、项目概述项目目标与用途本项目旨在设计和实现一个基于STM32微控制器的汽车仪表显示系统。该系统能够实时显示汽车的速度、转速、油量等关键信息，并通过CAN总线与其他汽车控制单元进行通信。这种仪表显示系统不仅提高了驾驶的安全性和便捷性，还能为汽车提供更智能的用户体验。技术栈关键词微控制器：STM32显示技术：TFTLCD/OLED传感器：速度传感器、温度传感器、油量传感器通信协议：CAN总线、UA
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
项目：事半功倍的法宝小小效能
行动的三大流程：记录、排程和执行，也讲了易效能的4D原则以及T-step标签法。这些流程和方法能够解决我们眼前的一地鸡毛，让我们有更多时间和精力去关注更为长远的事情，完成工作、生活和人生中重要的项目。项目管理能够让我们围绕结果去做事情，达成事半功倍的效果，也就是做更少的事情，但达成更好的效果。如果我们能够不断地达成一个又一个的项目，那么我们的人生无疑会像滚雪球一样，在长坡道上面不断积累。一、项目的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

自动监控备份系统--项目详情

自动监控备份系统

源码地址：https://github.com/JustDocat/project-for-backup

项目性能测试：https://blog.csdn.net/Thinker_serious/article/details/99954314

项目功能介绍

项目环境搭建

项目模块划分

具体模块实现与代码解析

客户端

服务端

"; body += ""; body += file; body += ""; body += "

filename

源码地址：https://github.com/JustDocat/project-for-backup

可扩展的功能

项目性能测试地址：https://blog.csdn.net/Thinker_serious/article/details/99954314

你可能感兴趣的:(项目)