20122952

MongoDB从入门到放弃！

概述：大家对数据库肯定不陌生，肯定也有很多人用过MySQL，但是在用MySQL的时候各种建表，写表之间的关联让人非常头疼。

MongoDB也是一种数据库，但是它不是用表，而是用集合来装数据的。

MongoDB官方：https://www.mongodb.com/

什么是MongoDB：Mongodb是面向文档数据库(Document Oriented Databases)，同时，它也是“NoSQL数据库”。

MongoDB 是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统。

MongoDB 将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档，数组及文档数组。

下表将帮助您更容易理解Mongo中的一些概念：

SQL术语/概念	MongoDB术语/概念	解释/说明
database	database	数据库
table	collection	数据库表/集合
row	document	数据记录行/文档
column	field	数据字段/域
index	index	索引
table joins		表连接,MongoDB不支持
primary key	primary key	主键,MongoDB自动将_id字段设置为主键

通过下图实例，我们也可以更直观的了解Mongo中的一些概念：

MongoDB的安装

1.去mongodb的官网http://www.mongodb.org/downloads下载msi安装包（CommunityServer版本）。安装的默认路径是：C:\Program Files\MongoDB\Server\3.6\bin

2.为了启动mongodb方便，将mongod.exe路径加入环境变量。电脑->属性->高级系统设置->环境变量,在path里加入默认路径：C:\Program Files\MongoDB\Server\3.6\bin

3.在D盘新建一个mongodb文件夹用来放数据文件，并在mongodb文件夹下建立data,logs文件夹，在logs文件夹下建立mongodb.log文件

4.以管理员启动cmd，并且输入：mongod --dbpath D:\mongodb\data\ --logpath D:\mongodb\logs\mongodb.log --install --serviceName"MongoDB"

5.以管理员启动cmd，net start mongodb启动mongodb服务；mongo 127.0.0.1:27017进入mongo数据库；net stop MongoDB关闭mongodb服务

mongoDB采用BSON结构来存储数据和网络数据交换

BSON是一种类json的一种二进制形式的存储格式，简称Binary JSON，它和JSON一样，支持内嵌的文档对象和数组对象，但是BSON有JSON没有的一些数据类型，如Date和BinData类型。

BSON可以做为网络数据交换的一种存储形式，这个有点类似于Google的Protocol Buffer，但是BSON是一种schema-less的存储形式，它的优点是灵活性高，但它的缺点是空间利用率不是很理想，BSON有三个特点：轻量性、可遍历性、高效性。

把这种格式转化成一文档这个概念(Document)，因为BSON是schema-free的，所以在MongoDB中所对应的文档也有这个特征，这里的一个Document也可以理解成关系数据库中的一条记录(Record)，只是这里的Document的变化更丰富一些，如Document可以嵌套。

MongoDB以BSON做为其存储结构的一种重要原因是其可遍历性。

几个BSON的例子

一个Document的BSON表示：

代码如下:

{  
title:"MongoDB",  
last_editor:"192.168.1.122",  
last_modified:new Data("27/06/2011"),  
body:"MongoDB introduction",  
categories:["Database","NoSQL","BSON"],  
revieved:false  
}

这是一个简单的BSON结构体，其中每一个element都是由key/value对组成的

一个嵌套的例子

代码如下:

{  
name:"lemo",  
age:"12",  
address:{  
city:"suzhou",  
country:"china",  
code:215000  
}  
scores:[  
{"name":"english","grade:3.0},  
{"name":"chinese","grade:2.0}  
]  
}

MongoDb可以操作的数据类型（文档，集合）

1：文档

概述

文档是MongoDB的核心概念，是数据的基本单元，非常类似于关系数据库中的行。在MongoDB中，文档表示为键值对的一个有序集。MongoDB使用Javascript shell，文档的表示一般使用Javascript里面的对象的样式来标记，如下：

1 {"title":"hello!"}
2 {"title":"hello!","recommend":5}
3 {"title":"hello!","recommend":5,"author":{"firstname":"paul","lastname":"frank"}}

从上面的例子可以看到，文档的值有不同的数据类型，甚至可以是一个完整的内嵌文档（最后一个示例的author是有一个完整的文档表示的，文档里面定义了firstname和lastname。当然还可以包含更多其他信息甚至于在内嵌文档中还可以有内嵌文档）。

说明

文档区分大小写和数据类型，所以以下两组文档是不同的：

1 {"recommend":"5"}  
2 {"recommend":5}

1 {"Recommend":"5"}
1 {"recommend":"5"}

MongoDB的文档不能有重复的键。下面的文档是非法的：

{"title":"hello!","title":"Mongo"}

操作

创建

创建文档非常简单，通过插入语句就能向数据库中创建一个文档记录。

1 > db.blogs.insert({"title":"hello!"})

如果在执行这条语句之前，数据库和blogs集合并没有创建，会分别创建数据库和集合，同时插入文档。

删除

1 > db.blogs.remove()   // 删除集合中所有文档。
2 > db.blogs.remove({"title":"hello!"})   // 删除指定条件的文档，当前语句删除"title"为"hello!"的文档。

2：集合

集合是一组文档的集，相当于关系型数据库中的数据表。

动态模式

集合是动态模式的。什么意思呢？具体来说就是一个集合里面的文档可以是各式各样的。举例来说，下面的两种文档完全可以存储在同一个集合里面：

1 {"title":"hello!"}
2 {"recommend":5}

可以看出，上面两个文档不仅值得类型不同，连键也完全不一样。这和关系型数据库中一个表中只能存放相同模型的数据结构显得很不一样。但是这也就产生了一个问题：既然一个集合中可以存放任意的文档，那么多个集合的存在还有什么必要性呢？这其实可以和关系型数据表可以对应起来理解，我们可以创建一张表容纳下上面提到的title和recommend列，但是总有一个列是NULL的。这还仅仅是两个列的情况，如果出现无数的列，那么这种情况就非常糟糕了。所以不难想出一个数据库中存在多个集合的原因应该至少有如下几点：

数据混乱。开发人员要区分每次查询只返回特定类型的文档，或者把这个区分交给处理查询结果的应用程序来处理。这对于开发和维护来说都会带来很大的麻烦。
性能。分别在不同的集合上查询要比在一个集合中去查询不同数据快得多。
数据更集中。同种类型的文档放在一个集合里，数据更加集中，查询数据时。需要的磁盘寻道操作更少，效率更高。
更高效的利用索引。索引是按照集合来定义的。创建索引时，需要使用文档的附加结构。在一个集合中只放入一种类型的文档，可以更有效的对集合进行索引。

常用命令

show collections 查看当前数据库中存在哪些集合，将展示集合的名称列表。如下图所示：
help() 获取集合上的可执行命令的列表。执行语句如下：
```
1 db.users.help()
```
insert(obj) 向集合中插入一个文档。
drop() 删除当前集合，删除之后不可恢复。
dropIndex(index) 删除集合上的索引，参数为空时，删除所有索引（除了_id上的索引）
ensureIndex(keypattern[,options]) 创建索引
update(query,object[,upsert_bool,multi_bool]) 更新集合中满足条件的文档
find([query,fields]) 根据条件查询满足条件的文档

当然还有很多命令在这里没有列出，但是可以通过help()命令轻松的查看能在集合上执行的命令。

数据库

多个文档构成集合，多个集合组成数据库。一个MongoDB实例可以承载多个数据库，每个数据库可以拥有0到多个集合。

每个数据库有相应的数据文件和命名空间文件。文件的前缀是数据库的名称，后缀.ns表示命名空间文件，后缀以.0、.1等数字结尾的，表示数据文件。
数据文件的大小从64MB开始（这是在64位Windows Server 2012上看到的结果，其他环境可能有些差异），新的数据文件比上一个文件大一倍。所以能看到，chen.0的大小是64MB，chen.1的大小是128MB，chen.2是256MB。
文件使用MMAP进行内存映射，会将所有的数据文件映射到内存中，但是只是虚拟内存，只有访问到这块数据时才会交换到物力内存中。
每个数据文件会被分成一个一个的数据块，块与块之间用双向链表链接。
在命名空间文件中，保存了每个命名空间的存储信息元数据，包括其大小、块数、第一块的位置、最后一块的位置、被删除的块的链表以及索引信息。

数据库操作

1.创建并进入数据库

use DATABASE_NAME

创建名字为TEST的数据库，并进入数据库；如果数据库已存在，则直接进入数据库。

use TEST

2.显示数据库。

show dbs

显示所有数据库

show dbs

3.删除数据库

db.dropDatabase()

删除TEST数据库

use TEST
db.dropDatabase()

集合操作

1.创建集合

db.createCollection(name, options)

创建集合名imooc的数据库

db.createCollection("imooc")

2.查看集合。

show collections

查看所有集合

show collections

3.删除集合

db.COLLECTION_NAME.drop()

删除集合imooc

db.imooc.drop()

数据操作

1.create操作

db.collection.insertOne()
db.collection.insertMany()
db.collection.insert()

写入单条和多条数据：

db.inventory.insertOne(
   { item: "canvas", qty: 100, tags: ["cotton"], size: { h: 28, w: 35.5, uom: "cm" } }
)
db.inventory.insertMany([
   { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } },
   { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } },
   { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } }
])

2.Read操作

db.collection.find()

查找status为"D"的数据，并且显示5条。

db.inventory.find( { status: "D" } ).limit(5)

查找status为"D"的数据，并且以格式化显示。

db.inventory.find( { status: "D" } ).pretty()

查找status为"A"或"D"的数据。

db.inventory.find( { status: { $in: [ "A", "D" ] } } )

查找status为"A"并且qty为30的数据。

db.inventory.find( { status: "A", qty: 30} )

查找status为"A"或者qty为30的数据。

db.inventory.find( { $or: [ { status: "A" }, { qty:30 } ] } )

查找status为"A"的第二条数据。

db.inventory.find( { "status.1":  "A" } )

查找instock属性中qty为20的数据。（instock属性是一个集合）

db.inventory.find( { 'instock.qty': 20 } )

查找instock属性中qty为20的第一条数据。（instock属性是一个集合）

db.inventory.find( { 'instock.0.qty': 20 } )

查找status为"A"的数据，并且只返回_id,item和status字段

db.inventory.find( { status: "A" }, { item: 1, status: 1 } )

查找status为"A"的数据，并且只返回item字段，不返回status和_id字段

db.inventory.find( { status: "A" }, { item: 1, status: 0, _id: 0 } )

查找status为"A"的数据，并且只返回_id和item字段，以及size字段的uom属性

db.inventory.find({ status: "A" }, { item: 1, "size.uom": 1 })

查找item为null或者不存在item属性的数据

db.inventory.find( { item: null } )

查找item属性为null的数据

db.inventory.find( { item : { $type: 10 } } )

查找不存在item属性的数据

db.inventory.find( { item : { $exists: false } } )

相当于db.users.find( { type: 2 } )，因为结果返回一个循环指针

var myCursor = db.users.find( { type: 2 } );
myCursor

3.Update操作

db.collection.updateOne()
db.collection.updateMany()
db.collection.replaceOne()
db.collection.update()

将item为"paper"的第一条数据的size.uom改为"cm"，status改为"P"

db.inventory.updateOne(
   { item: "paper" },
   {
     $set: { "size.uom": "cm", status: "P" },
   }
)

将item为"paper"的所有数据的size.uom改为"cm"，status改为"P"

db.inventory.updateMany(
   { item: "paper" },
   {
     $set: { "size.uom": "cm", status: "P" },
   }
)

把item为"paper"的第一个数据替换为后一个数据

db.inventory.replaceOne(
   { item: "paper" },
   { item: "paper", instock: [ { warehouse: "A", qty: 60 }, { warehouse: "B", qty: 40 } ] }
)

4.delete操作

db.collection.deleteOne()
db.collection.deleteMany()
db.collection.remove()

删除第一个status为"D"的数据；删除所有status为"D"的数据

db.inventory.deleteOne( { status: "D" } )
db.inventory.deleteMany( { status: "D" } )

Docker 部署 MongoDB

1. 拉取 docker 镜像

docker pull mongo:3.4

2. 运行

docker run -d --name mongodb --volume /usr/local/mongodata:/data/db -p 27017:27017 mongo:3.4 --auth

3. 进入 mongo

docker exec -it mongodb mongo

4. 创建数据库帐号

use admin;db.createUser({ user: 'root', pwd: '123', roles: [ { role: "root", db: "admin" } ] });

5. 安装 mongo-express 可视化工具

docker run -d --name mongo-express -p 8081:8081 --link mongodb:mongo --env ME_CONFIG_MONGODB_ADMINUSERNAME='root' --env ME_CONFIG_MONGODB_ADMINPASSWORD='123' mongo-express

mongoDB索引的使用

索引也是一种常见的查询优化的方式

Index

索引

我们在users的collection上面为name字段创建索引

db.users.ensureIndex({"name":1})

查询该collection上面已经创建了哪些索引

 db.users.getIndexes()

通过查询发现该collection上面为id和name创建了索引，其中_id是默认的索引。

删除字段name上面的索引

db.users.dropIndex({"name":1})

复合索引

在name和age上面创建复合索引

 db.users.ensureIndex({"name":1,"age":-1})

该复合索引被创建后，基于name和age的查询将会用到该索引，或者是基于name的查询也会用到该索引，但是只是基于age的查询将不会用到该复合索引。

因此，如果想用到复合索引，必须在查询条件中包含复合索引中的前N个索引列。然而如果查询条件中的键值顺序和复合索引中的创建顺序不一致的话，MongoDB可以智能的帮助我们调整该顺序，以便使复合索引可以为查询所用。

唯一索引

默认情况下创建的索引都不是唯一索引，如果创建唯一索引需要unique参数设置为true

为name创建唯一索引

 db.users.ensureIndex({"name":1},{"unique":true})

如果这时插入重复的name值，就会报错

[MongoDB]count，gourp，distinct

作用类似sql中的count函数，用来计数。

如上图所示，列举了不带参数，带参数，以及先find后count的方式。

distinct

去重，接收字段参数，语义：按某字段去重。比如上图中，我们按name去重。

group

顾名思义是分组的意思，与sql中group by相同。但在mongodb中group就比较复杂了。

参数：

key：按照key进行分组。

initial：每组都分享的“初始化函数”。可以在此处初始化一些变量，供每组进行使用。

$reduce：该函数有两个参数，第一个参数是当前document对象，第二个参数是上次操作的累计对象。collection中有多少个document就会调用多少次$reduce。

condition：过滤条件。

finalize：该函数会在每组document执行完成后，就会调用该函数，可以在这个函数中，做一些后续的工作，比如进行计数操作，统计结果的个数。

例子：根据age进行分组，查找每个年龄段的人员姓名。如图一所示：

图一

计数，分组后，符合条件的user有多少个。

SpringBoot整合mongoDB

MongoDB 是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。

这一片文章介绍一个springboot整合mongodb，如果你了解整合mysql之类的数据库，可以一带而过。

还是同样的套路，pom文件中加入mongodb依赖，完整pom文件如下：



	4.0.0

	com.mongo.web
	springboot_mongo
	0.0.1-SNAPSHOT
	war

	springboot_mongo
	Demo project for Spring Boot

	
		org.springframework.boot
		spring-boot-starter-parent
		2.0.4.RELEASE
		 
	

	
		UTF-8
		UTF-8
		1.8
	

	
		
			org.springframework.boot
			spring-boot-starter-web
		

		
			org.springframework.boot
			spring-boot-starter-tomcat
			provided
		
		
			org.springframework.boot
			spring-boot-starter-test
			test
		

		
		
			org.springframework.boot
			spring-boot-starter-data-mongodb
		
	

	
		
			
				org.springframework.boot
				spring-boot-maven-plugin

配置文件中，配置对应mongodb的数据库信息，这里只配置了数据库地址，端口号，数据库名称，配置如下：

spring:
  data:
    mongodb:
      uri: mongodb://10.2.4.35:27017/test
  application:
    name: mongoweb
server:
  port: 8888

也是一样的创建一个实体类，如下：

package com.mongo.mongoweb.serviceimpl;


import java.util.List;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.domain.Pageable;
import org.springframework.data.mongodb.core.MongoTemplate;
import org.springframework.data.mongodb.core.query.Criteria;
import org.springframework.data.mongodb.core.query.Query;
import org.springframework.data.mongodb.core.query.Update;
import org.springframework.stereotype.Service;

import com.mongo.mongoweb.model.User;
import com.mongo.mongoweb.service.UserService;

@Service
public class UserServiceImpl implements UserService{

	/**
	 * 由springboot自动注入，默认配置会产生mongoTemplate这个bean
	 */
	@Autowired
	private MongoTemplate mongoTemplate;

	/**
	 * 查找全部
	 */
	@Override
	public List findAll() {
		return mongoTemplate.findAll(User.class);
	}

	/**
	 * 根据id得到对象
	 */
	@Override
	public User getUser(String id) {
		return mongoTemplate.findOne(new Query(Criteria.where("id").is(id)), User.class);
	}

	/**
	 * 插入一个用户
	 */
	@Override
	public void insert(User user) {
		mongoTemplate.insert(user);
	}

	/**
	 * 根据id删除一个用户
	 */
	@Override
	public void remove(Integer id) {
		Criteria criteria = Criteria.where("id").is(id);
		Query query = new Query(criteria);
		mongoTemplate.remove(query, User.class);
	}

	/**
	 * 分页查找
	 * 
	 * user代表过滤条件
	 * 
	 * pageable代表分页bean
	 */
	@Override
	public List findByPage(User user, Pageable pageable) {
		Query query = new Query();
		if (user != null && user.getName() != null) {
			//模糊查询
			query = new Query(Criteria.where("name").regex("^" + user.getName()));
		}
		List list = mongoTemplate.find(query.with(pageable), User.class);
		return list;
	}


	/**
	 * 根据id更新
	 */
	@Override
	public void update(User user) {
		Criteria criteria = Criteria.where("id").is(user.getId());
		Query query = new Query(criteria);
		Update update = Update.update("name", user.getName()).set("age", user.getAge());
		mongoTemplate.updateMulti(query, update, User.class);
	}

	/**
	 * 插入一个集合
	 */
	@Override
	public void insertAll(List users) {
		mongoTemplate.insertAll(users);
	}

	/**
	 * test  测试mongodb
	 * @param user
	 * @return
	 */
	@Override
	public List show(User user) {
		mongoTemplate.insert(user);
		List all = mongoTemplate.findAll(User.class);
		return all;
	}

}

创建一个数据操作层，继承MongoRepository，代码如下：

package com.mongo.mongoweb.controller;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.domain.PageRequest;
import org.springframework.data.domain.Pageable;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import com.mongo.mongoweb.model.User;
import com.mongo.mongoweb.service.UserService;

/**
 * user控制器
 *
 */
@RestController
@RequestMapping("/user")
public class UserController {

	@Autowired
	private UserService userService;

	@GetMapping("/get/{id}")
	public User getUser(@PathVariable String id) {
		return userService.getUser(id);
	}

	@GetMapping("/delete/{id}")
	public String delete(@PathVariable int id) {
		userService.remove(id);
		return "delete sucess";
	}

	@GetMapping("/add")
	public String insert() {
		User user =new User(16, ""+16, 16);
		userService.insert(user);
		return "sucess";
	}

	@GetMapping("/insert")
	public String insertAll() {
		List list = new ArrayList<>();
		for (int i = 10; i < 15; i++) {
			list.add(new User(i, "" + i, i));
		}
		userService.insertAll(list);
		return "sucess";
	}

	@GetMapping("/find/all")
	public List find(){
		return userService.findAll();
	}

	@GetMapping("/find/{start}")
	public List findByPage(@PathVariable int start,User user){
		Pageable pageable=new PageRequest(start, 2);
		return userService.findByPage(user, pageable);
	}

	@GetMapping("/update/{id}")
	public String update(@PathVariable int id){
		User user =new User(id, ""+1, 1);
		userService.update(user);
		return "sucess";
	}

	@GetMapping("/test")
	public Object test(){
		User user =new User(123, "test1234", 123);
		List list = userService.show(user);
		return list;
	}

}

到这里就结束了，可以启动项目访问http://localhost:8888/test

然后访问http://localhost:8888/user/test可以查看刚才创建的数据，如下图：

[{
	"_id": "5b7b742ae4b89c144cb976a0",
	"id": 123,
	"name": "test1234",
	"age": 123
}, {
	"_id": "5b7b7443e4b89c2a10cb3dc2",
	"id": 123,
	"name": "test1234",
	"age": 123
}, {
	"_id": "5b7b7445e4b89c2a10cb3dc3",
	"id": 123,
	"name": "test1234",
	"age": 123
}, {
	"_id": "5b7c1673e4b89c213cec3021",
	"id": 123,
	"name": "test1234",
	"age": 123
}]

修改和删除这里就不做测试了，在方法上有对应的测试访问地址。

这里做一个简单的总结，通过整合几种数据库，包含关系型数据mysql，文件式数据库mongodb，甚至说elasticsearch等等其实步骤都大致如下：

1.加入对应依赖
2.配置文件配置对应数据库信息
3.数据操作层继承想要的repository

mongoDB主从复制

主从复制这种方式很灵活.可用于备份,故障恢复,读扩展等.
最基本的设置方式就是建立一个主节点和一个或多个从节点,每个从节点要知道主节点的地址.
这里我们用一主一从实现mongodb的复制

服务器已经安装好了mongoDB,直接就可以运行mongo Client,我们要创建自己的mongod实例,
首先把容器自行运行的先停止

mongod --shutdown

创建master实例

mongod --master --port=27081 --dbpath=/data/masterdb --logpath=/data/masterlog --fork

建 slave实例

mongod --slave  --port=27083 --dbpath=/data/slavedb --logpath=/data/slavelog   --source=27081    --fork

查看mongo进程

root@mongodb-671984-3837ac52-ky93c:~# ps -ef|grep mongod
root       116     1  0 13:09 ?        00:00:05 mongod --master --port=27081 --dbpath=/data/masterdb --logpath=/data/masterlog --fork
root       173     1  0 13:20 ?        00:00:01 mongod --slave --port=27083 --dbpath=/data/slavedb --logpath=/data/slavelog --source=27081 --fork
root       279    64  0 13:24 pts/0    00:00:00 grep mongod

测试 master,slave

连接master

 mongo --port 27081

在mongo client 执行下列命令

> rs.isMaster()
{
    "ismaster" : true,
    "maxBsonObjectSize" : 16777216,
    "maxMessageSizeBytes" : 48000000,
    "maxWriteBatchSize" : 1000,
    "localTime" : ISODate("2016-09-13T05:29:37.302Z"),
    "maxWireVersion" : 4,
    "minWireVersion" : 0,
    "ok" : 1
}
> use blogs
switched to db blogs
> db.blog.insert({BlogName:"ike's Blog",writer:"ike" })
WriteResult({ "nInserted" : 1 })

连接slave

 mongo --port 27083

在mongo client 执行下列命令

> rs.isMaster()

> use blogs
switched to db blogs
> db.blog.find()
Error: error: { "ok" : 0, "errmsg" : "not master and slaveOk=false", "code" : 13435 }

Error的原因是从机默认不支持读写 ,解决办法:

> rs.slaveOk()

mongoDB主重复值特点

1.副本集具有2个或者多个节点(一般最少3个)
2.副本集具有一个主节点,其他都是从节点
3.所有数据都是从主节点到从节点的.
4.当主节点故障,从节点会自行推举一个新的主节点
5.当失败节点恢复后,连接副本集后,重新作为从节点

MongoDB集群之分片技术应用

分片的目的：改善单台机器数据的存储及数据吞吐性能。提高在大量数据下随机访问性能

MongoDB分片成员节点（Shard，Config，Mongos）

分片：分片是指将数据拆分，将其分散存放在不同的机器上的过程。有时也用分区（partitioning）来表示这个概念。

几乎所有数据库软件都能进行手动分片（manual sharding）。应用需要维护与若干不同数据库服务器的连接，每个连接还是完全独立的。应用程序管理不同服务器上不同数据的存储，还管理在合适的数据库上查询数据的工作。

Mongodb支持自动分片（autosharding），可以使数据库架构对应用程序不可见，也可以简化系统管理。Mongodb自动处理数据在分片上的分布，也更容易添加和删除分片。

Mongodb的分片机制允许你创建一个包含许多台机器（分片）的集群。将数据子集分散在集群中，每个分片维护着一个数据集合的子集。与单个服务器和副本集相比，使用集群架构可以使应用程序具有更大的数据处理能力。

复制是让多台服务器都拥有同样的数据副本，每一台服务器都是其它服务器的镜像，而每一个分片和其它分片拥有不同的数据子集。

为了对应用程序隐藏数据库架构的细节，在分片之前要先执行mongos进行一次路由过程。这个路由服务器维护着一个“内容列表”，指明了每个分片包含什么数据内容。应用程序只需要连接到路由服务器，就可以像使用单机服务器一样进行正常的请求了。路由服务器知道哪些数据位于哪个分片，可以将请求转发给相应的分片。每个分片对请求的响应都会发送给路由服务器，路由服务器将所有响应合并在一起，返回给应用程序。对应用程序来说，它只知道自己是连接到了一台单机mongod服务器。

在分片之前，集合实际上是一个单一的数据块。分片依据片键将集合拆分为多个数据块，这块数据块被分布在集群中的每个分片上：

注意，数据块列表开始的键值和结束的键值：$minkey和$maxkey。可以将$minkey认为是”负无穷“，它比MongoDB中的任何值都要小。类似地，可以将$maxkey认为是”正无穷“，它比MongoDB中的任何值都要大。片键值的范围始终位于$minkey和$maxkey之间。这些值实际上是BSON类型。只是用于内部使用，不应该被用在应用程序中。如果希望在shell中使用的话，可以用Minkey和Maxkey常量代替。

现在数据已经分布在多个分片上了，接下来做一个查询操作。首先，做一个基于指定的用户名的查询：

>db.users.find({username : "user12345"})
{
  "_id" : ObjectId("50b0451951d30ac5782499e6"),
  "username" : "user12345",
  "created_at" : ISODate("2012-11-24T03:55:05.636Z")
}

可以看到查询可以正常工作，现在运行explain()来看看MongoDB到底是如何处理这次查询的：

>db.users.find(username : "user12345").explain()
    {
      "clusteredType" : "ParallelSort",
      "shards" : {
	    	"localhost : 30001" : [{
	    		"cursor" : "BtreeCursor username_1"，
	    		"nscanned" : 1,
	    		"nscannedObjects" : 1,
	    		"n" : 1,
	    		"millis" : 0,
	    		"nYields" : 0,
	    		"nChunkSkips" : 0,
	    		"isMultiKey" : false,
	    		"indexOnly" : false,
	    		"indexBounds" : {
	    			"username" : [[
	    			               "user12345",
	    			               "user12345"
	    			               ]
	    			              ]
	    		}
	    	}]
     },
    "n" : 1,
    "nChunkSkips" : 0,
    "nYields" : 0,
    "nscanned" : 1,
    "nscannedObjects" : 1,
    "millisTotal" : 0,
    "millsAvg" : 0,
    "numQueries" : 1,
    "numShards" : 1
    }

输出信息包含两个部分，一个看起来比较普遍的explain()输出嵌套在另一个explain()输出中。外层的explain()输出来自mongos：描述了为了处理这个查询，mongos所做的工作。内层的explain()输出来自查询所使用的分片。在本例中是localhost：30001。

由于”username“是片键，所以mongos能够直接将查询发送到正确的分片上。作为对比，来看一下查询所有数据的过程：

>db.users.find().explain()
    {
    	"clusteredType" : "ParallelSort",
    	"shards" : {
	    	"localhost : 30000" : [{
	    		"cursor" : "BasicCursor"，
	    		"nscanned" : 37393,
	    		"nscannedObjects" : 37393,
	    		"n" : 37393,
	    		"millis" : 38,
	    		"nYields" : 0,
	    		"nChunkSkips" : 0,
	    		"isMultiKey" : false,
	    		"indexOnly" : false,
	    		"indexBounds" : {
	    			
	    		}
	    	}],
	    	"localhost : 30001" : [{
	    		"cursor" : "BasicCursor"，
	    		"nscanned" : 31303,
	    		"nscannedObjects" : 31303,
	    		"n" : 31303,
	    		"millis" : 37,
	    		"nYields" : 0,
	    		"nChunkSkips" : 0,
	    		"isMultiKey" : false,
	    		"indexOnly" : false,
	    		"indexBounds" : {
 
	    		}
	    	}],
	    	"localhost : 30002" : [{
	    		"cursor" : "BasicCursor"，
	    		"nscanned" : 31304,
	    		"nscannedObjects" : 31304,
	    		"n" : 31304,
	    		"millis" : 36,
	    		"nYields" : 0,
	    		"nChunkSkips" : 0,
	    		"isMultiKey" : false,
	    		"indexOnly" : false,
	    		"indexBounds" : {
 
	    		}
	    	}]
    	},
    "n" : 100000,
    "nChunkSkips" : 0,
    "nYields" : 0,
    "nscanned" : 100000,
    "nscannedObjects" : 100000,
    "millisTotal" : 111,
    "millsAvg" : 37,
    "numQueries" : 3,
    "numShards" : 3
    }

可以看到，这次查询不得不访问所有3个分片，查询出所有数据。通常来说，如果没有在查询中使用片键，mongos就不得不将查询发送到每个分片。包含片键的查询能够直接被发送到目标分片或者是集群分片的一个子集，这样的查询叫做定向查询（targeted query）。有些查询必须被发送到所有分片，这样的查询叫做分散--聚集查询（scatter-gather query）：mongos将查询分散到所有分片上，然后将各个分片的查询结果聚集起来。

运行cluster.stop()就可以关闭整个集群了。

>cluster.stop()

mongoDB分片成员节点

另外一个副本集:

# mongod --port 27011 --dbpath /data/smail_data1 --logpath /var/smail_log1/mongodb.log --keyFile /var/key/mongodb.key --shardsvr  --replSet rs_1 --clusterAut
hMode keyFile --fork --logappend
# mongod --port 27012 --dbpath /data/smail_data2 --logpath /var/smail_log2/mongodb.log --keyFile /var/key/mongodb.key --shardsvr  --replSet rs_1 --clusterAut
hMode keyFile --fork --logappend
# mongod --port 27013 --dbpath /data/smail_data3 --logpath /var/smail_log3/mongodb.log --keyFile /var/key/mongodb.key --shardsvr  --replSet rs_1 --clusterAut
hMode keyFile --fork --logappend

# mongo  --port 27011
> conf={_id:'rs_1',members:[{_id:1,host:'10.166.224.7:27011'}]}
{
    "_id" : "rs_1",
    "members" : [
        {
            "_id" : 1,
            "host" : "10.166.224.7:27011"   ## 10.166.224.7
        }
    ]
}
> rs.initiate(conf)
{ "ok" : 1 }


rs_1:PRIMARY> db.createUser({user:'root',pwd:'root',roles:["root"]})
Successfully added user: { "user" : "root", "roles" : [ "root" ] }
rs_1:PRIMARY> db.auth('root','root')
1
rs_1:PRIMARY> rs.add('10.166.224.7:27013')
{ "ok" : 1 }
rs_1:PRIMARY> rs.add('10.166.224.7:27012')
{ "ok" : 1 }

里有两个细节:
1.节点之间需要keyfile认证,集群内节点使用keyFile使用的秘钥必须相同
2.不同的服务器使用同一网段注册节点,config server和副本集的配置信息不要使用127.0.0.1 或者localhost

config server

mongod --configsvr --port 27019  --dbpath=/data/medium_conf --logpath=/var/conf_log/mongodbconf.log --fork  --logappend --keyFile /var/key/mongodb.key  --clusterAuthMode keyFile
root@medium-701747-230f8712-ee7xm:~# mongo --port 27019
configsvr> use admin
switched to db admin
configsvr> db.createUser(user:'root',pwd:'root',roles:["root"])

mongos

mongos --port 27021  --logpath=/var/mongosdb_log/mongos.log --fork --logappend  --configdb 10.166.224.4:27019 --keyFile /var/key/mongodb.key  --clusterAuthMode keyFile
                                                                                          ## 使用和分片同一网段的ip

Add Shard

momgo --port 27021

mongos> use admin
switched to db admin
mongos> db.auth('root','root')

mongos> sh.addShard("rs_2/10.166.224.4:27011")   ##添加同一主机下的shard成员
{ "shardAdded" : "rs_2", "ok" : 1 }

mongos> sh.addShard("rs_1/10.166.224.7:27011")  ##添加10.166.224.7下的shard成员
{ "shardAdded" : "rs_1", "ok" : 1 }

mongos> sh.status()   ## sharding status

Enable Sharding

测试分片集群:

mongos> use test  ##database
mongos> for(i=0;i<20000;i++){db.shardtest.insert({'url':'intricate-sutra.com','name':"ike's blog",'i':i})};   ##collection:shardtest
mongos> db.shardtest.stats()   ##查看集合状态,发现shards内只有rs_1一个shard

##数据分片
mongos> sh.enableSharding("test")  
mongos> sh.shardCollection("test.shardtest",{_id:1})

束后balance会根据chunk的数量进行数据迁移,直到chunk的数量平均分配到每个shard上,如图:

chunk和balance

balancing:
均衡器负责数据的迁移,会周期性的检查分片是否存在不均衡,如果存在balance进程会进行chunk的迁移.
balance进行均衡的条件是chunk数量的多少,而不是chunk大小

mongos> use config
mongos> db.locks.find({_id:"balancer"}).pretty()  ##查看balance的状态

chunk:
chunkSize的大小默认是64M,可以修改chunk的大小,使数据分布更均衡

mongos> use config
mongos> db.settings.save({"_id" : "chunksize", "value" : NumberLong(32)})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })

也可以在数据插入前配置数据存储chunk

mongos> sh.enableSharding('test')
mongos> db.createCollection("job" )  ##创建集合:test.job
mongos> sh.shardCollection('test.job',{'offer':1})
mongos> sh.splitAt("test.job",{offer:20})   ##按offer的20作为split的点

splitting是后台进程,按照middle或者chunk大小splitting数据,上面的操作就是按照middle(split的点)划分.

哈希分片(hash key)

分片过程中利用哈希索引作为分片的单个键.
哈希分片的片键只能使用一个字段.
哈希片键最大的好处就是保证数据在各个节点分布基本均匀.

手动分片

请求查询机制

简单通过路由查询（Routed Request）:当一个查询请求发送到mongos之后，mongos会根据内部的一些机制定位到某一个shard上面，然后shard将查询结果返回给mongos。

方式二、分散聚合查询（scatter gather request）:当一个查询请求发送到mongos之后，mongos会将此查询分散到多个shard节点进行查询。然后shard成员节点返回对应的结果由mongos进行结合将最终的结果返回给用户。

方式三、分布式排序查询机制（distributed merge sort request）:当一个排序查询请求发送到mongos之后，mongos会将此查询分散到多个shard节点进行查询。然后shard成员节点返回对应的结果（此结果是在shard内部排好序的）由mongos进行结合将最终的结果返回给用户。

注：Shard：分片 Replocation：副本集

MongDB行业应用

比如游戏、物流、电商、内容管理、社交、物联网、视频直播等，以下是几个实际的应用案例。

游戏场景：使用 MongoDB 存储游戏用户信息，用户的装备、积分等直接以内嵌文档的形式存储，方便查询、更新

物流场景：使用 MongoDB 存储订单信息，订单状态在运送过程中会不断更新，以 MongoDB 内嵌数组的形式来存储，一次查询就能将订单所有的变更读取出来。

社交场景：使用 MongoDB 存储存储用户信息，以及用户发表的朋友圈信息，通过地理位置索引实现附近的人、地点等功能

物联网场景：使用 MongoDB 存储所有接入的智能设备信息，以及设备汇报的日志信息，并对这些信息进行多维度的分析

视频直播：使用 MongoDB 存储用户信息、礼物信息等

你可能感兴趣的:(技术分享)

mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
打造高效医院运维团队：一体化监控能力的全方位提升 MXsoft618 运维管理软件运维软件智能运维管理系统运维
在数字化时代，医院信息系统的稳定运行至关重要。为了提高医院运维团队的一体化运维监控能力，我们需要从多个方面入手，构建一套全面、高效的运维体系。首先，培训和技能提升是基石。我们应该为运维团队提供定期的技术培训，使他们熟练掌握新监控工具的使用技巧，学习系统故障排查方法和性能优化手段。此外，通过组织技术分享会，团队成员能够及时了解最新的运维技术和行业趋势，保持与时俱进。其次，制定标准化流程和规范对于提升
技术分享会回顾｜Rust在量化领域如何应用？非凸科技 Rust招聘量化私募 Rust汇报 rust 开发语言后端
很多人会问：未来几年，国内量化机构都会考虑用Rust吗？Rust在量化领域如何应用？又有什么独特优势？就高频量化交易系统而言，Rust比C++强吗？如何看待Rust的应用前景？......为满足大家的好奇心，3月6日，非凸科技与Rust中文社区联合举办了一场线上技术分享会。非凸科技北京分公司负责人朱为老师就“国内外量化发展现状、Rust在量化领域应用、典型工作场景以及招聘职位等方面进行了分享。满满
【启明智显技术分享】探讨CAN总线相关知识以及Model3C 2路CAN的应用启明智显 M系列产品工业HMI HMI芯片 CAN 启明智显 MODEL3C
一、CAN总线相关知识CAN总线概述CAN（ControllerAreaNetwork）总线是一种高实时性、高可靠性和灵活性的串行通信协议，广泛应用于汽车和工业控制系统中。它由德国BOSCH公司开发，最高速率可达到1Mbps，具有强大的检错和处理机制，以及高抗干扰性和自诊断能力。1、CAN总线特点高实时性：CAN总线采用非破坏性仲裁技术，确保高优先级数据能够优先传输。高可靠性：CAN总线具有强大的
uni-app技术分享|开源demo视频呼叫arcall uni-app端技术实现 anyRTC 音视频 uni-app技术分享视频通话 webrtc 呼叫邀请视频通话音视频 uni-app
介绍基本uniapp_arcall是通过uniapp实现的语音通话、视频通话以及相关配套的呼叫邀请。解决向指定用户发起呼叫通知，对方接受后进行通话的场景需求。呼叫邀请基本流程
2022副业项目，无人直播技术分享，一台手机就可以搞定的兼职副业 dieyiwang 自动化
项目分享假如你在2022年新冠疫情席卷的当下都还没掌握一个网络项目，那你是真的应当反思一下了，所以只有网上+线下双确保，才能确保自己的一个稳定收入给大家分享的是视频无人直播新项目【详尽拆卸】，抖音无人在线，实际上一直都是蓝海项目里的一条瀚海大白鲨，因为他既可在门坎和投资成本很低的并且把转现发挥到极致。一、无人直播详细介绍根据抖音直播平台所进行的没有人直播卖货，根据素材内容（包括照片、短视频、声频）
【QNX+Android虚拟化方案】116 - Android 侧 NFS Client 挂载 QNX NFS Server 目录不成功问题排查方法 "小夜猫&小懒虫&小财迷"的男人 android
【QNX+Android虚拟化方案】116-Android侧NFSClient挂载QNXNFSServer目录不成功问题排查方法一、QNX侧1.检查镜像是否挂载成功：/mnt/nfs_shared_dir目录2.检查/mnt/etc/exports文件配置是否正确3.检查nfsd、rpcbind两个服务程序是否在后台工作正常二、Android检查方法基于原生纯净代码，自学总结纯技术分享，不会也不敢
【QNX+Android虚拟化方案】105 - 如何替换 NON-HLOS.bin 中的 Wifi Firmware 固件 "小夜猫&小懒虫&小财迷"的男人 nohlos
【QNX+Android虚拟化方案】105-如何替换NON-HLOS.bin中的WifiFirmware固件1、提取NON-HLOS.bin中的WifiFirmware出来2、把提取出来的wifi固件放到代码中3、重新打包生成NON-HLOS.bin4、将生成的NON-HLOS.bin与老的NON-HLOS.bin对比5、使用fastboot下载测试wifi基于原生纯净代码，自学总结纯技术分享，不
【QNX+Android虚拟化方案】119 - Android USB相关调试命令 "小夜猫&小懒虫&小财迷"的男人 android
【QNX+Android虚拟化方案】119-AndroidUSB相关调试命令基于原生纯净代码，自学总结纯技术分享，不会也不敢涉项目、不泄密、不传播代码文档！！！本文禁止转载分享！！！汇总链接：《【QNX+Android虚拟化方案】00-系列文章链接汇总》本文链接：《【QNX+Android虚拟化方案】119-AndroidUSB相关调试命令》telnet192.168.1.1//进入android
技术分享-商品篇-售后退款退货（十八） bobo-rs 技术分享商城篇 B2B B2B2C B2C 退款退货售后退款商城
前言我们在前面的内容中聊完了商品、购物、支付、订单等四大金刚，接下来我们在了解一下售后退款在B2C商城中重要性。总所周知我们在日常购物中，支付了不喜欢的商品，或者发现质量问题等，不想要已购买的订单，这时我们会在原订单详情，找到退款功能，进行退款或者退货，这是一个最基本商城功能，所以若是我们设计的商城系统没有退款的这个模块，在各平台小程序是无法进行上架使用的，比如某微，此功能是整个系统闭环的重要节点
技术分享 | app自动化测试（Android）--元素定位方式与隐式等待霍格沃兹测试开发学社测试人社区软件测试技能自动化运维
本文节选自霍格沃兹测试开发学社内部教材元素定位是UI自动化测试中最关键的一步，假如没有定位到元素，也就无法完成对页面的操作。那么在页面中如何定位到想要的元素，本小节讨论Appium元素定位方式。Appium的元素定位方式定位页面的元素有很多方式，比如可以通过ID、accessibility_id、XPath等方式进行元素定位，还可以使用Android、iOS工作引擎里面提供的定位方式。隐式等待设置
MyBatis整体架构分析：基础支持层、核心处理层和接口层阿里Java程序员程序员 java 经验分享面试
欢迎关注专栏：Java架构技术进阶。里面有大量batj面试题集锦，还有各种技术分享，如有好文章也欢迎投稿哦。MyBatis的整体架构分为三层，分别是基础支持层、核心处理层和接口层，如下图所示。基础支持层反射模块该模块对Java原生的反射进行了良好的封装，提供了更加简洁易用的API，方便上层使调用，并且对反射操作进行了一系列优化，例如缓存了类的元数据，提高了反射操作的性能。类型转换模块类型转换模块提
web前端技术分享：koa中间件是如何实现的？程序员的小傲娇 web前端编程语言 web
在前端开发过程中我们可能会使用到koa中间件，但很多同学却不知道它是如何实现的，下面小千就来给大家介绍一下这个koa中间件（洋葱模型）。一、问题分析asyncawait是promise的语法糖，await后面跟一个promise，所以上面的代码可以写成：改成这样更好理解一些，所以流程控制的核心在于next的实现。next要求调用队列中下一个middleware，当达到最后一个的时候resolve。
黄金三年，京东后端新人的技术破茧之路京东零售技术技术成长
作者：京麦研发李泽阳引言2021年毕业于中国科学院大学，作为校招新力量入职京东，目前主要负责商家内容资讯和商家AI智能助手。工作中追求做实事，做有价值的事，乐于技术分享，撰写的文章多次在京东云、京东零售技术传播。先后获得部门年度卓越员工、618卓越个人、京东技术品牌影响力新星。生活中喜爱马拉松跑步和旅行摄影，找不到答案的时候，就去看看这个世界。本文主要讲述了作为应届毕业生从校园到职场，黄金三年的进
【PHP进阶】Redis管道技术的实际运用程序员若风+ php redis bootstrap
大家好，我是程序员若风，又到了技术分享时刻。今天我们来讲讲Redis管道技术Redis管道技术介绍Redis流水线技术是一种通过同时发出多个命令来提高性能的技术，而无需等待对每个单独命令的响应。大多数Redis客户端都支持流水线操作。–官网英文直译若风粗暴解释如果我们同时有10个查询命令要执行，如果不借助管道技术，那么就是10次网络IO请求，借助管道技术，我们可以将10条命令打包同时传输给Redi
【PHP进阶】Redis管道技术的实际运用程序员若风+ 后端
大家好，我是程序员若风，又到了技术分享时刻。今天我们来讲讲Redis管道技术Redis管道技术介绍Redis流水线技术是一种通过同时发出多个命令来提高性能的技术，而无需等待对每个单独命令的响应。大多数Redis客户端都支持流水线操作。--官网英文直译若风粗暴解释如果我们同时有10个查询命令要执行，如果不借助管道技术，那么就是10次网络IO请求，借助管道技术，我们可以将10条命令打包同时传输给Red
技术分享 | Web自动化之Selenium安装霍格沃兹测试开发学社
⬇️复制“下方链接”，提升测试核心竞争力！更多技术文章分享和免费资料领取原文链接Web应用程序的验收测试常常涉及一些手工任务，例如打开一个浏览器，并执行一个测试用例中所描述的操作。但是手工执行的任务容易出现人为的错误，也比较费时间。因此，将这些任务自动化，就可以消除人为因素。Selenium可以帮助我们自动化完成验收测试，通过构建更严格的测试，从而使软件更为可靠也更易于维护。Selenium支持W
统信UOS_麒麟KYLINOS上不覆盖高版本依赖包的情况下批量安装软件鹏大圣运维 linux 统信 UOS linux 操作系统国产化服务器桌面统信麒麟
原文链接：统信UOS/麒麟KYLINOS上在不覆盖高版本依赖包的情况下批量安装软件大家好！在使用基于Debian的Linux发行版，如统信UOS和麒麟KYLINOS时，deb包作为软件安装包的格式非常常见。今天，我将为大家带来一个实用的技术分享，即如何在不覆盖系统中已有更高版本软件依赖包的情况下，批量安装deb包。这个需求在日常管理工作中尤为重要，尤其是当我们需要在多台机器上部署软件，或者更新某个
技术分享 | 测试平台开发-前端开发之数据展示与分析霍格沃兹_Tester
测试平台的数据展示与分析，我们主要使用开源工具ECharts来进行数据的展示与分析。ECharts简介与安装ECharts是一款基于JavaScript的数据可视化图表库，提供直观，生动，可交互，可个性化定制的数据可视化图表，功能非常强大，目前ECharts已经发布到ECharts5版本。我们的项目也选择Echarts来作为我们的数据展示与分析工具。ECharts官网：https://echart
非常不错！来教你用 Python 批量生成 PDF 文档 VIP_CQCRE python java 编程语言 linux 人工智能
这是「进击的Coder」的第495篇技术分享作者：Ckend来源：Python实用宝典“阅读本文大概需要4分钟。”日常办公中，经常会使用PDF文档，难免需要对PDF文档进行编辑，有时候PDF文档中的大部分内容都是一样的，只是发送对象不同。这种模板套用的场景下，使用Python进行自动化就尤为方便，用最短的时间办最高效的事。今天就给大家讲讲如何用Python自动套用模板批量生成下方这样的PDF文档。
我的创作纪念日 OldGj_ 创作
机缘成为CSDN博客网站创作者初心记录成长：作为大二学生，我深知在技术领域的学习是一个持续不断的过程。通过在CSDN博客上记录我的学习经历和成长，我可以清晰地追踪自己的进步，并为未来的学习和职业发展做好记录和总结。技术知识分享：我将我的CSDN博客视为一个技术分享的平台，我希望通过分享我的Java技术栈内容和数据结构相关知识，帮助其他学习者更好地理解和掌握这些知识，共同进步。自我技术提升：通过在C
见世面的成本有多低？这几个技术公众号告诉你答案傅一平
独乐乐，不如众乐乐，为您精选以下公众号！人工智能爱好者社区专注人工智能、机器学习、数据科学等顶尖技术前沿科技成果研究、实战技巧。每周会有书豪采访记系列采访技术大佬文章和原创漫画文章，立即关注，掌握人工智能最新资讯与成果。号主是《R数据科学实战：工具详解与案例分析》书籍作者。大数据分析挖掘和Python机器学习商业智能BI、数据分析、数据挖掘、大数据、Python、机器学习、深度学习、算法等技术分享
C#/.NET/.NET Core学习、工作 He少年 .net .netcore c#数据结构
‍C#/.NET/.NETCore学习、工作、面试指南让现在的自己不再迷茫✨✨✨。DotNetGuideDotNetGuide技术社区是一个面向.NET开发者的开源技术社区，旨在为开发者们提供全面的C#/.NET/.NETCore相关学习资料、技术分享和咨询、项目推荐、招聘资讯和解决问题的平台。在这个社区中，开发者们可以分享自己的技术文章、项目经验、遇到的疑难技术问题以及解决方案，并且还有机会结识
一文彻底搞懂数据库三范式数据库
一个三线城市的国企码农，热爱技术，在这里和大家分享在国企搞技术的点点滴滴。欢迎大家关注我的微信公众号：果冻想前言每天开各种会议，这不刚刚结束的组织生活会的批评环节，我又收到了一条批评，说我技术分享不多，不够，没有有效起到传帮带的作用。好吧，以后就把这些日常的传帮带都总结起来，发到这里，作为一个记录，也以备组内小兄弟们后续翻阅查看。这几天在整理数据库表的时候，看到之前的支撑方建的那些表，简直不忍直视
技术分享 | 关于 MySQL Online DDL 有趣的验证爱可生开源社区
作者：胡存存爱可生DBA团队成员，主要负责MySQL故障处理和SQL审核优化。对技术执着，为客户负责。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。MySQL在5.6引入OnlineDDL之后，在5.7和8.0版本又对这一功能进行了大幅的优化。尤其是在8.0之后，已经实现了列的秒加。在5.7中有些DDL操作也实现了秒修改，比如修改字段的默认值，修改
常见内网穿透工具，收好了！互联网架构
因公众号更改推送规则，请点“在看”并加“星标”第一时间获取精彩技术分享点击关注#互联网架构师公众号，领取架构师全套资料都在这里0、2T架构师学习资料干货分上一篇：2T架构师学习资料干货分享大家好，我是互联网架构师！文章来源：https://v0w.top/2020/08/11/IntranetProxy/前言本文以渗透的视角，总结几种个人常用的内网穿透，内网代理工具，介绍其简单原理和使用方法。1.
技术分享 | kubernetes operator 简介爱可生开源社区
作者：沈亚军爱可生研发团队成员，负责公司DMP产品的后端开发，爱好太广，三天三夜都说不完，低调低调...本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。k8soperator介绍k8sOperator是一种用于特定应用的控制器，可扩展KubernetesAPI的功能，来代表k8s用户创建、配置和管理复杂应用的实例，它基于基本k8s资源和控制器概念构建
Java后端开发三年，你不得不了解的JVM zwb_jianshu
喜欢的朋友可以关注下专栏：Java架构技术进阶。里面有大量batj面试题集锦，还有各种技术分享，如有好文章也欢迎投稿哦。JAVA程序员，三年是个坎，如果过了三年你还没有去研究JVM的话，那么你这个程序员只能是板砖的工具了。下面来个JVM的解析可好？JVM是JavaVirtualMachine（Java虚拟机）的缩写，也就是指的JVM虚拟机，属于是一种虚构出来的计算机，在我们实际的电脑上来进行模拟各
利用Windows10漏洞破解密码(保姆级教学) 可惜已不在 windows 安全 windows
前言:本篇博客只是技术分享并非非法传播知识,实验内容均是在虚拟机中进行,并非真实环境正文:一.windows10电脑密码破解1)开启windows10虚拟机,停留在这个页面2）按5次Shift键,出现这个粘滞键,如果没有出现的,则说明漏洞已经修复3)重新启动,在这个页面的时候,再次重新启动4)到出现这个页面的时候停止5)输入命令notepad打开记事本6)点击文件,选择所有文件7)打开路径C:/W
前端技术分享：页面性能优化问题复盘有道AI情报局有道技术团队前端性能优化 javascript
项目背景在code_pc项目中，前端需要使用rrweb对老师教学内容进行录制，学员可以进行录制回放。为减小录制文件体积，当前的录制策略是先录制一次全量快照，后续录制增量快照，录制阶段实际就是通过MutationObserver监听DOM元素变化，然后将一个个事件push到数组中。为了进行持久化存储，可以将录制数据压缩后序列化为JSON文件。老师会将JSON文件放入课件包中，打成压缩包上传到教务系统
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》