踏着阳光

MongoDB开发使用手册

一．基础部分

MongDB简介

NOSQL历史和产生原因

原因: 互联网用户数的增长和用户参与互联网习惯的改变

初始的静态内容网站，提供中心化的内容服务，

特点: 中心化，用户阅读内容

系统：Apache

动态网页内容，电子商务和论坛网站出现。

特点: 用户访问动态内容，并提供少量内容

系统：Apache+Mysql+Php, IIS+ASP+SQLSERVER, IIS+ASP.net+SQLSERVER, TOMCAT+JSP+ORACLE

3. 博客出现: 去中心化网站出现。

特点：Web2.0网站的雏形用户阅读内容，并开始更多地参与网站的交互

系统: 高并发访问，数据库压力增大 Memcached 缓存的出现，并出现数据库集群的概念

微博，淘宝等网站出现，以及云计算平台出现，如google，百度广告，等大规模系统

特点: 用户重复参与网站交互，和内容提供，而系统需要对用户行为进行分析

系统：支持高并发，及时响应，并能够实现分布式计算

NOSQL：Memcached, Redis, Hbase, 等NOSQL数据库，不仅仅是简单缓存，并能够提供分布式要求，包括复制，分片，水平分区，并提供复杂格式的数据存储

总结:

高并发读写操作

普通关系型数据库，很难满足高并发读写的要求，上万次读写的需求

海量数据存储

上亿用户产生大量数据，包括用户数据，访问日志，用户提供内容，用户状态记录等，这种海量数据的存储，关系型数据库已经很难满足，尤其是从海量数据中提取和汇总数据成为瓶颈

高可用性和高扩展性

关系型数据库也能支持，同步复制，水平分区扩展，但维护工作相当繁杂，并很难做到热扩展

内存操作(快速), 并发量高(非阻塞进程), 硬盘回写(数据完整和高效的平衡),备份和恢复

复制(高可用性，和连续服务), 分片(热扩展，海量数据) 操作简单(JSON)，负载均衡，

分布式部署(局域网，和物理部分), 事务支持

2. 主流的NOSQL介绍

数据库类型	开发语言	特性	应用场景
CouchDB	Erlang	特点：DB一致性，易于使用使用许可： Apache 协议： HTTP/REST 双向数据复制持续进行或临时处理处理时带冲突检查因此，采用的是master-master复制(见编注2) MVCC - 写操作不阻塞读操作可保存文件之前的版本 Crash-only(可靠的)设计需要不时地进行数据压缩视图：嵌入式映射/减少格式化视图：列表显示支持进行服务器端文档验证支持认证根据变化实时更新支持附件处理因此，CouchApps(独立的 js应用程序) 需要 jQuery程序库	适用于数据变化较少，执行预定义查询，进行数据统计的应用程序。适用于需要提供数据版本支持的应用程序。如CMS系统，数据统计汇总
Redis	C	特点：运行异常快使用许可： BSD 协议：类 Telnet 读写操作异常快较复杂的数据格式 sets, 链表，hash 事务支持消息订阅 pub/sub 主从同步复制硬盘回写第三方sharding支持	适用于数据变化快且数据库大小可遇见(适合内存容量)的应用程序股票价格、数据分析、实时数据搜集、实时通讯配置下发，全局实时数据
Mongodb	C++	特点：保留了SQL一些友好的特性(查询，索引)。使用许可： AGPL(发起者： Apache) 协议： Custom, binary( BSON) 支持javascript表达式硬盘回写主从复制和集群功能内建分片机制较快读写性能大格式数据支持 7．空数据库大约占 192Mb 8. 事务支持	1．大数据量查询和汇总 2．分布式部署，和水平扩展数据统计汇总业务数据库，替代Mysql
Neo4j	Java	特点：基于关系的图形数据库使用许可： GPL，其中一些特性使用 AGPL/商业许可协议： HTTP/REST(或嵌入在 Java中) 1．可独立使用或嵌入到 Java应用程序 2．图形的节点和边都可以带有元数据 3．很好的自带web管理功能 4．使用多种算法支持路径搜索 5．使用键值和关系进行索引 6．支持事务(用 Java api) 7．使用 Gremlin图形遍历语言 8．支持 Groovy脚本 9．支持在线备份，高级监控及高可靠性支持使用	适用于图形一类数据。这是 Neo4j与其他nosql数据库的最显著区别例如：社会关系，公共交通网络，地图及网络拓谱
HBase	Java	特点：支持数十亿行X上百万列使用许可： Apache 协议：HTTP/REST (支持 Thrift，见编注4) 采用分布式架构 Map/reduce 对实时查询进行优化高性能 Thrift网关通过在server端扫描及过滤实现对查询操作预判支持 XML, Protobuf, 和binary的HTTP 对配置改变和较小的升级都会重新回滚不会出现单点故障	适用于偏好BigTable:)并且需要对大数据进行随机、实时访问的场合报表，数据挖掘
Memcache	C	快速简单分布式支持和热扩展	KV数据库数据库辅助缓存

3．Mongodb概述

3.1．Mongodb 内部文件和内存管理

结构: Database,Collection,Document

逻辑关系对比
Mongodb	Mysql
Db(数据库)	Database(数据库)
Collection(集合)	Table(表)
Document(文档)	Row(行)
Field(列)	Col(字段)

每个数据库都有相应的数据库文件

示例: 新建了两个数据库(test,test1)，并在两个collection(user1,user2)分别插入记录

显示相关数据

[root@localhost db]# ls -l

-rwxr-xr-x 1 root root 5 12-23 17:07 mongod.lock

-rw------- 1 root root 16777216 12-23 17:08 test.0

-rw------- 1 root root 33554432 12-23 17:08 test.1

-rw------- 1 root root 16777216 12-23 17:08 test1.0

-rw------- 1 root root 33554432 12-23 17:08 test1.1

-rw------- 1 root root 16777216 12-23 17:08 test1.ns

-rw------- 1 root root 16777216 12-23 17:08 test.ns

drwxr-xr-x 2 root root 4096 12-23 17:08 _tmp

分别按两倍递增，16M,32M,64M,128M…..2G，最大为2G,所以mongodb单服务器和数据库最大存储上限为2G

内存管理方式

Mongod启动时，会载入相应文件到物理内存，并把内存管理交给系统，内存使用和结构如下所示，如果数据量很大，mongod启动的速度会较慢
物理内存，虚拟内存，swap, MMAP

使用MMAP映射文件到虚拟内存，并映射虚拟内存到实际的物理内存

32bit 内存上限为 4G-1G(内核占用)-0.5堆栈 =2.5 即32位系统的内存可寻址上限是2.5G

62bit 内存上限为12T 所以mongodb的单数据库上限也相应的增加

所以32位系统mongod的单数据库文件上限为2G

物理文件被分成相应的块，每个块之间使用双向链表来连接

内存按照16M,32M,64M…2G递增方式进行分配，会预留相应的内存空间

这是mongod会大量消耗内存的原因，即使一条记录，也会占用16M的内存空间，并且还不包括test1.ns所预先分配的内存空间

这样的机制有利于防止较小的数据库浪费过多的磁盘空间，同时又能保证较大的数据库有相应的预留空间使用。

Test.ns 名字空间索引，保存着相应的文件索引

每一条记录保存着相应的名字空间(包括collection的关键信息)

内存的分配，新加入的数据，看是否有适合的空闲内存块可以分配，如果没有则增加新的数据块

Mongodb需要定期来进行数据压缩，以释放掉相应的空闲内存，移动相应数据，把内存碎片整理成完整的内存块，以便于进行重新分配。

>repairDatabase()

>db.runCommand({ compact : 'yourCollection' });

分别进行数据库的压缩和单个集合的压缩

3.2．BSON数据格式

索引的概念—数据库

Mongdb的安装和配置

下载

http://www.mongodb.org/downloads

Linux ,windows, mac osx, solaris 编译和Source版安装
建议选择64bit版本，能够支持更大的数据存储，32bit仅仅支持最大2G的文件
建议选择编译版本安装，能够适应特性的硬件和系统平台，能够进行定制和配置安装，而且效率较高，不会出现兼容性错误，建议在产生环境使用
一般选择在linux平台安装

在linux平台安装

步骤1: 解压

>cp xx.tgz /usr/local

>tar zxvf mongodb.tgz

>cd /usr/local/mongodb

>mkdir db

>mkdir logs

步骤3: 启动mongodb

>cd /usr/local/mongodb/bin

>/usr/local/mongodb/bin/mongod –dbpath=/usr/local/mongodb/db –logpath=/usr/local/mongodb/logs/mongo.log --fork

步骤4：安装相应的服务

> vi /etc/rc.local

添加 /usr/local/mongodb/bin/mongod –dbpath=/usr/local/mongodb/db –logpath=/usr/local/mongodb/logs/mongo.log --fork

步骤5 连接mongod

>mongo

步骤6 查看mongo日志

>vi /usr/local/mongodb/logs/mongodb.log

Windows平台安装

步骤1: 解压mongoxx.zip到指定目录如c:\

>c:\mongodb\db

>c:\mongodb\logs

步骤3: 启动mongodb

>cd c:\mongodb\bin

>mongod –dbpath=c:\mongodb\db –logpath=c:\mongodb\logs\mongodb.log

步骤4：安装相应的服务

> mongod –dbpath=c:\mongodb\db –logpath=c:\mongodb\logs\mongodb.log

>net start mongodb

步骤5 连接mongod

>mongo

步骤6 查看mongo日志

Linux 源码安装(待完善)
配置参数说明

基本配置

--------------------------------------------------------------------------------

--quiet # 安静输出

--port arg # 指定服务端口号，默认端口27017

--bind_ip arg # 绑定服务IP，若绑定127.0.0.1，则只能本机访问，不指定默认本地所有IP

--logpath arg # 指定MongoDB日志文件，注意是指定文件不是目录

--logappend # 使用追加的方式写日志

--pidfilepath arg # PID File 的完整路径，如果没有设置，则没有PID文件

--keyFile arg # 集群的私钥的完整路径，只对于Replica Set 架构有效

--unixSocketPrefix arg # UNIX域套接字替代目录,(默认为 /tmp)

--fork # 以守护进程的方式运行MongoDB，创建服务器进程

--auth # 启用验证

--cpu # 定期显示CPU的CPU利用率和iowait

--dbpath arg # 指定数据库路径

--diaglog arg # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads

--directoryperdb # 设置每个数据库将被保存在一个单独的目录

--journal # 启用日志选项，MongoDB的数据操作将会写入到journal文件夹的文件里

--journalOptions arg # 启用日志诊断选项

--ipv6 # 启用IPv6选项

--jsonp # 允许JSONP形式通过HTTP访问（有安全影响）

--maxConns arg # 最大同时连接数默认2000

--noauth # 不启用验证

--nohttpinterface # 关闭http接口，默认关闭27018端口访问

--noprealloc # 禁用数据文件预分配(往往影响性能)

--noscripting # 禁用脚本引擎

--notablescan # 不允许表扫描

--nounixsocket # 禁用Unix套接字监听

--nssize arg (=16) # 设置信数据库.ns文件大小(MB)

--objcheck # 在收到客户数据,检查的有效性，

--profile arg # 档案参数 0=off 1=slow, 2=all

--quota # 限制每个数据库的文件数，设置默认为8

--quotaFiles arg # number of files allower per db, requires --quota

--rest # 开启简单的rest API

--repair # 修复所有数据库run repair on all dbs

--repairpath arg # 修复库生成的文件的目录,默认为目录名称dbpath

--slowms arg (=100) # value of slow for profile and console log

--smallfiles # 使用较小的默认文件

--syncdelay arg (=60) # 数据写入磁盘的时间秒数(0=never,不推荐)

--sysinfo # 打印一些诊断系统信息

--upgrade # 如果需要升级数据库

* Replicaton 参数

--------------------------------------------------------------------------------

--fastsync # 从一个dbpath里启用从库复制服务，该dbpath的数据库是主库的快照，可用于快速启用同步

--autoresync # 如果从库与主库同步数据差得多，自动重新同步，

--oplogSize arg # 设置oplog的大小(MB)

* 主/从参数

--------------------------------------------------------------------------------

--master # 主库模式

--slave # 从库模式

--source arg # 从库端口号

--only arg # 指定单一的数据库复制

--slavedelay arg # 设置从库同步主库的延迟时间

* Replica set(副本集)选项：

--------------------------------------------------------------------------------

--replSet arg # 设置副本集名称

* Sharding(分片)选项

--------------------------------------------------------------------------------

--configsvr # 声明这是一个集群的config服务,默认端口27019，默认目录/data/configdb

--shardsvr # 声明这是一个集群的分片,默认端口27018

--noMoveParanoia # 关闭偏执为moveChunk数据保存?

配置文件示例

# mongo.conf

#where to log

logpath=/var/log/mongo/mongod.log

logappend=true

# fork and run in background

fork = true

#port = 27017

dbpath=/var/lib/mongo

# Enables periodic logging of CPU utilization and I/O wait

#cpu = true

# Turn on/off security. Off is currently the default

#noauth = true

#auth = true

# Verbose logging output.

#verbose = true

# Inspect all client data for validity on receipt (useful for

# developing drivers)

#objcheck = true

# Enable db quota management

#quota = true

# Set oplogging level where n is

# 0=off (default)

# 1=W

# 2=R

# 3=both

# 7=W+some reads

#oplog = 0

# Diagnostic/debugging option

#nocursors = true

# Ignore query hints

#nohints = true

# Disable the HTTP interface (Defaults to localhost:27018).

#nohttpinterface = true

# Turns off server-side scripting. This will result in greatly limited

# functionality

#noscripting = true

# Turns off table scans. Any query that would do a table scan fails.

#notablescan = true

# Disable data file preallocation.

#noprealloc = true

# Specify .ns file size for new databases.

# nssize =

# Accout token for Mongo monitoring server.

#mms-token =

# Server name for Mongo monitoring server.

#mms-name =

# Ping interval for Mongo monitoring server.

#mms-interval =

# Replication Options

# in replicated mongo databases, specify here whether this is a slave or master

#slave = true

#source = master.example.com

# Slave only: specify a single database to replicate

#only = master.example.com

# or

#master = true

#source = slave.example.com

# Address of a server to pair with.

#pairwith =

# Address of arbiter server.

#arbiter =

# Automatically resync if slave data is stale

#autoresync

# Custom size for replication operation log.

#oplogSize =

# Size limit for in-memory storage of op ids.

#opIdMem =

停止mongodb

命令方式

>use admin

switched to db admin

>db.shutdownServer()

进程方式

ps –aef | grep mongod

kill -2

简单的数据操作

1. 切换并产生数据库

>use tutorise

在切换数据库时，如果数据库不存在，则直接产生数据库

2. 插入相应数据

>db.user.insert({username:'gaoyu'})

当collection不存在时，产生相应的数据库集，并插入相应数据

此过程会分配内存，并产生相应的文件，同时插入数据，所以第一次插入的速度会相对较慢

3. 显示所有数据

>db.user.find()

{ "_id" : ObjectId("4ef311a1776fbc2bc7dd038f"), "username" : "gaoyu" }

没有附带相应的查询条件，所以会显示所有的数据条目

4. 继续插入数据

>db.user.save({username:'Jone'})

>db.user.count()

并统计整体collection 的数据条目数

解释相应的ObjectID,这是在Collection中唯一的数值，是mongodb自动进行分配的，HASH

5. 进行相应的查询

>db.user.find({username:'gaoyu'})

查询username 为gaoyu的所有记录，

find(查询匹配表达式) 查询匹配表达式也是JSON形式，字段:'内容'

6. 数据更新

数据更新分为两种形式，包括简单数据更新，和复杂数据更新

简单数据更新

>db.user.update({username:'gaoyu'},{$set:{countty:'tianjin'}})

db.user.update({更新查询条件},{$set:{更新内容}})

更新符合查询条件的内容，如果字段不存在，则添加相应字段并进行更新

更新复杂的数据

db.users.update( {username: "Jone"},

{ $set:{favorites:

{

cities: ["Chicago", "Cheyenne"],

movies: ["Casablanca", "The Sting"]

}

})

7. 删除数据

进行Collection的整体删除

>db.user.remove()

仅仅是移除数据从user,而并不是进行物理删除，如果要进行实际的物理删除可以使用

>db.user.drop()

进行实际的物理删除

8. 产生相应的索引

1. 插入相应的200000条数据

>for(i=0;i<2000000;i++){

>...db.numbers.save({num:i});

>...}

2. 查询相应的数据

>db.numbers.find()

>db.numbers.count()

>200000

3. 进行相应数据范围查询

db.numbers.find( {num: {"$gt": 199995 }} ).explain()

{

"cursor" : "BasicCursor",

"nscanned" : 200000,

"nscannedObjects" : 200000,

"n" : 4,

"millis" : 136,

"nYields" : 0,

"nChunkSkips" : 0,

"isMultiKey" : false,

"indexOnly" : false,

"indexBounds" : {

}

1. "cursor" : "BasicCursor", 表示仅仅使用了基础游标，对整表进行了相应的扫描

2. "nscanned" : 200000, 扫描记录数为200000

3. "n" : 4, 得到四条匹配记录

4. "millis" : 136, 用时 136毫妙

5. "indexOnly" : false, 是否使用索引

常用工具集

MongoDB在bin目录下提供了一系列有用的工具，这些工具提供了MongoDB在运维管理上方便。

l bsondump: 将bson格式的文件转储为json 格式的数据

l mongo: 客户端命令行工具，其实也是一个js 解释器，支持js 语法

l mongod: 数据库服务端，每个实例启动一个进程，可以fork 为后台运行

l mongodump/ mongorestore: 数据库备份和恢复工具

l mongoexport/ mongoimport: 数据导出和导入工具

l mongofiles: GridFS管理工具，可实现二制文件的存取

l mongos: 分片路由，如果使用了sharding 功能，则应用程序连接的是mongos而不是

l mongosniff: 这一工具的作用类似于tcpdump，不同的是他只监控MongoDB相关的包请求，并且是以指定的可读性的形式输出

l mongostat: 实时性能监控工具

二．mongoDB应用开发

MongoDB机制

组成

mongodb分为客户端，和服务器两部分，分别按照Mongodb的通信协议负责不同的职责，共同完成mongodb的操作

客户端：

负责生成_id hash，按照相应的规则
把客户端提交的内容JSON转化为BSON(二进制的JSON)
和服务端通过TCP Socket进行通讯，把客户端提交内容传递给服务器
接受服务端的返回，并把BSON反序列化为JSON

_ID

生成一个全局唯一的ID

4c342312 238d3c 19bc 000001

4位时间戳机器ID 进程ID 计数器

BSON

http://www.mongodb.org/display/DOCS/Mongo+Wire+Protocol

进行相应的处理

Mongodb进行相应处理，包括查询和插入操作，并返回相应的值(BSON)

设计mongodb数据库

包含以下主题

设计数据库的标准，能够满足应用程序的需求
能够表现，一对一，一对多，多对多模式

电子商务数据库示例

商品表

products =

{_id: new ObjectId("4c4b1476238d3b4dd5003981"),

slug: "book-barrow-9092",

sku: "9092",

descriptuon: "NOSQL数据库开发",

detail{

weight: 230,

weight_unit: "g",

manufacturer: "Tech",

color: "red"

totel_view: 4,

average_view: 4.5

price{

retail: 45,

sale:40

}

price_history{[

{

retail:45

sale:40

start_date: new Date(2011,11,1),

end_date: new Date(2011,12,25)

{

retail:45

sale:30

start_date: new Date(2011,10,1),

end_date: new Date(2011,10,31)

}

]},

category_main: new ObjectId("6a5b1476238d3b4dd5000049"),

tags:["mongodb","computer","book","NOSQL"]

}

产生slug唯一索引，保证sku在products的唯一性

>db.products.ensureIndex({sku: 1}, {unique: true})

>db.products.insert(name:”redis 开发手册”,

>…sku: 9092,

>…slug: “redis cookbook”

>…safe:true

>…}

系统会拒绝进行相应的插入操作，因为唯一索引的问题

Field和字段的概念有所区别，能够递归包含

设计mongodb数据库

包含以下主题

l 设计数据库的标准，能够满足应用程序的需求

l 能够表现，一对一，一对多，多对多模式

1．电子商务数据库示例

商品表

products =

{_id: new ObjectId("4c4b1476238d3b4dd5003981"),

slug: "book-barrow-9092",

sku: "9092",

descriptuon: "NOSQL数据库开发",

detail{

weight: 230,

weight_unit: "g",

manufacturer: "Tech",

color: "red"

totel_view: 4,

average_view: 4.5

price{

retail: 45,

sale:40

}

price_history{[

{

retail:45

sale:40

start_date: new Date(2011,11,1),

end_date: new Date(2011,12,25)

{

retail:45

sale:30

start_date: new Date(2011,10,1),

end_date: new Date(2011,10,31)

}

]},

category_main: new ObjectId("6a5b1476238d3b4dd5000049"),

tags:["mongodb","computer","book","NOSQL"]

}

产生slug唯一索引，保证sku在products的唯一性

>db.products.ensureIndex({sku: 1}, {unique: true})

>db.products.insert(name:”redis 开发手册”,

>…sku: 9092,

>…slug: “redis cookbook”

>…safe:true

>…}

系统会拒绝进行相应的插入操作，因为唯一索引的问题

1． Field和字段的概念有所区别，能够递归包含

关系型数据库设计原则:

范式但出于性能和特殊要求，数据库设计的规则会发生相应的改变

模式1: 一对多模式

和mysql不同，由于mongodb能够保存相应的子文档，所以表现一对多关系可以采用两种方式，分别是内嵌式和关联式

内嵌式表达:

关联式:

广告订单--广告投放

广告订单:

{

_id: ObjectId("4d650d4cf32639266022018d"),

name:"宝洁广告订单1",

start_date:"120909404",

end_date:"133949494",

...

}

广告投放:

{

_id: ObjectId("4d650d4cf32639266022ac01"),

name:"北京推广1",

order_id:"4d650d4cf32639266022018d",

...

}

内嵌式:

{ title: "How to soft-boil an egg",

steps: [

{ desc: "Bring a pot of water to boil.",materials: ["water", "eggs"] },

{ desc: "Gently add the eggs a cook for four minutes.", materials: ["egg timer"]},

{ desc: "Cool the eggs under running water." },

]

}

1. 由于组织结构不同，处理一对多关系，不同于关系型数据库仅仅采用一种关联模式，而存在两种模式

2. 当关联不属于从属关系，而且存在双向查询，则采用关联模式，并需要进行关联键进行索引

3. 当两者属于包含关系，则采用内嵌方式，并且被包含对象不会经常变化，并不会进行双向查询，或对被包含对象进行其他关联查询

4. 是否属于从属关系，是否会进行双向查询

模式2: 多对多关联

由于mongodb不存在连接查询，所以仅仅存在一种方式，即内嵌数组方式

产品--类目

products

{

_id: ObjectId("4d650d4cf32639266022018d"),

title:"mongodb 开发手册"

category_ids:[

ObjectId("4d6574baa6b804ea563c132a"),

ObjectId("4d6574baa6b804ea563c459d")

...

}

高级数据库操作

数据类型

string, integer, boolean, double, null, array, and object.

日期：

>x =new Date()

>d=new ISODate()

>d.getYear()

>d.getMonth()

数据库

建立数据库

产生数据库,转到相应数据，并产生数据库

1. 判断数据库是否存在，如果不存在则在硬盘产生相应的文件

>use magento

删除数据库

删除相应的数据库，和数据库内部的集合，并删除相应的索引，同时删除相应物理文件

>use magento

>db.dropDatabase()

查看数据库状态

> db.stats()

{

"collections" : 3,

"objects" : 10004,

"avgObjSize" : 36.005,

"dataSize" : 360192,

"storageSize" : 791296,

"numExtents" : 7,

"indexes" : 1,

"indexSize" : 425984,

"fileSize" : 201326592,

"ok" : 1

}

系统命令

system.namespaces 显示所有名字空间

system.indexes 显示所有索引

system.profile stores database profiling information.

system.users 显示数据库用户

local.sources 显示所有源

集合

新建集合

产生集合，并分配相应的空间

>db.createCollection(“users”)

>db.createCollection("users", {size: 20000})

显示集合列表

>show collections

修改集合名称

>db.oldname.renameCollection(“newName”)

>db.runCommand({renameCollection:”oldname”,to:”mydb.newname”})

Capped Collection 集合

概念

Capped集合是定长文档，记录集的长度是定长，定数量的
Capped集合的数据库尺寸是预先定制的，如1024K
我们可以预算得到capped记录集的document数，
Capped 的按先后顺序进行插入，如果文档数溢出，则丢弃最早的记录，先进先出的定长队列，并且有系统自动实现
不存在索引，插入和提取速度都相当快

应用:

日志系统: 保留最早日志，并自动抛弃较早日志，或写入到其他集合中
最近浏览: 保存用户最近浏览的记录
最新内容: 保存指定数量的最新内容

产生

>db.createCollection("mycoll", {capped:true, size:100000})

>db.user.actions.count();

>db.user.actions.find();

>db.user.actions.find().sort({"$natural": -1})

系统集合

系统名字空间

> db.system.namespaces.find();

{ "name" : "garden.products" }

{ "name" : "garden.system.indexes" }

{ "name" : "garden.products.$_id_" }

{ "name" : "garden.user.actions", "options" :

{ "create": "user.actions", "capped": true, "size": 1024 } }

系统索引

> db.system.indexes.find();

{ "name" : "_id_", "ns" : "garden.products", "key" : { "_id": 1 } }

索引

Mongo索引采用btree方式，回顾mysql索引

索引是?

Mongodb索引的组织形式?

索引操作

索引的概念

聚类索引，一般索引，btree索引 btree+索引

聚类

Btree

Btree+

索引效果

1. 插入相应的200000条数据

>for(i=0;i<2000000;i++){

>...db.numbers.save({num:i});

>...}

2. 查询相应的数据

>db.numbers.find()

>db.numbers.count()

>200000

3. 进行相应数据范围查询

db.numbers.find( {num: {"$gt": 199995 }} ).explain()

{

"cursor" : "BasicCursor",

"nscanned" : 200000,

"nscannedObjects" : 200000,

"n" : 4,

"millis" : 136,

"nYields" : 0,

"nChunkSkips" : 0,

"isMultiKey" : false,

"indexOnly" : false,

"indexBounds" : {

}

1. "cursor" : "BasicCursor", 表示仅仅使用了基础游标，对整表进行了相应的扫描

2. "nscanned" : 200000, 扫描记录数为200000

3. "n" : 4, 得到四条匹配记录

4. "millis" : 136, 用时 136毫妙

5. "indexOnly" : false, 是否使用索引

> db.numbers.ensureIndex({num:1})

> db.numbers.find( {num: {"$gt": 199995 }} ).explain()

建立索引

>db.numbers.ensureIndex({num:1},{background : true，unique:true, sparse:true, dropDups:true})

>db.factories.ensureIndex( { "metro.city" : 1, "metro.state" : 1 } );

查看索引

> db.numbers.getIndexes()

>db.system.indexes.find()

复合索引

db.things.ensureIndex({j:1, name:-1});

a,b,c

可以使用在下列情况

a,b

a,b,c

唯一索引

db.things.ensureIndex({firstname: 1, lastname: 1}, {unique: true});

删除索引

db.collection.dropIndexes();

db.collection.dropIndex({x: 1, y: -1})

重建索引

db.myCollection.reIndex()

插入

> doc = { author : 'joe', created : new Date('03/28/2009') }

> db.posts.insert(doc);

修改

如果增加相应的field，则把修改记录移动到尾部，并进行field添加和修改

Update操作

db.collection.update( criteria, objNew, upsert, multi )

criteria:条件

objNew:对象

upsert:如果不存在，插入

multi:多值匹配

Set

{ $set : { field : value } }

> db.users.update({"name" : "joe"},

... {"$set" : {"favorite book" :

... ["cat's cradle", "foundation trilogy", "ender's game"]}} )

Unset

{ $unset : { field : 1} }

>db.user.update({name:”test”},{“$unset”:{score:1}})

Inc

{ $inc : { field : value } }

> > db.games.update({"game" : "pinball", "user" : "joe"},

... {"$inc" : {"score" : 10000}})

仅仅能够应用在数值类型的field,也可以使用负值，相当于-

push

{ $push : { field : value } }

> db.user.update({name:”gaoyu”},{“$push”:{favor:”tv”}})

>db.user.update({name:”gaoyu”},{“$push”:{favor:”basketball”}})

如果字段存在，并且是数组类型，则压入相应的值到数据，如果不存在，则创建数组字段，并压入值

pushAll

{ $pushAll : { field : value_array } }

> db.user.update({name:”gaoyu”},{“$push”:{favor:[“tv1”,”tv2”]}})

压入一个数组，如果字段存在，则压入所有值，不存在，则添加数组，不是数组类型报错

pop

{ $pop : { field : 1 } } { $pop : { field : -1 } }

> db.user.update({name:”gaoyu”},{“$pop”:{favor:1}})

>db.user.update({name:”gaoyu”},{“$pop”:{favor:1}})

弹出最后一个值，堆栈,知道数组为空，如果不是数组类型则报错

Pull

{ $pull : { field : {} } }

弹出符合条件的值

Rename

修改字段名

{ $rename : { old_field_name : new_field_name } }

锁

db.students.update({score: {$gt: 60}, $atomic: true}, {$set: {pass: true}}, false, true)

分片不支持加锁

FindandModify

修改，并返回相应值

> db.jobs.save( {

inprogress: false, priority:0,

tasks : [ "select product", "add inventory", "do placement"]

} );

> db.jobs.save( {

inprogress: false, priority:1,

tasks : [ "run sales report", "email report" ]

} );

> db.jobs.save( {

inprogress: false, priority:2,

tasks : [ "run marketing report", "email report" ]

} );

> job = db.jobs.findAndModify({

query: {inprogress: false, name: "Biz report"},

sort : {priority:-1},

update: {$set: {inprogress: true, started: new Date()}},

new: true

});

{

"_id" : ...,

"inprogress" : true,

"name" : "Biz report",

"priority" : 2,

"started" : "Mon Oct 25 2010 11:15:07 GMT-0700 (PDT)",

"tasks" : [

"run marketing report",

"email report"

]

}

删除

删除整体数据，但不删除索引

>db.a.remove()

删除指定条件的数据

>db.a.remove({username:”test”})

>db.a.remove({_id:”assdd”}) 推荐

>db.a.remove(object) 不推荐

删除指定的集合，并删除索引，速度比单条删除记录要快

>db.test.drop();

删除锁

>db.videos.remove( { rating : { $lt : 3.0 }, $atomic : true } )

删除会在内存和文件产生碎片，通过repairDatabase()，来整理内存碎片

查询

查询整体数据集合

>db.catalog.find();

没有给出条件就是查询完全数据集，但客户端仅仅返回50条记录，如果继续查看请键入it

根据条件进行查询

>db.catalog.find({product_id:117})

>数据库.collection.find(查询条件), 其中查询条件为JSON格式

组合条件查询

> db.catalog.find({"product_id":117, "category_id":3})

>数据库.collection.find({查询条件1, 查询条件2}) 两个条件之间使用,分割

返回指定的字段

>db.catalog.find({product_id: 117},{product_id:1,category_id:1})

格式：db.collection.find({查询条件},{field1:1,field2:1}) 第二个参数显示需要显示的字段

>db.catalog.find({product_id: 117},{product_id:1,category_id:1,_id:0})

排除某些字段不进行显示

范围查询

>db.catalog.find({product_id:{$gt:100}}) $gt 查询product_id 大于100的记录

>db.catalog.find({product_id:{$lt:100}}) $lt 查询product_id 小于100的记录

>db.catalog.find({product_id:{$gt:100,$lt:200}}) $gt,$lt组合使用，查询product_id 大于100且小于200的记录

$lt:小于 $lte:小于等于 $gt 大于 $gte 大于等于 $ne不等于

In查询

$in 查询值在指定的集合内进行匹配

$nin 对不在指定集合条件的记录进行匹配

>db.catalog.find({product_id: {$in:[121,128,129]}})

> db.catalog.find({product_id: {$nin:[121,128,129]}})

或查询

$or 满足两个条件之一的记录进行相应的匹配

>db.catalog.find({$or:[{product_id:121},{category_id:3}]})

>db.catalog.find({$or:[{product_id:{$in:[121,128,129]},{category_id:3}}]

Limit和skip

限制返回的记录集数

>db.catalog.find().limit(n)

掠过指定的记录集个数，从第n+1条记录开始显示

>db.catalog.find().skip(n)

Sort排序

分别按照指定顺序进行排序，类似于1正序，-1倒序

>db.c.find().sort({username:1,age:-1})

>db.c.find().limit(50).skip(50).sort({username:1})

随机值查询

>var random = Math.random()

>result = db.foo.findOne({“random”:{“$gt”:random})

Null查询

>db.c.find(“z”:{“$exists”:true})

使用$exists查询指定字段为null值的记录，而不能使用 xxx:null

数组查询

单值匹配

>db.c.find({fruit:”apple” })

多值匹配

>db.c.find({fruit:{all:[“apple”,”banana”]})

***Sql查询的映射图

Sql	Mongodb
SELECT * FROM users	Db.users.find()
SELECT a,b FROM users	Db.users.find({},{a:1,b:1})
SELECT * FROM users WHERE age=33	Db.users.find({age:33})
SELECT a,b FROM users WHERE age=33	Db.users.find({age:33},{a:1,b:1})
SELECT * FROM users WHERE age=33 ORDER BY name	Db.users.find({age:33}).sort({name:1})
SELECT * FROM users WHERE age>33	Db.users.find({age:{“$gt”:33}})
SELECT * FROM users WHERE age!=33	Db.users.find({age:{“$ne”:33}})
SELECT * FROM users WHERE name LIKE "%Joe%"	Db.users.find({name:”\Joe\”})
SELECT * FROM users WHERE name LIKE "Joe%"	Db.users.find({name:\^Joe\})
SELECT * FROM users WHERE age>33 AND age<=40	Db.users.find({age:{“$gt”:33},age:{“lte”:40}})
SELECT * FROM users ORDER BY name DESC	Db.user.find().sort({name:-1})
SELECT * FROM users WHERE a=1 and b='q'	Db.users.find({a:1,b:”q”})
SELECT * FROM users LIMIT 10 SKIP 20	Db.users.find().limit(10).skip(20)
SELECT * FROM users WHERE a=1 or b=2	db.users.find( { $or : [ { a : 1 } , { b : 2 } ] } )
SELECT * FROM users LIMIT 1	Db.users.findOne()
SELECT order_id FROM orders o, order_line_items li WHERE li.order_id=o.order_id AND li.sku=12345	db.orders.find({"items.sku":12345},{_id:1})

聚合

Count计数

>db.catalog.count()

对collection的记录进行相应的计数，计数对于统计数据库记录数，并进行相应的分页

GRIDFS

简介

GridFS主要是用来存储大型文件，如高清图片，视频，或文本等

安装PHP客户端

Linux

$ tar zxvf mongodb-mongdb-php-driver-.tar.gz

$ cd mongodb-mongodb-php-driver-

$ phpize

$ ./configure

$ sudo make install

编辑php.ini,添加

Extension=”mongo.so”

应用案例

案例1 电子商务

产品表:

{

_id: new ObjectId("4c4b1476238d3b4dd5003981"),

slug:"wheel-barrow-9092",

sku: "9092",

name:"Extra Large Wheel Barrow",

description: "Heavy duty wheelbarrow...",

details: {

weight: 47,

weight_units: "lbs",

model_num: 4039283402,

manufacturer: "Acme",

color: "Green"

total_reviews: 4,

average_review: 4.5,

pricing: {

retail: 589700,

sale:489700,

price_history: [

{

retail: 529700,

sale: 429700,

start: new Date(2010, 4, 1),

end: new Date(2010, 4, 8)

{

retail: 529700,

sale: 529700,

start: new Date(2010, 4, 9),

end: new Date(2010, 4, 16)

category_ids: [

new ObjectId("6a5b1476238d3b4dd5000048"),

new ObjectId("6a5b1476238d3b4dd5000049")

main_cat_id: new ObjectId("6a5b1476238d3b4dd5000048"),

tags:["tools", "gardening", "soil"],

}

db.products.ensureIndex({slug: 1}, {unique: true})

类目表

doc =

{ _

id: new ObjectId("6a5b1476238d3b4dd5000048"),

slug:"gardening-tools",

ancestors: [

{

_id: new ObjectId("8b87fb1476238d3b4dd500003"),

slug: "home"

{ name: "Outdoors",

_id: new ObjectId("9a9fb1476238d3b4dd5000001"),

slug: "outdoors"

}

parent_id: new ObjectId("9a9fb1476238d3b4dd5000001"),

name:"Gardening Tools",

description: "Gardening gadgets galore!",

}

订单表

doc =

{ _

id: ObjectId("6a5b1476238d3b4dd5000048")

user_id: ObjectId("4c4b1476238d3b4dd5000001")

state: "CART",

line_items: [

{

_id: ObjectId("4c4b1476238d3b4dd5003981"),

sku: "9092",

quantity: 1,

pricing: {

retail: 5897,

sale: 4897,

}

{

_id: ObjectId("4c4b1476238d3b4dd5003981"),

sku: "10027",

quantity: 2,

pricing: {

retail: 1499,

sale: 1299

}

shipping_address: {

street: "588 5th Street",

city:"Brooklyn",

state: "NY",

zip: 11215

sub_total: 6196

}

用户表

{

_id: new ObjectId("4c4b1476238d3b4dd5000001"),

username: "kbanker",

email: "[email protected]",

first_name: "Kyle",

last_name: "Banker",

hashed_password: "bd1cfa194c3a603e7186780824b04419",

addresses: [

{

street: "588 5th Street",

city:"Brooklyn",

state: "NY",

zip: 11215

{

street: "1 E. 23rd Street",

city:"New York",

state: "NY",

zip: 10010

}

payment_methods: [

{

last_four: 2127,

crypted_number: "43f6ba1dfda6b8106dc7",

expiration_date: new Date(2014, 4)

}

]

}

应用1: 查询某地区的用户，使用邮政编码进行查询

>db.user.find({ “address.zip”:{“$lt”:12334,”gt”:11123}})

应用2: 查询买过某商品的用户，并显示用户的详细信息

user_ids = db.db.order.find(

{

'line_items.sku': "9092",

purchase_date: {'$gt': new Date(2009, 0, 1)}

{user_id: 1, _id: 0}

).toArray().map(

function(doc) {

return doc['_id']

}

)

users = db.users.find({_id: {$in:user_ids}})

问题：查询0-30的用户

问题: 返回单条购物超过97元的订单

问题：返回颜色不是黑色和蓝色的商品

问题：返回标签式 garden和3c的产品

问题：返回制造商是ACM，并标签不是 garden的商品

问题: 返回last_name 不以B为开头的用户

问题：返回颜色为蓝色和绿色的商品

问题: 返回颜色为蓝色，或制造商是ACM的商品

问题：返回属性中带有颜色的商品

问题：返回制造商id为432的商品

问题：返回标签为soil的商品

问题：返回第一个标签为0的商品

问题：返回第一个地址中state为NY的用户

问题：返回地址中state为NY的用户

问题: 返回地址.name为home，并在state为NY的用户

问题：返回有三个地址的用户

问题：返回用户ID对3取余余1的用户

问题：返回sku大于1000的商品，并仅仅显示商品名

问题：商品价格倒序

问题：用户按注册日期倒序，并掠过100，取10条记录

三．mongoDB分布式集群

分片

分片的原因:

由于海量数据的原因，单台服务器不能满足数据存储的需求，包括硬盘和内存
数据库读写负载的增加，单台服务器不能满足读/写并发的需求，通过分担相应的负载到不同的服务器上，来满足需求。尤其是写负载的情况
海量数据的数据提取和汇总的瓶颈
最终需要通过分片，满足海量数据，高并发写的需求
最终核心：把单中心节点的数据和计算，分散到不同分布式节点，每个节点仅仅对路由中心负责，而客户端仅仅知道路由中心

分片实现方式（水平分区）

手动方式(客户端程序控制)
中间键方式: mysql+amoba
数据系统内置的分片机制，mysql+cluster,mongodb内置分片

程序方式:

优点: 完全控制，能够自己来定义写入和读取的规则

缺点:

程序复杂性提高
分布式计算，并进行汇总的效率不易进行优化
算法比较固定，如取余，分段，或业务逻辑分片
难于扩展，和删除节点，由于存在数据迁移
调整负载和数据分布不容易
维护工作繁杂，难于热扩展
分片对于客户端是不透明，并且是紧耦合的

优点:

分片对客户端透明
采用配置方式来设定分片方式
分片策略可定制
减少客户端的开发工作

缺点：

性能损失
节点扩展，数据迁移问题
如果分布算法不平衡,存在节点负载不均衡的问题

何时进行分片

开始时不进行分片，只有当需要分片时才采取分片策略
单机内存不足
Mongod已经不能满足高并发写需求
大数据量读写

Mong分片的目的

分片的步骤

步骤1：建立配置服务器

>./mongod –dbpath=/usr/local/mongodb/db –port=2000 –fork

说明:

配置服务器负责储mongos的相应配置，包括分片规则和分片数据对应关系
如同启动普通服务器

步骤2：建立mongos服务

>./mongos –port=3000 –configdb localhost:2000 –logpath=/usr/local/mongodb/logs/mongs.log –fork

步骤3：建立相应分片节点

节点1

> ./mongod --port=1000 --dbpath=/usr/local/mongodb/db --logpath=/usr/local/mongodb/logs/mongodb.log –fork

节点2

> ./mongod --port=1000 --dbpath=/usr/local/mongodb/db --logpath=/usr/local/mongodb/logs/mongodb.log –fork

你可能感兴趣的:(mongodb)

重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
一文快速了解.NET项目文件(.csproj) ，基础而重要的文件【代码之美系列】 Microi风闲【开源】NET Core 跨平台 .net c#
代码之美系列目录一、C#命名规则规范二、C#代码约定规范三、C#参数类型约束四、浅析B/S应用程序体系结构原则五、浅析C#Async和Await六、浅析ASP.NETCoreSignalR双工通信七、浅析ASP.NETCore和MongoDB创建WebAPI八、浅析ASP.NETWebUI框架RazorPages/MVC/WebAPI/Blazor九、如何使用MiniProfilerWebAPI分
SmartETL中数据库操作与流程解耦的设计与应用
正如ETL这个概念本身所指示的，数据库读写访问是ETL的最常用甚至是最主要的操作。现代信息系统的设计与运行基本都是围绕数据库展开的，很多应用的核心功能都是对数据库的CRUD（创建、检索、更新、删除）操作。SmartETL框架设计之初就考虑到了这个情况，在早期就根据团队的技术栈，实现了对MongoDB、MySQL、ElasticSearch、ClickHouse等数据库的Extract操作（即Loa
mongodb-org-server_8.0.11_amd64.deb 这个文件怎么安装小李飞刀李寻欢 OpenSource 数据库大数据搜索引擎 mongodb
参考博文：mongodb-org-mongos:Depends:libssl1.1(＞=1.1.1)butitisnotinstallable-CSDN博客要安装mongodb-org-server_8.0.11_amd64.deb文件，需要使用dpkg命令。不过在此之前，有几点需要注意：MongoDB官方版本目前最高为6.0，8.0.11可能是第三方或测试版本，请确认来源可靠性安装.deb包可能
Uniapp微信小程序开发：后端服务器搭建指南（语言选择+部署方案）
目录前言：Uniapp+微信小程序的架构模式️后端服务器的作用后端语言选择（Node.js/Java/Python/PHP/Go）☁️服务器部署方案（云服务器vsServerless）实战：如何连接Uniapp与后端API安全优化：HTTPS、JWT、接口鉴权数据库选择（MySQL、MongoDB、云数据库）总结&最佳实践1.前言：Uniapp+微信小程序的架构模式Uniapp是一个基于Vue.j
MongoDB创建集合命令db.createCollection详解 ywb201314 Mongodb
完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用，这个参数没有实际意义size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没有限制autoIndexId:是否使用_id作为索引，默认为使用(t
mongodb创建集合命令db.createCollection详解 weixin_34209851 数据库 python shell
mongodb创建集合命令db.createCollection详解完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没有限制autoInde
mysql创建集合collection_MongoDB创建集合命令db.createCollection详解 kokosK
MongoDB创建集合命令db.createCollection详解完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用，这个参数没有实际意义size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没
mysql.createPool(db)_nodejs解决mysql和连接池(pool)自动断开问题会咕咕咕的小夫爷
最近在做一个个人项目，数据库尝试使用了mongodb、sqlite和mysql。分享一下关于mysql的连接池用法。项目部署于appfog，项目中我使用连接池链接数据库，本地测试一切正常。上线以后，经过几次请求两个数据接口总是报503。一直不明就里，今天经过一番排查终于顺利解决了。1.mysql链接普通模式varmysql=require('mysql'),env={host:'localhost
MongoDB复杂查询聚合框架巴里巴气 MongoDB知识记录 mongodb 数据库
前言前面已经对MongoDB基础的增删改查进行了分享,在增删改方面基本已经够用了,但是查询方面是远远不够的,find方法只能传入一些查询条件。涉及到稍微复杂点的查询就无法实现了,如分组、排序、映射(起别名)等这些操作的时候就没有办法实现。所以我接下来给同志们分享专一用于MongoDB复杂查询的框架-----聚合框架注意:文档和JSON对象基本上是一个意思,我会在解释的时候说是JSON对象,便于理解
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
【k8s学习】Kubernetes新手学习，4小时视频笔记总结伊丽莎白2015
【学习视频地址】KubernetesTutorialforBeginnersFULLCOURSEin4Hours视频不一定打得开，不过我笔记也很详细了。【笔记内容】1-【k8s学习】Kubernetes学习——核心组件和架构2-【k8s学习】minikube、kubectl、yaml配置文件的介绍3-【k8s学习】在minikube上布署MongoDB和MongoExpress4-【k8s学习】k
探索阿里云DMS：解锁高效数据管理新姿势云资源服务商 oracle 数据库阿里云云计算
一、阿里云DMS是什么阿里云DMS，全称为DataManagementService，即数据管理服务，是一种集数据管理、结构管理、安全管理于一体的全面数据库服务平台。它能够有效地支持各类数据库产品，包括但不限于MySQL、SQLServer、PostgreSQL、PPAS、DRDS、OceanBase、MongoDB、Redis等，对用户的数据库进行全方位的维护和管理，提供了一站式的数据库解决方案
数据库、HTML
一、数据库数据库文件与普通文件区别:普通文件对数据管理(增删改查)效率低2.数据库对数据管理效率高，使用方便常用数据库:1.关系型数据库:将复杂的数据结构简化为二维表格形式大型:0racle、DB2中型:MySq1、sQLServer小型:Sqlite2.非关系型数据库以键值对存储,且结构不固定。//JSONRedisMongoDB嵌入式数据库:sqlite3:stu.db1.开源免费，c语言开发
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
搭建商城系统 hunzi_1 php java uni-app
搭建商城系统需从系统架构设计、技术选型、核心模块开发到运营优化全流程规划，以下是关键步骤及实践要点：系统架构设计采用分层架构设计（数据层、服务层、应用层、用户层），数据层使用分布式数据库（如MySQL+MongoDB）保障存储与查询效率，服务层基于微服务架构实现商品管理、订单处理等功能模块，应用层适配Web/移动端多平台访问，用户层通过RBAC权限管理控制不同角色操作权限。‌技术选型‌前端‌：HT
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
【网络与爬虫 24】爬虫数据存储方案：从文件到数据库的全面指南莫比乌斯@卷技术技巧 #网络与爬虫网络爬虫数据库
【网络与爬虫24】爬虫数据存储方案：从文件到数据库的全面指南关键词：爬虫数据存储、CSV、JSON、Excel、SQLite、MySQL、MongoDB、Redis、数据持久化、数据管理摘要：本文全面介绍爬虫数据存储的各种方案，从简单的文本文件、CSV、JSON到Excel表格，再到SQLite、MySQL等关系型数据库，以及MongoDB、Redis等NoSQL数据库。通过对比分析不同存储方式的
Java研学-MongoDB(三) 泰勒疯狂展开 #Java研学 java mongodb 开发语言
三文档相关7文档统计查询 ①语法：//精确统计文档数慢准dahuang>db.xiaohuang.countDocuments({条件})4//粗略统计文档数快大致准dahuang>db.xiaohuang.estimatedDocumentCount({条件})4 ②例子：//精确统计文档数name为奔波儿灞dahuang>db.xiaohuang.countDocuments({name:
MongoDB入门操作汇总，java开发从入门到实战pdf 阿里自研院程序员面试后端 java
options是可选参数,包括内存及索引的配置展示库下所有集合showcollections向集合插入一条数据db.[collection_name].insertOne({“key”:“value”})db.[collection_name].insert({“key”:“value”})向集合插入多条数据db.[collection_name].insertMany([{“key”:“valu
Spring Data REST极速构建REST API 代码的余温 spring java 后端 spring boot
SpringDataREST是SpringData项目家族中的一个子项目，它构建在SpringDataRepositories（如SpringDataJPA、SpringDataMongoDB等）之上，旨在自动将你的数据模型（实体）和SpringDataRepository暴露为超媒体驱动的RESTfulWeb服务。它的核心目标是极大简化构建围绕数据的RESTAPI的过程。核心思想：约定优于配置：
2024-2025 贡献的开源项目总结 dotNET跨平台开源
盘点2024-2025贡献的开源项目总结Intro借着统计贡献的时候盘点一下自己过去一年对别的开源项目合并的pullrequest，统计时间：从2024-04-01到2025-03-31，按PR合并的时间算PR总计:184,去掉自己仓库的PR对其他开源项目的PR总计:100,仓库数量:51，详细列表如下AllPRcontributions0xced/ChiselupdateMongoDbdrive
MongoDB Rust驱动代码架构深度解析倪俪珍Phineas
MongoDBRust驱动代码架构深度解析mongo-rust-driverTheofficialMongoDBRustDriver项目地址:https://gitcode.com/gh_mirrors/mo/mongo-rust-driver前言本文将对MongoDB官方Rust驱动(mongo-rust-driver)的核心架构进行深入解析，帮助开发者理解其设计哲学和实现细节。我们将从客户端构
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
MongoDB数据库备份及恢复策略详解魑魅丶小鬼
本文还有配套的精品资源，点击获取简介：MongoDB，作为流行的开源NoSQL数据库，提供灵活、高性能和易用性的特点。为了保证数据安全和业务连续性，进行有效的备份和恢复策略至关重要。本文将介绍MongoDB的备份工具和方法，包括mongodump和mongorestore命令行工具，以及更复杂的云备份解决方案。同时，将通过一个中等规模的数据集实例来详细说明备份流程，强调备份前停止写入、执行备份、检
Redis GEO vs MongoDB 地理空间关键指标对比
方案对比：RedisGEO：优点：性能极快（微秒级）简单易用，支持距离计算缺点：仅支持位置查询，无法直接关联其他属性（如商家类型）需要额外存储详细信息（需要二次查询MySQL或MongoDB）数据同步：需要维护数据一致性（当商家位置更新时，需要同步更新Redis）MongoDB地理空间索引：优点：支持地理位置+属性联合查询（如查找附近且类型为“餐饮”的商家）数据与业务模型存储在一起，避免二次查询提
MongoDB 数据库的备份与恢复 qq_33928223 数据库管理数据库 mongodb oracle
以下是MongoDB中使用mongodump和mongorestore进行数据库逻辑备份与恢复的完整指南：一、mongodump备份工具1.核心功能逻辑备份：将MongoDB中的数据以BSON/JSON格式导出到本地文件。灵活性：支持按数据库、集合、条件过滤备份。低影响：默认在后台运行，对线上服务影响较小。2.常用命令及参数mongodump\--host\#目标实例地址（默认localhost:
“Payload document size is larger than maximum of 16793600.“问题解决（MongoDB）阿宇来了 mongodb 数据库
遇到的错误：Payloaddocumentsizeislargerthanmaximumof16793600.表示尝试插入或更新的MongoDB文档大小超过了最大限制（16MB）。错误原因MongoDB对单个文档（document）的大小有硬性限制：最大为16MB。这是为了保证性能和内存使用效率。你当前操作的数据大小已超过这个限制（如提示中的16,793,600bytes≈16MB），因此Mong
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

MongoDB开发使用手册

一．基础部分

MongDB简介

Mongdb的安装和配置

简单的数据操作

常用工具集

推荐客户端工具

二．mongoDB应用开发

MongoDB机制

设计mongodb数据库

高级数据库操作

安装PHP客户端

应用案例

三．mongoDB分布式集群

分片

你可能感兴趣的:(mongodb)