weixin_33878457

NoSQL Databases技术资料整理汇总

0 Reference

NoSQL论文

在 Stuttgart Media 大学的 Christof Strauch 历时8个月（2010年6月-2011年2月）完成了一篇150页长的NoSQL相关的论文, 对NoSQL的各个方面做了探讨

http://www.christof-strauch.de/nosqldbs.pdf

分布式系统领域经典论文翻译集

http://duanple.blog.163.com/blog/static/709717672011330101333271/

2010 NoSQL Summer Reading List

http://blog.nosqlfan.com/html/1647.html

http://www.empiricalreality.com/2010/09/22/2010-nosql-summer-reading-list/

NoSQL技术综述

Distributed Algorithms in NoSQL Databases

http://highlyscalable.wordpress.com/2012/09/18/distributed-algorithms-in-nosql-databases/

NOSQL Patterns

http://horicky.blogspot.com/2009/11/nosql-patterns.html

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

1 起源和历史

1.1 Goolge为一切的开始

Google created a full mechanism that included a distributed filesystem, a column-family-oriented data store, a distributed coordination system, and a MapReduce-based parallel algorithm execution environment. Graciously enough, Google published and presented a series of papers explaining some of the key pieces of its infrastructure. The most important of these publications are as follows:

Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung. “The Google File System”; pub. 19th ACM Symposium on Operating Systems Principles, Lake George, NY, October 2003.URL: http://labs.google.com/papers/gfs.html

Jeffrey Dean and Sanjay Ghemawat. “MapReduce: Simplifi ed Data Processing on Large Clusters”; pub. OSDI’04: Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, December 2004. URL: http://labs.google.com/papers/mapreduce.html

Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber. “Bigtable: A Distributed Storage System for Structured Data”; pub. OSDI’06: Seventh Symposium on Operating System Design and Implementation, Seattle, WA, November 2006. URL: http://labs.google.com/papers/bigtable.html

Mike Burrows. “The Chubby Lock Service for Loosely-Coupled Distributed Systems”; pub.OSDI’06: Seventh Symposium on Operating System Design and Implementation, Seattle,WA, November 2006. URL: http://labs.google.com/papers/chubby.html

1.2 Open-source和Yahoo

The creators of the open-source search engine, Lucene, were the first to develop an open-source version that replicated some of the features of Google’s infrastructure. Subsequently, the core Lucene developers joined Yahoo, where with the help of a host of other contributors, they created a parallel universe that mimicked all the pieces of the Google distributed computing stack.
This open-source alternative is Hadoop.

1.3 Amazon的Dynamo

A year after the Google papers had catalyzed interest in parallel scalable processing and nonrelational distributed data stores, Amazon decided to share some of its own success story. In 2007, Amazon presented its ideas of a distributed highly available and eventually consistent data store named Dynamo.

You can read more about Amazon Dynamo in a research paper, the details of which are as follows:

Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash Lakshman, Alex Pilchin, Swami Sivasubramanian, Peter Vosshall, and Werner Vogels, “Dynamo: Amazon’s Highly Available Key/value Store,” in the Proceedings of the 21st ACM Symposium on Operating Systems Principles, Stevenson, WA, October 2007. Werner Vogels, the Amazon CTO, explained the key ideas behind Amazon Dynamo in a blog post accessible online at www.allthingsdistributed.com/2007/10/amazons_dynamo.html.

Then, Everyone…

2 NoSQL分类

2.1 Taxonomies by Data Model (基于数据模型分类)

相关Blog:

NoSQL Data Modeling Techniques

Concerning the classification of NoSQL stores Highscalability author Todd Hoff cites a presentation by Stephen Yen in his blog post “A yes for a NoSQL taxonomy” (cf. [Hof09c]).
In the presentation “NoSQL is a Horseless Carriage” (cf. [Yen09]) Yen suggests a taxononmy that can be found in table 2.1.

Key-Value-Cache	Memcached, Repcached, Coherence, Infinispan, EXtreme Scale, Jboss Cache, Velocity, Terracoqa
Key-Value-Store	keyspace, Flare, Schema Free, RAMCloud
Eventually-Consistent Key-Value-Store	Dynamo, Voldemort, Dynomite, SubRecord Mo8onDb Dovetaildb
Ordered-Key-Value-Store	Tokyo Tyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
Data-Structures Server	Redis
Tuple Store	Gigaspaces, Coord, Apache River
Object Database	ZopeDB, DB4O, Shoal
Document Store	CouchDB, MongoDB, Jackrabbit, XML Databases, ThruDB, CloudKit, Perservere, Riak Basho, Scalaris
Wide Columnar Store	Bigtable, Hbase, Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

2.2 基于CAP理论分类

相关Blog:

CAP – Consistency, Availability, Partition Tolerance

How to beat the CAP theorem

3 NoSQL核心技术

3.1 Data Consistency, 数据一致性

3.1.1 一致性问题的理论基础

相关Blog:

全序, 分布式一致性的本质

在Lamport论文谈了那么多偏序和全序的问题, 全序到底有什么用? 论文里面给出互斥资源访问的例子, 如果觉得还是比较抽象
这里以分布式数据存储为例
对于并发写数据就存在一致性问题, 如何解决分布式数据库的一致性问题?
Lamport在上面那篇论文里面其实也给出了答案, 这就是他这篇paper里面第二个贡献, 也是常常为人忽略的
如果将分布式系统的所有节点看作有限状态机, 只要保证每个节点的执行命令序列一致, 就能保证所有节点的状态的一致性

对于分布式数据库, 其实就是在同样的初始状况下, 保证每个数据库节点的数据更新序列一致, 就能简单的保证所有数据库的数据的一致性

所以可以看出, 一致性问题已经转变为排序问题

所以这就是为什么上面的paper来讨论偏序和全序的原因, 因为其实你解决了这个问题就已经解决了数据一致性问题

于是上面的问题转变为, 如何在分布式的环境中, 给所有的写操作全序?

1. 基于master或固定参照系, 比如下面的利用时间戳, 悲观或乐观锁
这些方法确实可以保证全序, 但都存在单点或时钟同步问题

2. 使用Paxos算法来保证全序, 尤其在强一致性的场景下
但问题在于, 该算法耗费比较高, 如果对于海量并发写而言, 需要高可用性的方案

当然对于高可用性的方案, 必须要做出一些牺牲, 无法保证全序

那么Vector Clocks算法就是这样一种方案, 当然只能达到偏序, 因为他的原理就是基于paper中描述的偏序理论

3.1.2 Nosql中的一致性技术概要

相关Blog:

Nosql数据一致性技术概要

3.1.3 Quorum Read and Write

此概念成名于Dynamo的设计, 但是该设计不光可以用于最终一致性的方案, 而是一种保证一致性的通用思路
因为在分布式的环境中, 让w达到n是不现实的,在这种情况下怎样保证一致性...
对于M/S架构, 如果master只会同步更新部分复本W, 如果read操作需要读到最新数据, 要不通过master, 要不就至少需要读R个复本, 并保证R+W>N
Paxos同样也可以基于这样的设计

N The number of replicas for the data or the piece of data to be read or written.

R The number of machines contacted in read operations.
W The number of machines that have to be blocked in write operations5.
In the interest to provide e. g. the read-your-own-writes consistency model the following relation between the above parameters becomes necessary:
R +W > N

几种特殊情况：
W = 1, R = N,对写操作要求高性能高可用
R = 1, W = N , 对读操作要求高性能高可用，比如类似cache之类业务
W = Q, R = Q where Q = N / 2 + 1 一般应用适用，读写性能之间取得平衡。如N=3,W=2,R=2

3.1.4 Eventual Consistency (BASE), 最终一致性技术

当然最典型的代表就是Amazon Dynamo
高可用性的solution, 任意节点都可以写入数据, 必然导致版本的不一致和冲突
所以必须需要一种技术来记录各个版本之间的因果关系或偏序关系, 这就需要vector clocks

并且对于任意节点的更新, 如何在各个复本间同步以达到最终的一致性, 这就需要反熵协议

相关Blog:

Vector Clocks, 时间向量

Why Vector Clock are Easy or Hard?

Anti-Entropy Protocols

3.1.5 Strong Consistency, 强一致性技术

如上图右下角, M/S比较简单在上面的引用已经描述, 简单但很实用, Goolge早期在GFS和Bigtable都使用的这种设计
其中最重要的算法是Paxos, Google的Megastore中使用

相关Blog:

Strong Consistency, 强一致性技术概述

Paxos Made Simple

3.2 Data Partitioning(Sharding), 数据动态划分

相关Blog:

Consistent Hashing算法及相关技术

3.3 Data Replication, 数据复本技术

相关Blog:

Data replication 同步技术

3.4 Data Storage Layout

Row-Based Storage Layout

A table of a relational model gets serialized as its lines are appended and flushed to disk.
Advantages
a. whole datasets can be read and written in a single IO operation
b. one has a “[g]ood locality of access (on disk and in cache) of different columns”.
Disadvantages
a. operating on columns is expensive as a considerable amount data has to be read.

Columnar Storage Layout

相关Blog:

Columnar Storage, 关于Row-based和Columnar的比较

Serializes tables by appending their columns and flushing them to disk.
Therefore operations on columns are fast and cheap while operations on rows are costly and can lead to seeks in a lot or all of the columns. A typical application field for this type
of storage layout is analytics where an efficient examination of columns for statistical purposes is important.

其实没有好坏, 只是不同的场景, 如果需要整行读当然row-based好, 如果只需要少量的column, 当然选columnar
做个balance, 就是下面的方案column-families

Columnar Storage Layout with Locality Groups

Similar to column-based storage but adds the feature of defining so called locality groups that are groups of columns expected to be accessed together by clients.
The columns of such a group may therefore be stored together and physically separated from other columns and column groups.
The idea of locality groups was introduced in Google’s Bigtable paper.

3.5 Storage Implementaton, 数据存储实现

Storage implementation pluggable. e.g. A local MySQL DB, Berkeley DB, Filesystem or even a in memory Hashtable can be used as a storage mechanism.

特有的Storage implementation, HBase, Couchbase

3.5.1 SSTables(Sorted String Table)和Log Structured Merge Trees (LSM-trees)

相关Blog:

大数据索引技术 - B+ tree vs LSM tree

详解SSTable结构和LSMTree索引

3.5.2 CouchDB Storage Implementation

相关Blog:

NoSQL Databases - CouchDB

CouchDB has a MVCC model that uses a copy-on-modified approach. Any update will cause a private copy being made which in turn cause the index also need to be modified and causing the a private copy of the index as well, all the way up to the root pointer.

Notice that the update happens in an append-only mode where the modified data is appended to the file and the old data becomes garbage. Periodic garbage collection is done to compact the data. Here is how the model is implemented in memory and disks.

3.8 Query Models, 数据检索

Whereas key/value stores by design often only provide a lookup by primary key or some id field and lack capabilities to query any further fields, other datastores like the document databases CouchDB and MongoDB allow for complex queries—at least static ones predefined on the database nodes (as in CouchDB).

This is not surprising as in the design of many NoSQL databases rich dynamic querying features have been omitted in favor of performance and scalability.

On the other hand, also when using NoSQL databases, there are use-cases requiring at least some querying features for non-primary key attributes.

Nosql往往只支持基于主键query, 而无法支持复杂的查询, 比如范围查询, 非主键的查询, 当然也有象CouchDB和MangoDB可以支持这样的查询.

但大部分比较纯粹的NoSQL是不支持的, 因为基于key/value的query, 一般都是基于DHT(Distributed Hash Table)技术, 只支持exact match.

那么如果用nosql, 又想具有较复杂的querying features, 有如下思路,

Companion SQL-database is an approach in which searchable attributes are copied to a SQL or text database. The querying capabilities of this database are used to retrieve the primary keys of matching datasets by which the NoSQL database will subsequently be accessed.

如图, 这个想法就是用SQL当索引, 比较简单, 因为索引应该会小点, 所以扩展性问题不是那么突出, 但是还是有问题, 而且维护两个系统增加了复杂性

Scatter/Gather Local Search can be used if the NoSQL store allows querying and indexing within database server nodes. If this is the case a query processor can dispatch queries to the database
nodes where the query is executed locally. The results from all database servers are sent back to the query processor postprocessing them to e. g. do some aggregation and returning the results to a client that issued the query.

Distributed B+Trees are another alternative to implement querying features. The basic idea is to hash the searchable attribute to locate the root node of a distributed B+tree (further information on scalable, distributed B+Trees can be found in a paper by Microsoft, HP and the University of Toronto, cf. [AGS08]). The “value” of this root node then contains an id for a child node in the B+tree which can again be looked up. This process is repeated until a leaf node is reached which contains the primary-key or id of a NoSQL database entry matching search criteria.

Prefix Hash Table (aka Distributed Trie) is a tree-datastructure where every path from the root-node to the leafs contains the prefix of the key and every node in the trie contains all the data whose key is prefixed by it (for further information cf. a Berkley-paper on this datastructure [RRHS04]). Besides an illustration Ho provides some code-snippets in his blog post that describe how to operate on prefix hash tables / distributed tries and how to use them for querying purposes (cf.[Ho09b]).

前缀HT, effciently supporting 1-dimensional range queries over a DHT.

4 主流NoSQL

4.1 BigTable, HBase

bigtable: A Distributed Storage System for Structured Data

HBase-TDG Introduction

HBase-TDG ClientAPI The Basics

HBase-TDG ClientAPI Advanced Features

HBase-TDG Architecture, SSTable和LSMTree

HBase-TDG Schema Design

HBase vs. BigTable Comparison

4.2 KV

Dynamo: Amazon’s Highly Available Key-value Store
Cassandra - A Decentralized Structured Storage System

4.3 Document DB

NoSQL Databases - MongoDB

NoSQL Databases - CouchDB

Comparing Mongo DB and Couch DB

MongoDB Schema Design

网上游戏代练系统+源代码
网上游戏代练系统摘要随着当今社会的发展，时代的进步，各行各业也在发生着变化，本系统健身房这一方面，利用网站游戏代练已经逐步进入人们的生活。传统的网上游戏代练，都是用户通过电话咨询或者到实体店购买等操作，这种购买局限性比较大且花费较多。网络以及计算机为解决当前的问题提供了新的方向新的可能。利用网络技术进行网上游戏代练的实现，首先用户可以根据网上游戏代练系统查看代练商城，并根据自己的喜好，将喜欢的代练
# 二级造价工程师工程造价管理基础知识-工程决策和设计阶段造价管理概述二月鸟_0e1e
工程决策是选择和决定投资行动方案的过程，是对拟建项目的必要性和可行性进行技术经济论证，对不同建设方案进行技术经济比较及做出判断和决定的过程。工程设计是指工程项目开始建设施工之前，根据已批准的设计任务书，为具体实现拟建项目的技术、经济要求，拟定建筑、安装及设备制造等所需要的规划、图纸、数据等技术文件的工作。设计是工程项目由计划变为现实具有决定意义的工作阶段。1工程决策阶段和设计阶段造价管理的工作内容
使用C#打造预约日程管理系统 Ready-Player
本文还有配套的精品资源，点击获取简介：在信息技术领域，日程管理是重要需求。本文介绍如何使用C#语言实现一个名为"AppointmentSchedule"的预约日程管理系统。首先，文章将引导读者设计一个存储日程信息的数据结构，并提供一个容器类来管理多个预约。然后，文章将讨论如何处理预约冲突并提供用户界面设计建议。同时，也会探讨数据持久化的方法，以及如何为系统添加提醒功能和网络同步功能。最后，开发者可
开篇向水一生
在基于Internet的互联网已经成熟的时代，我们考虑利用相似的理念和技术去改造传统工业中的环节时，这便自然而然的得到了工业互联网的概念。它的本身上还是在解决信息流在各个节点之间传递的问题，只是因为异构的系统太多，要统一出一套标准来，确实是一项任重道远的大工程。工业互联网的实现远比我们现在看到的『传统』意义上的互联网要难，这有很大一部分是由于历史遗留问题而造成的局面，它不像我们现在看到的这种IT互
如何提高工作技能,以及往什么方向提高,也许面试官会告诉你 sexy_cyber
面试官问啥,钻研啥,通常面试官都会在一条线上逐渐深挖,一直问到最底层,来试探你的技术深度,算不算资深
JAVA无人系统台球室源码自助开台约球交友系统源码小程序
全域无人化运营革命：JAVA无人系统台球室源码解析（支持茶室/棋牌/KTV多业态）在共享经济与无人化浪潮的推动下，全球自助娱乐市场规模突破千亿美元，传统台球室、棋牌室面临人力成本高、运营效率低、用户粘性弱等痛点。JAVA无人系统台球室源码以SpringBoot+MyBatisPlus+MySQL为核心技术栈，通过Uni-app跨端开发实现小程序/H5/APP全渠道覆盖，集成AI裁判、社交裂变、多支
python爬虫技术——基础知识、实战南瓜AI python 爬虫 scrapy
参考文献：Python爬虫入门(一)（适合初学者）-CSDN博客一、常用爬虫工具包Scrapy语言:Python特点:高效、灵活的爬虫框架，适合大型爬虫项目。BeautifulSoup语言:Python特点:用于解析HTML和XML，简单易用。Selenium语言:Python/Java/C#特点:支持浏览器自动化，适合处理JavaScript渲染的网页。Requests语言:Python特点:简
软考“平替“——工信部信创证书来了！现在考超容易！ PMP项目管理人工智能系统架构 IT 信创工信部软考职场和发展
很多IT行业的宝子都知道软考证书的含金量，但是软考高项的难度也不低，不少人都需要二战三战，但是现在“平替”信创证书来了，难度降级，含金量不变！现在考超容易，新证书出台的前面几次考试，宽松到套模板就能拿分！一、什么是信创？信创即信息技术应用创新，其本质是打破西方技术垄断的「数字新基建」，而由工信部教育与考试中心直接颁发的信创证书，已成为衡量数字化人才硬实力的「国标认证」。这也表明，被写入「十四五」规
有源电力滤波器matlab仿真实验报告,基于Matlab有源电力滤波器APF的仿真研究
目前，对有源电力滤波器的研究越来越广泛。一方面，研究者众多，不仅有高等院校、研究所，而且也有许多电力局、大型企业等；另一方面，研究涉及谐波检测方法、控制策略、PWM波的形成等有源滤波技术的各个方面，对谐波检测控制方法和谐波检测电路的实现方法研究尤其活跃，出现了许多新的方法，这些方法都是旨在提高谐波检测的实时性和检测精度，因为谐波检测方法及谐波检测电路的实时性和检测精度对有源电力滤波器的滤波性能起着
matlab达林算法的电加热炉温度控制,基于单片机的电加热炉温度控制算法与仿真研究[1]...
收稿日期：2011－11作者简介：张宇驰(1978—)，男，硕士，讲师，研究方向为自动控制与机电一体化。基于单片机的电加热炉温度控制算法与仿真研究张宇驰(湖南工业职业技术学院，湖南长沙410208)摘要：介绍几种基于单片机的电加热炉温度控制算法，通过对PID控制算法仿真、SMITH控制算法仿真、大林算法仿真的比较分析，仿真结果验证了大林控制算法的稳定性和鲁棒性较好，几乎没有超调量，且稳态误差小。关
金属表面划痕检测实践指南 - 使用OpenCV IYA1738
本文还有配套的精品资源，点击获取简介：在机器视觉领域，表面划痕检测是一项关键技术，特别是在金属表面。本文深入探索了如何使用OpenCV库在VisualStudio2019环境下进行表面划痕检测。主要技术包括图像作差、动态阈值处理、边缘检测以及形态学操作。通过这些方法，我们可以有效地从金属表面图像中提取划痕特征。本文详细描述了实施表面划痕检测的步骤，包括图像读取、差分图像计算、阈值处理、边缘检测优化
前端转后端学习路线整理
一、背景本人是一名Web前端开发，技术栈是Vue和React，不会Node。之前学过，但是因为一些原因（比如没有使用场景，很多概念无法理解，学完就忘等）一直也没有掌握。因为在CMS部门耳濡目染时间久了，感觉不学点后端有点说不过去，而且学起来之后发现也挺有兴趣的。但是对于一名前端开发（而且在学校的时候基本没学习）来说要学习的内容实在太多了，开始的困难在于理清各种技术都是干什么的以及它们之间的关系。现
GIMP 3.0 中文版下载与安装全指南，附软件下载链接
GIMP（GNUImageManipulationProgram）作为开源图像处理领域的标杆工具，其3.0版本在技术架构上实现了多项突破：界面与性能升级基于GTK3重构的UI支持高分辨率屏幕，SVG图标体系带来更现代的视觉体验；引入多线程渲染与SIMD指令集加速，滤镜处理效率提升300%+非破坏性编辑机制通过图层版本控制与历史状态隔离，实现图像修改与原始数据的分离，这一特性对专业设计流程至关重要跨
某银行基于容器负载均衡信创替代，实现完整全自动对外服务暴露的流水线实践
一、背景介绍外部硬件负载均衡作为容器业务统一入口的架构模式已在我行运行3年之久，通过长时间的容器云平台使用经验与负载均衡运维经验积累，在我行容器云环境形成一套特有的负载均衡适配模型，现部署模式下实现了应用上线人员以自服务的形式将容器服务对外暴露。根据2022年1月银保监会办发[2022]2号中关于科技能力建设的指导意见，坚持关键技术自主可控原则，降低外部依赖、避免单一依赖。为配合推进指导意见，同时
程序员的一生：代码、挑战与无限可能 Jay_MIng 开发语言 php linux 运维 nginx java python
程序员的职业生涯呈现出鲜明的阶段性特征，每个阶段都面临不同的挑战与机遇：成长期（22-30岁）：黄金学习期。在这个阶段中的你身体机能处于巅峰，自由时间也充沛，你大多是一个人，没有太多的压力，核心任务是构建技术根基。从学校的书本知识到企业级开发实战的跨越在此阶段完成，需掌握团队协作、版本控制、代码测试等工程化能力。黄金期（30-45岁）：上有老下有小的负重攀登期。技术能力达到高峰，却面临家庭责任挤压
对象的本质：OOP编程核心揭秘止观止计算机科学 OOP 面对对象编程
引言面向对象编程（OOP）革命性地重塑了软件开发，其核心在于“对象”——一种模拟现实实体的计算模型。对象不仅是数据容器，更是封装了状态和行为的自治单元，使程序从指令序列转变为交互网络。通过本解析，我们将层层递进，揭示对象在OOP中的根本角色：从定义延伸到设计实践，帮助读者跨越语言差异（如Java、Python或C++），掌握这一范式的精髓。章节构建遵循技术演进：先解剖对象本质，再关联OOP支柱，最
一文讲透HTML语义化标签
文章目录语义化标签概述HTML标签及其含义常见HTML5语义化标签语义化标签对搜索引擎（SEO）的影响提升搜索引擎排名增强可访问性改善用户体验语义化标签案例各标签作用说明语义化标签概述HTML语义化是指使用恰当的标签来准确表达内容的结构和含义，使网页不仅对人类开发者可读，也能被搜索引擎、辅助技术等更好地理解和处理。例如，用表示页眉，表示独立内容区块，提升页面可访问性和SEO效果。HTML标签及其含
web前端入门到实战：CSS实现8种炫酷按钮大前端世界
今天给大家分享8种炫酷按钮的CSS实现。1.3D按钮1现在的主流是扁平化的设计，拟物化的设计比较少见了，所以我们仅从技术角度去分析如何实现这个3D按钮该按钮的立体效果主要由按钮多出的左、下两个侧面衬托出来，我们可以使用box-shadow模拟出这两个侧面：HTML：3DButton1CSS:.button-3d-1{position:relative;background:orangered;bo
如何区别HTML和HTML5？代码的余温 html html5 前端
要区分HTML（通常指HTML4及更早版本）和HTML5，主要可以从以下关键方面进行比较：一、文档声明区别二、语义化标签对比用途HTML4标签HTML5新标签头部区域导航栏内容区块独立文章侧边栏页脚主要内容区✅HTML5通过语义化标签取代了泛滥的，提升可读性和SEO三、多媒体支持差异四、图形技术演进constctx=document.getElementById('myCanvas').getCo
AI人工智能领域多模态大模型的发展历程回顾 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
AI人工智能领域多模态大模型的发展历程回顾关键词：AI人工智能、多模态大模型、发展历程、技术演变、应用场景摘要：本文旨在全面回顾AI人工智能领域多模态大模型的发展历程。通过对不同阶段核心概念、算法原理、数学模型等方面的深入剖析，结合实际项目案例，探讨其在各个领域的应用场景。同时，推荐相关的学习资源、开发工具和重要论文著作，最后总结多模态大模型的未来发展趋势与挑战，并对常见问题进行解答。1.背景介绍
分布式操作系统 - 1.分布式系统概论 IT斜杆青年分布式操作系统分布式网络
文章目录1.概念和特点1.1概念1.2需解决问题1.3中间件1.4分布式系统特点2.设计目标2.1支持资源共享2.2透明性2.3开放性（1）OpenSystem（2）特点2.4可伸缩性（1）规模可伸缩性（2）地理位置可伸缩性（3）管理可伸缩性（4）实现可伸缩性采用的技术减少通信延迟将服务分割并分布化部署副本（replication）与缓存（caching）（5）易犯错误2.5高性能3.类型3.1高
游卡，快手，蓝禾26届秋招/提前批/实习内推 u010022905 算法 c语言前端关卡设计游戏美术
游卡，快手，蓝禾26届秋招/提前批/实习内推①游戏大厂-游卡26秋招内推【岗位】产品策划，发型运营，程序技术，美术表现，职能综合【一键内推】https://app.mokahr.com/m/campus_apply/yokagames/41940?recommendCode=DS5y8jth&hash=%23%2Fjobs#/jobs【内推码】DS5y8jth①快手2026届快STAR-X提前批校
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
Rock Robotic-无人机测绘 moonsims 人工智能
RockRobotic-无人机测绘RockRobotic公司简介RockRobotic是一家总部位于美国的无人机测绘技术公司，专注于：高精度LiDAR载荷系统一体化三维测绘解决方案云端数据处理平台（RockCloud）公司定位于“LiDAR即服务”，为工程师、测绘师提供即插即用的硬件+简单易用的软件服务。目标用户群：土地测绘公司、电力巡检、地籍建模、林业资源单位等。RockRobotic产品发展历
Specim推出便携式高光谱相机：可检测假冒艺术品和犯罪现场血迹 ggtdfgfdg 数码相机
芬兰specim高光谱相机高光谱(Hyperspectral)相机可以见到人类肉眼不能直接看到的内容，甚至可以分析物体的成分。只是这类设备通常又大又笨重，因此大多只能放在实验室用用。好消息是，芬兰VTT技术研究中心剥离出来的SpecimOy公司，刚刚推出了一款便携式的高光谱相机，它就是SpecimIQ。该相机能够收入可见光和近红外光谱范围内的不同波长，然后对物体表面的反射光成像。SpecimIQ采
计算机专业考研复试全攻略——从笔试到机试，从英语面试到项目答辩的完整解决方案
一、复试备战全景规划1.1复试全流程解析复制初试成绩公布→复试分数线确认→资格审查→专业课笔试→英语能力测试→综合面试→机试（部分院校）→拟录取公示时间管理建议（以3月复试为例）：复制1月：专业课基础复习+英语口语积累2月：强化核心考点+项目经验整理3月：模拟面试训练+热点技术追踪1.2复试评分维度拆解考核模块占比核心考察点专业课笔试40%-50%知识体系完整性、计算思维能力英语面试15%-20%
元宇宙：技术乌托邦与数字化未来——基于技术哲学的分析
一、技术哲学视域下的元宇宙本质哲学源流与技术基因的双重映射理想世界的千年回响：从柏拉图洞穴隐喻中的影子世界，到普特南“钵中之脑”对虚拟与现实界限的消弭，元宇宙的构想深植于人类对平行世界的永恒追问。中国传统神话中“天人二元结构”的意象，与元宇宙虚实融合的特性形成跨时空呼应。技术促逼（Gestell）的现代性批判：海德格尔的“座架理论”揭示，技术作为“促逼”将世界异化为资源储备。元宇宙通过VR/AR、
回顾2022 星空梦想plus 学习轨迹总结
今年的学习可谓是毁誉参半，欠缺的方面就是对未来技术的探索并没有取得预期的成果，拖了许多的进度，但愿者最后这个月，能跟上原本的学习进度。值得肯定的方向呢是对自己未来发展的大胆探索，突破了原有的枷锁桎梏，找到了另一条探索出路，从长远来看，我的这次大胆探索是大有裨益的，对未来相机的技术能更好的，更精准，更稳健的把握住。不单单是对相机技术追求的精益求精，不单是对相机上层，框架层，硬件抽象层，驱动层
送别太医大力稳重
我经常心怀感激，因为和公司最优秀的工程师坐在一个办公室，而且就在邻桌。他对技术有一种罕见的狂热，对每个细节都有偏执狂式的要求。他工作的时候不苟言笑，但聊起天来又语出惊人。他是个旁观者，但喜欢不经意的欣喜。我熟悉他的语气，他讲到什么都慢条斯理，又在无意中流露出自己智识与经验上的优越感。这自信让我敬佩，或许也会导致某种交流无法顺畅进行。他很少承认办公室其他人对自己带来工作上的影响，除去赞扬过我曾经写过
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

NoSQL Databases技术资料整理汇总

0 Reference

NoSQL论文

分布式系统领域经典论文翻译集

2010 NoSQL Summer Reading List

NoSQL技术综述

Distributed Algorithms in NoSQL Databases

NOSQL Patterns

1 起源和历史

1.1 Goolge为一切的开始

1.2 Open-source和Yahoo

1.3 Amazon的Dynamo

Then, Everyone…

2 NoSQL分类

2.1 Taxonomies by Data Model (基于数据模型分类)

2.2 基于CAP理论分类

3 NoSQL核心技术

3.1 Data Consistency, 数据一致性

3.1.1 一致性问题的理论基础

3.1.2 Nosql中的一致性技术概要

3.1.3 Quorum Read and Write

3.1.4 Eventual Consistency (BASE), 最终一致性技术

3.1.5 Strong Consistency, 强一致性技术

3.2 Data Partitioning(Sharding), 数据动态划分

3.3 Data Replication, 数据复本技术

3.4 Data Storage Layout

Row-Based Storage Layout

Columnar Storage Layout

Columnar Storage Layout with Locality Groups

3.5 Storage Implementaton, 数据存储实现

3.5.1 SSTables(Sorted String Table)和Log Structured Merge Trees (LSM-trees)

3.5.2 CouchDB Storage Implementation

3.8 Query Models, 数据检索

4 主流NoSQL

4.1 BigTable, HBase

4.2 KV

4.3 Document DB

你可能感兴趣的:(NoSQL Databases技术资料整理汇总)