翰霖学院

03.InfluxDB系统化学习-MetaStore

概述

在《02.InfluxDB系统化学习-InfluxDB初始化》讲述了influxdb数据启动过程中加载的服务，其中在

cmd/influxdb/run/server.go中创建NewServer对象时有以下代码：

MetaClient: meta.NewClient(c.Meta)

该代码主要是完成Meta相关的初始化，本节主要是针对Meta做详细的介绍

Meta的作用

Meta中的信息存储在meta.db的数据文件中，具体配置信息参考《配置文件》章节。

meta 为InfluxDB的元数据服务，用于管理数据库的元数据相关内容；influxdb将meta数据库，包装成一个MetaClient对外提供数据，需要meta的模块都引用这个MetaCient。该meta.db 直接使用protobuf格式的数据作为持久化文件。meta加载持久化文件后，会将全部内容缓存在内存中。当有meta改写时， MetaClient会将更新后的数据序列化然后写入磁盘中。MetaClient一部分数据已slice的形式存储，很多api都会将该slice返回给调用方，从而脱离了其锁的保护，有数据并发竞争访问的问题存在。meta.db中存储每个database的元数据(名称、过期策略、ContinuousQuery)和用户等信息。

配置文件

全部的配置文件参考《01.InfluxDB系统化学习-配置文件》，关于meta的配置信息如下所示：

###
### [meta]
### 存储有关InfluxDB集群元数据的 Raft consensus group 的控制参数将在下面被配置。
### Controls the parameters for the Raft consensus group that stores metadata
### about the InfluxDB cluster.
###

[meta]
  # Where the metadata/raft database is stored
  # 元数据/raft 数据库被存储的路径  即meta目录
  dir = "/var/lib/influxdb/meta"

  # Automatically create a default retention policy when creating a database.
  # 当创建一个新的数据库时自动为其创建一个默认的rentention policy（保留策略）
  # retention-autocreate = true

  # If log messages are printed for the meta service
  # 是否为meta服务打印日志
  # logging-enabled = true

代码分析

通过《02.InfluxDB系统化学习-InfluxDB初始化》中的说明，指导在服务启动过程中会初始化MetaClient并且打开加载相关文件，代码如下：

// NewServer returns a new instance of Server built from a config.
// 依据配置Server对象和它管理的各个组件
func NewServer(c *Config, buildInfo *BuildInfo) (*Server, error) {
    。。。。。。
       。。。。。。
       bind := c.BindAddress
    s := &Server{
        buildInfo: *buildInfo,
        err: make(chan error),
        closing: make(chan struct{}),
        BindAddress: bind,
        Logger: logger.New(os.Stderr),
        MetaClient: meta.NewClient(c.Meta),
        reportingDisabled: c.ReportingDisabled,
        httpAPIAddr: c.HTTPD.BindAddress,
        httpUseTLS: c.HTTPD.HTTPSEnabled,
        tcpAddr: bind,
        config: c,
    }
    s.Monitor = monitor.New(s, c.Monitor)
    s.config.registerDiagnostics(s.Monitor)
    if err := s.MetaClient.Open(); err != nil {
        return nil, err
    }
        。。。。。。
        。。。。。。
        return s, nil
}

MetaClient定义

定义在services/meta/client.go中，负责所有和meta data有关的操作和请求处理（核心定义是cacheData *Data）：

// Client is used to execute commands on and read data from
// a meta service cluster.
// 负责所有和meta data有关的操作和请求处理
type Client struct {
    logger *zap.Logger
    mu sync.RWMutex
    closing chan struct{}
    changed chan struct{}
    cacheData *Data //主要被处理的数据（meta信息的增，删，查，改操作）
    // Authentication cache.
    authCache map[string]authUser
    path string
    retentionAutoCreate bool
}
type authUser struct {
    bhash string
    salt []byte
    hash []byte
}
// NewClient returns a new *Client.
func NewClient(config *Config) *Client {
    return &Client{
        cacheData: &Data{ // Data中定义了meta需要管理的信息
            ClusterID: uint64(rand.Int63()),
            Index: 1,
        },
        closing: make(chan struct{}),
        changed: make(chan struct{}),
        logger: zap.NewNop(),
        authCache: make(map[string]authUser),
        path: config.Dir,
        retentionAutoCreate: config.RetentionAutoCreate,
    }
}

Data定义

定义在services/meta/data.go中，详细记录了meta中存储的信息：

// Data represents the top level collection of all metadata.
type Data struct {
    Term uint64 // associated raft term
    Index uint64 // associated raft index
    ClusterID uint64
    Databases []DatabaseInfo
    Users []UserInfo
    // adminUserExists provides a constant time mechanism for determining
    // if there is at least one admin user.
    adminUserExists bool
    MaxShardGroupID uint64
    MaxShardID uint64
}

DatabaseInfo

定义数据库的名称，查询方式和回收策略

// DatabaseInfo represents information about a database in the system.
type DatabaseInfo struct { // 管理RetentionPolicies与ContinuousQueries
    Name string
    DefaultRetentionPolicy string
    RetentionPolicies []RetentionPolicyInfo
    ContinuousQueries []ContinuousQueryInfo
}

RetentionPolicyInfo

Influxdb是按时间写入数据的，每个DB都有自己的Retention Policy，这个Retention Policy规定了每两个ShardGroup之间的时间跨度ShardGroup Duration, 即每过一个ShardGrup Duration就会生产切换到下一个新的ShardGroup;

1.封装了Retention Policy: 包括了复本个数，数据保留时长，ShardGroup切分时长和当前节点的所有ShardGroup信息

2.定义了按时间和时间范围查找相应ShardGroup的方法

// RetentionPolicyInfo represents metadata about a retention policy.
type RetentionPolicyInfo struct {
    Name string
    ReplicaN int
    Duration time.Duration
    ShardGroupDuration time.Duration
    ShardGroups []ShardGroupInfo
    Subscriptions []SubscriptionInfo
}

ShardGroupInfo记载了当前ShardGroupInfo的信息，并且根据StartTime和EndTime，就可以按时间和时间范围来查找到相应的ShardGroup;

代码如下：

// ShardGroupInfo represents metadata about a shard group. The DeletedAt field is important
// because it makes it clear that a ShardGroup has been marked as deleted, and allow the system
// to be sure that a ShardGroup is not simply missing. If the DeletedAt is set, the system can
// safely delete any associated shards.
type ShardGroupInfo struct {
    ID uint64
    StartTime time.Time // 这个group 的最早时间
    EndTime time.Time // 这个Group里最晚的时间
    DeletedAt time.Time
    // 这个ShardGroup包含的所有Shard,对于同一个ShardGroup，按Series key(Point key)不同散列写到不同的Shard中;
    Shards []ShardInfo
    TruncatedAt time.Time
}
// ShardInfo represents metadata about a shard.
type ShardInfo struct {
    ID uint64
    Owners []ShardOwner
}
// ShardOwner represents a node that owns a shard.
type ShardOwner struct {
    NodeID uint64
}

ContinuousQueryInfo

// ContinuousQueryInfo represents metadata about a continuous query.
type ContinuousQueryInfo struct {
    Name string
    Query string
}

UserInfo

// UserInfo represents metadata about a user in the system.
type UserInfo struct { // 封装了用户信息：用户名，密码，对db的操作权限
    // User's name.
    Name string
    // Hashed password.
    Hash string
    // Whether the user is an admin, i.e. allowed to do everything.
    Admin bool
    // Map of database name to granted privilege.
    Privileges map[string]influxql.Privilege
}

数据加载

初始化MetaClient之后调用cmd/influxd/run/server.go中的NewServer（）方法如下方法完成meta问价的加载和处理：

if err := s.MetaClient.Open(); err != nil {
    return nil, err
}

调用services/meta/client.go中的Open()方法，核心方法是Load（）和snapshot（）

// Open a connection to a meta service cluster.
func (c *Client) Open() error {
    c.mu.Lock()
    defer c.mu.Unlock()
    // Try to load from disk
    // meta数据是会保存到磁盘的，influxdb启动时也会从磁盘上读取:
    if err := c.Load(); err != nil {
        return err
    }
    // If this is a brand new instance, persist to disk immediatly.
    if c.cacheData.Index == 1 {
        if err := snapshot(c.path, c.cacheData); err != nil {
            return err
        }
    }
    return nil
}

Load()

meta数据存储在磁盘meta.db文件中，influxdb在启动时会从磁盘中加载到内存中,代码参考如下：

// Load loads the current meta data from disk.
func (c *Client) Load() error {
    file := filepath.Join(c.path, metaFile)
    f, err := os.Open(file)
    if err != nil {
        if os.IsNotExist(err) {
            return nil
        }
        return err
    }
    defer f.Close()
    data, err := ioutil.ReadAll(f)
    if err != nil {
        return err
    }
    // 利用protocol buffer作反序列化，获取文件中的数据存入缓存中
    if err := c.cacheData.UnmarshalBinary(data); err != nil {// services/meta/data.go
        return err
    }
    return nil
}

services/meta/data.go

// unmarshal deserializes from a protobuf representation.
func (data *Data) unmarshal(pb *internal.Data) {
    data.Term = pb.GetTerm()
    data.Index = pb.GetIndex()
    data.ClusterID = pb.GetClusterID()
    data.MaxShardGroupID = pb.GetMaxShardGroupID()
    data.MaxShardID = pb.GetMaxShardID()
    data.Databases = make([]DatabaseInfo, len(pb.GetDatabases()))
    for i, x := range pb.GetDatabases() {
        data.Databases[i].unmarshal(x)
    }
    data.Users = make([]UserInfo, len(pb.GetUsers()))
    for i, x := range pb.GetUsers() {
        data.Users[i].unmarshal(x)
    }
    // Exhaustively determine if there is an admin user. The marshalled cache
    // value may not be correct.
    data.adminUserExists = data.hasAdminUser()
}

snapshot()

将meta数据写入磁盘，所有的meta信息都有对应的protocol buffer结构，依赖protocol buffer作序列化和反序列化

// snapshot saves the current meta data to disk.
func snapshot(path string, data *Data) error {
    filename := filepath.Join(path, metaFile)
    tmpFile := filename + "tmp"
    f, err := os.Create(tmpFile)
    if err != nil {
        return err
    }
    defer f.Close()
    var d []byte
    // 利用protocol buffer作二进制的序列化
    if b, err := data.MarshalBinary(); err != nil {
        return err
    } else {
        d = b
    }
    // 写入文件
    if _, err := f.Write(d); err != nil {
        return err
    }
    if err = f.Sync(); err != nil {
        return err
    }
    //close file handle before renaming to support Windows
    if err = f.Close(); err != nil {
        return err
    }
    return file.RenameFile(tmpFile, filename)
}

其他方法

Commit

influxdb运行时，所有的meta信息在内存里都缓存一分，当meta信息有改动时，通过此方法立即写入磁盘，同时更新内存里的缓存

// commit writes data to the underlying store.
// This method assumes c's mutex is already locked.
func (c *Client) commit(data *Data) error {
    data.Index++
    // try to write to disk before updating in memory
    if err := snapshot(c.path, data); err != nil {
        return err
    }
    // update in memory
    c.cacheData = data
    // close channels to signal changes
    close(c.changed)
    c.changed = make(chan struct{})
    return nil
}

ShardGroupsByTimeRange和ShardsByTimeRange

按给定的时间查找已有的ShardGroup和Shard，和后续需要讲解的查询息息相关

// 按给定的时间查找已有的ShardGroup和Shard
// ShardGroupsByTimeRange returns a list of all shard groups on a database and policy that may contain data
// for the specified time range. Shard groups are sorted by start time.
func (c *Client) ShardGroupsByTimeRange(database, policy string, min, max time.Time) (a []ShardGroupInfo, err error) {
    c.mu.RLock()
    defer c.mu.RUnlock()
    // Find retention policy.
    // 先找到RetentionPolicyInfo
    rpi, err := c.cacheData.RetentionPolicy(database, policy)
    if err != nil {
        return nil, err
    } else if rpi == nil {
        return nil, influxdb.ErrRetentionPolicyNotFound(policy)
    }
    groups := make([]ShardGroupInfo, 0, len(rpi.ShardGroups))
    // 遍历RPI中的所有ShardGroup
    for _, g := range rpi.ShardGroups {
        if g.Deleted() || !g.Overlaps(min, max) {
            continue
        }
        groups = append(groups, g)
    }
    return groups, nil
}
// ShardsByTimeRange returns a slice of shards that may contain data in the time range.
func (c *Client) ShardsByTimeRange(sources influxql.Sources, tmin, tmax time.Time) (a []ShardInfo, err error) {
    m := make(map[*ShardInfo]struct{})
    for _, mm := range sources.Measurements() {
        groups, err := c.ShardGroupsByTimeRange(mm.Database, mm.RetentionPolicy, tmin, tmax)
        if err != nil {
            return nil, err
        }
        for _, g := range groups {
            for i := range g.Shards {
                m[&g.Shards[i]] = struct{}{}
            }
        }
    }
    a = make([]ShardInfo, 0, len(m))
    for sh := range m {
        a = append(a, *sh)
    }
    return a, nil
}

PrecreateShardGroups

预先创建ShardGroup, 避免在相应时间段数据到达时才创建ShardGroup

// 预先创建ShardGroup, 避免在相应时间段数据到达时才创建ShardGroup
// Influxdb定义了一个Service:Precreator Serivec(services/precreator/service.go)，
// 实现比较简单，周期性的调用PrecreateShardGroups,看是否需要创建ShardGroup
// PrecreateShardGroups creates shard groups whose endtime is before the 'to' time passed in, but
// is yet to expire before 'from'. This is to avoid the need for these shards to be created when data
// for the corresponding time range arrives. Shard creation involves Raft consensus, and precreation
// avoids taking the hit at write-time.
func (c *Client) PrecreateShardGroups(from, to time.Time) error {
    c.mu.Lock()
    defer c.mu.Unlock()
    data := c.cacheData.Clone()
    var changed bool
    // 遍历所有的DatabaseInfo信息
    for _, di := range data.Databases {
        for _, rp := range di.RetentionPolicies {
            if len(rp.ShardGroups) == 0 {
                // No data was ever written to this group, or all groups have been deleted.
                continue
            }
            // ShardGroups中的所有ShardGroup已经是按时间排序好的，最后一个也就是最新的一个ShardGroup
            g := rp.ShardGroups[len(rp.ShardGroups)-1] // Get the last group in time.
            if !g.Deleted() && g.EndTime.Before(to) && g.EndTime.After(from) {
                // Group is not deleted, will end before the future time, but is still yet to expire.
                // This last check is important, so the system doesn't create shards groups wholly
                // in the past.
                // Create successive shard group.
                // 计算出需要创建的ShardGroup的开始时间
                nextShardGroupTime := g.EndTime.Add(1 * time.Nanosecond)
                // if it already exists, continue
                if sg, _ := data.ShardGroupByTimestamp(di.Name, rp.Name, nextShardGroupTime); sg != nil {
                    c.logger.Info("Shard group already exists",
                        logger.ShardGroup(sg.ID),
                        logger.Database(di.Name),
                        logger.RetentionPolicy(rp.Name))
                    continue
                }
                newGroup, err := createShardGroup(data, di.Name, rp.Name, nextShardGroupTime)
                if err != nil {
                    c.logger.Info("Failed to precreate successive shard group",
                        zap.Uint64("group_id", g.ID), zap.Error(err))
                    continue
                }
                changed = true
                c.logger.Info("New shard group successfully precreated",
                    logger.ShardGroup(newGroup.ID),
                    logger.Database(di.Name),
                    logger.RetentionPolicy(rp.Name))
            }
        }
    }
    if changed {
        if err := c.commit(data); err != nil {
            return err
        }
    }
    return nil
}

Influxdb定义了一个Service:Precreator Serivec(services/precreator/service.go)，实现比较简单，周期性的调用PrecreateShardGroups,看是否需要创建ShardGroup

// runPrecreation continually checks if resources need precreation.
func (s *Service) runPrecreation() {
    defer s.wg.Done()
    for {
        select {
        case <-time.After(s.checkInterval):
            if err := s.precreate(time.Now().UTC()); err != nil {
                s.Logger.Info("Failed to precreate shards", zap.Error(err))
            }
        case <-s.done:
            s.Logger.Info("Terminating precreation service")
            return
        }
    }
}

Cluster版本中的Meta

整体架构

参考

InfluxMeta data分析db的

InfluxDB中文文档

Influxdb原理详解

Influxdb Cluster版本中的Meta

InfluxDB meta文件解析

InfluxDB源码目录结构和数据目结构

饿了么Influxdb实践之路

InfluxDB基本概念和操作

【赵渝强老师】MongoDB的Journal日志数据库nosqlmongodb
数据是MongoDB的核心，MongoDB通过使用Journal日志保证数据的安全。Journal日志用于记录上一个检查点之后发生的数据更新，并将更新的信息顺序写入Journal日志文件中。通过使用Journal日志能够将数据库从系统异常终止事件中还原到一个有效的状态。通过6.5.1.3小节的介绍了解到，MongoDB使用预写日志机制实现数据的持久化。每个Journal日志文件的大小是100M，并
【赵渝强老师】PostgreSQL的物理存储结构数据库postgresql
PostgreSQL在执行initdb的数据库集群初始化时会指定一个目录。该目录通过环境变量$PGDATA来表示。当数据库集群初始化完成后，会在这个目录生成相关的子目录以及一些文件。这些生成的文件就是PostgreSQL的物理存储结构中的文件。如下图所示。如上图所示，环境变量$PGDATA指向的目录就是/home/postgres/training/pgsql/data。下表说明了其中的每个目录的
【赵渝强老师】PostgreSQL的WAL预写日志文件数据库postgresql
PostgreSQL数据库的物理存储结构主要是指硬盘上存储的文件，包括：数据文件、日志文件、参数文件、控制文件、WAL预写日志文件等等。下面重点讨论一下PostgreSQL的WAL预写日志文件。视频讲解如下：https://www.bilibili.com/video/BV1HCWBehEjj/?aid=113020218901...WAL是WriteAheadLogging的缩写，即预写日志，它
【赵渝强老师】PostgreSQL中的模式数据库postgresql
在PostgreSQL中，所有的数据库对象都是属于模式中的对象。这里的数据库对象包括：表、索引、视图、存储过程、触发器等等。所有数据库对象都有各自的对象标识符oid（objectidentifiers）,它是一个无符号的四字节整数，相关对象的oid都存放在相关的系统目录表中，比如数据库的oid和表的oid分别存放在pg_database,pg_class表中。下面重点介绍一下PostgreSQL中
知识图谱语义搜索：构建智能化搜索未来 cooldream2009 AI技术知识图谱知识图谱人工智能
目录前言1.知识图谱语义搜索的基础概念1.1什么是知识图谱1.2什么是语义搜索1.3知识图谱语义搜索的结合2.知识图谱语义搜索的核心技术2.1自然语言处理技术2.2知识图谱构建与管理2.3图数据库与查询技术3.知识图谱语义搜索的应用场景3.1智能问答系统3.2个性化推荐3.3专业领域信息检索4.知识图谱语义搜索的未来展望4.1技术挑战4.2应用趋势结语前言随着信息技术的飞速发展，数据量呈现爆炸式增
【学习总结|DAY027】JAVA操作数据库 123yhy传奇学习 java 数据库 mybatis spring boot
在后端开发中，Java操作数据库是核心技能。本文将详细介绍JDBC、MyBatis及SpringBoot配置文件相关知识，并给出实用代码示例。一、JDBC（JavaDataBaseConnectivity）（一）简介JDBC是sun公司定义的操作关系型数据库的API规范。它如同一个标准接口，各数据库厂商实现此接口并提供驱动jar包。例如，我们在使用MySQL数据库时，需引入mysql-connec
【学习总结|DAY029】后端Web实战(员工管理)一：多表操作与查询优化 123yhy传奇学习 java maven springboot web 数据库
在Web后端开发中，员工管理模块是企业级应用的重要组成部分。本文将深入探讨Tlias系统员工管理模块的开发过程，重点聚焦于多表关系处理、多表查询实现以及员工列表查询的优化，为开发者提供全面的技术参考。一、多表关系剖析（一）一对多关系（以部门与员工为例）在实际业务场景中，一个部门通常会包含多个员工，这就形成了典型的一对多关系。在数据库设计层面，我们通过在员工表（emp）中添加外键dept_id来关联
【学习总结|DAY030】后端Web实战(员工管理)二：新增员工、事务管理与文件上传 123yhy传奇学习前端
在Web后端开发领域，实现复杂业务功能是开发者的核心任务之一。本文将围绕Tlias系统的员工管理模块，详细介绍新增员工、事务管理以及文件上传功能的开发过程，通过实际代码示例帮助读者深入理解相关技术要点。一、新增员工功能实现新增员工功能涉及员工基本信息和工作经历信息的存储。在数据库设计上，使用emp表存储员工基本信息，emp_expr表存储员工工作经历信息。（一）需求与接口设计接口用于添加员工信息，
【学习总结|DAY026】MySQL基础 123yhy传奇学习 mysql 数据库
在Web后端开发中，数据库扮演着至关重要的角色，它是存储和管理数据的核心组件。近期学习了数据库相关知识，在此分享学习过程中的重点内容，涵盖数据库基础概念、MySQL操作以及SQL语句的详细使用等方面。一、数据库基础概念数据库（DataBase-DB）：形象地说，它就像是一个大型的数据仓库，专门用于高效地存储和管理海量数据。例如，在金融领域，同花顺的数据中心需要存储海量的股票、基金等金融数据，包括股
Java Web 登录系统示例：过滤器技术与 JDBC 数据库连接 Bro_cat JavaWeb开发 java tomcat maven java-ee servlet 过滤器 Filter
在这篇博客中，我们将探讨一个简单的JavaWeb登录系统示例，重点介绍其中使用的过滤器技术以及JDBC数据库连接技术。这个示例包括后端代码和简单的前端代码，帮助你理解这些技术的实现和原理。项目结构过滤器技术什么是过滤器？过滤器（Filter）是JavaWeb开发中的一个强大工具，它可以在请求到达Servlet之前或响应返回客户端之前对请求和响应进行拦截和处理。过滤器可以用来执行诸如字符编码设置、跨
@Repository注解和@mapper的区别 YQ9 mybatis java spring boot
1.@Repository注解通俗解释：你可以把@Repository注解想象成是一个专门负责管理数据库操作的“仓库管理员”。这个管理员主要负责和数据库打交道，就像管理一个大仓库一样，他会进行各种操作，比如把货物（数据）存进仓库（数据库），从仓库里拿出货物，更新货物信息，或者把货物从仓库中删除。举例：假设你在运营一个在线商城，需要存储和管理商品信息。你可以创建一个ProductRepository
分享 7 个用 Python 开发成的数据库编程咕咕gu- 数据库 Python入门 Python基础 python 开发语言
如果你正在学习Python，那么你需要的话可以，点击这里Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！Python作为一种高层次的编程语言，因其简单易用和强大的社区支持，被用于实现多种类型的数据库。这些数据库可以分为几大类，包括关系型数据库、NoSQL数据库、嵌入式数据库和面向对象数据库等。下面这些数据库不常用，看可以通过学习这些项目源码提升自己对数据库的理解
MySQL无限极分类表设计：实战项目中的高效解决方案 MissYou-Coding mysql 数据库
在许多实战项目中，如电商系统、内容管理系统等，我们常常需要处理具有层级关系的数据，例如商品分类、文章栏目等。这些数据通常呈现出无限极分类的特点，即一个分类下可以有多个子分类，子分类下又可以有更深层次的子分类，层级关系复杂且不固定。下面将介绍一种适用于MySQL数据库的无限极分类表设计，并对其设计思路、优缺点进行详细分析，希望能为同行们提供一些有价值的参考。表结构设计我们设计的无限极分类表名为cat
python 清空表格_python 清空表数据库表 weixin_39989190 python 清空表格
《Greenplum5.0最佳实践》迁移数据使用Gptransfer使用Gptransfer命令迁移一个Greenplum数据库集群中的数据到另一台集群(metradata,data)gptransfer可以迁移数据库中的全部数据或者部分选择的表到另外一台Greenplum中。源数据库和目的数据库可以在同一个集群中，也可以在不同的集群中。gp...文章whatcat2017-11-194163浏览
python爬虫 django搜索修改更新数据_Django+python+BeautifulSoup垂直搜索爬虫 weixin_39897070 python爬虫 django搜索修改更新数据
使用python+BeautifulSoup完成爬虫抓取特定数据的工作，并使用Django搭建一个管理平台，用来协调抓取工作。因为自己很喜欢Djangoadmin后台，所以这次用这个后台对抓取到的链接进行管理，使我的爬虫可以应对各种后期的需求。比如分时段抓取，定期的对已经抓取的地址重新抓取。数据库是用python自带的sqlite3，所以很方便。这几天正好在做一个电影推荐系统，需要些电影数据。本文
mysql mvcc 并发update_MySQL——MVCC--多版本并发控制机制瓦罗兰十字军 mysql mvcc 并发update
前言以下的分析均在mysql的InnoDB引擎下。假设此时事务A与事务B同时执行。一、定义：MVCC(Multi-VersionConcurrencyControl，多版本并发控制)一种并发控制机制，在数据库中用来控制并发执行的事务，控制事务隔离进行。二、核心思想：MVCC是通过保存数据在某个时间点的快照来进行控制的。使用MVCC就是允许同一个数据记录拥有多个不同的版本。然后在查询时通过添加相对应
mysql mvcc与锁的关系_mysql四种隔离级别和mvcc以及锁之间的关系夏至未至 mysql mvcc与锁的关系
什么是事务的隔离级别隔离级别：理解隔离级别之前需要先了解事务的四个特性，分别是：A(Atomic)：原子性是指数据库的事务是一个不可分割的工作单位，只有数据库事务都成功才算成功，任何一个SQL的失败，数据库状态都必须回退到事务开始前的状态C(Consistence)：一致性是指事务将数据库的状态从一种状态转变为下一个一致的状态。在事务的开始和结束后，数据库的完整性约束都没有被破坏。I(Isolat
【Node.js】Session原理详解 Peter-Lu #NodeJS node.js express 前端 npm javascript
文章目录一、Session机制概述1.什么是Session2.Session与Cookie的关系二、Session的工作流程1.基本流程2.示例代码三、Session的存储方式1.内存存储2.文件存储3.数据库存储Redis存储示例四、Session的生命周期1.Session过期时间2.手动销毁Session五、Session在分布式系统中的应用1.StickySession2.Session共
PG vs MySQL mvcc机制实现的异同进击的CJR postgresql mysql mysql 数据库
MVCC实现方法比较MySQL写新数据时，把旧数据写入回滚段中，其他人读数据时，从回滚段中把旧的数据读出来PostgreSQL写新数据时，旧数据不删除，直接插入新数据。MVCC实现的原理PG的MVCC实现原理定义多版本的数据——使用元组头部信息的字段来标示元组的版本号定义数据的有效性、可见性、可更新性——通过当前的事务快照和对应元组的版本号判断实现不同的数据库隔离级别——通过在不同时机获取快照实现
php链接oracle乱码，尝试把一个php的项目转成java， slm311 java
最近有个新需求，OA上的考勤信息确认，开始的时候搞了个php的版本，莫名其妙的数据库会乱码（oracle）(等有时间再写一篇php链接oracle数据库）折腾了将近一个周，乱码莫名其妙的出现，代码啥也不动，多请求两遍又正常了。准备搞个java来替换php，在gpt的协助下，搞成了。上代码连接数据库：privatestaticfinalStringDB_URL="jdbc:oracle:thin:@
spring-boot 整合 shardingsphere-jdbc、mybatis-plus 数据分片（文末有彩蛋）ゞ註﹎錠oo 架构之路 mybatis spring boot spring 数据库
1.什么是ShardingSphere？ApacheShardingSphere是一款分布式的数据库生态系统，可以将任意数据库转换为分布式数据库，并通过数据分片、弹性伸缩、加密等能力对原有数据库进行增强。ApacheShardingSphere设计哲学为DatabasePlus，旨在构建异构数据库上层的标准和生态。它关注如何充分合理地利用数据库的计算和存储能力，而并非实现一个全新的数据库。它站在数
ShardingSphere 功能详细介绍冰糖心158 数据库
ShardingSphere是一个开源的分布式数据库中间件，旨在为数据库提供高可扩展性、可管理性和高可用性，支持数据的分库分表（Sharding）、数据库路由、数据同步等功能。ShardingSphere本质上是一个分布式数据库代理，它提供透明的分布式数据操作，使得应用程序可以像操作单一数据库一样操作分布式数据。ShardingSphere具有以下几个主要功能：1.分库分表（Sharding）Sh
Shardingsphere-Proxy 5.5.0数据迁移她又在丛中笑 shardingsphere zookeeper java spring boot
Shardingsphere-Proxy5.5.0数据迁移Shardingsphere系列目录：背景配置集群部署搭建Zookeeper修改shardingsphere-proxy配置重启shardingsphere-proxy执行数据迁移连接代理数据库实例（Navicate）应用代理数据库注册目标分片数据库存储单元注销目标分片数据库存储单元创建分库分表规则删除规则注册源数据库存储单元注销源数据库存
最新java springboot druid shardingsphere 与shardingsphere-proxy读写分离 lgbisha springBoot java java spring boot 数据库 linux
最新javaspringbootdruidshardingsphere读写分离公司又有新的项目，然后项目需求要求有数据库读写分离，这个需求倒也没什么问题，就是采用什么方式来解决网上调研了一堆方案，最后选择比较大众的解决方案用shardingsphere，但是呢这个shardingsphere也有两种，一种是java接入shardingsphere的jar包，然后进行配置来进行读写分离，还有一种是s
Spring Boot 中使用 ShardingSphere-Proxy 冰糖心158 数据库 spring boot 后端 java
在SpringBoot中使用ShardingSphere-Proxy，与使用ShardingSphere-JDBC有所不同。ShardingSphere-Proxy作为独立的代理层，处理数据库分库分表、路由和负载均衡等功能，而应用程序通过JDBC连接到代理服务，而不是直接连接数据库。因此，集成ShardingSphere-Proxy的方式主要包括配置SpringBoot连接到ShardingSph
基于Android 看点新闻系统(源码+LW+部署讲解+数据库+ppt) 西红柿计算机毕设 Android毕设数据库 java spring boot android-studio
！！！！！！！！！选题不知道怎么选不清楚自己适合做哪块内容都可以免费来问我避免后期給自己答辩找麻烦增加难度（部分学校只有一次答辩机会没弄好就延迟毕业了）会持续一直更新下去有问必答一键收藏关注不迷路源码获取：https://pan.baidu.com/s/1aRpOv3f2sdtVYOogQjb8jg?pwd=jf1d提取码:jf1d！！！！！！！！！项目介绍基于Android看点新闻系统(源码+L
Nacos 监控全攻略：从 Prometheus 数据采集到核心指标解读磐基Stack专业服务团队 Nacos Nacos
文章目录第1章Prometheus采集Nacosmetrics数据第2章Nacosmetrics含义2.1jvmmetrics2.2Nacos监控指标2.3nacos异常指标2.4clientmetricsNacos2.X版本已有完善的监控体系，支持通过暴露metrics数据接入第三方监控系统监控Nacos运行状态，目前支持prometheus、elasticsearch和influxdb。下面重
【Redis】为什么Redis单线程还这么快？通过什么机制进行优化的？来一杯龙舌兰数据库 #Redis redis 数据库缓存多路复用内存优化 redis快
文章目录纯内存操作高效的数据结构非阻塞I/O与多路复用技术（网络I/O优化）非CPU密集型任务单线程的优势单线程的劣势redis6.0引入多线程后台线程的优化总结更多相关内容可查看Redis的瓶颈在于内存和网络带宽纯内存操作Redis是一个内存数据库，它的数据都存储在内存中，这意味着我们读写数据都是在内存中完成，这个速度是非常快的可能有很多人只知道存内存更快，但是不知道原因内存：中每个存储单元都有
O2O同城系统架构与功能分析商鼎云技术源码自研产品 O2O同城同城系统
2015工作至今，10年资深全栈工程师，CTO，擅长带团队、攻克各种技术难题、研发各类软件产品，我的代码态度：代码虐我千百遍，我待代码如初恋，我的工作态度：极致，责任，死磕！欢迎点赞、收藏、关注，更多分享请进我主页。一、系统架构服务端：Java（最低JDK1.8，支持JDK11以及JDK17）数据库：MySQL数据库（标配5.7版本，支持MySQL8）ORM框架：Mybatis（集成通用tk-ma
10秒教会你mysql的连接 m0_74823933 mysql adb 数据库
连接MySQL数据库通常可以通过多种方法实现，以下是几种常见的方法，我将按照您的要求以清晰、分点的方式归纳说明：1.使用MySQL命令行客户端打开终端或命令提示符：首先，打开您的计算机上的终端或命令提示符窗口。输入连接命令：在命令行中输入以下格式的命令：bash复制代码mysql-u[用户名]-p将[用户名]替换为您的MySQL用户名。输入密码：按Enter键后，系统会提示您输入密码。输入密码（注
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &