一颗小小的石头.

MIT6.5830 实验2

前置回顾

在实验一中，我们完成了基本的数据存储层功能，以及实现了最核心的几个数据结构，Tuple、HeapFile、HeapPage、Buffer Pool 等，对他们的增删查改已经支持，但没有和上层的逻辑 sql 关联起来。实验二需要对 Tuple 数据结构有深刻的理解，这里附上实验一的核心内容。

HeapFile：物理上对应一个操作系统的文件，即实验中的 .dat 文件。逻辑上对应一张表。

HeapPage：物理概念。内存和磁盘存储的最小单位，固定为 4096B 大小。承上启下的作用，逻辑代码读取内存存储使用 Page ，内存中的数据想写入到磁盘中，也是利用 Page。和 HeapFile 是一对多。

Tuple： 逻辑上，理解为数据表中的一行。物理存储上，和 Page 是一对多的关系，Tuple 中包含自己属于那个Page的哪个 Slot 槽位置。

Buffer Pool ：内存中的页面缓存。File和Page虽然是一对多关系，但 File 不能直接从磁盘中读取Page, 需要借助 Buffer Pool 去读取，如果缓存中有直接返回，如果没有，由 Buffer Pool 去磁盘中读取对应的页面。

实验目标

为 GoDB 编写一组运算符来实现表修改（例如，插入和删除记录）、过滤器、联接、聚合等。然后可以进行简单的 sql 查询，但 SQL 解析器不需要自己实现，查询计划和执行逻辑已经提供好。

实验二作为承上启下的关键阶段，实现难度上先易后难，因为有提供可参照的函数实现，所以刚开始比较简单，也能通过各个操作对应的test程序，但当最后运行 easy_parser_test.go 时会发现有各种问题需要修复。

实现思路

先介绍一下本次实验涉及到的各个文件：

文件名	操作	对应sql功能	返回值	难度
filter_op.go	过滤	where 条件	过滤后的行	简单
limit_op.go	截断	limit 操作	固定数量的行	简单
order_by_op.go	排序	order 操作	排过序的行	中等
insert_op.go	插入	insert 语句	成功插入的行数	简单
delete_op.go	删除	delete 语句	成功删除的行数	简单
project_op.go	投影	select 操作	仅包含指定列的行	困难
join_op.go	连接	join on 操作	连接后的行	困难
agg_op.go	聚合	max() min()	聚合后的行	中等

基本概念

TupleDesc 行描述符

在实验一中，Tuple指的是表中的一行数据，其中 tupleDesc 是行的列信息。在实验二中， tuple 的概念得到了延伸，不再限定于表里的一行数据，它可以是任何地方的一行数据。例如：

join 两个表得到的中间结果是一行数据
例如insert 操作逻辑上返回的是成功插入的行数，实现上返回的是一个值为Rows的Tuple
例如 max 聚合操作逻辑上返回的是最大值，实现上返回的是一个值为 RowValue 的Tuple

总之，所有操作的请求入参和返回出参都是 Tuple

Iterator 迭代器

在实验一中已经接触过迭代器，它采用闭包的方式逐个返回要取出的元素，而非一次性全部取出。在实验二中，大部分op操作结束后返回Tuple都是用迭代器的方式。理由如下：

某些情况下数据库通过迭代器等方式向上层返回数据，而不是一次性获取所有数据。例如mysql客户端使用scan方法手动逐行读取。否则如果select出的数据非常多，多到连内存都放不下，就不能很好的处理。用分批返回的方式即可解决。例如MySQL server层中的net buffer缓冲区就是服务端有大量数据需要返回给客户端的时候，放置分批数据的地方。当然也可以直接使用scan方法读取mysql内部结果的迭代器。

思考：所有操作都可以用迭代器的方式逐个返回吗？并不是，例如 order by 操作，必须把所有数据都读到内存中才能排序，虽然排序完依然使用迭代器返回，但核心优势无法利用上。

Operator 操作

是一个接口，含义是某种 sql 操作，对应上表中的各种操作类型。接口有两个方法：

Descriptor() 获取列信息。刚才提到操作中的列信息不再一定是一行的列了，而可能是部分行，例如 filter 过滤操作针对是指定的两列，这两列可能不是原始行中的列，例如 select from t where max(age) > avg(age)
Iterator() 获取迭代器。刚才提到，所有操作的结果都使用迭代器的方式去返回，在迭代器迭代的过程中才真正执行一些操作，即惰性计算。

Expr 表达式

exprs.go 中的 Expr 接口含义为，能够应用于 Tuple 上以获取值的操作。例如：

select age - 18 from t 中的中的减操作，需要对每个Tuple 的 age 减 18 的到一个值。
select * from t where age1 > age2 中，需要分别取出每个 tuple 中的 age1 和 age2 列的值再做比较。

所以，表达式接口给定了3种实现，分别是 FieldExpr、ConstExpr、FuncExpr 分别代表取列值、常量值、经过函数运算后的值。

Exercise 1

根据实验手册 lab2.readMe 文件，从最简单的开始， filter_op.go 和 join_op.go

type Filter[T constraints.Ordered] struct {
    op     BoolOp  // 布尔操作，比较左值和右值的大小
    left   Expr   // 左值表达式，使用 EvalExpr 可获取值
    right  Expr   // 右值表达式，使用 EvalExpr 可获取值
    child  Operator  // 子操作迭代器，也就是需要执行过滤操作的 Tuple 集合。
    getter func(DBValue) T   // 数据类型转换，从 DBValue 转换到 泛型T，例如从 IntField 转 int
}

其中的 child 是 Operator 接口，有迭代器方法，可以从中获取需要执行过滤操作的 tuple ，例如

select * from t where age > 18 那么 child 就是整个表 HeapFile 对象。
select * from t1 where age > (select age from t2) 那么 child 就是子表的 Project 对象。

filter_op : Iterator

很简单，取待过滤的 Tuple ，即 child 中的 Tuple ，循环迭代器直到找到一个符合条件的 Tuple 的返回。

左值和右值都是一个表达式，直接用提供好的 EvalExpr 方法获取列值，值之前的比较用提供好的 evalPred 方法。

注意返回值也是一个迭代器，注意闭包嵌套的写法。

filter_op : Descriptor

过滤操作针对的是左值和右值，直接返回左右表达式对应的 FieldType 即可。

EqualityJoin : Descriptor

type EqualityJoin[T comparable] struct {
    // Expressions that when applied to tuples from the left or right operators,
    // respectively, return the value of the left or right side of the join
    leftField, rightField Expr

    left, right *Operator //operators for the two inputs of the join

    // Function that when applied to a DBValue returns the join value; will be
    // one of intFilterGetter or stringFilterGetter
    getter func(DBValue) T

    // The maximum number of records of intermediate state that the join should use
    // (only required for optional exercise)
    maxBufferSize int
}

等值 join，相当于from t1 join t2 on t1.xx = t2.yy，其中 left, right 分别对应左右两个表，leftField, rightField 分别代表连接的字段。

根据函数注释，Descriptor 函数返回的是左右两边的 desc 组合, 借助之前实现的 TupleDesc 的 merge 方法

EqualityJoin : Iterator

表连接的实际逻辑就相当于两层嵌套的 for 循环，外层循环表 t1 的每一行，内层循环表 t2 的每一行去匹配外层的行

最直接的实现也是这样的

需要注意的是，这里因为 EqualityJoin 结构体定义中的泛型是 comparable 而不是 constraints.Ordered 所以没法用 filter 里面的evalPred 函数进行比较， go1.18后的泛型，comparable的意思是可以直接使用 == 号进行判断。实验手册已经指明了，表连接就是等值连接，不支持其他大小关系。

以上直接 join 的方式无法通过 join_op_test.go 中的 TestBigJoinOptional 测试，原因是性能太差导致超时。优化后可以获得额外的课程分数奖励。Join 操作是常见的 SQL 操作，所以优化方案备受关注和研究，常见的手段有 Sort-Merge Join 、Hash Join 等，无论怎么优化都但无法避免两个表的笛卡尔积操作，但可以以空间换时间来提高性能，例如这里使用 Sort-Merge Join.

先对两个表进行排序[根据 join 列值]，时间复杂度为 O(n*logn)，因为把两个表的所有数据都拉取到内存中了，所以空间复杂度 O(m+n)，当然如果join列有索引的话，那么相当于已经有序，直接迭代器取出来即可，不需要在内存中再做排序。然后对排序好序的两个表进行连接，其实就是双指针算法，leetCode 上一大把，可抽象为找出数组 [1,2,2,4,5] 和 [0,2,2,4,4,6] 的相等元素对，有6组 [2,2] [2,2] [2,2] [2,2] [4,4] [4,4] 最大时间复杂度为 O(m+n)

如果考虑空间复杂度不超过 maxBufferSize 的要求，则需要采用 Hash Join 方法，为其中一张表（通常是较小的表，称为 "build" 表）创建一个在内存中的临时哈希表，驱动另外一个表做循环匹配。需要注意的是解决 hash 冲突问题。时间复杂度约等于 O(m/size * n) 空间复杂度为 O(size)

通过理论推导和实际验证，得出一般情况下 join 操作选择小表做驱动表有更好的性能。又根据被驱动表有无索引，分别为 ndex nested-loop join 和 block nested-loop join 两种方法，进一步multi-range read优化，针对多个id先排序再去回表，约等于顺序读聚簇索引。大表的join对buffer pool不断的读入和淘汰，不仅实时影响其他事务，而且在join结束后也要靠后续的查询去恢复命中率。

Exercise 2

agg_op

实现一些聚合操作，对应 sql 中的 select name,max(age) from t group by name

agg_op.go 中已经提供了一个 CountAggState 案例做参考，那么基本可以直接依葫芦画瓢直接cv

// interface for an aggregation state
type AggState interface {
    // Initializes an aggregation state. Is supplied with an alias,
    // an expr to evaluate an input tuple into a DBValue, and a getter
    // to extract from the DBValue its int or string field's value.
    Init(alias string, expr Expr, getter func(DBValue) any) error

    // Makes an copy of the aggregation state.
    Copy() AggState

    // Adds an tuple to the aggregation state.
    AddTuple(*Tuple)

    // Returns the final result of the aggregation as a tuple.
    Finalize() *Tuple

    // Gets the tuple description of the tuple that Finalize() returns.
    GetTupleDesc() *TupleDesc
}

AddTuple()：指的是对一个新的 tuple 做聚合会发生什么，例如对于 sum 操作会发生相加，对于 max 操作会和已有的 max 值做比较赋值。

Finalize()：执行完聚合操作后，最终返回一个 tuple ，例如对于 avg 会返回一个平均值 tuple

GetTupleDesc()：返回执行聚合后形成的列信息，例如 sum 操作最后会返回一个 int 列 tuple

以下给出 AvgAggState的代码，其他的聚合agg代码类似。

agg_state

对应 group by 分组和聚合器逻辑。

type Aggregator struct {
    // Expressions that when applied to tuples from the child operators,
    // respectively, return the value of the group by key tuple
    groupByFields []Expr

    // Aggregation states that serves as a template as to which types of
    // aggregations in which order are to be computed for every group.
    newAggState []AggState

    child Operator // the child operator for the inputs to aggregate
}

Descriptor

对于一个 sql 分组查询： select name,max(age) from t group by name ，很明显返回的列应该是分组列 + 聚合列，所以这里拼接一下。

extractGroupByKeyTuple

已经实现好的 Iterator 中调用，作用是从给定的 tuple 中提取聚合字段, 生成新的 tuple 并返回

getFinalizedTuplesIterator

例如 select name,count(name) from t1 group by name 结果应该是：

列信息： name,count 行信息：sam,1 geo,3

入参 groupByList 就是结果所有的分组列组成的行，例如 sam 和 geo

入参 aggState 是聚合列以及列的结果，例如在name列上聚合的 1 和 3

需要把上面两种列组装起来，返回一个迭代器

Exercise 3

删除和新增操作，比较简单，这里以新增为例。注意返回值是一个名为 count 的列，表示成功了多少行数据。

Exercise 4

project_op 投影操作是整个实验二的难点，比较抽象。在之前实验一的 tuple.go 中，我们实现了 project 方法，功能是根据 fields 把 tuple 中的匹配字段挑出来形成新的 tuple，理解了"投影"的内涵。

project_op: Descriptor

// Project 投影，针对某个Tuple集合，仅选取指定的列 例如:select name,age from person
type Project struct {
    selectFields []Expr   // required fields for parser
    outputNames  []string // 相当于 select name as n 中的 as 重新命名
    child        Operator
    //add additional fields here
    // TODO: some code goes here
    distinct bool
}

列描述符不难理解，直接取 selectFields 字段就可以，但必须把输出的名字 outputNames 注入进去，也就是列名 alias , 否则在重命名的场景下无法通过测试。

project_op: Iterator

迭代器的难点不在于 distinct 的逻辑，而是如何构造返回数据，具体说就是如何选取列。

Exercise 5

排序操作

// TODO: some code goes here
type OrderBy struct {
    orderBy []Expr // OrderBy should include these two fields (used by parser)
    child   Operator
    //add additional fields here
    ascendingList []bool
}

order_by_op：Descriptor

order_by_op：Iterator

重点是排序函数的编写，注释中已经指引了，在 golang 语言中需要让对象数组实现 sort.Sort 接口，并让我们去参考 https://pkg.go.dev/sort 中的代码，发现正是我们想要的，直接依葫芦画瓢。

Golang 中的接口是隐式实现，不像 Java 那样明确。所以 GoLand IDE 的提示就很重要了。实现好排序 Sort 接口之后，进一步实现迭代器接口就很容易了。

Exercise 6

Limit 截取操作

type LimitOp struct {
    child     Operator //required fields for parser
    limitTups Expr
    //add additional fields here, if needed
}

实现起来也比较简单，只需要在迭代器外维护一个计数器即可

Exercise 7

检测我们的上述实现是否能跑通基本的SQL。无需任何修改直接运行 simple_query_test.go 如果全部通过，不一定说明代码没问题，还需要能跑通 easy_parser_test.go 检测程序。

思考

SQL 解析器

实验仅仅让编写基础操作的代码，但上层调用者没有让人编写。最精髓的 SQL 解析器已经提供了，代码在 parser.go 中，复杂度和难度都较大，值得学习和参考。详细阅读逻辑执行计划和物理执行计划。

其他

通过实验能理解到作为普通 curd body 考虑不到的地方。例如：

实现底层join逻辑之后，对不同的 join 算法、有无索引等对查询的性能和内存影响是怎样的？
实现 select distinct 逻辑之后，了解 distinct 导致迭代器需要先拉取全量数据对性能的影响，order by同理。

联系方式

[email protected]

OSPO Summit 2025 正式定档！议题征集同步开启开源
历经二十余年的发展，OSPO已然成为企业数字化转型的战略枢纽、产学研协同创新的关键桥梁、公共领域开放生态建设的核心引擎。作为这一进程的重要见证者和推动者，OSPOSummit也将在2025年6月12日迎来它的第三次进化。会议信息时间：2025年6月12日地点：北京议题征集，期待你的声音现在，我们面向全球开源社区决策者、企业技术管理者、学术机构研究者及一线开发者，发起议题征集！诚邀您分享OSPO如何
软件定义世界下的教育创新：高校计算机实验室应重心转向开源平台开源
一、一键式教学环境部署，节省90%准备时间•应用模板库：提供200+预置教学工具模板（如JupyterLab+TensorFlow、MySQL集群），教师可根据课程需求选择模板，5分钟内完成包含依赖库、运行环境的全栈部署。•多版本隔离：支持同一服务器并行运行不同版本框架（如Django3.2教学版与4.1开发版），避免版本冲突导致30%的课堂时间浪费。•自助式环境创建：学生通过命令行快速申请带GP
【第11章】亿级电商平台订单系统-海量数据架构设计 cherry5230 架构系统架构架构分布式
1-1本章导学课程导学课程定位：大型系统架构设计核心难点解析核心项目：BToB电商平台订单系统（年交易额200亿级）本章知识体系1.核心概念辨析海量数据vs大数据本质区别解析常见认知误区说明2.方法论框架海量数据处理核心思想分布式计算原理数据分片策略弹性扩展机制3.数据库架构设计方法论体系读写分离模式分库分表策略数据分区方案缓存层设计4.数据处理体系海量数据处理之道批处理与流处理数据压缩技术异步处
数据操作与事务：确保数据一致性的关键 qcidyu 软件开发数据库规则
title:数据操作与事务：确保数据一致性的关键date:2025/2/11updated:2025/2/11author:cmdragonexcerpt:在现代数据管理中，事务处理是确保数据完整性和一致性的重要机制。本文将深入探讨事务的ACID特性、锁机制及其种类（行级锁与表级锁）以及事务隔离级别（READUNCOMMITTED、READCOMMITTED、REPEATABLEREAD、SERI
Starrocks 命令 Alter table DISTRIBUTED 重分布数据的实现鸿乃江边鸟大数据 StarRocks starrocks 大数据
背景在前文Starrocks写入报错primarykeymemoryusageexceedsthelimit中，可以通过ALTERTABLExxxxDISTRIBUTEDBYHASH(xx)BUCKETS50;来改变数据的分布状态,具体的执行过程是怎么样的呢？分析首先对应的g4文件中为alterTableStatement，这里最终的调用是AlterJobExecutor.visitAlterTa
Beekeeper Studio：高颜值且免费的SQL开发工具开源项目精选 sql 数据库
BeekeeperStudio是一款免费开源的SQL开发和数据库管理工具，具有美观高效、简单易用的特点。BeekeeperStudio基于Vue.js开发，遵循MIT开源协议，支持Windows、Linux以及macOS平台。Stars数17842Forks数1170主要特点安全连接：除了正常的连接，也可以使用SSL加密连接或通过SSH隧道连接；SQL自动补全：代码编辑器支持语法高亮和表名自动补全
个人AI助手的未来：Yi AI开源系统助力快速搭建耶耶Norsea 网络杂烩人工智能开源
摘要YiAI推出了一站式个人AI助手平台解决方案，助力用户快速搭建专属AI助手。该平台采用全套开源系统，涵盖前端应用、后台管理及小程序功能，并基于MIT协议开放使用。同时，平台集成了本地RAG方案，利用Milvus与Weaviate向量数据库支持本地部署，为用户提供高效、灵活的数据处理能力。关键词个人AI助手,快速搭建,开源系统,本地RAG,向量数据库一、YiAI开源系统概述1.1个人AI助手的发
CocoaPods创建本地私有库、远程私有库和公有库群野 iOS组件化 iOS代码管理 objective-c ios cocoapods
pod库创建过程创建工程更新本地索引库手动创建本地私有库创建自己的pod库部署您的库创建工程gitremoteaddorigin[https://code.adress.com.git]关联远程代码拷贝远程库gitclone[https://code.adress.com.git],进入拷贝工程的目录，gitcommit-am'init'本地提交gitlog查看本地提交记录，gitpush提交到远
常用的git和linux命令有哪些？海姐软件测试 git linux elasticsearch 大数据搜索引擎
一、Git常用命令1.仓库与基础操作命令作用常用参数/示例gitinit初始化新仓库gitinitgitclone克隆远程仓库gitclonehttps://github.com/user/repo.gitgitstatus查看仓库状态gitstatus-s（简洁模式）gitadd添加文件到暂存区gitadd.（添加所有文件）gitaddfile1.txtgitcommit提交代码gitcommi
快速上手系列丨如何管理 PieCloudDB Database 虚拟数仓云原生数据库教程管理
为增强社区用户的体验，PieCloudDBDatabase社区版已于8月完成了全面改版升级。同时，PieCloudDB社区还特别制作了《快速入门PieCloudDB社区版》系列课程，旨在帮助大家全面了解新版本，逐步探索PieCloudDB的强大功能。PieCloudDB社区版提供免费下载，可用于体验产品新特性、个人学习、PoC验证等场景，方便社区用户快速体验领先的数仓虚拟化技术。PieCloudD
初识HTML中的div块元素—零基础自学网页制作猿说前端 html web开发
块元素基础属性讲解元素是个有故事的元素，这个元素很早就出现在html超文本标记语言中，它设计之初就是为了解决网页页面布局的需求。但是遗憾的是它出生后一直怀才不遇。在我还上初中的时候，智能手机还没有出现，更没有平板电脑等移动设备。上网是通过摆在桌子上的计算机来完成的。那时，大街小巷上有好多网吧。那时，马云刚刚辞去工作准备创业。那时，发送邮件的操作都会出现在计算机课程中。那时，对页面还没有现在的跨平台
零基础怎么开始学网络安全（非常详细）零基础入门到精通，收藏这一篇就够了程序员羊羊 web安全安全网络 php 学习
一、学习建议1.了解基础概念：开始之前，了解网络安全的基本概念和术语是很重要的。你可以查找网络安全入门教程或在线课程，了解网络安全领域的基本概念，如黑客、漏洞、攻击类型等。2.网络基础知识：学习计算机网络基础知识，了解网络通信原理，不同网络协议（如TCP/IP）的工作方式，以及网络拓扑结构等。3.操作系统知识：了解常见的操作系统，特别是Windows和Linux。掌握基本的命令行操作和系统管理技能
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
Vue.js的watch监听阿珊和她的猫 vue.js 前端 javascript
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》文章目录引言`watch`选项的基本概念`watch`选项的基本语法`watch
Nginx限流与鉴权（Nginx Traffic Limiting and Authentication） Linux运维老纪奋力拼搏让企业网站更好 nginx 运维云计算 linux 运维开发数据库
Nginx限流与鉴权：2分钟搞定流量洪峰与安全防护在现代互联网架构中，Nginx已经成为了非常重要的组件，广泛应用于负载均衡、反向代理以及静态资源的服务。除了这些基本功能，Nginx还提供了丰富的配置选项来处理限流（RateLimiting）和鉴权（Authentication）。这两项技术对于确保服务的可用性和安全性至关重要，特别是在高并发和敏感数据访问场景中。本文将详细介绍如何在Nginx中配
undo log ，redo log 和binlog的区别？努力向前ing MySQL八股详究数据库 MySQL log
一.MySQL如何保证事务的一致性？两阶段锁：prepare阶段：1.写入redolog（prepare）2.通知server准备写入binlogcommit阶段：1.写入binlog2.提交redolog二.有了binlog为什么还要记录redolog？binlog和redolog虽然都是为了数据安全与恢复准备的，但是他们的侧重点和功能有所不同，binlog记录的是SQL语句，属于逻辑日志，可以
【高考志愿】数学大雨淅淅程序人生高考
目录一、数学专业概述1.1学科特点1.2课程设置1.3学习方法1.4数学专业的分类二、就业前景三、填报建议四、注意事项五、数学专业排名一、数学专业概述1.1学科特点数学专业作为一门基础学科，具有高度的抽象性、逻辑性和精确性。它要求学生具备良好的数学基础、逻辑思维能力和解决问题的能力。因此，选择数学专业的学生需要有较强的数学兴趣和扎实的数学基础。1.2课程设置数学专业的课程设置通常包括数学分析、高等
Java课程设计“单项选择题标准化考试系统设计” GG爆不会写代码 java sql mysql intellij-idea
大二时做的java课设，代码能力不是很行，给需要做课设的同学一个参考题目如下“单项选择题标准化考试系统设计”1、问题描述设计一个单项选择题标准化考试系统，该系统要求能自动组卷和评分。2、功能要求（1）用数据库保存试题。（每个试题包括题干、4个备选答案、标准答案）。（2）试题录入：可随时增加试题到试题库中。（3）试题抽取：每次从试题库中可以随机抽出N道题（N由键盘输入）。（4）答题：用户可实现输入自
使用LangSmith Chat Datasets微调模型 scaFHIO python 人工智能机器学习
在这篇文章中，我们将探讨如何通过LangSmithChatDatasets轻松微调模型。这一过程分为三个简单的步骤：创建聊天数据集。使用LangSmithDatasetChatLoader加载示例。微调你的模型。微调后，您可以在LangChain应用中使用微调过的模型。在深入探讨之前，我们需要安装一些前置条件。前置条件确保您已经安装了langchain>=0.0.311并准备好LangSmithA
《炫动漫》杂志社炫动漫杂志社炫动漫编辑部2024年第1期目录 QQ296078736 python
理论新知探究中职班主任德育能力提升策略(1)叶荣琳基于核心素养下以问题为驱动的高中数学教学评一体化的课堂教学探究(4)鹿园园农村初中英语作业设计与批阅方式的创新使用(7)侯成英新课改背景下初中物理教学方法创新策略探究(10)李传荣“双减”背景下构建初中数学高效课堂的策略(13)陈苏婷精神医学本科生参加心理剧团体课程的教学效果研究(16)查莉珺;王语含;陈虹;屈远;胡华提质增效：《机械识图》高职复习
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
C语言中的函数 NaZiMeKiY C/C++c语言 linux 开发语言
一.函数：1.函数的概念：函数就是程序中独立的功能2.函数的使用场景：我们需要反复书写的代码，但是又不确定什么时候会用到二.函数的定义和调用：①：函数的结构返回值类型函数名(形参1,形参2,...,形参n){函数体;return返回值;}②：举例：#includevoidstudy(){printf("准备开始学习\n");printf("打开b站\n");printf("打开自己想要学习的课程\
SelectDB 实时分析性能突出，宝舵成本锐减与性能显著提升的双赢之旅 SelectDB技术团队大数据物联网 doris selectdb 人工智能电商场景数据分析
BOCDOP宝舵早期基于TiDB构建实时数仓，随着数据量增长，在数据处理效率、OLAP能力扩展、功能支持、成本与资源方面存在一定优化空间。为提升数据分析能力并优化成本，宝舵引入SelectDB，达成写入速度提升10倍，成本直降30%的显著成效。本文转录自高瑞军（宝尊科技高级架构师）在DorisSummitAsia2024上的演讲，经编辑整理。业务背景宝尊集团创立于2007年，是中国品牌电商服务行业
【数据库】MySQL事务详解此木|西贝数据库数据库 mysql
事务的隔离级别读未提交（read-uncommitted）：最低级的隔离级别，允许其他事务读到未提交的值；读已提交（read-committed）：事务只能读取到其他事务提交的数据；可重复读（repeatable-read）：对同一条数据多次读取结果都是一样（mysql默认隔离级别）；串行化（serializable）：最高的隔离级别，所有事务穿行执行，事务间不会产生干扰隔离级别存在的问题读未提交
分布式事务3PC解决了2PC哪些问题？ java干货仓库八股文汇总分布式事务分布式 java 面试
三阶段提交（3PC，Three-PhaseCommit）是对二阶段提交（2PC，Two-PhaseCommit）的改进，旨在解决2PC的一些固有缺陷，特别是在分布式系统中的容错性和性能问题。以下是3PC比2PC更好的原因及其优势的详细分析：1.二阶段提交（2PC）的问题2PC是一种经典的分布式事务协议，分为两个阶段：准备阶段（PreparePhase）：协调者向所有参与者发送准备请求。参与者执行事
【含文档+PPT+源码】基于微信小程序农家乐美食餐厅预约推广系统编程毕设微信小程序美食小程序
项目介绍本课程演示的是一款基于微信小程序农家乐美食餐厅预约推广系统，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用该系统功能架构图如下：技术栈说明技术栈：后端：SpringBoot+Vue+ElementUI（后端是前后端分离的）前端：Un
【含文档+PPT+源码】基于SpringBoot+vue的疫苗接种系统的设计与实现小咕聊编程 spring boot 后端 java
项目介绍本课程演示的是一款基于SpringBoot+vue的疫苗接种系统的设计与实现，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用疫苗接种系统包括管理员登录、用户管理、疫苗信息管理、疫苗接种管理、接种管理、疫苗百科知识管理、消息通知管理、
【Go基础】Go入门与实践资源帖小超人冲鸭 golang 开发语言后端
看到好的持续更新……Go系统教程从语法讲起：李文周博客七天快速上手项目Go测试驱动开发博客孔令飞项目开发实战课程，孔令飞图文教程《Go语言高级编程》书籍Go算法刷题模板Go实战项目KV系统crawlab分布式爬虫平台seaweedfs分布式文件系统Cloudreve云盘系统gfast后台管理系统（基于GoFrame）alist多存储文件列表（基于Gin、React）Yearning开源SQL审核平
Git 的基本概念和使用方式成风693 git
Git是一种分布式版本控制系统，广泛用于协作开发和追踪代码变更历史。以下是Git的基本概念和使用方式：仓库（Repository）：Git仓库是存储代码和版本历史的地方。它可以是本地仓库（LocalRepository）或远程仓库（RemoteRepository）。提交（Commit）：提交是将代码变更保存到版本历史中的操作。每次提交都会生成一个唯一的标识符（SHA-1哈希值）。分支（Branc
flutter TextField 限制输入长度冬无雪 flutter android studio
限制TextField的输入长度需要inputFormatters的属性及属性值：LengthLimitingTextInputFormatter(6)如下：TextField(inputFormatters:[WhitelistingTextInputFormatter.digitsOnly,//只允许输入数字LengthLimitingTextInputFormatter(6)],)其他的属性
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源