吧嗒嘣

技术分享|GBase 8a在某客户的部署方案

软硬件需求估算

配置计算原则

按照客户方估算：初始入库10TB左右，月增长1TB左右，数据保存年限15年，基于以上计算考虑到系统冗余，集群整体数据承载能力需求大于200TB。建议部署3节点集群。由我方提供人员进行安装、部署和调试。我方将配合系统应用开发验收，应用系统投产试运行三个月后，启动产品验收。

对于MPP数据库集群，充分考虑OLAP分析型处理场景的特征，作为配置策略，配置主体依存于所处理的数据总量，而非OLTP在线交易类场景的TPMC等指标。依托数据库厂商积累的实际案例经验，在项目实施中合理规划硬件资源与处理数据量之间比例关系，确保最佳得发挥所购设备的各项技术性能。

硬件配置估算的过程立足海量数据分析、数据仓库类应用场景，同时严格平衡资源需求与性能指标之间的关系，此外还参考了GBase 8a MPP Cluster在金融、电信等行业其它类似案例中的实际工程经验。

一般类大数据平台MPP数据库建设中，CPU、内存与磁盘空间如下比例：即1core:8GB:1TB；

建议MPP数据库网络结构

集群需3台Linux服务器上部署MPP数据库软件。3个节点作为管理节点与数据节点部署在一起。集群GBase 8a MPP Cluster 管理节点、运算节点网络连接方式

说明：GBase 8a MPP Cluster数据库集群中每台服务器的配置2个万兆光口，双网卡绑定，分别连接到2台万兆交换机上，形成高可用，用于GBase 8a MPP Cluster数据库节点之间高速数据交换；配置2个万兆网卡，双网卡绑定，分别连接到2台万兆交换机上，形成高可用，用于GBase 8a MPP Cluster数据库集群与其外部节点如应用服务器、监控服务器等数据交换。

软件配置清单

产品名称	版本	备注
GBase 8a MPP Cluster	V95	南大通用大规模分布式并行数据库集群系统

备份

建议采用的存1备的方式。每个节点的数据都是3分之1乘以2。

数据高可用的保障机制包括主副本机制、gcrecover机制、failover机制等，它们共同确保GBase 8a MPP的数据高可用。

主副本机制：存储层提供的高可用保障，是数据高可用的基础。

gcrecover机制：执行层提供的数据高可用保障，是一种事务补偿机制，保障数据的最终一致性；与基于事务日志的强一致系统不同，8a MPP采取的是最终一致性（2PC+事务补偿），以获得更好的执行效率。

failover机制：一致性服务层（corosync）提供的数据高可用保障，属于集群层的末端保护，确保集群写操作在极端异常情况下的数据一致性；failover是一种数据高可用的保障机制，用来保障集群异常（发起节点gclusterd crash、发起节点掉电、集群整体crash等）情况下的数据一致性。

数据节点服务器配置估算

对于基于GBase 8a MPP Cluster分布式数据库集群系统，其物理磁盘容量的计算方法为：

最小磁盘空间需求MDSR (Minimum Disk Space Requirements) = 原始数据×数据库及相关工作空间因子×副本选项因子×操作系统因子×RAID因子×数据库压缩因子。

最小磁盘空间需求MDSR除以每台服务器的存储空间，就能得到数据节点服务器的数量。

膨胀因子	因子值	说明
数据库及相关工作空间因子	1.5	对于海量数据的复杂关联和复杂聚合运算，中间过程涉及大量表间关联操作，生成众多中间表；上述过程均占用较大的临时工作空间，一般预留30%~40%临时空间
副本选项因子	2	权衡性能、空间代价和高可用性等因素，配置1份副本
操作系统和文件系统因子	1	一般情况下，规划2块独立的400GSSD盘用于安装操作系统以及其他软件，操作系统盘不占据数据盘存储空间，所以此项因子为1
RAID因子	12/10	一般采用RAID5，同时还需要考虑热备盘。12块盘3.84TB的SSD盘，设置1块热备盘，11块盘做成 1组RAID5；
数据库压缩因子	1	本项目按压缩后实际落盘存储空间计算，不考虑原始数据的压缩比。故数据库压缩因子为1

协调节点服务器配置说明

协调节点部署分布式任务协调调度层组件GCluster，负责SQL的解析、SQL的优化、分布式执行计划生成、执行调度，管理元数据。

协调节点生成执行计划后下发给各计算节点进行计算，为保证协调节点之间元数据信息同步的高效性，以及协调节点与数据节点之间任务分发的高效性，协调节点之间、协调节点与计算节点之间必须使用万兆网络进行连接。

协调节点服务器的数量配置为单数。

服务器节点部署方案

部署架构

正式生产环境中管理节点负载分担的方式工作。计算节点通过数据副本实现高可用。

服务器节点设置

硬盘设置

操作系统盘与集群数据盘分开独立划分RAID，防止操作系统损坏对数据的影响，系统盘采用RAID1，数据盘采用RAID50，具体划分策略如下表：

用途	磁盘划分	目录	文件系统格式	大小	目录含义	备注
操作系统盘	两块盘RAID1	/	XFS	约600GB（以盘的实际大小为准）	操作系统根目录	默认
		/boot	XFS	500M	操作系统引导目录
		/swap	XFS	128GB	操作系统swap
数据盘	剩余盘RAID50（1块全局热备）	/opt	XFS		数据库主目录	RAID卡设置建议： Strip Size：条带尺寸为1M； Access Policy：设置为RW； Read Policy：设置为Ahead； Write Policy：设置为Write Back with BBU； IO Policy：设置为Cached IO模式；

操作系统设置

为发挥GBase 8a集群的最佳性能，部署时需对操作系统的部分参数做一些调整修改，详细设置如下表：

参数项	设置值	含义
vm.vfs_cache_pressure	1024	表示内核回收用于directory和inode cache内存的倾向，默认值为100，增加该值超过100，将导致内核倾向于回收directory和inode cache；集群服务器设置此操作系统参数为1024，使操作系统倾向于回收directory和inode cache，避免定时执行sync&&sync&&echo 3>/proc/sys/vm/drop_caches操作
vm.min_free_kbytes	8388608	表示强制Linux 操作系统为VM文件系统最低保留多少空闲内存（Kbytes），此参数设置为8G大小可以避免因gbase库进程占用大量内存导致异常
kernel.core_uses_pid	1	控制核心转储是否附加PID的核心文。用于调试多线程应序件。
net.ipv4.tcp_syncookies	1	控制 TCPsyncookies的使用。
net.ipv4.ip_local_reserved_portss	5050,5258,5288,6666	防止数据库需要使用的端口被其他程序强行占用
vm.zone_reclaim_mode	0	配置vm.zone_reclaim_mode = 0使得内存不足时去remote memory分配优先于swap out local page
vm.swappiness	1	swappiness参数为swap内存使用倾向，60代表内存剩余60%时会使用swap，设置为1表示强制使用物理内存。
net.core.netdev_max_backlog	262144	每个网络接口收数据包的速率比内核处理这些包的速率快时，允许送到队列的数据包最大目。
vm.overcommit_memory	0	检查是否有足够的内存可用，如果是，允许分配；如内存不够拒绝该请求，并返回一个错误给应用程序。
net.core.rmem_default	8388608	接收套字缓冲区大小的默认值(以字节为单位 )
net.core.rmem_max	16777216	接收套字缓冲区大小的最大值(以字节为单位 )
net.core.somaxconn	65536	用来限制监听(LISTEN)队列最大数据包的数量，超过这个就会导致链接超时或者触发重传机制。
net.core.wmem_default	8388608	发送套字缓冲区大小的默认值(以字节为单位 )
net.core.wmem_max	16777216	发送套字缓冲区大小的最大值(以字节为单位 )
net.ipv4.tcp_fin_timeout	1	如果套接字由本端要求关闭，这个参数决定了它保持在FIN-WAITT-2状态的时间。对端可以出错并永远不关闭连接，甚至意外当机。缺省值是60秒。
net.net.ipv4.tcp_max_orphans	3276800	系统中最多有少个TCP套接字不被关联到任何一个用户文件句柄上。如果超过这个数字，孤儿连接将即刻被复位并打印出警告信息。这个限制仅仅是为了防止简单的仅是为了防止简单的DoS攻击，不能过分依靠它或者人为地减小这个值，更应该增加这个值(如果增加了内存之后 )。
net.ipv4.tcp_max_syn_backlog	262144	表示那些尚未收到客户端确认信息的连接（ SYN 消息）队列的长度，默认为 1024，加大队列长度为，加大队列长度为262144，可以容纳更多等待连接的网络连接数。
net.ipv4.tcp_max_tw_buckets	20000	系统在同时所处理的最大timewait sockets数目。如果超过此的话time-wait socket会被立即删除并且显示警告信息。之所以要设定这个且显示警告信息。之所以要设定这个限制，纯粹为了抵御那些简单的Dos攻击，千万不要人为的降低这个限制攻击，不过如果网络条件需要比默认值更多，则可以提高它 (或许还要增加内存)。
net.ipv4.tcp_mem	94500000 915000000 927000000	第一个值是内存使用的下限。第二个值是内存压力模式开始对缓冲区使用的上限。第三个值是内存应用压力的上限。第三个值是内存上限。在这个层次上可以将报文丢弃，从而减少对内存的使用。
net.ipv4.tcp_rmem	4096 87380 4194304	TCP 接收缓冲区，3个字段分别是 min，default，max。MIN：为TCP socket预留用于接收缓冲的内存数量，即使在内存出现紧张情况下TCP socket都至少会有这么多数量的内存用于接收。
net.ipv4.tcp_timestamps	0	时间戳可以避免序列号的卷绕。一个 1Gbps 1Gbps的链路肯定会遇到以前用过的序列号。时间戳能够让内核接受这种 “异常”的数据包。
net.ipv4.tcp_tw_recycle	1	开启 TCP 连接中 TIME-WAIT sockets的快速回收，默认为0，表示关闭。
net.ipv4.tcp_wmem	4096 87380 4194304	TCP发送缓冲区，3个字段分别是 min， default，max。Min：为 TCP socket预留用于发送缓冲的内存最小值。每个 TCP socket都可以使用它。
net.ipv4.tcp_tw_reuse	1	表示是否允许重新应用处于 TIME-WAIT 状态的socket用于新的TCP连接。
net.ipv4.tcp_sack	1	表示是否启用有选择的应答（Selective Acknowledgment），这可以通过有选择地应答乱序接收到的报文来提高性能（这样可以让发送者只发送丢失的报文段）；（对于广域网通信来说）这个选项应该启用，但是会增加对 CPU的占用。
net.ipv4.tcp_window_scaling	1	支持更大的TCP窗口。如果TCP窗口最大超过 65535(64KB), 必须设置该数值为1。
ulimit虚拟内存配置	/etc/security/limits.conf，添加如下两行，操作系统重启后生效： * soft as unlimited * hard as unlimited	虚拟内存不足会造成的运算缓慢
ulimit内存配置	/etc/security/limits.conf，添加如下内容操作系统重启后生效： * rss as unlimited	内存不足时杀掉进程
ulimit打开文件数配置	/etc/security/limits.conf，添加如下内容操作系统重启后生效： * soft nofile 655360 * hard nofile 655360	文件句柄数不足集群使用报错
透明页 transparent_hugepage	never	为保证数据库高效运行，需要关闭 transparent_hugepage 参数
服务器操作系统IO调度器	deadline	GBase集群服务器需要将IO调度器（IO elevator）配置为deadline以提升小文件读写IO效率
selinux	disabled	要求各节点禁用 SELINUX

网络设置

集群节点配置千兆和万兆网络IP地址（千兆连接办公网，万兆用于集群内部数据交换）

万兆、千兆网络均需采用双网卡绑定，绑定模式为主备模式（mode=1），网卡绑定必须设置成开机自动生效。

后续扩展方案

硬件扩展方案

对于分布式MPP数据库系统，建议采用水平横向扩展方式进行系统扩展，即增加集群节点数量实现集群规模的扩展。GBase 8a MPP Cluster分布式数据库的性能随集群节点数量增加而呈准线性提升，具体包括存储容量的扩增，计算能力提升和并发响应能力的增长。

系统扩容的控制行为完全由GBase 8a MPP Cluster集群内部自动完成，即扩容过程中数据的重分布和集群结构的元数据更新全部由内部自动完成。通过元数据信息更新保证映射关系的无损失移植，保证扩容后集群结构对上层应用透明，使原有应用可以平滑移植，即应用无需修改。扩容之后，考虑MPP + Shared nothing 的分布式数据库特征，系统能力(包括存储能力和处理能力)会根据节点数增加而近线形提升。对于功能扩展的情形，一方面要扩展集群的节点数规模，而另一方面则应考虑通过产品的资源管理组功能实现集群资源的多租户能力，以防止随着系统功能扩展而发生应用之间资源相互争夺以及相互影响的情况。

作为GBase 8a MPP Cluster分布式数据库的内部数据重分布实现，充分利用了虚拟哈希桶提供的2层映射关系，从而大大加强了系统的扩展灵活性。其具体的扩容实现过程如下：

GBase 8a MPP Cluster分布式数据库的扩容的步骤/原理简述如下：

1）新增节点元数据的生成；

2）根据扩容节点计算新的hash 桶分布(从每个老的集群节点上移动一定数量的hash 桶到新的集群节点)；

3）按照新的hash 桶分布采用select into server 的方式将老节点上的符合新的hash 桶分布要求的数据搬移到新节点；(select into server：将符合条件的数据insert 到一个节点分片上，即在老节点上执行select，在新节点上执行insert)；

4） delete 老节点上的重新分布已经完成的数据；

5）重新生成hash 映射表nodedatamap（nodedatamap 表记录了哪些hash 桶分布在哪个节点上）；

GBase 8a MPP Cluster分布式数据库扩容过程中不支持人为的暂停和续作。但在扩容期间，如果因为网络等异常原因导致扩容失败而中断时，在故障排除后使用完全相同的扩容命令（包括参数）重新扩容时，扩容程序会自动从上次失败时中断的地方开始，继续进行后续的扩容步骤。这就实现GBase 8a MPP Cluster分布式数据库扩容过程中所需要的断点续传功能。

GBase 8a MPP Cluster分布式数据库支持动态扩展，支持灵活的系统扩展方式，包括容量扩展、主机服务器扩展、应用功能扩展等，下面分别对这些系统扩展方式进行描述，并且说明该扩展对现有系统的影响。

1）容量扩展

单集群节点扩容：集群节点增配硬盘，扩展单节点存储容量。

增加节点：通过增加集群节点，扩展集群存储容量。

对现有系统的影响：提升系统的数据存储容量，无负面影响。

2）主机计算能力扩展

单节点增配：扩展节点的内存、CPU等，提升集群节点的计算能力。

增加节点：通过增加集群节点，扩展集群的计算能力，并发能力。

对现有系统的影响：提升系统的性能，包括计算能力、并发能力等，无负面影响。

3）应用功能扩展

应用系统功能扩展对GBase 8a MPP Cluster分布式数据库无影响。

对现有系统的影响：增强系统功能，无负面影响。

软件扩展方案

作为软件扩展方案，在GBase 8a MPP Cluster分布式数据库增加新功能时，可通过平滑升级每个节点上的数据库及集群软件、打补丁等，增强GBase 8a MPP Cluster分布式数据库的功能，提升其性能。

作为实际实施时，往往在增加GBase 8a MPP Cluster分布式数据库集群节点时，同时可以考虑实施快速的系统软件的升级部署，包括操作系统、GBase 8a MPP Cluster分布式数据库等，并需要同时进行数据重新分布，以通过软件扩展方式全面提升系统能力。

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
Spring Boot基础小李是个程序 spring boot 后端 java
5.SpringBoot配置解析5.1.基础服务端口：server.port=8080（应用启动后监听8080端口）应用名称：spring.application.name=Chat64（注册到服务发现等场景时的标识）5.2.数据库连接（MySQL）URL：jdbc:mysql://localhost:3306/ai-chat（连接本地3306端口的ai-chat数据库，含时区、编码等参数）驱动：
Docker初识：mysql8主从复制（单向）- 主从搭建扩展知识滴水可藏海 #mysql 数据库
主从服务（master-slave）新学习到的知识。1、全库同步与部分同步上回书说到Docker初识：mysql8主从复制（单向）的配置都是针对全库配置的。但是实际上并不需要针对全库做备份，只需要对一些特别重要的库或者表来进行同步。例如information_schema等。可以通过配置文件中的一些属性指定需要针对哪些库或者哪些表记录binlog。Master配置：#需要同步的二进制数据库名bin
在拉卡拉分账功能中实现实时更新，需结合异步回调通知和数据库事务来确保数据一致性。以下是具体实现方案肥仔全栈开发拉卡拉支付 php 拉卡拉支付三方支付
一、实时更新的核心逻辑依赖拉卡拉分账回调拉卡拉分账完成后会主动推送回调通知（类似支付回调），需监听该回调并更新订单分账状态。数据库事务保障分账金额更新、状态变更等操作需放在事务中，避免部分失败导致数据不一致。二、代码实现1.分账回调处理接口（监听拉卡拉分账结果推送，实时更新数据库）//文件：application/api/controller/Notify.phppublicfunctionlak
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Android开发中RxJava的使用与原理你过来啊你 android rxjava
RxJava是ReactiveExtensions在JVM上的实现，专为处理异步事件流和基于观察者模式的编程而设计。在Android开发中，它极大地简化了异步操作（如网络请求、数据库访问、UI事件处理）的管理、组合和线程调度，有效解决了回调地狱问题。一、RxJava核心概念Observable(可观察者)：数据源或事件源。它负责发出数据项(onNext)或事件（成功完成onComplete/发生错
MySQL数据库访问（C/C++）敲上瘾 MySQL数据库 mysql 数据库 c++c语言数据库开发数据库架构
访问数据库的方式：命令行：使用命令行输入SQL指令直接访问。需记忆命令和SQL语法，对新手不友好。正因如此推荐新手使用该方式访问，能倒逼学习者对SQL语法的记忆，并对MySQL更深入理解。图形化界面访问：使用图形化界面工具，如：DBeaver、DataGrip、Navicat、HeidiSQL（MySQL）、MySQLWorkbench。特点：有语法提示，可以直接对数据手动增删改。编程接口：在编写
MySQL多表关系详解六七_Shmily 数据库 mysql android 数据库
MySQL中的多表关系是关系型数据库设计的核心，它描述了不同表之间数据如何相互关联。合理设计表关系是构建高效、无冗余、易于维护的数据库模式的关键。MySQL主要支持三种基本的多表关系：1.一对一关系(One-to-OneRelationship)概念：表A中的一条记录最多只与表B中的一条记录相关联，反之亦然。实现方式：共享主键：表B的主键同时也是指向表A主键的外键。这是最严格的实现，确保绝对的一对
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

技术分享|GBase 8a在某客户的部署方案

服务器节点部署方案

后续扩展方案

你可能感兴趣的:(数据库,数据库,数据仓库,数据挖掘,数据分析)