心细决定成败

Sphinx+MySQL5.1x+SphinxSE+mmseg…

什么是Sphinx

Sphinx 是一个在GPLv2 下发布的一个全文检索引擎，一般而言，Sphinx是一个独立的搜索引擎，意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持，也支持从标准输入读取特定格式的XML数据。通过修改源代码，用户可以自行增加新的数据源（例如：其他类型的DBMS的原生支持）。

Sphinx的特性

 高速的建立索引(在当代CPU上，峰值性能可达到10 MB/秒);

 高性能的搜索(在2 – 4GB 的文本数据上，平均每次检索响应时间小于0.1秒);

 可处理海量数据(目前已知可以处理超过100 GB的文本数据, 在单一CPU的系统上可处理100 M 文档);

 提供了优秀的相关度算法，基于短语相似度和统计（BM25）的复合Ranking方法; 支持分布式搜索;

 provides document exceprts generation;

 可作为MySQL的存储引擎提供搜索服务;

 支持布尔、短语、词语相似度等多种检索模式;

 文档支持多个全文检索字段(最大不超过32个);

 文档支持多个额外的属性信息(例如：分组信息，时间戳等);

 停止词查询;

 支持单一字节编码和UTF-8编码;

 原生的MySQL支持(同时支持MyISAM 和InnoDB );

原生的PostgreSQL 支持.

更多特性参考手册。

原生MySQL存储引擎检索流程：

基于Sphinx存储引擎检索：

开始

本文以CentOS5.5+mysql-5.1.55+sphinx-0.9.9（coreseek-3.2.14.tar.gz目前最新稳定版）为例介绍

安装前准备文件

Sphinx+MySQL5.1x+SphinxSE存储引擎+mmseg中文分词搜索引擎架构搭建过程。

通过yum命令更新依赖包(与php环境搭建依赖包一起更新了)

yum -y install gcc g++ gcc-c++ libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-devel glib2 glib2-devel bzip2 bzip2-devel ncurses ncurses-devel curl curl-devel e2fsprogs e2fsprogs-devel krb5 krb5-devel libidn libidn-devel openssl openssl-devel openldap openldap-devel nss_ldap openldap-clients openldap-servers patch libtool automake imake mysql-devel expat-devel

安装MySQL+SphinxSE，进入软件包目录

tar zxvf mysql-5.1.55.tar.gz

tar zxvf sphinx-0.9.9.tar.gz

cp -r sphinx-0.9.9/mysqlse/ mysql-5.1.55/storage/sphinx

cd mysql-5.1.55

./BUILD/autorun.sh

./configure --prefix=/usr/local/webserver/mysql/ --enable-assembler --with-extra-charsets=complex --enable-thread-safe-client --with-big-tables --with-readline --with-ssl --with-embedded-server --enable-local-infile --with-plugins=partition,innobase,myisammrg,sphinx

make

make install

。。。省略若干配置步骤，和平时配置MySQL没什么两样。

安装完成启动MySQL后查看sphinx存储引擎是否安装成功

在mysql命令行下执行

show engines;

如果出现如下图红色方框内的信息说明SphinxSE已经安装成功！

安装Sphinx全文检索服务器

Sphinx默认不支持中文索引及检索，以前用Coreseek的补丁来解决，目前Coreseek 不单独提供补丁文件，而基于sphinx开发了Coreseek 全文检索服务器，Coreseek应该是现在用的最多的sphinx中文全文检索，它提供了为Sphinx设计的中文分词包LibMMSeg包含mmseg中文分词，其实coreseek-3.2.14.tar.gz中已经包含了sphinx，前面安装SphinxSE时也可以使用这个压缩包里的mysqlse。

我们来看一下的安装过程：

安装autoconf

tar zxvf autoconf-2.64.tar.gz

cd autoconf-2.64

./configure --prefix=/usr

make

make install

cd ..

安装Coreseek

tar zxvf coreseek-3.2.14.tar.gz

cd coreseek-3.2.14

cd mmseg-3.2.14/

./bootstrap

./configure --prefix=/usr/local/mmseg3

make

make install

cd ../csft-3.2.14/

sh buildconf.sh

./configure --prefix=/usr/local/coreseek --without-python --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql --host=arm

make

make install

cd /usr/local/coreseek/etc

进入配置目录通过命令ls可以看到3个文件

example.sql sphinx.conf.dist sphinx-min.conf.dist

其中example.sql是示例sql脚本我们将其导入到数据库中的test数据库中作为测试数据(会创建两张表 documents和tags)

vi sphinx.conf

输入以下内容

source src1

{

type = mysql

sql_host = localhost

sql_user = root

sql_pass =12345678

sql_db = test

sql_port = 3306 # optional, default is 3306

sql_sock = /tmp/mysql.sock

sql_query_pre = SET NAMES utf8

sql_query = \

SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content \

FROM documents

sql_attr_uint = group_id

sql_attr_timestamp = date_added

sql_query_info = SELECT * FROM documents WHERE id=$id

}

index test1

{

source = src1

path = /usr/local/coreseek/var/data/test1

docinfo = extern

charset_type = zh_cn.utf-8

mlock = 0

morphology = none

min_word_len = 1

html_strip = 0

charset_dictpath = /usr/local/mmseg3/etc/

ngram_len = 0

}

indexer

{

mem_limit = 32M

}

searchd

{

port = 9312

log = /usr/local/coreseek/var/log/searchd.log

query_log = /usr/local/coreseek/var/log/query.log

read_timeout = 5

max_children = 30

pid_file = /usr/local/coreseek/var/log/searchd.pid

max_matches = 1000

seamless_rotate = 1

preopen_indexes = 0

unlink_old = 1

}

说明:

代码段source src1{***} 代表数据源里面主要包含了数据库的配置信息，src1表示数据源名字,可以随便写。

代码段index test1{***} 代表为哪个数据源创建索引,与source *** 是成对出现的，其中的source参数的值必须是某一个数据源的名字。

其他参数可以查看手册，这里不再赘述。

生成索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all

其中参数--all表示生成所有索引

当然也可以是索引的名字例如：/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf test1

执行后可以在/usr/local/coreseek/var/data目录中看到多出一些文件,是以索引名为文件名的不同的扩展名的文件

在不启动sphinx的情况下即可测试命令:

/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf number

可以看到将内容中含有number数据的数据查询出来。

过滤查询

/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf number --filter group_id 2

限定group_id 为2 返回一条记录

同样也可以测试中文（需将命令行终端编码调整为utf-8）

/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf 研究生创业

可以看到我们输入的查询文字已经被拆分成了两个词，只是因为我们的测试数据中没有中文数据查询结果为空。我们插入几条新数据。

INSERT INTO `test`.`documents` (

`id` ,

`group_id` ,

`group_id2` ,

`date_added` ,

`title` ,

`content`

)

VALUES (

NULL , '2', '3', '2011-02-01 00:37:12', '研究生的故事', '研究生自主创业'

), (

NULL , '1', '1', '2011-01-28 00:38:22', '研究', '为了创业而研究生命科学'

);

我们再来看以下数据库中的主要数据

插入新数据后需要重新生成索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf test1

然后执行查询测试 /usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf 研究生创业

我们搜索的词语是“研究生创业”，可以看到词语被拆分成了研究生和创业两个词,虽然有两条记录都包含“创业和”研究生”这几个字但是“研究生命科学”中的“研究生”三个字虽然是紧挨着的但是不是一个词语，结果是只匹配一条“研究生自主创业”，我们在搜索“研究”这个词语

/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf 研究

同样匹配一条记录，而“研究生的故事”和“研究生自主创业”的词语却没有被查询出来，可以看出sphinx与分词技术结合可以匹配出相关度更高的结果。

当然我们的目的不仅限与命令行下的测试，我们可以通过搜索API调用来执行搜索，搜索API支持PHP、Python、Perl、Rudy和Java。如果从PHP脚本检索需要先启动守护进程searchd，PHP脚本需要连接到searchd上进行检索：

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf

在解压后的sphinx-0.9.9/api目录下的sphinxapi.php就是sphinx官方为我们提供的API文件（其实也可以使用PHP的sphinx扩展），只需将其包含进自己的PHP脚本文件就可以了。

示例代码：

include('sphinxapi.php');

$cl = new SphinxClient();

//设置sphinx服务器地址与端口,如果是本机则可以为localhost

$cl->SetServer( "192.168.16.6", 9312 );

//以下设置用于返回数组形式的结果

$cl->SetArrayResult ( true );

//$cl->SetMatchMode( SPH_MATCH_ANY );//匹配模式

//$cl->SetFilter( 'group_id', array( 2 ) );

$result = $cl->Query( '研究生创业', 'test1' ); //参数关键字索引名

if ( $result === false ) {

echo "Query failed: " . $cl->GetLastError() . ".\n";

}

else {

if ( $cl->GetLastWarning() ) {

echo "WARNING: " . $cl->GetLastWarning() . "";

}

echo '

'; 
                print_r( $result ); 
        } 
       ?> 
     执行后的结果： 
     Array 
     ( 
         [error] =>  
         [warning] =>  
         [status] => 0 
         [fields] => Array 
             ( 
                 [0] => title 
                 [1] => content 
             ) 
       
         [attrs] => Array 
             ( 
                 [group_id] => 1 
                 [date_added] => 2 
             ) 
       
         [matches] => Array 
             ( 
                 [5] => Array 
                     ( 
                         [weight] => 2 
                         [attrs] => Array 
                             ( 
                                 [group_id] => 2 
                                 [date_added] => 1296491832 
                             ) 
       
                     ) 
       
             ) 
       
         [total] => 1 
         [total_found] => 1 
         [time] => 0.078 
         [words] => Array 
             ( 
                 [研究生] => Array 
                     ( 
                         [docs] => 1 
                         [hits] => 2 
                     ) 
       
                 [创业] => Array 
                     ( 
                         [docs] => 2 
                         [hits] => 2 
                     ) 
       
             ) 
       
     ) 
       
     在matches中的就是查询结果，我们注意到sphinx是将记录中的主键ID值返回而不是返回所有数据，上面的例子中的键名5就是记录的ID（如果在查询前执行$cl->SetArrayResult ( true );则数组结构会有些许差异）。至此搜索服务器已经为我们完成了大部分工作，接下来我们通过主键ID值来查询我们想要的数据就可以了。 
      Sphinx存储引擎的使用 
     SphinxSE是一个可以编译进MySQL 5.x版本的MySQL存储引擎，它利用了该版本MySQL的插件式体系结构。尽管被称作“存储引擎”，SphinxSE自身其实并不存储任何数据。它其实是一个允许MySQL服务器与searchd交互并获取搜索结果的嵌入式客户端。所有的索引和搜索都发生在MySQL之外。 
     SphinxSE的适用于： 
      使将MySQL FTS 应用程序移植到Sphinx 
      使没有Sphinx API的那些语言也可以使用Sphinx 
      当需要在MySQL端对Sphinx结果集做额外处理（例如对原始文档表做JOIN，MySQL端的额外过滤等等）时提供优化。 
     要通过SphinxSE搜索，需要建立特殊的ENGINE=SPHINX的“搜索表”，然后使用SELECT语句从中检索，把全文查询放在WHERE子句中。 
     创建一张表t1 
     CREATE TABLE t1 
     ( 
         id          INTEGER UNSIGNED NOT NULL, 
         weight      INTEGER NOT NULL, 
         query       VARCHAR(3072) NOT NULL, 
         group_id    INTEGER, 
         INDEX(query) 
     ) ENGINE=SPHINX CONNECTION="sphinx://localhost:9312/test1"; 
      
     搜索表前三列的类型必须是INTEGER，INTEGER和VARCHAR，这三列分别对应文档ID，匹配权值和搜索查询。查询列必须被索引，其他列必须无索引。列的名字会被忽略，所以可以任意命名，参数CONNECTION来指定用这个表搜索时的默认搜索主机、端口号和索引，语法格式：CONNECTION="sphinx://HOST:PORT/INDEXNAME"。 
     执行SQL语句 select d.id,d.title,d.content from t1 join documents as d on t1.id = d.id and t1.query = '研究生创业'; 
     +----+--------------------+-----------------------+ 
     | id | title              | content               | 
     +----+--------------------+-----------------------+ 
     |  5 | 研究生的故事 | 研究生自主创业 | 
     +----+--------------------+-----------------------+ 
     1 row in set (0.04 sec) 
     结果返回了我们想要的数据，可见利用SphinxSE可以仅仅在SQL语句上做很小的改动即可很方便的实现全文检索！

flutter开发之状态管理、路由管理、马拉萨的春天 flutter开发一天一读 flutter 前端 javascript
2.3状态管理#2.3.1简介响应式的编程框架中都会有一个永恒的主题——“状态(State)管理”，无论是在React/Vue（两者都是支持响应式编程的Web开发框架）还是Flutter中，他们讨论的问题和解决的思想都是一致的。所以，如果你对React/Vue的状态管理有了解，可以跳过本节。言归正传，我们想一个问题，StatefulWidget的状态应该被谁管理？Widget本身？父Widget？
通信算法之205 ： MSK调制解调
转载：MSK（MinimumShiftKeying）：MSK调制出现在上世纪六七十年代，因其频率间隔小、恒包络、相位连续、主瓣窄等特性，它在GSM等系统中得到了应用。随着功放技术的发展及抗衰落方法的不断出现，输出的恒包络特性已不再是选择调制方式的主要依据。MSK调制1bit/s/Hz的频带利用率上限也无法适应带宽紧缺的通信场景，在3G及以后的移动通信中它被高阶的PSK和QAM等取代。但在一些特定的
【分布式 ID】生成唯一 ID 的几种方式也无风雨晴工具分布式分布式 ID
文章目录1.什么是唯一ID2.UUID2.1优点2.2缺点3.数据库自增ID3.1优点3.2缺点4.利用redis来实现自增id4.1优点4.2缺点5.雪花算法5.1优点5.2缺点6.数据库号段6.1优点6.2缺点7.小结1.什么是唯一ID分布式ID是指在分布式系统中需要生成的全局唯一的标识符。比如在电商、物流等行业，每笔订单都需要一个唯一的订单ID。通过这个ID，商家可以跟踪订单的状态，包括下单
未来运维，绝绝AI 必备 AI_运维_攻城狮 ai 运维人工智能
在当今数字化时代，运维工作对于企业的稳定运行至关重要。随着科技的不断进步，人工智能（AI）和自动化技术正逐渐改变着运维行业的面貌。本文将分析运维行业的未来发展方向，探讨人工智能在运维中的应用前景、自动化运维的发展趋势，并对未来的运维工作模式和技能需求进行预测和分析，以帮助读者更好地规划自己的职业发展。一、运维行业现状目前，运维工作主要包括服务器管理、网络管理、数据库管理、应用程序监控等方面。运维工
Java分布式任务调度交响乐：用代码指挥千台服务器跳起精准的华尔兹墨夶 Java学习资料1 java 分布式服务器
一、架构设计：分布式任务调度的指挥系统1.1架构图（用文字构建你的想象）[调度中心]→[任务路由]→[执行器集群]↑↓││├─数据库存储─┤││└─监控告警─┘关键组件：调度中心：任务的"总指挥"，负责任务注册、调度、状态监控执行器集群：任务的"舞团"，每个节点都是潜在的表演者任务路由：动态分配任务的"交通调度系统"数据库存储：任务元数据的"记分牌"二、核心技术实现：分布式调度的魔法阵2.1XXL
PgSQL内核特性 | Brin索引 yzs87 搜索引擎数据库
PgSQL内核特性|Brin索引数据库在进行过滤扫描或者join时，如果该表特别大，那么就需要顺序扫描表的所有数据然后进行过滤，或者扫描所有数据进行join条件探测。这对IO的负载影响特别大，当在join时，比如HashJoin的外表，需要对每个数据都进行Hash表探测，进一步影响性能。现有列存比如Infobright、Parquet、hydra等都对存储进行了类似的改进，在每个block中增加了
Java与Kotlin中的泛型之：擦除、不变、协变、逆变 Σ冰咖啡 java kotlin
Java与Kotlin中的泛型之：擦除、不变、协变、逆变前言对于Java中泛型的使用方法和应用场景等，不在本文章中作讨论，在阅读此篇文章时，我已经默认你对Java泛型有了一个较为清楚的认识和较为熟悉的应用熟练度。代码中的部分声明因篇幅原因没办法完全展示，只展示关键代码，但是别担心，你一定能看懂。本文章的内容均参考《Kotlin核心编程》中对该知识点的讲述，以及结合本人的实际开发经验。概述Java中
kotlin入门之泛型易帜¤ kotlin android
【码上开学】Kotlin的泛型在学习kotlin泛型之前我们先来回顾一下关于Java的泛型基础吧。说道泛型，我们可能最常用的就是在三大集合中去使用。泛型将具体的类型泛化，编码的时候用符号来值代类型，在使用时再确定他的类型。因为泛型的存在，我们可以省去强制类型转化。泛型是跟类型相关的，那么是不是也能使用与类型的多态呢？场景一：//多态，因为Button是TextView的子类，向上转型TextVie
基于springboot+mysql+jpa+html实现商品销售信息系统五星资源 spring boot mysql java
基于springboot+mysql+jpa+html实现商品销售信息系统一、系统介绍1、系统主要功能：2.涉及技术框架：3.本项目所用环境：二、功能展示三、其它系统四、获取源码一、系统介绍1、系统主要功能：订单管理模块商品管理模块品牌管理模块分类管理模块客户管理模块供应商管理模块2.涉及技术框架：web框架：SpringBoot数据库框架：SpingDataJPA数据库：MySql项目构建工具：
【redis】介绍和安装火龙谷 redis redis 数据库缓存
介绍Redis是一款高性能的开源内存数据库，核心采用键值对（Key-Value）存储模型。其最大优势在于数据完全基于内存操作，读写速度远超传统磁盘数据库（内存访问速度可达磁盘的数千倍，固态硬盘仍有显著差距）。支持丰富的数据结构（字符串、哈希、列表、集合等），并非简单存储单一值。提供持久化机制（RDB快照/AOF日志），确保重启后数据可恢复。具备主从复制、哨兵高可用、集群分片等分布式能力，扩展性强。
编程语言发展史之：逻辑编程语言 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介逻辑编程（logicalprogramming）是一种编程范式，旨在以一种逻辑的方式来表示程序，而不是像命令式编程一样直接面向计算模型或执行指令。逻辑编程倾向于通过构造计算机所理解的数学逻辑模型来解决问题。它特别适用于那些对数据结构和算法模型十分敏感的问题。与函数式编程相比，逻辑编程更加强调数据、关系和抽象等抽象概念之间的对应关系，因此更容易设计出正确而优雅的程
无人设备遥控器之RTK技术篇 SKYDROID云卓小助手信号处理人工智能嵌入式硬件算法自动化
RTK（Real-TimeKinematic，实时动态差分）技术是一种基于载波相位测量的高精度卫星导航定位技术，在无人设备（如无人机、无人车、无人船）遥控器中应用广泛，可显著提升设备的定位精度与作业效能。一、技术原理：载波相位差分实现厘米级定位RTK技术的核心在于通过基准站与流动站（无人设备）之间的实时数据交互，消除卫星信号传播过程中的公共误差，实现厘米级定位精度。具体流程如下：基准站观测：部署在
数据库AICD特性之--一致性 Consistency 你都会上树？数据库数据库 java oracle
数据库AICD特性之–原子性Atomicity数据库AICD特性之–隔离性Isolation数据库ACID特性之–持久性Durability数据库AICD特性之–一致性Consistency一致性指数据库在事务执行前后，数据始终符合预设的完整性约束和业务规则。事务执行前数据是合法的，执行后也必须合法，不允许出现违反规则的中间状态。一致性并非独立实现，而是依赖ACID中其他特性的协同：原子性（Ato
Java SE知识点五：面向对象之：继承时来天地皆同力. Java SE知识点 java 开发语言改行学it idea intellij idea 后端
1.什么是继承1.1继承的概念Java中的类是对事物的抽象描述，但有时候一个类与其他类有许多的共性，比如猫和狗都是动物，那么猫和狗这两个类就难免会有许多相似之处：classDog{publicStringname;publicintage;publicStringcolor;publicvoideat(){}publicvoidsleep(){}}classCat{publicStringname
Java基础集合框架之Set框架之TreeSet 骑牛小道士集合框架之Set java 开发语言
TreeSetTreeSet数据结构及实现原理TreeSet的构造方法TreeSet核心特性有序性(`排序大小输出`)自然排序定制排序唯一性底层数据结构:红黑树导航方法(特色核心优势)基础导航方法范围视图（不修改原集合）提取和删除元素逆序视图不允许null元素TreeSet线程不安全TreeSet线程不安全体现解决方案TreeSet优缺点TreeSet应用场景类结构传承去区别于HashSet实现了
Java基础集合框架之Set框架之LinkedHashSet 骑牛小道士集合框架之Set java 开发语言
LinkedHashSetLinkedHashSet构造方法LinkedHashSet底层数据结构及实现原理LinkedHashSet核心特性有序性插入顺序排序伪访问顺序排序(LRU)元素唯一性底层数据结构:[哈希桶+(链表或红黑树)]+追加的双向链表允许null值LinkedHashSet线程不安全LinkedHashSet线程不安全体现解决方案LinkedHashSet优缺点以及适用场景pub
Java基础集合框架结构分类图形骑牛小道士 java jvm 开发语言
集合集合分类分类图Collection分类Collection集合子结构之List合集Collection集合子结构之Set合集Collection集合子结构之Queue合集Map分类集合就是一个放数据的容器，准确的说是放数据对象引用的容器集合分类分类图java中集合分类有两大根接口Collection和Map集合CollectionMapCollection分类Collection集合的架构粗略
多bin技术：为LoRa项目赋能的高效远程升级方案门思科技技术分享网络服务器运维
在物联网（IoT）领域，设备的远程维护和固件升级（OTA升级）是保障系统稳定、持续优化的重要环节。然而，对于采用LoRa或LoRaWAN等低功耗广域网（LPWAN）技术的项目而言，受限于带宽窄、数据包尺寸小（通常最大255字节）等特点，传统的大容量固件升级方式并不适用。为了更高效、更安全地实现远程升级，多bin方案（multi-binapproach）应运而生，成为LoRa项目不可或缺的关键技术之
LevelDB、BoltDB 和 RocksDB区块链应用比较 MetaverseMan 区块链
LevelDB、BoltDB和RocksDB是三种常用的键值存储数据库，它们在区块链领域（如以太坊、比特币等）或其他高性能应用中有广泛应用。虽然它们都是嵌入式键值存储，但设计目标、性能特性、功能支持和适用场景有显著差异。以下是它们的详细对比，特别是结合区块链公链（如以太坊）中可能涉及的场景。1.LevelDB概述：LevelDB是由Google开发的一个轻量级嵌入式键值存储库，基于LSM树（Log
DolphinScheduler 6 个高频 SQL 操作技巧数据库
摘要：ApacheDolphinScheduler系列4-后台SQL经验分享关键词：大数据、数据质量、数据调度整体说明在调研了DolphinScheduler之后，在项目上实际使用了一段时间，有了一些后台SQL实际经验，分享如下。进入DolphinScheduler后台数据库，我这里使用的是MySQL数据库。以任务名称包含“ods_xf_act”的任务为例。一、修改任务组操作UPDATEt_ds_
Java操作MongoDB数据库（连接，增删改查） Java失业转安卓数据库 java mongodb
连接背景：需使用第三方类库：mongo-java-driver-3.4.2.jar不同的MongoDB需要使用的版本jar不同，根据需要可以自己在官网下载适合自己的版本gson-2.8.8.jar:某些方法需要传入MongoDB所需的Bson对象，可通过Gson，fastjson等方式创建，此处用的Gson1.连接MongoDB数据库：返回值：一个数据库连接对象参数:参数一：String类型的ip
阿里云安全访问AWS服务的极简方案：PrivateLink实战指南 ivwdcwso 运维与云原生阿里云安全 aws PrivateLink 跨云方案
无需公网/IP白名单/复杂路由，三步构建跨云专属通道当你的阿里云应用需要访问AWS的S3、Lambda或数据库时，是否还在为开放公网端口、配置VPN路由而头疼？本文将用15分钟带你实现零暴露的跨云安全连接。一、为什么选择PrivateLink？假设你的业务存在以下场景：✅阿里云ECS需要读写AWSS3中的敏感数据✅跨云调用Lambda函数但要求流量不出互联网✅避免配置复杂VPN或专线传统方案痛点：
SQL学习笔记5 彤银浦 sql 学习笔记
多表查询1、多表关系MySQL是一个关系型数据库，数据库中表与表之间存在关联。它们的关系根据一张表包含另外一张表数据的多少可以分为：（使用外键建立关系的方法不常用）一对多或多对一：在多的一方加入外键对应少的一方的主键多对一：在两张表中加入一张中间表，中间表中加入两个外键对应两张表的主键一对一：在一张表加入另一张表的外键，且将外键约束为唯一2、多表查询概述多表查询的语法：select字段from表1
多容器应用与编排——AI教你学Docker LuckyLay AI教你学Docker 人工智能 docker 容器
2.2多容器应用与编排现代应用通常由多个服务（如Web、数据库、缓存等）组成，每个服务运行在独立的容器里。如何高效管理、协调、扩展、升级这些多容器应用，成为容器化实践的核心。容器编排工具（如DockerCompose、Swarm、Kubernetes）正是为此而生。一、Compose：本地/开发环境多容器编排1.概述DockerCompose是用于定义和运行多容器Docker应用的工具。通过doc
彻头彻尾搞定JVM系列之五：JVM垃圾回收算法慕枫技术笔记 JVM从入门到精通 jvm
引言做C++开发的同学特别羡慕Java开发的同学，因为Java开发的同学在开发过程中不用手动去申请内存以及释放内存，因为JVM虚拟机会帮助我们进行垃圾回收，虽然有时候它可能会崩掉，但是至少比手动进行内存申请以及释放幸福的多。本篇文章主要介绍JVM的垃圾回收机制。一、什么是垃圾在探讨垃圾回收机制之前，我们先来搞清楚Java中的垃圾指的是什么。既然叫做垃圾，那肯定是没用的东西，没用的东西就需要进行回收
SQL学习笔记6 彤银浦 sql 学习笔记
事务1、事务的概念事务就是多个操作的集合，事务将这一串操作作为一个整体向数据库提交，要么同时操作成功，要么同时失败在输入DML语句时，MySQL是自动将事务提交，因此要操作事务时需要手动开启事务操作流程为：开启事务（若中间有错，则回滚复原并报错）结束事务2、事务操作事务操作有两种方式方式一：关闭事务自动提交，改为手动提交查看事务提交方式：select@@autocommit设置事务提交方式：set
Web 架构之图片与静态资源优化全攻略懂搬砖 web架构原力计划前端架构网络
文章目录思维导图一、图片优化1.图片格式选择2.图片压缩3.响应式图片4.图片懒加载二、静态资源优化1.文件压缩2.缓存策略3.CDN加速总结思维导图Web架构图片与静态资源优化图片优化静态资源优化图片格式选择图片压缩响应式图片图片懒加载JPEGPNGWebP无损压缩有损压缩文件压缩缓存策略CDN加速GzipBrotli强缓存协商缓存一、图片优化1.图片格式选择JPEG特点：有损压缩格式，适合色彩
数据库设计体系化知识（后端+前端+AI+三高场景+大厂面试+简历包装） @一叶之秋 Java架构师学习路线数据库前端人工智能 java
数据库设计体系化知识（AI融合版：后端+前端+AI+三高场景+大厂面试+简历包装）一、数据库设计基础：范式理论+AI辅助建模1.核心知识（AI赋能表结构设计）（1）三大范式+AI校验规则落地：用AI代码生成工具（如Copilot）自动校验表结构是否符合范式。→示例：输入“设计学生-班级表”，AI生成符合3NF的表结构，并标注冗余字段风险。后端协同：Java后端通过SchemaValidator工具
MySQL自增约束 @一叶之秋 MySQL理论学习
1、自增约束特点：（1）一个表只能有一个自增约束因为一个表只有一个维护自增值的变量。（2）自增约束的列只能是整数列（3）自增约束的列必须是键列（主键，唯一键，外键），实际中一般是主键自增最多2、如何在建表时指定某个列自增createtable【数据库名.】表名称(字段名1xxIntprimarykeyauto_increment,字段名2数据类型【uniquekey】【notnull】defaul
论文参考文献（持续更新...） @一叶之秋 java
毕业论文参考文献（java）考虑到平时做课程设计和毕业论文文献不好找，还要格式正确，某文库还不能直接复制粘贴，这里列举出自己做项目时用到的一些参考文献tips:论文查重技巧参考文献(一)：[1]李运莉.web数据库应用系统性能优化[M]．北京：人民邮电出版社，2011.[2]库俊国.基于J2EE技术的Web应用体系研究及实践[M]．北京：人民邮电出版社，2014.[3]陈楚杰.基于Struts和H
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

Sphinx+MySQL5.1x+SphinxSE+mmseg…

你可能感兴趣的:(IT之数据库)