weixin_30311605

elasticsearch技术实战——第一篇（使用篇）

为了提高搜索命中率和准确率，改善现有羸弱的搜索功能，公司决定搭建全文搜索服务。由于之前缺乏全文搜索使用经验，经过一番折腾，终于不负期望按期上线。总结了一些使用心得体会，希望对大家有所帮助。计划分三篇：

第一篇（使用篇），主要讲解基本概念、分词、数据同步、搜索API。
第二篇（配置及参数调优篇），主要围绕JVM参数调优、异常排查、安全性等方面讲解。
第三篇（倒排索引原理篇），知其然知其所以然。

一、技术选型

说到全文搜索大家肯定会想到solr和elasticsearch（以下简称es），两者都是基于lucence，到底有什么区别呢？主要列出四个方面：

对比项	solr	elasticsearch
分布式	利用zookeeper进行分布式协调	自带分布式协调能力
数据格式	支持更多的数据格式（XML、JSON、CSV等）	仅支持JSON
查询性能	更适合偏传统的搜索应用，单纯对已有数据进行搜索性能更高，但实时建立索引时查询性能较差。	在实时搜索应用中表现更好，数据导入性能更好
数据量对查询性能影响	明显下降	影响不大

最终选择es，主要原因：

作为后起之秀，吸收了solr的优秀设计，在实时搜索上性能更佳，大有超越solr之势。
社区非常活跃，文档齐全，越来越多的应用从solr迁移至es。典型案例较多：GitHub使用es来检索超过1300亿行代码、Wikipedia 使用es提供带有高亮片段的全文搜索。

二、基本概念

集群（cluster）和节点（node）：一个集群里包含多个节点，其中一个主节点通过选举产生，集群中任一节点的通信与整个es集群通信是等价的。
索引（index）：es包含一个或多个索引，相当于关系型数据库（以下简称RDS）里的数据库，可以向索引里写入或读取数据。
类型（type）：一个索引包含一个或多个type，相当于RDS里的表。
文档（document）：相当于RDS里的数据行，文档没有固定的格式（schemaless），与mongodb很类似。
分片（shards）：可以把一个大索引拆分成多个分片，分布到不同的节点上，提高检索效率。分片数在创建索引时确定，无法更改。
副本（replicas）：副本有两个作用，一是增加容错，当某个分片损坏或丢失时可以由其他副本恢复；二是增加系统负载，当搜索流量增加可以通过动态增加副本来满足要求。
倒排索引（inverted index）：由文档中所有不重复词的列表构成，对于其中每个词，有一个包含它的文档列表。倒排索引时lucence核心数据存储结构。

三、中文分词

3.1、分词器选型

默认分词器对英文支持较好，但对中文不友好，会把中文拆分成一个个汉字，这显然不满足需求。

市面上中文分词器不少，该如何选择，主要考虑以下几点：

自带默认词库，支持自定义词库扩展。
词库支持热更新（不重启es服务，自动生效）。
社区活跃，使用较广，分词效果好。

基于以上几点，很容易想到IK分词器，IK提供了两种分词模式：

分词模式

描述

ik_max_word

会将文本做最细粒度的拆分，比如会将“中华人民共和国国歌”

拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”，

会穷尽各种可能的组合

ik_smart

会做最粗粒度的拆分，比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”

IK分词器项目地址：https://github.com/medcl/elasticsearch-analysis-ik

3.2、词库更新

分词是否合理直接影响搜索结果的精确度，因此词库的更新尤为重要，由于es服务刚刚搭建完成，存在以下几个问题：

词库更新不便捷、不及时。词库虽然支持热更新，但是需要DBA操作，产品和运营人员无法自行更新。
自定义词库相对单一。目前只有疾病库。
线上由于分词不当影响搜索结果的比例不低。举个例子：用户搜索“浙二医院”，显然是想搜“浙大医学院附属第二医院”，但是现有词库利用ik_smart模式拆分成“浙”、“二医院”两个词，显然不符合需求。
重建索引不方便。由于词库更新后需要重建索引才能使已有数据按照新的词库分词，目前也是需要DBA手动操作，增加了风险。

针对以上问题，提出了几个解决方案，后续逐步优化解决：

某些专有名称（医生姓名、医院科室名称等）自动实时更新。
定期人为扩充词库，例如医院别名、科室别名、疾病症状等。
定期分析用户搜索记录，发现新词。
运营后台增加词库更新和重建索引功能，支持产品和运营人员自行维护词库。

抛出一个问题：由于词库更新后需要重建索引才能使已有数据按照新的词库分词，在数据量较小的情况下没有问题，一旦数据达到一定量级，重建索引的成本较高。百度这种量级的数据是如何应对词库更新的呢？可在评论区留言一起探讨。

四、数据同步

4.1、数据同步方式选择

这里的数据同步是指将数据从mysql同步到es。主要有几种方式：

调用es提供的api同步。这种方式最灵活、最实时，但是有一定的编码成本，主要适用于对索引数据实时性要求较高的场景。
同步工具。开源的同步工具也不少，主要有两种模式：

模式描述	代表	优点	缺点
服务定期扫表，通过时间戳字段实现同步	logstash	支持全量和增量同步，索引重建更方便	存在一定数据延迟，最少一分钟同步一次，且无法感知sql的delete操作
将自身伪装成mysql从库，监控binlog日志实现同步	go-mysql-elasticsearch	实时性较高	全量同步较困难，增加mysql服务器的同步成本

结合实际情况，会有定期重建索引需求，线上数据只允许逻辑删除，且对数据实时性要求并不高，公司的日志平台是通过logstash实现的日志收集，故选择logstash。

4.2、现有同步方式

公司正在做微服务拆分，且索引往往涉及多条业务线的数据。拿商品举例，主要包含基本信息（实时性要求较高）、统计数据（商品购买量、评论量、浏览量等，实时性要求不高）。所以最终决定借助大数据平台，实时数据10分钟做一次增量同步，统计数据一天一次同步，数据整理成宽表吐到mysql库，然后利用logstash将数据同步到es。

五、搜索API

搜索是全文索引的核心，下面列出了一些常用的搜索模式，为了便于理解，下面将各搜索语句类比成sql。

5.1、基本搜索（搜索骨架）

Query。使用Query DSL（Domain Specific Language领域特定语言）定义一条搜索语句。
From/Size。分页搜索，类似sql的limit子句。
Sort。排序，支持一个或多个字段，类似sql的order by子句。
Sourcing Filter。字段过滤，支持通配符，类似sql的select字段。
Script Fields。使用脚本基于现有字段虚构出字段。例如索引里包含first name和second name两个字段，使用Script Fields可以虚构出一个full name是first name和second name的组合。
Doc Value Fields。字段格式化，例如Date格式化成字符串，支持自定义格式化类型。
Highlighting。高亮。
Rescoring。再评分，仅对原始结果的Top N（默认10）进行二次评分。
Explain。执行计划，主要列出文档评分的过程。类似mysql的explain查看执行计划。
Min Score。指定搜索文档的最小分值，实现过滤。
Count。返回符合条件的文档数量。
...

5.2、核心搜索（Query DSL）

如果说上面的基本搜索类比成整条sql语句的骨架，那么Query DSL就是where条件，主要有以下几种类型语句：

全文搜索（Full Text Query）。文档地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/full-text-queries.html

类型	描述
Match Query	全文模糊匹配
Match Phrase Query	短语匹配，和Match Query类似，但要求索引词的先后顺序与输入搜索词的顺序一致。完全一致条件似乎比较严苛，可通过slop参数控制短语相隔多久也能匹配。
Match Phrase Prefix Query	与短语匹配一致，支持在输入文本的最后一个词项上的前缀匹配，常用于根据用户输入的即时查询，例如淘宝搜索框输入关键字后的下拉展示。
Multi Match Query	多字段搜索。包含以下几种模式： 1、best_fields：为每个字段分别生成Match Query搜索语句，然后取评分最高的字段作为文档最终得分。 2、most_fields：为每个字段分别生成Match Query搜索语句，然后将各分值相加然后除以命中语句数，得到文档最终得分。 3、phrase and phrase_prefix：行为跟best_fields一致，但使用 Match Phrase Query 代替 Match Query。 4、cross_fields：将多字段合并成一个大字段搜索。
...

词条搜索（Term Level Query）。文档地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/term-level-queries.html

类型	描述
Term Query	术语精确搜索，将关键字当成一个词来处理。 1、如果字段为keyword类型，即是字段的精确匹配。 2、如果字段为text类型，则仅当搜索词按ik_smart模式分词后只得到一个词的情况下才有可能搜索到文档。
Terms Query	同上，允许入参多个词。
Range Query	范围搜索，常用语数值和时间格式。类似sql的between子句。
Exists Query	搜索包含指定字段的文档。
Prefix Query	前缀搜索，常用于实现下拉框输入的即时搜索。
Wildcard Query	通配符搜索。通过通配符匹配词条。
Regexp Query	正则表达式搜索。通过正则表达式匹配词条。
...

组合搜索（Compound Query）。主要是对以上搜索语句的各种组合，主要介绍Bool Query和Function Score Query，文档地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/compound-queries.html

模式

描述

参数介绍

Bool Query

布尔搜索，由一个或多个类型化的Bool子句构成

must：用于搜索命中文档，条件组合是“and”关系，并且影响评分。
filter：用于过滤文档，不同于must，不会对评分有任何影响。
should：如果Bool Query包含must或filter子句，则该子句主要用于评分；否则用于搜索命中文档。可通过minimum_should_match（至少匹配几个条件）参数控制该行为。
must not：与must作用相反，且不会影响评分。

Function Score Query

自定义函数评分搜索

score_mode：自定义函数分值计算模式，包含 Multiply（相乘）、Sum（求和）、Avg（平均）、First（第一个）、Max（最大）、Min（最小）。

boost_mode：搜索结果分值与自定义函数分值结合得到最终分值的模式，包含 Multiply（相乘）、Replace（仅使用函数分值）、Sum（求和）、Avg（平均）、Max（最大）、Min（最小）。

field_value_factor：字段值因素，例如文章阅读量、评论量影响分值。

其他：Weight（权重）、Decay functions（衰变函数）、Random score（随机评分）

总结：以上对各种搜索模式做了简单介绍，每种模式里都包含一些搜索参数，没有具体展开。开发过程中往往需要结合实际情况，利用各种模式，设置搜索参数，配置字段权重，调优自定义函数分值，最终得到比较理想的搜索结果。

5.3、示例实战

Talk is cheap, show me the code。

  1 GET doctor_index/doctor_info/_search
  2 {
  3   "query¹": {

  4     "function_score": {
  5       "query": {
  6         "bool⁵": {
  7           "must6": [
  8             {
  9               "multi_match⁷": {
 10                 "query": "张内科",
 11                 "fields": [
 12                   "doctor_name^2",
 13                   "department_name^1.2",
 14                   "doctor_skill^0.8",
 15                   "institution_name^1.4"
 16                 ],
 17                 "type⁸": "cross_fields", 
 18                 "operator⁹":"and",
 19                 "analyzer¹⁰": "ik_smart"
 20               }
 21             }
 22           ],
 23           "must_not¹¹": [
 24             {
 25               "term¹²": {
 26                 "doctor_is_del": {
 27                   "value": "1"
 28                 }
 29               }
 30             }           ]
 39         }
 40       },
 41       "functions¹³": [
 42         
 43          {
 44           "script_score¹⁴": {
 45             
 46             "script": {
 47               "source¹⁵": "return Math.log(_score)/Math.log(2);"
 48             }
 49           }
 50         },         {
 65           "script_score": {
 66             "script": {
 67               "source": "String doctorProfessional = doc['doctor_professional'].value;  if (doctorProfessional == '主任医师') {     return 1; } else if (doctorProfessional == '副主任医师') {     return 0.8; } else if (doctorProfessional == '主治医师') {     return 0.6; } else if (doctorProfessional == '住院医师') {     return 0.4; }  return 0;"
 68             }
 69           }
 70         }       ],
 86       "boost_mode¹⁶": "replace",
 87       "score_mode¹⁷": "sum"  
 90   },
 91   "min_score²":3,
 92   "sort³": [
 93     {
 94       "_score": {
 95         "order": "desc"
 96       }
 97     },
 98     {
 99       "doctor_name": {
100         "order": "desc"
101       }
102     }
103   ],
104   "explain⁴": true
105 }

分析如下：

1、定义一个Function Score Query子句。
2、指定筛选文档的最低分值为3。
3、文档优先按分值降序排，分值相同的情况下按doctor_name降序排。
4、展示评分过程的执行计划。
5、定义Bool Query的组合搜索模式。
6、定义Bool Query的must子句。
7、定义多字段搜索，搜索关键字“张内科”，搜索字段：doctor_name权重2、department_name权重1.2、doctor_skill权重0.8、institution_name权重1.4。
8、定义多字段搜索类型为cross_fields，将以上四个字段合并成一个大字段处理。
9、定义关键字and搜索，即只有分词后多字段同时出现才满足命中条件。
10、定义使用ik_smart分词模式拆分搜索词。
11、定义Bool Query的must_not子句。
12、过滤掉doctor_is_del=1的文档。
13、定义具体的自定义函数数组。
14、定义一条评分规则。
15、定义评分函数逻辑，将Query计算后的分值做对数运算。
16、指定使用自定义函数分值作为文档的最终分值。
17、指定多个自定义函数使用相加的方式计算分值。

一句话解释：使用自定义函数搜索模式，定义Bool组合搜索条件，将doctor_name等四个字段按照不同的权重组合成一个大字段，搜索同时满足“张内科”关键字按照ik_smart分词后的结果，将关键字搜索得到的分值取对数后加上医生职称的分值作为最终分值，然后过滤掉doctor_is_del=1和分值小于3分的文档，最后按照最终分值和doctor_name两个字段降序排列，默认取10条记录，并且展示分值计算过程。

是不是觉得很酸爽，这是提条相对复杂的语句，细细体会。

5.4、评分机制

评分计算主要跟以下三个因素相关：

词频。词在文档中出现的次数越多，分值越高。
逆向文档频率。词在所有文档里出现的频率越高，分值越低。
字段长度归一值。字段长度越短，分值越高。

5.5、其他API

es还提供了其他强大的API功能，在此就不一一赘述了，例如：

文档管理API
索引管理API
聚合搜索API
集群信息API

六、开发流程

建议使用官方推荐的RestHighLevelClient SDK按照以下流程开发。

转载于:https://www.cnblogs.com/awalyslearning/p/9900635.html

操作系统视角下鸿蒙应用多语言的多媒体处理实践操作系统内核探秘操作系统内核揭秘 OS harmonyos wpf 华为 ai
操作系统视角下鸿蒙应用多语言的多媒体处理实践关键词：鸿蒙操作系统、多语言支持、多媒体处理、分布式架构、应用开发实践摘要：本文从鸿蒙操作系统的底层设计出发，结合多语言适配与多媒体处理两大核心场景，通过“系统能力-应用开发-用户体验”的全链路分析，揭示鸿蒙如何通过分布式架构、统一资源管理和多端协同特性，简化开发者在多语言多媒体应用中的开发复杂度。文章包含原理讲解、代码示例和实战案例，帮助开发者快速掌握
Java 数据结构篇-用链表、数组实现栈 2401_86450001 java 数据结构链表
2.7用链表实现栈的完整代码3.0用数组来实现栈3.1实现栈-入栈（push）3.2实现栈-出栈（pop）3.3实现栈-查找栈顶元素（peek）3.4实现栈-判断是否为空栈（isEmpty）3.5实现栈-判断是否为满栈（isFull）3.6实现栈-重写迭代器3.7用数组实现栈的完整代码1.0栈的说明栈是一种数据结构，它具有后进先出（LIFO）的特性，即最后入栈的元素最先出栈。栈通常可以通过数组或链
用 ArkTS 的 Repeat 组件玩转正向循环渲染：从基础到实战初始化萧何 harmonyos 华为深度学习
如果你经常开发HarmonyOS应用，肯定遇到过长列表渲染的问题——数据太多时页面卡得动不了，滑动时一顿一顿的，用户体验贼差。别担心，ArkTS的Repeat组件就是来解决这个问题的！它就像个"智能管家"，能按需加载组件、自动回收复用，让长列表滑动如丝般顺滑。今天咱们就用大白话聊聊Repeat怎么用，从基础用法到高级技巧，保证看完你就能上手～一、Repeat是啥？先搞懂它的核心优势咱们先拿生活中的
DeBian arm64 FireflyRK3576安装中文输入法和中文语言系统 up牛牛 linux ubuntu 运维
1.Debian配置中文环境在Debian上配置中文环境主要包括以下几个步骤：安装语言包：首先需要确保系统中已经安装了语言包。可以使用apt工具来安装：sudoaptupdatesudoaptinstalllocales2.配置locale：接下来需要配置系统的locale设置。运行以下命令打开locale的配置界面：sudodpkg-reconfigurelocales在出现的列表中选择zh_C
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
【vue-5】Vue 3 中的 v-model：双向数据绑定的全面指南
在Vue开发中，v-model是实现表单输入和应用状态之间双向绑定的关键指令。Vue3对v-model进行了重大改进，使其更加灵活和强大。本文将深入探讨Vue3中v-model的工作原理、新特性以及最佳实践。1.v-model基础1.1什么是v-modelv-model是Vue提供的一个语法糖，它本质上结合了v-bind和v-on：等价于：1.2基本用法在表单元素上使用v-model非常简单：你输
【Elasticsearch】dfsPhase
`dfsPhase`（即DFS阶段）是在每个数据节点本地执行的，而不是在协调节点执行的。在Elasticsearch的查询流程中，`dfsPhase`是为了在进行“评分”时更准确地计算全局的term频率（TF-IDF），它需要先在每个数据节点上执行一次本地的DFS操作，收集该节点上每个字段的term统计信息（如docFreq、totalTermFreq），然后将这些信息回传给协调节点。协调节点再合
【图论】CF——B. Chamber of Secrets (0-1BFS) KyollBM 图论算法
链接：https://codeforces.com/problemset/problem/173/B题目：思路：初识01BFS什么是01BFS呢？通常的BFS为一步权值为1，而某些题需要的不是走到步数，而是某种操作数，如花费一个操作可以走k步，而不花费只能走1步，通常我们使用双端队列可插队的性质来进行代码的编写，具体的对于不花费，那么就插入到前面，而对于花费则插入到最后本题中操作为“四射”，所以按
[数据结构]#4 用链表实现的栈结构 Marvinem13 数据结构链表学习 linux
使用链表来实现栈是一种比较常见的做法，它能够有效利用链表的动态特性来支持栈的一些基本操作，例如：1.Push（入栈）：向栈中添加一个元素。2.Pop（出栈）：从栈中移除顶部的元素。3.Peek/Top（查看栈顶元素）：返回栈顶元素但不将其移除。4.IsEmpty（判断栈是否为空）：检查栈中是否有元素。我们再来回忆一下链表，它由一系列节点组成，每个节点包含两部分：数据域和指针域（指向下一个节点）。对
如何在美团外卖上轻松领取并使用优惠券? 好项目氧券
如何在美团外卖上轻松领取并使用优惠券？在使用美团外卖平台点餐时，优惠券是我们常用来节省开支的小技巧。那么如何在美团外卖上轻松领取并使用优惠券呢？本文将为您详细介绍。一、领取优惠券1.打开美团外卖APP或进入美团外卖官网。2.在首页上方，可以看到“优惠”按钮，点击进入优惠中心。3.在优惠中心页面，你可以看到各种优惠券类型，如满减、折扣、新用户专享等。根据你的需求，可以选择合适的优惠券。4.点击领取优
vlan实验 zsk123456_ linux 网络服务器
实验拓扑5.二、实验需求1.全网可达2.使用DHCP获取IP地址三、实验思路1.配置交换机创建vlan更改交换机的接口链路类型配置trunk干道，放通vlam2.配置路由器配置子接口配置DHCP服务在子接口下放DHCP服务四、实验步骤1.创建vlan，更改交换机的接口链路类型，配置trunk干道，放通vlam[SW1]vlan2[SW1]vlan3[SW1]inte0/0/2[SW1-Ethern
完美化妆品怎么样好不好,完美日记什么档次的化妆品高省APP
完美日记是现在很火的一个彩妆品牌，很多彩妆博主都在推荐完美日记的化妆品，完美日记是中国新锐人气彩妆品牌，有很多好用的彩妆产品。高省APP高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。古楼导师高省邀请码518518，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高省只是一个导购的优惠平台！不卖产品
MySQL高可用集群SSRK：5步打造无感知故障切换墨瑾轩一起学学数据库【一】mysql adb 数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣大家好！今天我们要聊的是MySQL高可用集群的一种高级形态——SSRK（SuperSimpleandReliableKeepalived）。SSRK集群结合了InnoDBCluster、MySQLRouter和Keepalived，不仅提供了高可用性，还实现了
Linux下SPI设备驱动实验：向SPI驱动框架中加入字符设备驱动框架代码
一.简介前一篇文章编写了SPI设备驱动框架代码，文章如下：Linux下SPI设备驱动实验：SPI设备驱动框架编写-CSDN博客本文继续SPI驱动代码的编写。向SPI驱动框架中加入字符设备驱动框架代码。二.向SPI驱动框架中加入字符设备驱动框架代码1.添加字符设备驱动框架的代码打开ubuntu系统，通过vscode打开18_spi工程。向SPI设备驱动框架中添加字符设备驱动框架的代码。添加如下：(1
Linux下SPI驱动：SPI设备驱动简介
一.简介Linux下的SPI驱动框架和I2C很类似，都分为主机控制器驱动和设备驱动，主机控制器也就是SOC的SPI控制器接口，SPI设备驱动也就是所操作的SPI设备的驱动。本文来学习一下Linux下SPI设备驱动。二.Linux下SPI驱动：SPI设备驱动简介1.spi_driver结构体spi设备驱动也和i2c设备驱动也很类似，Linux内核使用spi_driver结构体来表示spi设备驱动，我
4个阶段，10种思维，教你快速入门短视频运营书不白读
短视频领域大火，很多人争相加入，但如果仔细观察，你会发现，成功的还是当初在其他平台的头部创作者们。那为什么从一个平台到另外一个平台，他们还能如鱼得水的进行创作呢？关键点在于两个字——思维，它是内容创作的底层逻辑。秋叶大叔，作为秋叶品牌的创始人，他从PPT、Excel、Word这些职场工具的使用，到新媒体创作、社群运营等方方面面，都做的风生水起，是名副其实的跨界达人。在短视频开始走进人们的生活以后，
QT下SQLite应用（二）菜鸟12号 qt 数据库 linux C++
一.简要介绍Qt是一个跨平台的C++应用程序开发框架，它提供了丰富的库和工具，用于开发GUI应用程序、数据库应用程序等。在Qt中，可以使用QSqlDatabase类和QSqlQuery类来操作SQLite数据库。此外，借助百度智能云文心快码（Comate）的智能代码生成功能，可以进一步提升开发效率。SQLite是一款轻型的数据库，是遵守ACID的关系型数据库管理系统，它包含在一个相对小的C库中。它
日更教会我的那些事迷雨楼
不知不觉，在已经日更将近百天了，还记得发第一篇文章时的心情，那时我想日更要求至少百字，即满百字便可，那对于全民写作时代的我们，似乎是低门槛了，于是信心满满参与了日更挑战。在日更挑战刚开始的几天，本着一腔热情和自信，自认为输出的算是文章，而且是自己喜欢的文字，算是自嗨式写作。可我也相信，即便是自嗨，也并非每天都能嗨起来。于是，我用曾作的几首小诗来保持日更，我明白写作有时的确需要灵感的光临，但往往文字
我爱上了自己的亲哥哥，怎么办？我的狗毛毛
1.其实不爱，何必相互伤害最近在上看到一篇贴子，名称是“我爱上了自己的亲哥哥，该怎么办？”底下有各种五花八门的热心回复。大部分网友都在探讨兄妹恋这一哲学论题，有些还给予真诚的支持和帮助。但是我个人认为，这压根就不是爱，只是一种基于强烈不安全感之下的控制而已。因为那位朋友，其实不够自爱。我所说的自爱，并非是“浪荡”。而是足够的对自己好，加倍的爱自己。这位朋友说自己性格较为内向，我估计（应该接近成年）
【Linux内核】Linux驱动开发撬动未来的支点 Linux内核 linux 驱动开发运维
推荐书籍：《Linux内核探秘：深入解析文件系统和设备驱动的架构与设计》知识点x86的IO地址空间和内存地址空间是独立的两套地址空间，并且使用不同的指令访问。MOV,IN,OUT。内存映射I/O可以将IO映射到内存。ARM等RISC采用统一编编址，无独立IO空间概念。为什么有IO地址空间的概念。因为在PCI总线下，外部芯片都有控制寄存器（配置空间）和设备本地内存（内存空间）两个部分，他们是独立的。
【PCIe】6: PCIe prefetchable和nonprefetchable smartvxworks PCIe高速总线专栏 PCIe PCI 串行高速总线
目录1.什么是prefetchable2.什么是nonprefetchable3.PCIe中的使用1.什么是prefetchableprefetchable可预取指的是CPU可缓存它的内容并且对它做所有类型的优化；可预取性内存是指存储器空间的可预取能力。例如如果读操作没有副作用（即如同从RAM中读数据一样不会破坏数据），则称存储器空间可预取。2.什么是nonprefetchablenonprefe
Python 中的列表（List）和元组（Tuple） shangjg3 Python python 开发语言
1.定义与语法差异1.列表的定义列表使用方括号`[]`定义，元素之间用逗号分隔。列表的元素可以是不同数据类型，甚至嵌套其他列表或元组。my_list=[1,"hello",True,[2,3]]2.元组的定义元组使用圆括号`()`定义，同样支持混合数据类型。需要注意的是，定义单元素元组时必须在元素后加逗号，以区别于数学表达式中的括号。my_tuple=(1,"world",False,(4,5))
春季招聘数字化：智能招聘如何升级面试流程？人事百宝箱面试流程优化面试流程数字化面试流程优化招聘数字化
2025年春季招聘季，全球企业面临着双重挑战：既要应对人才争夺战，又要在AI技术革命中重构招聘体系。数据显示，采用数字化面试流程的企业，人才录用效率提升47%，候选人体验满意度提高39%。在智能招聘时代，传统依赖人工的面试模式已难以适应快速变化的市场需求，企业需要通过数字化升级实现降本增效与体验优化的双重目标。本文将从行业趋势出发，解析春招面试流程的数字化升级路径，并深度解读Moka人力资源管理系
如何让用户回到上次阅读的位置？玛卡巴卡半夜不睡觉状态模式
【前端实战】如何让用户回到上次阅读的位置？在阅读类、资讯类、博客类网站中，记忆用户上次阅读到的位置，并在下次访问时自动滚动回那个位置，可以大大提升用户体验感。今天我们就来详细讲一讲：前端如何实现用户回到上次阅读的位置，包括基础scroll方法+优化、IntersectionObserverAPI+探针追踪、锚点URLHASH定位跳转等策略实现一个流畅且高效的方案。一、总体思路1、核心目标在用户滚动
彻底解决＂‘vue-cli-service‘ 不是内部或外部命令＂的问题！晷龙烬龙鳞拆解（前端深渊）vue.js 前端 npm
以龙息淬炼代码，在时光灰烬中重铸技术星河欢迎来到晷龙烬的博客✨！这里记录技术学习点滴，分享实用技巧，偶尔聊聊奇思妙想～原创内容✍️，转载请注明出处～感谢支持❤️！请尊重原创！欢迎在评论区交流！引言我最近拉取了一个Vue2的老项目，各种尝试，最终卡在了“vue-cli-service不是内部或外部命令”的这个错误提示上，令人倍感挫败。本文聚焦这一常见难题，提供我解决的思路，以供参考。一、问题分析该错
日常修炼夏摩山谷深处
修炼一：【工作篇】1.关于和领导交流在分配任务时，要马上搞明白你的任务是啥，不要因不好意思假装听懂了，再去猜领导的意思，万一猜错了，时间浪费了，工作也白做了，还会留下不好的印象。向领导征求意见时，提前准备好你的备选方案，多让领导去做选择题而不是问答题。2.关于工作学习建议主动学习，主动去接受任务，能学多少学多少。把握两个原则“令行禁止”和“法无禁止即可为“。前者的意思是当你被安排了多个任务时，直系
【MySQL高可用集群】MySQL的MGR搭建架构师之路魂数据库 mysql 数据库 MGR 高可用集群
前情提要：MySQL官方在5.7.17版本正式推出组复制（MySQLGroupReplication，简称MGR），使用类似zookeeper的多于一半原则。在一个集群由2N+1个节点共同组成一个复制组，一个事务的提交，必须经过N+1（也就是集群节点数/2+1）个节点决议并通过后才可以提交。这是目前MySQL数据库高可用与高扩展的最优解决方案。MGR有以下几个限制条件：1、存储引擎必须为Innod
解锁发动机潜能：深入解析现代宽域空燃比测量技术 Triv2025 高性能调校必备工具 ECU调校空燃比工具涡轮增压空燃比优化赛车发动机空燃比监测高分辨率AFR传感器
在追求极致动力与效率的发动机调校领域，精准的空燃比（AFR）数据是解锁性能潜力的核心密码。AFR500系列空燃比监测仪自问世以来，凭借其革命性的宽域测量技术，已成为改装发烧友和专业调校师不可或缺的利器。而全新的AFR500v2版本，则在性能、兼容性和应用广度上实现了全面飞跃。一、宽域测量核心价值在于其提供了真正的宽域空燃比测量能力：测量范围：标准范围覆盖9.0:1至16.0:1(0.62-1.1λ
Linux设备驱动之SPI驱动关于电机的一切 linux 驱动开发 arm开发
Linux下SPI驱动分成两部分：主机驱动和设备驱动。主机驱动：主机侧SPI控制器使用structspi_master描述，该结构体中包含了SPI控制器的序号（很多SoC中存在多个SPI控制器），片选数量，SPI信息传输的速率，配置SPI模式的函数指针（4种模式），实现数据传输的函数指针。structspi_master{structdevicedev;structlist_headlist;s1
2023-01-16 紫色春天
中原焦点团队网络初级38期朱继红坚持分享第73天，坚持读书打卡73天，约练38次，观察员30次，来访者8次2023年1月16日今天约练遇到了2位咨深的咨询师，整个咨询过程自然、温暖、流畅，咨询师通过倾听、陪伴丶自然同理、应对问句等咨询技术，一直稳稳地陪伴着来访者，用好奇引导来访者自我察觉，发挥水引子的作用，通过总结、提练，让来访者象打开一个又一个水龙头一样，自然流露、畅所欲言，看到…看到即疗愈……
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数