E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
结巴分词
ES
分词
查询
全文检索介绍全文检索的发展过程:数据库使用SQL语句:select*fromtablewheredatalike“%检索内容%”出现lucene全文检索工具(缺点:暴露的接口相对复杂,且没有效率)出现分布式检索服务框架solr(缺点:建立索引期间。solr搜索能力极度下降,造成实时索引效率不高)出现Elasticsearch,是以lucene为基础,基于Restful接口进行发布非结构化数据查找方
一只欢脱的知更鸟呀
·
2023-12-17 02:44
elasticsearch
大数据
搜索引擎
小白学大模型LLMs:文本
分词
方法
本文介绍了各种类型的
分词
(tokenization),用于将单词拆分为一个或多个标记(token),因为单词和
分词
之间存在一对多的关系。
深度学习算法与自然语言处理
·
2023-12-17 02:38
NLP与大模型
人工智能
大数据
算法
自然语言处理
LLM
大语言模型
Elasticsearch从入门到部署 文档操作 RestAPI
Elasticsearch从入门到项目部署安装
分词
器索引库操作-CSDN博客3.文档操作有了索引库,接下来就可以向索引库中添加数据了。Elasticsearch中的数据其实就是JSON风格的文档。
软工菜鸡
·
2023-12-16 22:00
jenkins
运维
elasticsearch
java
橘子学ES09之
分词
以及各大
分词
器
在ES中有很重要的一个概念就是
分词
,ES的全文检索也是基于
分词
结合倒排索引做的。所以这一文我们来看下何谓之
分词
。如何
分词
。
橘子在努力
·
2023-12-16 21:12
数据库
#
ES
elasticsearch
java
大数据
【 某景点舆情分析:Python、Echarts、Flask、文本处理技术的应用】
某景点舆情分析:Python、Echarts、Flask、文本处理技术的应用前言技术栈数据获取与准备景点数据统计分析评论数据处理与分析词频统计
分词
与文本处理情感分析数据可视化Web应用搭建结语前言随着旅游行业的蓬勃发展
爱欲无极
·
2023-12-16 21:15
Flask
数据分析与挖掘
数据可视化
python
echarts
flask
安装配置elasticsearch—kibana使用—中文
分词
目录1es相关介绍2安装和启动3es的基本概念4es简单办的增删改查5对于中文的
分词
1es相关介绍1搜索引擎elasticSearch6(和elasticSearch5的区别在于,root用户权限、一个库能否建立多个表
知更鸟女孩
·
2023-12-16 18:57
系统及软件安装配置
elasticsearch
搜索
kibana
中文分词
由词性标注Part of speech Tagging引出的概念解释
词性标注工具:thulac、jieba序列标注序列标注问题:包括
分词
、词性标注问题、NER、关键词抽取、词义角色标注、词性序列标注序列标注方法
Reese小朋友
·
2023-12-16 17:50
Machine
Learning
Stuffs
算法
nlp
【冷格玉荻】快要期末考试了!
不是说把一个单词改成成现在
分词
,上回期中测试我就没考好。所以我就复习
冷格玉荻
·
2023-12-16 16:51
ES开源分布式搜索引擎(常用命令说明)
索引类似于数据库类型标识_doc文档行数据数据所在的地方分区默认分区5个,后不能修改副本默认1个日后可以修改**注:**6.0之后,创建索引是一个要指定,否则报警告字段映射keyword相当于=text相当于like中文
分词
Amazing慕丶涵
·
2023-12-16 11:36
Elasticsearch:相关性工作台 - BM25 及 ELSER 的相关性比较
在传统的BM25搜索中,我们可以对所需要搜索的文字进行
分词
。它也可以得到
Elastic 中国社区官方博客
·
2023-12-16 10:55
Elasticsearch
AI
Elastic
elasticsearch
大数据
搜索引擎
人工智能
全文检索
python
elser
无哲的诗 《鸟屎》二首
图片发自App【鸟屎】文/无哲自行车蹲在午后的树荫里鸟屎蹲在车座上黑白分明之鸟屎看上去并不讨厌幸好有鸟屎可抬手寻迹翅膀捕捉飞翔【指挥倒车的
结巴
老张】
结巴
老张神勇敢担当亲自指挥小王向后倒车倒倒倒倒再再倒倒倒倒倒倒倒然后老张的表情认真了到到到到到到到到到到到了咣铛哗啦尾灯报废灰色砖墙也被撞疼
山西无哲
·
2023-12-16 10:10
Android通过listview实现输入框自定义提示栏(代替AutoCompleteTextView自动完成文本框)
效果图背景本人因为一些需求初次接触android,需要实现一个类似android自带的AutoCompleteTextView(自动完成文本框),但和其不同的是通过后端接口直接筛选数据(自己的
分词
处理规则
Sca_杰
·
2023-12-16 07:20
android
android
【无标题】《三国演义》小说
分词
、词频、词性、词云、小说人物出场次序排序以及人物关系的分析
于2023年3月21日发表于黑龙江1、相关包的引入2、词性词频(1)源代码(2)结果3、词云(1)源代码(2)结果4、小说人物出场次序(1)源代码(2)结果5、人物关系(1)源代码(2)结果以上全部内容,感谢观看!
呵哦喉
·
2023-12-16 04:50
python
Python中文分析:《射雕英雄传》统计人物出场次数、生成词云图片文件、根据人物关系做社交关系网络和其他文本分析
对应内容1.中文
分词
,统计人物出场次数,保存到词频文件中,文件内容为出场次数最多的前300人(可大于300)的姓名和次数#-*-coding:utf-8-*-importjiebadefgetText(
刘墨苏
·
2023-12-16 04:49
Python
python
中文分词
中文分析
社交关系网络
python分析小说《从前有座灵剑山》文本
用python分析该小说的
分词
,词频,词云,小说人物出场次数排序等等。1.
分词
对文本进行
分词
,将
分词
结果输出到文本文件中。
huixiang4
·
2023-12-16 04:19
python
开发语言
数据分析
随机
分词
与tokenizer(BPE->BBPE->Wordpiece->Unigram->sentencepiece->bytepiece)
subword的切分包括:BPE(/BBPE),WordPiece和Unigram三种
分词
模型。其中WordPiece可以认为是一种特殊的BPE。
zhurui_xiaozhuzaizai
·
2023-12-16 03:56
自然语言处理
中文分词
Elasticsearch之_reindex
_reindex可是个好东西,尤其是针对开发者而言,从小的方面讲在存储数据是我们常常可能由于字段类型的问题,值大小写的问题,
分词
器的问题导致查询不到,或者结构不对,或者分片数,副本数不对等这类问题,从大的方面讲
我教你啊
·
2023-12-16 03:46
#
Elasticsearch系列
elasticsearch
大数据
告白游戏3
结巴
?”楚朗阁皱起眉来,还是一样的好看:“走了,小
ghost
·
2023-12-15 23:47
Elasticsearch从入门到项目部署 安装
分词
器 索引库操作
day08-Elasticsearch黑马商城作为一个电商项目,商品的搜索肯定是访问频率最高的页面之一。目前搜索功能是基于数据库的模糊搜索来实现的,存在很多问题。首先,查询效率较低。由于数据库模糊查询不走索引,在数据量较大的时候,查询性能很差。黑马商城的商品表中仅仅有不到9万条数据,基于数据库查询时,搜索接口的表现如图:改为基于搜索引擎后,查询表现如下:需要注意的是,数据库模糊查询随着表数据量的增
软工菜鸡
·
2023-12-15 22:50
jenkins
运维
Elasticsearch学习
每天凌晨定时对索引做force_merge操作,以释放空间4、采取冷热分离机制,热数据存储到SSD,提高检索效率;冷数据定期进行shrink操作,以缩减存储5、采用curator进行索引的生命周期管理6、仅针对需要
分词
的字段
CopyLower
·
2023-12-15 19:07
学习
elasticsearch
学习
大数据
微服务学习|DSL查询语法、搜索结果处理、RestClient查询文档、黑马旅游案例
例如:match_all全文检索(fulltext)查询:利用
分词
器对用户输入内容
分词
,然后去倒排索引库中匹配。例如:match_querymulti_match_query精确查询:根据精确词
玩复杂点
·
2023-12-15 18:53
微服务
微服务
java
后端
elasticsearch
学习
Hanlp自然语言处理如何再Spring Boot中使用
HanLP主要支持中文文本处理,包括
分词
、词性标注、命名实体识别、依存句法分析、关键词提取、文本分类、情感分析等多种功能。
Crhy、Y
·
2023-12-15 17:25
c#
开发语言
java
eclipse
maven
Python自然语言处理:NLTK库详解
本篇博客将深入介绍NLTK库的使用,包括
分词
、词性标注、命名实体识别、情感分析等常见任务,并通过实例演示其在实际应用中
小雨淋林
·
2023-12-15 14:06
Python基础入门教程
python
自然语言处理
easyui
#命硬私董会#穷人和富人的思维有何不同
奈何,第一天就被“坏坏"的恒洋老师下了套,为了蜕变自己,为了克服自己对着镜头说话就
结巴
,卡顿,拿出上刑场就义的勇气做了公共承诺,至少跟随恒洋老师走完这七天的实战练习,昨天花了一天的时间练习,到晚上8点17
fe13abaa7ed7
·
2023-12-15 13:53
SpringBoot整合Lucene实现全文检索【详细步骤】【附源码】
笑小枫的专属目录1.项目背景2.什么是Lucene3.引入依赖,配置索引3.1引入Lucene依赖和
分词
器依赖3.2表结构和数据准备3.3创建索引3.4修改索引3.5删除索引4.数据检索4.1基础搜索4.2
笑小枫
·
2023-12-15 12:11
SpringBoot集成中间件
全文检索
spring
boot
lucene
MySQL 的 ngram 全文解析器
ngram解析器将文本序列
分词
为连续的n个字符。例如,你可以使用ngram全文解析器为“abcd”进行不同值的n
分词
。n=1:'a','b','c'
半桶水专家
·
2023-12-15 09:39
mysql
mysql
数据库
Elasticsearch学习心得及常见问题
目录1.Elasticsearch和elasticsearch-headr跨域问题2.Elasticsearch的插件ik
分词
器3.ElasticSearch的核心概念1.分片2.倒排索引(重点,数据库可能会问
@逾越
·
2023-12-15 09:51
笔记
面试
elasticsearch
solr
搜索引擎
【AI绘图】 学习 prompt 画图,收集网站
Lexica会根据prompt的特征做
分词
搜索,并附有每张图片的Seed、Guidancescale和分辨率。LCM,只需4步就可生图,快!:https:/
联系丝信
·
2023-12-15 08:59
【AI绘画】
学习
Elasticsearch 查询革新:探索 Wildcard 类型的高效模糊匹配策略
2、解决方案探讨面对这种问题,传统的解决方案有两种:2.1方案一:ngram
分词
器使用ngram
分词
器对存入的数据进行精细化的拆分,利用细颗粒度的token进行快速的召回。
铭毅天下
·
2023-12-15 04:47
elasticsearch
大数据
搜索引擎
全文检索
阶段五:深度学习和人工智能(学习人工智能的应用领域,如自然语言处理,计算机视觉等)
Python在自然语言处理方面有很多优秀的库,如NLTK、Spacy等,这些库提供了很多强大的功能,如
分词
、词性标注、命名实体识别等。通过使用这些库,我们可以快速地
哈嗨哈
·
2023-12-15 04:06
人工智能
深度学习
学习
古风心理悬疑小说《我是谁》(五、中年男女的骚动)
方芸有点
结巴
,“我现在到回县里某局当局长。”张强含蓄地回答,然
古风心理咨询
·
2023-12-15 04:10
Python jiaba
分词
库安装过程 imac环境
2.下载并安装jiaba
分词
库全自动安装:`easy_installjieba`或者`pipinstalljieba`/`pip3in
爱上鱼的猫_产品狗
·
2023-12-15 02:55
又一次读书交流课
少了
结巴
,多了流利。
f56b42eab002
·
2023-12-15 01:01
自然语言处理基础知识 学习
Partofspeechtagging词性标注Namedentityrecognition:命名实体的识别Co-reference:共指消解(代词)Basicdependencies:句法关系中文的自动
分词
wangqiaowq
·
2023-12-14 21:04
学习
docker安装elasticsearch和kibana
docker安装rabbitmq3、docker安装mysqldocker安装elasticsearch和kibanadocker系列一、安装elasticsearch二、安装kibana三、安装ik
分词
器
魚迹
·
2023-12-14 16:42
Linux
docker
elasticsearch
kibana
ik分词器
挑战52天学小猪佩奇笔记--day2
翻译:Mr.Dinosaurislost.知识点:没有生命的恐龙先生不是自己丢的,是被弄丢的,所以用被动语态被动语态:be+动词的过去
分词
这个句子的lost也可以看作形容词单词:din
努力学英语的piggy
·
2023-12-14 16:38
笔记
【基于NLP的微博情感分析:从数据爬取到情感洞察】
基于NLP的微博情感分析:从数据爬取到情感洞察背景数据集技术选型功能实现创新点今天我将分享一个基于NLP的微博情感分析项目,通过Python技术、NLP模型和Flask框架,对微博数据进行清洗、
分词
、可视化
爱欲无极
·
2023-12-14 13:02
数据分析与挖掘
自然语言处理
人工智能
ES查询语句中,match和term有什么区别?
它在查询之前对字段值和查询字符串进行
分词
(tokenization)处理。分析器(Analyzer)应用:match查询会应用字段指定的分析器(如果有的话)来处理查询字符串。
来自宇宙的曹先生
·
2023-12-14 13:55
elasticsearch
搜索引擎
流利说懂你英语笔记要点句型·核心课·Level 6·Unit 1·Part 3·Dialogue New Policy of a Company
ps:关于提议的新政策proposed提议;建议;打算;希冀;计划;求婚;propose的过去
分词
和过去式newpolicy新政策Yes,peoplethinkit'sa
羲之大鹅video
·
2023-12-07 00:06
《月亮与六便士》:按自我认可的方式过一生
生于巴黎,十岁前父母双亡,由叔叔接回英国抚养,因身材矮小,说话
结巴
,总被同龄人欺凌,性格孤僻敏感。毛姆18岁在伦敦学医,后弃医从文。23岁发表首部小说《兰贝斯的丽莎》,
如阅而至
·
2023-12-06 22:24
扩散模型学习(三)
文章目录一、StableDiffusion使用二、管线的组成部分1.可变分自编码器(VAE)2.
分词
器(Tokenizer)和文本编码器(TextEncoder)3.UNet4.调度器(Scheduler
李明朔
·
2023-12-06 18:51
AIGC
学习
人工智能
Windows系统下Elasticsearch-7.15.2安装
一、环境此次笔记使用的运行环境以及软件版本系统:WIN10JDK版本:1.8Elasticsearch版本:7.15.2elasticsearch-head版本:最新IK
分词
器版本:7.15.2Kibana
高级盘丝洞
·
2023-12-06 13:14
windows
elasticsearch
大数据
NLP中几个简单的,字符串相似度计算方法
文章目录一、简单的需求二、技术需求:三、常见的几种简单技术四、几个示例1.使用编辑距离(LevenshteinDistance)2.使用Jaccard相似度3.使用jieba库进行
分词
以及结合余弦相似度来计算两个中文字符串相似度一
QuietNightThought
·
2023-12-06 09:23
深度学习
人工智能
nlp
20220403听书笔记:为何韩非是一位枢纽人物?
另外,你可能听说过韩非口吃,虽然他文章写得好,但诸子百家几乎个个有思想、有文采、有口才,韩非的
结巴
可能给他减分不少。今天要为大家介绍的这本《韩非》告诉我们,其实韩非在历史上是个具有枢纽意义的人物。
幸运星小燕子
·
2023-12-06 08:33
使用中文维基百科训练word2vec模型
使用中文维基百科训练word2vec模型声明下载原始数据处理数据将下载后的文件转为txt文件将繁体中文转化为简体中文jieba
分词
训练模型测试模型参考声明本文作为个人学习笔记使用,考虑到有些网上教程即使收藏也存在一段时间后被删贴的可能
长沙知名李二狗
·
2023-12-06 07:13
自然语言处理学习笔记
word2vec
人工智能
自然语言处理
我是一名贵族(1)
礼仪,气质,金币,大陆,吸血鬼,特洛伊,龙,天使,陨落,大陆十大强者,美女,小
结巴
,黑暗魔法,这里充满着魔幻的气息。蝶形年5200年,一名家族没落的小贵族,唐空今年17岁,对这个世界充满着好奇的心思。
唐空空
·
2023-12-06 05:53
掌握这四种开场方法,轻松应对99%的演讲场合
要么是怕开口,起首便支支吾吾,结
结巴
巴;要么就是开门见山,一上来就是“我今天给大家讲的是……”,让人索然无味。往往是开场容易,但要做得精彩,有吸引力就难了!为什么演讲的开场这么难呢?
一一小痴道人一一
·
2023-12-06 04:15
《绿山墙的安妮》
好词:阴沉、神色、慌慌张张、不知所措、一愁莫展、一无所知、吵吵嚷嚷、鄙视、如醉如痴、腼腆、容貌小巧、绞尽脑汁、六神无主、胆战心惊、不知所措、数九寒天、结
结巴
巴、令人费解、怪里怪气、大吃一惊、平庸、摇头晃脑
朋吧
·
2023-12-06 01:48
python统计三国高频词,画条形图,绘词云图
3、生成三国演义(下卷)词云图思路1.open打开读取整篇文档2.使用split()方法找到关键字,分开上下卷3.使用jieba进行中文
分词
4.使用Counter统计词频并将前10个高频词使用append
青衫木马牛
·
2023-12-06 00:07
python
python
开发语言
修改ES IK插件源码,配合MySQL实现词库热更新
ESIK词库热更新简介在实际工作中,我们经常需要更新ElasticSearch中IKAnalyzer插件的自定义词库,以获得更好的中文
分词
和搜索效果。
LittleMagic
·
2023-12-05 23:51
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他