E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
哈工大分词器
哈工大
《软件工程专业导论》复习指南
哈工大
软件工程专业导论复习指南文章目录
哈工大
软件工程专业导论复习指南前言引言——软件工程专业导论课程引言第一章软件工程专业初步认知第二章软件体系结构与生命周期第三章软件需求工程第四章软件设计与实现第五章软件质量与软件工程管理第六章软件工程教育与职业发展专业实验考试前言选修课同学复习仅需掌握前
诩en
·
2024-01-13 19:58
哈工大答案
软件工程
大数据
软件工程专业导论
ES
分词器
Analysis是通过Analyzer(
分词器
)来实现的。1.Analyzer组成注意:在ES中默认使用标准
分词器
:StandardAnalyzer。特点是:中文是单字分词,英文是单词分词。
迷茫的羔羊羊
·
2024-01-13 02:26
ElasticSearch
java
服务器
linux
刘弘泉教授著作《解析数论研究》第三章简介
本章标题:关于相邻素数差问题的正确结果(此书2015年
哈工大
出版社出版)本章回避既往研究都用的错误而且不实效的Bombieri-Vinogradov定理,采用作者2008年研究Barban-Davenport-Halberstam
ATINER
·
2024-01-13 02:48
算法
机器学习
人工智能
谈谈《谈谈不定方程》这本书
2011年哈尔滨工业大学出版社再版,我于2011年11月20日在
哈工大
学友书店买到策划编辑刘培杰,责任编辑张永芹,139页,定价28元。该书作者柯召和孙琦是不定方程专家。
ATINER
·
2024-01-13 02:48
算法
哈工大
管理学院教授吴冲
吴冲,男,黑龙江哈尔滨人,吴从炘教授之子,1993-1998年6月获哈尔滨工业大学基础数学专业博士学位,2000年9月哈尔滨工业大学管理科学与工程博士后出站,2005年任哈尔滨工业大学管理学院教授,博士生导师,黑龙江省优秀中青年专家,2008年度入选“教育部新世纪优秀人才支持计划”。主要从事预测理论及应用等方向的研究工作。在国内外期刊发表学术论文170余篇,其中被SCI/SSCI检索73篇。包括以
ATINER
·
2024-01-13 02:18
人工智能
哈工大
数学学院洪桂祥教授(国家高层次人才)
洪桂祥、赖旭东(
哈工大
数学学院副教授,省级青年人才)及合作者徐邦在非交换分析(泛函分析的新方向)的非交换性、正性在极大
ATINER
·
2024-01-13 02:17
启发式算法
Elasticsearch初识之
分词器
详解附加示例代码
文档规范化(normalization)文档规范化,提高召回率示例代码#normalizationGET_analyze{"text":"Mr.Maisanexcellentteacher","analyzer":"english"}字符过滤器(characterfilter)分词之前的预处理,过滤无用字符html标签过滤器官方参考地址HTMLstripcharacterfilter|Elasti
hcj_ER
·
2024-01-13 00:32
Elasticsearch
elasticsearch
中文
分词器
-ik分词(安装+简介)附示例
简介支持自定义词典IK
分词器
允许用户自定义词典,可以添加新词、调整词频等,以便更好地适应特定的领域或需求。
hcj_ER
·
2024-01-13 00:01
Elasticsearch
elasticsearch
Elasticsearch初识之Mapping详解附加代码示例
在Mapping里也包含了一些属性,比如字段名称、类型、字段使用的
分词器
、是否评分、是否创建索引等属性,并且在ES中一个字段可以有对个类型。
hcj_ER
·
2024-01-13 00:01
Elasticsearch
elasticsearch
大数据
【ES】ES 拼音 PINYIN
分词器
Elastic的Medcl提供了一种搜索Pinyin搜索的方法。拼音搜索在很多的应用场景中都有被用到。比如在百度搜索中,我们使用拼音就可以出现汉字:在这里插入图片描述对于我们中国人来说,拼音搜索也是非常直接的。那么在Elasticsearch中我们该如何使用pinyin来进行搜索呢?答案是我们采用Medcl所创建的elasticsearch-analysis-pinyin分析器。下面我们简单介绍一
小則沐风
·
2024-01-12 11:25
elasticsearch
jenkins
大数据
专业140+总410+哈尔滨工业大学803信号与系统和数字逻辑电路考研经验
哈工大
电子信息(信息与通信工程-信通)
一年的努力付出终于有了收获,今年专业课140+,总分410+顺利上岸
哈工大
803电子信息(信息与通信-信通),回顾总结了自己这一年的复习,有得有失,希望对大家复习有所帮助。
一个通信老学姐
·
2024-01-12 08:00
博睿泽信息通信考研
博睿泽信息通信考研论坛
考研
信息与通信
经验分享
信号处理
专业130+总400+哈尔滨工业大学803信号与系统和数字逻辑电路考研经验
哈工大
,电子信息,信息与通信工程,信通
今年专业课803信号与系统和数字逻辑130+总分400+如愿考上哈尔滨工业大学电子信息(信息与通信工程-信通),总结了一些各门课程复习心得,希望对大家复习有帮助。数学一资料选择:①高数:张宇强化班②线性代数:李永乐强化③概率论:王式安强化+张宇强化上面说的都是视频,下面说纸质资料。李永乐复习全书强化版、李永乐660题;张宇高数18讲、概率论9讲、1000题;历年真题;模拟题资料,推荐李林6+4,张
一个通信老学姐
·
2024-01-12 08:00
博睿泽信息通信考研论坛
博睿泽信息通信考研
考研
信息与通信
信号处理
2018-06-13
613,周三翰飞吾儿:本周在哈尔滨学习,刚吃完饭,在
哈工大
建院二楼过道阅读书桌旁,好宽的一张桌子,我喜欢。下午提前上课,就在学校里休息。外面阳光灿烂,室内凉爽而不干燥,适合看书休息想家里的亲人哈。
季正爸爸
·
2024-01-12 08:31
TinyLlama-1.1B(小羊驼)模型开源-Github高星项目分享
项目地址:https://github.com/jzhang38/TinyLlama/特点采用了与Llama2完全相同的架构和
分词器
。这意味着TinyLlama可以在许多基于L
AI 研习所
·
2024-01-12 08:38
AIGC
AI
人工智能
AIGC
人工智能
windows安装Elasticsearch后使用ik
分词器
报错解决办法
最近在学习Elasticsearch,安装完成后下载了ik
分词器
压缩到plugins目录下启动es报错如下:java.security.AccessControlException:accessdenied
qqcoming
·
2024-01-12 07:44
elasticsearch
jenkins
大数据
清华AI第一,
哈工大
NLP第一
大家好我是二狗。这两天全球计算机科学排名CSRankings2024发布啦!下面二狗就带大家来看一下最新的排名情况。清华、北大、上海交大AI领域霸榜前三在AI板块,主要有人工智能、计算机视觉、机器学习、自然语言处理、网络&信息检索5个细分领域。当只勾选AI领域时,世界AI领域高校排名前20就出来啦。可以看到清华、北大、上交大直接霸榜前三,AI强校CMU仅仅排名第四,而浙江大学位列第五,另外在前二十
夕小瑶
·
2024-01-12 05:43
人工智能
【现代密码学】笔记3.1-3.3 --规约证明、伪随机性《introduction to modern cryphtography》
introductiontomoderncryphtography》写在最前面私钥加密与伪随机性第一部分密码学的计算方法论计算安全加密的定义:对称加密算法伪随机性伪随机生成器(PRG)规约法规约证明构造安全的加密方案写在最前面主要在
哈工大
密码学课程张宇老师课件的基础上学习记录笔记
是Yu欸
·
2024-01-11 04:53
密码学探秘:现代密码与量子密码
科研笔记与实践
密码学
笔记
gpt
我的创业之路——为了一份坚持,我开发了一款APP
08年,我考上
哈工大
。到大学后我遇到一个问题——和高中那种学校和老师监督的环境不同,大学的环境完全是“放养”。所以大一的上半学期,在没有人监督的大学环境中,我整整玩了一学期。
今日目标APP
·
2024-01-11 03:50
面试宝典之ElasticSearch面试题
ES
分词器
通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
Long里小花荣
·
2024-01-11 01:23
面试
elasticsearch
职场和发展
Elasticsearch安装IK
分词器
踩坑记录
在安装ESik
分词器
参考如下博文进行安装时报后面的错误提示https://blog.csdn.net/ZHHX666/article/details/125953385错误提示:Causedby:java.nio.file.NoSuchFileException
道法自然 实事求是
·
2024-01-11 00:28
Elasticsearch
elasticsearch
大数据
搜索引擎
后MATLAB时代的七种开源替代,一种替代堪称完美!
近日,有
哈工大
学生表示收到了正版软件取消激活的通知,而在与MATLAB开发公司MathWorks交涉之后,被告知由于美国政府实体名单的原因,相关授权已被中止。
佩洛君
·
2024-01-10 15:10
新闻
大数据
程序人生
其他
日志系统一(elasticsearch+filebeat+logstash+kibana)
目录一、es集群部署安装java环境部署es集群安装IK
分词器
插件二、filebeat安装(docker方式)三、logstash部署四、kibana部署背景:因业务需求需要将nginx、java、ingress
`Liar`
·
2024-01-10 11:25
elasticsearch
大数据
搜索引擎
贝叶斯算法(新闻分类任务)
文章目录前言介绍一、新闻数据集处理二、文本分词(jibe
分词器
)三、去停用词停用词表是什么?
Avasla
·
2024-01-10 10:22
数据分析项目笔记
机器学习算法
自然语言处理
python
数据分析
N-gram 分词
概述本课程作业主要借助python工具,实现了N-gram分词中的Unigram和Bigram
分词器
,并将前向最大切词FMM和后向最大切词的结果作为Baseline,对比分析N-gram
分词器
在词语切分正确率
Silence_Dong
·
2024-01-09 16:23
大模型做实体识别任务的原理
NER):通常是一个序列标注的任务,常见的模型框架有:LSTM-CRF、BERT+BILSTM+CRF等,该种任务通常被成为flatNER即:每一个token只分配一个label;序列标准任务还会受到
分词器
的影响
zcc_0015
·
2024-01-09 15:02
人工智能
每日一看大模型新闻(2023.11.15)大模型「幻觉」,看这一篇就够了 |
哈工大
华为出品;零一万物公布对Yi-34B训练过程;英伟达合作微软推出AI代工服务
1.产品发布1.1Adobe将推出分离背景噪音的AI音频工具发布日期:2023-11-15AdobeisusingAItobreakapartmessyaudio-TheVerge主要内容:Adobe在开发ProjectSoundLift的新音频工具,该工具使用AI将掌声等元素与人的声音分离。用户可以将音频文件导入到应用程序中,选择希望该工具过滤掉的声音,包括掌声、笑声、闹钟、演讲、人群、交通和打
超爱玩大模型
·
2024-01-08 20:44
人工智能
自然语言处理
prompt
数据分析
语言模型
gpt
embedding
狠人用500行SQL实现GPT大模型
其中包括
分词器
的实现和字典的构建。通过使用递归CTE,将文本分割为标记,并合并最佳相邻对,以生成编码后的表示。作者还提到了生成文本的过程,并介绍了GPT2中的生成算法。
极道Jdon
·
2024-01-08 12:54
javascript
reactjs
1.1量子理论的诞生
*这是
哈工大
《量子力学》课程的笔记,用于整理课堂草稿。1.会用到《数理方程》中的一些特殊函数。
冷月无声I
·
2024-01-08 09:16
ElasticSearch(四)查询、
分词器
https://www.cnblogs.com/soft2018/p/10203330.html正向索引正排表是以文档的ID为关键字,表中记录文档中每个字的位置信息,查找时扫描表中每个文档中字的信息直到找出所有包含查询关键字的文档。这种组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护;因为索引是基于文档建立的,若是有新的文档加入,直接为该文档建立一个新的索引块,挂接在原来索引文件的后面
OkidoGreen
·
2024-01-08 08:37
elasticsearch8和kibana部署遇到的坑
但是由于ik
分词器
只更新到8.6.1,所以就更改为部署8.6.1。
大志_若愚
·
2024-01-08 08:07
elasticsearch
大数据
搜索引擎
修改ES默认分词设置
这时候会按“清”,“华”,“大”,“学”去分词,然后搜出来的都是些“清清的河水”,“中华儿女”,“地大物博”,“学而不思则罔”之类的莫名其妙的结果,这里我们就想把这个分词方式修改一下,于是呢,就想到了ik
分词器
攻城狮阿楠
·
2024-01-08 08:33
数据检索
ES默认分词
3.ElasticSearch
分词器
,包括默认
分词器
、英文
分词器
、中文
分词器
注:测试环境:CentOSLinuxrelease7.6.1810(Core)jdk:1.8elasticsearch:6.8.2单节点es安装:1.ElasticSearch安装教程与注意事项以及集群环境搭建_名猿陈大浏的博客-CSDN博客es添加索引:2.ElasticSearch添加、查询、修改、删除索引入门教程_名猿陈大浏的博客-CSDN博客导图(用于总结和复习)注:使用GET_analy
名猿陈大浏
·
2024-01-08 08:59
分布式框架
ElasticSearch
es
elasticsearch
java
搜索引擎
elasticsearch查看分析器分词效果
低版本的elasticsearch查看
分词器
效果可以直接在URL中指定
分词器
和查询词es6.x查看分词效果,可以使用GET或者POST方法,但是
分词器
和查询词需要以json的形式写在body里。
gxgalaxy
·
2024-01-08 08:55
elasticsearch
【9种】ElasticSearch
分词器
详解,一文get!!!| 博学谷狂野架构师
ElasticSearch
分词器
作者:博学谷狂野架构师GitHub:GitHub地址(有我精心准备的130本电子书PDF)只分享干货、不吹水,让我们一起加油!
博学谷狂野架构师
·
2024-01-08 08:51
java
程序员
【Docker基础一】Docker安装Elasticsearch,Kibana,IK
分词器
安装elasticsearch下载镜像查看版本:ElasticsearchGuide[8.11]|Elastic#下载镜像dockerpullelasticsearch:7.17.16#查看镜像是否下载成功dockerimages创建网络因为需要部署kibana容器,要让es和kibana容器互联#创建一个网络:es-netdockernetworkcreatees-net#查看本机的网络dock
herogus丶
·
2024-01-07 20:40
Docker基础
docker
elasticsearch
容器
最全中文停用词表(可直接复制)
最全的停用词表整理词表名词表文件中文停用词表cn_stopwords.txt
哈工大
停用词表hit_stopwords.txt百度停用词表baidu_stopwords.txt机器智能实验室停用词库scu_stopwords.txt
dilifish
·
2024-01-07 17:54
机器学习
机器学习
nlp
停用词
elasticsearch拼音
分词器
PUT/yx{"settings":{"analysis":{"analyzer":{"my_analyzer":{"tokenizer":"ik_max_word","filter":"py"},"completion_analyzer":{"tokenizer":"keyword","filter":"py"}},"filter":{"py":{"type":"pinyin","keep_fu
思绪千字难提
·
2024-01-07 08:25
elasticsearch
大数据
搜索引擎
docker下,容器无法启动,要删除里面的文件
第一步:进入dockercd/var/lib/docker第二步:查找,我这里是拼音
分词器
find./-name'py'第三步:得到路径第四步:删除或复制或移动,我这里是删除py文件夹rm-rf.
汤永红
·
2024-01-07 08:16
docker
容器
运维
elasticsearch查询性能优化方案
索引设计优化:确保正确选择和配置
分词器
和索引设置,以适应你的数据类型和查询需求。对于高基数字段(cardinality),使用合适的字段类型和索引设置,如keyword类型或布尔索引。
不加班程序员
·
2024-01-06 08:38
elasticsearch
性能优化
大数据
Elasticsearch零基础实战
(直接执行的json)es自定义
分词器
如何实现?kibana监控jvm分子分母是什么?es如何改索引结构?
梦魇梦狸º
·
2024-01-06 03:49
在学习java的道路上越走越远
elasticsearch
大数据
搜索引擎
【linux 0.11 学习记录】一、环境配置,用Bochs输出hello world
–2023/11/07关于学习环境最简单的方法是用linux编译,
哈工大
提供了一站式编译运行调试环境,已经比较成熟,网上相关教程很多。
来碗豆腐脑
·
2024-01-05 17:06
linux
linux0.11
bochs
学习笔记
大学前的分手
我奇怪地问:
哈工大
,这么好的大学!怎么不开心?小红说:跟男朋友分手了!他录取的是海南大学!我充满向往的说:一南一北,真好!无论他走到天涯海角,你都追随着他!小红说:好什么?
bbt棒棒唐
·
2024-01-04 16:04
NLP-分词算法(一):Byte-Pair Encoding (BPE) / Byte-level BPE【BPE是char级别】
首先,它依赖于一种预
分词器
pretokenizer来完成初步的切分。pretokenizer可以是简单基于空格的,也可以是基于规则的;分词之后,统计每个词出现的频次,供后续计算使用。
u013250861
·
2024-01-04 16:14
#
NLP基础/分词
自然语言处理
算法
人工智能
ElasticSearch常用的
分词器
本文来说下有关ElasticSearch
分词器
的几个问题文章目录概述什么是Analysis
分词器
的组成AnalyzerAPIES
分词器
StamdardAnalyzerSimpleAnalyzerWhitespaceAnalyzerStopAnalyzerKeywordAnalyzerPatternAnalyzerLanguageAnalyzer
wh柒八九
·
2024-01-03 16:51
核心知识点
Elastic
Search
elasticsearch
es
大模型与大模型的幻觉问题
参考大模型中的涌现OpenAI科学家:幻觉是大模型与生俱来的特性,而非缺陷大模型「幻觉」,看这一篇就够了|
哈工大
华为出品大模型什么是大模型大语言模型(LLM)是基于海量文本数据训练的深度学习模型。
IT从业者张某某
·
2024-01-03 09:57
大模型
大模型
docker环境下ES启动及IK
分词器
启动命令记录
dockerrun--nameelasticsearch-p9200:9200-p9300:9300-e"discovery.type=single-node"-eES_JAVA_OPTS="-Xms64m-Xmx512m"-v/gdc/app/es/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml
cai_code
·
2024-01-03 08:35
docker
elasticsearch
jenkins
Stable Diffusion模型概述
5.条件设定5.1文本条件(从文本到图像)5.2
分词器
5.3嵌入5.
T1.Faker
·
2024-01-03 08:10
大模型
AIGC
stable
diffusion
安装elasticsearch、kibana、IK
分词器
、扩展IK词典
安装elasticsearch、kibana、IK
分词器
、扩展IK词典后面还会安装kibana,这个会提供可视化界面方面学习。需要注意的是elasticsearch和kibana版本一定要一样!!!
Bunny0212
·
2024-01-03 07:18
后端
elasticsearch
jenkins
大数据
docker
全文检索
搜索引擎
mysql
28、商城系统(十):ElasticSearch的映射,nginx下载安装,es
分词器
,springboot整合es
目录一、Mapping映射1.es7删除类型2.es给字段设置字段类型,即映射(1)创建映射
鹏哥哥啊Aaaa
·
2024-01-03 07:12
从头开始做项目
elasticsearch
大数据
搜索引擎
Springboot+Elasticsearch+IK
分词器
实现全文检索(2)
Springboot+Elasticsearch+IK
分词器
实现全文检索(2)logstash实时同步数据到Elasticsearch中logstash下载地址[\[https://blog.csdn.net
ZXZ程序猿1024
·
2024-01-03 04:01
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他