E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
哈工大分词器
自顶向下语法分析器
参考资料:聊聊编译原理(二)-语法分析Let’sBuildASimpleInterpreter.Part1.编译原理(
哈工大
)-19.4-1自顶向下分析概述(Av17649289,P19)03-2-34
抬头挺胸才算活着
·
2023-09-27 06:18
基于bert-base-chinese的二分类任务
使用hugging-face中的预训练语言模型bert-base-chinese来完成二分类任务,整体流程为:1.定义数据集2.加载词表和
分词器
3.加载预训练模型4.定义下游任务模型5.训练下游任务模型
失眠的树亚
·
2023-09-26 23:30
预训练语言模型
bert
分类
python
ElasticSearch-索引和文档的创建修改删除
目录一、创建索引二、查看索引三、索引是否存在四、删除索引五、创建文档六、查看文档七、更新文档八、文档是否存在九、删除文档一、创建索引#创建一个默认的索引,默认是标准
分词器
的索引PUT/es_db2#创建一个默认为
才_先生
·
2023-09-25 23:20
ElasticSearch
elasticsearch
搜索引擎
java
哈工大
-操作系统-HitOSlab-李治军-实验0-在自己电脑上搭建实验环境
哈工大
李治军老师的操作系统实验课程是一门不可多得的好课程,该课程基于linux0.11让学生们编写代码实现:系统启动、系统调用、进程切换、内核级线程等操作系统的基本功能。
garbage_man
·
2023-09-25 10:10
操作系统OS
操作系统
ubuntu
linux
Elasticsearch与Linux(第五天)-安装中文
分词器
所需环境mavenelasticsearch-analysis-ik一.安装maven1.下载地址:maven2.移动maven至/usr/localmv~/apache-maven-3.5.4-bin.tar.gz/usr/local/cd/usr/local/tar-zxvfapache-maven-3.5.4-bin.tar.gzmvapache-maven-3.5.4maven33.配置全
vientof
·
2023-09-25 01:01
elasticsearch
elasticsearch
Centos7安装Elasticsearch
Elasticsearch1.安装java环境如果有openjdk可以不安装ES-7.15.2链接:https://pan.baidu.com/s/1O6eO8bauGr9JyGI9rUSDFw提取码:empaIK
分词器
链接
秦六千
·
2023-09-24 22:20
elasticsearch
java
linux
CentOS7 使用Yum安装ElasticSearch、Kibana并配置IK
分词器
1.使用yum源安装elasticsearch#安装Java环境yuminstall-yjava-1.8.0-openjdk-devel.x86_64#配置Java环境变量vim/etc/profile#在文件末尾追加exportJAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.362.b08-1.el7_9.x86_64exportCLASSPATH
LonLoc
·
2023-09-24 22:20
elasticsearch
linux
大数据
ElasticSearch - 基于 docker 部署 es、kibana,配置中文
分词器
、扩展词词典、停用词词典
目录一、ElasticSearch部署1.1、创建网络1.2、加载镜像1.3、运行1.4、检查是否部署成功二、部署Kibana2.1、加载镜像2.2、运行三、部署IK
分词器
3.1、查看数据卷目录3.2、
陈亦康
·
2023-09-24 22:41
ElasticSearch
elasticsearch
docker
中文分词
07_ElasticSearch:倒排序索引与分词Analysis
2.1创建倒排索引2.2倒排索引搜索三、Analysis进行分词3.1Analyzer由三部分组成3.2Analyzer分词过程简介1)字符过滤器characterfilter2)
分词器
tokenizer3
吴法刚
·
2023-09-24 09:16
#
ES
elasticsearch
大数据
搜索引擎
Docker部署ElasticSearch数据库+analysis-ik
分词器
插件
文章目录一、部署ElasticSearch数据库二、添加
分词器
插件(analysis-ik)三、测试ElasticSearch数据库+analysis-ik
分词器
插件一、部署ElasticSearch数据库
神奇的海马体
·
2023-09-24 06:07
#
1-Docker容器
docker
elasticsearch
数据库
yum 快速安装zookeeper、Kafka集群部署 es安装 logstash安装 kibina
分词器
redis
Zookeeper安装Kafka是基于Zookeeper来实现分布式协调的,所以在搭建Kafka节点之前需要先搭建好Zookeeper节点。而Zookeeper和Kafka都依赖于JDK,我这里先安装好了JDK:安装jdkyuminstalljava-1.8.0-openjdk*-y1[
[email protected]
~]#java--versionjava11.0.52019-10-15LTS
百里晓生
·
2023-09-23 06:27
zookeeper
kafka
elasticsearch
【LLM系列之Tokenizer】如何科学地训练一个LLM
分词器
1背景与基础1.1为什么需要分词对于人而言,在我们学会阅读之前,仍然可以理解语言。比如当你开始上学时,即使你不知道名词和动词之间的区别,但是你已经可以和你的同学交谈了,比如“我喜欢吃香蕉”,孩子对于这些虽然不清楚,但是知道是什么意思的。在此刻,我们学会了把语音/语言变成一种书面语言,这样你就可以读写了。一旦你学会了将文本转换为声音,你就可以回忆使用之前学过的词义库。计算机(即语言模型(LM)或查找
致Great
·
2023-09-23 03:45
人工智能
深度学习
自然语言处理
c++primer:第一章-开始篇
同时那个
哈工大
操作系统第一章有时间还是得补上去,这样就比较完整一些。同时由于自己是学过C语言的,所以我自己只会把我自己觉得比较重要的知识点写出来。
_return_
·
2023-09-22 19:39
C++
Primer学习笔记
c++
经验分享-10期」二战化学跨考上岸武大计算机
比如说2020年
哈工大
的计算
117a9a0fae4e
·
2023-09-22 04:29
哈工大
开源工具PyLTP的使用方法
1.安装方法(1)pipinstallpyltp首先pip安装pyltp库。(2)在LTP的模型页面下载模型,我直接就放在pyltp库下面了。下面上代码:importtorchfromltpimportLTP#默认huggingface下载,可能需要代理ltp=LTP(r"D:\Python3.8\Lib\site-packages\ltp\LTP_model")#默认加载Small模型#也可以传
Shy960418
·
2023-09-21 14:23
nlp
python
ElasticSearch match, match_phrase, term区别
转自https://www.cnblogs.com/buxizhizhoum/p/9874703.html1.term结构化字段查询,匹配一个值,且输入的值不会被
分词器
分词。
小周周i
·
2023-09-21 11:28
Elasticsearch 入门 索引、
分词器
存储时是否启用
分词器
,会影响查询效果match_phase对输入分词,但要求查询时将每个term都搜到,且顺序一致。match是对输入分词,只要文档包含了查询的一部分条件,都可以被返回。
Melody2050
·
2023-09-21 11:23
后端
elasticsearch
2022-09-08
老牌名校高材生,
哈工大
博士,曾长期担任公立本科大学校长,莱克国际大学的设计者、总导师。师范科班出身,资深教育工作者
白清长
·
2023-09-21 03:09
ElasticSearch(二)
例如:match_all全文检索(fulltext)查询:利用
分词器
对用户输入内容分词,然后去倒排索引库中匹配。例如:
真滴book理喻
·
2023-09-21 02:55
#
ElasticSearch
elasticsearch
django
大数据
linux搭建单机ES,集成ik
分词器
,文本抽取,Kibana可视化平台
Elasticsearch单机(Linux)准备工作第一项:创建运行Elasticsearch和Kibana专用的普通用户,因为elasticsearch和kibana不允许使用root用户启动,所以需要创建新用户启动。linux用root权限创建一个用户赋权即可,注意权限要给足第二项(启动没有报相关错误此项可以不做调整):设置linux的虚拟内存vim/etc/sysctl.conf修改参数(自
命运本如此,莫问何所以
·
2023-09-21 00:20
ES
linux
elasticsearch
kibaba
ik
微调预训练模型huggingface,transformers
fromdatasetsimportload_datasetdataset=load_dataset("yelp_review_full")dataset["train"][100]如您现在所知,您需要一个
分词器
来处理文本
CCCS实验室L&Y
·
2023-09-20 16:44
深度学习
机器学习
python
Elasticsearch下的kibana和
分词器
(ik)
安装KibanaKibana是ES的可视化管理工具.1下载安装包一定和ES的版本一致(5.6.10)https://www.elastic.co/downloads/kibana.2安装解压到安装目录即可.3配置在config/kibana.yml中配置elasticsearch.url的值为ES的访问地址image.4启动./bin/kibana访问地址:http://localhost:560
小小知识分子
·
2023-09-20 01:04
2017校招面经(BAT、搜狗、搜狐、一点资讯、360、华为优招)
个人背景:本科普通院校信息管理与信息系统(计算机与管理的交叉学科),考研到
哈工大
,到找工作的时候刚好一年(工大本部2
婉妃
·
2023-09-19 18:07
ElasticSearch--Field的使用
的属性介绍三、常用的Field类型(一)text文本字段(二)keyword关键字字段(三)date日期类型(四)Numeric类型四、Field属性的设置标准一、Field的介绍上周的一篇文章说了IK
分词器
的安装
JAVA贩卖机
·
2023-09-18 15:33
java
数据库
全文检索
elasticsearch
搜索引擎
理解创业与快速融资
7月19日,
哈工大
百年校庆倒计时EMBA/MBA系列讲座在
哈工大
(深圳)F栋104举行,系列讲座之第一讲《理解创业与快速融资》由主讲嘉宾冯芳带来。分享get到的几个点。
Miya的生活圈
·
2023-09-17 07:07
es的ik
分词器
测试命令记录
查看分词效果POST_analyze{"analyzer":"ik_max_word","text":["郭奶奶去买菜"]}创建索引,为字段title指定索引分词PUTik_index{"mappings":{"properties":{"id":{"type":"long"},"title":{"type":"text","analyzer":"ik_max_word"}}}}查看索引映射情况G
木木呦
·
2023-09-17 03:41
四.IK
分词器
针对词条查询(TermQuery),查看默认中文
分词器
的效果:[itstar@hadoop105elasticsearch]$curl-XGET'http://hadoop105:9200/_analyze
临时_01e2
·
2023-09-16 23:20
哈工大
集合论与图论(下)慕课MOOC答案
Ps:答案选自2023
哈工大
集合论与图论慕课,慕课的题重复率很高并且具有极高的相似性,选答案时要格外注意对比选项,能力有限答案不一定面面俱到,整理不易读者且用且珍惜第1讲图的基本概念第2讲连通图、补图、
诩en
·
2023-09-16 18:34
哈工大答案
图论
集合论与图论
哈工大慕课MOOC
哈工大
校园网显示IP地址错误连接不上
您当前获取到的IP地址有误,请重新开关无线获取IP地址(注:电脑端还可以通过cmd窗口,输入ipconfig/release、ipconfig/renew命令)。如未解决此问题请联系网络安全和信息化办公室处理。当校园网登录时会出现如上情况,并且当你按照他的方法尝试了以后还没有效果这里提供一些可借鉴的方法:方法一关闭WiFi重新打开尝试一下方法二简单粗暴:直接重启电脑试试方法三(成功可能性比较大)打
诩en
·
2023-09-16 18:02
杂七杂八
网络
ElasticSearch
文章目录一、引言1.1海量数据1.2全文检索二、ES概述2.1ES的介绍2.2ES的由来三、ElasticSearch安装3.1安装ES&Kibana3.2安装IK
分词器
四、ElasticSearch基本操作
荭色海湾
·
2023-09-16 00:29
ElasticSearch
elasticsearch
大数据
搜索引擎
部署ik
分词器
部署ik
分词器
案例版本:elasticsearch-analysis-ik-8.6.2ES默认自带的
分词器
对中文处理不够友好,创建倒排索引时可能达不到我们想要的结果,然而IK
分词器
能够很好的支持中文分词因为是集群部署
CodeStarNote
·
2023-09-14 19:12
elasticsearch
jenkins
运维
linux
Docker安装Elasticsearch 8.x 、Kibana 8.x等
1.下载ik
分词器
插件下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.2.0/elasticsearch-analysis-ik
世代农民
·
2023-09-14 05:54
Elasticsearch
elasticsearch
kibana
elasticsearch
8
es-head
ik
docker容器中es安装ik
分词器
docker使用了一段.感觉很方便.好处:发现之前安装有些不好.就删了重装.并且配置简单,比如mysql新版本安装有时候就会出莫名其妙的问题坏处:对docker不是很熟.东西都放在C盘.用了一段时间.C盘涨了10多G.很坑!下面是ik安装过程:step1.安装es:dockerpullhub.c.163.com/library/elasticsearch:latest这里用了网易的镜像中心需要注意
狂暴踩踩
·
2023-09-13 01:41
DSL查询文档
例如:match_all全文检索(fulltext)查询:利用
分词器
对用户输入内容分词,然后去倒排索引库中匹配。例如:
Qihang
·
2023-09-12 23:25
教程 | 史上最全:Origin绘制Contour图
哈工大
的王博士、吉林大学的Kyle博士等提到了Contour图的一些绘图问题。这些问题也是经常遇到的难题,这篇教程很全!
编辑之谭
·
2023-09-12 13:38
NLP领域首个国家杰青,回归母校!
据哈尔滨工业大学(深圳)官网消息,12月1日,哈尔滨市科学技术局局长宋博岩率队来校调研,
哈工大
副校长、
哈工大
(深圳)常务副校长甄良与宋博岩一行座谈,双方就开展国际人工智能领域更全面更深层次的合作做了深入交流
zenRRan
·
2023-09-12 03:21
人工智能
nltk
微软
ai
机器学习
【ES】---field、field.keyword的区别
字符串(text):用于全文索引,该类型的字段将通过
分词器
进行分词,最终用于构建索引;字符串(keyword):不分词,只能搜索该字段的完整的值,用于精准匹配过滤和聚合;-----备注说明:一般
DreamBoy_W.W.Y
·
2023-09-11 16:48
大数据/智能
elasticsearch
关于elasticsearch与kibana、IK
分词器
初识elasticsearch-正向索引和倒排索引什么是文档和词条?每一条数据就是一个文档对文档中的内容分词,得到的词语就是词条elasticsearch就是面对文档存储的,可以是数据库中的一条商品数据,一个订单信息,文档数据会被反序列化为json格式后存储在elasticsearch中。什么是正向索引?基于文档id创建索引。查询词条时必须先找到文档,而后判断是否包含词条什么是倒排索引?对文档内容
认真学java的秃头小白
·
2023-09-11 12:17
java进阶
elasticsearch
jenkins
大数据
NLP入门(六)pyltp的介绍与使用
pyltp的简介 语言技术平台(LTP)经过
哈工大
社会计算与信息检索研究中心11年的持续研发和推广,是国内外最具影响力的中文处理基础平台。
山阴少年
·
2023-09-11 08:47
0.初识操作系统
操作系统_
哈工大
-李治军这个分类中的内容是看的李治军老师的公开课,看视频过程中做的课堂笔记。目标是完成课后的实验,加强对操作系统的理解。等加强下汇编,会做对应的实验。
JieQiong1
·
2023-09-10 22:41
操作系统_哈工大_李治军
操作系统
ES ik
分词器
踩坑--startOffset must be non-negative
1.建了一个索引,字段text,
分词器
选的ik_max_word,写入的时候报下面一个错。。
仙道Bob
·
2023-09-10 13:25
elasticsearch
elasticsearch
大数据
搜索引擎
Linux 安装elasticsearch-7.5.1
elasticsearch下载:wgethttps://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.5.1-linux-x86_64.tar.gz
分词器
bill447
·
2023-09-10 07:41
日志平台搭建
linux
elasticsearch
运维
寻味中国 73 哈尔滨的啤酒(
哈工大
特别篇)下
说明:阅读上篇请点击《寻味中国73哈尔滨的啤酒上》。本篇略长,约3500字。我的故事:成家之后,我又找回了喝啤酒的乐趣。八十年代后期,各地啤酒厂占住了自家的地盘,就开始彼此攻讦,努力赢得更广阔的市场。我所在的江西九江,市内及周边有四家啤酒厂,其中两家论品质未必输于哈尔滨,虽然都是工业拉格,但用料足,且各有特色,有的略甜,有的涩味重些,有的香气足,闭着眼睛我都能喝出杯中的啤酒是哪家生产的。我的品酒能
冯晓晖
·
2023-09-10 07:44
ACNet:用于图像超分的非对称卷积(附实现code)
Happy首发:AIWalkerPaper:https://arxiv.org/abs/2103.13634Code:https://github.com/hellloxiaotian/ACNet本文是
哈工大
左旺孟老师团队在图像超分方面的最新工作
HappyAIWalker
·
2023-09-09 11:19
深度学习
Elasticsearch源码分析九--查询解析器QueryParser注册过程
Lucene的解析器使用如下:'''在构造QueryParser对象时传入分析器,此过程涉及JavaCC、
分词器
、查询语法等'''Quer
Nireus_LOVE
·
2023-09-09 10:03
Elasticsearch
源码分析
elasticsearch
自然语言处理学习笔记(八)———— 准确率
在中文分词任务中,一般使用在标准数据集上词语级别的精确率、召回率与F1值来衡量
分词器
的准确程度。这三个术语借用自信息检索
阿波拉
·
2023-09-09 09:10
自然语言处理
自然语言处理
学习
笔记
nlp
何晗
2018-04-21
哈工大
hzyido
·
2023-09-08 10:34
ES-Docker部署的ES中安装IK
分词器
前言之前写了Docker部署Elasticsearch和Kinbana,但Elasticsearch毕竟是国外的,对分词方面明显跟不上我们的需求,所以在很多时候,我们都会安装
分词器
插件,如IK
分词器
、JieBa
小松猿
·
2023-09-08 09:40
elasticsearch
docker
jenkins
Elasticsearch从入门到放弃:瞎说Mapping
前面我们聊了Elasticsearch的索引、搜索和
分词器
,今天再来聊另一个基础内容——Mapping。
Jackeyzhe
·
2023-09-07 15:53
elasticsearch安装ik
分词器
elasticsearch安装ik
分词器
1.修改docker-compose.yml文件,对es目录下的plugins文件夹进行文件映射version:"2.2"volumes:data:config:
ITenderL
·
2023-09-07 13:01
elasticsearch
elasticsearch
大数据
big
data
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他