E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
汉语分词
NLP快速入门
p=1&vd_source=3f265bbf5a1f54aab2155d9cc1250219参考文档链接1:NLP知识点:Tokenizer
分词
器-掘金(juejin.cn)一、
分词
分词
是什么?
Knoka705
·
2024-02-15 09:10
NLP
自然语言处理
人工智能
鲁西南方言杂谈-明儿、赶明儿
本文只重点讲几个《
汉语
词典》上明确给出“明天”意思的部
分词
。
一两茶叶
·
2024-02-15 08:17
如何处理我们的文本数据成构建词表
这里有我们先经过停用词和按字
分词
的处理之后,得到的问答对文本数据,input_by_word.txt和target_by_word.txt。
liaolaa
·
2024-02-15 08:14
自然语言处理
pytorch
word2vec
VSCode常见插件安装
VSCode提供了大量的扩展和插件,其中对于前端开发比较常用的有以下几项:1.Chinese(Simplified)Language主要功能:VSCode汉化,提供
汉语
界面。
Mr_Arc
·
2024-02-15 07:58
武峰十二天-第三天 非谓语动词的翻译
非谓语动词有三种形式:不定式(todo),动名词(doing),
分词
:现在
分词
(doing),过去
分词
(done).3)某些非谓语动词还具有动词的一部分性质。
扬扬的快乐
·
2024-02-15 05:55
django-haystack + whoosh + jieba 实现全文搜索
网站实现全文搜索,并对中文进行
分词
搜索开发环境:Python3.7Django3.2需求:网站内有商品、求购2个模块,搜索栏输入塑料玩具时,希望优先搜索出匹配塑料玩具的信息,并同时匹配出塑料、玩具等信息
Vvvvvvv四季
·
2024-02-15 03:16
说一出是一出,英语里有这类似的地道表达么?
汉语
里我们说一个人说一出是一出意思是他一会儿这么说一会儿那么说想怎么说就怎么说好像都随着自己爱咋咋说后来又引申为这个人一会儿这么个想法一会儿那么个想法总之想法多,没个定数那么对于这样的人在英语里有没有地道的表达来形容呢
驻下Kobe
·
2024-02-15 02:22
假期结束
借机会也总结一下:1、大约就是10本书:《左传上部》看完,下部快了;《中国饮食史》;《中国农业科技史》、《读懂中国农业》,农国子民,算是补了一课;《
汉语
四千年》、《
汉语
史话》,对汉字的形音有个了解;《中国哲学史大纲
斯文致用
·
2024-02-15 02:06
NLP学习-05.问答系统基础-文本表示(word representation)-距离计算
上几节已经介绍了文本的
分词
,拼写纠错,这节介绍wordrepresentation和距离的计算都比较简单,不做详细说明.什么是wordrepresentation即将一个文本进行向量化,这样可以容易地进行距离的度量
logi
·
2024-02-15 01:35
ElasticSearch安装篇 一《elasticsearch、kibana、IK
分词
器》
ElasticSearch(安装篇)一、安装elasticsearch声明:Elasticsearch是用Java语言开发的,所以在安装之前,需要先安装一下JDK1.8,保证JDK环境正常下载官网:https://www.elastic.co**下载地址:**https://www.elastic.co/cn/downloads/elasticsearchwindows下安装解压即可使用熟悉目录b
gdhck
·
2024-02-15 01:19
Elasticsearch
java
es
逍遥于天地之间
先秦庄子的《逍遥游》,想必许多修
汉语
言文学的人读过—————北冥有鱼,其名为鲲。鲲之大,不知其几千里也;化而为鸟,其名为鹏。鹏之背,不知其几千里也;怒而飞,其翼若垂天之云。是鸟也,海运则将徙于南冥。
回首是天涯
·
2024-02-14 23:04
在公德公益中前行
文学与传媒学院18级
汉语
言文学3班发起了一场关爱孤弱老人的公益团体活动。在出发前一天,细心体贴的同学们先购置了许多食品,生活用品等作为送给老爷爷
周儿吉月
·
2024-02-14 21:21
Elasticsearch 数据类型系列
用了text之后,字段内容会被分析,在生成倒排索引之前,字符串会被
分词
器分成一个个词项。text类型的字段不用于排序,很少用于聚合,这种字符串也被称为a
大口吃饭大口吐
·
2024-02-14 20:20
陈文豪:世界上最大的监狱,是人的大脑
海信是我2010年的学生,当时给我学习演讲,后来就去了澳大利亚,在堪培拉边上学,边帮人做
汉语
培训,后来和当地居民开瓷器营销公司。
陈文豪
·
2024-02-14 19:11
2019年春季学期的收获
也会
汉语
拼音字母表,也会了加减法。我在学校,吃完饭就开始打扫卫生,也可以倒垃圾,我最喜欢的是劳动之星,这学期我收获了很多知识。谢谢洪老师和李老师!到二年级我会努力学习,天天进步!
小隽
·
2024-02-14 18:59
鲁西南方言杂谈-招
“招(拼音zhāo)”字,《
汉语
字典》给其解释有近三十个意思,本文只介绍在鲁西南方言里用到的其具有区域性使用的意思,并且在某些鲁西南县市里的人把“招”字都发zāo音。
一两茶叶
·
2024-02-14 17:53
中国美术馆展览雕塑|黎族勇士(王树山)
大多数黎族人都能兼说
汉语
,过去黎族没有本民族文字,通用汉文,1957年在党和政府帮助下创制了以拉丁字母为基础的黎文,信仰仍处在原始宗教阶段。
霖山
·
2024-02-14 17:57
读《曾国藩传》
这几天一直跟读《曾国藩传》收获很多一自我管理能力提高曾国藩的十二条规矩和课程,翻译成现代
汉语
,主要包括以下几点一早起,每天天不亮就起床,绝不赖床二静坐,每天静坐半个时辰,也就是一个小时,让自己的心静下来
莫郁凡
·
2024-02-14 15:44
无价之宝电影票多少钱一张?7折特价票购买方法
因为“无价之宝”这个词汇在
汉语
中
桃朵十三
·
2024-02-14 13:43
GPTs Action 实战:儿童
汉语
词典
嘿,大家好呀,我是景淮,一个加拿大的程序员,沉迷AI不能自拔中。今天的灵感来自于月影的LearnChineseCharacter。GPTs链接:https://chat.openai.com/g/g-HhhuZ8uIY-learn-chinese-character通过调用API可以把汉字的每一个笔画进行展示,然后清晰的显示出来。同样是汉字学习,想把孩子查字典的过程一起融入进去,辅助孩子进行查字典
·
2024-02-14 12:44
人工智能
Java——TCP/IP超详细总结
A只会说
汉语
、B只会说英语、而C既会说
汉语
又会说英语。现在A与B要聊天,他们之间该如何沟通呢?若A与C要聊天,又会怎样?这时如果我们:将
汉语
和英
说故事的五公子
·
2024-02-14 12:15
网络
以太网
网络通信
webgl
acl
我在西班牙的
汉语
教学之旅
感谢在西班牙作为
汉语
教师的这段经历让我有幸遇到了一群可爱的学生,为我的人生旅程抒写下了绚丽的篇章。海岛风光我在坐落于西班牙海岛上的拉斯帕尔马斯大学和其孔子学院本部授
西语知道
·
2024-02-14 12:43
为什么我始终是被抛弃的那个人?(2)
当她开始进一步思考,是参加
汉语
苏斐涵
·
2024-02-14 09:46
python笔记——jieba库
文章目录一.概述二.jieba库使用三.实例一.概述1.jieba库概述jieba库是一个重要的第三方中文
分词
函数库,不是安装包自带的,需要通过pip指令安装pip3installjieba二.jieba
Toby不写代码
·
2024-02-14 08:02
python学习
python
再说拼音
汉语
拼音集中学习已接近尾声,针对学生在拼读,作业等方面我所观察到的不足,给家长。几点建议。一,尽量为学生创造一个良好的语言环境。
黑石黑
·
2024-02-14 07:51
Elasticsearch实战阅读笔记
5.索引文本"bicyclerace"分析步骤将产生"bicycle""race""cycling""racing"(还有现代
分词
..nb)6.面向文档,意味着索引和搜索数据的最小单位是文档7.文档是无模式的理解索引相当于库
Wyat,sahar
·
2024-02-14 06:11
elasticsearch
elasticsearch
读史有感:十字军东征简史
那时我遇见一个会说
汉语
的人真
Amorsophist
·
2024-02-14 04:52
pytohn3+pycharm实现将txt文件 使用jieba
分词
worldcloud制作词云 ——以《三国演义》的txt文件为例
代码以及释义如下:```importjiebaimportjieba.analyseimportwordcloudfromPILimportImage,ImageSequenceimportnumpyasnpimportmatplotlib.pyplotaspltfromwordcloudimportWordCloud,ImageColorGeneratorimportjiebaimportjie
dlwlrmaIU
·
2024-02-14 02:41
最后一封遗书
把
汉语
创建成一款适宜梦游者的游戏,叛逆的罪状总会用成年揭晓独立的放生,乖巧的伪善终究会露馅啃老的负担。仇视指引着冷静参考各类文献综述,修炼心境下的桃木,讨好老辈扭转平庸的中伤,攀比鄙夷未来的建树。
陈迩遥
·
2024-02-14 02:22
五分钟让你全面了解文化传媒广播电视学专业!
所以,高考志愿我听从家长的建议填报了
汉语
言文学专业,想着
香辣杏鲍菇
·
2024-02-14 01:28
听课3:亓老师主讲了拼音课《a o e》
《aoe》是小学第一篇
汉语
拼音课,由三个部分组成。第一部分是单韵母ɑ、o、e的读音与形状的学习。第二部分是单韵母ɑ、o、e读四声的学习。第三部分是四线格的认识和单韵母ɑ、o、e书写的学习。
龙之崛起
·
2024-02-13 23:00
《源氏物语》文言体详注译文 桐壶 第一章第一段
《源氏物语》原书用古日语写就,故尝试文言翻译,同时尽可能保留古日语当中与古
汉语
相通的部分,哪怕有些内容需要结合注释才能更好懂——因为那样更接近原文。配图的方式,有的是直接贴图,有的是提供图片链接。
闲机生
·
2024-02-13 22:52
13自然语言处理基础入门
字符串基础操作及应用自然语言处理简介做一个中文文本分类任务,首先要做的是文本的预处理,对文本进行
分词
和去停用词操作,来把字符串分割成词与词组合而成的字符串集合并去掉其中的一些非关键词汇(像是:的、地、得等
Jachin111
·
2024-02-13 21:04
大模型Tokenizer知识
Byte-PairEncoding(BPE)是一种常用的无监督
分词
方法,用于将文本分解为子词或字符级别的单位。BPE的词典构建过程如下:初始化词典:将每个字符视为一个初始的词。
lichunericli
·
2024-02-13 21:39
LLM
人工智能
语言模型
一首小诗,当英文遇上
汉语
。
英文原文:Yousaythatyouloverain,butyouopenyourumbrellawhenitrains...Yousaythatyoulovethesun,butyoufindashadowspotwhenthesunshines...Yousaythatyoulovethewind,Butyoucloseyourwindowswhenwindblows...ThisiswhyI
七开的柯基
·
2024-02-13 18:01
韩语学习丨韩语TOPIK初级语法①
谓词词干末音节是开音节时用"-려고",闭音节时有"-으려고".相当于
汉语
的“为了...”“想(做)...”“要(做)....”例:1)낚시를합니다/사람들이많이모여요.钓鱼/聚集了很多人。
教韩语的小右
·
2024-02-13 17:12
pandas:统计某一列字符串中各个word出现的频率
更多、更及时内容欢迎留意微信公众号:小窗幽记机器学习背景某一列是字符串,想要统计该列字符串
分词
结果后各词出现的词频。
JasonLiu1919
·
2024-02-13 14:56
pandas
python
pandas
数据分析
2021-05-04 你有好奇心吗?
汉语
词典的解释是:泛指对自己所不了解的事物觉得新奇而感兴趣,充满新鲜感。好奇心是人类进步的动力,很多发明创新都是为了满足自己的好奇心,同时在客观上给人类
寒风老猫2015
·
2024-02-13 13:56
【智慧爱♥幸福家】第5篇:家长学会接纳孩子!
接纳,这个词,我们先看看百度百科是如何解释的:接纳是一个
汉语
词汇,读音为jiēnà,指接受(个人或团体参加组织、参加活动等);采纳。出自《后汉书·岑彭传》等。近义词区别接纳不代表接受,也不代表内化。
彩仕铭宏
·
2024-02-13 10:05
ES实战-分析数据1
分析是文档被发送并加入倒排索引之前,es在其主体上进行的操作,具体如下1.字符过滤-使用字符过滤器转变字符2.文本切分为
分词
-将文本切分为单个或多个
分词
3,
分词
过滤-使用
分词
过滤器转变每个
分词
4.
分词
索引
wzerofeng
·
2024-02-13 09:25
elasticsearch
postman
大数据
圣经故事连载1
我先假设圣经里记载的都是真实的(不要问我为什么我不假设它是假的,因为我刚开始读的时候就认为它不是真的,并且如果这样假设故事就没法讲下去了),基于这个逻辑,我们先看人类的起源,这个科学界未解之谜,圣经上是怎么说的(基于
汉语
圣经翻译的问题
英明Jimmy
·
2024-02-13 09:31
如何开发一个属于自己的人工智能语言大模型?
这可能包括清理文本、去除停用词、进行词干提取、
分词
等。选择模型结构:你需要选择一个适合处理文本数据的模型结构。一种常见的选择
super_journey
·
2024-02-13 06:40
人工智能
2022-03-23
自然语言处理实验演示-16.高级文本
分词
器除了基本的文本
分词
word_tokenize,NLTK还提供了更多的针对特定NLP任务的高级文本
分词
标记工具。
跨象乘云
·
2024-02-13 05:32
在游戏中开启诗意盎然的奇妙之旅吧
2017年,相信每个人的朋友圈都接受了《中国诗词大会》的刷屏洗礼,然后是《见字如面》、《朗读者》,传统
汉语
言文化如春风化雨般滋润快文化时代下的我们。相信每一个怀有诗词梦想的人都浸润其间、甘之如饴。
汝年年
·
2024-02-13 05:11
璐瑶妈妈的课程为什么被称为线上最强学区房?
我们是在一个小城市,因为受到身边人的影响“现在的中国越来越强,很多外国人都在学习
汉语
,我们不需要学英语了”,我竟然就真的没有给孩
花_开_半_夏_彤彤妈
·
2024-02-13 03:45
【ES】--ES集成热更新自定义词库(字典)
目录一、问题描述二、具体实施1、Tomcat实现远程扩展字典2、验证生效3、ES配置远程扩展字典4、为何不重启ES能实现热更新一、问题描述问题现象:前面完成了自定义
分词
器词库集成到ES中。
DreamBoy_W.W.Y
·
2024-02-13 01:52
大数据/智能
elasticsearch
【ES】--Elasticsearch的
分词
器深度研究
目录一、问题描述及分析二、analyze分析器原理三、multi-fields字段支持多场景搜索(如同时简繁体、拼音等)1、ts_match_analyzer配置
分词
2、ts_match_all_analyzer
DreamBoy_W.W.Y
·
2024-02-13 01:22
elasticsearch
【ES】--Elasticsearch的
分词
器详解
目录一、前言二、
分词
器原理1、常用
分词
器2、ik
分词
器模式3、指定索引的某个字段进行
分词
测试3.1、采用ts_match_analyzer进行
分词
3.2、采用standard_analyzer进行
分词
三
DreamBoy_W.W.Y
·
2024-02-13 01:52
大数据/智能
elasticsearch
【ES】--ES集成自定义
分词
库
目录一、相关安装1、(window单机)elasticsearch安装2、安装Elasticvue插件3、ik
分词
器插件4、ES集成自定义词库一、相关安装1、(window单机)elasticsearch
DreamBoy_W.W.Y
·
2024-02-13 01:50
大数据/智能
elasticsearch
读书:赵金铭《对外
汉语
教学概论》短评
我所读过的对外
汉语
教学概论性质的书,基本没一本是能让人读得心潮澎湃、拍案叫绝的。框架基本雷同,内容大同小异,板块联结性较弱,读起来很容易消磨人的兴趣。
饮冰听雨
·
2024-02-13 00:04
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他