E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
汉语分词
【python、nlp】文本预处理
文本预处理中包含的主要环节:文本处理的基本方法
分词
分词
就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字
岩塘
·
2024-01-12 09:52
python
自然语言处理
windows
TinyLlama-1.1B(小羊驼)模型开源-Github高星项目分享
项目地址:https://github.com/jzhang38/TinyLlama/特点采用了与Llama2完全相同的架构和
分词
器。这意味着TinyLlama可以在许多基于L
AI 研习所
·
2024-01-12 08:38
AIGC
AI
人工智能
AIGC
人工智能
windows安装Elasticsearch后使用ik
分词
器报错解决办法
最近在学习Elasticsearch,安装完成后下载了ik
分词
器压缩到plugins目录下启动es报错如下:java.security.AccessControlException:accessdenied
qqcoming
·
2024-01-12 07:44
elasticsearch
jenkins
大数据
从杜甫诗看七律句式特点06,秋水才深四五尺,野航恰受两三人
内容还是来自王力先生的《
汉语
诗律学》五言扩充最常见的位置是前2字,其次是分开插入第1、3字。不过今天的这种五言句式加2字,出自插入前2字,还分别插入第1、3、4字。
老街味道
·
2024-01-12 06:59
大语言模型参数微调过程(附完整代码)
1.配置参数model_args,data_args,train_args,finetuning_args,generating_args=get_train_args()2.加载
分词
tokenizertokenizer
抓个马尾女孩
·
2024-01-12 05:23
深度学习
语言模型
深度学习
来吧,一起感受下
汉语
的博大精深!
1【踬仆】zhi4pu1跌倒。2【醴】li3一种甜酒。《庄子·山木》:“君子之交淡如水,小人之交甘若醴。”3【牙蘖】ya2nie4植物刚长出的枝芽。嵇含《孤黍赋序》:“余慎终屋之南荣,有孤黍生焉,因泥之湿,遭雨之润,借昔牙蘖,滋茂甚速。”4【菡萏】han4dan4荷花。李璟《摊破浣溪沙》:“菡萏香销翠叶残,西风愁起绿波间。”5【飙尘】biao1chen2狂风吹起的尘土,比喻行至无常。《古诗十九首》
清水常天
·
2024-01-12 05:26
a、o、e的教学设计
3、认识和学习使用
汉语
拼音拼音四线格。重点难点:1、ɑoe的正确发音,o和e读音的比较。2、ɑoe的四声读法。课前准备:彩色挂图、ɑoe的四声卡片、画有四线格和描红笔顺的小黑板,学生各带小镜子一面。
风帆远行
·
2024-01-12 03:22
想学配音有什么途径?零基础如何自学声优?
假如想变成一个声优得话,你的普通话水平要通关,能说流利规范的
汉语
,语言表达能力要好。次之,讲话要有感情,还需要有高度注意力。最终,也是最重要的一项,有“心”。
配音新手圈
·
2024-01-12 02:03
日语入门学习,教你怎么正确的学习日语声调
与
汉语
的发音不同,日语发音比较单纯,只有高低音。在课本上也有详细的介绍发音的规则,但即
趣味学习知识
·
2024-01-11 23:42
汉字,世界上最美的文字,华夏文化的活化石
汉字是
汉语
书写用字,也被日、韩、越南等语言借用,是华夏文化圈广泛使用的一种文字,也是目前世界上仅有被广泛使用的表意文字。
华夏元素
·
2024-01-11 23:58
2022087【素·好课记】No.18张学伟《书戴嵩画牛》
老师通过提供现代
汉语
意思、做动作、出示图片让学生对照文言文找出相应句子,初步帮助学生理解课文意思。第二环节知人部分,先出示前两句,也就是集中写杜处士的句子,指导学生朗读,引导学生评价,再范读。
素小拙
·
2024-01-11 22:21
汉字里的秘密——“钱学森之问”的思索
本内容是根据《汉字里的秘密》系列讲座整理而来的,而讲座的主要内容来源于“
汉语
原创思维形态”研究课题。
尹红卿讲国学
·
2024-01-11 22:32
感悟汉字魅力 传承语言之美
本周日有幸聆听了来自洛阳师范学院的姚智清教授的讲座《
汉语
的魅力》,让我真切的感受到
汉语
这源自中华五千年文化的传承背后具有的魅力。汉字之美:形、音、义。语音之美:四声、平仄、叠音、谐音等。
伊河学校闫瑞
·
2024-01-11 20:47
学会这些高情商的聊天技巧,能让你在职场、为人处世上如鱼得水。
现代
汉语
辞典里对聊天的解释为:闲谈,即空闲时候说说话。但聊天也是有很多技巧的,要注意说话的方式和时机。接下来就为大家带来一些高情商
负越笔记
·
2024-01-11 18:46
blow off steam是吹气么?可不是,千万别让别人这样吹
尤其是要把气给撒出来不撒出来憋得慌,不痛快
汉语
里的生气生气不是也有个“气”在里面么?
驻下Kobe
·
2024-01-11 15:57
为什么海外孩子学中文应该先学汉字再学拼音?
这是
汉语
老师们经常会被问到这个问题。在这里,我就过去的教学经验来谈谈对这个问题的看法。(说明:以下观点并非100%绝对,只能说是针对多数海外华裔孩子而言,毕竟个体之间有差别,无法"放之四海而皆准"。
灵犀中文老师Amy
·
2024-01-11 15:24
2022-04-06
【练习时间】共30mins【Part1热身练习】口腔灵活度练习:1、口腔肌肉打开:3组2、口腔饱满度训练(鼓腮帮子):4组3、数葫芦:5组4、腹式呼吸:5组【Part2练习内容】元音/ɜː/练习感受:
汉语
d724fcff8757
·
2024-01-11 15:14
TikTok案例分享:
汉语
教学这个类目,真的值得做!
毫无疑问,先天的语言优势:
汉语
教学。今天就来和大家分享这一类目下的转化案例。
Ms想想
·
2024-01-11 14:07
高中语法专题(过去
分词
):过去
分词
作表语知识点综合讲解及习题专练(二)
3.过去
分词
作表语时与被动语态的区别:①“be+过去
分词
”表示状态时,是系表结构,此时
分词
通常已形容词化;②表示动作时,是被动语态,且绝大多数被动结构中的动作执行者由介词by引出。
初高中英语学习资料
·
2024-01-11 12:14
忙碌的一天
下午忙里抽闲,偷偷看了会儿对外
汉语
的考试内容,还给女儿报名了小儿口述日记训练营,寒假找点事情给她做做。不然,放假在家就是手机、电视看个不停
陈一回
·
2024-01-11 12:36
《猎捕关东一号》第四十六章 战地视察团
目录:《猎捕关东一号》目录上一章:下一章:两个鬼子的少佐,心里都有一种不祥的预感,他们也对这两个大佐和一个中佐感到奇怪,因为刚才对顾春华和金英男互相斗嘴,他们都听得很明白,他们都是懂
汉语
的。
张小贝_
·
2024-01-11 08:44
给孩子创造英语环境
和起跑线没啥太大关系,这是由生理特征决定的,所谓3-6岁的语言敏感期,这个年龄段孩子学习英语最快,事半功倍,是让孩子同时用
汉语
和英语去认识和描述世界,而不是把用
汉语
认识的
人工智娘
·
2024-01-11 08:02
词云可视化(摘录)
Python代码上手词云制作1号词云:《葛底斯堡演说》黑色背景词云(4行代码上手)美化词云2号词云:面朝大海,春暖花开(配置词云参数)常用参数从外部文件读入文本3号词云:乡村振兴战略中央文件(句子云)中文
分词
中文
分词
第三方模块
Sparky*
·
2024-01-11 08:34
廖雪峰爬虫笔记
ES7.9.3整合结巴
分词
插件
ES7.9.3安装centos7安装ES-CSDN博客1.下载elasticsearch-jieba-plugin下载地址:GitCode-开发者的代码家园我使用elasticsearch-jieba-plugin7.4.2整合7.9.3测试可以使用2.修改build.gradleversion='7.4.2'改为version='7.9.3'这个文件也改一下plugin-descriptor.p
hahaha 1hhh
·
2024-01-11 07:06
elasticsearch
jieba
中文
分词
、去停用词、发现新词
NLP涵盖的内容较多,
分词
是基础,特别是对中文来说。中文
分词
目前使用过snownlp、jieba,简单对比下,jieba的默认模识更好用,snownlp分的过细了。
废柴社
·
2024-01-11 06:06
解释文本向量化的原理
文本向量化的原理可以通过以下步骤解释:1.
分词
(Tokenization):将文本分割成单个单词或标记的过程。这可以通过简单地按空格或标点符号进行分割来实现。
andeyeluguo
·
2024-01-11 06:20
笔记
人工智能
centos下espeak文本转语音的代码实现
1、espeak简单的介绍espeak是一款能朗读文本的软件,其最主要的特色是即能读
汉语
又能英语,体积很小就2M左右,比较其他tts软件,如festival、ekho等,安装起来要简单的多,也容易上手,
在黎明的反思
·
2024-01-11 04:58
c++
tts
espeak
centos
日更挑战
上次跟一朋友两天,朋友事业有成,家庭美满,每年会到到处旅行,会跑步爱美食爱车爱生活,会英语
汉语
,最近在学日语,并且已经在考级,我随口说,你时时多刺激我下,我也得保持学习的状态,他说,这边方面,我觉得还是得靠自己的内容的自我驱动力
SuriXu
·
2024-01-11 03:25
面试宝典之ElasticSearch面试题
ES
分词
器通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
Long里小花荣
·
2024-01-11 01:23
面试
elasticsearch
职场和发展
Elasticsearch安装IK
分词
器踩坑记录
在安装ESik
分词
器参考如下博文进行安装时报后面的错误提示https://blog.csdn.net/ZHHX666/article/details/125953385错误提示:Causedby:java.nio.file.NoSuchFileException
道法自然 实事求是
·
2024-01-11 00:28
Elasticsearch
elasticsearch
大数据
搜索引擎
《谁暖半张床》第二章 赴宴6
两人起初都是在师范大学工作,一个在财经学院担任辅导员,一个在
汉语
言文学院教授中国古典文
四木公子1
·
2024-01-10 23:25
鄂教版九年级全册文言词类活用归类小结
古代
汉语
中的词类活用非常普遍,是古代
汉语
的重要语法特点之一。鄂教版教材中出现的主要是名词、动词、形容词的活用,归类如下表。图片发自App
彭丹0910
·
2024-01-10 20:57
记录2018 第十周周记
5日晚上,因为春节前一次主动分享产生的机缘,临时受邀去参加了一个权威的个人倾向和
汉语
能力测评。用了81分钟做了两套题,电脑打分之后,张老师给我做了大约10分钟的点评。水平真高!
张智坤878
·
2024-01-10 15:08
基于Python爬虫的B站弹幕可视化
2.弹幕文本清洗和
分词
:对抓取到的弹幕文本进行清洗和
分词
处理,去除停用词并生成
分词
列表。3.弹幕发送量分析:统计视频过程中每一秒的弹幕量,并以折线图
沐知全栈开发
·
2024-01-10 14:45
python
爬虫
开发语言
拼音单元教学定位要准确,目标要明确
《课程标准》明确提出:“
汉语
拼音学习的评价,重在考查学生认读和拼读的能力,以及借助
汉语
拼音认读汉字、说普通话、纠正地方音的情况。”由此可见,
汉语
拼音的目的是“运用”——借助
汉语
拼音识字和学习普通话。
我爱皎皎明月
·
2024-01-10 13:14
日志系统一(elasticsearch+filebeat+logstash+kibana)
目录一、es集群部署安装java环境部署es集群安装IK
分词
器插件二、filebeat安装(docker方式)三、logstash部署四、kibana部署背景:因业务需求需要将nginx、java、ingress
`Liar`
·
2024-01-10 11:25
elasticsearch
大数据
搜索引擎
Level3_Unit1_Part2_Listening(1-2)
主要用到的语法被动语态主语是动作承受者构成:Be+动词过去
分词
bedividedinto被分成Becauseoftheearthrotation,TheEarthisdividedintoseveraltimezones
欧洲尤格萨隆
·
2024-01-10 10:38
贝叶斯算法(新闻分类任务)
文章目录前言介绍一、新闻数据集处理二、文本
分词
(jibe
分词
器)三、去停用词停用词表是什么?
Avasla
·
2024-01-10 10:22
数据分析项目笔记
机器学习算法
自然语言处理
python
数据分析
诗歌创作技巧
汉语
言文学专业有一个文学创作的实践,我们是从3.25到5.9期间完成这个创作的初稿与定稿,期间还有专门指导老师的指导与修改。
嗨嗨海儿
·
2024-01-10 09:02
鲁西南方言杂谈-饥荒
“饥荒”是一个
汉语
词语,一般指庄稼歉收或没有收成,出自汉代贾谊《新书·无蓄》“世之有饥荒,天下之常也”。《
汉语
词典》给出五个意思解释,在鲁西南方言里,能用到的只有两个,剩下的用不到,本文就不做介绍。
一两茶叶
·
2024-01-10 07:26
【华为OD机试真题2023C&D卷 JAVA&JS】中文
分词
模拟器
华为OD2023(C&D卷)机试题库全覆盖,刷题指南点这里中文
分词
模拟器知识点图字符串时间限制:5s空间限制:256MB限定语言:不限题目描述:给定一个连续不包含空格字符串,该字符串仅包含英文小写字母及英文文标点符号
若博豆
·
2024-01-10 07:51
算法
java
华为od
javascript
高效阅读7.2打造适合自己的阅读书单
直接用
汉语
书写的书,比其它语言翻译过来的书要好理解。尽管翻译过来了,但外国人的用词习惯和中国人还是有区别,增加阅读难度。2.门类。不同种类的书阅读难度也会不同。
飞鸟绝千山
·
2024-01-10 05:58
如何提升一个人的文笔?
因为对于使用
汉语
的写手来说,几乎九成的毛病都在于前三点的使用不当。一,重点内容的前置:错误:“帮我把手术刀拿过来一下!”正确:“手术刀,拿过来一下给我!”
学趣联盟
·
2024-01-10 02:42
一周汇总2.17~2.23
单词和语法结构缺一不可,现在正在结合已知短语尝试用词造句(写),只有将单词连成一线,才会慢慢转化为自己的一部分,类似于
汉语
的用词造句。我相信,每天坚持输入和输出,会有效果的(说)!
橘柚染寒烟
·
2024-01-10 00:55
全世界都在讲普通话(二)
它是现代标准
汉语
的另一个称呼,是以北京语音为标准音,以北方官话为基础方言,以典范的现代白话文著作为语法规范的通用语。那推广普通话的意义何在呢?语言是最重要的交际工具和信息载体。
呐呐呐静
·
2024-01-09 23:03
学习《
汉语
诗律学》(8):可平仄两读的字在意思上有区别吗?
这段时间,通过学习《
汉语
诗律学》,终于对一字两读有了更深一步的了解。那么,这些可以平仄两读的字,在读平声和读仄声时,意思上到底有没有区别呢?回答是:因字而异。一般情况下,大致可分为以下两种
秋沼芰荷
·
2024-01-09 23:03
C# —— 多态
多态:同一个行为具有多个不同的表现形式,或形态的能力多态的特点:属于同一个接口,使用不同的实例而去执行不同的操作eg:说话的方法speak()但是不同的实例说的话不一样,例如中国人说
汉语
,日本人说日语eg
不爱敲代码的阿玲
·
2024-01-09 21:23
c#
开发语言
【236】感谢
感恩,《现代
汉语
词典》的解释:对别人所给的帮助表示感激,是对他人帮助的回报。百度百科中对感恩的解释:感恩是一种处世哲学,也是生活中的大智慧。一
幽幽白书0
·
2024-01-09 21:19
源自四姑娘山的美,东方圣山,户外天堂
二姑娘山和大姑娘山(请将手机横屏观看,从左到右排布幺妹峰、三姑娘山、二姑娘山和大姑娘山,高度分别为6250米、5355米、5276米、5025米;特别说明:四姑娘山的藏语原意并没有四个姑娘的含义,后来因
汉语
发音与四姑娘相似
川藏行
·
2024-01-09 19:27
为什么说二分无赖是扬州?
二、《忆扬州》意思古
汉语
家王曙解释:扬州的少女们娇美的脸上怎能藏住眼泪,她们可爱的眉梢上也挂不住一点忧愁。天下明月的光华有三分吧,无赖的扬州啊,你竟然占去了两分。三、为什么用无赖一词?诗人把扬州明月
梅溪沐雪客
·
2024-01-09 17:09
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他