E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
句子分词
《大模型应用开发极简入门》随记
人工智能(AI)大预言模型(LLM)机器学习(ML)深度学习(DL)内容LLM概述ML算法被称为人工神经网络DL是ML的一个分支最先开始简单语言模型吗,例如:n-gram模型(通过词频来根据前面的词预测
句子
里下一个词
hoypte
·
2025-02-19 08:34
人工智能
情感分析研究综述:方法演化与前沿挑战
文章目录摘要abstract1.引言2.模型方法2.1文本情感分析2.1.1文档级情感分类2.1.2
句子
级情感分类2.1.3方面级情感分类2.2文本情感分析方法2.2.1基于词典的方法2.2.2基于机器学习的方法
next_travel
·
2025-02-19 07:32
人工智能
机器学习
深度学习
Jieba
分词
算法应用
1.Jieba
分词
算法简介Jieba是一个用于中文
分词
的Python库,其核心思想是基于词典和统计模型来进行
分词
。由于中文文本中没有明显的单词边界,因此
分词
是中文处理中的一个重要任务。
C嘎嘎嵌入式开发
·
2025-02-18 17:03
算法
服务器
数据库
c++
linux
AI大模型应用开发实践:3.使用 tiktoken 计算 token 数量
使用tiktoken计算token数量tiktoken是OpenAI开发的一种BPE
分词
器。给定一段文本字符串(例如,"tiktokenisgreat!")
Hugo_Hoo
·
2025-02-18 03:41
AI大模型应用开发
人工智能
AI编程
agi
【Vim Masterclass 笔记13】第 7 章:Vim 核心操作之——文本对象与宏操作 + S07L28:Vim 文本对象
文章目录Section7:TextObjectsandMacrosS07L28TextObjects1文本对象的含义2操作文本对象的基本语法3操作光标所在的整个单词4删除光标所在的整个
句子
5操作光标所在的整个段落
安冬的码畜日常
·
2025-02-17 12:07
Vim
Masterclass
vim
笔记
vim文本对象
文本对象
Python:第三方库
pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文
分词
衍生星球
·
2025-02-16 20:00
python
第三方库
【科普】大模型应用中一个 Token 占多少汉字?答案超乎想象!
如腾讯1token≈1.8个汉字,通义千问、千帆大模型等1token=1个汉字,对于英文文本来说,1个token通常对应3至4个字母,不同的模型对相同的输入
分词
,
分词
结果是不一样的。
大模型.
·
2025-02-16 19:53
easyui
前端
人工智能
程序人生
语言模型
文心一言
自然语言处理
算法练习|Leetcode49字母异位词
分词
,Leetcode128最长连续序列,Leetcode3无重复字符的最长子串,sql总结
目录一、Leetcode49字母异位词
分词
题目描述解题思路方法:哈希总结二、Leetcode128最长连续序列题目描述解题思路方法:总结三、Leetcode3无重复字符的最长子串题目描述解题思路方法:双指针法总结
ambitious_Rgr
·
2025-02-16 16:05
算法
sql
哈希
哈希算法
数据结构
leetcode
python
微服务es搜索关键词,实现关键词高亮,来自黑马头条的总结
数据库中查询实现的效果,要求从标题和内容中搜索关键词,然后让关键词高亮步骤ElasticSearch环境搭建索引库创建文章搜索多条件复合查询索引数据同步ElasticSearch环境搭建这些都是死步骤,直接cvik
分词
器下载地址
菜鸡且互啄69
·
2025-02-16 15:26
elasticsearch
大数据
搜索引擎
java
golang使用redis实现全文搜索
简介使用redis实现全部文章精确到段落的搜索实现思路文章分段,使用一张表单独记录下段落信息段落
分词
,把段落划分成词
分词
后使用有序集合记录到redis中,每个词语后记录含有该
分词
的段落ID集使用一个哈希键记录下每个段落的
分词
千年死缓
·
2025-02-16 07:52
golang
redis
开发语言
清影2.0(AI视频生成)技术浅析(二):自然语言处理
2.上下文关联:捕捉文本中词语之间、
句子
之间
爱研究的小牛
·
2025-02-15 11:22
AIGC—视频
AIGC—自然语言处理
自然语言处理
人工智能
音视频
AIGC
深度学习
机器学习
【Elasticsearch】文本分析Text analysis概述
分析通过
分词
实现全文搜索:将文本分解成更小的单元,称为词
risc123456
·
2025-02-14 10:05
Elasticsearch
elasticsearch
【Elasticsearch】token filter
分词
过滤器
以下是Elasticsearch中常见的
分词
过滤器(TokenFilter)的详细说明,基于搜索结果中的信息整理:1.Apostrophe•功能:处理文本中的撇号(apostrophe),例如将“O'Reilly
risc123456
·
2025-02-14 06:40
Elasticsearch
elasticsearch
【Elasticsearch】字符过滤器Character Filters
在Elasticsearch中,字符过滤器(CharacterFilters)是文本分析器的重要组成部分,用于在
分词
之前对原始文本进行预处理。它们可以对字符流进行转换,例如添加、删除或更改字符。
risc123456
·
2025-02-14 06:40
Elasticsearch
elasticsearch
【Elasticsearch】
分词
器概述
Elasticsearch
分词
与神经网络
分词
的区别Elasticsearch的
分词
过程产生的是优化用于搜索和检索的语言学
分词
。这与机器学习和自然语言处理中的神经
分词
不同。
risc123456
·
2025-02-13 22:28
Elasticsearch
elasticsearch
Python NLP 自然语言处理
PythonNLP自然语言处理"""基于https://github.com/isnowfy/snownlp$pipinstallsnownlp"""fromsnownlpimportSnowNLP#
分词
简简单单OnlineZuozuo
·
2025-02-13 09:19
m1
Python
领域
python
自然语言处理
开发语言
人工智能大模型原理与应用实战:自动文摘系统的设计与实现
一般来说,自动摘要分为
句子
级摘要和段落级摘要两种类型。前者针对较短的文章进行摘要,后者针对较长的文章进行摘要。然而,文章摘要的效果始终受到文章所处的上下文
AI天才研究院
·
2025-02-13 03:06
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
Java
Python
架构设计
大语言模型常见任务及评测数据集汇总(一):70 余个数据集!
LCQMC:哈尔滨工业大学发布的数据集,主要用于中文
句子
匹配任务,也常用于文本分类。BQCorpus:同样用于中文
句子
匹配,也可用于文本分类。
大F的智能小课
·
2025-02-13 00:12
大模型实战
人工智能
四、自然语言处理_08Transformer翻译任务案例
作为NLP领域的扛把子,对于此类任务的处理会更为强大,下面将以基于Transformer模型来重新处理此任务,看看效果如何1、需求概述现有一个《data.txt》文件,里面存放了很多组翻译对(即:英文
句子
学不会lostfound
·
2025-02-12 08:53
AI
自然语言处理
人工智能
深度学习
transformer
encode-decode
2024年印象深刻的AI写作API接口介绍
其中,一些知名的API服务如Komprehend意图分析api、Komprehend讽刺检测、Komprehend命名实体识别、CAPIXAI书名生成、CAPIXAI
句子
缩短、CAPIXAI
句子
扩展、Komprehend
·
2025-02-11 20:07
程序员后端
LTP/pyltp安装和使用教程
文章目录LTP介绍分句
分词
加载外部词典个性化
分词
词性标注命名实体识别NER依存句法分析语义角色标注LTP介绍官网:https://ltp.ai/下载可以到官网的下载专区:https://ltp.ai/download.html
Cachel wood
·
2025-02-11 19:16
自然语言处理nlp
easyui
前端
javascript
pyltp
ltp
人工智能
nlp
docker pgsql实现pg_jieba全文检索
安装pg_jieba
分词
器安装依赖工具查看docker运行的所有容器dockerps进入pg数据库容器dockerexec-itpostgres4postgisbash安装必要的工具和依赖apt-getinstall-ygitbuild-essentialcmakelibpq-devpostgresql-server-dev-all
敏捷利齐
·
2025-02-11 13:05
SQL
docker
全文检索
容器
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
大模型推理引擎的基本工作模式可以概括为,接收包括输入prompt和采样参数的并发请求,
分词
并且组装成batch输入给引擎,调度GPU执行前向推理,处理计算结果并转为词元返回给用户。
·
2025-02-11 11:44
百度云大模型gpu
jieba库的使用
中文文本需要
分词
获得单个的词语
分词
依靠中文词库,确定汉字之间的关联概率除了
分词
,用户还可以添加自定义的词组;精确模式:把文本精确分开,不存在冗余模式全模式:把文本中所有可能的词语都扫描出来,有冗余搜索引擎模式
è¤è²çåºå
·
2025-02-11 04:52
Python相关知识
python --jieba
分词
jieba库是什么jieba库中文
分词
第三方库,中文文本需要通过
分词
获得单个的词语。
好好学习的顾顾
·
2025-02-10 14:38
python
二级备考
python
LLM 中的 vocabulary 和 embedding vector
这个过程通常分为两个步骤:
分词
(Tokenization)将输入的自然语言文本按照某种规则分割成一系列的token,可以是单词、子词或者字符等。
Overman..
·
2025-02-10 04:33
LLM
embedding
人工智能
LLM
大模型
NLP_[2]-认识文本预处理
1文本预处理及其作用2.文本预处理中包含的主要环节2.1文本处理的基本方法2.2文本张量表示方法2.3文本语料的数据分析2.4文本特征处理2.5数据增强方法2.6重要说明2文本处理的基本方法1.什么是
分词
闵少搞AI
·
2025-02-10 03:57
NLP
自然语言处理
人工智能
想做 Python 聊天机器人,有什么好用的中文
分词
、数据挖掘、AI方面的 Python 库或者开源项目推荐
想做Python聊天机器人,有什么好用的中文
分词
、数据挖掘、AI方面的Python库或者开源项目推荐?在当今数字化时代,聊天机器人已经成为了连接人与机器的重要桥梁。
xiamu_CDA
·
2025-02-09 20:01
人工智能
python
机器人
CNN-day11-注意力机制
通过注意力机制,模型可以做到对图像中不同区域、
句子
中的不同部分给予不同的权重,从而增强感兴趣特征,并抑制不感兴趣区域。2注意力应用注意力机制最初应用于机器翻
谢眠
·
2025-02-09 19:26
深度学习
cnn
深度学习
人工智能
c/c++蓝桥杯经典编程题100道(6)字符串反转
例题问题描述C语言实现解法1:双指针交换法(难度★)解法2:递归反转(难度★★)解法3:使用临时数组(难度★☆)C++实现解法1:使用reverse函数(难度★)解法2:用栈反转(难度★☆)解法3:反转
句子
中的单词
tamak
·
2025-02-09 07:59
c语言
c++
蓝桥杯
算法
Python + Tkinter + pyttsx3实现的桌面版英语学习工具
Python+Tkinter+pyttsx3实现的桌面版英语学习工具在多行文本框输入英文
句子
,双击其中的英文单词,给出英文读音和中文含义和音标。本程序查询本地词典数据。
学习&实践爱好者
·
2025-02-09 06:21
Python学习
编程实践系列
python
开发语言
PTA:字符串 藏尾诗
每句一行,但
句子
不一定是等长的,最短一个汉字,最长九个汉字。注意:一个汉字占三个字节。输出格式:取出每句的最后一个汉字并连接在一起形成一个字符串并输出。同时在末尾输入一个换行符。
悦悦子a啊
·
2025-02-08 22:26
C语言PTA习题
算法
c++
开发语言
20.言语理解与表达-语句排序题-确定捆绑
确定捆绑确定捆绑是指找出必须放在一起的
句子
组合。
上岸学堂
·
2025-02-08 10:58
行测百日上岸计划
行测小白到上岸
-
言语理解与表达
人工智能
经验分享
python
java
算法
Lucene搜索引擎原理与代码实例讲解
Lucene搜索引擎原理与代码实例讲解关键词:搜索引擎,全文检索,倒排索引,查询优化,索引构建,
分词
,评分器1.背景介绍1.1问题由来在信息爆炸的互联网时代,如何高效地管理和搜索信息成为了一个严峻的挑战
杭州大厂Java程序媛
·
2025-02-08 04:41
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
ElasticSearch IK热词自动热更新原理与Golang实现
热更新概述ik
分词
器本身可以从配置文件加载扩张词库,也可以从远程HTTP服务器加载。从本地加载,则需要重启ES生效,影响比较大。所以,一般我们都会把词库放在远程服务器上。
Go和分布式IM
·
2025-02-07 20:22
Golang学习和进阶
后端开发
elasticsearch
ik热词更新
ik分词器
docker安装es及
分词
器ik
系统是macos,docker是docker-desktop拉取镜像dockerpullbitnami/elasticsearch启动docker镜像dockercreate-e"discovery.type=single-node"\--nameelasticsearch1-p9200:9200-p9300:9300\bitnami/elasticsearch:8.17.1测试是否好使http:
陈墨1234
·
2025-02-07 20:21
docker
elasticsearch
容器
优美文章翻译《Technology and Its Impact on Society》
以下是对文章《TechnologyandItsImpactonSociety》的
句子
结构分析和翻译:
句子
结构分析与翻译Inthecontemporaryworld,technologyhasbecomeanintegralpartofourdailylives
你一身傲骨怎能输
·
2025-02-07 12:25
英语
优秀英文文章翻译
优美十级英文
句子
深入翻译
下面是对
句子
“Inthecontemporaryworld,technologyhasbecomeanintegralpartofourdailylives,influencingvariousaspectsofsociety
你一身傲骨怎能输
·
2025-02-07 12:25
英语
句子分析
产品经理的人工智能课 02 - 自然语言处理
产品经理的人工智能课02-自然语言处理1自然语言处理是什么2一个NLP算法的例子——n-gram模型3预处理与重要概念3.1
分词
Token3.2词向量化表示与Word2Vec4与大语言模型的交互过程参考链接大语言模型
平头某
·
2025-02-07 05:12
人工智能
产品经理
自然语言处理
【大模型LLM面试合集】训练数据_数据格式
对于大语言模型的训练中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个
句子
或者一个段落。
X.AI666
·
2025-02-06 18:28
人工智能
big
data
大模型面试必看!超详细面经指南+答案,轻松拿Offer!2025大模型上岸就靠它了!
[x]大模型(LLMs)进阶面[x]1.llama输入
句子
长度理论上可以无限长吗?[x]1.什么是LLMs复读机问题?[x]2.为什么会出现LLMs复读机问题?[x]3.如何缓解LLMs复读机问题?
AI大模型-大飞
·
2025-02-06 16:47
大模型
AI大模型
大模型教程
人工智能
学习
LLM
Deepseek
【Elasticsearch】学习笔记-p2(索引库操作&文档操作)
1.1mapping映射属性mapping是对索引库中文档的约束,常见的mapping属性包括:type:字段数据类型,常见的简单类型有:字符串:text(可
分词
的文本)、keyword(精确值,例如:
2401_84010836
·
2025-02-06 15:37
程序员
elasticsearch
学习
笔记
.Net / C# 繁体中文 与 简体中文 互相转换, 支持地方特色词汇
还支持日文的新旧转换.OpenCC在.Net中的实现https://github.com/CosineG/OpenCC.NET代码.Net8这里只举例繁体转简体,其他的类似usingOpenCCNET;//初始化字典和
分词
xxxxxue
·
2025-02-06 08:54
C#
.net
c#
繁体中文
繁体
简体
简体中文
日文
Elasticsearch 对于
分词
position 的巧妙设计(qbit)
{"match_phrase":{"name.text":{"query":"sanli"}}}以下测试均使用ES内置的simple
分词
器试验过程直接查看
分词
结果GET_analyze{"analyzer
·
2025-02-05 17:04
洛谷B2122 单词翻转
给出小明同学写的一个
句子
,请你将所有的单词复原。输入格式共一行,一个字符串表示
句子
,单词之间以空格分隔。输出格式每个单词一行。思路一个一个输入字符串,让它们翻转输出即可。
tazuh
·
2025-02-05 11:44
c++
算法
开发语言
B2122 单词翻转
给出小明同学写的一个
句子
,请你将所有的单词复原。输入格式共一行,一个字符串表示
句子
,单词之间以空格分隔。输出格式每个单词一行。
天秀信奥编程培训
·
2025-02-05 11:12
洛谷网站题解
字符串入门
c++
C/C++题目字符数组-单词翻转
描述:输入一个
句子
(一行),将
句子
中的每一个单词翻转后输出。输入只有一行,为一个字符串,不超过500500个字符。单词之间以空格隔开。输出翻转每一个单词后的字符串,单词之间的空格需与原文一致。
Zhang_Charls
·
2025-02-05 11:42
c++
字符串
c算法
OpenAI Sora 入门教程第二章:Sora 的文本到视频转换原理
语法分析:分析
句子
的语法结构,理解逻辑关
山海青风
·
2025-02-05 04:23
人工智能
人工智能
prompt
python
关于搜索需求,搜索架构的一切
一、搜索引擎的原理,架构与细节文章:《搜索引擎的原理,架构与细节》内容:全网搜索引擎的架构与流程站内搜索引起的架构与流程搜索引擎原理与核心数据结构:正排,倒排,
分词
,拉链
架构师之路_
·
2025-02-05 02:39
毕设 基于python的搜索引擎设计与实现
文章目录0简介1课题简介2系统设计实现2.1总体设计2.2搜索关键流程2.3推荐算法2.4数据流的实现3实现细节3.1系统架构3.2爬取大量网页数据3.3中文
分词
3.4相关度排序第1个排名算法:根据单词位置进行评分的函数第
A毕设分享家
·
2025-02-04 12:29
python
毕业设计
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他