E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
文本处理三剑客
Pandas进阶:
文本处理
引言文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。文本的操作主要是通过访问器str来实现的,功能十分强大,但使用前需要注意以下几点。访问器只能对Series数据结构使用。除了常规列变量df.col以外,也可以对索引类型df.Index和df.columns使用确保访问的对象类型是字符串str类型。如果不是需要先astype(str)转
金戈鐡馬
·
2023-12-03 18:44
Python
pandas
python
数据分析
文本
三剑客
之awk
shell:/bin/bash正则表达式:匹配文章中的字符通配符:匹配的是文件名{?任意单个字符}元字符:不表示本来的含义,在正则表达式中有特殊含义的字符正则表达式:(易写难读)元字符的使用正则表达式代表字符.代表单个任意字符[]单个字符[abc]显示a或b或c表示次数*零次或无数次代表前面的字符出现.*代表任意字符(不包括0次)/?代表0或1次,可有可无的/+代表1次到正无穷次\{3\}代表前面
kiritoCVB
·
2023-12-03 11:59
运维
文本
三剑客
之sed
目录sed和awk的区别:一.sed语法&选项1.语法①基本语法,类似cat②sed选项'自身脚本语法'操作2.选项①命令的选项②sed自身脚本语法中的命令选项3.用法举例①例:查找几点几分到几点几分之间的日志(/pat1/,/pat2/)②例:修改文件内容二.搜索替代1.普通用法(地址)s/旧字符/新字符/修饰符,修饰符:2.分组后项引用举例讲解①基本用法②高阶用法筛选(.*)sed和awk的区
kiritoCVB
·
2023-12-03 11:59
linux
运维
服务器
boost I 字符串与
文本处理
目录一、lexical_cast与C语言、C++的对比二、format1.format类2.格式化语法三、string_ref1.背景2.boost::string_ref3.remove_prefix()和remove_suffix()四、string_algo1.大小写转换2.字符串判断a.函数b.函数对象3.分类函数4.修剪5.查找6.替换与删除7.分割8.合并9.查找分割迭代器五、xpre
烫青菜
·
2023-12-02 18:59
boost
boost
Java的正则表达式
正则表达式是一种强大而灵活的
文本处理
工具。使用正则表达式,能够以编程的方式,构造复杂的文本模式,并对输入的字符串进行搜索。一旦找到了匹配这些模式的部分,就能够随心所欲地对它们进行处理。
hzulwy
·
2023-12-02 14:41
java
正则表达式
Java——正则表达式
很多人因为它们看上去比较古怪而且复杂所以不敢去使用,不过,经过练习后,就觉得这些复杂的表达式写起来还是相当简单的,而且,一旦你弄懂它们,你就能把数小时辛苦而且易错的
文本处理
工作缩短在几分钟(甚至几秒钟)
静惘
·
2023-12-02 14:38
Java
java
正则表达式
python
Cpp之旅(学习笔记)第10章 字符串和正则表达式
Cpp之旅(学习笔记)第10章字符串和正则表达式10.1引言Cpp标准库提供了string类型,使用程序员不必在使用C风格的
文本处理
方式——通过指针来处理字符数组。
霜晨月c
·
2023-12-02 04:58
C++之旅
学习
笔记
正则表达式
c++
python自学之《21天学通Python》(10)——正则表达式
正则表达式主要用于处理文本,正则表达式能够使
文本处理
简单起来,尤其对于复杂的查找替换这样的工作,使用正则表达式会非常快的完成。流行的文本编辑器(如Emacs、Vim等)大都支
病树前头
·
2023-12-02 03:09
Python自学
正则表达式
python
unix
LangChain的函数,工具和代理(二):LangChain的表达式语言(LCEL)
LangChainExpressionLanguage(LCEL)是LangChain工具包的重要补充,旨在提高
文本处理
任务的效率和灵活性。
-派神-
·
2023-12-02 01:21
ChatGPT
Langchain
langchain
chatgpt
人工智能
语言模型
SHELL编程前奏_小工具
本节课程目标了解shell中的通配符熟悉grep、cut、sort等小工具和shell中的通配符的使用#一、
文本处理
工具##1.
师范大学通信大怨总
·
2023-12-02 00:35
linux
数据库
windows
生信小白开始接活——
文本处理
(二)
上篇处理了最简单的单细胞公共数据,即1个样本对应1个矩阵文件(tsv),读取统计就行了,但是GEO公共数据库中还存在如下的情况:例如GSE178318,15个样本的信息全部混在一块了,针对这种情况,我们怎么统计指定样本的线粒体基因分布,中值基因,中值UMI这些指标,逻辑就是拆分样本,如何拆分,下面会娓娓道来~~~1.png打开GEO界面,红框处6个样本的数据需要统计:2.png15个样本的数据见下
璇而微珏
·
2023-12-01 16:59
朋友小聚
不想早早去单位,于是在“
三剑客
”群里约了好久不见的CGQ和CLJ两位好友小聚。
陌路将至
·
2023-12-01 13:10
正则表达式及文本
三剑客
grep sed awk
正则表达式1.元字符.//匹配任意单个字符,可以是个汉字[yang]//匹配范围内的任意单个字符[^y]//匹配处理指定范围外的任意单个字符[:alnum:]//字母和数字[:alpha:]//代表任何英文大小写字符[:lower:]//小写字母[:upper:]//大写字母[:blank:]//空白字符[:space:]//包括空格、制表符[:cntrl:]//不可打印的控制字符2.表示次数*/
Ybaocheng
·
2023-12-01 07:42
正则表达式
linux
运维
漫谈语义(文本)匹配
1、背景自然语言处理是人工智能领域的重要分支,以
文本处理
智能化为任务导向正在驱动学术界和工业界对其进行更为深入的探索,而语义匹配(文本匹配任务)就是自然语言处理中最为典型的任务。
二范数智能
·
2023-12-01 07:11
知识图谱
人工智能
nlp
python
文本
三剑客
目录grepawk工具介绍awk命令awk常见的内置变量可直接用awk命令使用举例打印磁盘已经使用情况打印字符串打印字符串确定文件有多少行提取ip地址打印/etc/passwd所有用户名打印多列内容提取/etc/passwd以root开头的行打印倒数第二行当前处理的行的行号NR==n代表行号,取第几行NR%2==0取偶数行;NR%2==1取奇数行NR==m,NR==n取m到n区间行取uid数值范围
ZYTDZDXL
·
2023-12-01 05:38
服务器
运维
linux
三剑客
-grep
grep–查找显示文件中匹配的行,过滤字符串信息,对大小写敏感参数:-E,-i,-v,-w,^,$,-n,-cgrepadm/etc/passwdgrep-cadm/etc/passwd-E表示或,grep-E‘root|daemon’/etc/passwd-i忽略大小写,和E一起应用,查日志时一起用,grep-iE‘exception|error’error.log动态过滤查看日志:tail-f
测试开发笔记
·
2023-12-01 04:37
shell
linux
运维
服务器
文本
三剑客
之grep
目录grep正则表达式代表字符位置锚定示例:查找网卡位置分组grep所在位置:shell:/bin/bashgrep的作用主要用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查,打印匹配到的行。模式:由正则表达式的元字符及文本字符所编写出的过滤条件正则表达式:匹配的是文章中的字符通配符:匹配的是文件名?任意单个字符元字符:不表示本来的含义,在正则表达式中有特殊含义的字符
bob_gem
·
2023-12-01 03:35
mysql
服务器
数据库
文本
三剑客
之awk
目录awk选项表达式(program):处理动作:awk内置变量awk内置命令习题示例:面试题:vim
文本处理
工具awkawk是一个强大的linux命令,有强大的文本格式化的能力,好比将一些文本数据格式化成专业的
bob_gem
·
2023-12-01 03:35
运维
linux
文本
三剑客
之sed
sed也可以在无交互的情况下实现相当复杂的
文本处理
操作,被广泛应用于Shell脚本中,用以完成各种自动化处理任务。sed
bob_gem
·
2023-12-01 03:35
linux
Docker
三剑客
之docker-machine(自动化部署docker)
一、docker-machine是什么?什么是docker-machine,简单来说就是快速创建一个docker容器环境的,在多台阿里云ECS安装上docker,可以使用相关的命令同时给多主机上安装docker软件不需要用传统的方式一台台的安装还有就是你要在本地快读创建docker集群环境,我总不能一台一台创建虚拟机吧,所以docker-machine可以解决这个问题。docker-machine
裁二尺秋风
·
2023-11-30 19:18
文本
三剑客
之sed
一、sed编辑器■sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的—组规则来编辑数据流■sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中1、sed的工作流程主要包括读取、执行和显示三个过程:读取:sed从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,patternspace)执行:默认情况下
沈阳最速传说と疾走の猛虎!贵物刀一郎です
·
2023-11-30 16:18
linux
从零构建属于自己的GPT系列1:文本数据预处理、文本数据tokenizer、逐行代码解读
中进行本篇文章配套的代码资源已经上传从零构建属于自己的GPT系列1:文本数据预处理从零构建属于自己的GPT系列2:语言模型训练0任务基本流程拿到txt文本数据,本文以15本金庸小说为例CpmTokenizer预训练模型将所有
文本处理
成
机器学习杨卓越
·
2023-11-30 13:50
Hugging
Face实战
gpt
chatgpt
语言模型
nlp
小白学习Java第二十三天<进入Javaweb>
网页内容包含:HTML代码、CSS代码、JavaScript代码等内容,俗称网页
三剑客
。
sjxxxx_
·
2023-11-30 11:37
Java小白
javascript
前端
开发语言
语言模型
文本处理
基石:Tokenizer简明概述
编者按:近年来,人工智能技术飞速发展,尤其是大型语言模型的问世,让AI写作、聊天等能力有了质的飞跃。如何更好地理解和利用这些生成式AI,成为许多开发者和用户关心的问题。今天,我们推出的这篇文章有助于读者深入了解大语言模型的工作原理。作者指出,大语言模型的核心在于将文本转化为数字表征,这就需要介绍tokenizer的概念。通过tokenizer,文本被分词并映射为tokenid,这为模型理解文本提供
Baihai IDP
·
2023-11-30 07:24
技术干货
语言模型
人工智能
自然语言处理
白海科技
深度学习
AI
TinyMce富
文本处理
器 在Vue3 vue-vite中使用(小白避坑 必看)
我是觉得吧tinymce这个富文本编辑器是最好用用起来可以说是非常丝滑、简单易懂经典模式|TinyMCE中文文档中文手册(ax-z.cn)首先安装依赖:这里先声明一下:TinyMce在4.0以后就不支持Vue2.0了,所以我们需要固定版本,或者降低版本!否则会报错vue3的下载命令如下$npminstall@tinymce/tinymce-vue-S$npminstalltinymce-Svue2
蓝斑.json
·
2023-11-30 05:46
vue
vue配置
view
vue.js
前端
node.js
html
Linux
文本处理
工具awk用法总结
awk是一种
文本处理
工具,它逐行读取输入文本,根据用户提供的模式匹配特定的行,然后执行对应的动作来处理匹配到的行。
滨海新世界
·
2023-11-30 00:54
linux
Python3基础(十二) 学习总结·附PDF
Python是一门强大的解释型、面向对象的高级程序设计语言,它优雅、简单、可移植、易扩展,可用于桌面应用、系统编程、数据库编程、网络编程、web开发、图像处理、人工智能、数学应用、
文本处理
等等。
神奕
·
2023-11-29 18:04
Lang.
-
Python
Python学习之旅
python
学习总结
基础教程
精通正则表达式笔记一---正则表达式基础概念[ ],[^ ],.,^,$,\<,\>,|,(),-
在进行详细的和复杂的
文本处理
时,保持精确性是很重要的。差一、二个空格字符,可能导致截然不同的结果。举一个例子,处理某些E
xjfhz
·
2023-11-29 18:13
正则表达式
学习
java
shell脚本之awk
1.awk基本介绍AWK是一种处理文本文件的语言,是一个强大的文本分析工具(awk
文本处理
工具,可以加载一行,处理一行)可以在无交互的模式下实现复杂的文本操作。
lelelele798
·
2023-11-29 18:08
linux
Java学习笔记 --- 正则表达式
体验正则表达式packagecom.javase.regexp;importjava.util.regex.Matcher;importjava.util.regex.Pattern;/***体验正则表达式,给
文本处理
带来哪些便利
乌云不要说话
·
2023-11-29 18:03
Java基础
学习
java
正则表达式
正则表达式及文本
三剑客
grep,awk,sed
目录正则表达式前瞻代表字符表示次数位置锚定分组或其他grep选项范例awk前瞻awk常见的内置变量范例sed前瞻sed格式范例搜索替代格式范例分组后项引用格式范例正则表达式前瞻通配符:匹配的是文件名正则表达式:匹配的是文章中的字符元字符:不代表本来的含义,在正则表达式中有特殊含义的字符正则表达式的表现代表字符表示次数位置锚定分组或其他代表字符.匹配任意单个字符,可以是一个汉字[]匹配指定范围内的任
GnaW1nT
·
2023-11-29 18:32
正则表达式
Python文件操作及
文本处理
一.
文本处理
引入文本程序运行过程中产生的数据最先都是存放在内存中的若想永久保存下来必要存放在硬盘中,应用程序若想操作硬件必需通过操作系统文件就是操作系统提供给应用程序来操作硬盘的虚拟概念用户或应用程序对文件的操作
老登,快爆金币
·
2023-11-29 16:08
python
[Linux ] sed
文本处理
和免交互
sed是一个非交互式的
文本处理
工具,它按行逐步处理输入流的数据。1.2基本用法格式:sed[选项]'语法'[标准输入]sed选项选项含义-n关闭自动打印-i实际修改文本的内容-r显示扩展正则
你请叫我Ikun
·
2023-11-29 14:19
Linux
linux
运维
服务器
ce从初阶到大牛--shell篇
awk:一个强大的
文本处理
工具,也可用于数学运算。二、定义变量url=https://
凌晨五点的星
·
2023-11-29 10:46
ce从初阶到大牛
chrome
前端
Encoder-Decoder 框架
下图是
文本处理
领域里常用的Encoder-Decoder框架最抽象的一种表示。
宠乖仪
·
2023-11-29 09:16
自然语言处理
工业以太网
三剑客
之——EtherNet/IP
1、什么是EtherNet/IP?EtherNet/IP是通用工业协议(CIP)的名称,通过标准实现以太网(IEEE802.3和TCP/IP协议套件)。EtherNet/IP于2001年推出,如今已成为最成熟、最成熟、最完整的工业协议EtherNet/IP是以下家族的成员在其上层实施CIP的网络(图1)。EtherNet/IP和CIP由ODVA管理。ODVA发布EtherNet/IP™规范并帮助通
Pou光明
·
2023-11-29 08:21
tcp/ip
网络协议
网络
【shell】文本
三剑客
之sed详解
目录一、sed简介(行编辑器)二、基本用法三、sed脚本格式(匹配地址脚本命令)1、不给地址,那么就是针对全文处理2、单地址,表示#,指定的行,$表示最后一行,/pattter/:表示该模式能匹配到的每一行,正则表达式3、地址范围:#,#从第几行到第几行#,+#从第几行开始,往后加4行/patter1/,/patter2/表示从第一个开始找,到第二个结束4、步进:~1~2:表示奇数行2~2:表示偶
liu_xueyin
·
2023-11-29 06:55
linux
运维
服务器
bash
数据库
一键删除多余内容,批量处理HTML文本,轻松省时!
现在,我们为您带来了一款全新的HTML
文本处理
工具,它可以轻松解决您的问题!首先,在首助编辑高手的主页面板块栏里,选择“文本批量处理”板块。
hlyling
·
2023-11-28 15:54
python
tornado
flask
fastapi
pyqt
numpy
linux正则表达式测试器,Shell学习篇:正则表达式和
文本处理
工具
原标题:Shell学习篇:正则表达式和
文本处理
工具一什么是正则正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。
张近微
·
2023-11-28 13:32
linux正则表达式测试器
linux正则表达式及
文本处理
三剑客
grep、sed、awk
目录Linux正则表达式Linux
文本处理
三剑客
之grepLinux
文本处理
三剑客
之sedLinux
文本处理
三剑客
之awkLinux正则表达式Linux核心通配符:*:匹配任意长度的任意字符?
别掉头发啦
·
2023-11-28 13:01
Linux
正则表达式
linux
运维
文本
三剑客
之正则表达式
前言Linux命令中,可以使用通配符替代或者识别某一些文件名,通常用于模糊查询的场景正则表达式与通配符类似,但是匹配的准确度比通配符更高正则表达式组成:普通字符:大小写字母、数字、标点符号及一些其他符号元字符:在正在表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符或表达式)在目标对象中的出现模式一、基础正则表达式常见元字符(支持的工具:grep、egrep、sed、a
chiu莓
·
2023-11-28 13:25
shell
云计算
正则表达式
正则表达式 通配符 awk
文本处理
工具
目录什么是正则表达式概念正则表达式的结构正则表达式的组成元字符元字符点(.)代表字符.点值表示点需要转义\r..t代表r到t之间任意两个字符过滤出小写过滤出非小写space空格[[:space:]]表示次数位置锚定例:分组或扩展表示邮箱表示手机号AWk格式选项表达式处理动作例:awk常见的内置变量拓展awk数组计算(默认使用关联数组)什么是正则表达式概念正则表达式(RegularExpressio
思华年^O^
·
2023-11-28 13:53
正则表达式
文本
三剑客
之grep
grep基本介绍grep命令是Linux系统中最重要的命令之一,功能是从文本文件或管道数据流中筛选匹配的行和数据,如果再配合正则表达式,功能十分强大,是Linux运维人员必备的命令。模式:由正则表达式的元字符及文本字符所编写出的过滤条件grep命令里的匹配模式就是你想要找的东西,可以是普通的文字符号,也可以是正则表达式grep[选项]…查找条件目标文件选项含义-v排除匹配结果,取反-n显示匹配的行
沈阳最速传说と疾走の猛虎!贵物刀一郎です
·
2023-11-28 12:16
linux
文本
三剑客
之AWK
awk原理是一种
文本处理
工具加载一行处理一行awk命令格式:1.awk[选项]'表达式{处理动作}'文件1文件2……满足表达式就处理,不满足表达式就不处理2.awk-f脚本文件文件1文件2……awk选项
沈阳最速传说と疾走の猛虎!贵物刀一郎です
·
2023-11-28 12:45
linux
运维
服务器
Grafana集成LDAP认证
Grafana、Prometheus外加各类的Exporter目前已经成了监控领域的
三剑客
。
aneirin
·
2023-11-28 09:51
Shell 之正则表达式与文件处理器--正则表达式中的
三剑客
(grep、sed、awk)
Shell之正则表达式与文件处理器--正则表达式中的
三剑客
(grep、sed、awk)一、正则表达式1.1、定义1.2、用途1.3、构成二、基础正则表达式2.1、基础正则表达式常见元字符:(支持工具:grep
这小子贼帅
·
2023-11-28 02:40
shell脚本攻略
shell
正则表达式
文本
三剑客
之grep和正则表达式
一、grepgrep[选项]…查找条件目标文件选项:-m#匹配#次后停止//grep-m1root/etc/passwd#多个匹配只取第一个-v显示不被pattern匹配到的行,即取反//grep-Ev'^[[:space:]]*#|^$'/etc/fstab-i忽略字符大小写#可有可无-n显示匹配的行号-c统计匹配的行数grep-croot/etc/passwd#统计匹配到的行数-o仅显示匹配到
半糖不加冰520
·
2023-11-28 02:40
正则表达式
Shell 脚本之正则表达式与文本
三剑客
探索
基本正则表达式元字符1.2.1字符匹配1.2.2次数匹配1.2.3位置锚定1.2.4分组1.2.5逻辑或\|1.2.6非打印字符1.3扩展正则表达式1.3.1字符匹配1.3.2次数匹配1.3.3位置锚定二、文本
三剑客
Lamour d'une vie
·
2023-11-28 02:39
正则表达式
shell:正则表达式及
三剑客
grep命令
目录一、grep和元字符1、grep2、元字符三、正则匹配1.查找特定字符2、使用[]来查找集合字符3、查找行首"^"与行尾字符"$"4、查找任意一个字符"."与重复字段"*"5、查找连续字符范围{}四、扩展正则表达式五、正则的一些实用写法正则表达式又称为正规表达式、常规表达式、在代码中常简写为regex、regex或RE。正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,简单
人间若有一两风
·
2023-11-28 02:09
正则表达式
shell脚本之正则表达式(文本
三剑客
之grep)
目录1.正则表达式的概述1.概述2.正则表达式定义3.常见的元字符(支持的工具:grep、egrep、sed、和awk)4.扩展正则表达式元字符(支持egrep、awk)2.grep命令1.grep的介绍2.案例1.正则表达式的概述1.概述通常用于判断语句中,用来检查某一个字符串是否满足某一格式。正则表达式是由普通字符与元字符组成。普通字符:包括大小写字母、数字、标点符号及一些其他符号;元字符:是
shanjun12
·
2023-11-28 02:38
正则表达式
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他