llljjlj

字符串分割函数strtok和strsep使用注意事项

转载自 https://blog.csdn.net/astrotycoon/article/details/50813959

为什么写本文

最近工作中经常需要解析字符串，并且这些字符串都有一个共同的特点，那就是它们由一个或者多个分隔符（delimiter）隔开，而我要做的就是提取出由这些分隔符隔开的诸多子串。

我们来看一个例子，假设DHCP服务器返回的信息如下格式：

网络地址:子网掩码:默认网关:DNS地址1:DNS地址2

这里为了简单化问题，字符串中只有一种分隔符“:”，当然我相信这是现实中最常见的一种情况。现在的任务就是正确地提取出网络地址、子网掩码、默认网关以及两个DNS地址。需要指出的是，因为有时DHCP服务器会发生异常，导致返回的信息不完整，例如192.168.6.138:255.255.255.0::202.38.64.1:114.114.114.114，看到没有？默认网关没有正确获取到，因此返回的字符串中有连续的两个分隔符“:”，彼此之间是没有空格的。

我首先想到的办法是使用sscanf函数，如下：

const char *dhcpargs = "192.168.6.138:255.255.255.0::202.38.64.1:114.114.114.114";
char ip[32], netmask[32], gateway[32], dns[2][32];
int ret = sscanf(dhcpargs, "%[^:]:%[^:]:%[^:]:%[^:]:%s", ip, netmask, gateway, dns[0], dns[1]);
结果发现不可行，sscanf函数返回值为2，网络地址和子网掩码正确解析出来了，但是DNS地址都没有解析出来，也就是说sscanf无法正确解析空字符串，如果遇到空字符串就停止后续的解析 -- 确切的说，是说明符[ ]无法匹配空字符串。

后来了解到C语言中有函数来分割字符串，分别为strtok和strsep函数。strtok是标准C库函数，strsep不是，但是现如今的C库几乎全部有strsep的实现，就连linux内核也已经很早开始使用strsep，而放弃使用strtok了。

在使用过程中，我发现strtok不能胜任以上的情况，最终选择了strsep函数。还发现了这两个函数的诸多相同点和不同点，以及使用这两个函数容易犯的错误，本文就结合这两个函数的源码来简单分析下这两个函数的异同点。

函数源码

代码来自glibc-2.24，strtok源码如下：

/* Copyright (C) 1991-2016 Free Software Foundation, Inc.
This file is part of the GNU C Library.
The GNU C Library is free software; you can redistribute it and/or
modify it under the terms of the GNU Lesser General Public
License as published by the Free Software Foundation; either
version 2.1 of the License, or (at your option) any later version.
The GNU C Library is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
Lesser General Public License for more details.
You should have received a copy of the GNU Lesser General Public
License along with the GNU C Library; if not, see
. */

#include

static char *olds;

#undef strtok

#ifndef STRTOK
# define STRTOK strtok
#endif

/* Parse S into tokens separated by characters in DELIM.
If S is NULL, the last string strtok() was called with is
used. For example:
   char s[] = "-abc-=-def";
   x = strtok(s, "-");       // x = "abc"
   x = strtok(NULL, "-=");       // x = "def"
   x = strtok(NULL, "=");       // x = NULL
       // s = "abc\0=-def\0"
*/
char *
STRTOK (char *s, const char *delim)
{
char *token;

if (s == NULL)
s = olds;

/* Scan leading delimiters. */
s += strspn (s, delim);
if (*s == '\0')
{
olds = s;
return NULL;
}

/* Find the end of the token. */
token = s;
s = strpbrk (token, delim);
if (s == NULL)
/* This token finishes the string. */
olds = __rawmemchr (token, '\0');
else
{
/* Terminate the token and make OLDS point past it. */
*s = '\0';
olds = s + 1;
}
return token;
}
strtok代码整体流程如下：

（1）判断参数s是否为NULL。不为NULL则就以s为起始点开始分割；如果是NULL，证明不是第一次调用，则从上一次olds保存的位置处开始分割。

（2）跳过开始位置的所有分隔字符，直到遇到第一个非分割字符。函数strspn用来计算开始处有多少个连续分割字符。

（3）如果一走来就遇到了'\0'字符，证明字符串已经分割完成，因此返回NULL。不然则继续。

（4）先保存待分割字符串的首地址，也就是本次待分割出的子串的首地址。接着调用函数strpbrk寻找后续的第一个分隔符：如果返回值为NULL，证明后续的所有字符中没有分隔符了，那么使olds指向字符串的末尾，即'\0'，函数返回s。如果找到了，那么将其覆盖写为了'\0'，并且使old指向后面的第一个字符，函数返回s。

再来看看strsep的源码如下：

/* Copyright (C) 1992-2016 Free Software Foundation, Inc.
This file is part of the GNU C Library.
The GNU C Library is free software; you can redistribute it and/or
modify it under the terms of the GNU Lesser General Public
License as published by the Free Software Foundation; either
version 2.1 of the License, or (at your option) any later version.
The GNU C Library is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
Lesser General Public License for more details.
You should have received a copy of the GNU Lesser General Public
License along with the GNU C Library; if not, see
. */

#include

#undef __strsep
#undef strsep

char *
__strsep (char **stringp, const char *delim)
{
char *begin, *end;

begin = *stringp;
if (begin == NULL)
return NULL;

/* A frequent case is when the delimiter string contains only one
character. Here we don't need to call the expensive `strpbrk'
function and instead work using `strchr'. */
if (delim[0] == '\0' || delim[1] == '\0')
{
char ch = delim[0];

if (ch == '\0')
   end = NULL;
else
   {
   if (*begin == ch)
   end = begin;
   else if (*begin == '\0')
   end = NULL;
   else
   end = strchr (begin + 1, ch);
   }
}
else
/* Find the end of the token. */
end = strpbrk (begin, delim);

if (end)
{
/* Terminate the token and set *STRINGP past NUL character. */
*end++ = '\0';
*stringp = end;
}
else
/* No more delimiters; this is the last token. */
*stringp = NULL;

return begin;
}
weak_alias (__strsep, strsep)
strong_alias (__strsep, __strsep_g)
libc_hidden_def (__strsep_g)
个人认为strsep的源码比strtok的写的要好，主要体现在函数内局部变量的命名上，简单明了。strsep代码的整体流程如下：

（1）begin指向参数stringp，即传递进来的字符串首地址。如果首地址为NULL，则什么也不做，返回NULL；否则继续。

（2）获取后续字符中第一个分割字符的位置，如果没有获取到，设置*stringp为NULL，返回begin。否则覆盖写找到的分隔符为'\0'，并且是*stringp指向后续的第一个字符。

相同点

好了，看完了源码，想必已经看出了些许两者的相同之处了吧？总结如下：

（1）两者都会修改原字符串，因此这个字符串可千万不能存储在只读内存区域里（也就是大家常说的string literal，中文一般叫做字符串字面值），否则运行时会发生断错误。可以是字符数组（存储在数据段.data，或者栈上），或者是存储在动态申请的内存（堆）里的字符串。

（2）如果处理过程中没有找到分隔符，则返回的就是传递进去的字符串的首地址。

不同点

（1）strtok函数使用了全局静态变量，这就使得它不是线程安全函数或者说是不可重入函数。而strsep通过二级指针用来替代strtok中的全局指针的功能，因此它是线程安全函数，glibc中有个strtok_r函数，它同样是通过提供二级指针的功能来保证线程安全的，在不考虑移植的情况下，应尽量使用strtok_r函数。

（2）strtok函数在扫描一个字符串时，会忽略掉一开始的分隔符，而strsep不会忽略，而是覆盖写成'\0'，并且返回一个空字符串。因此strtok的返回值只有两种情况:非空字符串首地址和NULL；strsep的返回值有三种可能：空字符串首地址，非空字符串首地址以及NULL。这点尤其重要，会导致strtok和strsep的行为不同，也是最迷惑人的地方。

（3）调用方式的区别：strtok函数第一次调用时第一个参数必须提供待分割字符串的首地址，而后续调用必须设置成NULL。strsep的调用方式一直不变。

实际例子

先来说下为什么文章一开始我说最终选择了strsep函数，根据上面的不同点（2）可知，strsep在处理网关时会返回空字符串，这是我想要的，为空就知道是DHCP服务器发生异常导致的，而strtok却直接跳过去解析DNS，这就导致把DNS地址当成网关了，这完全不是我想要的结果嘛！

好了，来看个比较典型并且简单的例子，重点是向读者展示两个函数扫描字符串的不同方式！

#include
#include
#include

int main(int argc, const char *argv[])
{
char buf[] = "abadcbaf";
char *result;

#if 0
for (result = strtok(buf, "ab"); result != NULL; result = strtok(NULL, "ab")) {
printf("result = %s\n", result);
}
#else
char *pbuf = buf;
while ((result = strsep(&pbuf, "ab")) != NULL) {
printf("result = %s\n", result);
}
#endif

exit(EXIT_SUCCESS);
}
接下来我以图形方式向读者展示两个函数的扫描过程，你会发现两个函数的扫描次数是不同的。

strtok函数处理过程：

（1）初始状态

（2）第一次分割后（忽略前三个分隔符，覆盖写找到的第一个分割符b为'\0'，olds指向后续字符a，返回字符串"dc"）

（3）第二次分割后（忽略分割字符a，olds执行字符串尾部，返回字符串"f"）

（4）最后一次（第三次）分割后（函数返回NULL，olds指向字符串尾部）

接下来看strsep的处理过程：

（1）初始状态

（2）第一次分割（覆盖写字符a为'\0'， stringp指向字符b，返回空字符串）

（3）第二次分割（覆盖写字符b为'\0'，stringp指向后续的字符a，返回空字符串）

（4）第三次分割（覆盖写字符a为'\0'，stringp指向后续字符d，返回空字符串）

（5）第四次分割（覆盖写字符b为'\0'，stringp指向后续字符a，返回字符串"dc"）

（6）第五次分割（覆盖写字符a为'\0'，stringp指向后续的字符f，返回空字符串）

（7）第六次分割（stringp指向NULL，返回字符串"f"）

（8）第七次分割（因为stringp为NULL，什么都不做，函数返回NULL）

通过对比发现：strtok函数实际分割了2次，strsep实际分割了6次。

总结

对strtok和strsep这两个函数，网上有不少文章讲解，我发信很多存在错误，究其原因是他们没有结合源码来分析，甚至有猜测的成分在里面，导致对它们的理解不够透彻。而strtok和strsep的源码我们又是唾手可得的，那还不如直接看源码，这样来的痛快，也不会存在理解上的模棱两可。

参考链接：

《Linux C函数strtok解析》

《关于函数strtok和strtok_r的使用要点和实现原理（一）》

《What are the differences between strtok and strsep inC》

补充：

今天简单看了下VS下strtok的实现，发现它的实现跟GNU的实现方式不大一样，因此简单分析如下。

先看源码如下：

/***
*strtok.c - tokenize a string with given delimiters
*
* Copyright (c) Microsoft Corporation. All rights reserved.
*
*Purpose:
* defines strtok() - breaks string into series of token
* via repeated calls.
*
*******************************************************************************/

#include
#include
#ifdef _SECURE_VERSION
#include
#else /* _SECURE_VERSION */
#include
#endif /* _SECURE_VERSION */

/***
*char *strtok(string, control) - tokenize string with delimiter in control
*
*Purpose:
* strtok considers the string to consist of a sequence of zero or more
* text tokens separated by spans of one or more control chars. the first
* call, with string specified, returns a pointer to the first char of the
* first token, and will write a null char into string immediately
* following the returned token. subsequent calls with zero for the first
* argument (string) will work thru the string until no tokens remain. the
* control string may be different from call to call. when no tokens remain
* in string a NULL pointer is returned. remember the control chars with a
* bit map, one bit per ascii char. the null char is always a control char.
*
*Entry:
* char *string - string to tokenize, or NULL to get next token
* char *control - string of characters to use as delimiters
*
*Exit:
* returns pointer to first token in string, or if string
* was NULL, to next token
* returns NULL when no more tokens remain.
*
*Uses:
*
*Exceptions:
*
*******************************************************************************/

#ifdef _SECURE_VERSION
#define _TOKEN *context
#else /* _SECURE_VERSION */
#define _TOKEN ptd->_token
#endif /* _SECURE_VERSION */

#ifdef _SECURE_VERSION
char * __cdecl strtok_s (
char * string,
const char * control,
char ** context
)
#else /* _SECURE_VERSION */
char * __cdecl strtok (
char * string,
const char * control
)
#endif /* _SECURE_VERSION */
{
unsigned char *str;
const unsigned char *ctrl = control;

unsigned char map[32];
int count;

#ifdef _SECURE_VERSION

/* validation section */
_VALIDATE_RETURN(context != NULL, EINVAL, NULL);
_VALIDATE_RETURN(string != NULL || *context != NULL, EINVAL, NULL);
_VALIDATE_RETURN(control != NULL, EINVAL, NULL);

/* no static storage is needed for the secure version */

#else /* _SECURE_VERSION */

_ptiddata ptd = _getptd();

#endif /* _SECURE_VERSION */

/* Clear control map */
for (count = 0; count < 32; count++)
map[count] = 0;

/* Set bits in delimiter table */
do {
map[*ctrl >> 3] |= (1 << (*ctrl & 7));
} while (*ctrl++);

/* Initialize str */

/* If string is NULL, set str to the saved
* pointer (i.e., continue breaking tokens out of the string
* from the last strtok call) */
if (string)
str = string;
else
str = _TOKEN;

/* Find beginning of token (skip over leading delimiters). Note that
* there is no token iff this loop sets str to point to the terminal
* null (*str == '\0') */
while ( (map[*str >> 3] & (1 << (*str & 7))) && *str )
str++;

string = str;

/* Find the end of the token. If it is not the end of the string,
* put a null there. */
for ( ; *str ; str++ )
if ( map[*str >> 3] & (1 << (*str & 7)) ) {
*str++ = '\0';
break;
}

/* Update nextoken (or the corresponding field in the per-thread data
* structure */
_TOKEN = str;

/* Determine if a token has been found. */
if ( string == str )
return NULL;
else
return string;
}
可能最让人迷惑的就是这个数组map，它的用途是什么？又为什么它的大小是32呢？

不难看出，map数组是用于记录分隔符的，但是又不是单纯的记录，确切地说，它是一个位集，每个字节8个bit，因此32*8共256，足以表示所有的ascii。

因此map数组的每个元素代表8个ascii，如果对应的ascii字符存在，对应的bit设置为1，否则为0。

我们可以看一个具体的例子，在ascii表中从字符@到字符G的十进制值为64~71，正好是数组map的第9个元素，即map[8] -- 也就是说map[8]字节中的每一个bit的状态代表分隔符总是否存在字符@到G。

这样就比较清楚了。其实右移3位，相当于除以8，&7相当于取8的模。

/* Set bits in delimiter table */
do {
map[*ctrl >> 3] |= (1 << (*ctrl & 7));
} while (*ctrl++);
这段代码就是讲分隔符映射到map数组中。
/* Find beginning of token (skip over leading delimiters). Note that
* there is no token iff this loop sets str to point to the terminal
* null (*str == '\0') */
while ( (map[*str >> 3] & (1 << (*str & 7))) && *str )
str++;
这段代码即忽略前缀的分隔符。
好，差不多了明白了吧。

参考链接：

《 strtok源码剖析位操作与空间压缩》

《杭电水题--排序关于strtok的一些问题》
---------------------
作者：astrotycoon
来源：CSDN
原文：https://blog.csdn.net/astrotycoon/article/details/50813959
版权声明：本文为博主原创文章，转载请附上博文链接！

【linux】ssh 远程执行命令自动输入密码方式檀越@新空间 s5 Linux学习 linux ssh 服务器
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨博客目录一.自动输入密码二.sshpass方式1.安装sshpass2.源码下载3.安装过程4.验证三.expect方式1.脚本2.执行前些天发现了一个巨牛的人工智能
【Linux | 网络】网络编程套接字是阿建吖! 【Linux】【网络】linux 网络
目录一、预备知识1.1理解IP地址1.2认识端口号1.3理解网络套接字1.4理解"端口号"和"进程ID"1.5认识TCP协议与UDP协议1.6网络字节序二、socket编程接口2.1socket常见API2.1.1socket函数2.1.2bind函数2.1.3listen函数2.1.4accept函数2.1.5connect函数2.2主机字节序和网络字节序的转换的函数2.2.1htonl函数2.
Linux·网络入门基础知识迅~ Linux应用编程服务器网络 linux
目录网络的位置计算机网络背景网络发展认识“协议”网络协议初始协议分层编辑OSI七层模型编辑TCP/IP五层（或四层）模型网络传输基本流程编辑同局域网的两台主机通信跨网络的两台主机通信网络中的地址管理认识IP地址认识MAC地址网络的位置我们通常在手机或者电脑上使用的APP，比如抖音、快手、淘宝等，这些APP都是在应用层的。用户在应用层的各种请求最终会下达给操作系统，操作系统内除了进程管理、文件管理、
一行配置引起的Linux默认路由未生效问题彭泽布衣 Linux操作系统 Linux问题排查小记 linux 运维服务器默认路由
默认路由问题Linux多网卡默认路由未配置问题背景问题分析Linux多网卡默认路由未配置问题背景最近装机比较频繁，但是装完机，启动系统之后，发现Linux系统没有默认路由。centos系统，说是修改/etc/sysconfig/network-scripts/ifcfg-xxx，加一行GATEWAY=192.168.1.1就可以，但是我加完之后，重启了network，检查默认路由，看并没有生效。问
【无标题】 KellenKellenHao tomcat java
一、tomcat安装 #关闭防火墙与SELinux [root@proxy_host~]#rz rzwaitingtoreceive.**[root@proxy_host~]#ls anaconda-ks.cfg ceph-release-1-1.el7.noarch.rpm apache-tomcat-8.5.40.tar.gznginx-1.27.3.tar.gz #解压到指定路径
Linux信号处理全解析程序员弘羽 Linux系统编程 java 网络 linux
在Linux系统编程中，信号（Signal）是一种异步通知机制，用于告知进程发生了某种事件。理解常见的信号及其默认行为对于编写健壮的应用程序至关重要。目录一、信号的分类与作用1.SIGHUP（信号编号：1）2.SIGINT（信号编号：2）3.SIGQUIT（信号编号：3）4.SIGILL（信号编号：4）5.SIGABRT（信号编号：6）6.SIGFPE（信号编号：8）7.SIGKILL（信号编号：
Linux 命令使用笔记【sysctl】 fzip Linux linux 服务器运维
名称在系统运行时，配置修改内核参数概要sysctl[options][variable[=value]][...]sysctl-p[fileorregexp][...]描述sysctl用于在linux系统运行时修改内核参数。可以修改的参数都在/proc/sys/文件夹下。Linux中的sysctl支持需要Procfs。您可以使用sysctl来读写sysctl数据。参数variable要从中读取的键
Linux 命令使用笔记【zcat】 fzip Linux linux zcat
zcat命令zcat命令用于不真正解压缩文件，就能显示压缩包中文件的内容的场合。语法zcat(选项)(参数)选项-S：指定gzip格式的压缩包的后缀。当后缀不是标准压缩包后缀时使用此选项；-c：将文件内容写到标注输出；-d：执行解压缩操作；-l：显示压缩包中文件的列表；-L：显示软件许可信息；-q：禁用警告信息；-r：在目录上执行递归操作；-t：测试压缩文件的完整性；-V：显示指令的版本信息；-l
运维系列&Linux系列【仅供参考】：Ubuntu 16 永久修改ulimit中的max file open限制坦笑&&life 运维运维 linux ubuntu
Ubuntu16永久修改ulimit中的maxfileopen限制Ubuntu16永久修改ulimit中的maxfileopen限制摘要正文Ubuntu16永久修改ulimit中的maxfileopen限制摘要本文介绍如何在Ubuntu16系统中增加最大文件打开数限制，通过修改系统配置文件来实现对nginx等服务中worker_connections参数的有效提升。正文Ubuntu16–howto
Linux - 修改系统的max open files、max user processes（附ulimit的使用方法） oldbalck java 操作系统网络
Linux-修改系统的maxopenfiles、maxuserprocesses（附ulimit的使用方法）目录1问题说明2修改maxopenfiles3修改maxuserprocesses4附录:ulimit命令说明1问题说明Linux系统默认的maxopenfiles=1024,在大内存服务器中,如果运行负载比较大的程序,很容易发生error:toomanyopenfiles,特别是提供大量静
max open files mysql_MySQL性能优化之open_files_limit，table_open_cache和max_connections配置关系... Moriarty K max open files mysql
MySQL的变量open_files_limit，table_open_cache和max_connections是相互关联的。如果对有些变量进行了设置，有的变量没有设置，mysql会根据一定的计算公式进行计算得出其他的，当然有些时候会触发mysql的一些警告来。本文探讨的均基于Linux系统首先，mysql会基于max_connections和table_open_cache的值计算最低需要的文
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
mysql日志报：Changed limits: max_open_files: 1024
linux上的数据库mysql突然挂掉了重启mysql（systemctlrestartmysqld），出现类似下面的情况：/system.slice/mysqld.service└─control├─2571/bin/bash/usr/bin/mysql-systemd-startpost└─3541sleep1最后查看mysql.log发现不知道错误的错误：[Warning]Bufferedw
在Ubuntu主机中修改ARM Linux开发板的根文件系统牧以南歌〆嵌入式Linux linux ubuntu arm开发驱动开发
目录在Ubuntu主机中修改ARMLinux开发板的根文件系统一、安装环境二、根文件系统镜像扩容三、挂载扩容后的根文件系统镜像四、修改相关配置五、创建挂载脚本六、切换回主机目录七、取消挂载八、精简根文件系统镜像大小在Ubuntu主机中修改ARMLinux开发板的根文件系统开发环境：Ubuntu20.04、飞凌OK3568开发板、开发板使用的根文件系统镜像为ubuntu.img一、安装环境首先使用以
Bash Shell面试题高级汇总002 韩公子的Linux大集市 Bash入门 bash 开发语言
文章目录一、Shell原理进阶二、性能与资源管理三、并发控制与IPC四、安全与防御五、调试与追踪六、文本处理黑科技七、系统级深入题八、容器化环境九、综合场景题十、面试官深度追问方向以下是一份深度梳理的LinuxShell高级面试题汇总，涵盖脚本优化、系统原理、故障排查、安全实践等高频考点，适用于中高级开发/运维岗位：一、Shell原理进阶exec3<>file的作用是什么？文件描述符0-2的默认指
一个小时快速部署大模型，附大模型书：ChatGLM3大模型本地化部署、应用开发与微调! LLM教程人工智能 langchain 知识图谱 Agent 大模型 LLM AI
这个教程有以下几部分构成：硬件配置概念介绍实操测试结果1.硬件配置本文使用的方法配置要求低，没有gpu也可以正常使用(就是有点慢)，不管是windows还是linux，都可以无障碍使用大模型，有脚就行，废话少说，let’srock!2.概念介绍几个部署要用到的概念，工具和项目huggingface:类似于模型的github，各种各样的开源模型都可以在这被找到.模型量化技术：这也是我们能够在低端设备
vscode报错：找不到任务“g++.exe build active file”。（Linux)
错误原因：task.json文件中的“label”和launch.json中的"preLaunchTask"不匹配，要保持这两个参数一致（大部分原因都是因为中英文不匹配）！task.jsonlaunch.json以上是修改后的，因为task文件是自动生成的，label处错误写法是：g++.exe的生成活动文件（中文），而launch文件找不到中文，就报错找不到了。把task文件中的改成英文就可以了
Hadoop MapReduce入门且行且安~ 数据分析进阶之路 Linux命令 hadoop MapReduce入门
入门简介计算过程分为两个阶段Map和ReduceMap阶段并行处理输入数据Reduce阶段对Map结果进行汇总针对python语言来说：map函数或者reduce函数来说，输出的数据格式为元组tuple一个简单的MapReduce程序只需要指定map()reduce()input()output()剩下的由框架完成。Linux常见命令：-读取文件（文本文件，在Windows下使用记事本打开的文件）
基于Linux下的vscode c/c++开发环境搭建详细教程墨小傲 linux vscode c语言
vscode是文本编辑而非集成开发环境，需要经过配置才能在其上编译执行代码。本教程将具体详解在linux上配置VisualStudioCode使用GCCC++编译器（g++）和GDB调试器的方法（GCC是GNU编译器集合，GDB则是GNU调试器）。配置vscode后，将通过在VSCode中编译和调试一个简单的C++程序告知您具体该如何操作。一、先决条件安装VisualStudioCode.安装C+
Hadoop MapReduce 入门
一、Hadoop3.0.4环境准备1.环境要求Java8（Hadoop3.0.4不支持Java11+）单节点或多节点Linux系统（推荐Ubuntu18.04+）至少4GB内存（建议8GB+）50GB以上磁盘空间2.安装Java#安装Java8sudoapt-getinstallopenjdk-8-jdk#验证安装java-version3.下载与安装Hadoop3.0.4#下载Hadoop3.0
Linux Vim 如何使用 BACKLS gradle vim
LinuxVim最全面教程目录介绍安装Vim基本操作启动与退出插入模式移动光标删除、复制和粘贴撤销与重做高级操作查找与替换多文件编辑宏与自动化插件管理配置Vim编辑vimrc常用配置示例总结介绍Vim是一个高度可配置的文本编辑器，适用于从日常文本编辑到复杂的编程任务。它的前身是vi编辑器，具有强大的文本处理能力和灵活的扩展性。安装Vim在不同的Linux发行版上安装Vim的方法略有不同。以下是一些
Docker技术全景解析：从核心原理到实践应用 Liudef06小白 docker 容器运维
Docker技术全景解析：从核心原理到实践应用引言：容器化革命的引擎2013年诞生的Docker并非容器技术的发明者，却成功地将Linux容器（LXC）这一底层技术转化为开发者友好的标准化工具。它通过镜像封装、环境一致性和资源隔离三大创新，解决了“在我机器上能跑，线上为什么不行”这一行业顽疾。Docker的核心突破在于创建了跨环境的应用交付标准——开发者构建的Docker镜像可在开发笔记本、测试服
PHP 安装指南 wjs2024 开发语言
PHP安装指南引言PHP是一种广泛使用的开源服务器端脚本语言，常用于Web开发。正确安装PHP是开始构建动态网站或应用程序的第一步。本文将详细介绍如何在各种操作系统上安装PHP，并指导您完成必要的配置步骤。安装环境准备在安装PHP之前，请确保您的系统满足以下条件：操作系统：PHP可以在多种操作系统上运行，包括Windows、Linux和macOS。Web服务器：虽然PHP主要用作服务器端脚本语言，
VMware Fusion 虚拟机安装CentOS 7 Mac 2501_92680691 macos mac vmware 虚拟机 centos7
CentOS是CommunityEnterpriseOperatingSystem的缩写，也叫做社区企业操作系统。是企业Linux发行版领头羊RedHatEnterpriseLinux的再编译版本（是一个再发行版本），而且在RHEL的基础上修正了不少已知的Bug，相对于其他Linux发行版，其稳定性值得信赖,广泛用于服务器、云计算、虚拟化等领域。原文地址：VMwareFusion虚拟机安装Cent
高通 QRB5165 GPIO 子系统
深度掌握高通QRB5165平台的GPIO子系统：原理、配置、调试与实战案例目录深度掌握高通QRB5165平台的GPIO子系统：原理、配置、调试与实战案例1.引言：GPIO在嵌入式系统中的重要性2.QRB5165平台GPIO硬件结构概述3.LinuxGPIO子系统原理解析TLMM驱动的注册流程4.DeviceTree配置详解TLMM节点结构gpios属性解析中断配置5.用户态控制GPIO：Sysfs
1. Linux 基本命令 GotoLevel Linux编译基础 linux ffmpeg 运维
安装工具包:安装工具包:【1.brew;(MacOS)；2.apt;(Linux-乌班图);3.yum;(Linux-服务器端)】brewsearchffmpeg：在服务源上查找显示ffmepg的安装包;brewinstallffmpeg：安装服务器上的ffmepg包;brewremoveffmpeg:移除安装的ffmepg包；Linux基本命令:ctrl+l:清屏;ctrl+c:取消当前命令;s
【CMake】CMake简介及使用示例晴雨日记 CMake c++
CMake简介CMake是一个跨平台的开源构建系统生成器，用于管理软件构建过程。它不直接编译代码，而是根据CMakeLists.txt文件生成标准构建文件（如Makefile、VisualStudio项目等），再调用底层工具（如gcc、MSVC）编译。核心优势：跨平台：支持Windows、Linux、macOS可扩展：支持C/C++/CUDA/Fortran等多种语言模块化：提供find_pack
基于MQTT的温湿度采集服务 aiprtem 嵌入式Linux MQTT AM335x linux 物联网 c语言
基于MQTT的温湿度采集服务1.项目概述thdetect是一个基于RS485的温湿度采集服务程序，通过Modbus-RTU协议读取传感器数据，并将数据通过MQTT协议发布到消息代理服务器。该服务可以作为后台守护进程运行，为上层应用提供实时的温湿度数据。2.开发环境处理器：AM3354显示屏：支持触摸功能的LCD屏幕操作系统：Linux3.2LVGL版本：v8.3构建工具：CMake3.16+交叉编
centos7 ifconfig命令不显示IP号的解决方法奔跑向Python的小兔 tcp/ip 网络协议网络
当使用ifconfig命令时，对于ens33这个第一网卡不显示ip地址，用ip-a并不显示正确的ip号，用下面的方式来解决用sudodhclient-v命令这是一个在Linux系统中获取IP地址的命令，通过启动DHCP客户端程序向DHCP服务器请求IP地址等网络配置信息。sudo是以管理员权限运行dhclient命令，-v选项指定输出详细调试信息。执行该命令后，DHCP客户端会自动在网络中寻找DH
Linux系统学习：文件、目录操作，简单语法橙小花 linux 学习
DAY2文件系统Linux本质上就是一个文件系统。Linux文件系统是操作系统组织、存取、保存数据的一种手段。整体采用层级式的倒状目录结构。倒状树结构中的目录/:根目录/bin：主要存放系统普通指令/boot：主要存放系统的引导程序/dev：存放硬件设备对应的文件（Linux应用开发阶段，访问其中的文件）/etc：存放系统和应用程序的配置文件（如：profile）/home：家目录，存放当前系统下
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

字符串分割函数strtok和strsep使用注意事项

你可能感兴趣的:(linux)