冷月宫主

C++字符串分词

董波

QQ:84638372

一简介

字符串分词，即按照某一规则，将一个完整的字符串分割为更多的字段。在C库当中，strtok/wcstok提供了类似的功能，C++标准库兼容了C库。C++的stringstream有类似的功能，boost.string_algorithm也有提供类似的泛型算法。另外在boost当中专门提供了boost.tokenizer来做这样的工作，它的实现是对C++泛型设计的一个不错的诠释，当然，它远没有达到完美的程度。Matthew Wilson在它的stlsoft中也提供了类似的组件，stlsoft.string_tokeniser。它们各有各自的特点，接下来我们对此做一些探讨和研究。

二 C库

C库中提供了strtok/wcstok来实现类似的功能，但是它们具有明显的缺点：

1. 不可重入性。这是因为它用内部的静态变量来保存相关状态。如果C库实现没有考虑TLS的话，则还有竞争条件的问题(更多信息可以参考 Chapter 21: Thread-Local Storage)。

2. 参数必须是可写入的。

3. 参数必须是C风格字符串。

4. 总是跳过空白。

下面是一个早期字符串函数的例程（改编自Matthew Wilson《Extended STL, Volume 1》 Chapter 27 ）：

#include

using namespace std;

int main()

{

char str[] = "abc,def;ghi,jkl;;";

char* outer = NULL;

char* inner = NULL;

for( outer = strtok( str, ";") ; NULL != outer; outer = strtok(NULL, ";") )

{

printf( "Outer token: %s\n", outer );

//for( inner = strtok( outer, ","); NULL != inner; inner = strtok( NULL, ",") )

//{

// printf( "Inner token: %s\n", inner );

//}

}

return 0;

}

如上面的程序，如果解注释那一段代码将导致工作不正常，也不会达到我们想要的目的，输出可能如下:

Outer token: abc,def

Inner token: abc

Inner token: def

请按任意键继续. . .

在Windows下面，Visual C++ 2005起提供了新的安全版函数，在一定程度上可以解决这种问题(UNIX系统下面有strtok_r有类似的功能)，因为它们是可重入的。下面是上面例程的升级版：

#include

using namespace std;

int main()

{

char str[] = "abc,def;ghi,jkl;;";

char* outer = NULL;

char* inner = NULL;

char* pOut = NULL;

char* pIn = NULL;

for( outer = strtok_s( str, ";", &pOut ) ; NULL != outer; outer = strtok_s(NULL, ";", &pOut) )

{

printf_s( "Outer token: %s\n", outer );

for( inner = strtok_s( outer, ",", &pIn); NULL != inner; inner = strtok_s( NULL, ",", &pIn ) )

{

printf_s( "Inner token: %s\n", inner );

}

return 0;

}

在我的机器上输出如下：

szRes: || pTok:

请按任意键继续. . .

但是即便是如此，我们也不能解决它所存在的其它问题，比如刚才提到的2、3、4点。

三 C++ stringstream

这也是一种可以用来分词的方法，但是实际上用的并不多，而且功能也不够强大，而且很多人都不能很好的掌握stringstream，因为我们平时用得太少了。

#include

using namespace std;

int main()

{

stringstream str("abcd efg kk dd " );

string tok;

while( getline( str, tok, ' ' ) )

{

cout<<tok << endl;

}

return 0;

}

输出如下：

abcd

efg

请按任意键继续. . .

四 boost字符串算法库

在我写的《C++ String深入详解2.0》中对它做过一些介绍，但是那还不够，在未来的3.0版本中将会涵盖更多的相关内容。字符串算法库中也有提供字符串分词的泛型算法和迭代器。

4.1 泛型算法

这种方式基于Range的概念，需要我们提供一个可以容纳被拆分后字符串的容器，下面是它的一个简单例程：

#include

using namespace std;

#include

int main()

{

string ss( "HelloWorld!He.lloWorld!he" );

vector<string> tmp;

// 以标点符号分开！

vector<string>& tt = boost::algorithm::split( tmp, ss, boost::algorithm::is_punct() );

assert( boost::addressof(tmp) == boost::addressof(tt) );

copy( tt.begin(),tt.end(),ostream_iterator< string >( cout,"\n" ) );

return 0;

}

输出：

HelloWorld

lloWorld

请按任意键继续. . .

我们可以看到，我们对整个拆分过程是不可控的，即使在某些时候我们可能只对拆分后的前两个单词感兴趣我们也不得不用容器来获取和保存所有结果，这对于字符串很长的情况那实在是让人不能接受，或许我们应该“按需分配”，所以便有了迭代器的方法。

4.2 迭代器

boost::algorithm::split_iterator可以用来拆分字符串，同时还需要搭配一些Finder(比如token_finder)和断言式（或者说判断式）。当然我们也可以自己DIY一个Finder。下面是一个简单的例程：

#include

using namespace std;

#include

int main()

{

string str("abc@ d*dd a");

boost::algorithm::split_iterator< string::iterator > iStr(

str,

boost::algorithm::token_finder( boost::algorithm::is_any_of( "@* " ) )

);

boost::algorithm::split_iterator< string::iterator> end;

while( iStr != end )

{

cout<< *iStr << endl;

++iStr;

}

return 0;

}

输出：

abc

请按任意键继续. . .

这个输出可能不是我们想要的，将代码做一点点修改：

boost::algorithm::split_iterator< string::iterator > iStr(

str,

boost::algorithm::token_finder(

boost::algorithm::is_any_of( "@* " ),

boost::algorithm::token_compress_on )

);

这个时候将开启压缩，输出可能如下：

abc

请按任意键继续. . .

相对于boost.tokenizer，字符串算法库提供的分词手法要少一些，如果要更多的功能的话我们还是需要自己DIY一个Finder的。自己DIY一个Finder并不复杂，我们只需要保证我们的Finder拥有与此类似的重载即可：

template< typename ForwardIteratorT >

iterator_range<ForwardIteratorT>

operator()(

ForwardIteratorT Begin,

ForwardIteratorT End ) const;

至于这个Finder内部您要保存什么信息都可以由您自己决定。这和boost.tokenizer采用的策略也是类似的，因此它们两个的扩展性都是很强的。本来应该多说一些关于Boost字符串算法库的内容的，因为毕竟Tr2中有它，但是这不是这个文档的重点。

五 boost.tokenizer

boost.tokenizer是一个专门提供的字符串分词库，它本身由视图容器和一些迭代器以及迭代器视图组成。虽然我认为可能随着Boost字符串算法库的日趋成熟和强大，这个库可能会被拿掉，但是研究和学习它的一些东西还是有一些价值的。

5.1 组件

5.1.1 tokenizer

tokenizer是一个视图容器，它本身并不包含具体的数据，它存在于boost\tokenizer.hpp中。

template <

typename TokenizerFunc = char_delimiters_separator<char>,

typename Iterator = std::string::const_iterator,

typename Type = std::string

class tokenizer

TokenizerFunc : 一个符合TokenizerFunc概念的拆分工具。

Iterator : 用于访问每个拆分后数据的迭代器。

Type: 用于保存拆分后的数据。

5.1.2 token_iterator

token_iterator是一个迭代器，它用于访问我们的拆分后数据，它位于boost\token_iterator.hpp中。

template <class TokenizerFunc, class Iterator, class Type>

class token_iterator

: public iterator_facade<

token_iterator<TokenizerFunc, Iterator, Type>

, Type

, typename detail::minimum_category<

forward_traversal_tag

, typename iterator_traversal<Iterator>::type

>::type

, const Type&

这是它的声明，如果您不了解新式迭代器的概念以及模板元编程，可能理解这段代码有一些困难，但是这并不重要。我简单告诉您的就是从iterator_façade派生可以很轻松的得到一些迭代器的行为，同时只需要派生类实现一些必要的成员函数以符合其概念即可。后面的一个模板元过程只是保证我们的迭代器最多只能是前向迭代器，即使我们使用一个随机迭代器来具现化token_iterator也会被当做前向迭代器。通常从iterator_façade派生都需要将类iterator_core_access设置为友元类。

迭代器token_iterator保存了如下数据成员：

TokenizerFunc f_;

Iterator begin_;

Iterator end_;

bool valid_;

Type tok_;

它们分别是：分词工具类对象、开始位置、结束位置、有效位以及结果。

在token_iterator的实现中，这两个函数很重要：

void increment(){

BOOST_ASSERT(valid_);

valid_ = f_(begin_,end_,tok_);

}

const Type& dereference() const {

BOOST_ASSERT(valid_);

return tok_;

}

他们分别对应了迭代器自增和提领操作。因此我们可以知道提领操作返回的只是一个常引用，并不会有什么太大的开销，而对于自增来说，它的开销取决于拆分工具的实现。更直接的来说就是取决于拆分工具的operator ()的实现。

5.1.3 分词工具类(TokenizerFunc)的概念模型

boost.tokenizer为我们提供了四个内置的工具类，它们分别是：char_separator、escaped_list_separator、offset_separator以及char_delimiters_separator。其中char_delimiters_separator已经被deprecated了，我们应该使用char_separator来代替它。它们的实现都位于boost\token_functions.hpp中。

在详细介绍这种工具类之前必须描述一下它的模型和概念，因为如果我们要自己DIY一个分词工具类的话，那么就需要符合它的规则。

首先TokenizerFunc在应用中被tokenizer和token_iterator按值保存，因此它应该是可拷贝构造的，参考源码我们可以发现类似的代码：

void assign(Iterator first, Iterator last, const TokenizerFunc& f){

assign(first,last);

f_ = f;

}

因此，TokenizerFunc应该是可赋值的。由于不存在友元关系，因此这两个函数应该必须是public的。

参考tokenizer和token_iterator的实现还可以发现用到它的其它地方，下面是一个摘录：

void initialize(){

if(valid_) return;

f_.reset();

valid_ = (begin_ != end_)?

f_(begin_,end_,tok_):false;

}

因此我们可以推断出TokenizerFunc应该具有一个reset的成员函数，它的意义应该是保证迭代器可以用于一个新的分析得以进行。另外还应该具有一个operator ()的重载，这个重载应该具有三个或者更多的参数，并且支持3个参数的调用（其它的参数有默认值）。这至少的三个参数是开始位置、结束位置以及保存分析结果的tok_，这里的tok_应该是作为引用传递的。并且这个operator()总是有一个bool返回值，如果返回true则代表分析可以继续；如果返回false则对迭代器的有效性产生影响。

5.2 工具类解析

5.2.1 char_separator

char_separator可能是我们最常用到的工具了，让我们先学会如何使用它。例子1(摘自boost文档)：

#include

using namespace std;

#include

int main()

{

std::string str = ";;Hello|world||-foo--bar;yow;baz|";

typedef boost::tokenizer<boost::char_separator<char> > tokenizer;

boost::char_separator<char> sep("-;|");

tokenizer tokens(str, sep);

for (tokenizer::iterator tok_iter = tokens.begin();

tok_iter != tokens.end();

++tok_iter)

{

std::cout << "<" << *tok_iter << "> ";

}

std::cout << "\n";

return 0;

}

输出：

请按任意键继续. . .

它除了分隔符之外其它全部使用默认的参数，这将使得分词过程将遗弃所有的sep参数中的字符。但是char_separator并不仅仅是作为strtok的替代物存在的，它比strtok强大得多。

下面是char_separator的数据成员：

private:

string_type m_kept_delims;

string_type m_dropped_delims;

bool m_use_ispunct;

bool m_use_isspace;

empty_token_policy m_empty_tokens;

bool m_output_done;

char_separator多了这样的一些概念：遗弃分隔符、保留分隔符以及empty开关。

遗弃分隔符：我们可以简单的认为它就是不会出现在分割后的任何一个结果里面。

保留分隔符：任何一个保留分隔符都将作为一个独立的结果存在。

empty开关：处理是否将empty视为一个结果。

将刚才的代码做一点点简单的修改：

boost::char_separator<char> sep("-;", "|");

其它不变，我们将得到输出：

<|> <|> <|> <|>

请按任意键继续. . .

另外如果将输出字符串修改为这样：

std::string str = ";;Hello|wor ld||-foo--bar;yo w;baz|";

此时将得到输出：

<|> <|> <|> <|>

请按任意键继续. . .

我们可以看到空格并没有被视为一个分隔符。要想将空格视为分隔符需要在sep的第一个参数中显式的指定，比如：

boost::char_separator<char> sep("-; ", "|" );

现在来看保留empty的情况，代码如下：

#include

using namespace std;

#include

int main()

{

std::string str = ";;Hello|wor ld||-foo--bar;yo w;baz|";

typedef boost::tokenizer<boost::char_separator<char> > tokenizer;

boost::char_separator<char> sep("-;", "|", boost::keep_empty_tokens );

tokenizer tokens(str, sep);

for (tokenizer::iterator tok_iter = tokens.begin();

tok_iter != tokens.end();

++tok_iter)

{

std::cout << "<" << *tok_iter << "> ";

}

std::cout << "\n";

return 0;

}

结果：

<> <> <|> <|> <> <|> <> <> <|> <>

请按任意键继续. . .

其实，在绝大多数时候，我们都只需要使用默认的参数即可：

explicit

char_separator(const Char* dropped_delims,

const Char* kept_delims = 0,

empty_token_policy empty_tokens = drop_empty_tokens)

下面是一个简单例程（选自boost文档）：

#include

using namespace std;

#include

int main()

{

std::string str = "This is, a test";

typedef boost::tokenizer<boost::char_separator<char> > Tok;

boost::char_separator<char> sep; // 缺省构造

Tok tok(str, sep);

for(Tok::iterator tok_iter = tok.begin(); tok_iter != tok.end(); ++tok_iter)

std::cout << "<" << *tok_iter << "> ";

std::cout << "\n";

return 0;

}

输出：

<,>

请按任意键继续. . .

5.2.2 escaped_list_separator

这个组件用于分析和提取csv格式的字符串。关于csv: http://baike.baidu.com/view/468993.htm

下面是一个简单例程(修改自boost文档)：

#include

using namespace std;

#include

using namespace boost;

int main()

{

try

{

string s = "Field 1,\"putting quotes around fields, allows commas\",Field 3";

tokenizer<escaped_list_separator<char> > tok(s);

for(tokenizer<escaped_list_separator<char> >::iterator beg=tok.begin();beg!=tok.end();++beg)

{

cout << *beg << "\n";

}

catch( boost::escaped_list_error& e )

{

cerr<< e.what() << endl;

}

return 0;

}

输出：

Field 1

putting quotes around fields, allows commas

Field 3

请按任意键继续. . .

我建议您不要用它，因为它有很多问题，这个稍后再说。

5.2.3 offset_separator

这个工具类很简单，它的构造如下：

template <typename Iter>

offset_separator(Iter begin, Iter end, bool wrap_offsets = true,

bool return_partial_last = true)

: offsets_(begin,end), current_offset_(0),

wrap_offsets_(wrap_offsets),

return_partial_last_(return_partial_last) { }

offset_separator()

: offsets_(1,1), current_offset_(),

wrap_offsets_(true), return_partial_last_(true) { }

重要的概念有两个(选自boost文档)：

wrap_offsets_: 指明当所有偏移量用完后是否回绕到偏移量序列的开头继续。例如字符串 "1225200101012002" 用偏移量 (2,2,4) 分解，如果 wrap_offsets_ 为 true, 则分解为 12 25 2001 01 01 2002. 如果 wrap_offsets_为 false, 则分解为 12 25 2001，然后就由于偏移量用完而结束。

return_partial_last_: 指明当被分解序列在生成当前偏移量所需的字符数之前结束，是否创建一个单词，或是忽略它。例如字符串"122501" 用偏移量 (2,2,4) 分解，如果 return_partial_last_ 为 true，则分解为 12 25 01. 如果为 false, 则分解为 12 25，然后就由于序列中只剩下2个字符不足4个而结束。

简单的例程（选自boost文档）：

#include

using namespace std;

#include

using namespace boost;

int main()

{

string s = "12252001";

int offsets[] = {2,2,4};

offset_separator f(offsets, offsets+3);

tokenizer<offset_separator> tok(s,f);

for(

tokenizer<offset_separator>::iterator beg=tok.begin();

beg!=tok.end();

++beg

)

{

cout << *beg << "\n";

}

return 0;

}

输出：

2001

请按任意键继续. . .

5.3 boost.tokenizer的缺陷

虽然boost.tokenizer是本文档的重点，但是我对于它的态度是这样的：认真的学习它，领会它好的地方，学会它的设计思路和方法，找出它的缺陷，然后永远不要用它或者自己优化之后再用它。

5.3.1 效率问题

参考escaped_list_separator的实现可以发现，对字符串的查找动作使用的是标准库泛型算法find_if。

bool is_escape(Char e) {

char_eq f(e);

return std::find_if(escape_.begin(),escape_.end(),f)!=escape_.end();

}

bool is_c(Char e) {

char_eq f(e);

return std::find_if(c_.begin(),c_.end(),f)!=c_.end();

}

bool is_quote(Char e) {

char_eq f(e);

return std::find_if(quote_.begin(),quote_.end(),f)!=quote_.end();

}

如上所示，很明显，这种搜索方法肯定不如字符串自带的find函数，实际上在这里find_if没有必要。参考Visual c++ 2008 sp1的STL中find_if的实现：

template<class _InIt,

class _Pr> inline

_InIt _Find_if(_InIt _First, _InIt _Last, _Pr _Pred)

{ // find first satisfying _Pred

_DEBUG_RANGE(_First, _Last);

_DEBUG_POINTER(_Pred);

for (; _First != _Last; ++_First)

if (_Pred(*_First))

break;

return (_First);

}

template<class _InIt,

class _Pr> inline

_InIt find_if(_InIt _First, _InIt _Last, _Pr _Pred)

{ // find first satisfying _Pred

_ASSIGN_FROM_BASE(_First,

_Find_if(_CHECKED_BASE(_First), _CHECKED_BASE(_Last), _Pred));

return (_First);

}

这并没有对字符串搜索做任何优化，同时也无从优化。另外find函数对字符串搜索使用::memchr进行优化。而basic_string的成员函数find使用的是char_traits::find，而这个find也是使用::memchr来进行了优化的，对于宽字符串来说使用::wmemchr进行优化。

除了搜索算法不合理之外还有重复计算的问题。参考char_separator的实现中，在

template <typename InputIterator, typename Token>

bool operator()(InputIterator& next, InputIterator end, Token& tok)

中有这样的代码：

else

{

if (is_dropped(*next))

{

start=++next;

}

for (; next != end && !is_dropped(*next) && !is_kept(*next); ++next)

{

assigner::plus_equal(tok,*next);

}

m_output_done = true;

}

很明显，is_dropped很有可能会遭遇重复计算的问题，或许is_dropped效率很高，但是我想再快也比不过访问一个bool变量吧？这样的行为在其它地方也可以看到。

5.3.2 字符集问题

支持多字符集是一个库是否强大的标志之一，因为标准库的basic_string提供了char和wchar_t的实现，那么我们的字符串分词也应该至少支持这两种字符，然而实际上我们发现boost.tokenizer做不到。

比如下面的代码：

explicit escaped_list_separator(Char e = '\\',

Char c = ',',Char q = '\"')

: escape_(1,e), c_(1,c), quote_(1,q), last_(false) { }

比如当使用wchar_t来具现化的时候，这能通过编译吗？不能。

再次参考char_separator的两个私有函数：

bool is_kept(Char E) const

{

if (m_kept_delims.length())

return m_kept_delims.find(E) != string_type::npos;

else if (m_use_ispunct) {

return std::ispunct(E) != 0;

} else

return false;

}

bool is_dropped(Char E) const

{

if (m_dropped_delims.length())

return m_dropped_delims.find(E) != string_type::npos;

else if (m_use_isspace) {

return std::isspace(E) != 0;

} else

return false;

}

注意上面红色的部分，类似这样的操作是不能够写死的，这样无法支持wchar_t，这应该通过一个policy或者traits来实现。因此boost.tokenizer是不能很好的支持宽字符集的，至少库为我们提供的工具类不能很好的支持。相对而言，stlsoft在这方面处理的就好得多，当然我们也可以通过自己DIY一个Finder来实现更广泛的字符集支持和更具效率的字符串分词。

六 stlsoft::string_tokeniser

stlsoft是Matthew Wilson所做的一个程序库，它的网站是：http://www.stlsoft.org/

我们可以免费得到它，而且它的实现全部位于头文件中，无需编译。在Matthew Wilson的书《Extended STL, Volume 1 : Collections and Iterators》中对这个字符串分词做了一些介绍，相对而言它是一个很不错的实现。其实现位于stlsoft\string\string_tokeniser.hpp中。

在运行下面的程序之前，请确保已经安装和配置好了stlsoft。

#include

using namespace std;

#include

int main()

{

const wstring strRes(L":abc::def:ghi:jkl::?kk?dd::::::::");

stlsoft::string_tokeniser< wstring, wchar_t > tokens( strRes, L':' );

wcout.imbue( locale("chs") );

copy(

tokens.begin(),

tokens.end(),

ostream_iterator< wstring, wstring::value_type >( wcout, L"\n" ) );

return 0;

};

输出：

abc

def

ghi

jkl

?kk?dd

请按任意键继续. . .

七效率大PK

现在让我们来对上面所提到的一些东东进行测试吧，首先说明一下这个测试是不完整的，并不代表它们每一个在各种不同情况下的表现。设计本来就是一个相互取舍的过程，也许它在这种情况下表现不好，但是到了另外一种情况下它反而是最好的选择，因此，不能以这样的一个简单的测试来彻底肯定或者彻底的否定它们中的任何一个。在这里我们忽略vector可能的内存重分配对效率的影响。

源码如下：

#include

using namespace std;

#define __HAVE_STL_SOFT__ // 如果没有安装stlsoft请注释这一行即可

#ifdef __HAVE_STL_SOFT__

#include

#endif // #ifdef __HAVE_STL_SOFT__

#include

using namespace boost;

int main()

{

const string str( "abc*def*eght*kkk*ddd" );

const int ciCount = 20000;

typedef std::vector< string> STR_VEC;

STR_VEC vec;

vec.reserve( 1000 );

{

cout<< "C-strtok_s: ";

char sz[100];

boost::progress_timer timer;

int i = 0;

while( i++ < ciCount )

{

vec.clear();

char* pTok = NULL;

char* pContext = NULL;

pTok = strtok_s( sz, "*", &pContext );

while( pTok != NULL )

{

vec.push_back( pTok );

pTok = strtok_s( NULL, "*", &pContext );

}

strcpy_s( sz, str.c_str() );

}

vec.clear();

{

cout<<"boost.string_algorithm_container: ";

boost::progress_timer timer;

int i=0;

while ( i++ < ciCount )

{

vec.clear();

vec = boost::algorithm::split( vec, str, bind2nd( equal_to<char>(), '*' ) );

}

vec.resize(10); // 防止崩溃

{

cout<<"boost.string_algorithm_iterator: ";

boost::progress_timer timer;

int i=0;

while( i++ < ciCount )

{

boost::algorithm::split_iterator< string::const_iterator > iter(

str, boost::algorithm::token_finder( bind2nd( equal_to<char>(), '*' ) )

);

boost::algorithm::split_iterator< string::const_iterator > end;

int index =0;

while( iter != end )

{

// 防止多余的Copy动作

// vec.push_back( string( boost::begin(*iter), boost::end(*iter) ) );

vec[index++].assign( boost::begin(*iter), boost::end(*iter) );

++iter;

}

{

cout<<"boost.tokenizer: ";

boost::progress_timer timer;

int i=0;

while( i++ < ciCount )

{

vec.clear();

boost::tokenizer< boost::char_separator<char> > tokens( str, boost::char_separator<char>("*") );

copy( tokens.begin(), tokens.end(), back_insert_iterator< STR_VEC >( vec ) );

}

#ifdef __HAVE_STL_SOFT__

vec.clear();

{

cout<< "stlsoft.string_tokeniser: ";

boost::progress_timer timer;

int i=0;

while( i++ < ciCount )

{

vec.clear();

stlsoft::string_tokeniser< string, char > tokens( str, '*' );

copy( tokens.begin(), tokens.end(), back_insert_iterator< STR_VEC >( vec ) );

}

#endif // #ifdef __HAVE_STL_SOFT__

return 0;

};

我们对同样的字符串执行同样的拆分操作2万次。在Debug模式下面有输出：

C-strtok_s: 0.42 s

boost.string_algorithm_container: 7.56 s

boost.string_algorithm_iterator: 5.55 s

boost.tokenizer: 2.53 s

stlsoft.string_tokeniser: 2.19 s

请按任意键继续. . .

在Release下面有输出：

C-strtok_s: 0.04 s

boost.string_algorithm_container: 0.14 s

boost.string_algorithm_iterator: 0.05 s

boost.tokenizer: 0.14 s

stlsoft.string_tokeniser: 0.05 s

请按任意键继续. . .

通过分析我们知道，C的自然是最快的，因为它不需要多余的Copy动作，而其它的都会有这样的操作，同时C库提供的字符串函数大多用汇编写的，所以比较快。但是当我们让编译器全速优化之后发现boost字符串算法库的迭代器和stlsoft的迭代器也是相当快的。最慢的当然是使用容器来存放结果了，因为它始终都会不断的拷贝。

在实际应用当中我们应该具体问题具体分析，根据操作的环境选择最适合的处理方式。举个简单的例子，比如我们只对拆分结果的第某个感兴趣，那么很显然stlsoft的迭代器就更适合一些，为什么呢？刚才我们看过一些boost.tokenizer的源码，知道在迭代器中它保存了一个tok_作为结果的容器，每次自增都会将结果拷贝到这个tok_中，也就是说每次自增都会有拷贝发生，而对于stlsoft便不是如此，它在迭代器中保存的是两个迭代器所组成的范围，只要当我们提领的时候才会构造字符串：

V operator *() const

{

return traits_type::create(m_find0, m_find1);

}

很明显这种效率会高于boost.tokenizer。但是另外一个情况下，比如说我们需要多次提领同一迭代器，那么对于stlsoft来说便不合适了，因为每次提领它都会构造，使得最终我们多次构造字符串。而boost.tokenizer这时候更适合，因为它传回的是保存在内部的tok_的常引用:

const Type& dereference() const

{

BOOST_ASSERT(valid_);

return tok_;

}

这也从另外一个角度证明了一个观点：没有绝对的好与不好，只有适合与不适合的问题。

本文原创，转帖请著名出处。参考资料已经于文中指出。另外不保证文中所有信息都是正确的，没有人是绝对正确的。如果您有不同的见解我很乐意与您讨论、与您相互分享知识。

QQ :84638372

Blog: http://84638372.qzone.qq.com/

董波

2009/5/21

工整版的Word文档：

http://ishare.iask.sina.com.cn/f/5164324.html

你可能感兴趣的:(C++)

c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
c++ 内存处理函数 heeheeai c++开发语言
在C语言的头文件中，memcpy和memmove函数都用于复制内存块，但它们在处理内存重叠方面存在关键区别：内存重叠:memcpy函数不保证在源内存和目标内存区域重叠时能够正确复制数据。如果内存区域重叠，memcpy的行为是未定义的，可能会导致数据损坏或程序崩溃。memmove函数能够安全地处理源内存和目标内存区域重叠的情况。它会确保在复制过程中不会覆盖尚未复制的数据，从而保证数据的完整性。效率:
【c++基础概念深度理解——堆和栈的区别，并实现堆溢出和栈溢出】 XWWW668899 C++基本概念 c++c语言开发语言青少年编程
文章目录概要技术名词解释栈溢出和堆溢出小结概要学习C++语言，避免不了要好好理解一下堆（Heap）和栈（Stack），有助于更好地管理内存，以及如何写出一段程序“成功实现”堆溢出和栈溢出。技术名词解释理解东西最快的方式是根据自己目前能理解的词语去关联新的概念，不断的纠正，向正确的深度理解靠近，当无限接近的时候也就理解了想要理解的概念。我们经常说堆栈，把这两个名词放到一起。其实，堆是堆，栈是栈，两种
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
metaRTC5.0 API编程指南(一) metaRTC metaRTC c++c语言 webrtc
概述metaRTC5.0版本API进行了重构，本篇文章将介绍webrtc传输调用流程和例子。metaRTC5.0版本提供了C++和纯C两种接口。纯C接口YangPeerConnection头文件:include/yangrtc/YangPeerConnection.htypedefstruct{void*conn;YangAVInfo*avinfo;YangStreamConfigstreamco
sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
Rust是否会取代C/C++？Rust与C/C++的较量 AI与编程之窗源码编译与开发 rust c语言 c++内存安全并发编程代码安全性能优化
目录引言第一部分：Rust语言的优势内存安全性并发性性能社区和生态系统的成长第二部分：C/C++语言的优势和地位历史积淀和成熟度广泛的库和工具支持性能优化和硬件控制丰富的行业应用社区和行业支持第三部分：挑战和阻碍学习曲线现有代码库的迁移成本生态系统和工具链的完善度社区和人才培养行业应用和推广法规和标准化第四部分：未来趋势和可能性行业趋势教育和人才培养兼容和共存行业标准化企业支持和应用开源社区和生态
python可以制作大型游戏_python能做游戏吗-python能开发游戏吗靖dede python可以制作大型游戏
python可以写游戏，但不适合。下面我们来分析一下具体原因。用锤子能造汽车吗？谁也没法说不能吧？历史上也确实曾经有些汽车，是用锤子造出来的。但一般来说，还是用工业机器人更合适对吗？比较大型的，使用Python的游戏有两个，一个是《EVE》，还有一个是《文明》。但这仅仅是个例，没有广泛意义。一般来说，用来做游戏的语言，有两种。一是C++。。一是C#。。Python理论上，不仅不适合做游戏，而是只要
Python开发游戏？也太好用了吧七步编程工具 Github python python 游戏开发语言
程序员宝藏库：https://gitee.com/sharetech_lee/CS-Books-Store当然可以啦！现在日常能够用到和想到的场景，绝大多数都可以用Python实现。效果怎么样暂且不提，但是得益于丰富的第三方工具包，的确让Python能够很容易处理各种各样的场景。对于游戏开发也是这样，如果真的要想商业化，Python在游戏开发方面肯定没办法和C++相提并论，但是如果用于日常学习和自
Go编程语言前景怎么样？参加培训好就业吗 QFdongdong
Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
linux gcc 格式,Linux下gcc与gdb简介神奇的战士 linux gcc 格式
gcc编译器可以将C、C++等语言源程序、汇编程序编译、链接成可执行程序。gdb是GNU开发的一个Unix/Linux下强大的程序调试工具。linux下没有后缀名的概念。但gcc根据文件的后缀来区别输入文件的类别：.cC语言源代码文件.a由目标文件构成的库文件.C、.cc、.cppC++源码文件.h头文件.i经过预处理之后的C语言文件.ii经过预处理之后的C++文件.o编译后的目标文件.s汇编源码
浅谈openresty 爱编码的钓鱼佬 nginx openresty 运维
熟悉了nginx后再来看openresty，不得不说openresty是比较优秀的。对nginx和openresty的历史等在这此就不介绍了。首先对标nginx，自然有优劣一、开发难度nginx：毫无疑问nginx的开发难度比较高，需要扎实的c/c++基础，而且还需要对nginx源码比较熟悉，开发效率慢，比如实现一个类似echo的功能，至少要上百行代码。而openresty只需要一句ngx.say
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
Java【泛型】 SkyrimCitadelValinor Java基础 java
Java泛型的概述不同类的数据如果封装方法相同，不必为每一种类单独定义一个类，只需定义一个泛型类，减少类的声明，提高编程效率。通过准确定义泛型类，可避免对象类型转换时产生的错误。泛型又提供了一种类型安全检测机制，只有数据类型相匹配的变量才能正常的赋值，否则编译器就不通过。Java中的泛型与C++类模板的作用相同，但是编译方式不同，Java泛型类只会生成一部分目标代码，牺牲运行速度，而C++的类模板
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

C++字符串分词

C++字符串分词

一 简介

二 C库

三 C++ stringstream

四 boost字符串算法库

4.1 泛型算法

4.2 迭代器

五 boost.tokenizer

5.1 组件

5.2 工具类解析

5.3 boost.tokenizer的缺陷

六 stlsoft::string_tokeniser

七 效率大PK

你可能感兴趣的:(C++)

一简介

七效率大PK