在写程序过程中, 我们经常遇到要对数组去掉重复值, 为避免浪费时间造轮子, 这里给出一个c++内置的的常用函数unique().
这个函数只能对"相同元素在并邻在一块的"序列进行去重. 不能对相同元素七零八落地分布的一般序列进行去重, 可以对一般数组进行排序后再用unique()实现去重目的即可, 因为排好序的的序列里面相同元素一定存储在连续的地址块. 提醒, 该函数实现去重功能并不是把相同元素删除,网上说unique()把重复元素放到了末尾, 这个说法不正确, 所以有识之士更正说应该是把不重复的元素移到前面来. 这个说法已经很接近真相了, 但还是不够严谨 . 因为没有描述清楚后半句话, 让人误解成为 “仅仅序列内部元素之间的交换位置, 整个unique()作用后的序列和作用前的序列元素不多不少, 该有什么还是有什么, 只是摆放位置可能不一样而已”. 但事实并不是这样.
下面先用简单的代码例子理解unique()的用法
#include
#include
#include
using namespace std;
int main(void) {
list <int> l= {1, 1, 2, 2, 3, 3, 3, 4, 5}; //一共九个元素
int iniLen = l.size(); ///// 初始长度iniLen == 9
cout << "List elements before unique operation" << endl;
for (auto it = l.begin(); it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
list<int> :: iterator newEnd = unique(l.begin(),l.end()) ; //unique() 返回unique作用后的没有重复元素的数组末尾指针! 详细参数下面再讲
cout << "这个是unique作用后被移动到前面的非重复元素" << "\n";
for (auto it = l.begin(); it != newEnd; ++it)
cout << *it << " ";
cout << "\n\n";
cout << "看看后面地址里是什么\n";
for (auto it = newEnd; it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
cout << "再来看一下整个被unique作用后的原始数组(包括在数组后面的重复元素)\n List elements after unique operation" << endl;
for (auto it = l.begin(); it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
return 0;
}
#include
#include
#include
using namespace std;
int main(void) {
list <int> l= {1, 2, 3, 2, 1};
int iniLen = l.size();
cout << "List elements before unique operation" << endl;
for (auto it = l.begin(); it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
list<int> :: iterator newEnd = unique(l.begin(),l.end()) ; //unique() 返回unique作用后的没有重复元素的数组末尾指针! 详细参数下面再讲
cout << "这个是unique作用后被移动到前面的非重复元素" << "\n";
for (auto it = l.begin(); it != newEnd; ++it)
cout << *it << " ";
cout << "\n\n";
cout << "看看后面地址里是什么\n";
for (auto it = newEnd; it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
cout << "再来看一下整个被unique作用后的原始数组(包括在数组后面的重复元素)\n List elements after unique operation" << endl;
for (auto it = l.begin(); it != l.end(); ++it)
cout << *it << " ";
cout << "\n\n";
return 0;
}
例子1可以看到, 序列{1, 1, 2, 2, 3, 3, 3, 4, 5}有五个元素(1, 2, 3, 4, 5)第一次出现, 所以他们被赋值给序列的前面五个地址, 然后序列剩下的四个地址和原先序列后面相等数量的地址里的元素一样, 为{3, 3, 4, 5}. 可以理解为unique()对前面五个地址, 即例子里的[l.begin() , newEnd )进行写操作 ; 对后面的地址[newEnd , l.end() )进行读操作. 区间都是左闭右开.
例子2证明了重复元素只有相邻才能被作用
一个含有n个元素的序列里面有n1个不重复元素, 其余n2个是重复的.n = n1 + n2. unique()按序列顺序从头到尾把这n1个元素依次对序列的前n1个元素地址赋值, 然后剩下n2个地址里面的元素依然是原先序列后面n2个元素.
template <class ForwardIterator>
ForwardIterator unique (ForwardIterator first, ForwardIterator last)
{
if (first==last) return last;
ForwardIterator result = first;
while (++first != last)
{
if (!(*result == *first)) // or: if (!pred(*result,*first)) for version (2)
*(++result)=*first;
}
return ++result;
}
这个函数有两个重载
template
ForwardIterator unique (ForwardIterator first, ForwardIterator last);
template
ForwardIterator unique (ForwardIterator first, ForwardIterator last,
BinaryPredicate pred);
first和last分别是元素序列的初始位置和最终位置。范围是[first,last),它包含first和last之间的所有元素, 包括first指向的元素,但不last指向的元素。即区间左闭右开
pred : 一个函数指针或一个函数对象, 即可以自定义两个元素是否相等. 如绝对值一样的元素被判定为重复元素, 就可以吧cmp传给第三个参数
bool cmp(int a, int b){return abs(a) == abs(b)}
最后一个不重复元素的下一个迭代器, 如例子1里的newEnd