笔试面试题_华为_《简单错误记录》

题目描述

开发一个简单错误记录功能小模块,能够记录出错的代码所在的文件名称和行号。 
处理:
1.记录最多8条错误记录,对相同的错误记录(即文件名称和行号完全匹配)只记录一条,错误计数增加;(文件所在的目录不同,文件名和行号相同也要合并)
2.超过16个字符的文件名称,只记录文件的最后有效16个字符;(如果文件名不同,而只是文件名的后16个字符和行号相同,也不要合并)
3.输入的文件可能带路径,记录文件名称不能带路径
输入描述:
一行或多行字符串。每行包括带路径文件名称,行号,以空格隔开。

    文件路径为windows格式

    如:E:\V1R2\product\fpgadrive.c 1325
输出描述:
将所有的记录统计并将结果输出,格式:文件名代码行数数目,一个空格隔开,如: fpgadrive.c 1325 1 

    结果根据数目从多到少排序,数目相同的情况下,按照输入第一次出现顺序排序。

    如果超过8条记录,则只输出前8条记录.

    如果文件名的长度超过16个字符,则只输出后16个字符

思路:简单的记录输入的一些字符串及其出现的次数,然后再将出现次数较大的前八位(如果存在的话)输出,但是注意本题要求:“ 数目相同的情况下,按照输入第一次出现顺序排序”。也就是说,要求稳定数据存储和排序。
一般来说,有一些选择(参考牛客后面的讨论):
1)vector,在记录数据时候,不能够自动排序,但能够按照出现的先后顺序来记录。每次记录时,都得先遍历已存在的记录(vector),判断当前的string是否已经存在,若存在,则将计数器加一,若没出现,则在vector后面push_back该记录。记录的时间复杂度O(n)。
然后就是排序了,这是使用stable_sort(在algorithm头文件中),保证稳定排序;同时stable_sort、sort默认都是升序排序的,这里得用降序排序,那么我们可以自己写一个比较函数或函数对象,如代码中的函数,以pair的第二个元素作为排序标准(代码更详细)。排序的时间复杂度为O(nlgn)。代码如下:
#include
#include
#include

using namespace std;

bool COMPARE(pair lhs, pair rhs){
    return lhs.second > rhs.second;
}

int main(){
    
    vector > mp;
    string input;
    while(getline(cin, input)){
        
		if(input.size()==0)
            break;
        
        int f = input.rfind('\\');
        string file = input.substr(f + 1);
        
        mp.push_back(make_pair(file, 1));
        for(int i = 0; i < mp.size()-1; ++i){
            if(file == mp[i].first){
                mp[i].second++;
                mp.pop_back();
                break;
            }
        }
    }
    
    //排序
	stable_sort(mp.begin(), mp.end(), COMPARE);
    
    //输出
    for(int i = 0; i < mp.size() && i < 8; ++i){
        string outstr = mp[i].first;
        int k = outstr.find(' ');
        if(k > 16)
            outstr = outstr.substr(k-16);
        cout<
2)vector虽然能保证原序记录,但是是记录的时间复杂度却是O(n);
而map记录的时间复杂度为O(lgn),虽然其不能保证原序(它是按照str排序的),但我们可以再记录其出现的次序。在排序时,我们先按照str出现的频率排序,若频率相等,在按照其出现次序排序(这里还是得自己写一个函数来实现比较)。排序的时间复杂度同样为O(nlgn)。
而像hash_map、unordered_map等哈希表,实现记录的时间复杂度为O(1)。它们也不能实现原序存储。我们可以按照上面的方法,记录下每个str出现的次序,以便排序使用。
(有关map与unordered_map/hash_map的对比:A.前者红黑树实现,插入删除查找时间复杂度为O(lgn),后者哈希表实现,插入删除查找时间复杂度为O(1);B.前者更加稳定,后者不稳定,因为有碰撞等(其实还没有仔细研究);C.前者使用内存较少,后者较多;D.数据量少的时候可以选择前者,数据量大的时候选择后者速度快很多。)
代码如下(看着有点复杂):
#include
#include
#include

using namespace std;

bool COMPARE(const pair > &lhs, const pair > &rhs){
    
    if(lhs.second.second > rhs.second.second)
        return true;
    else if(lhs.second.second == rhs.second.second){     
            return lhs.second.first < rhs.second.first;
    }
    
    return false;
}

int main(){
    
    map > mp;
    string input;
    int ind = -1;
    while(getline(cin, input)){
        
		if(input.size()==0)
            break;
        
   		ind++;
        int f = input.rfind('\\');
        string file = input.substr(f + 1);
        
        if(mp[file].second == 0)//file还没出现过时,记录出现的次序
            mp[file].first = ind;
        mp[file].second++;
        
    }
    
    //先将mp的数据存放在vector,以便排序
    vector< pair > > vec;
    map >::iterator it = mp.begin();
    for( ; it != mp.end(); ++it)
        vec.push_back(make_pair(it->first, make_pair(it->second.first, it->second.second)));
    
    
    //排序
	stable_sort(vec.begin(), vec.end(), COMPARE);
    
    //输出
    for(int i = 0; i < vec.size() && i < 8; ++i){
        string outstr = vec[i].first;
        int k = outstr.find(' ');
        if(k > 16)
            outstr = outstr.substr(k-16);
        cout<

不知道能否优化下。。。


你可能感兴趣的:(笔试面试题_华为_《简单错误记录》)