计算 h-index

现在有这样一个问题, 求解 h-index.  h-index 是一种衡量一个人论文水平的参数, 其定义为 h篇文章引用超过h. 该参数越大表明一个人的学术水平越高, 但不同行业差别巨大. 一般看来生物领域偏高。


下面考虑下面一个算法问题, 已知一个列表 citel, 记录着每篇论文的引用数, 无先后顺序. 例如 [3, 10, 5, 1, 7]. 输出为该列表的h-index : 3 (最大3篇超过引用3)

函数原型如下

int hindex(const vector citel);

难度在于时间复杂度最低为多少, 如何优化该算法. 下面给出一个O(n log(n))的方法抛砖引玉


def hindex(citel):
    citel.sort()#排序算法 最耗时的部分
    h=1 if citel[-1]>0 else 0
    small=citel[-1]
    for i in citel[-2::-1]:
        if i==small and i >h:
            h+=1
        elif i>h:
            h+=1
            small=i
        else:
            break
    return h

请问, 是否可以在O(n)的复杂度上实现该算法?

你可能感兴趣的:(python,算法)