给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i
篇论文被引用的次数。计算并返回该研究者的 h
指数。
根据维基百科上 h 指数的定义:h
代表“高引用次数” ,一名科研人员的 h
指数 是指他(她)至少发表了 h
篇论文,并且每篇论文 至少 被引用 h
次。如果 h
有多种可能的值,h
指数 是其中最大的那个。
示例 1:
输入:citations = [3,0,6,1,5]
输出:3
解释:给定数组表示研究者总共有 5
篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5
次。
由于研究者有 3
篇论文每篇 至少 被引用了 3
次,其余两篇论文每篇被引用 不多于 3
次,所以她的 h 指数是 3
。
示例 2:
输入:citations = [1,3,1] 输出:1
对数组进行排序,
0, 1, 3, 5, 6,从后往前遍历,若当前元素大于h,则逐渐增加
- class Solution {
- public:
- int hIndex(vector<int>& citations) {
- // 14:30
- sort(citations.begin(), citations.end());
- int h = 0;
- int i = citations.size()-1;
- while(i >= 0 && citations[i] > h){
- h++;
- i--;
- }
- return h;
- }
- };
图示
基于“计数排序”的思想,先定义一个数组,存入该引用次数的论文有几篇。然后从后往前遍历,利用累积引用次数。
官方解释:
根据上述解法我们发现,最终的时间复杂度与排序算法的时间复杂度有关,所以我们可以使用计数排序算法,新建并维护一个数组 counter\textit{counter}counter 用来记录当前引用次数的论文有几篇。
根据定义,我们可以发现 H\text{H}H 指数不可能大于总的论文发表数,所以对于引用次数超过论文发表数的情况,我们可以将其按照总的论文发表数来计算即可。这样我们可以限制参与排序的数的大小为 [0,n][0,n][0,n](其中 nnn 为总的论文发表数),使得计数排序的时间复杂度降低到 O(n)O(n)O(n)。
最后我们可以从后向前遍历数组 counter\textit{counter}counter,对于每个 0≤i≤n0 \le i \le n0≤i≤n,在数组 counter\textit{counter}counter 中得到大于或等于当前引用次数 iii 的总论文数。当我们找到一个 H\text{H}H 指数时跳出循环,并返回结果。
作者:力扣官方题解
链接:https://leetcode.cn/problems/h-index/solutions/869042/h-zhi-shu-by-leetcode-solution-fnhl/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
代码:
- class Solution {
- public:
- int hIndex(vector<int>& citations) {
- int n = citations.size(), tot = 0;
- vector<int> counter(n + 1);
- for (int i = 0; i < n; i++) {
- if (citations[i] >= n) {
- counter[n]++;
- } else {
- counter[citations[i]]++;
- }
- }
- for (int i = n; i >= 0; i--) {
- tot += counter[i];
- if (tot >= i) {
- return i;
- }
- }
- return 0;
- }
- };