来源:力扣(LeetCode)
描述:
这个问题和“最多能完成排序的块”相似,但给定数组中的元素可以重复,输入数组最大长度为2000,其中的元素最大为108。
arr
是一个可能包含重复元素的整数数组,我们将这个数组分割成几个“块”,并将这些块分别进行排序。之后再连接起来,使得连接的结果和按升序排序后的原数组相同。
我们最多能将数组分成多少块?
示例 1:
输入: arr = [5,4,3,2,1]
输出: 1
解释:
将数组分成2块或者更多块,都无法得到所需的结果。
例如,分成 [5, 4], [3, 2, 1] 的结果是 [4, 5, 1, 2, 3],这不是有序的数组。
示例 2:
输入: arr = [2,1,3,4,4]
输出: 4
解释:
我们可以把它分成两块,例如 [2, 1], [3, 4, 4]。
然而,分成 [2, 1], [3], [4], [4] 可以得到最多的块数。
注意:
方法一:排序 + 哈希表
思路
记数组 arr 长度为 n,排完序的数组为 sortedArr。首先,将原数组分为一块,肯定是可行的。原数组直接排序,和将它分为一块后再排序,得到的数组是相同的。那么,如何判断一个数组是否能分为符合题意的两块呢?如果一个数组能分为两块,那么一定能找到一个下标 kk,这个下标将数组分为两个非空子数组 arr[0,…,k] 和 arr[k+1,…,n−1],使得arr[0,…,k] 和 sortedArr[0,…,k] 的元素频次相同,arr[k+1,…,n−1] 和 sortedArr[k+1,…,n−1] 的元素频次相同。判断能否分为更多的块时同理。这个判断过程可以从左至右同时遍历 arr 和 sortedArr,并用一个哈希表 cnt 来记录两个数组元素频次之差。当遍历到某个下标时,如果 cnt 内所有键的值均为 0,则表示划分出了一个新的块,最后记录有多少下标可以使得 cnt 内所有键的值均为 0 即可。
代码:
class Solution {
public:
int maxChunksToSorted(vector<int>& arr) {
unordered_map<int, int> cnt;
int res = 0;
vector<int> sortedArr = arr;
sort(sortedArr.begin(), sortedArr.end());
for (int i = 0; i < sortedArr.size(); i++) {
int x = arr[i], y = sortedArr[i];
cnt[x]++;
if (cnt[x] == 0) {
cnt.erase(x);
}
cnt[y]--;
if (cnt[y] == 0) {
cnt.erase(y);
}
if (cnt.size() == 0) {
res++;
}
}
return res;
}
};
执行用时:12 ms, 在所有 C++ 提交中击败了37.99%的用户
内存消耗:13.2 MB, 在所有 C++ 提交中击败了14.85%的用户
复杂度分析
时间复杂度: O(nlogn),其中 n 是输入数组 arr 的长度。排序需要消耗 O(nlogn) 的时间复杂度,遍历一遍消耗 O(n) 的时间复杂度。
空间复杂度:O(n)。排序完的数组和哈希表均需要消耗 O(n) 的空间复杂度。
方法二:单调栈
思路
对于已经分好块的数组,若块数大于 1,则可以得到以下结论:右边的块的所有数字均大于或等于左边的块的所有数字。考虑这个问题:对于已经分好块的数组,若在其末尾添加一个数字,如何求得新数组的分块方式?
新添加的数字可能会改变原数组的分块方式。如果新添加的数字大于或等于原数组最后一个块的最大值,则这个新添加的数字可以自己形成一个块。如果新添加的数字小于原数组最后一个块的最大值,则它必须融入最后一个块。如果它大于或等于原数组倒数第二个块(如果有)的最大值,那么这个过程可以停止,新数组的分块方式已经求得。否则,它将继续融合原数组倒数第二个块,直到遇到一个块,使得该块的最大值小于或等于这个新添加的数,或者这个数字已经融合了所有块。
上述分析过程中,我们只用到了块的最大值来进行比较,比较过程又是从右到左,符合栈的思想,因此可以用类似单调栈的数据结构来存储块的最大值。
代码:
class Solution {
public:
int maxChunksToSorted(vector<int>& arr) {
stack<int> st;
for (auto &num : arr) {
if (st.empty() || num >= st.top()) {
st.emplace(num);
} else {
int mx = st.top();
st.pop();
while (!st.empty() && st.top() > num) {
st.pop();
}
st.emplace(mx);
}
}
return st.size();
}
};
执行用时:4 ms, 在所有 C++ 提交中击败了97.38%的用户
内存消耗:11.9 MB, 在所有 C++ 提交中击败了62.01%的用户
复杂度分析
时间复杂度:O(n),其中 nn 是输入数组 arr 的长度。需要遍历一遍数组,入栈的操作最多为 n 次。
空间复杂度:O(n)。栈的长度最多为 n。
author:LeetCode-Solution