LeetCode/solutions/215. Kth Largest Element in an Array.md
2020-02-09 11:34:47 +08:00

140 lines
5.5 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# [215. Kth Largest Element in an Array](https://leetcode.com/problems/kth-largest-element-in-an-array/)
# 思路
给定一个数组, 要求返回其中第k大的数. 这应该属于常考的面试题了, 务必掌握. 有两个基本的思路: 快排划分的思想和最大(小)堆.
## 思路一、快排划分
我们回忆一下快排中的partition函数:
每次先(任意)确定一个中枢值pivot然后遍历其他所有的数字像这道题从大往小排的话就把大于中枢点的数字放到左半边
把小于中枢点的放在右半边,这样中枢点是整个数组中第几大的数字就确定了,虽然左右两部分各自不一定是完全有序的.
所以我们只需要调用partition函数,
* 若得到pivot的最终位置pos刚好就是k-1, 那直接返回nums[k-1];
* 若得到的pos比k-1小, 那在pos右边继续调用partition;
* 否则, 在pos左边继续调用partition.
其实STL中`nth_element`已经帮我们实现了上述过程, 注意学习使用:
``` C++
nth_element(vc.begin(), vc.begin()+5, vc.end(), cmp); // 没有返回值
```
**`nth_element`只保证第n(从0开始)个元素是位于最终排序位置的, 但其左右两边的元素则不一定有序.**
时间复杂度平均O(n)最坏O(n^2)空间复杂度O(1)
> * 平均时间复杂度粗略证明假设每次都是对半划分那么第一次划分我们需要遍历约n个数第二次需要遍历约n/2个数... 所以总的遍历次数大概就是 n + n/2 + n/4 + n/8 + ...用一个等比序列求和可得上式的极限n很大时为2n。所以这个**平均时间复杂度是与k具体多少无关的例如当k=n/2时还是这个复杂度即求中位数的平均复杂度也是O(n)。**
> * 可以先将nums顺序随机打乱这样就不会出现最坏时间复杂度的情况。
## 思路二、堆
用最小堆, 维护一个大小为k的最小堆(实际不是堆是个二叉树)新来一个元素后如果大小超过了k就去掉top元素是最小的即可, 到最后堆里就是最大的k个数堆顶为第k大的数。
由于堆大小为k**初始建堆时间复杂度是线性的**即O(k)后面删除堆顶元素和插入新元素时间都是O(logk)所以总的时间复杂度是O(nlogk)空间复杂度O(k)
> 也可以用最大堆,用最大堆的话需要将所有元素都进堆,然后再删除堆顶的元素 k-1 次。
初始建堆复杂度O(n),再加上 k-1 次删除操作所以总的时间复杂度为O(n + klogn)堆大小为n所以空间复杂度O(n)。
**所以但当n很大时是用最大堆不合理的将消耗大量空间。**
在STL中, `priority_queue`和`multiset`都可用来作为最小(大)堆, 代码以前者为例, 用`multiset`可以参考[此处](https://leetcode.com/problems/kth-largest-element-in-an-array/discuss/60309/C%2B%2B-STL-partition-and-heapsort)
**注意用priority_queue如何实现最大(小)堆, 即如何自定义比较方法(和sort、nth_element、partial_sort函数自定义比较函数写法不一样)**
其实, STL里有一个函数可以实现部分排序即`partial_sort`, 给定位置k, 该函数会将位置k前(不包含k)的元素排好序, 而k及之后元素则不一定有序.
> 建议详读[讨论区总结](https://leetcode.com/problems/kth-largest-element-in-an-array/discuss/60309/C%2B%2B-STL-partition-and-heapsort)
## 思路三、桶排序
如果数组里的元素的范围是固定的(有限的),还可以用桶排序。
# C++
## 思路一
``` C++
class Solution {
private:
int partition(vector<int> &nums, int low, int high){
int i = low, j = high;
int pivot = nums[low];
while(i < j){
while(i < j && nums[j] < pivot) j--;
nums[i] = nums[j]; // 将比pivot大的元素移到pivot左边
while(i < j && nums[i] >= pivot) i++;
nums[j] = nums[i]; // 将比pivot小的元素移到pivot右边
}
nums[i] = pivot;
return i;
}
public:
int findKthLargest(vector<int>& nums, int k){
int low = 0, high = nums.size() - 1, pos;
while(true){
pos = partition(nums, low, high);
if(pos == k - 1) return nums[pos];
if(pos < k - 1) low = pos + 1;
else high = pos - 1;
}
}
};
```
## 思路一STL版
``` C++
class Solution {
public:
int findKthLargest(vector<int>& nums, int k) {
// greater和less都重载了操作符()
nth_element(nums.begin(), nums.begin() + k - 1, nums.end(), greater<int>());
return nums[k - 1];
}
};
```
## 思路二
``` C++
class Solution {
static bool comp_func(const int &a, const int &b){
return a > b;
}
struct comp_class{
bool operator()(const int &a, const int &b){
return a > b;
}
};
public:
int findKthLargest(vector<int>& nums, int k){
// 以下三种写法都是可以的. 默认为最大堆: priority_queue<int, vector<int> > pq;
// priority_queue<int, vector<int>, greater<int>> pq;
// priority_queue<int, vector<int>, bool (*)(const int &a, const int &b) > pq(comp_func);
priority_queue<int, vector<int>, comp_class > pq;
for (int num : nums) {
pq.push(num);
if (pq.size() > k) {
pq.pop();
}
}
return pq.top();
}
};
```
## 思路二STL版
``` C++
class Solution {
public:
int findKthLargest(vector<int>& nums, int k) {
partial_sort(nums.begin(), nums.begin() + k, nums.end(), greater<int>());
return nums[k - 1];
}
};
```