23、合并K个升序链表

复制
全文

下载
全文

23、合并 K 个升序链表

题意

给你一个链表数组，每个链表都已经按升序排列。

请你将所有链表合并到一个升序链表中，返回合并后的链表。

难度

困难

标签

排序、链表、堆

示例

输入：lists = [[1,4,5],[1,3,4],[2,6]]

输出：[1,1,2,3,4,4,5,6]

解释：链表数组如下：

[

1->4->5,

1->3->4,

2->6

]

将它们合并到一个有序链表中得到。

1->1->2->3->4->4->5->6

分析

合并 K 个升序链表，很容易就让我们想到之前做过的 021.合并两个有序链表，这道题是

升级版，合并 K 个。

021 题解的思路是通过比较两个链表的头节点，更小的那个就是新链表的头节点，再从剩

余的里面找到下一个节点。

021.%E5%90%88%E5%B9%B6%E4%B8%A4%E4%B8%AA%E6%9C%89%E5%BA%8F%E

9%93%BE%E8%A1%A8-20240202192400.png

那我们能不能用相同的方法来完成 K 个升序链表的合并呢？

第一个链表与第二个链表合并，然后新的链表再与第三个链表合并……，以此类推，看上

去能实现我们的目的。

但很遗憾，这样做的话，每一次合并后的新链表就会非常臃肿，并且在与第 K 个链表合

并时，之前链表的节点会多次被访问。

第一个链表被访问 k - 1 次，第二个链表被访问 k - 2 次……

看来不太行啊，我们需要另寻他路。

堆。

好了，我来告诉大家答案啦，我们可以把 k 个链表的节点都扔到堆中，然后就可以快速得

到最小的那个节点。堆顶的那个节点就是最小的。

023.%E5%90%88%E5%B9%B6K%E4%B8%AA%E5%8D%87%E5%BA%8F%E9%93%BE%

E8%A1%A8-20240204154331.png

每次把堆顶的那个节点取出来放到新的链表里，是不是瞬间一道难题就变成了一道简单题

呢？

先不着急看题解，我们来讲讲最小堆。

上图中的堆就叫最小堆，Min Heap，一种特殊的完全二叉树，满足以下性质：对于树中

的每个非叶子节点，节点的值都小于或等于其子节点的值。

这个特质确保了树的根节点总是所有节点中的最小值。

最小堆支持高效的数据插入和删除最小元素的操作，这使得它非常适合用来实现优先级队

列（Priority Queue）。

优先级队列允许按照一定的优先级顺序（如从小到大或从大到小）移除和添加数据。

• 插入操作：当插入一个新元素时，元素会被放在树的底部，然后，这个元素会和它的

父节点比较，如果新元素小于父节点，它们会交换位置。这个过程会一直持续，直到

新元素的父节点小于或等于新元素，或者新元素到达了根节点。

• 删除操作：删除最小元素通常意味着删除根节点。删除根节点后，通常会将最后一个

元素移动到根节点的位置，然后进行下沉操作（与子节点比较并与较小的子节点交

换），直到恢复最小堆的性质。

来具体模拟一下哈。

初始最小堆

假设我们有一个初始的最小堆，如下所示：

7 9

10 15

插入新元素

现在，我们尝试插入一个新元素 6 到这个最小堆中。

①插入：首先，我们将 6 放在树的底部，以保持完全二叉树的结构。完全二叉树要求除

了最后一层外，每一层都被完全填满，当插入一个新元素时，它总是被添加到这个完全二

叉树的最后一个位置，以保持树的完整性和平衡。

7 9

10 15 6

②、调整：由于 6 小于其父节点 9，我们需要调整堆，以恢复最小堆的性质。6 和 9 交换

位置。

7 6

10 15 9

现在，最小堆的性质恢复了，插入操作完成。

删除最小元素

接下来，我们尝试删除最小元素，即当前堆顶的 5。

①、删除：移除根节点 5，通常我们会将最后一个元素（这里是 9）移动到根节点的位

置。

7 6

10 15

②、调整：由于 9 大于其子节点 6 和 7，我们需要调整堆。9 应该与其最小的子节点 6 交

换位置，以恢复最小堆的性质。

7 9

10 15

现在，最小堆的性质再次恢复了，删除操作完成。

可以看到，刚好与我们的需求相符，我们可以通过最小堆来实现合并 K 个升序链表。

在 Java 中，优先级队列 PriorityQueue 就可以用来实现一个最小堆，我们通过重写

Comparator 接口中的 compare() 方法，定义出优先顺序，让 PriorityQueue 按照节点

（ListNode）的值（val）大小排序即可。

OK，我们先来看比较规则：

static Comparator<ListNode> cmp = new Comparator<ListNode>() {

@Override

public int compare(ListNode o1, ListNode o2) {

//重写 compare()方法，自定义 PriorityQueue 内部顺序

return Integer.compare(o1.val, o2.val);

}

};

然后我们就可以创建一个优先级队列 PriorityQueue 了：

PriorityQueue<ListNode> queue = new PriorityQueue<>(cmp);

也可以简化成：

PriorityQueue<ListNode> queue = new PriorityQueue<>((a, b) -> a.val - b.val);

通过 Lambda 表达式，可以更加简洁地定义比较规则。

接着，我们将链表的所有节点都放到优先级队列中：

for (ListNode list : lists) {

while (list != null) {

queue.add(list);

list = list.next;

}

然后，我们依次取出最小的节点，放到新的链表中：

ListNode dummy = new ListNode(0);

ListNode tail = dummy;

while (!queue.isEmpty()) {

tail.next = queue.poll();

tail = tail.next;

}

最后，我们删除最后一个节点的 next 指针，然后返回新链表的头节点：

tail.next = null;

return dummy.next;

为什么要 tail.next = null; 呢？

在从优先级队列中取出节点并将其添加到新链表的尾部时，这个节点可能仍然保留着其在

原链表中的 next 指针。如果不将 tail.next 设置为 null，那么新链表的尾部可能会通过这

个未清除的 next 指针指向一个已经存在于新链表中的节点，从而创建一个循环引用。

我们来举一个没有 tail.next = null 的例子说明下：

-2 -> -1 -> -1 -> -1

-5 -> -3

假如第一个链表中的第二个节点 -1 出现在新链表的最后一个节点，那么新链表的最后一

个节点的 next 将指向第三个节点 -1，这样就会形成一个循环引用。

OK，来看完整的代码：

/**

* Definition for singly-linked list.

* public class ListNode {

* int val;

* ListNode next;

* ListNode() {}

* ListNode(int val) { this.val = val; }

* ListNode(int val, ListNode next) { this.val = val; this.next = next; }

class Solution {

public ListNode mergeKLists(ListNode[] lists) {

// 初始化优先级队列

PriorityQueue<ListNode> queue = new PriorityQueue<>((n1, n2) -> n1.val -

n2.val);

// 将所有链表的所有节点都添加到优先级队列中

for (ListNode list : lists) {

while (list != null) {

queue.add(list);

list = list.next;

}

ListNode dummy = new ListNode(0);

ListNode tail = dummy;

// 从优先级队列中依次取出节点，构建新的链表

while (!queue.isEmpty()) {

tail.next = queue.poll(); // 连接新节点

tail = tail.next; // 移动尾指针

}

tail.next = null; // 防止老的 next 指针影响新链表的结构

return dummy.next;

}

OK，我们来看一下题解效率：

023.%E5%90%88%E5%B9%B6K%E4%B8%AA%E5%8D%87%E5%BA%8F%E9%93%BE%

E8%A1%A8-20240204200524.png

分析 2

只击败了 39% 的用户，看来我们的题解效率还可以继续提高。那怎么提高呢？

在前面的题解里，我们一次性将所有的链表节点都加入到了优先级队列中，这样就增加了

优先级队列的维护成本。

• 时间复杂度：O(N log N)，其中 N 是所有链表中节点的总数。每次向优先级队列中加

入或取出节点时，都需要 O(log N) 的时间进行堆调整。由于二叉堆是完全二叉树，

其高度 h 与节点数量 n 之间的关系是 h = O(log n)。具体来说，对于含有 n 个节点的

完全二叉树，其高度大约是 log2(n)。这是因为，每增加一层，节点数量大约翻一

倍。

• 空间复杂度：O(N)，因为需要将所有节点都存储在优先级队列中。

在这种方法中，由于一次性将所有节点都加入到优先级队列中，队列的大小会达到 N，这

导致了每次插入和删除操作都需要在一个较大的堆上进行，增加了堆调整的成本。

好，我们来看下面这张图。

023.%E5%90%88%E5%B9%B6K%E4%B8%AA%E5%8D%87%E5%BA%8F%E9%93%BE%

E8%A1%A8-20240204202427.png

可以看到，我们只需要将 K 个链表的头节点加入到优先级队列中，也能得到一个最小

堆，然后我们就可以通过优先级队列的特性，快速得到最小的节点。

之后再把最小的节点取出来，把它的 next 节点加入到优先级队列中，如此循环，直到优

先级队列为空。

这样，我们就只需要维护一个 K 大小的优先级队列，而不是 N 大小的优先级队列。

• 时间复杂度：O(N log K)，其中 N 是所有链表中节点的总数，K 是链表的数量。每次

向优先级队列中加入或取出节点时，都需要 O(log K) 的时间进行堆调整。

• 空间复杂度：O(K)，因为队列中最多同时只有 K 个元素，即每个链表的当前头节

点。

在这种方法中，优先级队列的大小被限制为 K，这意味着堆调整的成本相比于之前的方法

大大减少了。

定义一个优先级队列：

PriorityQueue<ListNode> queue = new PriorityQueue<>((n1, n2) -> n1.val -

n2.val);

然后将 K 个链表的头节点加入到优先级队列中：

for (ListNode list : lists) {

if (list != null) {

queue.add(list);

}

接着，我们依次取出最小的节点，放到新的链表中：

ListNode dummy = new ListNode(0);

ListNode tail = dummy;

while (!queue.isEmpty()) {

ListNode minNode = queue.poll();

tail.next = minNode;

tail = tail.next;

if (minNode.next != null) {

queue.add(minNode.next);

}

最后，我们删除最后一个节点的 next 指针，然后返回新链表的头节点：

tail.next = null;

return dummy.next;

OK，我们来看完整的代码：

class Solution {

public ListNode mergeKLists(ListNode[] lists) {

// 初始化优先级队列

PriorityQueue<ListNode> queue = new PriorityQueue<>((n1, n2) -> n1.val -

n2.val);

// 将 K 个链表的头节点加入到优先级队列中

for (ListNode list : lists) {

if (list != null) {

queue.add(list);

}

ListNode dummy = new ListNode(0);

ListNode tail = dummy;

// 从优先级队列中依次取出节点，构建新的链表

while (!queue.isEmpty()) {

ListNode minNode = queue.poll();

tail.next = minNode; // 连接新节点

tail = tail.next; // 移动尾指针

if (minNode.next != null) {

queue.add(minNode.next); // 将下一个节点加入到优先级队列中

}

tail.next = null; // 防止老的 next 指针影响新链表的结构

return dummy.next;

}

来看题解的效率：

023.%E5%90%88%E5%B9%B6K%E4%B8%AA%E5%8D%87%E5%BA%8F%E9%93%BE%

E8%A1%A8-20240204203826.png

果然提升了不少。

总结

这道题我们通过优先级队列 PriorityQueue 来实现了合并 K 个升序链表，涉及到了我们

之前未曾接触过的数据结构——堆。

最小堆是一种特殊的完全二叉树，满足以下性质：对于树中的每个非叶子节点，节点的值

都小于或等于其子节点的值。

记住这个特质。

这样子就能够把最小的元素放在根节点上，$ O(1) $ 的时间复杂度就得到了最小的元素。

怎么实现在$ O() $的时间内插入一个新元素呢？

要维持完全二叉树的特质，就只能在最底层的最右边的叶子节点的右边插入，如果最底

层满了，那么就新建一层，再放到这一层中的最左边即可。

那么第二步就是要维护 “每个节点的值都大于等于父节点的值” 这个特质。如果插入的这

个节点的值小于它的父节点，那么它就向上调整，跟它的父节点直接交换，一直向上调

整，直到它不小于父节点或者抵达了根节点，如下：

023.%E5%90%88%E5%B9%B6K%E4%B8%AA%E5%8D%87%E5%BA%8F%E9%93%BE%

E8%A1%A8-20240204205030.png

如何删除呢？

我们显然不能直接删掉根节点，那样就变成了两个最小堆（小根堆）。

一般会把根节点与最后一个节点交换，然后删除。如果当前的结构不满足最小堆的特质，

需要向下调整，与子节点中比较小的一个交换位置，直到恢复最小堆。因为树高最多$

，所以我们最多就调整 $次。

回顾一下这道题所涉及到的 Java 基础知识：

• 优先级队列 PriorityQueue

• Lambda 表达式

• Comparator 接口

• 时间复杂度

• 链表 LinkedList

力扣链接：https://leetcode.cn/problems/merge-k-sorted-lists/

23、合并K个升序链表

相关文章