【教程】树上启发式合并

ID: 579

客观题

尝试: 4

已通过: 2

难度: 5

上传者:

boya

标签>

教程

广义的启发式合并就是同一个数据结构之间的合并，例如并查集合并、线段树合并等。

其核心思想就是：将小集合内元素逐一暴力并入大集合，注意大集合内元素不改变。

那为何时间复杂度是 $O(n\log{n})$ ?

考虑 “小集合规模+大集合规模大于等于 2倍小集合规模”，小集合每一次合并之后的规模都会至少翻倍，那么对于总共 $n$ 个元素的问题，合并次数一定是 $O(\log{n})$ , 每次合并操作元素个数不超过 $n$ , 可以得到总时间复杂度为 $O(n\log{n})$ 。

如果使用 set,map 等容器，访问、插入元素时间复杂度会增加 $O(\log{n})$ 倍，时间复杂度变为 $O(n\log^2{n})$ 。

下面利用一道例题讲解“树上启发式合并”基本写法。

例. U41492 树上数颜色

【题意简化】给定一颗 $n(1 \le n\le 10^5)$ 个节点的树，每个节点颜色给定，多次询问某个子树内颜色种类数。

【分析】

思路1：求出 dfs序，子树 $x$ 对应区间 $[dfn[x],dfn[x]+siz[x]-1]$ 。问题转化为区间数颜色，离线高效思路就是 HH项链，时间复杂度为 $O(n\log{n})$ 。也可以使用莫队，时间复杂度为 $O(n\sqrt{n})$ 。如果颜色带修改，就可以转成带修莫队。
思路2：启发式合并

这里介绍常见启发式合并写法。

1.利用容器合并

每个节点维护一个 set , DFS 求出每个节点重儿子。首先将节点容器与重儿子交换(swap, 时间复杂度为 $O(1)$ )，然后根节点信息插入，依次将轻儿子元素暴力插入根节点容器。

核心点在于，没有移动重儿子容器元素，只移动轻儿子容器元素。时间复杂度为 $O(n\log^2{n})$ ,空间复杂度为 $O(n\log{n})$ .

注意：除静态数组容器 array 外所有容器，swap() 只交换一次容器内指针，所以时间复杂度就是 $O(1)$

参考代码如下：

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e5+10;
int n,c[N],m,ans[N];
vector<int>g[N];
set<int>st[N];
int siz[N],son[N];  //子树大小 重儿子

void dfs(int x,int fa)
{
    son[x]=0; siz[x]=1;
    for(int y:g[x])
        if(y!=fa){
            dfs(y,x);
            siz[x]+=siz[y];
            if(son[x]==0||siz[y]>siz[son[x]])son[x]=y;  //重儿子
        }

    if(son[x]>0)  //重儿子存在
        swap(st[x],st[son[x]]);  //交换 时间复杂度 O(1) 

    st[x].insert(c[x]);

    //暴力合并轻儿子
    for(int y:g[x])
        if(y!=fa && y!=son[x])
            for(int i:st[y])st[x].insert(i);
    
    ans[x]=st[x].size();

}
int main()
{
    ios::sync_with_stdio(false); cin.tie(0);
    cin>>n;
    for(int i=1;i<n;i++)
    {
        int u,v;
        cin>>u>>v;
        g[u].push_back(v);
        g[v].push_back(u);
    }
    for(int i=1;i<=n;i++)cin>>c[i];
    dfs(1,0);
    cin>>m;
    while(m--)
    {
        int q;
        cin>>q;
        cout<<ans[q]<<"\n";
    }
    return 0;
}

2.利用全局计数数组统计种类数

利用容器启发式合并，时间复杂度并不是最优的，可以进一步优化。

可以定义一个全局计数数组，利用计数数组统计种类数。时间复杂度可以优化到 $O(n\log{n})$ 。

核心思路如下：

递归时求出当前节点 $x$ 的重儿子，之后优先递归计算轻儿子，最后递归计算重儿子。

重儿子信息保留（在全局数组中），接下来将所有轻儿子信息加入全局计算数组，根节点信息加入全局数组。

回溯的时候，如果当前节点是轻儿子，要删除。示意图如下：

启发式合并示意图

也就是说，先处理轻儿子，最后处理重儿子。递归返回时，重儿子信息保留在全局数组中。只需要将轻儿子暴力再次加入，就是当前树的所有信息。

但是由于有多个轻儿子，当轻儿子访问结束时，需要删除掉所有轻儿子信息，即回溯时删除轻儿子信息。递归函数需要区别回溯时删除或者不删除，增加一个参数 keep，核心参加代码框架如下：

void dfs2(int x,int fa,int keep)
{
    //先计算轻儿子
    for(int y:g[x])
        if(y!=fa && y!=son[x])
            dfs2(y,x,0);

    //计算重儿子 并且会保留 重儿子信息
    if(son[x]>0)dfs2(son[x],x,1);

    //只计算轻儿子
    for(int y:g[x])
    	if(y!=fa && y!=son[x])
        Add(y,x); //将子树 y 加入 
    
    add(x);//加入 x 信息
  
    ans[x]=num;  //保留答案

    if(keep==0)  //删除轻儿子信息
        Del(x,fa);   
}

常见会有两种写法，本质都是相同的。

一种递归添加子树删除子树，参考如下。另外一种将所有子树利用 dfs 序变为区间，添加和删除子树时访问 dfs序上一段区间。

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e5+10;
int n,c[N],m;
vector<int>g[N];
int son[N],siz[N],dfn[N],L[N],R[N],tim;  //dfs 序
int cnt[N],num,ans[N]; 

void dfs1(int x,int fa)
{
    dfn[++tim]=x; //dfs 序
    L[x]=tim;     //x 子树中 dfs 序最小值
    siz[x]=1;    son[x]=0;
    for(int y:g[x])
        if(y!=fa)
        {
            dfs1(y,x);
            siz[x]+=siz[y];
            if(son[x]==0||siz[y]>siz[son[x]])son[x]=y;  //重儿子
        }
    R[x]=tim; // x 子树中 dfs 序最大值
}
void add(int x)
{
    cnt[c[x]]++;
    if(cnt[c[x]]==1)num++;
}
void del(int x)
{
    cnt[c[x]]--;
    if(cnt[c[x]]==0)num--;
}
void Add(int x,int fa)
{
	cnt[c[x]]++; if(cnt[c[x]]==1)num++;
	for(int y:g[x])
		if(y!=fa)Add(y,x);
}
void Del(int x,int fa)
{
	cnt[c[x]]--; if(cnt[c[x]]==0)num--;
	for(int y:g[x])
		if(y!=fa)Del(y,x);
	
}
void dfs2(int x,int fa,int keep)
{
    //先计算轻儿子
    for(int y:g[x])
        if(y!=fa && y!=son[x])
            dfs2(y,x,0);

    //计算重儿子 并且会保留 重儿子信息
    if(son[x]>0)dfs2(son[x],x,1);

    //只计算轻儿子
    for(int y:g[x])
    	if(y!=fa && y!=son[x])Add(y,x);
    
    add(x);
    ans[x]=num;

    if(keep==0)
        Del(x,fa);   
}
int main()
{
    ios::sync_with_stdio(false); cin.tie(0);
    cin>>n;
    for(int i=1;i<n;i++)
    {
        int u,v;
        cin>>u>>v;
        g[u].push_back(v);
        g[v].push_back(u);
    }
    for(int i=1;i<=n;i++)
        cin>>c[i];

    dfs1(1,0);
    dfs2(1,0,0);

    cin>>m;
    for(int i=1;i<=m;i++)
    {
        int q;
        cin>>q;
        cout<<ans[q]<<"\n"; 
    }        
    
    return 0;
}

另外一种将子树转换为区间，参考代码：点击

类似题目： P9233 [蓝桥杯 2023 省 A] 颜色平衡树

其他例题

1.[ABC372E] K-th Largest Connected Components

2.GYM106161 L. Label Matching

3.P3201 [HNOI2009] 梦幻布丁

4.CF1899G Unusual Entertainment

【题意简化】给定一棵 $n(n\le 10^5)$ 个节点的树，以及一个长度为 $n$ 的排列 $p$ ， $q(q \le 10^5)$ 组询问，每次询问 $l,r,x$ ，需要回答在 $p_l ∼p_r$ 中有没有 $x$ 的后代.

【分析】对于询问 $p_l ∼p_r$ 其下标位置是连续的，那么将节点映射到排列中的位置。问题就转化为子树内能否找到 $l ∼ r$ 连续段。

思路一：将树上每个节点映射到排列的下标，利用容器 set 维护子树所有下标集合（启发式合并高效维护）。对于询问 $l,r,x$ ，在 $x$ 集合中二分查找第一个大于等于 $l$ 的位置，如果位置上对应的值小于 $r$ ，结果就是 'YES'. 时间复杂度 $O(n \log^2{n})$

参考代码：点击

思路二：利用树状数组，对应位置上 +1 ，子树中所有位置信息都存入树状数组（启发式合并维护）。对于询问 $l,r,x$ ，如果 query(r)-query(l-1)>0 说明子树中有后代节点。时间复杂度 $O(n\log{n})$

参考代码：点击

5.CF600E Lomsat gelral

【题意简化】给定一颗 $n(n \le 10^5)$ 个节点，根节点为 $1$ 的有根树，每个节点颜色编号为 $c_i(c_i\le n)$ ,询问每个节点对应子树内颜色出现次数最多的颜色编号之和。

【分析】启发式合并维护子树内颜色出现次数最多的颜色编号，同时维护出编号之和。注意轻儿子回溯时要清空。

参考代码：点击

当然本题思维更简单的做法是线段树，每次儿子线段树合并到根对应的线段树中。动态开点，线段树维护出现次数最多颜色次数，和对应颜色之和。

参考代码：点击

6.CF375D Tree and Queries

【题意简化】给定一个 $n(\le 10^5)$ 个节点的有根树（根节点为 $1$ ），节点 $i$ 的颜色为 $c_i$ . $m(\le 10^5)$ 次询问，询问子树 $v$ 内有多少种颜色，出现次数大于等于 $k$ .

【分析】启发式合并维护子树内每种颜色出现次数，再增加一个数组维护颜色种类数，num[x] 表示颜色大于等于 x 的颜色种类数。

参考代码：点击

7.CF208E Blood Cousins

【题意简化】给定 $n(\le 10^5)$ 个节点的森林， $m(\le 10^5)$ 次询问，询问 $v$ 的 $p$ 级表亲的数量。

【分析】求出 $v$ 的 $p$ 级祖先，问题转化为求祖先的 $p$ 的级儿子数量。用启发式合并维护子树不同节点深度的数量。

参考代码：点击

类似题目： CF246E

8. CF570D Tree Requests

【题意简化】给定一颗 $n(\le 5*10^5)$ 个节点的树，每个节点对应的字母。 $m(\le 5*10^5)$ 次询问，询问子树 $v$ 中，深度为 $h$ 的节点字母重新排列，能否后构成回文串。

【分析】如果构成回文，那么要求出现的字母出现奇数的次数不能超过 1 . 子树内不同深度节点字母，放入对应的深度容器中（set），可以放入前判断之前是否存在，如果存在，就删除，否则插入容器。查询时，检查对应容器 size。

参考代码：点击

9. CF1709E. XOR Tree

【题意简化】给定一个带点权的树，路径的权值定义为该路径上所有顶点的值的按位异或。我们称一棵树是“好”的，如果不存在权值为 $0$ 的简单路径。最少需要进行多少次操作（修改一个点的点权，修改为任意整数），才能使这棵树变为“好”的？

【分析】从根到点 $x$ 的点权异或和定义为 $d[x]$ ，那么路径 $x->y$ 路径异或可以表示为 $d[x]\oplus d[y] \oplus a[lca]$ . 用set 维护子树内 d[] , 子树间合并的时候，查询是否存在 d[y]^a[x] , 如果存在就需要修改 x 节点权值。

参考代码：点击

学习完毕

{{ select(1) }}

#edu3010. 【教程】树上启发式合并

例. U41492 树上数颜色

1.利用容器合并

2.利用全局计数数组统计种类数

其他例题

1.[ABC372E] K-th Largest Connected Components

2.GYM106161 L. Label Matching

3.P3201 [HNOI2009] 梦幻布丁

4.CF1899G Unusual Entertainment

5.CF600E Lomsat gelral

6.CF375D Tree and Queries

7.CF208E Blood Cousins

8. CF570D Tree Requests

9. CF1709E. XOR Tree

学习完毕

状态

开发

支持

#edu3010. 【教程】树上启发式合并

【教程】树上启发式合并

例. U41492 树上数颜色

1.利用容器合并

2.利用全局计数数组统计种类数

其他例题

1.[ABC372E] K-th Largest Connected Components

2.GYM106161 L. Label Matching

3.P3201 [HNOI2009] 梦幻布丁

4.CF1899G Unusual Entertainment

5.CF600E Lomsat gelral

6.CF375D Tree and Queries

7.CF208E Blood Cousins

8. CF570D Tree Requests

9. CF1709E. XOR Tree

学习完毕

状态

开发

支持

还没有账户？

登录