R语言绘制upset图

前言

本篇是R包UpSetR绘制upset图的教程。

什么是upset图?

对于集合的可视化,第一时间想到的都是韦恩图(venn diagram),一般集合不超过5个的时候,可视化效果还是不错的。但是一旦数据集增加,比如说五个的时候,你就很难从图中解读出想要的信息了。即便你把它画的很美观,但还是很难直观找到自己需要的信息。可视化的目的不是炫技,而是快速理解数据。而且普通韦恩图最大只支持7个数据集合。于是这时候就能体会出upset图的优势了。

该怎么看:

  • 左下角显示每个样本的个数

  • 右下角的点线图表示是哪几个样本之间的交集

  • 右上角的柱形图,显示和下方点阵图对应的集合交集的个数

绘图前的数据准备

​demo数据可以在https://www.r2omics.cn/res/demodata/venn.txt下载。

第一行为组名,必须要有,会出现在图中。每一列都是一个分组,下面的是分组里具体的内容。

R语言绘制upset图

# 代码来源:https://www.r2omics.cn/
# 加载R包,没有安装请先安装  install.packages("包名") 
library(UpSetR)         

# 读取数据文件
upset_dat <- read.delim('https://www.r2omics.cn/res/demodata/venn.txt') # 这里读取了网络上的demo数据,将此处换成你自己电脑里的文件
upset_list <- list(upset_dat[,1], upset_dat[,2], upset_dat[,3], upset_dat[,4], upset_dat[,5], upset_dat[,6], upset_dat[,7])   # 制作Upset图搜所需要的列表文件
names(upset_list) <- colnames(upset_dat[1:7])    # 把列名赋值给列表的key值
upset_list<- purrr::map(upset_list, na.omit)     # 删除列表中每个向量中的NA
upset_list<- purrr::map(upset_list, function(x){x[x!=""]}) # 删除列表中每个向量中的""

#作图
upset(fromList(upset_list),  # fromList一个函数,用于将列表转换为与UpSetR兼容的数据形式。
      nsets = 100,           # 绘制的最大集合个数
      nintersects = 40,      #绘制的最大交集个数,NA则全部绘制
      order.by = "freq",     # 矩阵中的交点是如何排列的。 "freq"根据交集个数排序,"degree"根据
      keep.order = F,        # 保持设置与使用sets参数输入的顺序一致。默认值是FALSE,它根据集合的大小排序。
      mb.ratio = c(0.6,0.4), # 左侧和上方条形图的比例关系
      text.scale = 1         # 文字标签的大小
)