29 seqlogo序列标识图
29.1 什么是序列标识图seqlogo?
序列标识图(sequence logo),序列标识图就是序列的logo,它是以图形的方式依次绘出序列比对中各个位置上出现的残基,每个位置上残基的累积可以反映出该位置上残基的一致性。每个残基对应图形字符的大小与残基在该位置上出现的频率成正比。在生物信息分析中,经常需要做序列标识图。例如,突出序列比对中的保守位置,用于研究结构域序列相似性。
本文我们就来讨论一下序列标识图seqlogo是如何绘制的。
29.1.1 绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/model/bioladder1/seqLogo/demoData.txt下载。
数据有且只有一列,没有行名与列名。内容是氨基酸序列。
29.1.2 R语言怎么画序列标识图seqlogo
library(ggseqlogo)
= read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/model/bioladder1/seqLogo/demoData.txt",header = F)
df
= c()
csl # # 自定义每个字母的颜色
# csl <- make_col_scheme(chars = c("A"), cols = c("red"))
ggseqlogo(df,
method = "prob", # 定义统计方式"prob"百分比;bits;“custom”
col_scheme = csl) # 定义颜色方案
# 其他基于ggplot2的代码也可以用,略
29.1.3 BioLadder生信云平台在线绘制序列标识图seqlogo
不想写代码?可以用BioLadder生信云平台在线绘制序列标识图seqlogo。
网址:
seqlogo-BioLadder生物信息在线分析可视化云平台www.bioladder.cn/web/#/chart/32