7 蛋白理化性质
7.1 什么是蛋白质理化性质?
蛋白质理化性质即蛋白的物理化学性质,主要包括长度,分子量,等电点,疏水性。
长度和分子量:即蛋白肽段的氨基酸个数,和分子质量。
等电点:等电点是一个分子表面不带电荷时的pH值。
疏水性:疏水性指的是一个分子与水互相排斥的物理性质。
本文我们就来讨论一下怎样用BioLadder做蛋白理化性质计算。
7.1.1 绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/model/new/physicochemical/1.fasta下载。
只支持fasta格式的文件。
在 fasta 文件当中,每一个序列由两部分组成。
序列的特征性 ID,“>”大于号开头后跟描述信息。
具体的蛋白序列。
7.1.2 R语言怎么计算蛋白理化性质
library(tidyverse)
library(Biostrings) # 用于读取fasta格式
library(Peptides) # 用于计算蛋白理化性质
<- readAAStringSet("https://www.bioladder.cn/shiny/zyp/bioladder2/model/new/physicochemical/1.fasta")
fa # AAStringSet object of length 100:
# width seq names
# [1] 366 GNXGCKMARGEVSCLCLAILGXQALQRTTFL...SXHQNTIMVISEASVVFLYANSEQSEKDIKX ENST00000658203_1...
# [2] 456 AQGLNGVGVGGLEGREVKDSQAYLTTQSCXE...VFVTSIPCLQKIASDSTAYPKPIRINDNPTT ENST00000638985_1...
# [3] 2783 GSTLRRFWRGCPFLASALRLEAKLVLCLLSI...XFYYIYIYVSFNIVLYTLIXTIKFIXNIKKX ENST00000603037_1...
# [4] 1299 VPKYSTGLPSIGLPFDYFIWLPGQRDSWEPT...MGHKMFIYAPIEGHLGCFQVLANINKAVINI ENST00000641360_1...
# [5] 768 GXLRLQNGEGGGKLSLLGHLGLAGLAENYLF...CSGXFTXMEXHNRCLLSWVSFTXDVLXGNPY ENST00000652540_1...
data.frame(fa) %>%
rownames_to_column("name") %>%
mutate("长度" = Peptides::lengthpep(seq = fa)) %>% # lengthpep() 计算长度
mutate("分子量" = mw(seq = fa)) %>% # mw() 计算分子量
mutate("疏水性" = hydrophobicity(seq = fa)) %>% # hydrophobicity() 计算疏水性
mutate("等电点" = pI(seq = fa)) %>% # pI() 计算等电点
as_tibble()
# # A tibble: 100 x 6
# name fa 长度 分子量 疏水性 等电点
# <chr> chr> <int> <dbl> <dbl> <dbl>
# 1 ENST00000658203_1 GNXGCKMARGE~ 366 3.83e4 -5.85e-2 8.09
# 2 ENST00000638985_1 AQGLNGVGVGG~ 456 4.81e4 -1.80e-1 8.52
# 3 ENST00000603037_1 GSTLRRFWRGC~ 2783 3.02e5 2.52e-4 10.0
# 4 ENST00000641360_1 VPKYSTGLPSI~ 1299 1.41e5 1.77e-1 8.63
# 5 ENST00000652540_1 GXLRLQNGEGG~ 768 8.11e4 2.53e-2 8.16
7.1.3 BioLadder生信云平台在线计算蛋白理化性质
不想写代码?可以用BioLadder生信云平台在线计算蛋白理化性质。
网址:
蛋白理化性质计算-BioLadder生物信息在线分析可视化云平台www.bioladder.cn/web/#/chart/74