基于predictprotein平台的蛋白质结构预测

admin•2025-03-23 12:31:16•网站建设•阅读59

2024年4月16日发(作者：)

龙源期刊网

基于predictprotein平台的蛋白质结构预测

作者：马相如肖冬

来源：《计算机光盘软件与应用》2013年第14期

摘要：基于predictprotein平台，通过整合threader、ROSETTA和ZDOCK等关于大分子

建模的免费软件包，构建了蛋白质结构预测虚拟机，并对不能进行同源建模的BmKAP蛋白质

序列的二级结构和三维结构分别进行了初步预测。

关键词：蛋白质结构预测；ROSETTA；虚拟机

中图分类号：Q518

随着DNA和蛋白质测序速度的加快，蛋白质结构需求的日益增多，人们迫切需要一种不

依赖于传统物理化学方法能够准确预测出蛋白质结构的方法[1，2]。因此，基于已有的蛋白质

结构数据库，利用同源建模和计算化学的方法进行蛋白质结构预测显得日益重要。在蛋白质二

级结构预测中以神经网络方法为主[3，4]，其中被称为PHD的神经网络预测方法整合了多种神

经网络方法的优点，具有较高的准确性[5]。蛋白质三级（或三维）结构的预测方法则主要分

为三种：同源性（homology）、从头计算（ab initio）和穿线法（threading）等方法[6]，其中

模板库中已有相似序列的同源性预测方法准确性最高。

进入21世纪以后，数据整合与软件集成已经成为目前生物信息学的研究热点和重要方向

[7，8]。集成整合Linux操作系统及其平台上众多的生物信息学免费软件，建立基于个人电脑

或局域网服务器的生物信息学平台，是目前国内外大学或研究机构生命科学教学和科研过程中

普遍采用的一个策略[8]。被称为蛋白质结构预测标准的 predictprotein平台[9]就是由美国哥伦

比亚大学生物信息中心整合开发的基于Ubuntu/Linux系统的蛋白质二级结构预测平台。而

ROSETTA是进行大分子建模、三维结构从头预测和蛋白质相互作用与对接研究的免费软件

包，并自1998年以来一直在CASP（Critical Assessment of Structure Prediction）竞赛中居于领

先地位。本文集成整合了蛋白质二级结构预测平台——predictprotein平台和ROSETTA等蛋白

质三维结构从头预测软件包，并对不能进行同源建模的BmKAP蛋白质序列的二级结构和三维

结构分别进行了初步预测。

1 软件与方法

1.1 计算机硬件

本研究所需计算机硬件的最低要求如下：CPU处理器主频2GHz以上（如果在虚拟机上运

行，则要求CPU支持虚拟技术），最小分配内存4GB，硬盘容量大于100GB。

1.2 主要软件包的获取与安装

龙源期刊网

本研究所需要的各个软件下载地址如表1所示。

用户可以在Windows平台上安装VirtualBox虚拟机，在虚拟机中装载bio-linux系统（iso

文件），然后在该系统中挂载Predict Protein Machine Image（PPMI）数据库；也可以将下载的

iso文件刻录成光盘或制作成USB驱动盘，再独立安装在计算机中。具体安装使用方法见bio-

linux网站的使用手册。

表1中threader、PROSPECT、ROSETTA、VMD和ZDOCK等软件是用来预测蛋白质三

维结构、分子动力学模拟和分子对接等，弥补了predictprotein平台在蛋白质三维结构预测（特

别是从头计算）方面的不足。ROSETTA等软件包下载解压后，可以参照README等类似说

明文件进行安装。如ROSETTA软件的安装，在LINUX终端解压后进入安装目录，执行scons

bin mode=release命令即可。

2 利用本平台的预测结果

2.1 蛋白质二级结构预测

这里以东亚钳蝎蝎毒BmKAP蛋白质序列[10]为例，简要说明一下蛋白质结构预测的过程

和方法。该序列是一段长度为89的氨基酸序列

（MKFVFASFALFVIFLCFSQSLSQSYFRCRDNEVFDNCISNCGPPRCSNILNTYPCTNLGPLCT

PGCKCKDGRVYDNQGRCVLQTECFQK）。在LINUX命令行终端输入“prof ”，

预测的结果为

（LEEEEHHHHHHEEEEEELLLLLLLLEEELLLHHHHHHHLLLLLLLLLLLLLLLLLLLLLLLLL

LLLLLLLLEEELLLLEEEEEEEEEEL）其中H表示α螺旋，E表示β折叠，L表示无规则卷

曲，可以看出该蛋白质中α螺旋有13个，β折叠有26个，无规则卷曲有50个。

此外，predictprotein平台中还有许多与蛋白质二级结构预测相关的命令，如coils（识别卷

曲螺旋）、conformational（识别二级结构中构型变化的氨基酸）、disulfinder（识别序列中的

二硫键）、norsp（识别序列中的非常规二级结构）、predictnls（识别序列中的核定位信

号）、profdisis（识别蛋白质和DNA间的交联位点）、profisis（识别蛋白质与蛋白质间的交联

位点）、phd（识别膜蛋白跨膜螺旋）等等。其预测结果表明：BmKAP是一个非球状蛋白

质，不包含任何核定位信号，不存在蛋白质与蛋白质间交联位点，在第31和32残基处有构型

变化的氨基酸。

2.2 使用ROSETTA预测蛋白质的三维结构

使用ROSETTA软件包的默认参数（未做任何优化和修改）进行BmKAP蛋白质序列的三

维结构从头预测（不能进行同源建模），先后运行“make_ ”、

“ccrelease -in：：file：：frag3 aaBmKAP03_05.200_v1_3 -in：file：

frag9 aaBmKAP09_05.200_v1_3 -in：：file：：fasta -out：file：silent

龙源期刊网

BmKAP_”和“extract_ccrelease -in：file：silent BmKAP_ -

in：file：fullatom -output -out：：prefix”等三个命令即可，预测的结果如图1所示。

图1 BmKAP蛋白质三维结构的solid ribbon图

2.3 蛋白质结构预测结果评估

对于BmKAP蛋白质的三维结构预测结果，使用QMEAN网页服务器[11]进行评估。评估

结果：QMEAN score，0.654；Estimated absolute quality，Z-score=-1.49；Residue error

3 讨论

由于蛋白质结构预测的复杂性和耗时性，以及在互联网上利用生物信息学服务器进行分

析，除了受网络速度限制外，还有无法保证原始实验数据的保密性以及对方服务器所使用软件

的可信性等等问题[11]，许多研究者需要构建自己的个人生物信息学分析服务器。而计算机运

算性能、存储技术和虚拟技术的飞速发展，使在个人电脑上建立跨平台的各种虚拟机成为现

实，从而可以在个人电脑上交叉使用Windows、Linux、Mac等各种操作系统依赖的生物信息

学软件。此外，利用LiveCD/LiveUSB等软件还可以将predictprotein平台（Ubuntu Linux 12.04

LTS系统）安装在优盘、闪存等各种可移动的存储工具上，建立可随身携带（1个体积极小、

重量极轻的闪存盘）的个人生物信息学移动分析平台。

除了蛋白质结构预测方面的软件之外，predictprotein平台中已经预安装或自带了各种序列

编辑和比对、分子系统发育和分子生态学分析以及作图等多种生物信息学相关软件包，如

arb、emboss、mothur、MrBayes、qiime、splitstree 、staden 、t-coffee、wise2等，详见网页列

表（ http：///tools/bio-linux/package-list）。其中，Qiime（Quantitative insights

into microbial ecology，http：///）作为微生物分子生态学分析的一个标准软件，也单

独提供基于64位Ubuntu Linux 12.04 LTS操作系统的VirtualBox虚拟机下载服务（ftp：

///pub/QIIME-v1.7.0-dependencies/）。

参考文献：

[1]李明，苏显中，于敏，郑全喜.蛋白质结构预测进展[J].生物技术，2009，19（3）：87-

90.

[2]Wei Zhu，Jingyu Hou，Yi-Ping Phoebe ting multi-layered information to

iteratively predict protein functions[J].Mathematical Biosciences，2012，236：108-116.

[3]鲁静，崔波.人工神经网络在蛋白质结构预测和QSAR中的应用[J].广东化工，2009，

199（36）：92-93.

龙源期刊网

[4]殷志祥，张家秀.神经网络在蛋白质结构预测中的应用[J].中国科技信息.2005，11：28-

29.

[5]何琴，高建华，刘伟.蛋白质二级结构预测的人工神经网络方法研究[J].分析科学学

报.2006，22（4）：438-440.

[6]王俊，丛丽娟，郑洪坤.常用生物数据分析软件[M].北京：科学出版社，2008.

[7]刘君强，彭智勇，杨先娣.生物信息集成研究综述[J].小型微型计算机系统，2007，28

（12）：2299-2304。

[8]马相如，王红梅，顾延生，葛继稳.基于局域网的生物信息学应用与开发平台的建立[J].

计算机应用，2009，29：1001-9081.

[9]Field，D.，Tiwari，B.，Booth，T.，Houten，S.，Swan，D.，Bertrand，

Thurston， Software for biologists： from famine to feast[J].Nature Biotechnology，2006，

24：801-803.

[10]Zeng，X.C.，Wang， Li，fication of BmKAPi，a novel type of

scorpion venom peptide with peculiar disulfide bridge pattern from Buthus martensii

Karsch[J].Toxicon，2002，40（12）：1719-1722.

[11]Benkert P Kuenzli M，Schwede Server for Protein Model Quality

Estimation[J].Nucleic Acids Res，2009，37：W510-W514.

作者简介：马相如（1977-），男，河南郑州人，讲师，从事生物统计学、生物信息学方

面的教学与研究。

作者单位：中国地质大学（武汉）环境学院，武汉 430074

基金项目：中央高校基本科研业务费专项资金资助项目（编号：CUGL130219）。

发布者：admin，转转请注明出处：http://www.yc00.com/web/1713198395a2202309.html

蛋白质结构预测生物平台

admin

网站建设
跨平台应用新体验：EXE转APK资源转换器
跨平台应用新体验：EXE转APK资源转换器【下载地址】EXE转APK资源转换器本仓库提供了一个资源文件，名为“EXE转APK资源转换器”。该工具的主要功能是将仅能在电脑上运行的 .exe 文件
admin
2月前
40
网站建设
windows平台下,有什么好的分屏软件推荐?3款让窗口布局更合理的App
windows平台下,有什么好的分屏软件推荐?Windows 10 系统为例，系统自带功能支持二分屏三分屏四分屏的分屏方式。比如用户通过鼠标将应用窗口拖到屏幕边缘，窗口会自动以占据 12 屏
admin
1月前
50
网站建设
⭐️Windows平台Python的下载、安装和配置环境变量——《跟老吕学Python编程》
⭐️Windows平台Python的下载、安装和配置环境变量——《跟老吕学Python编程》一、下载Windows版Python1.Python官网2.Windows版Python下载网址二、在Windows安装Python1.全自动安
admin
1月前
10
网站建设
U盘结构损坏且无法访问：原因、恢复方案与预防措施
U盘结构损坏现象描述 U盘，这一小巧便捷的存储设备，在日常工作和学习中扮演着重要角色。然而，当U盘出现结构损坏且无法访问时，用户往往会陷入焦虑与困惑。
admin
1月前
50
网站建设
hik中心服务器登录失败,蒲公英云平台登录失败解决方案
一、无法登录云平台当蒲公英接线后，电脑访问蒲公英的云平台，提示以下信息时： 1)在蒲公英本地管理界面，提示SN码：no sn f
admin
1月前
50
网站建设
实验9-10 在Windows下搭建入侵检测平台
实验九-实验十在Windows下搭建入侵检测平台实验目的：掌握在Windows中搭建基于snort的入侵检测系统（IDS）,熟悉简单的配置方法，能够
admin
1月前
30
网站建设
基于Java+SpringBoot+vue+element助农平台设计和实现
博主介绍：✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金华为云阿里云InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f
admin
29天前
00
网站建设
实现任意本地虚拟机或者本地物理机迁移上云到云平台使用，操作系统中的所有应用服务均不丢失正常使用启动，实现V2V、P2V、H2V，结合存储平台或者云平台实现热迁移服务不中断
实现任意本地虚拟机或者本地物理机迁移上云到云平台使用，操作系统中的所有应用服务均不丢失正常使用启动，实现V2V、P2V、H2V，结合存储平台或者云平台实现热迁移服务不中断。干过云计算平台的都比较清楚，云计算平台对虚拟机镜像是有一定要
admin
28天前
10
网站建设
WHAT KAN I SAY？Kolmogorov-Arnold Network (KAN)网络结构介绍及实战（文末送书）
一、KAN网络介绍 1.1 Kolmogorov-Arnold Network (KAN)网络结构的提出 2024年4月，来自MIT、加州理工学院、东北大学等团队的研究，引爆了一整个科技圈&a
admin
28天前
00
网站建设
STM32+ESP8266 WiFi连接机智云平台APP远程控制教程
本文档将介绍如何用STM32ESP8266 WiFi模块从零开始连接上机智云，并通过APP进行远程控制。机智云官网：机智云|智能物联网操作系统 (gizwits) 准备&#xff1a
admin
27天前
50
网站建设
python爬虫项目（十三）：爬取各类网盘的资源链接，搭建资源搜索平台
引言随着信息时代的发展，网盘作为一种重要的数据存储和分享工具，越来越受到用户的青睐。通过爬取各类网盘的资源链接并搭建一个资源搜索平台，可以为用户提供便捷的资源查找服务。本文将介绍如何爬取网盘资源、存储数据并搭建搜索平台的完整流程。目
admin
27天前
30
网站建设
ssm房屋租赁平台的设计与开发
系统包含：源码论文所用技术：SpringBootVueSSMMybatisMysql 免费提供给大家参考或者学习，获取源码请私聊我需要定制请私聊目录摘要
admin
26天前
10
网站建设
麒麟Linux启动目录,优麒麟目录结构介绍系统入门必备
对于Linux爱好者来说，深入了解Linux文件目录结构的标准和每个目录的详细功能，对于我们用好Linux系统至关重要，下面就由小编给大家介绍下优麒麟系统的目录结构&
admin
26天前
30
网站建设
军用emm管控平台_深信服企业移动管理EMM
深信服企业移动管理EMM (Enterprise mobility management，EMM) 为企业提供移动化管理一站式的解决方案员工只需要下载一个EMM套件，简单登录、注册后&#
admin
26天前
40
网站建设
10分钟物联网设备接入阿里云IoT平台
前言最近尝试了一下阿里云IoT物联网平台，还是蛮强大的。在此记录一下学习过程。本教程不需要任何外围硬件，一台电脑和一根能上网的网线即可。算是一篇Hello World了。先上效果图第一章
admin
26天前
00
网站建设
selenium爬取苏宁易购平台某产品的评论
目录 selenium的介绍 1、 selenium是什么？ 2、selenium的工作原理 3、如何使用selenium？ webdriver浏览器驱动设置关键步骤代码运
admin
19天前
30
网站建设
智能家居云平台设计
智能家居云平台设计摘要智能家居是未来家居的发展方向，其利用先进的网络技术、计算机技术和无线通信技术等将家居中的各种电子电气设备连接起来，统一管理、远程监控和资源共享&#xff0
admin
17天前
10
网站建设
Python获取系统及硬件信息（CPU、内存、硬盘、网络等），支持多平台 Windows、Linux
即可获取windows系统及硬件信息又可获取linux系统及硬件信息一站式，全平台！ 文章底部直接贴完整代码，先上介绍和函数说明 system-info 基于py
admin
17天前
30
网站建设
使用SwitchHosts快速切换hosts（Windows平台快速切换hosts）
场景：平时的开发中经常涉及到环境（域名-IP）的切换，生产环境、测试环境等时不时都要切换域名对应的IP，总不可能每次都去 C:W
admin
17天前
20
网站建设
Windows平台下编译libsrtp类库
官网下载地址： https:githubciscolibsrtpreleasestagv2.4.2 安装Cmake，官网下载地址： Download |
admin
1天前
10

发表回复

评论列表（0条）

暂无评论

基于predictprotein平台的蛋白质结构预测

发表回复

评论列表（0条）

联系我们

400-800-8888

基于predictprotein平台的蛋白质结构预测

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888

分享到：