• 蛋白结构合理性评估软件-PROCHECK的安装与使用


    蛋白结构合理性评估软件-PROCHECK的安装与使用

    由于PROCHECK这个工具真的相对比较久远了,哪怕官方给出的文档也存在部分代码无法使用了的问题.因此来记录下RPOCHECK的安装过程.下面是相关资料下载地址:

    软件包下载:https://www.ebi.ac.uk/thornton-srv/software/PROCHECK/download.html
    参考文献:
    Deviations from Standard Atomic Volumes as a Quality Measure for Protein Crystal Structures
    AQUA and PROCHECK-NMR: Programs for checking the quality of protein structures solved by NMR



    背景

    随着蛋白结构预测工具alphafold2的流行以及基于人工智能的生物大分子结构重构技术的不断强化, 如何对预测的蛋白结构进行有效的评估就成为了一个新的议题, 除了远近闻名的CASP比赛这样的使用未发布的新型蛋白结构作为对照来反映蛋白结构预测工具的准确度的方式以外,依赖几何结构, 能量项, 相互作用的通用计算指标也不失为一种简单且好用的评估方式, 而PROCHECK就是这样的一种工具.


    提示:以下是本篇文章正文内容,下面案例可供参考

    一、PROCHECK是什么?

    在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度 psi. PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成如下的Ramachandran图表示
    在这里插入图片描述

    横坐标为φ角, 纵坐标为ψ. 图中按颜色分为最合理区 (the most favored regions), 其它合理区 (the additional allowed regions), 一般合理区 (the generous allowed regions), 不合理区(the disallowed regions)。蓝色的点代表着所有的2面角, 当不少于90%的二面角分布在最佳合理区时,则蛋白质的结构是合理的。

    二、安装与使用

    1.安装

    解压软件包中的procheck.tar.gz文件, 将procomp.scr文件内的F77改为自己在用的forran语言编译器.(如gfortran), 以及删掉convax.for中的**CARRIAGECONTROL=‘LIST’**语句(该语句已经在新版本中被弃用,会报错)
    之后进行在命令行进行如下操作完成安装过程:

    csh procomp.scr                  #运行procomp.scr文件对文件夹中的文件进行编译, 有warning不用管,不影响使用
    gfortran -o convax convax.for    #编译convax.for文件
    ./convax                         #运行convax程序将.f后缀文件修改为.for
    
    • 1
    • 2
    • 3

    之后修改环境变量, 由于procheck中需要一个只想procheck根目录的prodir的环境变量才能运行,因此需要一个小写的变量名(实在变扭 +_+)

    #procheck
    export PRODIR="/path/to/your/procheck"
    export prodir=$PRODIR
    alias procheck="$PRODIR/procheck.scr"
    alias proplot="$PRODIR/proplot.scr"
    alias gfac2pdb="$PRODIR/gfac2pdb.scr"
    alias viol2pdb="$PRODIR/vio2pdb.scr"
    alias wirplot="$PRODIR/wirplot.scr"
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    2.使用

    使用方法如下所示(示例):

    procheck coordinate_file [chain-ID] resolution  #无图输出
    proplot coordinate_file [chain-ID] resolution   #有图输出
    
    • 1
    • 2

    其中 coordinate_file问pdb蛋白文件路径, [chain-ID]为链的序号(如A),是可选项可以不填, resulution为蛋白文件的分辨率.


  • 相关阅读:
    CMakeLists.txt简单项目模板
    【前端求助帖】关于使用element-plus select 模板嵌套popover中使用select选择后,上一个select自动关闭的问题
    JVM面试重点-2
    Shell 编程三剑客
    TCP和UDP的区别
    vue权限控制的想法
    前缀和(区间和,子矩阵的和)
    智能算法--2022年8月2日
    自动化运维:Ansible基础与命令行模块操作
    Java集合之Set集合
  • 原文地址:https://blog.csdn.net/recher_He1107/article/details/126226751