• 对MD数据的分析(FEL和DSSP)


    简介 

    建立模型进行分子动力学模拟后,对得到的轨迹进行主成分分析(PCA),绘制相关性矩阵(Correlation Matrix)和自由能井图(Free Energy Landscape)和dssp图(Definition of Secondary Structure of Proteins)

    绘制相关性矩阵图:

    使用cpptraj计算轨迹的相关性矩阵

    1. #进入amber的cpptraj程序:
    2. cpptraj
    3. ##第一步,计算轨迹的平均结构:
    4. parm tyr.prmtop
    5. trajin tyr_500.crd
    6. #计算非H原子的rmsd,保存为数据集rmsd-dataset,选择第一帧为参考文件:
    7. rms rmsd-dataset first !@H=
    8. #根据轨迹计算结构的平均构象,保存为数据集average-dataset:
    9. average crdset average-dataset
    10. run

    计算Cα原子的相关性矩阵,输出为ca_matrix.gnu文件:

    1. #利用1~30帧,计算所有CA的相关性矩阵,
    2. #输出文件为ca_matrix.gnu,保存数据集为ca_matrix:
    3. matrix covar out ca_matrix.gnu name ca_matrix start 1 stop 30 @CA

    给数据前后补上脚本,具体例子如下:

    1. #设置保存为pdf文件
    2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
    3. set output "Correlation Matrix.pdf"
    4. set size square
    5. set pm3d map
    6. #设置色条颜色,rainbow色条:
    7. set palette rgb 30,31,32
    8. #差值法解决马赛克问题:0,0是插入的值,设置越大,马赛克消除效果越好。
    9. #0,0表示让系统自动优化:
    10. set pm3d interpolate 0,0
    11. #设置标题和轴标签:
    12. set title "Correlation matrix" font "Time New Roman,14"
    13. set xlabel "atom CA" font "Time New Roman,10"
    14. set ylabel "atom CA" font "Time New Roman,10"
    15. #隐藏图例:
    16. unset key
    17. #设置x,y轴范围:
    18. set yrange [1:265]
    19. set xrange [1:265]
    20. #设置轴的小刻度线:
    21. set mxtics 3
    22. set mytics 3
    23. #刻度线向外:
    24. set xtics out
    25. set ytics out
    26. #设置色条的刻度朝内:
    27. set cbtics in
    28. #隐藏对称的刻度轴:
    29. set tics nomirror
    30. #设置色条的刻度长度:
    31. set cbtics scale 3
    32. #绘图数据:
    33. splot "-" with pm3d title "pca-out.gnu"
    34. 1.000 1.000 1.000
    35. 1.000 2.000 0.904
    36. 1.000 3.000 0.703
    37. 1.000 4.000 0.523
    38. 1.000 5.000 0.709
    39. 1.000 6.000 0.753
    40. 1.000 7.000 0.638
    41. 1.000 8.000 0.649
    42. 1.000 9.000 0.694
    43. 1.000 10.000 0.665
    44. 1.000 11.000 0.621
    45. 1.000 12.000 0.598
    46. 1.000 13.000 0.586
    47. 1.000 14.000 0.549
    48. 1.000 15.000 0.509
    49. 1.000 16.000 0.505
    50. 1.000 17.000 0.511
    51. 1.000 18.000 0.549
    52. 1.000 19.000 0.608
    53. 1.000 20.000 0.572
    54. 1.000 21.000 0.582
    55. [过多的数据省略...]
    56. set output
    57. end
    58. pause -1

    在gnuplot里拖入该gun文件。

    查看绘制的效果:

    相关性矩阵的图像呈对角线对称,色条两端颜色代表的区域对应的残基有着越强的运动相关性,颜色越浅的区域对应的残基运动相关性越弱。

    用cpptraj进行蛋白质二级结构分析(DSSP)

    编写cpptraj脚本dssp.in

    1. parm tyr.parm7 [top] #导入拓扑文件
    2. trajin tyr.nc parm [top] #导入100frame的轨迹文件
    3. center origin :236&!@H= mass #将残基236的质心作为盒子的中心对体系进行移动
    4. image origin center familiar
    5. reference tyr.pdb #导入坐标参考文件
    6. secstruct :15-68 out dssp15_68.gnu #计算15-68残基的dssp
    7. run
    8. quit

    注意:这里reference tyr.pdb很重要,不用pdb文件,它识别不了提取的残基id 

    运行脚本:

    cpptraj dssp.in

    运行gnuplot进行绘制:

    gnuplot dssp15_68.gnu

    调整gnu脚本:

    1. #设置保存为pdf文件
    2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
    3. set output "DefinitionofSecondaryStructureofProteins.pdf"
    4. set size square
    5. set pm3d map corners2color c1
    6. #隐藏图例:
    7. unset key
    8. #范围:
    9. set yr [1.000:54.000]
    10. set xrange [1.000:100.000]
    11. #刻度值:
    12. set ytics ("ILE:19" 5.000,"GLY:29" 15.000,"ARG:39" 25.000,"PHE:49" \
    13. 35.000,"GLN:59" 45.000,"PRO:68" 54.000) font "Times New Roman,10"
    14. set xtics ("0" 0,"20" 10,"40" 20,"60" 30,"80" 40,"100" 50,"120" 60,"140" 70,"160"\
    15. 80,"180" 90,"200"100) font "Times New Roman,10"
    16. #设置整个图表的空间(面积)大小:
    17. ##数值表示距离窗口左边界的距离:
    18. set lmargin at screen 0.15
    19. set rmargin at screen 0.85
    20. ##数值表示距离窗口下边界的距离:
    21. set tmargin at screen 0.78
    22. set bmargin at screen 0.20
    23. #标题和刻度标签:
    24. set xlabel "Time (ps)"
    25. set ylabel "residues"
    26. set title "Definition of Secondary Structure of Proteins 15-68"
    27. #刻度线条外翻:
    28. set tics out
    29. #色条的范围是 -0.5~7.5
    30. set cbrange [-0.0500:0.7500]
    31. #调整色条刻度值:
    32. set cbtics("None" -0.0500,"Extended" 0.05000,"Bridge" 0.1500,"3-10" \
    33. 0.2500,"Alpha" 0.3500,"Pi" 0.4500,"Turn" 0.5500,"Bend" 0.6500)
    34. set palette maxcolors 8
    35. set palette defined (0 "#000000",1 "#0000FF",4 "#00FF00",7 "#FF0000")
    36. #调整色条刻度线:
    37. set cbtics in
    38. set cbtics scale 2.8
    39. set tics nomirror
    40. splot "-" with pm3d title "dssp15_68.gnu"
    41. 1.000 1.000 0.0
    42. 1.000 2.000 0.0
    43. 1.000 3.000 0.7
    44. 1.000 4.000 0.0
    45. 1.000 5.000 0.0
    46. 1.000 6.000 0.0
    47. 1.000 7.000 0.1
    48. 1.000 8.000 0.1
    49. 1.000 9.000 0.1
    50. 1.000 10.000 0.1
    51. [过多的数据省略]
    52. set output
    53. end
    54. pause -1

    利用cpptraj进行PCA分析绘制自由能井图

    编写脚本pca.in:

    1. parm tyr.prmtop [p]
    2. trajin tyr.crd parm [p]
    3. rms rms-data :1-264&!@H= first #生成rmsd数据集
    4. run
    5. average crdset average-dataset :1-264&!@H= #生成平均构象数据集
    6. run
    7. createcrd tyr-trajectories-dataset #建立一个轨迹数据集
    8. run
    9. crdaction tyr-trajectories-dataset \ #计算这个轨迹数据集的rmsd,参考平均构象数据集
    10. rms ref average-dataset :1-264&!@H=
    11. crdaction tyr-trajectories-dataset \ #计算协方差矩阵
    12. matrix covar name tyr-covar-dataset :1-264&!@H=
    13. run
    14. runanalysis diagmatrix tyr-covar-dataset out tyr-evecs.dat \ #获取前3个特征向量
    15. vecs 3 name my-evecs \
    16. nmwiz nmwizvecs 3 nmwizfile tyr.nmd nmwizmask :1-264&!@H=
    17. crdaction tyr-trajectories-dataset projection TYR modes my-evecs \
    18. beg 1 end 3 :1-264&!@H=
    19. hist TYR:1 bins 25 out tyr-hist.agr norm name TYR-1
    20. hist TYR:2 bins 25 out tyr-hist.agr norm name TYR-2
    21. hist TYR:3 bins 25 out tyr-hist.agr norm name TYR-3
    22. hist TYR:1 TYR:2 bins 25 out pca-out.gnu norm name all_1_2 #将PC1和PC2输出为一个gnu文件
    23. run

    运行脚本:

    cpptraj pca.in

    得到的图像有点马赛克感觉;而且色图外围还有一圈白色的留白;还有颜色也不是我们熟悉的红蓝色条的热图。

    进行脚本的润色:

    1. #设置保存为pdf文件:
    2. set terminal pdfcairo enhanced color size 8,6 linewidth 3 font "Time New Roman,20"
    3. set output "Free Energy Landscape.pdf"
    4. #必须要在splot末尾加上"set output"语句,否则保存的文件会损坏!
    5. set size square
    6. set pm3d map
    7. #设置色条颜色,rainbow色条:
    8. set palette rgb -31,13,22
    9. #差值法解决马赛克问题:0,0是插入的值,设置越大,马赛克消除效果越好。
    10. #0,0表示让系统自动优化:
    11. set pm3d interpolate 0,0
    12. #设置标题和轴标签:
    13. set title "Free Energy Landscape" font "Time New Roman,20"
    14. set xlabel "PC1" font "Time New Roman,20"
    15. set ylabel "PC2" font "Time New Roman,20"
    16. #隐藏图例:
    17. unset key
    18. #这里必须根据实际数据进行修改:
    19. set yrange [ -18.955: 22.277]
    20. set xrange [ -25.709: 22.280]
    21. #设置轴的小刻度线:
    22. set mxtics 3
    23. set mytics 3
    24. #刻度线向外:
    25. set tics out
    26. #隐藏对称的刻度轴:
    27. set tics nomirror
    28. ........(表示数据)
    29. #输出:
    30. set output
    31. end
    32. pause -1

    查看保存的pdf图片:

     

    编写脚本将概率值转换为相对自由能,再绘制FEL图:

    使用origin软件绘制自由能井图:

    将数据文件pca-out.gnu改为pca-out.dat,将里面和gnuplot有关的命令语法删掉,只保留数据值,导入origin里:

    将第3列数据表示强度的数据列改为Z轴:

     对3列数据全选,在【工作表】-->【转化为矩阵】-->【xyz网格化】生成一个虚拟矩阵。

    选择虚拟矩阵,选择【绘图】-->【等高线图】,调整调整

    关于origin软件保存图片带有demo的水印的问题(提醒自己):

    发现用修复工具之后,一段时间demo由会像蘑菇一样冒出来(F**k!),修复操作如下:

    水印修复工具(就是那个Origin.exe文件),复制(不要移动)到安装目录里,替换里面原有的Origin.exe

    打开安装目录下的Origin64.exe就能去掉水印啦。

  • 相关阅读:
    ddr4测试-2
    面试干货丨Redis缓存数据库,持久化机制有哪几种你知道吗?!
    小程序原生开发中的onLoad和onShow
    React中的Hooks--useReducer()
    SpringMVC 05 结果跳转方式和接收请求参数及数据回显
    1019 General Palindromic Number
    TIA博途中通用函数库指令FIFO先入先出的具体使用方法
    【C转C++之路】带你弄懂输入输出(初步)、缺省参数和函数重载
    k8s之Helm
    Node.js | express 框架开篇
  • 原文地址:https://blog.csdn.net/Huang_8208_sibo/article/details/124677322