Model refinement & validation

 
R factor / R free 都不要超过0.5,否则结构是错误的
 
Rfree:用于cross-validation。dataset中预留的5%(或者少比例)用于验证。
  • Rotamer conformation不用特别看重。
  • clashscore通过给结构添加H原子,来看是否存在clash
  • test selection
    • randomly,随机从衍射点中取出5%作为test,只选择一次
    • Thin shell,从每个shell取一些点。
    • 标记后会标示FreeR-Flag,说明这些衍射点不参与结构计算。
 
Luzzati plot:Rfactor-分辨率的图像。
  • 数据量大,统计学意义强
  • 但是R factor表征结构好坏并不是很准确
SigmaA plot:Rfree-分辨率的图像。
  • R free表征更准确
  • 数据量小,可能统计学意义弱,误差大
 
判断结构有没有修完:和数据库中的Rfree-Rwork比较,看看对应分辨率大家结构怎么样。当然,不能完全依赖分辨率和R factor判断,因为不同分子柔性不一样。
 
real space fitting:查看density fit graphs,找到model和map非常不吻合的地方。
phenix.model_vs_data:可以用于model validation,检测各个指标是否正常
 
procheck:
  • ramachandram plot
  • main-chain bond length
一般不用COOT的ramachandram plot,因为没有考虑map分辨率,COOT都是用高精度检查,分辨率不够的时候可能会发现很多outliers,但是不用担心。
一般使用MOLPROBITY和procheck
Molprobity在COOT中有插件。
 
PDB_REDO上有使用标准workflow&scripts重新refine的结构,也可以参考。由于是自动化流程,REDO的高分辨结构准确度更高。也可以在上面参照R factor
 
Ramachandran plot:outlier may be good,but each outlier has to be explained. 这个plot只是一个统计结果,并不是需要严格遵循的。不是所有的ouliers都是错误的。
EDS(Electron Density Server),已经合并到PDB网站。