Emergence of fractal geometries in the evolution of a metabolic enzyme - 自然界第一个分形分子

 

Abstract

Fractals are patterns that are self-similar across multiple length-scales.分形是在多个长度尺度上都呈现出自相似的模式。
Macroscopic fractals肉眼可见的分形
之前,分子聚集成分形仅限于synthetic systems合成系统。
但是现在我们发现了一个自然界中的分形分子,citrate synthase,在蓝藻cyanobacterium中的Synechococcus elongatus细长聚球蓝藻中。这种聚球藻是蓝藻的代表种。
这种柠檬酸合酶能够自组装形成Sierpiński triangles(谢尔宾斯基三角形)
notion imagenotion image
谢尔宾斯基三角形是一种分形,是自相似集的一个例子。自相似集就是指,如果一个物体自我相似(self-similarity),表示它本身的一部分完全或者是几乎相似。自相似是分形的重要性质。
 
使用cryo-EM,研究者揭示了这一分形是如何从一个hexameric building block(六聚体)聚集而来的。
虽然,不同的刺激物能够对这些分形的形成进行调制,并且这些分形复合物能够在体外调节柠檬酸合酶的活性,但是这些分形可能在体内无法行使生理功能。
 
研究者使用ancestral sequence reconstruction祖先序列重建retrace追溯how the citrate synthase fractal evolved from non-fractal precursors这些柠檬酸合酶的分形是如何从非分形的前体进化而来的,结果表明这可能源于一个无害的进化事件harmless evolutionary accident。
 
意义:
  • expand the space of possible protein complexes
  • intricate and regulatable assemblies can evolve in a single substitution通过简单的替换就可以进化出复杂且可调节的复合物。
 

Intro

 

分形

Fractals are repeating patterns in which substructures at smaller scales resemble structures at larger scales
重复的模式;小尺度下的substructure与大尺度的structure一致或几乎相似。
These shapes are fascinating because they can be constructed using simple mathematical rules that result in structures of extraordinary complexity and beauty使用简单的数学规则就可以建构出极度复杂和美丽的图形,这就是分形的迷人之处。
Fractals exist in nature in the branching patterns of plant leaf veins, in coastal lines and in river systems植物叶脉、海岸线以及河流系统中都有类似的分支系统。
Most natural fractals are irregular. That is, their structures at different scales do not exactly match. 但是大部分的自然分形都是无规则的,也就是说,不同尺度下的结构并不完全匹配。
Instead, their self-similarity emerges from similar levels of detail in structures formed at different scales.而他们的自相似源自在不同尺度下形成的相似等级的细节。
有很少的一些规则的自然界中的自相似,比如Romanesco broccoli宝塔花菜中发现的重复结构,相关的产生准确的自相似模式的机理已经研究了很多了。
 

问题引入

All known regular fractals in nature are made by living organisms and exist at the macroscopic scale.目前已知的自然界中的所有规则的分形结构都是由生命体形成的,并且存在于宏观尺度。
However, none have yet been discovered in nature at the molecular scale despite the extraordinary diversity of biomolecular assemblies known to science然而,尽管生物大分子复合物具有非凡的多样性,之前一直没有发现在分子尺度下的分形结构。
 
The reason for this may be that fractal construction algorithms are difficult to translate into molecular self-assembly.原因可能是,分形建构的算法很难用分子自组装进行表达。
 
For example, the Sierpiński triangle, one of the best known regular fractals, can be created by triangular subdivision or through a stochastic ‘chaos game’ that relies on non-local rules, or by colouring in all elements of Pascal’s triangle that have odd binomial coefficients.
比如说,谢尔宾斯基三角形是最著名的规则分形案例之一,能够用以下方法建构:
  • 三角形分割
notion imagenotion image
  • 随机的chaos game,依赖non-local rules,可以play with 这个链接:
Non-local rules
Chaos game 是一个使用迭代函数系统(Iterated Function System, IFS)来生成分形图像的过程。在传统的chaos game中,规则通常是局部的,比如在Sierpinski三角形的生成过程中,每一步选择一个随机的顶点,并将当前点移动到它与这个顶点之间的中点。
然而,当我们谈论“non-local rule”时,这意味着规则不仅仅依赖于当前的点或局部的顶点。Non-local rule可能涉及到整个图形的属性或者前一步骤中多个点的位置。这种规则的引入可以导致更复杂、更不规则的分形图案。
例如,一个non-local rule可能规定每一步移动到距离当前点最远的顶点的中点,或者根据前几步生成的点的分布来决定下一步的动作。这些规则的变化可以极大地影响最终生成的分形的结构和外观。
这是密度依赖迭代生成的分形图形(新点的添加基于整体点分布的密度),迭代1000次得到的这是密度依赖迭代生成的分形图形(新点的添加基于整体点分布的密度),迭代1000次得到的
这是密度依赖迭代生成的分形图形(新点的添加基于整体点分布的密度),迭代1000次得到的
  • 将杨辉三角Pascal’s triangle中所有具有奇数二项式系数的元素涂上颜色。
 
Conversely, self-assembly of biomolecules occurs through the sequential addition of subunits rather than by subdivision and relies on local contacts between protomers to coordinate assembly. 相反的是,生物分子的自组装通常是通过亚基的顺序添加而不是不断分割,并且是依靠发起者protomer之间局部的接触进行聚集的。(也就是说不是像谢尔宾斯基三角形一样通过取中点之类的方法)
Synthetic designs have overcome these constraints and have built Sierpiński triangles out of small organic molecules. 合成设计可以克服这些束缚(也就是通过不断添加、局部接触进行聚集),也已经通过小的有机分子合成了谢尔宾斯基三角。
A key element of these designs is a molecular building block in which the structure traces out a 120° angle. This angle matches that between subtriangles within the equilateral Sierpiński triangle and allows a single monomer to bridge between subtriangles in a manner that passivates their edges. 这些设计中的关键元素是一个molecular building block(分子构件),结构呈120度角,与谢尔宾斯基等边三角形中的子三角形之间的角度一致。
This arrangement ensures that new triangles can only be attached on the tips of an existing triangle and thereby produces the large voids of the Sierpiński triangle. Other designs use metal coordination to enforce this angle这种排列方式确保了新的三角形只能附在现有三角形的顶部,于是形成了谢尔宾斯基三角形中间的大空隙。其他设计则使用金属配位来实现这一角度。
All designer fractals require special surfaces, precise temperature control during assembly or finely tuned ratios of different precursors to produce Sierpiński fractals所有设计者设计的分形都需要特殊的表面、组装过程中精确的温度控制或不同前体的微调比例,才能制造出谢尔宾斯基三角形。
Such delicate assembly requirements are unlikely to be met in cells, which makes the possibility of natural versions of these fractals seem remote.这种精细的聚集要求基本上在细胞中不可能满足,也就使得发现自然的分形的可能性更小了。
 

主题

  • 研究者报告了一种自然的代谢酶,在室温以及稀水溶液dilute aqueous solution中能够形成谢尔宾斯基三角。
  • 报道了其结构,组装机理,体外条件下酶活的调节机理
  • 如何从非分形的前体进化而来
 

结果

 

1 A protein that forms Sierpiński triangles

 
细菌柠檬酸合酶Bacterial citrate synthase (CS)是一种homo-oligomeric enzymes同源寡聚酶,能够组装成dimer和hexamer(六边形)
 
发现在藻青菌 S. elongatus 中的CS形成了一种不同寻常的聚集形式。
 
Mass photometry(MP)质量光度法分析了提纯酶,发现一类复合物由18个CS亚基构成。
notion imagenotion image
上图显示的是纯化CS的寡聚复合物分布情况。研究分析了两类藻青菌,绿色是一类集胞藻Synechocystis sp. PCC 6803(单体45.9kDa),蓝色显示的是本文的主要研究对象S. elongatus PCC 7942(其柠檬酸合酶称为SeCS,单体44.3kDa)。图b显示的是比例。
跑了三次size exclusion chromatography跑了三次size exclusion chromatography
跑了三次size exclusion chromatography
 
 
用负染观察发现SeCS复合物会形成不同大小的正三角形形状。
18mer有九个明显的密度,每个密度都是一个dimer。先形成一个六边形的环,再组合成三角形。18mer有九个明显的密度,每个密度都是一个dimer。先形成一个六边形的环,再组合成三角形。
18mer有九个明显的密度,每个密度都是一个dimer。先形成一个六边形的环,再组合成三角形。
18mer代表了主要的多聚体形式(条件是MP,>80%的CS亚基处于50nM)。
MP大于450nM时有少量的54mer,想当于3个18mer结合成一个更大的三角形,中间有个大空隙。
6mer、18mer和54mer分别代表了谢尔宾斯基三角的0、1、2阶形式。
36mer则是另一种形式,但是还是使用了6mer的building block以及三角形形状。
 
6mer SeCS的突变,2D average发现没有top view6mer SeCS的突变,2D average发现没有top view
6mer SeCS的突变,2D average发现没有top view
在18mer中也发现类似的优势取向,大部分都是最左边和最右边两种视图在18mer中也发现类似的优势取向,大部分都是最左边和最右边两种视图
在18mer中也发现类似的优势取向,大部分都是最左边和最右边两种视图
用相应的图标标记出来了用相应的图标标记出来了
用相应的图标标记出来了
在MP450nM以上时,研究者发现了很少的巨大的复合物,包含36mer和54mer。
notion imagenotion image
For the depicted structures we observed for the 18mer = 1491 particles, 54mer = 200 particles and the 36mer = 186 particles.在所描述的结构中研究者发现了1491个18mer,200个54mer以及186个36mer(但是没有说明是从多少张micrograph中看到的)
 
 
Additional assemblies that were observed only 2–4 times from a total of 20 micrographs (4096×4096 pixels). 在总共20张micrograph中只看到2-4次
最大的是下图的,只看到一次,但是研究者重建了模型,灰色表示的是dimer的三向连接,绿色表示的是双向链接。18mer和54mer都是双向链接,36mer的中间是三向连接。(其实不是很明白这个三向连接和双向链接的具体定义是什么)
notion imagenotion image
 
为了验证18mer和54mer是分形,计算了Hausdorff dimension D
 
notion imagenotion image
 
数学上的分形是可以无限拓展的,所以研究者试了一下这个蛋白分形数量能不能超过54个亚基。
方法是使用了small-angle X-ray scattering (SAXS) measurements,评估对比了不同溶液浓度下的radius of gyration (Rg)以及我们模型的理论值,(这个Rg是什么意思?)发现100uM以上,Rg值就超过了54mer并且很快超出了探测范围。
radius of gyration (Rg)以及SAXS实验
Rg是旋转半径,是一个描述蛋白质或其他分子在溶液中如何分布的物理参数。Rg值量度的是分子质量分布相对于其质心的平均距离的平方根。更大的Rg通常预示着更大的分子复合体大小。
Small-Angle X-ray Scattering (SAXS) is a technique used to study the structure of materials at the nanoscale by measuring the intensity of X-rays that are scattered at small angles when they interact with a sample. The scattered intensity 'I' is reported against the magnitude of the scattering vector 'q', where 'q' is related to the scattering angle 'θ' and the wavelength 'λ' of the X-ray. The pattern of scattering can provide information about the size, shape, and distribution of inhomogeneities within the material, such as macromolecules or nanoparticles. SAXS is particularly effective for examining the structure of noncrystalline systems and can characterize macromolecules from as small as 5 nm up to 150 nm in size. In the context of biological samples like proteins, SAXS helps to determine the overall size and shape in solution and can give insights into the assembly and conformational changes of these biological macromolecules.
The 'Limit of Detection' part could refer to the point where the SAXS technique's ability to resolve changes in the structure becomes less reliable, due to the weak signals at low scattering angles, especially for larger particles
SAXS实验一般是从高浓度的样本开始,然后逐步稀释来进行测量:in a SAXS experiment, it's common to start with a high concentration of the sample and then serially dilute it. This approach allows researchers to observe how the structure changes with concentration. As for the reversibility of the larger assemblies, when they talk about reversibility, they mean that when the protein concentration is lowered (by dilution), the larger assemblies dissociate back into smaller units. This suggests that the assembly process is not irreversible or permanently altering the proteins, but rather that it's driven by concentrations that allow the proteins to associate and dissociate under different conditions. 这样做是为了观察随着浓度变化蛋白质结构如何变化。当他们提到“较大的组装体是可逆的”时,意味着当蛋白质的浓度通过稀释降低后,较大的组装体能够解散回到较小的单元。这表明组装过程不是不可逆的,也不会永久改变蛋白质,而是由浓度驱动的,在不同条件下,蛋白质可以相互结合和分离。了解蛋白质-蛋白质相互作用的动态以及蛋白质在生物系统中形成复合体的条件是非常重要的。这在评估蛋白质复合体对环境变化的稳定性和功能性反应方面特别有价值。所以,当我们看到随着实验中蛋白浓度的降低,大型组装体能够逆转到较小结构,这就证明了这些组装体的形成是一个可逆的动态过程。
 
虽然他们很难证明更大的复合物就是谢尔宾斯基三角形而不是什么其他的形状,但是可以推断这些蛋白能够不断生长,就像是分形一样。
notion imagenotion image
 

2 Structural basis of Sierpiński assembly

To assemble a hexameric building block into a Sierpiński fractal, a new interface needs to be introduced between dimers. 为了将一个六边形的分子构件聚集成一个谢尔宾斯基三角,dimer之间必须有一个新的interface
满足两个条件:
  • 必须形成120角才能形成一个三角形
  • 只能是两个dimer之间形成interface
notion imagenotion image
这些标准保证了边缘是钝的(不结合其他蛋白),从而使得这种三角形成,而不是形成六边形的阵列。These criteria ensure that the edges of the triangles remain passivated and enables the large voids of the Sierpiński triangle to form.
这些标准在通常的同源体之间的互作中是很难满足的。
a 120° angle between hexamers can be achieved through the introduction of a three-fold symmetrical, head-to-tail C3 interface between dimers.
120度角还是可以通过一个C3对称性得到的。但是如果是120度角的话,那就只能形成一个三角形组成的晶格,而不是一个三角形的分形了,不满足第二个条件;
a two-fold, head-to-head C2 interface between dimers这种可以满足第二个条件,但是就无法形成正确的角度了,头对头就变成180度了,也就是不满足第一个条件,变成上图中的六边形晶格
 
为了解释这个问题,获得了6mer、18mer以及54mer的cryoEM结构。
notion imagenotion image
在18mer中,CS二聚体通过一个与已知六聚体蛋白类似的组装方式组合成六聚体,through an additional contact between two dimers of adjacent hexamers. 再通过两个六聚体之间两个邻近的dimer之间形成的额外接触形成18mer(也就是在18mer中绿色和灰色红色和蓝色部分的两个dimer
绿色和灰色红色和蓝色的这两种dimer比较特殊,每个二聚体中只有一个参与相互作用。(normally all four chains participate equally in the interface)
The two participating monomers form an interface between the amino terminus of one monomer and the carboxy terminus of the other and vice versa
notion imagenotion image
一个单体的E6(谷氨酸)和另一个单体的H369(组氨酸)建立了一个重要的链接(是暗红色标注的和浅蓝色标注的)
而如果将它们都突变成alanine或者直接删除,那么就无法形成18mer
notion imagenotion image
在那两个不仅会导致不在一个平面上,还会导致空间位阻
notion imagenotion image
这样也就钝化了三角形的边之间的互作。而这一不对等的互作模式也保证了没有更多的dimer会结合上去。说明这不是普通的三角形晶格,而是正好形成了谢尔宾斯基三角形。
 
为了研究interface如何形成的,比较了could only assemble into hexamers一类和a hexamer within the 18mer一类,
notion imagenotion image
18mer相对于hexamer有一个顺时针旋转的角度。稍微打破了D3对称性

然后就是试图解释18mer是如何聚合成54mer的
我们无法获得WT的54mer因为蛋白会在grid上聚集。再加上优势取向问题,54mer的top view太少了。
用了个点突变H369R。这种同样能形成18mer,但是能形成更高聚物。用这个解到了5.9A的54mer结构。
1、第一个揭示的是:edges are passivated along its outward facing edges as well as those facing its large internal void, which did not allow hexamers to attach there without introducing steric clashes向外的边缘、以及朝向其内部大空隙的边缘都是钝化的,这就不允许六聚体附着在那里,否则就会产生空间位阻
2、第二个:由18mer变成54mer的互作,和由6mer变成18mer的互作,用的是一个互作的surface。
但是,the dihedral angle二面角 between dimers across the interaction is different for the two types of connection within the 54mer.也就是说,在54mer中的两种互作的二面角是不一样的。
notion imagenotion image
  • 6mer中是60度,18mer中的角度也是60度
  • 但是相比之下,54mer中的18mer和18mer之间,则是34度。
这样的角度不一致是必要的,因为the dihedral angle of interaction between hexamers is too large across the length of an 18mer to close the triangle in a 54mer,六聚体之间的相互作用(也就是红蓝间)的二面角太大了,无法使得54mer在一个平面上,无法封闭54mer的三角形
 
notion imagenotion image
For even larger assemblies, this angle would have to shrink further because it is amplified over even larger distances. 对于更大的聚合物,这个角度(比如54mer和54mer之间的角度)还会缩小的更多。因为更大的距离尺度,内部角度的影响就会更大
这也符合他们在负染中看到的「条状物」,说明小角度是可能存在的。
但是他们可能在能量上不利less energetically favourable,这可能解释了first-order fractals(18mer)在极低浓度下(nanomolar concentrations纳摩尔级浓度)容易形成,但是更大的复合物只能在微摩尔级浓度形成。
 

但是这些36mer如何解释呢?似乎违反了18mer和54mer的聚合形态。
notion imagenotion image
notion imagenotion image
36mer和18mer/54mer之间最大的差别是中间有个3-way junction。
notion imagenotion image
从 18 聚体结构来看,通过观察到的界面进行三向相互作用是不可能的,因为它会使亚基钝化。因此,要么只有两个亚基可以在中心连接(I),要么没有亚基相互作用(II),要么存在一个独特的 C3 接口,允许三重相互作用(III)。
有两种可能:
  • this three-way junction is not a fully formed interface, the subunits are merely in close proximity这个三向接合点并不是一个fully formed的界面,这些亚基只是非常接近而已。要么只有两个亚基可以在中心连接(I),要么没有亚基相互作用(II)
  • 这种three-way junction是由于一个独特的C3接口形成的,而这个独特的C3接口我们之前没有在18mer中观察到。说明SeCS也可以形成普通的三角形晶格。
但是直接看2D average我们发现无法区分这两种可能。但是two lines of evidence argue against an additional C3 interface,有两个证据证明不存在所谓的特殊C3接口。
  • a mutation that ablates the fractal interface we see in the 18mer through a steric clash results in only hexamers and no larger stoichiometries. If an additional C3 interface exists, it must therefore overlap with the interface we see in 18mers如果一个突变通过立体冲撞消除了我们在 18 聚合体中看到的分形界面,则只会产生六聚体,而不会产生更大的化学结构。因此,如果存在一个额外的 C3 界面,它一定会与我们在 18 聚合体中看到的界面重叠。(这第一个理由什么鬼,看不懂)
    • notion imagenotion image
      notion imagenotion image
  • we created a mutant that significantly weakened the interface to form hexameric subcomplexes but leaves the residues that form the fractal interaction intact (D147A). If an additional C3 interface is present, this variant should form hexam- ers and tetramers through the fractal interaction. We observed mostly tetramers with this mutant, with only a small fraction of hexamers and larger complexes我们创建了一个突变体,它大大削弱了形成六聚体亚复合物的界面,但保留了形成分形相互作用的残基(D147A,天冬氨酸变丙氨酸)。如果存在一个额外的 C3 界面,这种变体就应该通过分形相互作用形成六聚体和四聚体。我们观察到这种突变体主要是四聚体,只有一小部分六聚体和更大的复合物。
    • notion imagenotion image
      削弱了三个dimer形成六聚体的界面,如果说存在特殊的C3界面,那么就应该形成稳定的6mer。D147A的质量光度测定(C)表明几乎没有6mer形成,而且形成的4mer还比6mer更多。
      notion imagenotion image
      (e)是从(d)(浓度20uM)获得的,可以看出,几乎形成的都是4mer。由于 6 聚体的丰度较低,因此不太可能存在另一个独特的 C3 接口,至少其稳定性要低得多。较大的低聚物可能是由于六聚体亚复合物界面未完全破坏所致。其他的更高聚物则是预测的想象结构。
      notion imagenotion image
      把形成分形的界面也给破坏了(SeCS D147A + L18Q),MP发现几乎只能形成dimer了。从MS(35uM)可以看出绝大部分都是dimer或者hexamer。这进一步说明了六聚体界面未完全破坏,未完全破坏的原因是六聚体的剩余的亲和力,而不是独特的C3 interface
      notion imagenotion image
      notion imagenotion image
 
综上所述,36mer中那种独特的C3界面是不存在的,这也和「36mer与54mer的数量接近」这一现象一致,(36mer有186个,54mer有200个),而54mer的大小要比36mer大得多。
 
因此,All assemblies we observed seemed to minimize the number of unsatisfied fractal interfaces也就是说,这种谢尔宾斯基三角形的建造与它们希望使得「未结合的分形界面数量最小化」有关,这是他们最有效的建构方式,leaving only 3 dimers at the corners of the triangle unsatisfied。如果形成其他结构(包括三角形晶格类),它们至少有4个dimer是无法满足的。
notion imagenotion image
当然,36mer也能作为zero-order的分形图形构建杨辉三角。
notion imagenotion image
总之,它们的统一之处是这种独特的三角形形状,这也是他们与少数形成其他2D晶格蛋白质不同的地方。并且,它们不需要类似合成的谢尔宾斯基三角一样的金属离子的帮助、不需要对称表面辅助。
这种能力来源于单独这些原体(构件)的flexibility,它们在组合成更大的个体时,能够打破局部对称性。但是conformational flexibility很多蛋白质都有,SeCS形成的六聚体构建块并没有表现出任何特别适合构建谢尔宾斯基三角形的显著特性,至少与其他二面角同源蛋白质复合体相比如此。
Fractals and other non-crystalline 2D assemblies may therefore be constructed using a variety of other proteins and common assemblies as building blocks.因此,分形和其他非晶态的二维组装可能可以使用各种不同的蛋白质和常见的组装体作为构建块来构造。
 

3 Function of Sierpiński assemblies

 
研究者接下来研究,在生理浓度下的主要寡聚体18mer,这类寡聚是否带来了一些功能特性。
 
CS柠檬酸合酶,催化乙酰-CoA 和草酰乙酸缩合成柠檬酸,是三羧酸循环的第一步。
 
如果加入底物或者反应产物,18mer都会解聚成6mer,说明hexamers are the catalytically active stoichiometry六聚体是具有催化活性的结构
notion imagenotion image
通过两个方面证明六聚体的催化活性:
1、比较WT和SeCS L18Q(无法形成分形结构)的酶活
  • Under saturating substrate conditions,底物饱和时,分形聚集完全被破坏,此时两者动力学参数几乎一样。
    • notion imagenotion image
      notion imagenotion image
  • Under non-saturating conditions,(此时WT有18mer)the wild-type SeCS was only half as active as the hexameric variant六聚体的酶活是WT的两倍。
2、构建突变体cys4,通过二硫键disulfide bridge稳定分形结构。这样即使是底物浓度饱和条件,也有部分分形复合物仍然能够保持。oxaloacetate草酰乙酸盐,是底物。
cys-reduced相当于可逆地拆开了二硫键,cys-oxidized相当于就是形成二硫键。可以看出突变体的Kcat相比于WT降低了。(Kcat:在最有优条件下酶催化生成底物的速率)而这一降低是可以被逆转的。
酶的转换数(turnover number )表示酶的催化中心的活性,它是指单位时间(如每秒)内每一催化中心(或活性中心)所能转化的底物分子数,或每摩尔酶活性中心单位时间转换底物的摩尔数。
notion imagenotion image
也就是说,复合物的形成会抑制酶活

但是为什么18mer的形成会抑制酶活呢?
解了citrate-bound hexamer at 2.7 Å晶体结构。
将这个晶体结构与one of a free hexamer (Δ2–6 SeCS)比较。相比于Δ2–6 SeCS,结合了柠檬酸的6mer有一个逆时针旋转。这种rigid-body rotation在其他CS酶中也是很有名的,底物结合后,推动CS从开放构象(Δ2–6 SeCS)变成封闭构象从而启动催化。
notion imagenotion image
但是这种旋转与「CS形成分形结构的顺时针旋转」是相反的
因此对于CS分形复合物而言,必须经历一个更大的逆时针旋转才能够转变为封闭状态,进而启动催化。这可能造成了一个更大的energetic barrier,导致分形结构的酶活下降
notion imagenotion image
 
notion imagenotion image
 

那么这种非常规的组装模式是否在S. elongatus细长聚球蓝藻中有调节酶活的作用。
因为分形复合物是pH敏感的:pH从7.5到9就会导致分形解聚成6mer。
这是由于分形结构中H369(组氨酸)这个残基,并且改为精氨酸后pH敏感性消失了,但是不影响其组装成分形。
notion imagenotion image
值得注意的是,S. elongatus胞内pH变化几乎与分形界面的pka相符。
  • 白天时,碳的聚集(bicarbonate碳酸氢盐的输入)使得pH升至8.4
  • 晚上时,pH回到7.3左右。
因为分形聚合物降低了酶活,circadian pH shift昼夜变化的pH抑制了SeCS的活性。
 
这种模式似乎是可行的:
  • 第一,我们观察到的胞内底物和产物的水平大大低于破坏18mer所需的水平。所以18mer的组装和解聚不会是因为胞内底物和产物浓度改变导致的。因此晚上pH下降时,18mer就形成了。
  • 第二,CS is en route to 2-oxoglutarate,也就是说柠檬酸合酶是在合成-酮戊二酸(2-oxoglutarate、α-Ketoglutaric acid)的途中,-酮戊二酸是Se中唯一已知的将氮同化为谷氨酰胺glutamine和谷氨酸glutamate的前体。在这个途径中,其他酶是在夜间被关闭的。
柠檬酸循环柠檬酸循环
柠檬酸循环
为了验证第二点,比较了CS和无法形成分形的突变体。在同样的条件下,没有发现生长有区别
notion imagenotion image
我们还研究了分形的形成是否能防止「氮饥饿时氨基酸合成导致的三羧酸循环耗竭」。Such a regulation is described in the related cyanobacterium Synechocystis sp. PCC 6803, but the regulators of this specific mechanism are not present in S. elongatus在相关的蓝藻 Synechocystis sp. PCC 6803 中描述了这种调控机制,但在Se中并不存在这种特定机制的调控因子。因此测试了两种突变体从氮饥饿的恢复情况。但是同样没有发现生长有区别。
notion imagenotion image
因此Even though the assembly has many hallmarks of being regulatory (catalytic differences between stoichiometries, responsiveness to physiological conditions), it is apparently not important for fitness under our experimental conditions, although we cannot rule out that it might be under natural conditions.尽管这种分形具有许多调控的特征(不同化学计量比的催化差异,对生理条件的响应性),在实验条件下,分形聚合物对生物的适应性似乎并不重要。
不能排除这种组装体在自然条件下可能具有重要性。

4 Evolution of the Sierpiński assembly

因此研究者开始怀疑whether this assembly could simply be an accident of history that is functionally inconsequential这种组装体是否可能仅仅是历史的偶然产物,对功能没有实质性的影响。
也就是说,分形聚合物是否在进化过程中保持了一定的功能,还是说仅仅是随机进化事件的结果。
因此开始探究这种分形聚合物的进化历史。
首先构建了CS的系统发育树。通过构建系统发育树,研究者希望看到不同CS蛋白之间的亲缘关系,从而推断其功能的历史重要性及进化稳定性。
with CS proteins from marine Gammaproteobacteria as an outgroup 使用来自海洋Gammaproteobacteria(一类-变形菌)的CS蛋白作为外群(用于比较的参照组)
notion imagenotion image
在此树的基础上,对几个Se亲缘种的CS蛋白进行了鉴定。
notion imagenotion image
研究者只在Planktothrix mougeotii孟氏浮游蓝丝藻中,发现了极少量的18mer。并且以类似的方法将N端切断,这些18mer也消失了。
notion imagenotion image
说明18mers 以及分形一定是沿着Se细长球藻的进化路线进化而来的,很可能是在 P. mougeotii 和细长球藻的最后一个共同祖先中进化而来,然后很快又沿着Cyanobium/Prochlorococcus青球藻/绿球藻的进化路线消失了。
 
为了测试这一点,we used ancestral sequence reconstruction to resurrect ancestral CS proteins at successive nodes leading from SeCS towards the root and characterized their assemblies by MP祖先序列重建的方法来“复活”(即重新合成或表达)在从SeCS向系统发育树的根部延伸的各个节点上的祖先CS蛋白质。然后利用MP对这些祖先CS的分形进行的分析。
祖先序列重建
祖先序列重建是一种用于推测过去生物的基因序列的技术。这通常涉及使用现存物种的基因序列来推断它们共同祖先的基因序列。一旦推断出祖先序列,研究人员可以实验室合成这些序列,表达相应的蛋白质,并研究这些“复活”的蛋白质的结构和功能。
notion imagenotion image
ancA,最近的祖先,仍然能够形成18mer;
ancB,ancA的直接前身,也能形成18聚体,但数量较少,表明其分形界面较弱。小角X射线散射(SAXS)分析的结果也证实了ancB在较高浓度下能够形成更大的组装体。
notion imagenotion image
随后的ancC到anc E,无法形成18mer。
在ancC与ancB之间演化出了相对较弱的分形结构,而从ancB到ancA之间,这种结构变得更加强大。

which historical amino acid substitutions enabled fractal assembly?哪个历史的氨基酸替代导致了分形的聚集?
 
即使在尚未形成分形结构的祖先蛋白中,形成分形界面关键且对pH敏感的接触位点上的氨基酸侧链E6和H369已经存在。这表明这些位点的存在本身并不足以导致分形结构的形成。
notion imagenotion image
在ancC和ancB之间的时间区间内,分形结构首次出现时,只发生了一个替换,即q18L(小写字母和大写字母分别代表祖先和衍生的氨基酸)。在实验中,仅将q18L引入到ancC中就足以触发分形复合体的形成,包括比18mer更大的复合体。
notion imagenotion image
而将这个替换逆转(从L18q)在SeCS中则消除了分形组装的能力。
notion imagenotion image
在18mer的结构中,the L18 side chains from the two non-participating monomers are at the centre of the fractal interface, but do not interact across the interface来自两个不参与分形组装的单体的L18侧链位于分形界面的中心,但它们并未在界面之间发生相互作用。
q18L therefore probably removed a repulsive polar interaction from the interface that prevented fractals from forming in ancC. q18L替换可能消除了界面上的一种排斥性极性相互作用,这种相互作用在ancC中阻止了分形结构的形成。这表明,在ancC中引入q18L替换是形成分形结构的关键,因为它移除了一个负面相互作用,从而促进了更大或更复杂组装体的形成。
Introducing the substitution q18L into more ancient ancestors than ancC did not, however, produce fractals. The historical window of opportunity in which fractals could evolve through just the q18L substitution was therefore very narrow. 然而,将q18L引入比ancC更古老的祖先并没有产生分形结构。这表明,在进化历史中,只有在非常特定的时间窗口内,通过q18L这一单一替换就能促使分形结构的演化。如果这个替换发生在进化历史上的其他时期,它不足以单独引发分形结构的形成,可能因为其他必要的结构或功能上的条件还未到位。
蛋白质演化也会有historical window of opportunity时机窗口的概念,某些演化变化的成功依赖于特定的历史条件和生物学上的context。
notion imagenotion image

下一个问题是,searched for substitutions that strengthened the fractal interface along the interval between ancB and ancA.在ancB与ancA之间的时间区间内,哪些氨基酸替换强化了分形界面的结构?
这个时间区段只有两个保守的替换发生了:k8R和y80F
  • k8R:赖氨酸变为精氨酸,在分形界面上,可能与另一个单体的主链形成更稳定的氢键,可能导致分形结构更加稳定。
    • notion imagenotion image
      notion imagenotion image
  • y80F:酪氨酸变为苯丙氨酸(多了个羟基)。这个替换位于连接二聚体形成六聚体的older interface。F80 engages in a cation–π interaction across the hexamer interfaceF80在六聚体界面上参与了一个阳离子-π相互作用,可能使得形成18mer必须的dimer旋转更有利。
    • notion imagenotion image
      notion imagenotion image
      虽然单独的k8R或y80F替换在ancB中引入时,并没有导致更稳定的18聚体的形成,但两者结合在一起时,却产生了与ancA相当的18聚体比例。
      notion imagenotion image
这表明这两个位点对于分形结构的形成和增强非常重要。
如果在WT的SeCS中逆转这些替换,则会导致18mer的不稳定性。
notion imagenotion image

也就是说,building a stable fractal required a markedly small number of substitutions and no new strong contacts in the fractal interface构建一个稳定的分形结构所需的氨基酸替换数量非常少,也没有新增什么很强的接触点。
  • 只需要极少数的氨基酸替换就能构建稳定的分形结构;在进化过程中,即使是非常小的改变也能对蛋白质的结构和功能产生深远的影响。
  • 不需要新的强接触点产生:分形界面的稳定并不依赖于新的强力相互作用的形成,而是通过已有的接触点或轻微改变现有接触的性质来实现。蛋白质的结构适应性可以通过微小的调整而不是完全的结构重建来实现。
  • 非适应性起源non-adaptive origin
    • notion imagenotion image
      在P. hollandica和Cyanobium/Prochlorococcus青球藻/绿球藻两个谱系中,这种稳定的分形结构几乎立即丧失,这支持了非适应性起源的假设。
      非适应性起源:某些生物学特征可能不是因为它们提供了适应性优势而进化,而是作为其他进化过程的副产品或由于遗传漂变等随机事件而形成
      表明即使没有明显的适应性优势,结构和功能的重大变化也可能仅通过少数几次关键的氨基酸替换就能发生。
       
这一发现与之前的研究一致,单个氨基酸的替换可以显著改变寡聚体状态占比或者诱导高聚物的组装。

当引入q18L突变到ancC(在没有此突变的情况下,不能形成18聚体)后,形成的界面在与野生型SeCS相似的pH范围内解离。这表明,尽管这种18聚体结构是新出现的,它的酸碱平衡已经适应了细胞的生理pH波动。这种匹配可能是为了适应特定的生理条件而演化。
notion imagenotion image
The apparently physiologically of the assembly is therefore either a molecular spandrel or simply a coincidence that looks deceptively adaptive.
pKa的匹配可能最初并非为了适应pH波动而演化,而是作为其他演化过程的副产品(分子间隙molecular spandrel);或者仅仅是一个巧合。
分子间隙:是指一种特征最初因为与当前用途无关的原因而演化,但后来获得了新的功能。
 
SeCS能够构建的这种分形复合物更可能是一种演化意外:
尽管该蛋白能够构建的分形复合物具有非常规则的复杂性beautifully regular and complex——高阶的谢尔宾斯基三角higher-order Sierpiński triangles——这种大型结构仅仅只能在非生理浓度下出现,其体积也难以适应S. elongatus的细胞质空间
 
尽管18mer有点相应的功能(比如刚刚提到的可以根据pH调节酶活),但是这种形成高阶聚合物的能力,几乎肯定是其意外演化出的、不寻常的对称性所带来的、意外的进化副产品

研究者对于这种类似自组装self-assembly蛋白质的总结:
  • 自组装的evolutionary transitions可能比现有我们掌握的数据库更加常见。目前的数据库可能没有完全捕捉到蛋白质自组装能力的多样性和演化历程。
  • 随着研究大分子复合物技术的进步,可能会发现更多种类自组装复合物。并且这些自组装类型come and go,不断出现消失,展现出蛋白质结构和功能在进化过程中不断变化。
  • 虽然会出现大量组装体的表型(比如这次的谢尔宾斯基三角),但是只有少数会对其宿主生物体产生重要影响并在进化中持续存在。这些结构因其对生物体有利的特性被自然选择保留。其他的则会像它们快速出现一样,快速消失。
  • 因此,会有很多过去可能存在过但已经灭绝的蛋白质组装体结构,它们并没有留到现在,这些消逝的独特的蛋白质演化事件更加印证了我们目前蛋白质分子结构研究的局限性,但是这也是魅力所在。