携手健康网携手健康网

软件包有助于理解复杂的树数据

大多数植物特征来自基因,蛋白质和代谢物的复杂相互作用。这些遗传特征的鉴定和分析非常具有挑战性,特别是当测序的基因组片段化时。Bastian Schiffthaler在他的论文中改进了欧洲白杨的基因组信息,并开发了有助于分析植物复杂遗传特征的生物信息学工具。

为了对基因组进行测序,通常将DNA切成小块,读取序列,然后生物信息学软件在迭代过程中使用这些小块的重叠区域组装整个序列信息,理想情况下会产生全长染色体。对于通常具有非常复杂的基因组的树木,因此大多数可用的基因组装配不是非常连续的。巴斯蒂安·希夫塔勒(Bastian Schiffthaler)致力于改善这种基因组的连续性,重点是欧洲白杨。

例如,与挪威云杉相比,欧洲白杨的基因组序列已经相当不错。但是,它仍然是零散的,这使得难以进行依赖于高度连续的程序集的分析。例如,通过全基因组关联检测与性状相关的DNA标记,或通过查看大规模的基因组重排研究进化史。

“我们的策略包括现代的长读测序,用高度精确的短读数据进行修饰,并结合光学和遗传图谱,以进一步将最初组装的支架连接到完全组装的染色体上。在接近20,000个遗传标记的情况下,遗传图谱是其中一个是迄今为止为任何生物创建的最全面的信息。这是绝大多数常用的自由软件程序无法处理的大量信息。” Bastian Schiffthaler说。

在遗传图谱上排序标记是旅行商问题的经典应用。要仅获得60个标记,就需要获得比宇宙中原子更多的计算量,因此所有软件都依赖于近似值,但是即使是对于这种大小的数据集来说也太慢了。

为了克服这个问题,Bastian Schiffthaler开发了“ BatchMap”,这是一个软件包,可以加快计算速度,以找到遗传标记的遗传方式最可能的顺序。该软件将计算分为小批量,易于计算并且可以并行运行。这大大减少了计算时间,Bastian Schiffthaler可以在欧洲白杨染色体上产生密集的遗传特征图谱。自从创建BatchMap以来,它现在已被其他基因组项目采用,例如组装挪威云杉和八倍体草莓的项目。

“我们想在全基因组关联研究的背景下评估我们改进的装配,以寻找与水杨素代谢有关的基因。这些代谢产物仅在胡杨和柳属物种中可用,并有助于保护植物免受草食动物的侵害,”巴斯蒂安解释说。 Schiffthaler。“与以前使用更加零散的程序集的尝试相比,我们可以看到我们的新基因组版本大大改善了对该复杂性状的分析,并且我们能够获得对不同胡杨属物种进化的新见解。”

鉴定控制复杂性状的基因非常具有挑战性。巴斯蒂安·希夫塔勒(Bastian Schiffthaler)研究了欧洲白杨的叶片形状变化,这是一种复杂的性状,是从父母那里继承而来的,但个体之间仍然高度差异。他们的结果表明,叶片形状受许多不同基因的复杂网络控制,但单个基因通常对最终叶片形状仅产生较小的影响。

巴斯蒂安·希夫塔勒(Bastian Schiffthaler)认为,要更好地理解叶片形状等性状的工作原理,这是一种综合方法,在该方法中,对有助于其出现的各个阶段的性状进行分析。因此,他开发了“ Seidr”,这是一种工具包,用于研究在生物体内被积极转化为蛋白质的基因之间的相互作用。他希望将“ Seidr”与其他数据层集成在一起,将使科学家将来能够更好地预测树木的复杂性状。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。