时间: 2022-05-24 12:31:26 | 作者:April | 来源: 喜蛋文章网 | 编辑: admin | 阅读: 117次
1995年,美国在人类基因组计划第一个五年总结报告中,对生物信息学给出了一个较为完整的定义:
生物信息学是一门交叉科学,它包含生物科学领域的信息获取、加工、存储、分析、解释等在内的所有方面,综合运用数学、计算机科学、生命科学技术理论和工具,阐明高通量生物数据所包含的生物学意义。
1、序列比对(alignment):研究的基因问题是比较两个或两个以上分子序列的相似程度,包括核酸序列和蛋白质序列的比对过程,是生物信息学的重大基础性问题,对于进行基因组序列拼接、理解未知序列功能有重要意义。序列比对算法在该领域较为成熟,有明确的分析原则,多种完善的算法和成熟的应用软件,序列比对算法也是序列装配算法中的核心内容。
2、序列装配(sequence assembling):目前广泛应用的核酸测序技术一般只能同时检测出十到几百个碱基对序列,技术的限制决定了测序过程需要对基因组进行打碎,并在测序后进行重新拼接的过程。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为序列装配。序列装配已经成为基因组研究的基础性技术过程,但其装配精度和速度还有待提高。
3、基因识别(gene identification): 基因识别的基本问题是在给定的基因组序列基础上,正确识别蛋白质组编码基因在基因组序列中的序列和精确定位。广义的基因识别还包括基因组的各种功能元件和非编码基因的识别。编码基因的识别已经取得较为突出的成效,目前对功能元件和非编码基因的识别水平还有待提高。这一过程也正伴随着RNA测序技术的发展再次成为热点问题。
4、多态和基因区间分析:基因组多态的识别和功能鉴定是研究物种进化、种群多样性、人类疾病易感和药物敏感性的关键技术。而基因区间的基因组序列形成既有多态性(重复片段),又具有不规则特性,既可能是重要的未知基因的潜伏区域、重要的功能调控子,也可能是真正意义上的“垃圾”片段,对它们的深入理解是解释基因组功能复杂性的关键因素。
5、RNA表达分析:主要包括编码RNA和非编码RNA的表达分析。
6、分子进化:分子进化和比较基因组学研究是从生物大分子的角度考虑的物种之间的垂直进化关系(建立系统发生树)或同一物种内不同亚种之间的迁移、进化关系。既可以用DNA序列、遗传多态,也可以用蛋白质序列来开展相应的研究,甚至于可通过结构和分子网络层面的比对分析。分子进化和比较基因组学研究是重要的大分子功能识别、DNA功能元件识别工具,广泛应用于功能基因组研究之中。
7、结构预测(structure prediction):主要针对蛋白质序列和RNA序列进行分析,包括2级和高级结构的预测过程,是生物信息学中的本源性问题之一,也是结构决定功能的经典假设的主要支撑技术。经过近30年的研究工作,蛋白质结构预测技术不断进步,但预测效果仍然不能完全满足实际需要,非编码基因(RNA)的大量识别进一步加大了结构预测算法开发的紧迫性。
8、分子互作:是细胞行使功能过程中最主要的作用形式。分子互作是定性与定量相结合的分析过程,阐明分子互作不仅有利于了解整个细胞活动过程,也将对各种分子的功能和作用方式产生深刻的理解,并能够为更高层次的细胞协作、疾病机制、药物开发研究提供依据。
全站搜索