1. 什么是(基因)生物信息学?
目前一般意义的生物信息学是基因层次的
它是一个包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面学科领域。
生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测。
他是近年来发展并完善起来的交叉学科。这门学科是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。
生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。 基因组信息
蛋白质的结构模拟 药物设计
它们是生物信息学的三个重要组成部分,生物信息学目前已在理论生物学领域占有了核心地位,它广泛地应用在生物、医药、农业、环境等学科。
2.广义生物信息学主要包括哪几个方面? 广义生物信息学主要包括如下几个方面:
一、生物的遗传信息
DNA―RNA―蛋白质,遗传信息—转录—翻译,遗传信息生物信息学。
二、生命活动的调控
基因的功能、表达和调控(表观遗传学)。蛋白的结构、功能和调控;细胞活动(分化、发育、衰老、死亡)的调控,器官、系统、整体活动的调控;节律、生物钟、分蘖、生长、开花、结果、营养的吸收、传输、转化、对外界信号的反应:含羞草、抗逆性。
三、生物电磁学与电磁生物学
生物电磁学:生命活体在不同层次(电子、离子、原子、基因、细胞、组织、整体等)的活动和不同属性(包括思维、精神)活动时以及和外界环境(生命体周围直至宇宙)相互作用时反映出来的各种电磁信息。人体的电磁辐射(包括发光):频率、强度、频谱。人体信号的调制方式:调幅、调频、编码。
电磁生物学:电磁辐射对生物体的影响,电磁场导致DNA突变,体内细胞电离、极化状态变化导致疾病。
四、视觉系统与光信息处理
视网膜神经元回路与信息处理、彩色视觉及彩色图像的编码、变换机制、眼动成象机制及宽视场、消色差动态成象系统、视觉认知机制及其图像信息的智能模式识别、不同状态立体视觉机制和静态、动态立体视锐度。
五、脑和神经系统与信息
脑的感知觉信息处理原理及其应用,学习、记忆、思维,逻辑思维和形象思维,思维模型与信息处理系统新原理的研究,新的计算模型、新型计算机、如:神经计算机。
六、生物体结构与微光机电系统
DNA驱动的微细机器人,生物大分子到细胞基本结构体系的自组装、自组织,创造新物质的分子工程学研究,分子聚集体的化学。
纳米生物技术将纳米技术和生物技术相集成,在生物医学、电子学、材料学、环境科学等诸多领域具有良好的应用前景。在生物芯片、分子马达、生物探针、纳米生物材料等迅速发展 。
七、基因芯片、蛋白质芯片等
目前一般意义的生物信息学是基因层次的,是近年来发展并完善起来的交叉学科。 这门学科是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。
3.Internet有哪些基本功能?
Internet不仅向其用户提供了全球范围的信息交流与快速通讯手段,其本身也具有极其丰富的信息资源,包括新闻、书刊杂志、数据库、计算机软件、多媒体资料等,也包括大量的生物信息学资源。
4.什么是Entrez?Entrez主要包括哪几个数据库?
Entrez(http://www.ncbi.nim.nih.gov/entraz)是美国国立医学图书馆国家生物技术信息中心(National Center for Biotechnology Information, NCBI)建立的生物医学数据库集成检索系统。系统中的数据库包括核酸序列数据库、蛋白质序列数据库、大分子三维结构数据库、全部基因组、孟德尔人类遗传及通过PubMed检索的MEDLINE。Entrez集成系统的最大特点是通过任何一个数据库检索出的信息可直接链接到Entrez其它数据库并找到相关的检索结果。
5.PubMed的一般检索方法有几种检索途径?
通过NCBI首页(http://www.ncbi.nlm.nih.gov/)或NCBI的Entrez检索系统(http://www.ncbi.nlm.nih.gov/Entrez/)选择PubMed链接选项或直接在浏览器地址栏 (URL)中输入“http://www.ncbi.nlm.nih.gov/entrez/query.fcgidb=PubMed”即可进入
PubMed检索界面。PubMed有多种检索途径,包括自由词、文献作者、规范主题词(MeSH)、期刊名称、文献出版年代、文献类型、文献语种、物质名称、记录入档日期、文献出版日期等。既可以单一字段检索,又可以利用高级布尔逻辑表达式多字段组配检索。
6.国际上三大DNA数据库是什么数据库?
,
国际三大DNA数据库:NCBI的GenBank ,欧洲分子生物学实验室(European Molecular Biology Laboratory, EMBL)、日本DNA数据库(DNA Data Bank of Japan,DDBJ)
7.简述进行基因搜索时的基本步骤 ?
在进行基因搜索时的基本步骤:
1、寻找DNA序列中基因不可能出现的区域,并将此遮蔽起来。
2、在启动子区寻找一致的模式,找出转录因子识别DNA结合区域。
3、寻找转录的起始密码、终止密码和剪切位点。
4、找出编码区。然后将全部收集到的信息汇总整理成总体上尽可能连贯的谱图。 注意进行不同的分析时使用不同的软件工具以及程序适用的物种选择和应用范围等。
8.BLAST的主要功能都包括什么 ?
1、核酸数据库搜索
组合基因组检索;分为标准的核酸与核酸数据库搜索;MEGABLAST提供大量长序列的比较;完全匹配的短序列搜索;特殊搜索。
2、蛋白数据库搜索
分为标准的蛋白与蛋白数据库搜索;PSI-and PHI-BLAST,其中PSI用于搜索证实远源进化关系的存在与否和进一步获取这个蛋白家族中的功能信息,而PHI用于搜索蛋白基序;同样包括蛋白的完全匹配的短序列搜索。
3、已翻译蛋白的BLAST搜索
包括[blastx],[tblastn],[tblastx]
4、保守区域的搜索:主要使用RPS-BLAST程序完成。
5、配对序列的两两比较:用于核酸和蛋白的两两比较分析。
6、针对特定数据库的搜索:比如人类基因组、微生物基因组等。
9.利用核酸序列进行基因结构预测的基本步骤是什么?(不确定) 一个全面的基因搜索方案,无论是通过单个集成的程序实现,还是通过多个程序分步实现,基本的思路是相同的:
1、通常如果一个序列中某一区域出现重复序列,该区域不大可能处于调控区域和编码区域。
2、如果某一片段与其它基因或基因产物有序列相似性,该片段是外显子的可能性极大。
3、一段序列上存在着统计的规则性,表现为显著的“密码子偏好”,是蛋白编码区最明显的标志之一。
4、与模板模式相符可能指出DNA上功能性位点的位置。这类分析可以基于很简单的模式(例如,众所周知的“TATA box”和剪接点的保守序列)或基于相当复杂的推理(例如,在后面将提到的启动子搜寻算法中)。
10.根据蛋白质的氨基酸序列预测其空间结构主要预测方法有哪两类?
预测方法主要有两类:
一、采用分子力学、分子动力学的方法,根据物理化学的基本原理,从理论上预测蛋白质分子的空间结构。
二、通过对已知空间结构的蛋白质进行分析,找出一级结构与空间结构的关系,总结出规律,用于新的蛋白质空间结构的预测。本章介绍利用分析蛋白质氨基酸的组成来确认未知蛋白的计算工具、蛋白翻译后修饰、蛋白功能预测。
组成蛋白质的氨基酸序列为蛋白质的一级结构,蛋白质的一级结构决定了蛋白质的性质。组成蛋白质的氨基酸的物理和化学性质早已被人熟知。构成蛋白质的20种氨基酸由于化学构造不同,在结构和功能上具有多样性,任一残基对蛋白质的物理和生化性质都会产生影响,即序列决定构象。由于蛋白质空间结构的基础是一级结构,近年来根据蛋白质的氨基酸序列预测其空间结构,受到科学家的关注。
11.谈谈学习生物信息学的体会(自己发挥吧)
有点粗糙,见谅
六哥