一、基本概况
课程名称:生物信息学(Bioinformatics)
课程代码:131010252
课程类别:专业核心课
学时/学分:44/2.5(其中理论44学时)
需预修课程:生物化学、分子生物学、植物学、普通微生物学、动物生物学
适用专业:适用于生物技术、生物工程、生物科学等专业的民族班本科教学
课程简介
生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学、数学、统计学等相互渗透而形成的交叉学科,也是理论概念与实践应用并重的学科。目前,生物信息学已经成为当今生命科学和自然科学的重大前沿领域之一。
生物信息学课程是面向生物技术专业的一门专业核心课程,与生物信息学实验实习课程配套。其主要任务是:使学生了解该课程的基本理论和框架,掌握相关生物信息学分析工具的应用,深入了解本学科发展方向及国际学术研究前沿;并具有能运用所学的理论和方法以及相关学科知识解决生命科学研究中实际问题的能力。
二、教学目标
学生通过本课程的学习,在知识和能力等方面达到以下要求:
1.理论、知识目标:
了解生物信息学知识体系;掌握生物信息学概念、专业术语及生物信息学研究内容;了解生物信息数据库,掌握数据库使用方法;掌握引物设计及测序原理与方法;理解针对核酸序列、蛋白质序列的分析原理并掌握分析方法;理解系统发育分析的概念,掌握其分析方法。
2.能力目标:
培养学生了解生物信息学知识体系,培养学生借助计算机、互联网及相关软件运用生物信息学方法分析生命科学研究中实际问题的能力,并具备一定解决问题的能力。
3.达成目标:
通过课程学习,学生应具有较扎实的生物信息学专业知识,了解生物信息学领域最新动态和发展趋势。掌握生物信息学基本分析原理及操作方法,并能正确解读分析结果的生物学含义。具有能够应用现代信息技术手段和工具解决生物学研究中实际问题的能力。该课程支撑本专业毕业要求的第2项、第4项、第5项。
三、教学内容及教学要求
绪论(讲课2学时;实习0学时)
教学内容:
1.课程介绍(课程内容,课程要求,学习方法);
2.生物信息学的概念、产生与发展;
3.人类基因组计划与生物信息学;
4.生物信息学的研究内容;
5.生物信息学的应用及展望。
教学要求:
掌握生物信息学的概念、研究内容及人类基因组计划的意义。了解生物信息学产生与发展、基本研究方法与技术、应用及展望。从整体对生物信息学有所认识并了解生物信息学与其它学科的关系,熟悉科学的学习生物信息学的方法和策略,激发学习兴趣,增强学生学好生物信息学课程的信心。
本章重点、难点:
重点:生物信息学概念及研究内容。人类基因组计划与生物信息学的关系,生物信息学对生物学发展的意义。
难点:人类基因组计划与生物信息学的关系,生物信息学对生物学发展的意义。
第一章生物信息学生物学基础(讲课4学时;实习0学时)
教学内容:
1.生物信息学与生物学关系;
2.生物进化与分类;
3.细胞;
4.生物大分子;
5.基因组;
6.生物遗传信息流动;
7.基因表达及调控。
教学要求:
巩固已修课程中与生物信息学相关的理论知识。理解生物大分子作为生物信息载体的意义。理解生物信息学与生物学相关课程知识点的联系。掌握氨基酸单字母缩写,核苷酸标准字符意义,掌握相关专业词汇的英文单词。
本章重点、难点:
重点:生物大分子与生物信息的关系;氨基酸单字母缩写、标准核苷酸字符的记忆;生物信息学相关重要专业词汇英文单词记忆。
难点:重要专业词汇英文单词记忆。
第二章生物信息数据库及其基本应用(讲课6 学时;实习7学时)
教学内容:
1.生物信息数据类型;
2.生物信息数据库种类;
3.常用生物信息学门户网站;
4.生物信息数据格式;
5.生物信息数据库查询方法;
6.生物信息数据库搜索方法。
教学要求:
1.了解生物信息学常见的数据库资源;
2.了解GenBank、Uniprot、PDB等国际著名的生物信息数据库的类型与特点;
3.了解著名生物信息平台的架构及其与各生物信息数据库的关系;
4.掌握生物信息数据库常见记录的格式内容;
5.掌握 NCBI的Entrez检索系统的使用方法,根据需要在各类数据库中搜寻信息,并理解各数据库注释的含义;
6.掌握生物信息数据库搜索的基本概念、原理,熟悉在线搜索工具Blast的操作方法,并理解数据库搜索结果的含义;
7.了解使用BankIt提交序列的方法。
本章重点、难点:
重点:生物信息数据库的特点;一级数据库与二级数据库的联系与区别;GenBank、SWISS-PROT、PIR、PDB等国际著名的生物信息数据库,及其类型与特点;数据库查询、数据库搜索的基本概念,二者间的区别;FASTA格式文件的特点;GBFF格式文件的特点;Entrez检索系统的特点及使用方法;序列相似性比较概念;BLAST程序评价序列相似性的方法及结果解读。
难点:生物信息数据库之间的联系;生物信息学网络平台与数据库的关系;GBFF格式文件的特点;Entrez检索系统特点及使用方法;Blast程序进行序列搜索的方法及搜索结果的解读。
第三章引物设计及测序结果分析(讲课8学时;实习7学时)
教学内容:
1.PCR技术简介;
2.引物设计的基本原则;
3.常规引物设计原理及操作方法;
4.简并引物设计原理及操作方法;
5.测序技术简介;
6.第一代常规测序结果查看及分析;
7.序列拼接原理及操作方法。
教学要求:
1.理解引物对PCR实验结果的影响;
2.掌握常规引物设计的原则;
3.掌握利用DNAMAN、PrimerPremier、Oligo等软件设计、分析、评估常规引物;
4.理解简并引物设计的原则;
5.了解使用本地软件设计简并引物的步骤;
6.了解使用CODEHOP在线工具设计、分析简并引物;
7.掌握第一代测序技术的原理及特点;
8.掌握使用Chromas软件、BioEdit软件查阅分析测序峰图文件的方法;
9.掌握使用VecScreen在线工具及DNAMAN软件分析处理测序序列结果的原理及方法。
本章重点、难点:
重点:引物设计的基本原则;常规引物与简并引物的区别;第一代核酸序列测序技术原理及特点;引物设计软件的操作;测序结果的查看及分析。
难点:引物设计过程中的筛选与评估;测序结果中载体序列去除。
第四章核酸序列分析(讲课10学时;实习9学时)
教学内容:
1.核酸序列基本分析:组分分析、序列变换、限制性酶切分析,分析原理及应用;
2.核酸序列比对分析:比对分析的概念、应用,相似性、同源性的概念及二者之间的关系,两序列比对常用软件及方法及比对结果的生物学意义,多序列比对常用软件及方法及比对结果的生物学意义;
3.基因结构预测分析:基因结构预测的重要意义,原核生物、真核生物的基因结构简介,基因结构预测的原理及方法。
教学要求:
1.掌握使用DNAMAN、BioEdit等相关软件对核酸序列进行组成分析、序列转换、酶切位点分析的原理及应用;
2.理解核酸序列基本分析结果的生物学意义,并能将其应用于具体科研实验;
3.掌握序列比对的概念及应用;
4.理解相似性、同源性概念及二者之间的关系;
5.掌握使用BLAST工具进行在线序列搜索,并理解结果含义;
6.掌握使用DNAMAN软件进行两序列比对分析;
7.掌握使用DNAMAN、ClustalX软件进行多序列比对分析;
8.理解概念性翻译概念及预测开放阅读框的原理;
9.掌握使用ORF finder或DNAMAN软件进行基因结构识别;
10.掌握使用FGENESH、POLYAH、PromoterScan、CpGPlot等在线工具分析识别真核生物基因结构,并理解分析结果各部分内容的含义;
11.理解不同来源核酸序列中基因结构的异同,掌握基因结构预测识别原理,能利用软件工具解决实际问题。
本章重点、难点:
重点:核酸序列基本分析的操作;比对的概念、原理;比对结果的生物学意义;核酸序列中基因结构的预测分析;概念性翻译。
难点:核酸序列限制性酶切分析的应用;相似性、同源性之间的关系;两序列比对、多序列比对原理及方法的异同;对不同来源核酸序列中基因结构预测分析方法的选择;分析确定开放阅读框的原理;基因结构预测结果的解读。
第五章蛋白质序列分析(讲课10学时;实习7学时)
教学内容:
1.蛋白质序列基本性质分析:蛋白质基本性质预测分析的理论依据,蛋白质相对分子质量、氨基酸组成、理论等电点预测、疏水性分析、稳定性预测、跨膜螺旋区预测、信号肽预测、亚细胞定位预测的原理及预测方法;
2.结构域分析及motif搜索:结构域概念,motif概念,结构域预测分析的意义,结构域预测的方法,motif搜索的方法;
3.空间结构预测分析:空间结构预测分析的理论依据,结构预测的局限性,蛋白质二级结构预测的原理及方法,蛋白质三级结构预测的原理及方法;
4.抗原表位预测分析:抗原表位概念,抗原表位预测的理论依据,抗原表位预测的方法。
教学要求:
1.掌握使用BioEdit软件、DNAMAN软件及在线工具ProtParam对蛋白质序列进行分子质量、氨基酸组成、疏水性等基本性质分析的原理及操作;
2.掌握使用TMHMM、COILS、SignalP、TargetP等在线工具进行蛋白质跨膜区分析、Coil区分析、信号肽分析及亚细胞定位等操作;
3.掌握使用SMART、CD-search在线工具进行结构域预测分析;
4.了解使用PROSITE在线工具进行蛋白质motif搜索操作,并能解读信息内容;
5.掌握利用PSIPRED、PredictProtein在线工具预测蛋白质的二级结构;
6.掌握使用SWISS-Model、Phyre2在线工具预测蛋白质的三级结构,理解预测三级结构的意义;
7.掌握使用Cn3D软件查看蛋白质三级结构文件;
8.理解抗原表位概念,了解抗原表位预测的原理及方法。
本章重点、难点:
重点:蛋白质理论等电点预测及电荷分析;蛋白质疏水性预测及意义;蛋白质跨膜螺旋区预测意义及方法;蛋白质信号肽、亚细胞定位预测的意义;结构域预测的方法及意义;蛋白质三级结构预测的方法;蛋白质三级结构的可视化。
难点:蛋白质三级结构预测的原理及方法。
第六章分子系统发育分析(讲课4学时;实习4学时)
教学内容:
1.生物进化与分子进化:生物进化的证据,分子进化的提出,分子进化的依据;
2.分子进化的分子基础:分子途径研究生物进化的可行性,分子进化的模式,分子进化的特点,研究分子进化的意义;
3.分子系统发育树的构建:系统发育树的概念,系统发育树的种类,构建系统发育树的原理与方法。
教学要求:
1.了解研究生物进化的方法及各方法的优缺点;
2.理解分子进化的分子基础及特点;
3.掌握分子系统发育树的概念、类型;
4.掌握使用ClustalX、MEGA软件构建系统发育树,并理解系统发育树的生物学意义。
本章重点、难点:
重点:分子进化的分子基础;系统发育树的概念;构建系统发育树的操作。
难点:生物进化与分子进化的关系;理解系统发育树的生物学意义。
四、考核方式及成绩评定
本课程的成绩由平时成绩(考勤占10%、提问占30%、课堂测验占60%)、综合作业两部分组成,其中平时成绩占60%、综合作业占40%。
五、教材及参考书目
教材:《生物信息学分析实践》,吴祖建、高芳銮、沈建国编著,科学出版社,2010年,标准书号:ISBN 9787030278319。
参考书目:
1.《DNA和蛋白质序列数据分析工具》第三版,薛庆中编著,科学出版社,2012年,标准书号:ISBN 9787030345097。
2.《生物信息学》第二版,陈铭编著,科学出版社,2015年,标准书号:ISBN9787030432872。
3.《理解生物信息学》,李亦学、郝沛主译,科学出版社,2012年,标准书号:ISBN 9787030328328。