25年贵州医科大学考研智能医学综合考试大纲要点梳理
在医学的广阔天地里,《智能医学综合》如同璀璨的星辰,引领着考生们探索生命的奥秘。2025年贵州医科大学硕士研究生招生考试智能医学综合(自命题)考试大纲的公布,更是为他们点亮了前行的明灯。
2025年贵州医科大学硕士研究生招生考试智能医学综合(自命题)考试大纲
Ⅰ.考试性质
本考研大纲适用于贵州医科大学智能医学及相关专业的研究生入学考试初试科目,旨在科学、公平、有效地测试考生是否具备继续攻读智能医学专业硕士学位所需要的数据挖掘、生物信息分析、人工智能基础等工科知识。评价的标准是高等院校优秀本科毕业生能达到的及格或及格以上水平,以利于学校择优选拔,确保智能医学专业硕士研究生的招生质量。
Ⅱ.考查目标
智能医学综合考试范围包括《数据挖掘导论》《生物信息学算法导论》(参考书目:生物信息学(一) ) 和《P ython人工智能:原理、实践及应用》(详见V.参考书目)。《数据挖掘导论》要求考生对数据和数据挖掘的基本概念、基本原理、基本分析工具和分析方法的掌握程度,了解考生是否具备运用所学知识分析和解决有关问题的能力;《生物信息学算法导论》考查生物信息学的基础理论知识、常用数据分析算法和软件工具,以及生物学数据库等;《Python人工智能:原理、实践及应用》要求考生掌握常见的人工智能方法和应用场景,并对Python编程语言有一定了解,能够用Python实现人工智能算法。
Ⅲ.考试形式和试卷结构
一、试卷满分及考试时间
本试卷满分为300分,考试时间为180分钟。
二、答题方式
答题方式为闭卷、笔试。
三、试卷内容及题型结构
试卷内容结构为:
1. 生物信息学算法导论约40%
2. 数据挖掘约40%
3. 人工智能导论约20%
试卷题型结构
选择题:第1-100小题,每小题2分,共200分;简答题:第101-107小题,每小题10分,共70分;综合题:第108小题,共30分。
Ⅳ.考查内容
一、生物信息学算法导论
(一)生物信息学的概念及发展历史
1. 生物信息学的概念
2. 生物信息学的主要应用方面
(二)生物学数据库及其检索
1. 数据库的概念
2. 数据库的结构类型:定义,特点。
3. 生物学数据库:一级数据库与二级数据库。
4. NCBI生物信息资源中心 : PubMed 、GEO 、Gene 、GenBank、FASTA序列存储格式、SRA、PMC和OMIM。
5.EBI生物信息资源中心:EMBL、Ensembl、ArrayExpress、UniProt、Reactome和BioMart。
(三)序列比对原理
1. 序列比对的概念
2. 序列的相似、同一与同源:三者概念与异同,直系同源与旁系同源。
3. 常用双序列比对工具:BLAST。
4. 常用多序列比对算法:动态规划算法,渐进式算法、迭代算法和统计概率算法。
5. 常用多序列比对工具: ClustalX/W , Clustal Omega,T- Coffee,MultAlin和MAFFT。
(四)蛋白质结构预测与分析
1. 蛋白质结构特征:一级结构,二级结构,三级结构与四级结构。
2. 蛋白质结构分类数据库:SCOP2和CATH。
3. 蛋白质结构比对:比对结果的内容,应用方面与常用比对方法。
4. 蛋白质结构预测:理论基础,二级结构预测方法及相关数据库,二级结构预测方法。
5. 蛋白质对接:分类和常用分析软件。
(五)基因组学
1. 基因组的概念
2. 基因组学分类
3. 蛋白编码基因的注释:注释策略、功能注释。
(六)转录组学
1. 转录组学的含义和研究对象;
2. RNA-seq与基因芯片技术的差异;
3. RNA-seq测序策略:单末端,双末端;
4. RNA-seq文库制备:制备步骤,链特异性文库,非链特异性文库;
5. 测序数据存储格式:FASTQ格式特点;
6. RNA-seq数据处理:质量控制,reads比对,转录本定量;
7. 功能分析:差异表达分析,聚类分析,富集分析,共表达分析。
(七)非编码RNA
1. 非编码RNA 的定义与分类;
2. 非编码RNA 的功能预测:预测平台;
3. microRNA:定义,功能,靶基因预测软件;
4. lncRNA:定义,分类,功能,常用数据库与分析软件。
(八)蛋白质组学
1. 蛋白质组学概述:概念,蛋白质组学技术应用领域。
2. 蛋白质的大规模分离鉴定技术:蛋白质二维电泳-质谱技术,一维(二维)色谱-质谱技术,同位素编码亲和标签技术,表面增强激光解吸离子化飞行时间质谱技术,蛋白质芯片技术。
3. 蛋白质翻译后修饰:定义,常见类型。
4. 蛋白质相互作用:蛋白质互作预测的生物信息学方法。
(九)系统生物学
1. 系统生物学基本概念:系统生物学的定义,系统生物学与分子生物学的差异,系统生物学的基本框架。
2. 复杂网络及特征:网络的概念和分类,复杂网络的统计特征,网络的拓扑分析,生物中的复杂网络。
3. 系统生物学基本技术与方法:蛋白质-蛋白质互作信息数据库,常用蛋白质-DNA相互作用数据库,常用代谢途径数据库。
4. 蛋白质-蛋白质相互作用网络:蛋白相互作用网络的性质, 网络模体。
(十)分子进化与系统发育
1. 分子水平的进化:分子进化的概念,分子进化的特点,中性学说。
2. 分子系统发育分析的基本概念:系统发育树和分子系统树的概念,系统发育树的分类,分子进化研究最根本的目的。
3. 分子系统发育树的构建方法:基于距离的方法,最大简约法,最大似然法,贝叶斯推断法。
4. 系统发育树构建及应用:构建系统发育树的步骤,构建系统发育树的常用软件。
(十一)统计学习与推理
1. 统计模型与参数推断:给定统计模型的参数估计方法,参数估计量的评选标准。
2. 聚类分析:距离尺度函数,聚类算法。
3. 深度学习:深度学习的核心,深度学习框架,深度学习模型。
(十二)生物信息学编程基础
1. Linux 操作系统:Linux常用命令操作。
2. R编程语言:R包的安装,基本运算,数据类型,R语言常用数学函数,R语言工作空间函数,R语言外部数据读取与读出,R语言基本绘图函数。
(十三)新一代测序技术及其应用
1.Sanger测序法的特点;
2.二代测序的特点;
3. 二代测序技术平台及其特点;
4. 三代测序技术的特点;
5. 生物信息学在二代测序中的应用。
二、数据挖掘
(一)数据挖掘概述
1. 数据挖掘的概念和任务:了解数据库系统技术的演变过程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。
2. 数据挖掘应用:掌握数据挖掘的数据类型;掌握数据挖掘功能和模式;理解数据挖掘与统计学、机器学习的联系和区别;了解数据挖掘的应用领域;了解数据挖掘的主要问题。
(二)数据
1. 了解数据对象与属性类型。
2. 理解数据的基本统计描述,掌握均值、中位数、众数、极差、四分位数、方差、标准差和四分位数极差的概念和计算方法;了解数据基本统计描述的图形显示;了解度量数据的相似性和相异性。
3. 了解进行数据预处理的原因及其重要性;了解数据质量涉及的因素;掌握数据预处理的主要步骤。
4. 了解数据清理的概念;了解处理数据缺失值的方法;了解处理噪音数据的方法。
5. 理解数据集成的概念;掌握冗余和相关性分析的方法(检验,Pearson积矩系数)。
6. 了解数据变换的策略;掌握数据规范化的计算方法(最小-最大规范化、z分数规范化、按小数定标规范化)。
7. 理解数据归约的概念;了解数据归约的策略;了解线性回归、对数线性模型、直方图、聚类、抽样等数据归约方法。
8.理解数据离散化和概念分层的概念;了解数据离散化的方法(分箱、直方图分析、聚类分析、相关分析)。
(三)分类和预测
1. 理解数据分类的概念;了解分类的两个过程;理解监督学习和非监督学习的区别;了解分类和预测的数据预处理方法;掌握评估分类和预测方法的标准。
2. 了解决策树的概念和优缺点;了解决策树归分类的主要步骤;了解常用的属性选择度量,掌握信息增益度量的求法; 理解两种常用的树剪枝方法。
3. 了解评估分类器性能的度量;了解评估分类和预测准确率的方法(混淆矩阵、灵敏度和特小型、度量)。
4. 了解K-折交叉验证和自助法的基本思想;了解ROC曲线的概念和特点。
5. 了解组合分类器的概念和常用的组合分类方法;了解装袋和提升的基本思想以及两者的区别;了解随机森林的基本思想。
6. 了解类不平衡问题的概念;了解提高类不平衡数据分类准确率的一般方法。
(四)挖掘频繁模式、关联和相关性
1. 理解项集、闭项集、频繁项集和关联规则的概念;了解规则兴趣度的两种度量(支持度和置信度)。
2. 了解关联规则挖掘的步骤。
3. 了解Apriori算法的步骤;了解FP-growth算法的步骤和优缺点;掌握相关性度量提升度(lift)的计算方法。
(五)聚类分析
1. 理解聚类分析的概念;了解聚类分析的应用领域;了解比较聚类方法的标准;了解数据挖掘对聚类的典型要求;了解比较聚类方法的各个方面。
2. 理解划分方法的概念和一般特点,以及典型算法;理解层次方法的概念和一般特点,以及典型算法;理解基于密度的聚类方法的概念和一般特点,以及典型算法;理解基于网格的聚类方法的概念和一般特点,以及典型算法;
3. 理解K-均值算法的步骤和优缺点;
4. 了解算法方法的距离度量。
5. 了解聚类评估概念和主要任务;了解测定聚类质量的方法。
三、人工智能导论
(一)人工智能基础
1. 人工智能定义:了解掌握人工智能的基本概念与定义;
2. 人工智能学派:了解人工智能的主要学派及主旨思想;
3. 人工智能历史:了解掌握人工智能的起源与发展历程;了解掌握驱动新一代人工智能快速发展的数据、算法、算力等重要驱动因素;
4. 机器学习与深度学习:了解掌握机器学习与深度学习、计算机视觉、自然语言处理、知识图谱、人机交互、机器人技术、SLAM技术等主要人工智能技术的基本概念和应用场景;
(二)Python编程基础
1.Python基本语法:了解掌握Python语言的特点与发展;
2.Python数据类型:掌握Python语言基本语法与数据类型;
3.Python函数与参数:掌握常用函数的功能与用法;熟练使用基本数据类型与组合数据类型;掌握Python程序分支、循环等结构控制,掌握异常处理方法;掌握常用Python函数定义、调用及参数传递方法;掌握程序中变量作用域、返回值类型; 掌握代码复用及模块化编程方法; 掌握Python面向对象编程方法,熟悉类的定义与使用、属性和方法的定义与使用、类的继承等;掌握Python文件系统读、写等基本方法和操作;掌握Python常用工具包,例如线性代数、可视化等;
(三)概率数理统计基础
1. 概率基础知识,例如概率分布、联合概率、边缘概率、条件概率等基本概念;
2. 概率分布:掌握离散随机变量、连续随机变量的主要性质, 了解掌握伯努利分布、泊松分布、均匀分布、正态分布等常用概率分布的公式与参数;
3. 样本和参数估计:掌握样本的概念和性质,统计量的定义与性质,三大抽样分布函数的定义;掌握大数定理和中心极限定理;掌握参数估计的定义,掌握点估计、极大似然估计方法的原理;掌握评价估计量的标准、区间估计的概念和方法。
V. 参考书目
1. 陈铭主编,生物信息学(一)(第四版),科学出版社,2022年。
2.(美)陈封能,(美)斯坦巴赫,(美)库玛尔,数据挖掘导论,人民邮电出版社,2010年。
3. 杨博雄等,Python人工智能:原理、实践及应用,清华大学出版社,2021年。
在追求医学卓越的道路上《智能医学综合》考试大纲是你们的得力助手和指路明灯。愿你们能够紧跟大纲步伐深入挖掘这门学科的精髓为未来的学术生涯奠定坚实的基础。