加入收藏  || English Version 
 
《多元统计分析》教学大纲

  发布日期:2015-03-06  浏览量:601


                   

《多元统计分析》课程是统计学专业高等教育的专业拓展课,内容包括:多元正态分布、方差分析、因子分析、主成分分析、判别分析、聚类分析等一些常用多元分析的理论与方法。通过对所考虑的包括多个变量的统计问题进行分析,以了解各变量的关系、建立合理的模型等。这些方法在经济、管理、医学、生物、社会学等各个领域得到了广泛的应用。系统地讲授本课程的基本理论与基本常识,加强基本技能的训练,培养和提高学生理解、分析运用多元统计分析相关的理论与方法进行数据处理的能力。多元统计分析简称多元分析,是统计学的一个重要分支,也是近三、四十年迅速发展的一个分支。随着电子计算机的普及和App的发展,信息储存手段以及数据信息的成倍增长,多元分析的方法已广泛应用于自然科学和社会科学的各个领域。国内国外实际应用中卓有成效的成果,已证明了多元分析方法是处理多维数据不可缺少的重要工具,并日益显示出无比的魅力。

设置本课程的目的是:进一步培养学生学习用概率统计的思想和方法去思考随机系统中多个变量之间的数量关系,逐步提高学生处理随机数据的能力。通过学习,要求学生掌握多元统计中的一些基本概念、基本理论与基本方法,掌握一些常见分布的性质和应用,掌握常用的数理统计的基本原理。

学习本课程的要求是:要求学生在学完本门课程以后,清楚每种统计方法所要解决的问题、前提条件和局限性等;要求学生学会分析多元观测数据,对给定的数据能够选用本课程中所先容的各种方法,借助统计分析App包去计算,从中提取出有用的信息,对所研究的问题作出合理的推断和科学的评价。

 

先修课程要求:高等代数、概率论、数理统计、应用统计App

本课程计划72学时,4学分。

选用教材:方开泰编著,《实用多元统计分析》,华东师范大学出版社,1989

教学手段:课堂讲授为主,习题课、课外辅导为辅

考核方法:考试

  

教学进程安排表

周次

学时数

教 学 主 要 内 容

教学方法

备注

1

4

矩阵代数,一元分布

讲课

 

2

4

随机向量,多元分布,边缘分布,条件分布,独立性

讲课

 

3

4

矩,特征函数,多元正态分布的定义

讲课

 

4

4

多元正态分布的基本性质,

条件分布和独立性

讲课

 

5

4

的极大似然估计及性质,Wishart分布的定义及性质,Hotelling 分布及性质

讲课

 

6

4

单一总体均值向量的检验

讲课

 

7

4

两总体均值向量的检验

讲课

 

8

4

Wilks分布及性质,多元方差分析

讲课

 

9

4

协差阵的检验,独立性检验

讲课

 

10

4

距离判别

讲课

 

11

4

贝叶斯判别

讲课

 

12

4

费歇判别

讲课

 <, /P>

13

4

距离和相似系数类和类的特征

讲课

 

14

4

系统聚类法

讲课

 

15

4

总体的主成分,样本的主成分

讲课

 

16

4

主成分的统计推断,多变量的图表示法

讲课

 

17

4

因子数学模型,参数估计,

讲课

 

18

4

因子旋转,因子得分,复习

讲课

 

 

 

第一章  矩阵代数

一、学习目的

通过本章的学习,要求学生了解多元分析的基本内容及应用领域,并掌握矩阵代数的基本常识:如行列式、逆矩阵、矩阵的迹、二次型、正定阵以及矩阵微商等概念。建议课时安排:2学时

二、课程内容

   多元分析基本内容,以及本课程的主要安排。相关的补充常识(绝大部分是已学

习过的内容)和将要涉及的计算App程序。

第二章  多元分布

一、学习目的

通过本章的学习,要求学生了解多维随机向量,多元分布函数, 密度函数边缘分布概念,要会由分布函数求密度函数或由密度函数求分布函数及由联合分布求边缘分布和条件分布等;了解随机向量独立性概念,掌握分布函数,密度函数,特征函数等方法判断两个或多个随机向量的独立性;了解随机向量均值和协方差的概念;掌握随机向量均值向量和协方差的性质并会运用其进行相关的计算。建议课时安排:8学时。

二、课程内容

第一节  一元分布

     回顾几个常见一元分布的分布函数

第二节 多元分布

(一)随机向量的定义

(二)随机向量的分布函数

(三)随机向量的边缘分布,条件分布及独立性

第三节 特征函数和矩阵

(一)随机向量特征函数的定义

(二)随机向量矩的定义

三、重点、难点提示和教学手段

(一)多元分布函数的定义,多元分布的边缘分布、条件分布及独立性;

(二)多维随机向量均值和协方差矩阵的定义及性质。

四、思考与练习

见教材P64-65:2-1,2-5,2-7,2-11

第三章  多元正态分布

一、学习目的

通过本章的学习,多元正态分布是多元统计中的重要的分布,要让学生知道多元分布在多元统计分析中重要性;要让学生了解多元正态分布的四种不同的等价定义并掌握其证明方法和多元正态分布的基本性质;了解样本数字特征的概念并掌握其矩阵形式;会求多元正态分布未知参数均值向量μ和协差阵Σ的极大似然估计并掌握其性质;了解维希特分布定义及其性质,了解T2分布。建议课时安排:10学时

二、课程内容

第一节  多元正态分布的定义和基本性质

(一)多元正态分布的定义

(二)多元正态分布的基本性质

第二节 条件分布和独立性

定义、计算

第三节 矩阵正态分布

定义、性质

第四节 的极大似然估计

(一) 的极大似然估计

(二)极大似然估计的性质

第五节 Whishart分布

Whishart分布定义、性质

三、重点、难点提示和教学手段

(一)正态分布的定义、多元正态变量的基本性质

(二)多元样本的数字特征

(三)均值向量和协差阵的最大似然估计及其基本性质

(四)Wishart分布及其基本性质

四、思考与练习

见教材P101-104:3-3,3-53-63-73-83-14

第四章  多元正态总体均值向量和协差阵的假设检验   

一、学习目的

通过本章的学习,了解假设检验的基本思想,计算步骤;了解 Wilks分布, 似然比统计量概念,了解一总体均值向量检验,两总体均值的检验(分三种情形讨论:协差阵相等,协差阵不相等,成对试验的T2统计量), 多总体均值检验(多元方差分析),协差阵检验, 独立性检验的检验统计量建立的统计思想并掌握用正态分布理论导出其在原假设下的分布;会上述各种检验方法对实际问题进行检验。建议课时安排:16学时

二、课程内容

第一节  单个总体均值的检验

(一)一元情形

(二)多元情形

(三)似然比原理

第二节 两总体均值的比较

(一)协差阵相等情形

(二)协差阵不相等情形

(三)成对实验情形

第三节 多总体均值的比较

(一)一元方差分析

(二)多元方差分析

第四节 协差阵的检验

第五节 独立性检验

三、重点、难点提示和教学手段

(一)单个均值向量的检验

(二)两个正态总体均值向量的检验

(三)多个正态总体均值向量的检验

四、思考与练习

见教材P138-141:4-14-24-34-9

第五章  判别分析

一、学习目的

通过本章的学习,要求学生理解判别分析的目的和意义、它的统计思想。了解并熟悉判别分析的三种类型,特别是Bayes判别方法的统计思想。掌握教材中给出的不同判别方法的判别规则和判别函数的结构。要熟悉对两总体样本的距离判别法、Fisher判别法和Bayes判别法的具体计算步骤,并比较其异同。建议课时安排:12学时

二、课程内容

第一节  距离判别

(一)距离判别法的基本思想

(二)两个总体的距离判别

(三)多个总体的距离判别

第二节 Bayes判别

(一)Bayes判别法的基本思想

(二)多元正态总体的Bayes判别法(判别函数的导出、基本假设、计算后验概率)

第三节Fisher判别法

(一)两个总体的Fisher判别法(基本思想、判别函数的推导、计算步骤)

(二)多个总体的Fisher判别法(推广)Fisher 判别

三、重点、难点提示和教学手段

(一)距离判别

(二)Fisher 判别法

(三)Bayes判别法

四、思考与练习

见教材P213-214:6-16-3

第六章 聚类分析

一、学习目的

通过本章的学习,要求学生理解聚类分析的目的和意义、它的统计思想,了解变量类型的几种尺度定义。熟悉Q型和R型聚类分析常用的距离和相似系数的定义,特别是Minkowski 距离。了解教材中先容的八种系统聚类方法,以及它们的统一公式,熟悉App中最长(短)距离法、重心法和Ward(离差平方和)法的具体使用步骤。在理解系统聚类方法基本性质基础上,初步掌握实际问题中选用聚类方法与对应的测量距离的原则。建议课时安排:8学时

二、课程内容

第一节 概述

聚类分析及其适用的范围和对象,聚类分析的目的。

第二节 距离和相似系数

样品分类(Q-型聚类分析)常用的距离和相似系数和指标分类(R-型聚类分析)常用的距离和相似系数。

第三节 系统聚类方法

八种系统聚类方法(最短距离法,最长距离法,中间距离法,重心法,类平均法,可变类平均法,可变法,离差平方和法)及其统一,类的个数选择问题。

第四节 系统聚类法的基本性质

系统聚类法的两条基本性质(单调性和空间的浓缩与扩张)。

第五节 计算步骤

聚类分析的计算步骤(对应于8种不同方法的具体计算步骤)。

三、重点、难点提示和教学手段

最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法

四、思考与练习

见教材P252-256:7-17-27-37-47-5

第七章 主成分分析

一、学习目的

通过本章的学习,要求学生了解主成分分析的统计思想和实际意义,以及它的数学模型和二维空间上的几何意义。掌握主成分的推导步骤及其重要的基本性质。能够利用计算App,自己编程解决实际问题并给出分析报告。熟悉数据处理中的样本标准化(归一化)的实际

意义和处理步骤。建议课时安排6学时

二、课程内容

第一节 概述

主成分分析(概念),问题提出的背景,以及主成分分析的基本思想。

第二节 主成分分析的数学模型及几何说明

主成分分析的数学模型,主成分分析的几何说明(意义)。

第三节 主成分的推导及性质:

主成分的导出,主成分的主要性质。

第四节 主成分的计算步骤及其应用

主成分的计算步骤(1.将原始数据标准化;2.建立变量的相关系数矩阵R3.R的特征根及相应的特征向量;4.写出主成分),在经济管理中的应用(直接的主成分分析、综合评估)。

三、重点、难点提示和教学手段

(一)数学模型、

(二)主成分的推导、

(三)主成分的贡献率、

(四)主成分的主要性质、

(五)计算步骤

四、思考与练习

见教材P252-256:7-17-27-37-47-5

第八章 多元数据图表示方法

一、学习目的

通过本章的学习,掌握四种多元数据的图示方法,要学生会由多元数据图对数据建立直观印象。建议课时安排:2学时。

 

二、课程内容

轮廓图;雷达图;调和曲线图;星座图。

 

第九章   因子分析

一、学习目的

本章要求学生了解因子分析的目的和实际意义,特别是因子分析模型的统计思想,以及与一般回归模型在本质上的区别。要熟悉因子分析数学模型建模的假设条件和各个分量的实际统计意义。掌握由主成分方法估计因子载荷阵的推导步骤,以及重要的基本性质。了解因子旋转(主要是方差最大正交旋转方法)和因子得分的实际统计意义和它们的数学表达式。能够利用计算App,自己编程解决实际问题中的因子分析问题,同时能给出初步的统计分析报告。建议课时安排:  6学时

二、课程内容

第一节 概述

因子分析问题提出的背景,以及因子分析的基本思想。

第二节 因子分析的数学模型:

因子分析的数学模型,因子模型的性质,因子载荷矩阵的统计意义。

第三节 因子载荷矩阵的估计方法

估计载荷矩阵和个性方差矩阵,常用的估计方法有主成分法,主因子法和极大似然法。主要先容的是主成分法。

第四节 因子旋转

因子的说明带有一定的主观性,常常通过旋转因子的方法来减少这种主观性。因子旋转有正交旋转和斜交旋转两种,主要先容主要介因子旋转的方法。

第五节 因子得分

因子得分(概念)以及两种因子得分方法(巴特莱特因子得分和汤姆森得分)。

第六节 计算的步骤

因子分析的计算步骤(1.将原始数据标准化;2.建立变量的相关系数矩阵R3.R的特征根及相应的特征向量,取前m个特征根及相应的特征向量写出因子载荷矩阵A4.A实施方差最大正交旋转;5.计算因子得分)。

三、重点、难点提示和教学手段

因子载荷阵的估计方法、因子旋转、因子得分、计算步骤

四、思考与练习

见教材P338:10-110-310-4

参考文献

[1] 张尧庭、方开泰著,《多元统计分析引论》,科学出版社,1982

[2] 何晓群,《多元统计分析》,中国人民大学出版社出版,2004

 

 

打印此页】【顶部】【关闭
   
版权所有 2019 澳门赌搏网站大全 All rights reserved 皖ICP备05018241号
地址:安徽省合肥市九龙路111号澳门新莆京娱乐网站磬苑校区理工楼H楼 邮编:230601 E-mail:math@ahu.edu.cn
访问统计:自2013年9月1日以来总访问:1000  后台管理


XML 地图 | Sitemap 地图