统计学变量的分类十篇

发布时间:2024-04-29 12:21:22

统计学变量的分类篇1

现在国家硕士研究生培养门类中列于数学大类之下属于概率论与数理统计大方向的有概率论与数理统计学术型硕士,应用统计专业学位硕士两类。两类硕士生的来源均是四年制本科生,学术性硕士生源的一般要求是数学或统计学专业毕业,应用统计专业学位硕士则只要求是理工科及相关专业即可,二者差别较大,专业知识的起点高度有差距。

在培养目标上,两类硕士差距就更加明显了。学术型硕士要求可以进行基本的专业理论研究,有继续进行高等理论研究的素质和潜力,其中的一部分人可以继续攻读本专业及相关金融、管理、经济等相关专业的博士学位,学术性的硕士生更强调理论学习和理论基础的训练。专业学位硕士则要求较好的专业知识实用能力,了解掌握常用统计方法的思想和软件应用,实践能力强,具有分析解决带复杂数据分析背景的实际问题的潜力,强调的是学生对实际问题的处理能力,各种统计方法的综合运用及实战能力。在国外发达国家,目前均有应用统计专业学位博士,就是说将来在我们国家,优秀的应用统计专业学位硕士可以进一步攻读专业学位博士,这类博士应该对实际问题有敏锐的眼光,对各种实用的统计方法有全面的了解,知晓其长处与不足,可以解决复杂的实际数据分析问题,因此应用统计专业学位硕士的概率理论基础训练应更加倾向于实际,倾向于在统计学中大量用到的概率论知识。这就决定了对两类硕士在概率论基础知识要求方面有很大不同。在概率论基础方面,由于两类生源的本科知识体系中都是以《概率论与数理统计》课程为起点,概率论部分基本相同,内容是:概率基础及公式,随机变量及分布,随机向量及分布,数字特征及计算。在硕士生阶段应在此基础上考虑两类硕士的培养目标的差异,分别在概率基础课程中安排不一样的教学内容和重点。

对学术型硕士生,通常开设《高等概率论》课程,以测度论为起点,具有一定的抽象度和深刻性,讲授一般观点下的积分、可测变换,随机变量及向量,概率理论、基本公式独立性,不等式和极限定理,数字特征与相依关系,讲述高度抽象的测度控制理论、拉冬一尼古丁定理、抽象的条件期望理论,训练学生的思考能力和论证基本功。对应用统计专业学位硕士,开设《概率论基础课程》,不涉及测度论等抽象内容,但是要把在实际应用中所有数据类型所对应的概率密度形式及演算作为重点加以训练,内容应该集中在常见随机变量的回顾,特殊类型的随机变量(既不是离散的也不是连续的)的引入和背景,条件概率演算一特别是连续变量对离散变量、离散变量对连续变量的条件概率计算,复杂情况下随机变量数字特征的计算等等,强调学生的动手推演能力和问题归类能力,例如要求学生会计算贝叶斯理论中常用的二项变量与贝塔变量的联合分布,通过这个联合分布来来计算相应的广义条件概率密度及条件数学期望。另一个例子就是给学生们详细介绍对连续型随机变量进行截断以后得到的截断随机变量的分布推演过程,讲述清楚该类型随机变量所对应的广义密度函数与原来的连续型随机变量的密度函数之间的关系,这类随机变量既不是连续性的也不是离散型的,使二者的结合体,在生物统计、工程试验的数据集合中经常会出现。

统计学变量的分类篇2

【关键词】统计分析方法;应用;检验体系;共性问题;现实意义

中图分类号:C8文献标识码:a文章编号:

前言

随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。

二、多元统计分析方法的主要应用

统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。

聚类分析

它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与其它类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定市场营销战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过市场调查,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。

判别分析

判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。

主成分分析

主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。

因子分析

因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等n个指标进行因子分析,如果按照一般的分析方法,我们就需要处理n个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。

三、构建多元统计分析方法检验体系的必要性

(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量

多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。

(二)多元统计分析统计检验体系的基础理论

多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。

(三)关于统计检验体系

将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:

a.主成分分析统计检验体系

b.因子分析统计检验体裂引

c.系统聚类分析统计检验体系

d.判别分析统计检验体裂

e.对应分析统计检验体系

f.典型相关分析统计检验体系

四、多元统计分析方法应用中需要注意的几个共性问题

1.关于原始数据变量的总体分布问题。

对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。

样本容量问题。

进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。

原始变量之间的相关性以及非线性关系问题。

多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。

数据处理问题。

多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。

五、结束语

在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。

【参考文献】

[1]于秀林.多元统计分析[m].北京,中国统计出版社,1999:223—224.

[2]高惠璇.应用多元统计分析[m].北京,北京大学出版社,2005:343—366.

统计学变量的分类篇3

关键词:对应分析;成绩;SpSS

中图分类号:G64文献标识码:a

收录日期:2013年8月5日

分析记笔记方式与成绩间的相互关系常用描述统计和相关分析。在描述统计中,用得较频繁的是频度统计、平均数、百分数等统计量。但这些统计量仅能进行单变量数据描述,并且数据拘泥于就事论事的罗列,不能对数据进行挖掘。相关分析可以挖掘多变量间的关系,如关联的程度和方向,也可用于信度分析、预测等,是一种功能强大的多用途统计技术。本文介绍的对应分析法,即能形象地用二维坐标图表达出两个变量不同分类间的关系,这是其他方法所难于比拟的。

本次研究的数据,来自由德州学院2012级国际经济与贸易学专业组织的针对全校四个年级各专业学生的学习方式调查。数据采用问卷形式获得,用系统抽样方法从全校四个年级的学生中抽取146人,收回133份调查问卷,对数据进行处理,经剔除重复数据,并使用序列均值方法替换缺失值后得到123份有效调查问卷,旨在了解学生学习方式与学习成绩之间的关系。但本次分析的数据只研究其中的一个变量,即:学生上课记笔记方式与学习成绩的关系。记笔记的方式分为四个层次:不停地记笔记,课后再复习;认真听老师讲解,偶尔记笔记;不听老师讲解,自己看书学习;只听老师讲解,从不记笔记,并分别赋值1、2、3、4。对被调查者分数重新编码,将学生成绩分为四个层次:0~59.9分,60~69.9分,70~79.9分,80~100分,分别赋值1、2、3、4。具体的研究问题是:记笔记方式与学习成绩变量类别之间是否有联系?如果有联系,联系有什么趋势?

在对调查数据进行分析和重新编码的基础上对行变量类别与列变量类别进行交叉汇总,如表1所示。(表1)

样本量为123人。总体上看,大多数回答情况是不停地记笔记,课后再复习和认真听老师讲解,偶尔记笔记,两项共计106人。70~80分的学生为54人。(表2)

表2显示对应分析最终汇总统计量,包括维度、单一值、惯量、卡方值、p值、惯量解释比例以及单一值稳定性等数据。卡方值19.507,p=0.021

对应分析还能用图形直观地反映行变量与列变量之间的关系,特别是当变量的类别数多时,图形既直观又具解释力,优势更加突出。本次分析的图形结果见图1。(图1)

注:图中实心的圆点表示记笔记情况,空心的圆圈表示成绩。不停地记笔记,课后再复习=1;认真听老师讲解,偶尔记笔记=2;不听老师讲解,自己看书学习=3;只听老师讲解,从不记笔记=4。0~60分=1,60~70分=2,70~80分=3,80~100分=4。

图1可以同时达到两个目的:一是解释变量间的关系,二是帮助分析变量分类的合理性。在图1中,分值的距离表示变量间的差异,有相似分布的变量在距离上靠得近一些。如果分值是负数,说明这一单元格的观察频数低于期望频数。从图1可看出,70~80分与不停地记笔记,课后再复习联系紧密,80~100分与认真听老师讲课,偶尔记笔记联系紧密。整体而言,及格以上的学生更倾向于不停地记笔记,课后再复习或认真听老师讲课,偶尔记笔记。从图1还可看出,在变量的分类上,70~80分可以与60~70分合并为60~80分。而不及格的学生与其他人相差甚远,他们不听老师讲解,自己看书学习或只听老师讲解,从不记笔记。

综合以上分析,我们可以得出下列结论:学生学习成绩与上课记笔记方式有联系:学习成绩较好的学生倾向于认真听老师讲课,偶尔记笔记或不停地记笔记,课后再复习。而学习成绩差的学生则不听老师讲解,自己看书学习或只听老师讲解,从不记笔记。

一般的交叉表难以清晰地表达两个变量的本质关系。本文以对应分析法分析大学生记笔记方式与成绩间的二维对应关系,并能输出几何坐标图,形象地表达一般交叉表难以表达的变量不同分类间的关系。相似的分类变量才会在坐标图上彼此靠近,因而很容易形象地了解变量的哪些分类间彼此相似或彼此相关。因此,在分析学习方式对学习成绩的影响中学会对应分析方法不仅有利于提高学生学习成绩,也有助于推动这类研究向纵深发展。

主要参考文献:

[1]潘宝骏,陈征,刘少娟.8463例正常分娩新生儿体重、胎位与孕母年龄的对应分析[J].中国卫生统计,1999.3.

统计学变量的分类篇4

[关键词]SpSS聚类分析因子分析

[中图分类号]tp319[文献标识码]a[文章编号]2095-3437(2014)18-0004-04

一、绪论

学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。

本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SpSS19.0。

二、分析方法

(一)相关分析

函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。

(二)层次聚类分析

聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。

主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]

(三)因子分析

教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。

三、分析过程

(一)对课程变量的R型聚类分析

对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(eucalideanDistance)、minkowski距离、Chebychev距离和pearon相关系数等。在SpSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SpSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]

本次分析采用了pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。

(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。

(2)当课程分成3类时。体育课iV归类出现变化,单独归入类3,说明体育课iV与其他学期的体育课的成绩考核可能存在差别。

(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。

(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。

(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。

(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。

其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。

四、结论

1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。

同样,体育iV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育iV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育iV的载荷达到0.912,同时,因子1、因子2、因子3对体育iV的载荷很小,因此,体育iV仅由因子4解释,体育iV与其他三个学期的体育课程不存在共同特征,体育iV可能在课程内容或评价方法等方面存在特殊性。

2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。

3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、思想概论和思想道德修养归属于因子1,高等数学a、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(i)、体育(ii)和体育(iii)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。

[参考文献]

[1]杨晓明.SpSS在教育统计中的应用[m].北京:高等教育出版社,2004:247.

[2]余建英,何旭宏.数据统计分析与SpSS应用[m].北京:人民邮电出版社,2003:252-253.

统计学变量的分类篇5

摘要:本文对数学建模方法分类情况做系统全面介绍,并对每种分类方法从适用情况、自身特点等方面做出客观评价,得到各种分类方法最适合使用的不同情况的结论,本文旨在此方面的研究能对数学建模学习者、教学者和研究者有所帮助。

关键字:大学生数学建模方法分类

当今世界人们研究自然界、人类社会的三大基本方法分别是科学计算、科学理论和科学实验。而现在人类社会面临由工业化社会向信息化社会过渡的时期,面对这个社会的过渡时期,我们需要的是一批能够适应高度信息化社会、拥有探索和研究自然界和人类社会三大方法的高素质人才。信息化社会的两个显著特点,一是计算机技术的迅速发展与广泛应用,二是数学的应用向一切领域渗透。计算机技术的飞速发展使得科学计算的作用越来越突出。全国各个高校大都开设有数学建模相关课程,培养学生的科学计算和创新的能力。

一、数学建模方法分类的意义

数学模型是对现实世界的特定对象,为了特定的目的,根据特有的内在规律,对其进行必要的抽象、归纳、假设和简化,运用适当的数学工具建立的一个数学结构。数学建模就是运用数学的思想方法、数学的语言去近似地刻画一个实际研究对象,构建一座沟通现实世界与数学世界的桥梁,并以计算机为工具应用现代计算技术达到解决各种实际问题的目的。建立一个数学模型的全过程称为数学建模。

数学建模过程就是一个创造性的工作过程。人的创新能力首先是创造性思维和具备创新的思想方法。数学本身是一门理性思维科学,数学教学正是通过各个教学环节对学生进行严格的科学思维方法的训练,从而引发人的灵感思维,达到培养学生的创造性思维的能力。同时数学又是一门实用科学,它具有能直接用于生产和实践,解决工程际中提出的问题,推动生产力的发展和科学技术的进步。

所谓分类,是对要研究的对象按照特点不同,将相似的部分归为一类,这样研究对象就被分为几种类型。在研究的过程中正是由于同一类型有相似点,不同类型又有不同点,方便对比、记忆,从而方便人们按不同类型依次分别进行研究。

本文所说的数学建模方法的分类,是从广义上出发,研究的是按照怎样的方法分类,使人们可以按照分类体系对数学建模进行认识学习,不是狭义的局限于单纯对算法或者模型进行分类,因为学习算法和模型本身就是一种学习数学建模的途径,本文不就某个途径展开分类,而是研究有哪些途径,在此称之为数学建模方法的分类。

学生学习数学建模,首先就要了解数学建模方法如何分类,只有按照一定的分类方法才能系统、完整、不纰漏的进行学习,同时,不同的分类方法适合不同的学习方法,不同的学生也会对各种分类方法有所选择。因此弄明白各种数学建模方法分类的情况,有助于更系统的了解数学建模,有助于学生选择合适的分类进行学习,有助于老师选择合适的分类方法教学,有助于研究者清楚调理地进行研究,有助于数学建模爱好者的交流分析。

二、数学建模方法的分类

现在流通于数学建模这一领域的书籍、文章等主要使用了5种分类方法:按照数学系统进行分类、按照数学模型进行分类、按照实际问题进行分类、按照分析方法和算法进行分类、按照计算软件进行分类等。下面对各种分类方法分别作介绍。

(一)按照数学系统分类

按照数学系统进行分类,也可以称之为按照大学通常开设的课程分类,即将数学建模方法分为高等数学、线性代数、概率论与数理统计三大类。

1.高等数学

与初等数学研究的是常量与匀变量相比,高等数学研究的则是不匀变量。而生活中,可以说没有什么是一成不变的,尤其是数学建模讨论的范围内,问题的一个或多个变量总是不断改变的,因此某些问题就要求我们用高等数学思想去计算。同时,高等数学是解决数学建模问题不可或缺的工具。总体来看,高等数学贯穿于所有数学问题的研究中。

高等数学的内容包括:一、函数与极限,二、导数与微分,三、导数的应用,四、不定积分,五、定积分及其应用,六、空间解析几何,七、多元函数的微分学,八、多元函数积分学,九、常微分方程,十、无穷级数。其中数学建模常用的有函数、积分、微分等。

2.线性代数

线性代数的研究对象是向量,向量空间,线性变换和有限维的线性方程组。建模问题中非线性模型可以被近似为线性模型,用行列式计算方程组问题往往使计算变得更容易,这使得线性代数在数学建模中也很常用。

线性代数的内容包括:1、行列式,2、矩阵,3、向量,4、线性方程组,5、相似矩阵与二次型。其中数学建模常用的有行列式、矩阵、线性方程组等。

3.概率论与数理统计

概率论与数理统计的理论与方法已广泛应用于数学建模中,如时间序列分析应用于石油勘测和经济管理问题,马尔科夫过程与点过程统计分析应用于地震预测问题等。

概率论与数理统计的内容包括:1、随机变量及其分布,2、多维随机变量及其分布,3、随机变量的数字特征,4、大数定律及中心极限定理,5、样本及抽样分布,6、参数估计,7、假设检验,8、方差分析及回归分析,9、bootstrap方法,10、随机过程及其统计描述,11、马尔科夫链,12、平稳随机过程。其中参数估计、方差分析、马尔科夫链等在建模中都很常用。

结论

经过以上对五种数学建模方法的分类情况的讨论,初步得到结论,在入门学习时按照数学系统分类的方法最适宜。在系统地、深入地研究数学建模时按照数学模型分类的方法最适合。按照实际问题分类和按照分析方法和算法分类由于比较典型但不够完整,因此作为前两种分类的补充最合适。按照计算软件分类的方法比较适合于上机完成数学建模的教学。我们在学习、研究、交流数学建模的时候,大学生在学习建模的时候,教师在传授数学建模的时候,爱好者在研究建模的时候,在不同的条件下按照相适应的方法分类,往往能起到事半功倍的作用。

参考文献:

[1]叶其孝主编,大学生数学建模竞赛辅导教材(一)[m],长沙:湖南教育出版社,1993。

[2]叶其孝主编,大学生数学建模竞赛辅导教材(二)[m],长沙:湖南教育出版社,1997。

[3]叶其孝主编,大学生数学建模竞赛辅导教材(三)[m],长沙:湖南教育出版社,1998。

统计学变量的分类篇6

关键词:地质统计学微量元素化学分析应用研究

中图分类号:p628.2文献标识码:a文章编号:1672-3791(2013)07(c)-0098-01

微量元素地球化学是半个世纪以来迅速发展和广泛应用的地球化学分支。由于同位素稀释质谱法、中子活化分析、Berthelot-nernst分配定律等方法的成功应用,在多种地质过程中微量元素分配演化的定量模型得以实现,也使得微量元素化学分析被系统地应用于解决各类地质问题,成为指示岩石成因的典型标志。20世纪70年代以后,微量元素地球化学的讨论从定性认识上升成为定量分析,发展方向也变成微观、宏观同时发展,经常需要对地球化学中的主量元素、稀土配分、微量元素等进行定量化学研究和数据分析,此时,一些相关的地质统计方法就变得非常重要和实用。在微量元素化学分析中,地质统计学的各类统计方法作为对地质客观现象相关数据进行定量分析的重要工具,提供了诸多有效的数据分析途径。应用地质统计学对微量元素化学分析进行处理,能为研究工作取得客观成果提供科学的定量依据。

1地质统计学与微量元素化学分析相关理论知识简述

1.1地质统计学

地质统计学是20世纪60年代兴起的一门数学地质学科分支,它的出现始于解决矿产普查勘探、矿山开发设计以及矿山开采整个过程中各种储量计算和生产误差估计问题。后来,地质统计学逐渐在油气勘探开发、采矿、水文以及环境科学领域中得到广泛应用。近年来,地质统计学作为一门新兴的科学,在地质领域的发展非常迅速,其应用前景的广泛性和模型计算的实用性受到地质学家的高度重视。

1.2微量元素化学分析

微量元素化学分析是地球化学的分支学科,主要研究自然物质和自然体系中微量元素的分布规律、存在形式、活动特点、控制因素及其地球化学意义。一般意义上讲,微量元素是指除了o、Si、al、Fe、Ca、na、K、mg、ti这九种组成99%的地壳和地幔质量之外的80余种元素。当然,这里所指的微量元素是相对而言的,在一个体系中它可能是微量元素,但在另一个体系中却可能是常量元素。

1.3地质统计学在地球化学领域的应用现状

近几十年年来,地质统计学对地球化学的相关研究中起到了极大的辅助和推进作用。应用地质统计学相关统计方法能够将大规模原始地球化学数据群体中隐藏的重要信息提炼和挖掘出来,进行分类和解释,继而被广泛地应用在地质找矿、科学研究等各个领域。在地球化学中主量元素、微量元素、稀土配分化学分析等领域的研究中,丰富的地质统计学方法对圈定和评价地球化学异常、提取地球化学找矿信息常常起到决定性的作用。本文则主要研究地质统计学在微量元素化学分析中的应用研究。

2地质统计学在微量元素化学分析中的应用研究

2.1方法讨论

聚类分析是通过某种距离的测算将数据对象的集合分为类似的对象组所形成的若干个类,其中运用到了降维思想,在对样品和指标进行分类,采用物以类聚的原理进行的一种多元统计分析方法。在地质找矿领域,聚类分析是研究元素在成矿活动中地球化学行为相似程度的一种有效方法,一般从数字分类角度进行分析。对于这种方法的运用,我们可以借鉴现有的成果和理论进行分析和应用。R型聚类分析是聚类分析方法的一种,原理是以变量之间的相似程度为基础,将变量分成不同级别的类。R型聚类分析是研究成矿活动中地球化学微量元素行为相似度的一种有效方法。通过对某些矿石或岩样的微量元素数据进行R型聚类分析,可以得出元素组合特征并将其分类,对元素之间的亲疏关系进行判定,进一步为划分矿化阶段、成矿元素迁移和富集的判断以及矿床成因等问题的研究提供判断依据。

2.2案例研究

通过对高松山矿区内岩矿石样品的微量元素数据进行R型聚类分析后,可以得到图1中显示的分类的结果,即,在相似水平的相关系数等于15时,可以把微量元素分成7个类别,分别是:(1)w、Cu;(2)Sn;(3)au、ag、as、Sb、pb、mo;(4)Bi;(5)Hg;(6)Co、ni、mn;(7)Zn。这7个类别之间没有显著的相关性,说明矿床成矿具有多期次性和复杂性。从图中还可以看出,au不仅和ag有着强相关关系,而且还和as、Sb、pb相关。而au元素与ag之间有非常密切的关系,当γ=2.5时它们聚成了一类,相关性比较强,同时Sb、as、pb和它们之间都存在相关性,说明au、ag、as、Sb、pb、mo之间具有亲缘关系,预示着伴随着多金属硫化物的形成au成矿并且富集。因此,我们可以以Sb、pb、ag、as作为矿区找金的近程指示元素。

3结论

本文采用地质统计学中一类常用方法,R型聚类方法对高松山矿区的铜多金属矿进行了微量元素组合上的分析研究。统计分析结果使我们对高松山金矿床岩矿石微量元素的数据结构的特点有了清楚的认识。各元素组合具有叠加出现的特征,表明矿床成矿具有多期多阶段或成矿物质多来源的特征。分析结果表明au与ag、as、Sb、pb等中低温元素相关非常大,但是和w、Co、Sn、mn、ni、Zn等中高温元素之间的相关性较差。

地质统计学在地球化学其它领域,比如常量元素分析、稀土元素分析中也有广泛的应用,笔者认为,采用类似的统计方法对不同类数据的分析是进一步拓展地质统计学在地质科学中应用性的前进方向。

参考文献

[1]赵伦山,张本仁.地球化学[m].地质出版社,1988,6.

统计学变量的分类篇7

1SaS软件在医学统计中的统计描述

在医学当中最为常见的两种资料类型分别是定量资料和分类资料,因此在对数据进行处理的时候就需要对资料的类型和分析情况作出了解,这样在对资料进行描述的时候就能够根据特殊的情况选择合适的方法[1]。

1.1定量资料的统计描述

所谓定量资料的统计描述就是对离散趋势和集中趋势进行描述,在描述性统计当中,频数分析和频数描述是两种最为常用的方法,如果我们想要对数据进行了解和认识,那么我们首先就需要从频数分析开始。

进行频数分析需要编制频数表,在编制频数表的时候需要将所有的观察结果按照一定的顺序做出排列,需要在排列的顺序当中去发现观察值的分布规律。也可以对某一个变量的频数进行频数分析,编制相应的频数分布表,这样就可以将该变量的分布类型揭示出来。频数分析能够将远离群体的某些可疑值发现,因此频数表能够对频数分布的两个重要特征做出表示,一个是集中趋势,另一个就是离散趋势。我们根据频数表所绘制出来的直方图就能够更加直观地将资料的分布特征观察出来[2]。在SaS软件当中,我们可以通过分析员来对频数做出频数分析,通过编程做出频数统计。

频数分析能够将定量变量的相关资料的分布情况和集中情况进行一定的描述。但是,如果我们想要更多的了解一些关于集中趋势和离散趋势的确切信息,那么我们就需要对于一些相关的描述性指标作出必要的计算[3]。所以,我们需要利用SaS软件当中的分析员来对常用描述性的统计指标作出描述,依然使用编程来对描述性的统计指标作出计算。

1.2分类变量的统计描述

分类变量的数据特征和定量资料是完全不相同的,分类变量的基础数据是绝对数据,比如某种疾病的出院人员、治愈人数以及死亡人数等等。在对一组定性资料数据特征进行描述的时候,一般都需要对其相对数做出计算[4]。在医学统计当中,我们常用到的相对数有构成比、频率和相对比等。所以在这里,我们也需要通过分析员对我们常用的相对数指标作出计算。

2SaS软件在医学统计中对总体均数的应用

举个例子来说,已知某地27例健康的成年男子的血红蛋白的含量均数是[x]=125g/L,标准差是S=15g/L,其数据是(血红蛋白含量[g/L]):123,105,134,140,127,112,113,127,145,125,110,130,112,138,110,100,104,155,147,137,126,125,100,122,127,133,145。对该地健康成年男性的血红蛋白量在95%、99%的可信区间进行估计。我们可以用来做出总体的均数估计,运行分析员,做出数据集。经过具体的操作和分析,我们就可以得出我们需要的结果:95%Confidenceintervalforthemean;LowerLimit:118.91;UpperLimit:130.87.99%Confidenceintervalforthemean;LowerLimit:118.91;UpperLimit:130.87。

计算好这些以后,我们还需要通过SaS程度做出总体的均数估计,可以通过运用CapaBiLitY过程当中的inteRVaLS语句,对其正态分布的总体均数的各种类型的可信区间做出估计。在整体均数的计算当中,其可信区间的SaS程序常规格式为:proccapabilitydata=数据集的名字noprint;intervals变量名的列表/method=4;run;

3SaS软件在医学统计中队样本含量及检验效能的估计

在各类的医学统计研究当中,对样本含量做出确定是研究设计的一个重要内容。因为样本含量计算起来相当麻烦,而且其样本条件也不容易掌握,所以在很多研究当中都将样本含量的计算忽略掉了。因此也就很容易发生样本含量偏低、检测效能偏低以及结果不可靠等情况。但是我们也不能够盲目去追求大的样本,因为一旦样本含量过大就会对很多资源造成浪费,加剧了质量的控制难度,造成资料的可靠性下降[5]。所以,在设计当中,只有对样本的大小做出科学的评估,才能够将检验的效能满足下来。

在对样本含量做出估计的时候需要使其具备四点条件。①对检验水平做出确定,是第一类错误的概率,其值越小所需要的样本例数就会越多,所以在通常条件下,我们会选择让=0.05,再根据专业的知识对双、单侧的检验进行确认;②将所期望的检验效能1-提出来,如果两总体确实存在差别的时候,就能够将这种差别发现,所以要求检验的效能越大,其样本的含量也就会越大。因此,检验效能也是由第二类错误的大小所决定的,通常情况下,我们都选择=0.25-0.1之间,而相对的检验效能就是0.75-0.90之间,检验效能不能够小于0.75,不然的话就不能够将总体真实差异反映出来;③允许出现的误差范围为=|2|,就是对两个总体参数差值进行比较,而总体参数可以通过预试验获得,也可以用专业上认为具有实际意义的差值来替代;④对总体标准差和总体率进行确定,通常都是根据试验结果或者预实验结果来确定,也可以通过样本标准差或者样本率来代替[5]。

在SaS的系统当中,我们一般都运用分析员的模块对样本含量的大小做出评估,但是这种模块却仅仅只限于对连续性的变量样本模块含量做出估计。

统计学变量的分类篇8

关键词:模糊分类器;mamdani;遗传算法

中图分类号:tp18

文献标识码:a文章编号:1672-8513(2010)03-0228-04

StudyonthemamdaniFuzzyClassifierBasedontheGeneticalgorithm

Lianhua,YinHongyan,ZHoUweihong

(SchoolofmathematicsandComputerScience,YunnanUniversityofnationalities,Kunming650031,China)

abstract:

mostofthefuzzyclassifiersarecreatedbyfuzzyrulesbasedontranscendentknowledgeorexpert′sknowledge.inmountainsoftheexistingdata,itisdifficulttoobtaintranscendentknowledgeandthenmoredifficulttoobtainfuzzyrules.thispaperproposesawayforcreatingmamdanifuzzyclassifierbasedonGaandmamdanifuzzylogicalsystem,withtheminimumnumberoffeaturesandfuzzyrulesaswellasbetterprecision.theresultwasappliedtotheiriswithbettereffects.

Keywords:fuzzyclassifier;mamdani;Ga

大多数简单分类问题,通常采用总结专家知识的方法构造模糊分类器,而对于复杂系统,人们很难获得完备的专家知识,而数据相对容易获得,因此建立在数据构造的模糊分类系统成为研究的热点,它们主要包括模糊聚类[1]、模糊神经网络[2]和进化模糊系统[3]等.这些方法通常利用了模糊模型万能逼近器的功能,以精确性指标为研究目标,而模糊模型的解释性却没有得到较好的处理.模糊模型的知识表达形式和推理机制可以融合专家的经验和知识,相比于神经网络等模型,符合人的思维习惯,其结构和隶属函数参数可以有明显的语义意义,人们可通过易于理解的模糊规则来洞察系统的内部运行机理,即解释性是模糊模型的最显著的特征.如何从数据中自动构造出精确性和解释性的模糊系统,近年来成为一个较热门的研究领域.

模糊分类系统的解释性,到目前为止还没有明确的定义,但一般认为,模糊分类系统的解释性与特征变量数目和模糊规则数目相关,还与隶属函数特性也密切相关.认为较少的特征变量数,较少的规则数的模糊分类系统具有更好的解释性.

本文在文献[4]的基础上对模糊规则前件的特征变量进行选择和论域进行模糊划分,并结合mamdani模糊推理系统[5],对输出结果的改进而生成一类模糊分类器,并对iris数据仿真,生成一个较文献[1]中较少的变量和规则数目的分类器,收到较好的分类效果.

1模糊分类器

模糊推理本质上就是将一个给定输入空间通过模糊逻辑的方法映射到一个特定的输出空间的计算过程,它涉及到隶属度函数、模糊逻辑运算、if-then规则等一些基本理论.目前常用的有mamdani和Sugeno型模糊逻辑系统,其中mamdani系统是最常用的算法.本文主要采用mamdani模糊逻辑系统.

而模糊分类器是将模糊系统与分类器相结合的一种特殊的模糊系统.对于n维m类n样本的的分类问题,其中x=(x1,x2,…,xn)为特征变量,{C1,C2,…,Cm}为输出类的标号值,则典型的模糊分类系统规则形式分3类:

1)模糊规则的后件仅为所属类,即:

Ri:ifx1isa(1,k),x2isa(2,k),…,xnisa(n,k),thenclassisCi,(1)

其中a(1,k),…,a(n,k)为定义在特征论域中的隶属度函数,可以取三角形、高斯形、梯形等.

2)模糊规则的后件为所属类并给出样本属于该类的置信度,即:

Ri:ifx1isa(1,k),x2isa(2,k),…,xnisa(n,k),thenclassisCiwithwi,(2)

wi为第i条规则的置信度;

3)模糊规则的后件为所有类并给出样本属于各类的置信度值,即:

Ri:ifx1isa(1,k),x2isa(2,k),…,xnisa(n,k),thenclassisCi(o)withwi(o),(3)

其中Ci(o)为输出向量的所有类中的某个类的值,wi(o)是它对应的置信度值.

本文中的规则后件为所属输出类的单点隶属度函数,即:

Ri:ifx1isa(1,k),x2isa(2,k),…,xnisa(n,k),thenYisa(n+1,Ci),(4)

其中a(n+1,Ci)是对应输出类的隶属度函数,它可以取常用的三角形、高斯形、梯形隶属度函数,本文在此取单点支撑隶属函数.对模糊推理结果再用分类器分类.

对于变量的第K个隶属度函数,采用文献[4]的方法用双边高斯隶属度函数表示:

李安华,尹红艳,周卫红:基于遗传算法的mamdani模糊分类器的研究

a(j,k)=exp-xj-c(j,k)ωl(j,k)2xj≤c(j,k),

exp-xj-c(j,k)ωr(j,k)2xj>c(j,k).(5)

(5)式中,c(i,k)、wl(j,k)、wr(j,k)分别表示双边高斯隶属度函数a(j,k)的中点、左宽度、右宽度.

对于输出类别的隶属度函数采用单点隶属度函数:

a(n+1,Ci)=1y=Ci,0y≠Ci.(6)

对样本xk模糊系统的输出采用“赢家通吃”的策略(winner-take-all),即系统的输出为具备最大激励度的规则所对应类的隶属度函数:

xk∈a(n+1,Cl),l=arg(max(βi(xk)),1≤l≤m.(7)

(7)式中βi为第i条规则的激励强度:

βi(xk)=Πnj=1aij(xk).(8)

(8)式中,aij(xk)为第i条规则中第j个变量的隶属度函数.

以上就构成了一个模糊规则,从而一个个的模糊规则就组成一个模糊规则库,但这样组成的mamdani推理系统的输出结果是一个连续的论域,所以最后对mamdani系统的输出采用分类器进行分类.分类器的构造:因为类别数为m,则输出的连续论域为[0,m),则分类把mamdani系统输出落在[i-1,i]范围内的归为第i类.计算类别的公式如下:

i=int()+1.(9)

这样就有一个类别的输出.分类器的流程图如图1.

2利用遗传算法构造mamdani模糊分类器

遗传算法是要对一定数量的种群数,然后对这个种群根据目标函数进行选择、交叉、变异等遗传操作,然后这样一代代进行优化,得到想要的结果.这里的种群是构造一定数量的模糊分类器,目标函数是每个分类器错误分类的个数、特征变量的个数、模糊规则数.利用遗传算法对这个种群优化从而可获得较优的模糊分类器.

要得到一个有一定种群数的模糊分类器,而且使模糊分类器有较高解释性,又缓解维数灾难,本文采用栅格法[4]划分各变量的论域,并利用多目标遗传算法,实现特征变量的选择和模糊划分.先对输入变量的论域进行栅格划分,确定前件,再用文献[4]的方法确定后件的类别号,并在此基础上再确定后件的隶属度函数.

2.1模糊规则前件的确定

在遗传算法的个体编码中,特征变量编码为控制基因部分,长度等于特征变量的长度,每个变量对应于1个位元,位元为1,则选择该变量,位元为0则该变量不被选择.

每个变量的论域先用统计的方法统计出来.对于每个变量的论域划分的编码,则先根据经验进行均匀划分,这样可以确定划分的侯选中点,再利用遗传算法选择中点,实现对特征变量论域的模糊划分.每个变量的论域以一定长(均匀划分的中点数)的编码来选择中点,每个中点对应于1个位元,位元为1,则选择该中点,位元为0则放弃选择该中点.每个中点确定后,再确定它们对应的左右宽度.左右宽度的选取与隶属度函数的重叠因子μ有关,如文献[4],左右宽度wl(j,k)、wr(j,k)表示如下:

wl(j,k)=-(c(j,k)-c(j,k-1))2lnμ12,wr(j,k)=-(c(j,k+1)-c(j,k))2lnμ12.(10)

其中c(j,k)表示第j个特征变量的第k个隶属度函数的中心,(10)式保证了第k个隶属度函数值为μ时,它对应的变量值正好与第k-1和第k+1的隶属度函数的中心位置重合,这样的隶属度函数有较高的解释性.

2.2模糊规则的提取

2.1节已选择好了变量及划分完了论域,规则的前件基本确定,规则数为各变量论域划分个数之积.现在是如何确定规则的后件的问题,本文在选择后件所属类的方法如文献[4],但在选择后件所属类的隶属度函数采用了单点隶属度函数.在模糊规则前件确定的情况下,先用每类的训练样本计算出该类的最大归属值,其中归属值用(8)式中激励强度来计算,再比较各类的最大归属值,最大的归属值所在的类为这个规则后件所属类,再定义这个规则后件的隶属度函数.这样反复训练就可以得到整个模糊规则的后件,从而可以得到所要的一个mamdani模糊推理系统.

2.3算法及算法流程

这里采用简单遗传算法,编码采用二进制,由控制基因和论域划分选择基因组成.适应度函数采用3个目标的权重和:

F1=ω1f1+ω2nf+ω3nr,(11)

式中,f1为分类错误分类样本个数,nf为选中的特征变量数目,nr为模糊规则数目,ω1,ω2,ω3分别为3个目标函数的权重数.

算法步骤如下:

Step1:参数设定,遗传代数maXGen,种群大小L等.

Step2:随机产生初始种群L个模糊分类器前件(gen=1).

Step3:由每个个体的代表模糊分类器的前件训练它们的后件,并计算出目标函数值.

Step4:进行遗传操作(选择、交叉、变异).

Step5:判断gen=mXaGen,如果是,则进入Step6,如果否,进入Step3.

Step6:适应度函数值最高的个体为最优的模糊分类器.

算法流程图如图2.

3仿真实验

iris系统是一个非常典型的分类问题,可作为各种分类算法的评估标准.iris数据是由4维(pentallength,pentalwidth,sepallength,sepalwidth)的150个样本组成,共有3个类(1-iris-setosa,2-iris-versicolor,3-iris-virginica),每个类有50个样本.第1类和其它2类完全分开,而第2类与第3类之间有交叉.

本文的实验均在matlab7.0上实现,遗传算法主要采用英国谢菲尔德(Sheffield)大学的遗传算法工具箱.采用如下参数:①种群遗传代数100;②种群个体数目20;③交叉概率0.9;④变异概率0.7;⑤隶属度函数重叠因子μ=0.15;⑥适应度函数参数:ω1=ω2=ω3=1.

遗传算法生成的模糊分类器,只有1个变量x4,并只有3条规则,具体如表1.它的错误分类个数为6.

表1模糊分类器规则表

rule特征变量x4

中点左宽度右宽度类别号

10.50.29040.58081

21.30.58080.58082

32.10.58080.29043

经过和文献[4]的数据比对,文献[4]里的变量数始终为2,规则数目分别为12,3,3,正确分别的样本数目分别是146,145,147,即错误分类个数分别为4,5,3.这里的变量个数比文献[4]少1,规则数一样,只是错误分类个数少于它的第1个遗传算法2个,少于它第2步遗传算法1个,少于它优化后的分类器的错误个数3个.这个分类器比文献[4]的分类器更具有解释性,但精确性稍微弱些.

4结语

本文主要是在文献[4]的基础上,对模糊分类器生成的过程进行研究,并在后件的规则及隶属度函数进行尝试改进,先行生成一个常见的mamdani模糊系统,最后用分类器对它进行分类的一种模糊分类器的生成方法.通过实验说明,它具有良好的分类效果,而且有比文献[4]更好的解释性.美中不足的是它的分类精确性稍弱,在下一步研究的问题是如何优化模糊分类器[6-9],以达到更好的精确性.

参考文献:

[1]范莹,计华,张化祥.一种新的基于模糊聚类的组合分类器算法[J].计算机应用,2008,28(5):1024-1027.

[2]FULLeRR.introductiontoneuro-fuzzysystems[m].newYork:physica-Verlag,2000.

[3]CoRDono,GomiDeF,HeRReRaF,etal.tenyearsofgeneticfuzzysystems:currentframeworkandnewtrends[J].FuzzySetsandSystems,2004,141:5-31.

[4]邢宗义,侯远龙,贾利民.基于多目标遗传算法的模糊分类系统设计[J].东南大学学报:自然科学版,2006,36(5):725-731.

[5]吴晓莉,林哲辉.matlab辅助模糊系统设计[m].西安:西安电子科技大学出版社,2002.

[6]雷英杰,张善文,李续武,等.matlab遗传算法工具箱及应用[m].西安:西安电子科技大学出版社,2005.

[7]王立新.acourseinfuzzysystemsandcontrol[m].北京:清华大学出版社,2003.

统计学变量的分类篇9

回归分析(regressionanalysis)是统计学中一种常用的分析数据的方法,旨在研究一个变量Y与其他若干变量X之间的相关关系,实际应用较为广泛。根据涉及自变量的个数,可将其分为一元回归分析、多元回归分析;根据自变量与因变量之间的关系类型,可将其分为线性回归分析、非线性回归分析。当回归分析中仅包含一个自变量、一个因变量,且二者关系可用一条直线近似表示,该回归分析为一元线性回归分析。当回归分析中包含两个或两个以上的自变量,且因变量与自变量之间是线性关系,则称为多元线性回归分析。回归分析常用于观测数据,目的是获得因果结论。回归分析的结果是最佳拟合直线的数学方程,该方程的用途之一是预测[5-6]。曾宪昌等[7]较早运用通径分析原理对贵州省58头不同年龄、性别的沿河山羊的体尺和体质量关系作出较为系统深入的分析。借助通径图解简明地表达各变量之间的关系,并在区分各自变量在多元回归中的相对重要性后,剔除影响不大的自变量,在偏回归系数显著性检验合格的基础上,建立最优回归方程,直接用体长和胸围估计体质量和屠宰率对山羊产肉性能进行预测。陈永军等[8]运用SpSS14.0分析成年大足黑山羊体尺与体质量的相关关系、体尺对体质量的直接和间接作用以及决定程度,最后建立体质量与体尺的最优回归模型。结果表明:胸宽和管围是影响公羊体质量最主要的体尺指标,胸围是影响母羊体质量最主要的体尺指标。公羊最优回归模型为:Y=19.630-0.940X6+4.346X7,母羊最优回归模型为:Y=-17.942+0.661X4。(注:Y指体质量、X6指胸宽、X7指管围、X4指胸围)王高富等[9]采用SaS软件CoRR对重庆黑山羊成年羊体尺、体质量指标与胴体净肉率进行相关分析,并以成年重庆黑山羊体高、体斜长、胸围、胸宽、胸深、成年体质量为自变量,胴体净肉率为应变量,采用ReG过程BaCKwaRD(后退法)的多元回归分析方法,构建估测重庆黑山羊胴体净肉率的最优回归方程,结果表明:胸围、胸宽和胸深可以作为选择胴体净肉率的间接指标。韩学平[10]采用逐步回归的方法对随机抽测的青海省河南县40只欧拉型藏羊成年公羊和104只成年母羊的体质量和8个主要体尺指标进行回归分析,得到欧拉型藏羊成年公羊体质量和主要体尺指标的最优回归方程为Y=0.88X2+13.64X6-4.35X7+1.28X4-114.51(p<0.01)(R=0.889);成年母羊体尺与体质量的最优回归方程为Y=0.49X1+0.46X2+0.30X3+0.43X4-43.51(p<0.01)(R=0.649)。(注:Y指体质量、X2指体长、X6指管围、X7指尾宽、X4指胸深、X1指体高、X3指胸围)冯平等[11]采用相关分析、通径分析和回归分析的方法研究不同年龄段陕北白绒山羊体尺、体质量、绒长、毛长和产绒量的最优回归模型。结果表明:陕北白绒山羊在4岁时处于最佳生长阶段,产肉和产绒性能最好;产绒量和体尺、体质量、毛长、绒长的最优回归模型为Y=0.559X10+0.391X4-0.176X9+0.196X7-0.169X8。(注:Y指产绒量、X10指绒长、X4指胸围、X9指毛长、X7指管围、X8指腰角宽)陈碧红等[12]运用SaS软件分析戴云山羊体尺与体质量间的相关、体尺对体质量的直接和间接影响以及体尺对体质量的决策程度,最后建立体质量与体尺的最优回归模型。结果表明:各体尺性状因素都在不同程度上影响戴云山羊的体质量。选育戴云山羊时应以胸部为主并兼顾体高,以取得较好的选育效果。

2主成分分析

主成分分析(principalcomponentanalysis)是由K.皮尔森对非随机变量引入的,用于分析数据及建立数理模型,尔后H.霍特林将此法推广应用于随机变量中。主成分分析又称主分量分析,是将多个变量通过线性变换以选出较少个重要变量的一种多元统计分析方法。在实际课题的研究中,为了全面系统地分析问题,常会涉及众多与此有关的变量,每个变量在不同程度上反映该课题的部分信息。信息的大小通常用离差平方和或方差来衡量。主成分分析可设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中取出几个较少的综合变量尽可能多地反映原来变量的信息,是数学上处理降维的一种方法。主成分分析是多元统计中的重要内容,是当前许多研究的主题,其原则是将多个相关指标简化为少数不相关指标,它能够在不损失过多遗传信息的基础上进行多性状的方向性选择,同时提高选择效果[13]。近年来,该方法已被广泛应用于牛、羊、猪等家畜性状的选育工作中。姜加华[14]于2004年对波尔山羊杂交二代(F2)羔羊各阶段体质量和体尺指标进行主成分分析,建立F2的生长模型,为制定新品种培育方案、饲养管理方案提供理论依据,为确定综合选育指标奠定基础。刘铮铸等[15]采用主成分分析法,分析波尔山羊与唐山奶山羊的级进杂交三代羔羊不同年龄阶段体高、体长、腿臀围、胸围和体质量等与生长相关的性状,综合为几个主成分,并由此确定衡量波唐三代羔羊生长发育性状的指标,探讨评估个体羊的生长发育状况。结果表明,在波唐三代羔羊l周龄时,体质量对主成分影响最大,随着年龄增长,在1月龄、2月龄和4月龄对主成分影响最大的是体长和腿臀围,在1月龄和2月龄,第二主成分主要反映羔羊的体高信息。白俊艳等[16]对成年大尾寒羊的体长、体高、体质量、胸围、尾长、尾宽进行测量,利用SpSS软件对以上6个体尺指标进行主成分分析。结果表明,第一主成分的贡献率较高为59.043%,其中高载荷的指标有体高、体长,这些体尺决定大尾寒羊体形的长短高矮,将其命名为高度因子。第二主成分的贡献率为16.919%,其中高载荷的指标有尾长、尾宽,其反映大尾寒羊尾巴形状的变化特征,将其命名为尾形因子。第三主成分的贡献率为11.081%,其中高载荷的指标有体质量、胸围,这些体尺与大尾寒羊体形结构均衡性密切相关,反映大尾寒羊躯体大小程度,将其命名为躯体因子。若取前3个主成分,其特征根值可使累积贡献率达到87.043%,即用这3个主成分可解释6个体尺指标总体信息,且信息损失部分较小,信息损失仅占12.957%。

3因子分析

因子分析(factoranalysis)是研究从变量群中提取共性因子的统计技术。因子分析的模型最早由J.penrson和C.S.pearman提出,首先应用于心理学研究。由于这种研究收到较好的效果,因而引起科学界的注意。数十年来许多统计学家以及其他科学工作者在因子分析的理论、方法和实际应用等方面做大量的工作,使因子分析不断得到充实并成为多元统计学的重要组成部分。与此同时因子分析的应用也逐渐推广到心理学以外的其他学科,如经济学、生物学、植物学、地质学、化学等[17-18]。因子分析与主成分分析都有清理多个原始变量内在结构关系的作用,但主成分分析重在综合原始变量的信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法[19]。因子分析旨在从许多变量中找出隐藏的具有代表性的因子,并将相同本质的变量归入公因子,通过建立公因子与原变量之间的数量关系来预报公因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。因子分析可减少变量数目,还可检验变量间关系的假设。在因子分析过程中,因子数的准确确定是极其重要的。由于分析数据(通常由试验测得)存在误差,这就给确定因子数带来很大困难。如何在掺和误差的试验数据中准确地找出影响原始分析数据的因子数,是因子分析研究中的一个特别重要也很困难的研究课题。多年来,不少致力于因子分析理论研究的工作者在这方面作了很大的努力。然而,迄今还没有现成的准确确定一套试验数据中有多少有意义的因子的严格的方法。不过,已有不少判据在确定因子数时是行之有效的,其中被应用得较多的有e.R.malinowk等提出的判据(如Re、inD等),用交互校验和频串分布等方法确定因子数也是相当有效的,这一方面的研究尚有待进一步的深入[17]。叶昌辉等[20]应用主因子分析的方法对广东省96头雷州山羊成年母羊的8个主要体尺性状进行研究分析,结果显示,雷州山羊成年母羊的8个体尺性状之间的相关系数均为正值,为正相关,可区分为相对独立的3个主因子。其中,第一主因子的贡献率最大,为60.00%,其中腰角宽、胸宽、胸围和胸深的因子载荷值较高,考虑其生物学意义,称第一主因子为躯体因子。同时,山羊躯体大小与屠宰率相关联,故躯体因子是山羊产肉率的一个间接指标。此外,第二主因子的贡献率为16.59%,称为高度因子;第三主因子的贡献率仅为7.64%,称为肢体因子。第一主因子的方差解释量最大,是雷州山羊变异的主要来源,故在今后的选育工作中应给予足够重视,以主因子为单位进行选种,结合其他性状的选择,提高雷州山羊的选育效率。

4聚类分析

聚类分析(clusteranalysis)又称集群分析,它是研究“物以类聚”的一种数理统计方法。聚类分析可将一些观察对象依据某些特征加以归类,在生物学和医学分类问题中有着广泛的应用[21]。聚类分析的基本思想是:所研究的样品或指标之间存在着程度不同的相似性。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标间相似程度的统计量,以这些统计量为划分类型的依据,将相似程度较大的样品聚为一类。聚类分析的目标就是在相似的基础上收集数据并分类,关系密切的对象聚为一个小的分类单位,关系疏远的对象聚为一个大的分类单位,最终把所有的样品或指标聚类完毕,即可形成一个由小到大的分类系统。聚类结果体现数据的分布特征,聚类方法多种多样,针对不同的问题应该采取不同的方法[22]。聚类分析有不同的分类[23-24]:按聚类变量可分为样品聚类(caseclusteranalysis,又称Q聚类),和指标聚类(variableclusteranalysis,又称R聚类);按聚类方法可分为系统聚类(joiningclusterprocedures)和动态聚类(iteractivepartitioningprocedures);按数据的欧几里得距离的远近进行分类分析,常用的有谱系聚类法(hierarchicalcluster)和分类聚类法(disjointcluster)。赵宗胜等[25]对3种不同类型杂交肉用羊的体尺指标进行聚类和主成分分析,将所分析的17项体尺指标分为三大类:特征类、围度类、高长度类。运用这两种方法,所得结果基本一致,但对于不同的杂交组合,结果有一定的差异。根据3种杂交组合的体尺与主成分分析结果,3种羊的第一、二主测指标略有不同,表明其对于不同类型杂交系各种指标的度量应有不同的侧重点。从而揭示出不同类型杂交肉羊体尺差异性的规律,为今后的肉羊品种选育、鉴定、评价提供新的思路和依据。侯洪梅[26]采用SpSS软件对62只7月龄青海加什科公羔体尺和体质量指标进行聚类分析,分为4类,并对各类羊只的各项指标计算类内均值和标准差,根据均值差异确定4类各项指标区间,得出更具操作性和实用性的加什科羊品种鉴定结果。

5判别分析

判别分析(discriminantanalysis)是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。进行判别分析时通常根据已知样本的分类及所测的指标,筛选出能提供较多信息的指标,从而建立判别方程,使其错判率最小。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。判别分析的目的是建立一个判别函数式,建立判别函数式的法则主要有Fisher判别准则和Bayes判别准则。根据已知分类的数目、是否筛选变量和变量间是否有共线性,判别分析可分为二类判别、多类判别、逐步判别和典则判别分析[27-28]。敖学成等[29]经3个点抽样测定,用体尺、体质量性状指标对四川省美姑县58只成年母羊的遗传多样性进行聚类分析和判别分析,表明美姑县高繁山羊类群中存在大、中、小类型,具有选择高产肉用山羊的基础,得出从当前羊群综合性状结构的多样性特点开展有计划的选育十分必要。提出并分析母羊分类的三个判别函数式,其中体高、十字部高、体长、胸围、胸深、胸宽、体质量等性状类别间组内均值相等性检验均达到极显著和显著水平,可从表型值作出判定,因此可作为当前选育的参考依据。陈暖等[30]用SpSS软件对崇明白山羊、海门山羊、徐淮山羊、关中奶山羊的17个体尺指标进行典型判别和逐步判别分析,提供一种基于体尺指标的山羊不同品种和地理类型的量化分析方法。结果表明:该方法总体判别率可达到95.5%,当要求交叉验证正确率>90%时,至少需要9个体尺指标;在品种间两两进行比较时,对判别贡献率最大的指标因品种不同而异。在该研究范围内,角型和胸宽是崇明白山羊区别于其他山羊的两个最具区分度的体尺指标。

6相关分析

相关分析(correlationanalysis)是研究变量之间密切程度的一种常用统计方法。两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。相关分析旨在研究变量之间是否存在某种依存关系,且对存在依存关系的变量探讨其变化方向、密切程度。若两个变量变化方向一致则为正相关,若两个变量变化方向相反则为负相关。简单相关系数(由Karlpearson提出,有时也称作pearson相关系数)用来度量变量间的线性相关关系的强弱程度。相关系数的符号(+或-)代表着变量间相关关系的方向(正相关或负相关)[31-32]。狄江[33]对中国美利奴羊(新疆型)体大品系育种群的2岁母羊进行体尺与主要性状的相关及通径分析。结果表明,体大品系羊体长、胸围与体质量呈显著的正相关(p<0.01);体高、体长、胸围通过提高净毛率而间接增加净毛量;毛长对污毛量、净毛量无直接影响;净毛率与污毛量是极显著的负相关(p<0.01)。刘金福等[34]在昌黎和卢龙两地测定89只唐山奶山羊成年母羊的体尺和体质量,并利用国际上通用的SaS统计分析软件对所测的各项资料进行统计分析,得出唐山奶山羊成年母羊体质量和体尺性状间的生长发育存在着较强的内在联系,在性状的选择方面可以利用这些较强的相关关系达到育种目的。贾存灵等[35]运用SaS软件分析萨福克×(无角陶赛特×小尾寒羊)三元杂交组合3月龄公羔体尺与体质量间的表型相关、体尺对体质量的直接和间接影响,并建立最优回归模型。萨福克×(无角陶赛特×小尾寒羊)三元杂交组合3月龄羔羊体尺各指标均与体质量有极显著的相关关系(p<0.01),其中胸深和胸围是影响三元杂交公羔体质量的主要因素。在选择三元杂交公羔体质量的同时,应加强对胸深和胸围的选择力度。吴平等[36]采用microsoftexcel2007和SpSS16.0软件进行基本处理和相关分析,用全回归法(enter)对体质量和体尺指标进行回归分析。研究主要针对关中奶山羊羔羊在3月龄内的体质量与体尺的生长发育情况而进行。研究表明,从初生到4月龄,羔羊生长发育迅速,尤其表现在初生后的前2个月左右,而此时也是母羊泌乳的最高峰期。通过对体质量与体尺之间相关性的研究得知,体质量与体长、胸围、体高之间都存在极显著的相关。在进行饲养培育时这3个指标都很重要,可作为此阶段选育的依据。

7综合分析

综合分析是指同时引用多种多元统计方法进行分析。较常见的是相关分析和回归分析的综合运用。扎西卓玛等[37]应用相关分析的方法,对83只柴达木绒山羊(互交羊)周岁母羊的胸围、抓绒前体质量、绒层厚度、粗毛量4个性状与产绒量性状的关系进行分析。结果表明这4项性状与产绒量均具有显著的相关性,用这4项性状估测产绒量的回归方程:Y^=114.7689-3.3302X1+5.6125X2+0.1935X3+1.1142X4。经F检验得该回归方程具有一定的可靠性。(注:Y指产绒量、X1指胸围、X2指抓绒前体质量、X3指绒层厚度、X4指粗毛量)王欣荣等[38]采用多元逐步回归分析方法,对随机抽测的甘肃省甘南州草地型藏羊225只成年公羊和290只成年母羊的体质量和主要体尺指标进行相关性分析。结果表明:甘南草地型藏羊成年公羊体质量和主要体尺指标的最优回归方程为Y=0.118X1+0.652X3+0.196X4(R=0.901,0.01<p<0.05);成年母羊体质量和主要体尺指标的最优回归方程为Y=0.111X1+0.186X2+0.626X3(R=0.849,p<0.01)(注:Y指体质量、X1指体高、X3指胸围、X4指管围、X2指体长)。回归模型显示,胸围和体高是影响甘南草地型藏羊体质量的主要体尺指标,建议在今后的选育工作中加大对胸围和体高的选择力度,以提高藏羊的平均体质量。梁学武等运用SpSS13.0软件[39-40],分别用Logistic、Bertalanffy和Gompertz模型对波尔山羊的体质量性状进行非线性拟合,并对体质量与体高、体长、胸围的相关性进行分析[41]。得出波尔山羊生长曲线采用Logistic模型拟合效果最佳,公母羊生长模型分别为:w=51.59×(1+6.15×e-1.82)-1(R2=0.9815)和w=52.56×(1+7.15×e-2.08)-1(R2=0.9834)(注:w指体质量)。公羊的生长拐点为14月龄,体质量25.80kg,成熟体质量为51.59kg;母羊的生长拐点为16月龄,体质量26.28kg,成熟体质量为52.56kg。在山羊的生长拐点前,加强饲养,可充分发挥其生长潜力,提高生产性能。波尔山羊体质量与胸围性状呈极显著正相关(p<0.01),与体高性状呈显著正相关(p<0.05),体质量与体高及胸围的二元回归方程为:Y=0.279Btg+0.893Bxw-19.28(注:Y指体质量、Btg指体高、Bxw指胸围)。生产实践中,可利用此回归方程估测体质量。

8小结

统计学变量的分类篇10

关键词:群车加油系统工况分类工况组合加油模式

中图分类号:U461文献标识码:a文章编号:1672-3791(2012)05(b)-0055-01群车加油系统由油泵、管路和各种部件组成,其功能主要依靠油泵、管路、阀门、加油枪等共同作用来实现,整个过程具有加油枪启闭随机、工况变化大的特点,这对加油系统规律和特性的研究提出了更高的要求,为能够更好地对系统规律和特性进行研究和分析,必须考虑加油支管数量的变化情况。所以,本文以加油支管数的变化引起系统的工况变化为研究重点,结合管网水力计算理论,通过理论分析的方法对加油系统的工况进行了归纳分类。

加油系统的工况研究主要是为了解决多分支管路的水力计算问题,由于加油支管数的随机变化,引起了系统工况的变换,如何对系统的随机工况进行水力计算并分析其变化规律及特性,成了本文研究的重点。加油系统的工况分析是实现求解系统水力计算问题和分析系统规律的基础,正确的工况分析能够准确地反映系统的工作状态,所以,对系统工况进行分类是必要的。

1加油系统液流规律分析

文献[1]和[2]中,以20管群车加油车的加油系统为例,分析了离心泵加油系统的液流规律和工况变化,介绍了有关加油系统的调节方法以及调节设备的选择,得到了影响加油系统液流规律的因素,并进行了计算模拟。离心泵加油系统中,泵所提供的流量和压力较大,系统参数变化不稳定,所以,新型群车加油车采用了滑片泵多分支管路作为加油系统,并减少了支管的数量(由20根减少为10根)。

结合水力计算的基本知识,以共结型加油系统为例,对滑片泵加油系统液流规律进行分析。假设该系统吸入液面与支管排出口的高差,且液面与大气相通,不考虑滑片泵的容积损失,由水力学基本原理可知,管路系统的流量—压头方程为:

(1)

根据滑片泵的工作特性和转速特性,可知滑片泵的出口压力方程为:

(2)

当泵在管路系统中工作时,,据此计算得:

(3)

(4)

式中为总流量,为支管流量,为干管管路特性系数,为支管管路特性系数,为加油枪支管数,为滑片泵转速,为滑片泵转速特性系数,为管路系统总压头,为滑片泵出口压头。

由式(3)和(4)可知,影响滑片泵加油系统流量的因素有支管数,管路特性系数、以及泵的转速。加油系统的液流主要有以下特点。

(1)当泵的转速固定时,随着支管数的减少,系统总流量减少,而支管中单管流量增加。(2)当泵的转速固定时,随着支管数的增加,系统总流量增加,而支管中单管流量减少。(3)当加油支管数保持不变时,随着泵转速的升高,系统流量和单根支管流量增加。(4)当加油支管数保持不变时,随着泵转速的降低,系统流量和单根支管流量减少。

可见,系统流量的值与支管数和泵转速成正比,支管流量与支管数成反比,与泵转速成正比。加油系统的管路及布置形式是固定的,当泵转速不变时,系统流量和支管流量就只有与支管数有关,系统的工况随着支管数的变化而变化。

通过分析多分支管路系统的液流规律,可知开启加油枪数是影响系统工况的一个重要因素。后勤工程学院的刘振志教授在《多枪加油过程自适应控制》一文中,建立了多枪加油系统的控制模型,以加油枪数的变化作为扰动、回流调节装置为控制器,详细阐述了多枪加油系统设置调节装置前后的工况变化,分析了影响系统工况的变化因素。该方法从控制理论的角度解释了多枪加油系统的特点和变化规律,验证了加油枪开启数是影响多分支管路系统工况的主要因素。

3工况分类

正是由于群车加油车完成油料补给任务的特殊性,其加油系统工作特点不同于一般的多分支管路系统。加油系统最主要的功能是为集群车辆进行加油作业,受油车辆和开启加油枪数量的随机变化使系统工况始终处于随机变化的状态。系统工况地划分是系统水力计算和分析的基础,有必要对系统中可能出现的工况进行分类。加油枪的开启数量和顺序是随机的,必须对加油枪进行编号分组,才能对工况进行分类和分析。在编号分组的基础上,根据数学中的排列组合知识对加油枪的开启状态进行排列组合计算,归纳所有可能的工况及工况类型。

3.1?工况组合数

群车加油车加油系统的工况是根据开启加油枪的数量和顺序进行划分的,开启加油枪的数量不同,所得到不同的工况组合;对于每一种工况组合,由于开启加油枪的顺序不同,该工况组合又分为不同的工况。现对开启n把枪时的加油系统工况数进行分析和讨论。

根据数学中排列组合的知识可知,系统的工况组合是在不考虑加油枪开启顺序的前提下,用开启加油枪数表示的一组数据,可以用来表示。每种开启加油枪数的组合数,共有1023种工况组合。

3.2?可能工况总数

系统的工况不仅取决于开启加油枪的数量,而且开启顺序也是必须要考虑的因素。每种工况组合由于加油枪的开启顺序不同,工况数可以用开启加油枪数的全排列来表示,即来表示该工况组合的可能工况数。加油系统在同时考虑加油枪开启数和开启顺序的条件下,开启n把加油枪的工况总数为,考虑开启加油枪顺序的情况下加油系统共有9864100种可能工况,这些工况反映了加油系统的动态变化。

3.3?工况类型及模式

本文主要是为实现加油系统随机工况的水力计算打下基础,也是系统稳态工况研究基础。根据加油系统稳态工况的水力计算方法可知,加油系统工况的水力计算与开启加油枪的顺序无关,其计算方法是相同的,即同一种工况组合在考虑开枪顺序和不考虑开枪顺序的情况下,水力计算方法和过程是相同的。因此,可将全部的9864100种可能工况归纳为1023种工况组合和10类加油模式。

4结语

本文通过分析滑片泵加油系统的液流规律的基础上,得出了加油支管数的变化是影响系统工况变化的主要因素,并且从从控制理论的角度也得到了验证;运用排列组合的知识,以开启加油枪的数量和顺序为条件,将加油系统的9864100种可能工况归纳为1023种工况组合和划分为10类加油模式,为群车加油系统的水利计算和模拟仿真奠定了基础。

参考文献