多项logistic回归 基于Logistic回归对考研率在不同群体间的差异研究



     伴随着我国市场经济的飞速发展,社会的不断进步,我国对高层次的人才的需求越来越大。现阶段,中国高等教育与研究生教育迅猛发展,规模也在急剧地膨胀,考研己成为一种公认的热潮。自2001年以来,我国开始实施了研究生招生扩招政策,研究生考试一年比一年热,“考研热”现象引起了社会各方面的关注。我们不禁好奇到底是什么样的人群更加愿意加入“考研大军”?本文试图从统计学的角度,运用Logistic回归的知识,对考研群体的性别、民族、专业和年级构成进行研究,对“考研热”进行更加深入的了解。

  一、描述性统计分析

  为研究考研群体的构成,本文通过发放调查问卷收集数据。本次调查的调查对象为高校本科生,最终选取中央民族大学在校本科生为调查对象,不失代表性。调查共发放1000份问卷,回收918份问卷,有效问卷863份,问卷有效回收率83.6%。首先对数据进行描述性统计分析,对比各个群体中考研率的高低。

  图2-1

  从图2-1可以看出,四个类别中每个群体的考研率都接近50%或者更高。从性别来看,女生群体中的考研率要明显高于男生群体中的考研率;从民族来看,汉族群体的考研率要明显高于少数民族群体。从专业来看,理科学生的考研率要高于文科和艺术类,超过了70%;从年级来看,08级的同学的考研率最高,除09级外,有随着年级的升高,考研率也在逐渐升高的趋势。

  二、列联表的独立性与相合性检验

  在进行了描述性统计后,为了进一步研究考研与性别、民族、专业和年级是否独立及其变化规律,利用R和SPSS软件进行二维列联表的独立性检验和相合性检验。将四个列联表综合如下表

  独立性检验。从描述性统计的直方图中可以看出,是否考研在性别、民族、专业和年级四个方面都是有差异的。为了检验了这种差异是否显著,我们用R软件分别计算出四个列联表的独立性检验的卡方统计量:

  设五个随机变量,X1、X2、X3、X4与Y均为离散型的,X1={男,女},X2 ={汉族,少数民族},X3 ={文科,理科,艺术},X4 ={11级,10级,09级,08级},Y ={考研,不考研}。据此检验假设:

  Xi与Y相互独立,i=1,2,3,4

  在95%的置信水平下得到如下结论:对于考研与性别的独立性检验,经过连续性修正后卡方的值为4.0761,p=0.0435<0.05,拒绝原假设,X1与Y不独立。对于考研与民族的独立性检验,经过连续性修正后,p接近于0,远小于0.05,拒绝原假设,X2与Y不独立。对于考研与专业的独立性检验,p接近于0,远小于0.05,拒绝原假设,X3与Y不独立。对于考研与年级的独立性检验,p=0.05843>0.05,接受原假设,X4与Y相互独立。

  由此可见,男生和女生在考研的选择上具有显著差异。汉族与少数民族在考研的选择上具有极显著的差异。文科、理科与艺术专业的学生在考研的选择上具有极显著差异。不同年级的学生在考研的选择上不具有显著的差异。

  相合性检验。根据二维列联表的属性的类型,上述建立的四个列联表可以归属为两类,其中考研与性别列联表、考研与专业的列联表属于双向无序列联表,考研与民族列联表、考研与年级列联表属于一向无序一向有序列联表。为了进一步研究考研与这四个变量之间的变化关系,我们可以给无序的属性定义一个“序”,使得它变成有序的属性。例如将性别中的男女分别用“1”“2”代替。使用Somers d系数度量列联表的相合关系。将数据输入SPSS,得到结果。

  在95%的置信水平下,除年级外,其余的三个变量的值均小于0.05,说明在考研和各变量的关系中,是否考研与性别、民族、专业具有相合性,且考研与性别和专业具有负相合性、考研与民族具有正相合性。从而说明有三种这样的趋势:在考研人群中,女性、汉族和理工科学生所占的比例高。

  三、Logistic线性回归模型

  通过上述两种检验可以明显看出相合性检验比独立性检验更深入,为了更加深入的了解变量之间的函数关系,我们通过建立Logistic回归模型来得到。

  线性方程的建立。经过上述对四个变量与考研之间的独立性和相合性检验,最终筛选出三个指标性别X1、民族X2和专业X3建立多元Logistic线性回归方程。

  X1={男、女}={1,2}; X2={汉族、少数民族}={1,2}; X3={艺术、文科、理工科}={1,2,3};  Y={考研、不考研}={1,0}

  将数据整理后输入R软件,首先得到结果为:Y与X1、X2、X3建立多元Logistic回归方程,在95%的置信水平下,变量X1没有通过检验,因此剔除X1,再建立Y与X2、X3的多元Logistic回归方程,所得结果如图4-1:

  图4-1

  此时,在95%的置信水平下所有变量均通过检验,得到拟合方程为:

  (4.1)                        (4.2)

  预测与分析。上述拟合方程说明,考研率与性别和年级没有关系,但考研率与民族和专业有关系,从X2、X3前面的系数可以看出,少数民族的考研率比汉族的考研率要低,艺术类、文科、理工科的考研率依次升高。

  根据得到的方程,下面计算优比并进行预测分析:当X2=i,X3=j时,考研率为Pij

  例如当民族是汉族、专业是艺术类时,即X2=1,,X3=1,考研率为P11;

  (5.4)                       (5.5)

  经计算两个优比的估计值分别为1.88和0.67,说明当专业上升一级(从艺术类变为文科类或从文科类变为理工类),优势(选择考研的概率与选择不考研的概率的比值)是原来的1.88倍;当民族由汉族变为少数民族,优势是原来的0.66倍。经过计算可以得到:

  比较上述结果可以发现:

  在汉族学生中,理工类学生选择考研的概率是艺术类学生的1.73倍,是文科类学生的1.25倍;在少数民族的学生中,理工类学生选择考研的概率是艺术类学生的1.95倍,是文科类学生的1.33倍;在艺术类、文科类、理工类的学生中,汉族学生的考研率分别是少数民族考研率的1.29倍、1.21倍、1.14倍;同时,还可以发现,在所有类别的学生中,理工类的汉族学生的考研率最高71.04%,而文艺类的少数民族学生的考研率最低31.83%。

  四、结论

  通过对模型的建立和求解,得出如下结论:

  在95%的置信水平下,不同性别的人在是否考研的选择上具有较为显著性的差异;不同民族的人和不同专业的人均具有极显著的差异;而不同年级的人不具有显著性差异。

  考研与性别和专业具有负相合性、考研与民族具有正相合性。有三种这样的趋势:在性别分类中,女生更加倾向于考研;在民族分类中,汉族更加倾向于考研;而在专业分类中,理工类的学生更加倾向于考研。

  通过建立多元Logistic回归方程得到,是否考研在性别、年级之间均没有差异。但考研率与民族和专业有关系,少数民族的考研率比汉族的考研率要低,艺术类、文科、理工科的考研率依次升高。且当专业上升一级(从艺术类变为文科类或从文科类变为理工类),选择考研的概率与不考研的概率的比值是原来的1.88倍;当民族由汉族变为少数民族,选择考研的概率与选择不考研的概率的比值是原来的0.66倍。在所有类别的学生中,理工类的汉族学生的考研率最高,而文艺类的少数民族学生的考研率最低。

  参考文献

  [1] 王静龙 梁小筠.定性数据分析 [M] 华东师范出版社,2004年版:71-77,83-88,141-152

  [2] 薛毅 陈立萍.统计建模与R软件 [M] 清华大学出版社,2006年版:229-232

  [3] 汤银才.R语言与统计分析[M].北京:高等教育出版社,2008:301-307

  [4] 王怀亮.基于R软件的logistic回归模型建模[J] 黑龙江对外经贸,2010(11):117-118

 多项logistic回归 基于Logistic回归对考研率在不同群体间的差异研究
  [5] 光琳.Logistic模型统计分析的软件实现 [J] 连云港师范高等专科学校学报,2011(12):1-3

  [6] 王莹.社会学视角下的大学生“考研热”研究——以大连市高校为例 [D]东北财经大学,2010(11):2-4

  

爱华网本文地址 » http://www.413yy.cn/a/9101032201/55517.html

更多阅读

对健康狗带狂犬病毒说法的异议 健康狗有狂犬病毒吗

对健康狗带狂犬病毒说法的异议*祖述宪据世界卫生组织(WHO)估计,世界上的每年报告死于狂犬病者约55000人,主要发生在亚洲和非洲地区。我国狂犬病死亡人数近年有所增加,每年约2000多人,约占世界总数的4%左右,但在我国媒体上,“狂犬病”一词

转:对梦入神机小说最入木三分的评价

对梦入神机最客观,最入木三分的评价来源: 文智峰的日志昔日草莽多鬼域,如今稳坐钓鱼台----《佛本是道》的主角洗白之路:《佛本是道》是一部公认后半部比前半部精彩的作品,洪荒流开山之作。佛本前半部走的是传统YY的“巧取豪夺”路线。

对产品质量与食品安全问题的思考 产品质量问题处理方案

摘要:在经济飞速发展的今天,人们对物质的需求越来越多,同时对物质的质量要求也越来越高。产品质量的好坏事关企业的存亡,是企业的生命,而近几年却接二连三爆出产品质量问题。民以食为天,现在提倡的绿色食品,健康食品,有机食品却不断发生恶性

声明:《多项logistic回归 基于Logistic回归对考研率在不同群体间的差异研究》为网友昏黄中对视分享!如侵犯到您的合法权益请联系我们删除