多项logistic回归 基于Logistic回归对考研率在不同群体间的差异研究
伴随着我国市场经济的飞速发展,社会的不断进步,我国对高层次的人才的需求越来越大。现阶段,中国高等教育与研究生教育迅猛发展,规模也在急剧地膨胀,考研己成为一种公认的热潮。自2001年以来,我国开始实施了研究生招生扩招政策,研究生考试一年比一年热,“考研热”现象引起了社会各方面的关注。我们不禁好奇到底是什么样的人群更加愿意加入“考研大军”?本文试图从统计学的角度,运用Logistic回归的知识,对考研群体的性别、民族、专业和年级构成进行研究,对“考研热”进行更加深入的了解。 一、描述性统计分析 为研究考研群体的构成,本文通过发放调查问卷收集数据。本次调查的调查对象为高校本科生,最终选取中央民族大学在校本科生为调查对象,不失代表性。调查共发放1000份问卷,回收918份问卷,有效问卷863份,问卷有效回收率83.6%。首先对数据进行描述性统计分析,对比各个群体中考研率的高低。 图2-1 从图2-1可以看出,四个类别中每个群体的考研率都接近50%或者更高。从性别来看,女生群体中的考研率要明显高于男生群体中的考研率;从民族来看,汉族群体的考研率要明显高于少数民族群体。从专业来看,理科学生的考研率要高于文科和艺术类,超过了70%;从年级来看,08级的同学的考研率最高,除09级外,有随着年级的升高,考研率也在逐渐升高的趋势。 二、列联表的独立性与相合性检验 在进行了描述性统计后,为了进一步研究考研与性别、民族、专业和年级是否独立及其变化规律,利用R和SPSS软件进行二维列联表的独立性检验和相合性检验。将四个列联表综合如下表 独立性检验。从描述性统计的直方图中可以看出,是否考研在性别、民族、专业和年级四个方面都是有差异的。为了检验了这种差异是否显著,我们用R软件分别计算出四个列联表的独立性检验的卡方统计量: 设五个随机变量,X1、X2、X3、X4与Y均为离散型的,X1={男,女},X2 ={汉族,少数民族},X3 ={文科,理科,艺术},X4 ={11级,10级,09级,08级},Y ={考研,不考研}。据此检验假设: Xi与Y相互独立,i=1,2,3,4 在95%的置信水平下得到如下结论:对于考研与性别的独立性检验,经过连续性修正后卡方的值为4.0761,p=0.0435<0.05,拒绝原假设,X1与Y不独立。对于考研与民族的独立性检验,经过连续性修正后,p接近于0,远小于0.05,拒绝原假设,X2与Y不独立。对于考研与专业的独立性检验,p接近于0,远小于0.05,拒绝原假设,X3与Y不独立。对于考研与年级的独立性检验,p=0.05843>0.05,接受原假设,X4与Y相互独立。 由此可见,男生和女生在考研的选择上具有显著差异。汉族与少数民族在考研的选择上具有极显著的差异。文科、理科与艺术专业的学生在考研的选择上具有极显著差异。不同年级的学生在考研的选择上不具有显著的差异。 相合性检验。根据二维列联表的属性的类型,上述建立的四个列联表可以归属为两类,其中考研与性别列联表、考研与专业的列联表属于双向无序列联表,考研与民族列联表、考研与年级列联表属于一向无序一向有序列联表。为了进一步研究考研与这四个变量之间的变化关系,我们可以给无序的属性定义一个“序”,使得它变成有序的属性。例如将性别中的男女分别用“1”“2”代替。使用Somers d系数度量列联表的相合关系。将数据输入SPSS,得到结果。 在95%的置信水平下,除年级外,其余的三个变量的值均小于0.05,说明在考研和各变量的关系中,是否考研与性别、民族、专业具有相合性,且考研与性别和专业具有负相合性、考研与民族具有正相合性。从而说明有三种这样的趋势:在考研人群中,女性、汉族和理工科学生所占的比例高。 三、Logistic线性回归模型 通过上述两种检验可以明显看出相合性检验比独立性检验更深入,为了更加深入的了解变量之间的函数关系,我们通过建立Logistic回归模型来得到。 线性方程的建立。经过上述对四个变量与考研之间的独立性和相合性检验,最终筛选出三个指标性别X1、民族X2和专业X3建立多元Logistic线性回归方程。 X1={男、女}={1,2}; X2={汉族、少数民族}={1,2}; X3={艺术、文科、理工科}={1,2,3}; Y={考研、不考研}={1,0} 将数据整理后输入R软件,首先得到结果为:Y与X1、X2、X3建立多元Logistic回归方程,在95%的置信水平下,变量X1没有通过检验,因此剔除X1,再建立Y与X2、X3的多元Logistic回归方程,所得结果如图4-1: 图4-1 此时,在95%的置信水平下所有变量均通过检验,得到拟合方程为: (4.1) (4.2) 预测与分析。上述拟合方程说明,考研率与性别和年级没有关系,但考研率与民族和专业有关系,从X2、X3前面的系数可以看出,少数民族的考研率比汉族的考研率要低,艺术类、文科、理工科的考研率依次升高。 根据得到的方程,下面计算优比并进行预测分析:当X2=i,X3=j时,考研率为Pij 例如当民族是汉族、专业是艺术类时,即X2=1,,X3=1,考研率为P11; (5.4) (5.5) 经计算两个优比的估计值分别为1.88和0.67,说明当专业上升一级(从艺术类变为文科类或从文科类变为理工类),优势(选择考研的概率与选择不考研的概率的比值)是原来的1.88倍;当民族由汉族变为少数民族,优势是原来的0.66倍。经过计算可以得到: 比较上述结果可以发现: 在汉族学生中,理工类学生选择考研的概率是艺术类学生的1.73倍,是文科类学生的1.25倍;在少数民族的学生中,理工类学生选择考研的概率是艺术类学生的1.95倍,是文科类学生的1.33倍;在艺术类、文科类、理工类的学生中,汉族学生的考研率分别是少数民族考研率的1.29倍、1.21倍、1.14倍;同时,还可以发现,在所有类别的学生中,理工类的汉族学生的考研率最高71.04%,而文艺类的少数民族学生的考研率最低31.83%。 四、结论 通过对模型的建立和求解,得出如下结论: 在95%的置信水平下,不同性别的人在是否考研的选择上具有较为显著性的差异;不同民族的人和不同专业的人均具有极显著的差异;而不同年级的人不具有显著性差异。 考研与性别和专业具有负相合性、考研与民族具有正相合性。有三种这样的趋势:在性别分类中,女生更加倾向于考研;在民族分类中,汉族更加倾向于考研;而在专业分类中,理工类的学生更加倾向于考研。 通过建立多元Logistic回归方程得到,是否考研在性别、年级之间均没有差异。但考研率与民族和专业有关系,少数民族的考研率比汉族的考研率要低,艺术类、文科、理工科的考研率依次升高。且当专业上升一级(从艺术类变为文科类或从文科类变为理工类),选择考研的概率与不考研的概率的比值是原来的1.88倍;当民族由汉族变为少数民族,选择考研的概率与选择不考研的概率的比值是原来的0.66倍。在所有类别的学生中,理工类的汉族学生的考研率最高,而文艺类的少数民族学生的考研率最低。 参考文献 [1] 王静龙 梁小筠.定性数据分析 [M] 华东师范出版社,2004年版:71-77,83-88,141-152 [2] 薛毅 陈立萍.统计建模与R软件 [M] 清华大学出版社,2006年版:229-232 [3] 汤银才.R语言与统计分析[M].北京:高等教育出版社,2008:301-307 [4] 王怀亮.基于R软件的logistic回归模型建模[J] 黑龙江对外经贸,2010(11):117-118
[5] 光琳.Logistic模型统计分析的软件实现 [J] 连云港师范高等专科学校学报,2011(12):1-3 [6] 王莹.社会学视角下的大学生“考研热”研究——以大连市高校为例 [D]东北财经大学,2010(11):2-4
更多阅读
对健康狗带狂犬病毒说法的异议 健康狗有狂犬病毒吗
对健康狗带狂犬病毒说法的异议*祖述宪据世界卫生组织(WHO)估计,世界上的每年报告死于狂犬病者约55000人,主要发生在亚洲和非洲地区。我国狂犬病死亡人数近年有所增加,每年约2000多人,约占世界总数的4%左右,但在我国媒体上,“狂犬病”一词
国资委新掌门很低调 曾在质检总局推多项创新 - 质监杂议 - 中国质 岩土工程规范杂议
国资委新掌门很低调 曾在质检总局推多项创新有质检总局内部人士总结说,一是三鹿牌婴幼儿奶粉事件,二是迎战甲流,三是2009年全国质量年活动的开展,四是今年以来开展的“两大”,即“大质检文化,大质检工作机制”。其中,“两大”活动的开展,则
邵逸夫先生对早期《西游记》电影的贡献—六小龄童的博客—强国博 西游记六小龄童版52集
博客正文邵逸夫先生对早期《西游记》电影的贡献原创于: 2014-01-07 17:29:36标签: 六小龄童,邵逸夫,何梦华,西游记,逸夫楼前不久我刚接受了宁波市图书馆的邀请,在“天一讲堂”做了“感悟西游文化”主题讲演,现场座无虚席,能容纳两百多席
转:对梦入神机小说最入木三分的评价
对梦入神机最客观,最入木三分的评价来源: 文智峰的日志昔日草莽多鬼域,如今稳坐钓鱼台----《佛本是道》的主角洗白之路:《佛本是道》是一部公认后半部比前半部精彩的作品,洪荒流开山之作。佛本前半部走的是传统YY的“巧取豪夺”路线。
对产品质量与食品安全问题的思考 产品质量问题处理方案
摘要:在经济飞速发展的今天,人们对物质的需求越来越多,同时对物质的质量要求也越来越高。产品质量的好坏事关企业的存亡,是企业的生命,而近几年却接二连三爆出产品质量问题。民以食为天,现在提倡的绿色食品,健康食品,有机食品却不断发生恶性