
请教如何学习掌握SPSS,有谁能提供心得体会以及技巧等
可以调查一下每个商场日客流量的数据,商场应该会提供的,你说i能帮他们免费分析,得到数据之后首先用SPSS画检验分布,然后求个期望什么的,给商场提供一些合理的意见
祝你好运
我需要SPSS统计分析实例,是要写500字左右论文的
运用逐步回归法分析影响上海银行存款的1.目的和意义在现品经济社会人们的工作与生活已经离不开货币。
在生活中人们所需的各种商品,都需要用货币去购买;人们所需的各种服务,也需要支付货币来获得;人们劳动工作的所获得的报酬——工资,也是用货币支付的;人们为了种种目的,要积累财富,保存财富,采用的主要方式是积攒货币、到银行储蓄。
除个人外,企业、行政事业部门的日常运行同样也离不开货币。
财政收支也都是用货币进行的。
可见,货币已经融入了并影响这经济运行和人们的生活。
作为经营“货币”这种商品的银行的功能是办理各种存款(也称为负债业务)、放款和汇兑业务,其中商业银行所吸收的各种存款(活期、定期、储蓄)约占银行资金来源的70%~80%,为银行提供了绝大部分的资金来源,并为实现银行各职能活动提供了基础。
所以说,银行存款对银行本身的生存和发展有着重要意义,除此之外,银行存款也能反映出一个特定时期人们的生活水平以及经济发展的水平。
因此对上海的银行存款的分析是非常重要且必要的。
本文将介绍运用SPSS11.5统计分析软件中的逐步回归法对影响上海银行存款的因素进行分析研究并建立模型,为相关专业人士的决策提供一定参考。
2.影响银行存款的因素分析存款作为银行吸收资金来源的主要业务,其之影响因素非常的多。
从中我选取了10个主要因素的(1951年至2000年)数据运用SPSS的逐步回归析和研究它们对上海银行存款的影响程度。
这10个因素分别是全市居民储蓄(亿元)、从业人数(万人)、全市居民消费水平(元\\\/人)、全市银行贷款(亿元)、全社会固定资产投资总额(亿元)、职工工资总额(亿元)、职工劳保福利费用(万元)、社会消费品零售总额(亿元)、外贸出口商品总额(亿美元)、全市财政收入(亿元)。
上海全市银行存款及影响其的10个因素的1951年至2000年的数据见下表2.1。
表2.1上海全市银行存款数据(1951年~2000年)年份 全市银行存款(亿元) 全市居民储蓄(亿元) 从业人数(万人) 全市居民消费水平(元\\\/人) 全市银行贷款(亿元) 全社会固定资产投资总额(亿元) 职工工资总额(亿元) 职工劳保福利费用(万元) 社会消费品零售总额(亿元) 全市财政收入(亿元) 外贸出口商品总额(亿美元)1964 33.29 8.64 438.31 270 45.27 7.22 19.40 33117 26.55 73.35 6.521965 37.66 9.98 460.76 276 49.77 7.75 20.07 33819 27.13 83.18 7.651966 40.18 10.68 462.62 298 62.52 7.23 19.74 34536 28.72 92.49 8.741967 43.58 10.60 478.39 300 71.82 4.61 20.22 35268 30.78 73.97 8.421968 50.25 10.56 516.44 293 85.32 4.58 19.75 36016 29.94 83.98 8.491969 57.42 10.18 536.70 309 82.12 7.45 21.06 36780 32.57 102.30 8.761970 142.41 10.47 540.87 304 76.05 10.90 20.63 37560 31.85 114.02 8.671971 155.28 11.29 560.29 318 88.74 11.36 21.14 38356 32.91 123.53 9.811972 167.81 12.51 576.74 334 99.41 13.23 22.08 39169 36.15 129.11 13.301973 175.86 13.13 589.52 357 112.66 16.24 22.37 39999 39.79 138.18 23.161974 178.21 13.85 610.16 380 125.13 22.43 22.80 40847 44.06 143.04 24.391975 185.09 14.66 646.88 397 129.61 32.53 23.49 41737 47.71 147.11 22.201976 182.60 15.37 669.56 408 133.97 23.96 24.79 46531 49.98 144.42 19.781977 205.30 16.00 679.65 411 143.19 18.00 24.97 49797 49.28 159.91 22.211978 242.93 18.18 698.32 442 153.37 27.91 28.12 57424 54.10 190.67 28.931979 267.92 24.88 712.59 527 165.16 35.58 32.73 81664 68.28 192.75 36.751980 291.06 30.20 730.77 582 200.98 45.43 38.10 94004 80.43 198.85 42.661981 148.85 32.92 750.22 638 221.98 54.60 39.59 102061 88.73 204.52 38.071982 170.56 37.94 764.03 640 227.77 71.34 41.34 113909 89.80 200.69 36.051983 190.73 45.97 768.90 688 239.50 75.95 42.91 127679 100.68 204.34 36.481984 222.51 56.10 769.79 789 245.35 91.72 53.72 152282 123.72 215.79 35.871985 261.09 70.09 775.53 1030 306.27 118.56 68.99 190217 173.39 263.86 33.611986 324.81 90.95 782.99 1190 427.66 146.93 83.35 233574 196.84 257.72 35.821987 396.38 120.33 788.12 1298 523.35 186.30 94.78 286323 225.25 241.36 41.601988 419.68 141.21 792.13 1680 576.11 245.27 114.47 391974 295.83 261.69 46.051989 473.73 193.47 784.96 1928 698.71 214.76 131.10 437789 331.38 297.25 50.321990 613.86 252.16 787.72 2009 857.76 227.08 146.78 533797 333.86 284.36 53.211991 769.95 328.22 798.13 2421 1008.82 258.30 172.84 670676 382.06 324.66 57.401992 1051.45 413.09 806.91 2842 1213.32 357.38 217.21 804903 464.82 340.13 65.551993 1495.06 578.39 787.25 4162 1605.57 653.91 279.33 1038701 624.30 439.53 73.821994 2247.56 975.95 786.04 5343 1966.96 1123.29 357.89 1241344 770.74 615.91 90.771995 3056.76 1396.13 794.19 6712 2387.33 1601.79 440.75 1496034 970.04 702.46 115.771996 3870.98 1868.34 851.21 7742 2852.66 1952.05 492.70 1873885 1161.30 873.76 132.381997 5560.65 2729.57 847.25 8699 3722.30 1977.59 510.10 1931500 1325.21 1070.95 147.241998 5595.43 2372.94 836.21 9202 4259.71 1964.83 510.35 1878137 1471.03 1146.00 159.561999 6270.91 2597.12 812.09 10328 4862.03 1856.72 583.54 2095239 1590.38 1390.58 187.852000 6925.99 2524.05 828.35 11546 5415.71 2015.76 614.53 2521553 1722.27 1752.70 253.54注:该表数据来源:《上海统计年鉴》2.1全市居民储蓄(亿元)个人货币收入是用来供个人消费的,积蓄是准备用作远期消费或不可预测的需要,它们都不是资本,金额也比较小。
由于现代银行制度的发展,举办储蓄,并支付利息,小额的货币收入就可以转化为资本,从而扩大了社会资本总量,加速经济的发展。
由表2.1可看到,随着社会经济的发展和人们收入的不断提高,全市居民储蓄从1951年的1.01亿元增加至2000年的2524.05亿元,特别是1985年之后呈快速增长趋势。
可见社会公众的储蓄增长会提高银行盈利资产的规模,一定程度上使商业银行获得更多的收益。
所以,全市居民储蓄对银行存款有着直接而深远的影响。
2.2从业人数(万人)从业人数是指在全市各行各业的企事业单位中从事工作人数的总和,其包括了国有、集体、合资、独资等其他单位的从业人员,城镇个体劳动者,农村集体和个体劳动者以及其他劳动者。
从表2.1可知,从业人数是呈稳定增长趋势的,这与全市人口的增加有着极大的关系。
上海近十几年经济的飞速发展和国际大都市的形象,吸引了大批的外来人口(外地和外国)来沪居住、创业以及工作。
随着全市企业数量的不断增加,从业人数也在不断的增加。
从业人数的多少与银行存款有着紧密的联系,因为每个从业人员都会有自己的收入,不管收入的多与寡,他们每个人都会在银行拥有一个以上的帐户并利用存折、借计卡来取工资或办理各种活期、定期的储蓄或取款;利用信用卡刷卡消费或提款。
2.3全市居民消费水平(元\\\/人)居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。
通过消费的物质产品和劳务的数量和质量反映出来。
反映居民消费水平的主要指标有:(1)平均实物消费量指标:平均每人全年主要有消费品的消费量、平均每百户耐用消费品拥有量、人均居住面积、平均每人生活用水量、平均每人生活用电量等;(2)现代化生活设施的普及程度指标:自来水普及率、煤气普及率、平均每百户主要家用电器拥有量、电话普及率等;(3)反映消费水平的消费结构指标:居民生活消费支出中食品的比例、居民生活消费支出中文化生活服务支出比例、不同质量消费品的消费比例等;(4)平均消费量的价值指标:平均每人消费基金、平均每人生活消费额、平均每人用于各项生活消费的支出等。
从表2.1中可以看到1990年以后的居民消费水平有了大大的提升,可见人们的生活质量随着改革开放的步伐的加快也越来越好。
2.4全市银行贷款(亿元)贷款,又称放款,是银行将其所吸收的资金,按一定的利率贷给客户并约定归还期限的业务。
虽然银行运用资金的方式不止贷款一种,但是贷款是商业银行在其资产业务中的比重一般占首位。
通过贷款联系,银行可密切与工商企业往来联系,有利于拓宽业务领域,获得更多的利润。
银行贷款的种类按不同的标注至少又以下几类:按期限分为短期贷款、中期贷款和长期贷款;按用途可分为投资贷款、商业贷款、消费贷款和农业贷款;按贷款是否有抵押品分为:抵押贷款和无抵押贷款;按换款的方式分为:一次偿还贷款和分期偿还贷款。
从表2.1可知,银行贷款不断的大幅度增加,表明了经济的快速发展和人们消费理念的变化。
2.5全社会固定资产投资总额(亿元)固定资产投资总额是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。
全社会固定资产投资包括基本建设投资、更新改造投资、国有单位其他固定资产投资、房地产开发投资、城镇集体固定资产投资、联营经济、股份制经济、外商投资经济、港澳台投资经济及其他经济类型的固定资产投资,农村集体5万元以上固定资产投资,城镇工矿区私人建房投资和国防、人防基本建设投资。
全社会固定资产投资按经济类型可分为国有、集体、个体、联营、股份制、外商、港澳台商、其他等。
按照管理渠道,全社会固定资产投资总额分为基本建设、更新改造、房地产开发投资和其他固定资产投资四个部分。
是社会固定资产再生产的主要手段。
通过建造和购置固定资产的活动,国民经济不断采用先进技术装备,建立新兴部门,进一步调整经济结构和生产力的地区分布,增强经济实力,为改善人民物质文化生活创造物质条件。
这对我国的社会主义现代化建设具有重要意义。
从表2.1可知,固定资产投资的总额是呈不固定态势来增长的,2000年的固定资产投资总额比1900年的增长8.8倍,非常真实地反映了上海在上世纪90年代经济的腾飞。
2.6职工工资总额(亿元)职工工资总额是指各单位在一定时期内直接支付给本单位全部职工的劳动报酬的总和,包括奖金、津贴、补贴、加班工资和其他工资(附加工资、保留工资以及调整工资补发的上年工资等)。
职工工资从某种程度上来说是市民收入的主要来源。
而收入比较高的话,居民用于消费和储蓄的金额也会有相应的提高,所以职工工资直接影响着银行存款。
2.7职工劳保福利费用(万元)劳保福利是指劳动保险和福利。
为了保护工人职工的健康,减轻其生活中的困难,我国对劳动保险制定了相应的法律条文。
福利指员工与工人福利之总称,亦指以企业员工为对象而实施的福利措施,包括法定的福利,企业主与工会所实施的提高职工生活水准的各种措施。
由表2.1可知,2000年,单位支付职工劳保福利费用的总额已经达到2521553万元,并且其比例每年以3%~8%的速度增长,已高达67.9%,这一数据说明人们的基本生活标准可以得到保障,从而有更多的钱用于其它的消费和用于储蓄存款或其他金融投资。
2.8社会消费品零售总额(亿元)社会消费品零售总额是指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。
包括售给城乡居民用于生活消费的商品(不包括住房)和售给机关、团体、部队、学校、企业、事业单位和城市街道居民委员会、农村村民委员会用公款购买的用作非生产、非经营使用的消费品。
这个指标反映通过各种商品流通渠道向居民和社会集团供应生活消费品来满足他们生活需要的情况,是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。
2.9全市财政收入(亿元)财政既然要提供公共物品来满足公共需要,就要从国内总收入(GDI——与生产指标GDP相对应的收入指标)中集中一部分收入,从这个意义上来理解,财政收入是指一定量的货币收入,即国家占有的以货币表现的一定量的国内总收入;财政收入又可以理解为一个分配过程,这一过程是财政运行的第一个阶段或第一个环节,在其中形成特定的分配关系或利益关系。
财政收入按其形式分为税收、收费、债务收入、铸币税和通货膨胀税。
财政运行是国民经济的运行的一个部分,国民经济的运行决定了财政的运行,而财政的运行也反过来影响国民经济的运行,直接影响投资、消费和进出口,影响GDP的增长和结构,影响收入分配和各阶层之间的收入差距,影响经济的稳定和可持续发展。
2.10外贸出口商品总额(亿美元)对外出口贸易一直以来是上海经济发展的重要环节及体现,也是赚取外汇,达到国际收支平衡和增加国际储备的前提条件。
随着中国加入WTO,上海的对外贸易也越来越频繁且出口的商品数量和金额也大大的提高。
目前国际货物买卖合同中买卖双方就支付条款的订立大多都通过银行采用现汇结算的方式。
在国际货物买卖中使用的结算工具主要是货币和票据,而银行作为买卖双方的结算中介为其办理汇兑业务、信用证业务、承兑业务。
前两者是银行存款业务衍生出来的结算业务,而承兑业务是以银行的信用来确保客户的信用。
到2000年底,一般贸易出口增幅继续高于加工贸易,而出口产品结构调整也随之加快,高新技术产品和机电产品出口快速增长。
3.回归方法与模型建立3.1研究方法与原理运用多元线性逐步回归方法研究预测影响上海的银行存款的因素。
逐步回归是按自变量对因变量的作用程度从大到小逐个引入回归方程,每引入一个变量同时检验方程中各个自变量的显著性,合格保留、不显著剔除,反复进行直到再没有显著的变量可以引入为止。
回归分析是根据自变量的最有组合建立回归方程(模型)预测因变量的未来发展趋势。
该方法的运用条件是有大量的观测统计数据,适用研究没有确定关系形式的因素对象,运用工具为SPSS统计软件。
3.2模型的建立及求解因为银行存款与大部分变量呈指数关系,所以把表2.1的各个原始变量的50年数据进行对数变换(LN10()),并且把转换后的样本数据倒退8年后来建模。
设多元线性回归的模型为:lnY=β0+β1X1+β2X2+β3X3+…+β9X9+β10X10其中:Y:全市银行存款(亿元)X1 ——全市居民储蓄(亿元) X6 ——职工工资总额(亿元)X2 ——从业人数(万人) X7 ——职工劳保福利费用(万元)X3 ——全市居民消费水平(元\\\/人) X8 ——社会消费品零售总额(亿元)X4 ——全市银行贷款(亿元) X9 ——全市财政收入(亿元)X5 ——全社会固定资产投资总额(亿元) X10 —— 外贸出口商品总额(亿美元)注:模型中倒退的年数用(t-n)表示,其中n表示倒退几年。
(t-n)不参与任何计算,它只做标识之用。
利用SPSS11.5对样本数据进行统计分析,运行后的输出的结果如表3.2.1所示。
表3.2.1 逐步回归统计分析结果 CoefficientsModel Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta18 (Constant) -.994 1.012 -.982 .334居储7 .692 .146 .595 4.741 .000从人1 1.386 .604 .216 2.294 .029固投6 -.285 .046 -.280 -6.246 .000财政4 -.634 .146 -.289 -4.358 .000银贷4 1.007 .100 .813 10.057 .000劳福2 -1.396 .189 -1.221 -7.380 .000工资1 1.053 .232 .754 4.531 .000财政3 -.670 .134 -.311 -5.005 .000从人8 -2.413 .336 -.485 -7.184 .000从人2 2.954 .670 .479 4.406 .000银贷2 .520 .110 .440 4.703 .000劳福6 .418 .193 .305 2.168 .039即回归模型为:lnY=0.595X1(t-7) +0.216X2(t-1) -0.28X5(t-6) -0.289X9(t-4) +0.813X4(t-4) -1.221X7(t-2) +0.754X6(t-1) -0.311X9(t-3) -0.485X2(t-8) +0.479X2(t-2) +0.44X4(t-2) +0.305X7(t-6)所以,在倒退8年的50年数据样本中,银行存款的增长与前7年的全市居民储蓄,前1年、前8年、前2年的从业人数,前6年的全社会固定资产投资总额,前4年和前3年的全市财政收入,前4年和前2年的银行贷款,前2年和前6年的职工劳保福利费用,前1年的职工工资总额等因素之间有显著意义的相关关系。
4.结论和评价4.1模型评价4.1.1进入因素的分析表4.1.1.1 Variables Entered\\\/Removed(a)Model Variables Entered Variables Removed Method1 居储7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).2 工资7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).3 固投8 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).4 从人1 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).5 . 工资7 Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).由于SPSS11.5软件通过特定程序对上海市相关数据进行整体的统计运算,所以具有更强的客观性和公证性。
从上表中可以看出,按自变量对因变量的作用程度从大到小首先引入的是前7年的居民储蓄,等到第五步时把之前进入的前7年的职工工资给剔除了,再后面的第14和第17步中把前8年的固定投资和前3年的银行贷款给剔除了。
这3个被剔除的变量在引入变量越来越多的情况下被检验出其显著性不合格。
除此之外,在10个自变量中,诸如全市居民消费水平、社会消费品零售总额、外贸出口商品总额没有进入模型。
因为的外贸出口商品总额涨幅没有达到足以进入方程的显著性,所以被剔除了。
不过,随着贸易全球化和中国国际地位的提高,上海的外贸出口总额也会不断的增加,在不久的将来会对银行存款起明显的作用。
我们可以从表3.2.1看到,在进入的因素中全社会固定资产投资总额、财政收入、前2年的职工劳保福利费用、前8年的从业人员与银行存款是负相关,即随着它们的增加加快,银行存款的增长会减慢,其中前2年的职工劳保福利费用影响最强,其系数为-1.221。
前8年的从业人员、财政收入、全社会固定资产投资总额的影响顺次递减。
比如说,全社会固定资产投资总额增加,表明了国有、集体、个体、联营、股份制、外商、港澳台商提供了对基本建设、更新改造、房地产开发投资和其他固定资产投资额,那么他们必须从银行拿出自己的存款,有时还需要向银行进行贷款来完成投资,所以银行的存款量会增加缓慢是可以想象的。
又比如说财政收入,政府的财政收入是通过税收、收费等途径获得,如果国家对个人、企业所征取的税越多的话,个人与企业的支出就会增加,净收入也就变少了,而如果其用于消费的指出不变或提高的话,那么其用于银行存款的货币就会相应减少,从而导致全市银行存款的递增缓慢。
而居民储蓄、银行贷款、职工的工资、前1年和前2年的从业人员、前6年的职工劳保福利费用与银行存款呈正相关,即随着它们的增加加快,银行存款的增长也会加快,其中前四年的银行贷款的影响最强,其系数为0.813,其次是居民储蓄等等。
比如说,职工工资的增加会使得人们的收入上升,收入上升后虽然有一部分会被用来支付消费,但绝大部分人们还是会把钱存入银行,用于各种类型的投资,这种行为使得银行存款的增加加快。
又如:居民储蓄的增加,当然会直接影响银行存款量的增加,这是勿庸置疑的,因为居民储蓄是银行存款业务的主要内容,它是银行吸收资金的主要方式。
再如:经济的发展会使得银行贷款量上升,银行想要通过贷款给个人或企业客户来获得更多利润,那么银行就会运用各种手段来增加吸引资金量。
在这种情况下,社会上的闲置资金由于较高的收益而会流向银行,使得银行存款增加速度加快。
从表4.1.2.1中我们可以看到,随着进入的变量越多,F值由大变小,然后再由小变大,使得最后一步的F值达到1191.379,表明回归模型包括12个变量,且拟合度较高。
4.1.3自相关问题的诊断DW值一般要求1.5~2.5时,残差与自变量互为独立。
从表4.1.3.1可见回归模型的DW值为2.342,说明该模型无自相关的问题,此模型可以被使用。
表4.1.3.1 Model Summary(s)Model R R Square Adjusted R Square Std. Error of the4.1.4样本检验表4.1.4.1年份 取对数值(y1) 取对预测值(y2) 相对误差(%)2001 3.93 4.05 3.052002 3.98 4.17 4.772003 4.09 4.32 5.62以上的样本检验的相对误差的计算方法是用2001年~2003年各个取对预测值减去对应的取对数值之后再除以取对数值后得到的。
其公式:相对误差=(y2-y1)\\\/y1×100%样本检验的相对误差需不大于10%,表示所建立的模型是可以使用的。
表4.1.4.1中的所计算的相对误差的都小于10%,说明模型建立的较好。
4.1.5残差正态性检验图4.1.5.1 银行存款对数的标准化残差直方图图4.1.5.1表明:标准化残差的正态曲线的均值为0,标准差为0.84,接近标准正态曲线,基本满足随机误差项正态分布的假设理论,模型拟合效果比较好。
4.1.6银行存款对数的正态概率图和残差散点图图4.1.6.1 正态概率图图4.1.6.2 散点图图4.1.6.1表明:代表样本残差的数据点基本处在表示指定正态分布的直线上或周围,因此基本符合残差正态分布的假设理论。
图4.1.6.2表明:残差散点的分布随机均匀,且大多落在水平直线-2和2之间,所以可以判断残差与因变量之间相互独立性较高,基本满足残差独立的假设理论,模型的拟合效果比较好。
4.2结论综上所述,商业银行的存款不断的增加,可以反映上海居民的收入在不断地增加、生活品质也在不断的提高,更可以从侧面反映上海金融的飞速发展和经济的繁荣。
我国加入世贸组织后,金融对外开放程度加深,国内各银行之间、外资银行与中资银行之间的竞争越来越激烈,而存款是竞争的重要领域。
随着我国国民物质生活的丰富,消费观念的变化,投资渠道的增多,这些因素将深刻地影响客户存款需求的特性。
目前我国商业银行负债以存款为主,负债结构单一,缺乏稳定性;同时银行特别是国有商业银行由于历史和体制的原因,存在资产质量差,不良贷款率高,资本金不足等问题,使得我国银行业积聚了大量的风险。
因此,我国商业银行的存款产品必须进行契约设计的改进,完善其中的激励与约束对等的机制设计,创新存款产品种类,满足不同客户的个性化需求;同时要提高存款的稳定性。
上海作为全国的金融中心,应该顺应时代的进步建立一个合理的金融体系并完善其制度,而商业银行作为金融的重要环节应不断地对自身进行改革和创新更好地为个人和企业客户服务,这对于上海人民的生活水平的提高和经济的稳定发展具有重要的意义和作用。
参考文献[2]黄达.金融学[M].北京:中国人民大学出版社,2004[3]郑道平.货币银行学原理[M].北京:中国金融出版社,2005[4]陈共.财政学[M].北京:中国人们大学出版社,2004[6]彼得·K·奥本海姆,官青译.跨国银行业务[M].北京:中国计划出版社.2001[6]上海统计年鉴.
教育、心理方面spss入门的书籍推荐~
刘超《SPSS其实很简单》本书力图打破这种局面:(1)从实际问题入手,剥离出需要研究的问题,帮助读者理解如何选择恰当的统计方法。
(2)从使用SPSS生成变量开始,到最终实现撰写APA(美国心理协会)格式的结果,提供每一操作步骤的截图,并对输出结果进行解读,帮助读者在面对大量输出结果时,快速有效的找到所需部分,并作出合理分析。
(3)总结统计方法使用的前提假设和利用SPSS进行各种统计分析的程序步骤,带领读者理解统计方法的实质。
刘超《简明应用统计学》本书采用通俗易懂、言简意赅的语言介绍统计知识,避免了复杂烦琐的数学推导。
通过经济、管理、人文社会科学领域的问题和实例,引发读者的学习兴趣,激起读者运用统计思维思考问题的热情。
在数据分析和实际问题的解决中介绍统计方法,帮助读者理解如何使用统计方法解决实际问题,突出统计应用的特点,强调读者的动手能力。
本书以统计软件SPSS和常用的办公软件Excel为数据分析工具,在例题解答中给出分析结果的软件操作步骤,读者可以一边阅读,一边使用计算机进行分析,获得对数据分析的直观感受。
本书可作为经济、管理、人文社会科学专业以及其他领域的统计学教材,也可供其他应用统计学进行数据分析和对SPSS软件有兴趣的实际工作者参考。
张文彤《SPSS统计分析基础教程》【本书介绍】为同时满足广大读者对统计学入门和统计软件操作入门的需求,本书改变了以往SPSS书籍对统计理论和软件操作“两条主线、各自表述”的编写方式,将这两者完全融合了起来。
全书共分15章,定位为统计软件和统计学入门书籍。
它以SPSS 12.0为准,针对统计初学者和SPSS初级用户的需求,以统计理论为主线,详细介绍了在SPSS中的界面操作、数据管理、统计图表制作、统计描述和常用单因素统计分析方法的原理与实际操作。
其内容完全覆盖目前国内大部分专业本科统计课程的教学范围,并结合SPSS的强大功能作了很好的扩展。
各章后均附有参考文献和思考练习题,涉及到统计理论的章节还提供了本章小结。
全书内容深入浅出,风格简洁明快,是一本难得的统计理论与SPSS操作相结合的统计参考书。
本书可用作各专业本科生和研究生的统计学教材,但同时也是一本SPSS 10~12版的通用入门教材,因此完全可以作为各行业中非统计专业背景,需要使用统计方法的人员,以及希望从头学习SPSS软件使用的人员的参考书使用。
我当时学SPSS课程的时候老师没有让我们买教材,他是自己弄了比较基础的课件给我们,就告诉我们如何操作这个系统。
我个人感觉是张文彤的这本书还不错,可以参考一下。
怎么用spss来做有序多分类probit回
Probit回归:Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。
这个回归主要用于研究半数效量用的。
直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。
Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。
(虽然logistic回归最后判断的是是或否,但是它也需要计算一个概率来判断这个结果倒是是还是否。
)而且如果有一点数学基础的话,会知道,这两个回归画出来的图也非常像,只是logistic回归画出来的Z型稍微平缓一些。
那么这两个回归到底有什么区别呢
通常来说区别不大。
最重要的一个区别在于probit回归适用于呈正态分布的数据,logistic回归适用于呈logistic分布的数据。
不过这个区别也蛮微妙的,因为正态分布和logistic分布还蛮像的。
所以大概来讲,到底是选择哪个分布更多的还是一种个人喜好。
但是大家都知道啊,logistic分布比probit分布可有名多了。
如果说十个从事大数据的人里边有五个人知道logistic回归,那么有三个知道probit回归就不错了。
在我们ppv课网站的spss视频教学里边,绝大部分都会讲到logistic回归,但是probit回归就不见得有人讲了。
(顺便说一句,我个人最喜欢spss从入门到精通这套课程,刚入门的时候就是听得这套课。
强烈推荐大家去听一听)。
那么这是什么原因呢
这绝不是probit不好用的原因。
主要原因有两个,第一,logistic回归形式比较多。
二分类,有序多分类,无序多分类,这些logistic回归都可以做。
这就好像我们ppv课网站提供了spss,sas,r,matlab,hadoop等等视频,你可以从零基础学到精通级别,肯定比较受欢迎哈。
第二,则归功于logistic回归的易解释性。
Logistic回归提供了一个很重要的参数,OR值,这个值很直接的告诉你处于某个状态比处于另一个状态时因变量发生的概率增加了多少倍。
这当然是一个很重要很直观的参数啦。
就好像你每学一段时间以后,我们ppv课网站告诉你你的知识积累比之前增加了多少倍多少倍,这个肯定很重要撒。
因此呢,logistic回归就比probit回归应用的广泛了。
不过这并不是说logistic回归就比probit回归好。
实际上,两种回归拟合的方程几乎一样好。
不过,再怎么几乎一样,那也肯定是有所不同的。
可惜这种不同用你的肉眼一般是看不出来的,至于怎么看,下边在讲。
好了,现在大概就介绍完probit回归的背景知识了(绝对没有凑字数)。
现在我们开始操作。
首先假设一个情景,假设我们ppv课网站打算增加一定的课程,达到收视率增加百分之二十的目的,我们就有了三个变量,课程增加的数目(假设分为3,6,9三个水平),各个增加水平的课程数(比方加3节课,6节课,9节课的都是十个课程),各个水平的课程的收视率增加达到百分之二十的课程数(假设分别是3,5,6)。
(这段真的有点绕,最好读两遍保证能看懂哪个变量是表示的什么意思)。
那么我们就有了一个3*3的数据集,选择菜单分析——回归——probit,打开主面板,响应频率里选我们各个水平收视率增加达到百分之二十的课程数(也就是我们做实验的课程里边有多少课程成功达到了收视率增加的目标),观测值汇总里边选择各个增加水平的总课程数,再下边有一个因子,一个协变量。
我们的自变量课程增加的水平是三节课一个台阶,所以我们要选到协变量里边去哈。
(如果你的自变量是连续型变量,那你就得在因子下边的那个定义范围里边选好范围。
)此外协变量下边有一个转换下拉菜单,这个菜单有三种方法,除了“无”以外,还有两种对数转换,你可以试试,你的数据到底怎么转换效果最好。
完了以后,在左下边还有一个模型:概率\\\/logit,这个单选框里默认的是概率。
也就是默认数据分布是正态的。
这个也不用管它。
然后点开选项,勾选频率,信仰置信区间,继续,确定。
然后就可以看结果了。
参数值和卡方检验这两个表会告诉你这个模型有没有意义,适不适合用probit回归(如果想和logistic回归作比较,就可以用这里的拟合度检验检测)。
此外置信限度这个很大的表会告诉你假如你想要你的课程收视率增加的概率是百分之八十的时候,你的课程要增加多少节课这么个数据。
它大概是以百分之五为精度的。
那如果我想知道增加百分之八十三,需要加多少节课的话,那么我们就要用参数估计值里的参数进行计算了。
非线性回归自然界中既然有线性回归,那么理所当然的,也会有非线性回归。
不过,人类对于非线性回归的研究远远不如对线性回归的研究来的深刻,广泛。
不信你看一看你的spss教科书,线性回归的内容可以洋洋洒洒写一章,非线性回归确占一小节,还往往是比较薄的一节。
线性回归指的是y=a+a1*x1+a2*x2…这种形式的方程,非线性回归包含的方程类型就多得多了。
常见的有,幂函数,指数函数,双曲函数,对数函数等等。
我们先举个例子。
假设想拟合ppv课授课老师的数目和网站受欢迎程度的关系。
选择分析——回归——非线性。
打开主对话框。
因变量选择网站受欢迎程度,模型表达式需要自己编辑。
(我就挺怵这个的),首先我们知道,我们肯定不可能看一眼就看出我们的数据是什么样子的模型,我们可以通过图形——图表构建程序里边,画出散点图,通过散点图大致判断我们的模型符合什么样的方程,然后在进一步使用(或者直接使用)参数估计法(前面讲过的),估计出它的表达式。
估计出表达式以后,就可以编辑模型表达式了。
编辑好以后看左下角的参数那一栏。
你的模型里边的参数是需要首先定义一个初始值的。
这个初始值要尽量靠近真实值,如果离真实值太远的话,也会影响到模型的准确度。
看到这里,可能你要发脾气了,这是个什么模型
怎么这么麻烦要是我知道模型,知道初始值,那我还需要做分析吗啊唉,我也没办法,非线性回归就是这么个玩意,总之你还是拿起你的笔,根据你的模型代几组数据算一算大概的初始值吧。
毕竟为了最后的精度嘛。
输好初始值以后,打开保存对话框,勾选预测值,残差。
继续,其他的默认就可以。
点确定。
输出的参数估计值会给出参数,套到你的模型里就可以。
注意看方差分析表下边的标注,里边会给出决定系数R^2,这个R^2通常比参数估计法里的大,也就是说,非线性回归的精度往往比参数估计法的大,模型拟合的好。
(废话,要是非线性回归一点优势也没有,还有谁肯研究啊。
)上边只是简单介绍了一点非线性回归的方法。
实际生活中,非线性回归比线性回归远远复杂的多,不是一句两句就能说清楚的,此外,还有一种很普遍的办法是通过数学公式把非线性方程转化成线性方程。
这样就能大大降低方程的复杂性。
在这里,给大家总结了几个常见的公式。
统计分析与SPSS的应用这门课,推荐一个实验报告
你要提供数据,然后做分析,才会有报告的我替别人做这类的数据分析蛮多的
用SPSS能对成绩做哪方面分析
就是实验班和对照班的比较,前后比较,组间比较等等



