Add Your Text Here.

See posts by tags

See posts by categories

数字贸易发展现状因子分析

  • by
  • 1 minute read
  • 10月 10, 2022

考虑到数据的可得性和完整性,由于西藏自治区的数据缺失较多,本文选取除香港、澳门、台湾、西藏外的30个省市的相关数据,采用有关数字贸易发展的14个指标,进行因子分析,得出我国部分省市数字贸易发展的具体情况.

因子分析最重要的部分就是指标选取,本文在现有的研究基础上,基于数字贸易的内涵和界定,采用马述忠(2018)和章迪平(2020)的做法,遵循系统性、科学性及综合性原则,从软件和硬件条件两个方面选取四个角度选取14个指标来衡量我国数字贸易发展现状,具体见下表:

以上指标的数据主要来源于国家统计局及各省统计年鉴,获得的数据需要进行一定的处理,才能进行因子分析。本文处理的方式,首先是进行标准化处理,其次再进行变量相关性检验。

由于本文选取的指标量纲不同,并且各项指标之间的数字差异显著,为了保证因子分析更加合理准确,需要对数字贸易的各项指标进行标准化处理,使得各项指标满足E(X)=0,V(X)=1,基本原理为:对序列X1,X2,X3,…,XN进行变换,令,其中:;,则新序列Y1,Y2,Y3,…,YN的均值=0,方差=1,且无量纲。

由表可知,KMO 的值=0.818,大于阈值=0.8,表明变量之间是存在相关性的,符合要求;巴特利球形检验的显著性值= 0.000,小于 0.05,说明其显著相关,可以进行因子分析。

通过相关性检验,说明本文选取有关数字贸易的指标适合做因子分析。本文采取主成分法提取因子。计算公因子方差和方差贡献率,分析见下表:

每一个变量都可以用公因子表示,其表达的大小就是公因子方差表中的“提取”,“提取”的值越大说明变量可以被公因子表达得越好,一般大于0.5即可认为是可以被表达的,但是更好表达要求大于0.7,这才足以说明变量能被公因子表达得很合理.在上表中可以看到,“提取”的值都是大于0.7的,所以变量可以被很好地表达。

方差贡献率代表解释方差的比率,方差贡献率越高,解释的方差就越大,表明这个因子就越重要,在上表中,成份1-14代表可以选取的因子数,为了更好地对指标进行解释,常常采用降维的方法只选取2-3个因子,使得方差贡献率总和达到80%即可。

由上表得知,第1个因子的方差贡献率达到了69.36%,则近似可以解释69%的成份,第2个因子的方差贡献率为18.37%,前2个因子的累计方差贡献率达87.72%,远超50%,说明前2个因子可以对全部指标的87.72%做出解释,因此为了达到降维的目的,可以选取的因子数为2。

为更好的论证前文的表述,绘制了直观的碎石图作为辅助。由上图得出:前3个因子的连接线非常陡峭,其余因子的连接线趋于平缓,更直观地说明了前2个因子的方差可以解释整体的方差。

采用具有Kaiser标准化的正交旋转法计算旋转成份矩阵,旋转在3次迭代后已收敛,结果下表:

由上表得出,在第1列中,2020年GDP、2020年互联网宽带接入端口、2020年互联网宽带接入用户和2020年电信业务总量的指标系数分别为0.938、0.969、0.967、0.963,这些指标的系数最大,具有较大载荷,因此可以把第1个因子(F1)归结为发展潜力;而在第2列中,2020年移动电线年电子商务销售额收入的系数分别为0.942、0.909、0.822,这些指标对应的系数最大,具有较大载荷,因此可以把第2个因子(F2)归结为发展环境。

现基于前文分析,对我国各省数字贸易发展水平进行排列。本文从因子分析得分系数矩阵出发(见下表),得出因子与指标间的线性关系。

将各变量的标准化数值依次代入式、中,可以计算出各省市在每个公共因子上的得分排名,具体结果见下表。

由上表得出,北京和上海的发展环境在全国排名分别为第1和第2,但发展潜力排名则倒数,主要是因为这2个地区的经济发展水平已经很高导致。广东、江苏和山东这3个地区在发展潜力排名很高,因为这3个地区的市场规模庞大,存在很大的发展潜能。然而,广东、江苏和浙江这3个地区不论在发展环境,还是在发展潜力的排名都位于前列,是我国数字贸易发展的核心区域。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

Related Posts