江西省地方财政收入预测与研究--688IT编程网

Statistics and Application 统计学与应用, 2023, 12(1), 224-234 Published Online February 2023 in Hans. /journal/sa /10.12677/sa.2023.121023

江西省地方财政收入预测与研究

龚淑聪

江西财经大学，江西南昌

收稿日期：2023年1月23日；录用日期：2023年2月13日；发布日期：2023年2月27日

摘

要

财政收入是国家建设和治理的基础和重要保障，它不仅能够综合反映出国民经济状况，也为国家政府对市场经济进行宏观调控奠定了基础。本文以江西省财政收入为例，收集当地近20年的相关数据进行实证分析。

首先利用LASSO 回归分析筛选出影响江西省财政收入的重要因子，将其作为预测模型的变量。然后将灰GM(1,1)与BP 神经网络结合起来，先利用GM(1,1)拟合得到2025年各变量的估计值，再将这些估计值作为BP 神经网络的输入，输出值即为江西省2025年的财政收入预测值。实验结果表明，预测模型精度较高，可为当地政府制定相关财政政策给出理论参考。

关键词

财政收入预测，GM(1,1)模型，BP 神经网络，LASSO 模型

Forecast and Research on Local Fiscal Revenue of Jiangxi Province

Shucong Gong

Jiangxi University of Finance and Economics, Nanchang Jiangxi

Received: Jan. 23rd , 2023; accepted: Feb. 13th , 2023; published: Feb. 27th

, 2023

Abstract

Fiscal revenue is the basis and important guarantee for national construction and governance. It can not only comprehensively reflect the state of the national economy, but also lay the foundation for the national government to carry out macro-control over the market economy. This paper takes the fiscal revenue of Jiangxi Province as an example and collects the relevant data in the past 20 years for empirical analysis. First of all, LASSO regression analysis was used to screen out the important factors affecting the fiscal revenue of Jiangxi Province and take them as the variables of the prediction model. Then the grey GM(1,1) is combined with BP neural network, and the esti-

龚淑聪

mated value of each variable in 2025 is obtained by the fitting of GM(1,1). Then these estimated values are used as the input of BP neural network, and the output value is the predicted fiscal rev-enu

e value of Jiangxi Province in 2025. The experimental results show that the prediction model has high accuracy and can provide theoretical reference for local government to formulate rele-vant fiscal policies.

Keywords

Fiscal Revenue Forecast, GM (1,1) Model, BP Neural Network, LASSO Model

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

/licenses/by/4.0/

1. 引言

在十九大报告中，明确提出“加快建立现代财政制度，充分发挥财政政策的导向作用，努力提高经济发展的质量和效益，推进国家治理体系和治理能力现代化”。财政收入在一定程度上是一个国家国民经济实力映现的窗口，也是国家进行资源配置优化、促进社会公平、改善民生的重要经济杠杆[1]。

从地方层面上来说，地方财政作为我国的财政的重要组成部分，是地区经济建设发展的重要保证，也是促进其经济平稳运行的物质基础。对地方财政收入进行分析和预测，可以有效克服地方财政预算与收支失衡的问题，有助于加强相关部门拟订预算及财政政策，以此改进地方财政收入预测模型的科学性、预测的客观性、规划的前瞻性。

从2020年开始，新冠疫情持续地影响着全省甚至全世界经济的正常运转，为经济的稳定发展带来了很大的压力。如何把准各自定位，发挥各自优势，进一步提升经济实力，优化财政分配和配置，拉动财政收入的增长，促进江西省经济高质量发展显得尤为重要。因此，通过探究影响江西省财政收入的关键经济因素并建立财政收入预测模型，对财政收入情况进行科学分析和准确预测是具有重要意义的。

2. 相关理论及模型介绍

2.1. LASSO 变量选择方法

Lassso 方法是通过构造一个精炼模型，并对其进行不断地压缩，使得一些变量系数为零，最终达到变量简化的效果[2]。

给定数据集()()(){}1122,,,,,,m m D x y x y x y = ，

其中d x ∈ℜ，最简单的线性回归模型，以平方误差为损失函数，则优化目标为

()

T 1min m

i i

i y x ω

ω−−∑ (1)

当样本特征很多，但是样本数量相对较少时，上述(1)式就容易陷入过拟合。为缓解这一问题，对(1)式引入正则化项。若使用2L 范数正则化，则有

()

T 12min m

i i

i y x ω

ωλω−−+∑ (2)

其中正则化参数0λ>。上式被称为“岭回归”，通过引入2L 范数正则化，确实能降低过拟合的风险；

龚淑聪

将正则化项中的2L 范数替换为P L 范数时，令1p =，即采用1L 范数，则有

()

T 11min m

i i

i y x ω

ωλω−−+∑ (3)

其中，正则化参数0λ>，上式被称为Lassso 。

1L 范数正则化都能够有效的降低过拟合风险，并且相较于2L 而言，正则化(Lassso)还有另一个优点：

更容易获得稀疏解，即通过它求得的ω会有更少的非零分量。

2.2. 灰系统GM(1,1)模型

灰预测系统是对既含有已知信息、也含有未知信息的系统进行预测，这也就是在有限的变化范围内的灰数据系统进行预测[3]。其建模过程如下：

首先对原始序列()

()(){}0

0,1,2,,i

X x i n ==

进行一次累加得到序列()

()(){}

1,1,2,,i

X x i n ==

，

对()1

X 建立一阶线性微分方程为：

()()1

d d X aX u t

+= (4) 求解微分方程，得到预测模型为：

()()()()11ˆˆˆˆ10e ˆak u X k X a − +=−

(5) 将()()1ˆ1X

k +经过累减还原为()()0ˆ1X k +，即()0X 的灰预测模型为： ()()()

()

()01ˆˆˆˆˆ1e

10e ˆa

ak u X

k X a −− +=−−

(6) 采用后验差检验法进行灰模型的精度检验。后验差检验的两个重要指标为C (后验差)和P (小误差概率)，模型精度等级[4]如表1所示。

Table 1. Accuracy grade of grey model 表1. 灰模型精度等级表

等级后验差比值C 小误差频率P 一级 C ≤ 0.35 P ≥ 0.95 二级 0.35 < C ≤ 0.5 0.8 ≤ P < 0.95 三级 0.5 < C ≤ 0.65 0.7 ≤ P < 0.80 四季

0.65 < C

P < 0.7

2.3. 反向传播(BP)神经网络

BP 神经网络[5]是一种按误差反向传播训练的多层前馈网络，其算法称为BP 算法[4]。其学习算法如下：

1) 用随机数初始化层间节点i 和j 的连接权ij W 和节点j 的阈值j θ。

2) 读入经预处理的训练样本{}PL X 和{}PK Y 。 3) 计算各层节点的输出(对第P 个样本) ()pj ij pi j i

O f W I θ=

−∑，式中pi I 既是节点i 的输出，又是节点j 的输出。

4) 计算各层节点的误差信号

龚淑聪

输出层：()()1pk pk pk pk pk O y O O δ=−− 隐含层：()1pi pi pi pi ij i O O O W δ=−∑ 5) 反向传播

权值修正：()()1ij pi pi ij W t O W t αδ+=

+ 阈值修正：()()1j j pi t t θθβδ+=+

式中α为学习因子，β为加速收敛的动量因子。 6) 计算误差

()()2

pk p k E O Y =−∑∑

2.4. 组合预测

灰预测GM(1,1)模型是根据样本数据的具体分布情况和随机性质，通过常用的关联分析对样本数据进行分析后，将原本不平稳的样本数据，利用累加函数使其变成单调递增的数据模型，这种累加模型往往适用于指数型的时间序列数据，但如果数据之间是一种非线性的函数关系，那么这种模型就不能够体现

出来。

人工神经网络预测模型作为一种非线性自适应的预测模型，具有高度的非线性函数映射能力，这种性质使得神经网络适合应用于存在多因素并且非线性联系的高维复杂问题上，因此它可以反映模型因素之间的非线性函数关系。作为目前人工网络模型中使用范围最广的BP 神经网络模型，它能够处理绝大多数的非线性的数据序列关系，而且模型能够科学全面地反映样本数列的复杂性，同时还能保证较高的预测精度。

因此本文结合两种预测方法优缺点，可以将两个单一的预测模型进行组合，这样一方面可以实现两个模型的优势互补，另一方面又较好地消除了两者不足，在最大程度上又保证了模型的预测精度。

3. 数据来源与变量说明

本文使用的数据主要来自于2006~2021年《江西省统计年鉴》，部分数据参考了《中国统计年鉴》和《中国经济统计年鉴》，其中包含19个影响江西省财政收入的解释变量[6]，主要包括地区生产总值、税收收入、农村人均消费支出等，如下表2所示。

Table 2. Symbol description of fiscal revenue and influencing factors of Jiangxi Province 表2. 江西省财政收入及影响因素符号说明

符号含义单位 X 1 第一产业产值亿元 X 2 第二产业产值亿元 X 3 第三产业产值亿元 X 4 地区生产总值亿元 X 5 税收收入亿元 X 6 农村人均消费支出元 X 7 城镇人均消费支出元 X 8 农村居民人均可支配收入元 X 9 城镇居民人均可支配收入

元 X 10

外商直接投资

万美元

龚淑聪

Continued

X 11 教育支出万元 X 12 科学技术支出万元 X 13 农林水支出万元 X 14 存款余额亿元 X 15 贷款余额亿元 X 16 普通高等学校毕业人数

人 X 17 建筑业总产值亿元 X 18 出口总值万美元 X 19

进口总值

万美元

4. 实证分析

基于以上三大主要统计理论及预测方法的基础上，运用江西省2006~2020年财政收入及相关影响因素数据，分别依次利用LASSO 模型、灰预测GM(1,1)模型与神经网络组合模型，进行分析研究[7]。

4.1. 数据预处理

4.1.1. 相关分析

根据江西省历年的经济数据，利用eviews 软件对以上各经济指标进行相关性分析。通过eviews 软件计算出因变量与各自变量之间的相关系数，根据相关系数的大小来判断变量与因变量之间的关系，从而把和因变量没有关联的自变量进行删除[8]。

查询资料后，选用Pear-son 对变量与因变量之间的关系进行检验，其公式为：

p =

其中是(),Cov X Y 变量X 和变量Y 之间的协方差；()Var X 是变量X 的方差；()Var Y 是变量Y 的方差。

地方财政收入与各经济指标之间的相关系数的具体情况，如下表3所示。

第一范式正则化不能产生稀疏解Table 3. Correlation coefficients 表3. 相关系数

R 2 x 1 x 2 x 3 x 4 x 5 x 6 x 7 Y 0.981** 0.985** 0.940** 0.973** 0.998** 0.959** 0.975** R 2 x 8 x 9 x 10 x 11 x 12 x 13 x 14 Y 0.971** 0.973** 0.835** 0.982** 0.885** 0.991** 0.961** R 2 x 15 x 16 x 17 x 18 x 19 Y

0.914**

0.771**

0.954**

0.976**

0.913**

注：**在0.01水平(双侧)上显著相关。

从上表3中，可以看出地方财政收入与各经济指标之间的相关程度都很高，平均在0.9以上。经过相关分析可知，各变量与地方财政收入之间的相关性都非常高，因此我们可以选取这些变量对地方财政收入进行建模，并预测江西省未来几年的地方财政收入值。

688IT编程网

江西省地方财政收入预测与研究

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

江西省地方财政收入预测与研究

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法