CNDD文献复刻 | 数据要素共享与城市创业活力(免分享)
01 文献简介
程中的作用提供了新的理论逻辑。(3)进一步探讨了区域要素禀赋、非正式制度环境、地区初始数字基础设施政策支持差异与创业行业类型差异等协调因素的影响效应,对于理解公共数据开放价值创造效应、完善制度设计以提升城市创业活力具有重要的政策价值。
数据来源于以下几个方面:首先,城市数据来源于 2008~2022 年《中国城市统计年鉴》的面板数据,在剔除严重缺失值与无法识别的样本之后,进一步采用插值法对缺失值进行补充。其次,新注册企业数量来源于工商注册数据库,从市场监管总局网络获取了包括新注册企业的名称、类型、注册地址、注册年份、注册资本和主营业务等基本信息在内的工商注册企业数据,利用注册地址以及注册年份,将工商注册企业数据合成得到城市—年份维度的面板数据。
本文将各城市公共数据开放平台上线建设的个体与时间差异视为一项准自然实验,构建多期双重差分模型(Difference-in-Differences,DID),系统评估公共数据开放对城市创业活力的影响,具体模型设定为:
其中,下标 i表示城市,t表示年份;被解释变量 entre_activationit表示城市 i在第 t年的创业活力;解释变量 openit表示公共数据开放的虚拟变量,倘若城市 i在第 t年及以后上线公共数据开放平台则赋值为 1,否则为 0;controlsit表示影响城市创业活力的控制变量集合;ηi、μt分别表示城市固定效应与年份固定效应,加以控制基准回归中不随城市与年份变化的混淆因素;εit为随机误差项。此外,考虑到残差序列相关以及异方差造成的估计偏差,将所有回归标准误聚类到城市层面。最关注的系数是 β1,其衡量公共数据开放对城市创业活力影响的净效应,倘若β1显著为正则表明公共数据开放能有效激发城市创业活力。
1.被解释变量:城市创业活力
借鉴杜运周等(2020)、袁礼和龚钰涵(2023)的研究思路,考虑到城市内企业规模异质性差异而产生的度量偏误,将城市人口作为标准化基数,采用城市每百人口中的新注册企业数量衡量城市创业活力。
2.核心解释变量:公共数据开放
公共数据开放的政策处理变量(open)表示城市 i在第 t年及以后是否上线公共数据开放平台。参考复旦大学数字与移动治理实验室发布的《2023中国地方公共数据开放报告(城市)》,整理出各城市是否上线公共数据开放平台的基础数据,并且将其与华中师范大学信息管理学院发布的《中国政府开放数据利用研究报告(2022)》进一步对照。同时,借鉴复旦大学数字与移动治理实验室发布的《2023中国地方公共数据开放报告(城市)》的方法,通过以下两步进一步进行检验:首先,将各地区公共数据开放平台域名限定于 gov.cn,将其作为确认官方公共数据开放平台的依据,且必须由地级市以上行政级别的政府部门负责建设与运营,同时通过开设专门且统一平台或者由政府部门在官网设置专栏的形式开放;其次,通过在搜索引擎中对各地区名称加关键词(“数据开放”“数据资源”“公共资源”等)加以验证。据此,最后获得了截至 2023年 204个城市(含有直辖市、副省级城市与地级市)的公共数据平台上线时间,将上线公共数据平台的城市设定为 treat,将首次上线时间以及之后年份设定为 post,进而构建城市—年份层面城市是否上线公共数据开放平台的虚拟变量 open(treat × post)。
3.控制变量
城市层面控制变量包括:①经济发展水平。经济发展水平与生产要素集聚相关,影响企业家创业的吸引力与收益情况,采用城市人口密度的自然对数量化城市经济发展水平。②产业结构升级。资源禀赋基础与要素投入条件的差异是影响城市创业结构的重要因素,尤其是服务业与金融业的发展能够为创业活动开展提供服务型技术、人才与资金的支持,采用第三产业增加值与第二产业增加值比值衡量产业结构升级。③人力资本水平。人力资本是人才与技术集聚的重要因素,而人才与技术能为激发城市创业活力提供高质量的要素,以人均普通本专科在校学生数衡量。④公共服务水平。公共服务关乎人才宜居、社会保障等多方面,也为企业进入提供坚实的基础条件,以每百人公共图书馆藏书量衡量城市公共服务水平。⑤传统基础设施。交通便利性与实体物流交易成本的节约为市场主体进入市场提供了较强的吸引力,采用铁路货运总量的自然对数量化城市传统基础设施。⑥互联网发展水平。互联网加速市场主体信息的传播速度,降低创业的信息成本,互联网基础设施建设还为创业运营模式提供了支持,采用电信业务总量的自然对数衡量互联网发展水平。⑦金融发展水平。金融资源可得性为企业家创业提供信贷资金来源,也有助于吸引生产要素集聚,采用年末金融机构各项贷款余额与地区生产总值比重衡量。⑧财政压力水平。财政压力水平有助于理解地方政府根据居民偏好与资源禀赋提供公共产品的行为策略,采用各地方财政一般预算内支出占地方财政一般预算内收入比重量化。⑨科学支出水平。科学支出反映地方政府对于科技创新环境与成果的重视,还为生产性服务业聚集提供良好的外部条件,以科学支出对数衡量城市科学支出水平。
此外,考虑到各城市公共数据开放平台上线行为可能不具随机性,各地方政府可能需要结合地区的经济发展水平、地理区位以及资源禀赋等条件作出抉择,这些因素随着时间变化可能对城市创业 活 力 产 生 影 响 ,从 而 导 致 采 用 多 期 双 重 差 分 模 型 识 别 假 设 不 成 立 。因 此 ,借 鉴 Edmonds 等(2010)、赵涛等(2020)的研究思路,进一步纳入 1995 年人均粮食产量、1995 年人均油料产量、1995年人均蔬菜产量、1995 年人均普通高等学校数量以及时间趋势交互项,以控制影响城市是否建设公共数据开放上线平台的原有社会经济特征等,进而缓解实验组选择的估计偏差。
表 1报告了公共数据开放对城市创业活力影响的回归结果。其中,第(1)列为控制城市固定效应与年份固定效应基础上的单变量回归,公共数据开放政策处理变量的回归系数在 1% 水平上显著为正,初步表明公共数据开放对所属城市的创业活力具有显著的正向影响。考虑到经济、教育、文化、基础设施与政府行为等特征对城市创业活力的影响,在前述单变量回归的基础上控制了经济发展水平、产业结构升级、人力资本水平、公共服务水平、传统基础设施、互联网发展水平、金融发展水平与财政压力水平等变量。第(2)列的回归结果显示,公共数据开放政策处理变量的回归系数仍然在 1% 水平上显著为正。此外,考虑到城市初始禀赋特征的基准变量可能影响城市是否选择开放公共数据,在前述基础上,进一步控制城市事前变量与时间趋势交互项。第(3)列的回归结果显示,核心解释变量的回归系数仍然通过 1% 水平检验显著为正,回归系数小于前述回归结果,说明较为有效地控制了城市事前变量与时间趋势交互项对政府是否开放公共数据对所属城市创业活力的冲击。根据第(3)列的回归结果,其经济含义在于,在其他条件不变的情况下,与尚未开放公共数据的城市相比,公共数据开放城市的每百人新注册企业数量将平均增加 19.210家/万人,相当于均值的 17.251(0.192/1.113)家/万人。上述回归结果意味着,公共数据开放显著促进城市创业活力提升,激发经济增长活力,这也意味着公共数据开放有助于降低制度性交易成本与优化信息搜寻匹配效率的理论逻辑可能成立。
见推文末尾。
▪ 客服微信方式:
扫描下方二维码,或搜索下方微信号。
1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。
2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。
任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。
中国深度数据库:让精品数据 得以流动
CNDeepData:Let high-quality data flow without barriers
部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001