CNDD-0208 “智慧城市试点”DID变量及学术论文应用

01 数据介绍

▪ 数据名称: 智慧城市试点DID变量

数据编号:0208

▪ 数据层级:地级市层面

▪ 数据范围:2000-2022年

▪ 样本数量:6,900条

▪ 数据来源:根据政府公告等公开内容整理

▪ 数据说明:CNDD “智慧城市试点”DID变量整理了中国300个重要地级市是否加入智慧城市试点”以及何时加入智慧城市试点”。具体变量包括行政区划代码、年份、地区、所属省份、是否试点城市、、最早试点年份、智慧城市试点DID变量文件提供.xlsx和.dta格式,可使用excel或stata打开。

▪ 数据维度:年度数据

▪ 综合评价:为了探索运用现代科学技术、整合信息资源和统筹业务应用系统,加强城市规划、建设和管理的新模式,我国于 2012 年推出“智慧城市”试点政策。这一政策是贯彻党中央、国务院关于创新驱动发展、推动新型城镇化、全面建成小康社会的重要举措。一方面,政府依托先进的信息通信技术,在管理城市产业、公共事业及服务、城市环境等过程中,实现政府办公、监管、服务、决策等过程的智慧化,进而减少由信息不对称导致的效率损失。另一方面,城市中的企业和居民借助大数据、互联网和物联网等信息通信技术,企业实时高效配置生产要素,提高生产效率,居民高效配置自身资源,提高生活品质和工作效率。实质上,智慧城市是基于信息技术和信息化的一种新时代下的城市发展战略、是城市信息化的高级形态。进一步而言,智慧城市试点建设过程中,政府和企业必然会投入大量的智慧项目和资金,这些智慧项目和资金均是依托大数据、互联网和物联网等信息通信技术,从而直接导致智慧城市以及智慧城市中企业的信息化水平较非智慧城市有一个“意外”的提高,意味着一种“冲击”。因此,智慧城市建设可以看作信息化的自然实验,为运用双重差分法研究地级市信息化的影响提供了绝佳的机会。

CNDeepData 数据应用质量评级

 常用度:★★

▪ 稀缺度:★★★

▪ 新颖度:★★★

▪ 总体级别:12颗星

  常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。

✔  稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。

  新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。

02 变量说明  

03 数据概览

04 前沿文献速递

▪ 文献来源

 石大千,李格,刘建江.信息化冲击、交易成本与企业TFP——基于国家智慧城市建设的自然实验[J].财贸经济,2020,41(03):117-130.DOI:10.19795/j.cnki.cn11-1166/f.20200313.006.
▪ 文献内容
智慧城市建设一般伴随着城市信息化水平的“意外”提升。本文将中国2012 年智慧城市试点建设作为信息化冲击的自然实验,构建了智慧城市建设影响企业全要素生产率( TFP) 的交易成本理论分析框架。基于 2003—2016 年中国地级市和上市公司匹配面板数据,运用双重差分法( DID) 、倾向得分匹配双重差分法( PSM-DID) 和三重差分法( DDD) 实证检验了智慧城市建设产生的信息化冲击对企业全要素生产率的影响及其机制。实证结论表明,智慧城市建设这一信息化冲击显著提升了企业全要素生产率。机制检验表明,信息化冲击通过降低企业交易成本,从而提高企业全要素生产率。进一步异质性检验表明,智慧城市建设产生的信息化冲击对资本密集度更高、规模更大企业的全要素生产率促进作用更加明显; 相对于非国有企业,智慧城市建设产生的信息化冲击对国有企业产生了较大影响; 相对于非交易行业,交易行业由于智慧城市建设导致的交易成本下降,企业全要素生产率提升更明显。
▪ 模型设定:
中国从 2009 年提出智慧城市建设构想,于 2012 年首批设立智慧城市试点,2013 年和 2014 年分别设立第二批和第三批试点城市,这一外生事件改变了城市和企业的信息化水平和运行环境,产生了自然实验。由于企业无法预知所在城市是否会被列为智慧城市试点,也无法在短时间内干预政府决策,所以中国的智慧城市建设就是一次外生的信息化冲击,这为本文运用双重差分法识别智慧城市建设的政策效应提供了绝佳的机会。本文构建两个虚拟变量。一是实验组和控制组虚拟变量 du,由于智慧城市试点时间不是发生在同一年份,因此本文的 DID 为时点不一致的渐进性 DID,我们分别以相应年份试点设立时间为政策发生时点。因此,如果企业属于某一年试点成立的智慧城市以内的企业,该变量取值为 1,否则取 0。二是政策时间虚拟变量 dt,当试点城市内的企业在相应年份设立试点,当年及之后设置为 1,否则定义为 0。由于第一批试点城市于 2012 年底设立,因此将 2013 年作为政策效应发生的首次年份。在确定实验组和控制组的过程中,由于部分智慧城市是县级城市或者市级区域,如果将这些城市定义为实验组会导致估计结果被高估。为此,本文在确定实验组的过程中将县级城市或者市级区域所在的地级市删除。同时,进一步根据上市公司所在的城市依据上述标准确定其是否为智慧城市所在的上市公司,也就是说当上市公司处于县级城市或者市级区域就将该上市公司删除,从而估计智慧城市影响的净效应。
DID 估计结果的准确性还依赖对照组的选取,即对照组能否客观反映实验组所在城市在未建设智慧城市这一反事实情形下的全要素生产率的变化。由于中国不同地级市发展具有较大的异质性,不同企业很难满足实验组和控制组时间效应一致的条件。因此,需要寻找与实验组企业特征尽可能相似的控制组企业来评估政策效果。为处理这一问题,倾向得分匹配法( PSM) 可以用来消除样本选择偏差,匹配寻找与实验组特征尽可能相似的控制组,满足 DID 估计要求。PSM 能够解决样本选择偏差问题,但不能避免因变量遗漏而产生的内生性问题,而 DID 能通过双重差分很好地解决内生性问题并得出政策处理效应,但不能很好地解决样本偏差问题,基于此,本文最终采取 PSM 与 DID 相结合的方法( 石大千等,2018) ,从而更准确地评估智慧城市建设带来的信息化冲击对企业全要素生产率的影响。
基于上述讨论,双重差分模型设定如下:

其中,tfp 为企业全要素生产率,X 为一组影响企业全要素生产率的控制变量,a 为企业不可观测的固定效应,η 为随时间变化的固定效应,ε 为随机扰动项。

▪ 数据说明

本文被解释变量为企业全要素生产率,为了避免企业全要素生产率的测度方式不同影响本文实证结果,借鉴相关文献( Levinsohn 和 Petrin,2003; 刘莉亚等,2018) ,采用 LP( Levinsohn 和 Petrin,2003,LP) 方法测度企业全要素生产率。具体而言,使用经制造业出厂价格指数平减后的主营业务收入作为产出变量,用经固定资产价格指数平减后的固定资产净值作为资本投入变量,用员工人数作为劳动投入变量,用经原材料购进价格指数平减后的原材料和在产品总和作为中间品投入变量,然后使用 LP 法计算企业的全要素生产率。由于服务业 TFP 计算和制造业存在较大差异,为和文献保持一致,本文仅用制造业上市公司样本作为本文的实证样本。

在进行回归前,参考前期文献( 鲁晓东、连玉君,2012; 刘莉亚等,2018) ,本文对样本数据进行了常规处理,首先删除金融类、公共事业类以及综合类上市公司,并删除了 ST 和* ST 公司样本以及样本当前进行了 IPO( Initial Public Offering) 的上市公司。为保证样本的连续性,我们将相关财务数据以及交易成本相关数据存在缺失的样本删除。最终本文得到了 6110 个观测值的 2003—2016 年的非平衡面板数据,为避免异常值对估计结果的影响,本文对主要连续变量分别在 1% 和 99% 的水平上进行缩尾处理。 

核心解释变量为 DID 变量,即模型中两个虚拟变量的交乘项( du × dt) 。

借鉴相关文献,本文还控制了一些企业特征变量: 企业规模,用企业员工人数来衡量; 资产负债率,代表企业的资本结构; 资产收益率,代表企业的盈利能力; 资本密集度,即人均固定资产净值; 固定资产占比,反映企业的资产结构; 企业年龄,反映企业的经营时长及经营经验。除此之外,还控制了城市特征变量:金融发展,以金融机构存贷款总额占 GDP 比重衡量; 政府研发投入,以财政科技支出占总财政支出的比重衡量; 基础设施,用人均道路面积表示; 人力资本,用大学生毕业人数衡量; 产业结构,以第三产业就业人数与第二产业就业人数的比值衡量; 人口密度,以单位面积人口数量度量。为了消除异方差的影响,企业员工、企业年龄和所有的城市特征变量均进行了取对数处理。本文所使用数据来自国泰安数据库和 2004—2017 年《中国城市统计年鉴》,与以往研究相比,本文所测算的 TFP 均值②相比于鲁晓东和连玉君( 2012) 略高,主要在于其使用的工业企业数据库,而本文使用的是上市公司数据。工业企业数据库包含各类型企业,平均而言其全要素生产率相比于上市公司要低( 郑宝红、张兆国,2018) 。同时,本文所测算的 TFP 均值与段梅和李志强(2019) 较为接近。

▪ 实证结果

本文的理论逻辑是智慧城市建设是城市信息化水平提高的自然实验,信息化水平提高会影响企业 TFP。因此,本文的实证要首先验证智慧城市建设是否会显著提高城市信息化水平,为检验本文的主要逻辑的存在性,也就是智慧城市是否真的提高了城市信息化水平,本文使用地级市样本数据,利用双重差分模型实证检验智慧城市建设是否会提高城市信息化水平,从而为将智慧城市看作信息化冲击的准自然实验提供证据。由于地级市数据的可得性,本文使用地级市互联网用户数以及每万人互联网用户数作为信息化水平的代理变量( 见表 1) 。表 1 结果表明,智慧城市建设影响城市信息化水平的系数在 1% 的水平下显著,表明智慧城市相比于非智慧城市信息化水平显著较高,智慧城市建设显著提高了城市信息化水平,从而可以将智慧城市建设看作信息化冲击的准自然实验。这为本文使用双重差分法研究信息化冲击对企业全要素生产率的影响提供了坚实的实践基础。

表 2 报告了智慧城市对企业全要素生产率的估计结果,我们通过逐步控制企业特征和城市特征的方式估计。所有估计结果表明,无论是否加入控制变量,智慧城市建设对企业 TFP 的影响均显著为正,即智慧城市建设显著提高了企业全要素生产率,这与本文预期相符。相对于非智慧城市的企业而言,智慧城市企业的全要素生产率大致高出 4. 3 个百分点。智慧城市建设通过政策力量,借助信息化技术弱化了市场上的信息不对称,改善了企业的外部市场环境。同时,企业内部利用信息技术,贯通运营的各个环节,降低企业信息搜寻成本、监督成本、协调成本,进而促进企业全要素生产率的提高。由此,本文得到了智慧城市建设促进企业全要素生产率提高的初步结论。

为了克服智慧城市企业和非智慧城市企业间的系统性差异,减少 DID 模型估计误差,本文进一步利用 PSM 方法寻找与智慧城市企业特征最接近的企业作为控制组进行 DID 估计。首先本文将是否是智慧城市企业虚拟变量对城市特征和企业特征变量进行 Logit 回归,得到倾向得分值; 其次基于 0. 05 的指定宽带代入核函数计算权重进行有放回匹配,倾向得分值最接近的城市企业即为智慧城市的配对城市企业。 
由于 PSM 匹配需要满足一定的假设条件,为了得到更为稳健的估计结果,我们使用广义精确匹配( Coarsened Exact Matching,CEM) 方法来估计。该方法相比于 PSM 的优势在于: ( 1) 不需要不同组数据满足共同支撑假设来进行匹配,而是根据原始数据的经验分布来匹配; ( 2) CEM 匹配可以要求两组数据匹配不相等,并赋予不同组数据一定权重,以平衡每层数据中处理组和控制组的数量,从而反映政策评估效果的真实情况; ( 3) 不同于 PSM 使用概率模型,CEM 无须依赖回归模型的选择,而直接根据每个变量的理论分布来进行回归匹配。因此,从这一角度而言,CEM 匹配放松了PSM 匹配的假设,从而可得到更稳健的估计。
表3 报告了 PSM 匹配中的核匹配,以及 CEM 匹配后使用 DID 估计的结果。从结果中看出,在利用 PSM 方法消除样本选择偏差后,智慧城市建设的系数在 5% 的水平下显著为正,智慧城市建设促进了企业全要素生产率的提高,PSM-DID 估计结果与前文 DID 估计结论无明显差异。进一步利用 CEM 匹配后的估计结果表明,相比于 PSM-DID 估计结果,CEM-DID 估计的系数有所提高,进一步表明本文实证结论是稳健的,智慧城市建设提高了企业的全要素生产率。

05 其他相关文献

石大千,丁海,卫平,等.智慧城市建设能否降低环境污染[J].中国工业经济,2018,(06):117-135. 

宋德勇,李超,李项佑.新型基础设施建设是否促进了绿色技术创新的“量质齐升”——来自国家智慧城市试点的证据[J].中国人口·资源与环境,2021,31(11):155-164.

袁航,朱承亮.智慧城市是否加速了城市创新?[J].中国软科学,2020,(12):75-83.

06 获取方式

以下三种方式三选一即可:

▪ 直接购买

见推文末尾,价格为69元。

▪ 朋友圈分享后免费领取(每人限领15份)

持续3小时,集齐5个赞,需要对所有人可见,并且本人关注CNDeepData公众号。

▪ 购买会员

添加客服微信,购买年度普通会员149元,年度高级会员299元,永久高级会员899元,可享CNDeepData所有数据免费获取。

▪ 朋友圈分享要求:

①分享时间需要在早上7:30到晚上12:30之间。

②请附带一句推荐词,例如“推荐CNDD高质量数据库”。

③请将包含时间内容的截图发给客服。

客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:

DeepData001

获取更多更新数据

版权声明 …

1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。

中国深度数据库:让精品数据 得以流动

CNDeepData:Let high-quality data flow without barriers

资源下载此资源下载价格为69积分(VIP免费),请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部