CNDD-0201 地级市高铁开通DID数据及学术论文应用
01 数据介绍
▪ 数据名称: 地级市高铁开通
▪ 数据编号:0201
▪ 数据层级:地级市层面
▪ 数据范围:2000-2022年
▪ 样本数量:6,900条,每年300个城市。
▪ 数据来源:参考汪克亮等(2021),邓慧慧等(2020)、卞元超等(2019)根据各地级市高铁开通数据整理
▪ 数据说明:CNDD地级市高铁开通DID数据包含地区代码、年份、地区、省份、试点城市、试点时期、最早试点年份、高铁开通DID等指标。数据提供.dta和.xlsx格式,可用stata或excel打开。
▪ 数据维度:年度数据
CNDeepData 数据应用质量评级
▪ 常用度:★★★★★
▪ 稀缺度:★★★☆☆
▪ 新颖度:★★★☆☆
▪ 总体级别:11颗星
✔ 常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。
✔ 稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。
✔ 新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。
02 变量计算
参考汪克亮等(2021),邓慧慧等(2020)、卞元超等(2019)根据在 t 年是否开通高铁来赋值,由于部分城市有多个高铁站点,本文以其最早开通站点的年份treat_year作为该城市高铁开通的年份。对于某一城市来说,开通高铁可能包含“经”和“停”两种状态,本文更关注于“停”。因此,本数据所识别的是否开通高铁的依据是该地级市是否具有高铁站( 包含停靠高铁列车的普通车站等) 。
首先,依据 DID 模型设立的基本原则,设立了两个虚拟变量: 一是组别虚拟变量 treat,本文将高铁开通的试点城市的treat 定义为 1,其他城市定义为0,来描述处理组和控制组之间的差异; 二是时间虚拟变量time,本文将高铁开通之后年份的 time 定义为 1,开通高铁前的年份定义为 0,用以区分高铁开通前后的差异。两个虚拟变量的交互项 treat × time 用 DID 表示,是表示高铁开通的核心解释变量。
▪ 文献来源:
文章通过理论分析,探讨了高铁开通影响区域创新活动以及区域创新差距的内在机制,进而以是否开通高铁为“准自然实验”,采用 2004 年 - 2015 年中国 287 个地级市的数据,实证分析了高铁开通对区域创新及其差距的影响效应。研究发现,考察期内,高铁开通显著提升了区域创新水平,其机制主要在于高铁开通后所引发的创新要素流动效应; 高铁开通能够对区域创新差距产生重要影响: 即相对于未开通高铁的城市来说,开通高铁城市的创新能力和创新速度持续提升,这能够进一步拉大区域之间的创新差距; 且高铁开通在促进区域创新过程中也存在着显著的时间动态效应。分地区估计结果显示,高铁开通能够促进东部地区城市创新活动的开展,也拉大了其内在的创新差距; 而由于高铁开通所引发的人才流失,高铁开通对中部和西部地区创新活动及其差距的影响效应不显著。文章研究结论可能为优化中国区域创新格局、促进创新型国家建设提供启示。
1. 因变量: 区域创新
本文研究中的区域创新主要是指科技创新。技术创新产出能够较为直接地衡量一个地区最终的技术创新成果,也反映了该地区技术创新的综合能力,本文亦采用创新产出作为衡量区域创新的指标。目前研究中关于创新产出的衡量指标主要包括新产品销售收入和专利等,前者可能忽视了科技创新的知识创造功能,后者则可以更加直接地体现科技创新的知识成果。因此,本文采用专利指标作为衡量区域创新的最终指标,我们主要通过手动搜索的方式从国家知识产权局网站数据库系统获取了 2004 - 2015 年全国 287 个地级市的专利申请授权数和发明专利申请授权数等相关数据。
2. 核心自变量: 高铁开通
本文对于核心自变量的选取是采用 2004 - 2015 年中国 287 个地级市是否开通高铁的虚拟变量。需要指出的是,第一,关于高铁的研究主要包括“高铁建设”和“高铁开通”两个方面,我们所要考察的是高铁开通后所产生的创新要素流动及其对区域创新活动的影响,因而本文关注的是“高铁开通”。第二,对于某一城市来说,开通高铁可能包含“经”和“停”两种状态,本文更关注于“停”。因此,本文所识别的是否开通高铁的依据是该地级市是否具有高铁站( 包含停靠高铁列车的普通车站等) 。第三,由于部分地级市开通了多条高铁,我们以较早的年份作为该城市开通高铁的日期。第四,在具体的处理过程中,由于中国部分高铁线路的开通是在年末,这些线路开通所产生的知识溢出效应及对区域创新的影响等可能无法在短时间内显现,我们对这些线路所经地级市的高铁开通年份进行了滞后一年处理。
为了进一步降低双向因果关系所导致的内生性估计偏误,本文将进一步采用工具变量法对其控制。关于工具变量的选取,本文选择各地级市的地理坡度指标( Geography) ,依据在于: 第一,地理坡度综合体现了某一地区的地形变化情况,其能够间接衡量高铁修建的成本,平原地区修建高铁的成本要远低于丘陵山地地区,且当前中国的高铁线路和所经地区也主要集中在平原地区,因而地形坡度也是影响是否修建高铁的重要因素,故这一指标满足相关性要求; 第二,地理坡度和地形状况是该地区长期历史中所形成的天然地理条件,是客观存在的( 戴亦一等,2016) ,与当期区域创新活动不直接相关,满足外生性的要求。由于在本文考察期内,地理坡度是一个不随时间变化的量,我们将其乘以每一年度各地级市所在省区开通高铁城市的总数,因为各地级市所在省区开通高铁数量与各地级市是否开通高铁紧密相关,但无法直接影响各地级市的区域创新活动。本文基于中国地理 90 米分辨率数字高程数据,采用 ArcGIS 软件计算获得各地区的地理坡度数据,并采用二阶段最小二乘法( 2SLS) 对模型进行估计。估计结果如表 1 所示。
由表 1 所示的结果可知,考察期内,采用工具变量法的 2SLS 估计结果说明,全国样本中,是否开通高铁对于区域创新活动具有显著的促进作用,且第一阶段估计结果中,工具变量的估计系数显著为正,识别弱工具变量的 Cragg - Donald Wald F 统计量大于 10% 水平的标准值,说明本文所选取的工具变量是有效的。相对于那些尚未开通高铁的城市来说,开通高铁能够显著促进该地区科技创新的发展。高铁开通能够通过要素流动,产生知识溢出,从而有利于区域科技创新活动的开展。分地区的估计结果来看,对于东部地区,高铁开通显著促进了其区域创新活动的开展,即相对于那些未开通高铁的城市,开通高铁的城市具有更高的技术创新水平。东部地区具有更加优越的创新环境,而且当前中国大量的创新城市、创新高地均汇聚于此,高铁的开通进一步强化了这一地区的创新优势,吸引大量的优质创新资源,其也促进了内部生产要素的流动,这都有利于促进该地区科技创新活动的开展。而对于中部和西部地区来说,高铁开通对其区域专利数量的影响效应在10% 水平上仍然不显著,这可能是因为,尽管这些地区高铁的开通能够有助于进一步优化其区域创新环境,促进创新主体之间的交流和互动,但是高铁开通也进一步增强了其创新人才和资本流失的可能性,更多的优质创新要素在高铁开通后能够更加便利地向发达地区进行流动,引发“孔雀东南飞”,从而导致了这些地区创新环境的持续恶化以及创新生产水平的降低。这种正反两方面的影响可能使得高铁开通无法显著地促进中部和西部地区创新活动的开展。
汪克亮,庞素勤,张福琴.高铁开通能提升城市绿色全要素生产率吗?[J].产业经济研究,2021,(03):112-127.
邓慧慧,杨露鑫,潘雪婷.高铁开通能否助力产业结构升级:事实与机制[J].财经研究,2020,46(06):34-48.
卞元超,吴利华,白俊红.高铁开通、要素流动与区域经济差距[J].财贸经济,2018,39(06):147-161.DOI:10.19795/j.cnki.cn11-1166/f.2018.06.012.
以下三种方式三选一即可:
▪ 直接购买
添加客服微信,支付价格为69元。
▪ 朋友圈分享后免费领取(每人限领15份)
持续3小时,集齐5个赞,需要对所有人可见,并且本人关注CNDeepData公众号。
▪ 购买大会员
添加客服微信,购买年度普通会员149元,年度高级会员299元,永久高级会员899元,可享CNDeepData所有数据免费获取。
▪ 朋友圈分享要求:
①分享时间需要在早上7:30到晚上12:30之间。
②请附带一句推荐词,例如“推荐CNDD高质量数据库”。
③请将包含时间内容的截图发给客服。
▪ 添加客服微信方式:
扫描下方二维码,或搜索下方微信号。
1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。
2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。
任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。
中国深度数据库:让精品数据 得以流动
CNDeepData:Let high-quality data flow without barriers
部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001