CNDD-0084 2005年全国1%人口抽样调查数据(百万级观测值)

01 数据介绍
▪ 关键词:人口抽样调查数据子样本
▪ 数据编号0084
▪ 数据名称:2005年全国 1% 人口抽样调查数据
▪ 数据区间:2005年
▪ 样本数量:2,585,481条
▪ 数据来源:国家统计局
▪ 数据说明:2005年中国1%人口抽样调查在全国各县(市、区)抽取约6万个调查小区,调查对象为小区的全部人口。调查内容主要包括住户的基本情况和个人的年龄、性别、受教育程度、职业、迁移流动、生育、社会保障、住房情况等指标。 
▪ 数据维度时点数据
▪ 综合评价经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这次调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、多阶段、整群概率比例的抽样方法。最终样本单位为调查小区。数据提供Stata13、14版本文件,dta数据大小为305M,数据已进行初步处理。另附县及县以上行政区划代码、调查明细表以及2005年1%人口抽样调查行、职业编码等资料。
CNDeepData 数据应用质量评级

▪ 常用度:★★★

▪ 稀缺度:★★★

▪ 新颖度:★★★

▪ 总体级别:12颗星

  常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。

✔  稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。

  新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。

02 主要指标

图片

03 数据特征概览
▪ 数据概览  

图片

▪ 数据获取内容

图片

04 前沿文献速递

▪ 文献来源

 倪鹏途,陆铭.市场准入与“大众创业”:基于微观数据的经验研究[J].世界经济,2016,39(04):3-21. 
▪ 文献内容:
文章利用2005年全国1%人口抽样调查的子样本以及CFPS2010数据研究了城市层面市场结构对创业的影响,结果发现:国企占比高对创业活动存在显著的抑制作用,而这一负面影响在服务业(特别是消费性服务业)中表现得更为明显。在不同受教育水平的人群中,国有控股企业占比对受教育水平高的群体创业影响更大,但并没有发现在国企占比高的行业中,雇员工资水平和创业之间存在替代作用。同时,文章构建了20世纪90年代国企”抓大放小”政策之后的”新国企比重”指标,结果表明”新国企比重”高的城市,国企占比高对于创业的抑制作用更强。最后,我们还发现地区市场潜力的优势并没有缓解国企占比对于创业的抑制作用。因此,放宽市场准入,尤其是在服务业放宽市场准入,才能形成”大众创业”的政策环境。
▪ 研究设计与相关数据应用:
文章使用的个人层面数据是 2005 年全国 1% 人口抽样调查数据中的一个子样本。文章仅研究城市的创业活动,核心的国有企业占比指标也是在城市和行业层面度量的,因此农村居民的样本被剔除。考虑到少数民族自治地区的特殊性,这些样本也被删除。同时,文章考察的是居民的职业选择,也删除了非劳动年龄人口和未工作人口样本,根据 2005 年全国 1% 人口抽样调查问卷,删除了 15 周岁以下的样本和 15 周岁以上但在当年 10 月 25-31 日没有为取得收入而从事 1 小时以上劳动的样本,即排除学龄前儿童、在校学习、丧失劳动能力、离退休、料理家务、毕业后未工作、因单位原因失去原工作、因个人原因失去原工作、承包土地被征用的样本,最终研究的样本为雇员、雇主、自营劳动者和家庭帮工这四种就业身份的城市居民。
文章使用的行业层面数据是 2004 和 2008 年经济普查数据。2004 年数据包含制造业企业,而 2008 年数据涵盖的是服务业企业。使用上述数据可以对全部制造业和服务业企业的城市行业特征进行刻画。同时,将这些行业数据与 2005 年全国 1% 人口抽样调查数据中的行业二位码相匹配。为了减轻城市创业活动反过来对城市经济发展、人力资本水平等特征变量发生的影响,文章所使用的城市层面数据是 2000 年度数据。城市平均教育年限是根据 2000 年人口普查数据中的个人教育年限计算而得; 其他城市特征变量来自于 2001 年《中国城市统计年鉴》。最终研究的样本是个人、行业和城市层面匹配的结果,整合后的样本占全部城镇居民样本的 36. 75% 。

为了考察行业内企业平均规模、市场垄断程度、国有控股企业比例与创业活动之 间的关系,本文建立了如下 Probit 计量模型:

图片

其中,下标 i、j 和 k 表示个人 i 在行业 j 工作,居住在城市 k。行业 j 以 2005 年全 国 1% 人口抽样调查数据中 2 位数行业代码来表示。“创业ijk”为个人是否创业的哑变 量,1 表示个人创业,0 表示否。根据 2005 年全国 1% 抽样调查数据中的就业身份为雇员、雇主、自营劳动者和家庭帮工,文章使用两种创业的定义: 一是广义上,用雇主和自营 劳动者的就业身份代表个人创业; 二是狭义上,用雇主的就业身份代表个人创业。“企业规模jk”表示城市 k 行业 j 中企业平均规模的对数,以该城市具体行业的企 业平均就业人数的对数表示; “市场集中度jk”表示城市 k 行业 j 的市场结构,以赫芬达尔-赫希曼指数度量:

图片

其中,Xa 代表企业 a 的规模,即企业 a 的就业人数; X 代表企业 a 所在行业的总 模,sa = Xa /X 代表企业 a 在行业中的规模占有率,hhi 越大表明市场集中度越高,行业的市场垄断程度越高; “国有控股企业比例jk”表示在城市 k 行业 j 中国有控股企业在该城市相应行业总企业数中所占比例,以此度量国有企业行业垄断程度。在回归分析中使用的是带有% 单位的数值。由于行政性垄断由政府的强制行政力形成,政府通过赋予国有控股企业特权实现过度保护,该指标可用于表示行政性垄断的程度。同时使用城市 k 行业 j 中国有控股企业营业收入在行业中所占比例作为稳健性检验。本文同时控制了一系列的个人特征变量、城市特征变量以及行业和省份固定效应,增强检验结果的可靠性。“个人ijk”是一系列个人变量,具体分为: (1) “个人教育”,即个人受教育年限; (2) “本地户籍”,即具有本地还是外地户籍,使用哑变量进行表示,具有本地户籍的为 1; (3) “工作经验”,以“个人年龄-个人受教育年限 - 6”来度量; (4) “男性”,以哑变量表示的 性别,男性样本为 1; (5) 个人婚姻状况,有单身、已婚、离异、丧偶等情况,以一组哑变量 表示,将单身作为对照组。(6) “少数民族”,以哑变量表示,少数民族样本为 1。

同时,文章也控制了一组城市变量“城市k”,具体包括: (1) “城市教育”,以个人受教育年限的平均值表示; (2) “工资”表示城市职工平均工资的对数,该变量代表本地区的经济发展水平,由于在统计年鉴中城市级的人均 GDP 数据不准确,因此使用职工平均工 资来度量经济发展水平; (3) “三产”,即第三产业在 GDP 中的占比,表示地区第三产业的发展情况; (4) “政府支出”度量政府支出占 GDP 的比重,该变量是为了控制政府干预程度对创业的影响; (5) “就业密度”,以二、三产业的就业人数与城市建成区面积的比例表示; (6) “外商直接投资”代表人均外商直接投资,用来衡量地区的外商直接投资水平。

▪ 实证结果:

表 2 的回归结果(1) 列示了基本的 Probit 模型估计结果,以雇主和自营劳动者表 示企业家,系数代表边际效应。与 Glaeser 等( 2010) 的基本结论一致,在中国,城市行业内企业平均规模与市场集中程度显著负向作用于创业活动。

图片

由表 2 的回归结果(1) 可知,在加入城市行业内国有企业比例与行业、省份固定效应后,城市行业内企业平均规模与市场集中程度对创业的负向作用不断减弱,这表明在行业和地区层面,个人成为企业家不仅受行业中企业平均规模、市场集中程度影响,行业的所有制结构以及行业、地区特征也会对创业活动产生显著作用,行业内以及同一省份中企业规模越大、市场集中程度与国有控股企业比重越高对创业的抑制效果就越强。需要强调的是,在表 2 第(1) 组第 2 列的基础上加入国有企业比例之后,市场集中度的系数明显下降,这表明,垄断对创业活动的阻碍与国有企业比例高度相关, 这种垄断表现为行政性垄断。

此外,表 2 的回归结果(1) 表明,在个人特征中,本地户籍居民相对于外来居民更 不可能创业。在文章所研究的样本里,本地居民中以雇主表示的企业家占比 4. 13% , 而外来居民中企业家占比 6. 45% ,大于本地居民的企业家占比,这很可能是由于户籍歧视,尤其是大城市的户口限制政策,导致外来人口相比本地居民的工作机会减少, 从而外地户籍居民更倾向于创业。另一种可能是,更具有创业精神的人群更可能在城市间流动。无论是哪一种可能性都说明,外来人口是城市创业活力的重要来源。此外,男性相比女性更有可能成为企业家。如表 2 第( 1) 组回归所示,个人受教育水平越高,被企业雇用的可能性越大。

由于文章使用的服务业微观数据是 2008 年的经济普查数据,而个人创业数据为 2005 年全国 1% 人口抽样调查数据,这种做法实际上假设了地区-行业指标在几年间变化不大,但是,时间上的“倒挂”的确可能带来内生性问题,如地区创业氛围浓厚会使该地区私营企业和中小企业更多,从而国有企业占比和市场集中度下降。因此,文章也使用了 2010 年中国家庭动态跟踪调查( China Family Panel Studies,简称 CFPS) 数据进行验证,减少反向因果可能导致的内生性估计偏误( 见表 2 第(2) 组回 归) 。与主体 Probit 模型一致,在 CFPS2010 数据中,企业家群体的定义为私营业主和个体经营户。由于 CFPS2010 数据中行业的划分比经济普查数据的行业更粗,因此使用的企业规模、市场集中度以及国有控股企业比例这 3 个变量是根据 2004 和 2008 年 经济普查数据计算的城市层面变量,从而与 CFPS2010 数据中的城市进行匹配。由表 2 的第( 2) 组回归结果可知,核心变量国有控股企业比例的系数符号不变,但是,由于该变量是城市级指标,变异度小,在控制了行业和省份固定效应后,国有控股企业比重的系数不再显著,其他控制变量的符号和显著性略有差异。

05 其他相关文献
[1]赵西亮.农民工与城市工资——来自中国内部移民的证据[J].经济学(季刊),2018,17(03):969-994.
[2]罗楚亮,王亚柯.城镇居民的住房贫困——基于2000年与2005年人口调查数据的经验研究[J].经济学动态,2013(09):95-103.
[3]王宗萍,段成荣,杨舸.我国农民工随迁子女状况研究——基于2005年全国1%人口抽样调查数据的分析[J].中国软科学,2010(09):16-24+32.
06 获取方式
见推文末尾,此数据仅限永久高级会员下载。
▪ 添加客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:DeepData001获取更多更新数据

图片
图片
往期已推送数据
CNDD 已推送数据列表及业务介绍
CNDD 全国各地区儒家文化变量数据合集
CNDD 中国上市公司创新变量数据合集(全网最全)
CNDD 中国银行业数据合集
CNDD 中国债券市场研究数据合集
版权声明 …
1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。
数据授权使用说明 …
任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。
图片
中国深度数据库:让精品数据 得以流动CNDeepData:Let high-quality data flow without barriers
资源下载此资源仅限年度高级会员下载,请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部