CNDD-0239 企业经济政策不确定性感知指数及学术论文应用
01 数据介绍 ▪ 关键词:不确定性、企业经济政策不确定性感知 ▪ 数据编号:0239 ▪ 数据名称:企业经济政策不确定性感知指数 ▪ 数据范围:企业层面 ▪ 数据年份:2000-2023 ▪ 样本数量:54,973条 ▪ 数据来源:根据上市公司年报文本分析爬取 ▪ 数据说明:CNDD企业经济政策不确定性感知指数为参考聂辉华等(2020)爬取了上市公司经济政策不确定性感知词数和句数,并计算得到的上市公司经济政策不确定性感知指标。数据提供经济政策不确定性感知的相关词表,并提供.xlsx和.dta两种格式的数据,数据可用excel或stata打开。 ▪ 数据维度:年度数据 ▪ 综合评价:Baker 等( 2016) 的经济政策不确定性指标( EPU) 存在两个问题。第一,EPU 指数是国家层面的,在同一个时间点上对所有企业有且仅有一个观测值,无法区分企业个体面临经济政策不确定性的差异。由于 EPU 指数是时间序列,在研究经济政策不确定性对企业的影响时,无法在面板数据回归模型里加入时间固定效应,因此难以排除其他宏观经济因素对企业的影响。第二,当使用 EPU 指数时,往往假设所有企业对不确定性的感知是同质的。但现实中同一国家内部不同地区、不同行业的经济政策各不相同; 而且个体预期的形成方式多种多样,即使面对完全相同的政策环境,企业的不确定性感知也很难整齐划一。基于以上考虑,聂辉华等(2020)开发一种衡量中国企业个体对经济政策不确定性异质性感受的指标。使用上市公司披露的年报文本,提取指标衡量企业个体面临的经济政策不确定性。
CNDeepData 数据应用质量评级 ▪ 常用度:★★★★★ ▪ 稀缺度:★★★★★ ▪ 新颖度:★★★★☆ ▪ 总体级别:14颗星 ✔ 常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。 ✔ 稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。 ✔ 新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。
02 主要指标
参考聂辉华等(2020),衡量经济政策不确定性的指标从上市公司年报文本中使用文本挖掘方法提取得到。随着计算机技术的发展,把文本等非结构化数据引入公司金融研究的做法越来越普遍( Tetlock,2007; Li,2008; Loughran 和 McDonald,2014、2016) 本文参考 Baker 等( 2016) 和 Hassan 等( 2019) 的做法,使用“词表法”筛选特定的内容文本,在一段文本中如果出现特定词语,就把这段文本识别为表达某些特定含义的文本。本文认为如果一句话中同时出现“政策词语”和“不确定性词语”,就认为这句话是年报撰写人表述公司面临经济政策不确定性的内容。首先通过格式转换工具把每份上市公司年报的 PDF 文件转换成文本文件,使用正则表达式取出“管理层讨论与分析”(Management Discussion and Analysis,简 称MD&A,有些年报中是“董事会报告”)的内容,剔除所有数字、英文字母和除句号以外的所有标点符号和特殊符号。然后,以中文句号为分隔符把 MD&A 文本分割为句子,考虑到中文的语言习惯,本文以句子作为分析的基本单位。假定上市公司 i 在年份 t的年报中 MD&A 句子数量为 Sit,使用编程语言 Python 调用 jieba 分词模块对每个句子进行分词,并在分词的同时剔除停用词。为尽量降低分词带来的歧义,本文在分词时定义了用户词表,词表包括所有 A 股上市公司的全称和简称、会计科目名称、后续文本处理用到的表示不确定性的词语以及与政府(政策) 相关的词语。分词以后每个句子都变成一系列词语的组合,再对每个句子( s) 一进行以下操作: 搜索每个句子中出现的词,如果出现表示不确定性的词,就认为是表示不确定性的句子; 如果一个句子中同时出现政府、政策等内容相关的词和表示不确定性的词,就认为是一个表示政策不确定性的句子( P) 。用经济政策不确定性句子中不确定性词语数量( ns ) 占 MD&A总词语数量( N) 的比例衡量企业面临的经济政策不确定性( FEPU) 。FEPU 的计算如( 1) 式所示,其中 IP ( s) 是示性函数,当 s∈P 时,I= 1; 当 s∉P 时,I= 0。
03 数据概览
▪ 数据年度分布
04 相关参考文献速递
为检验企业感知的经济政策不确定性对企业投资支出的影响,参考 Gulen和 Ion( 2015) 的研究,建立以下回归模型:
被解释变量 Investmentit 表示投资支出,参考付文林和赵永辉( 2014) 、饶品贵等( 2017) 以及谭小芬和张文婧( 2017) 的做法,使用企业当期用于购进固定资产、无形资产和其他长期资产而支付的现金来衡量,并除以资产总额进行标准化。关键解释变量FEPUit是企业面临的经济政策不确定性,即本文从企业年报文本中提取的政策不确定性感知指标。Xit 代表控制变量组,参考既有文献( Blundell 等,1992; Gulen 和 Ion,2015) 的做法,控制变量包括: ( 1) 企业杠杆率,用负债总额与总资产的比值衡量; ( 2)企业成长性,用托宾 Q 值衡量; ( 3) 企业经营状况,用总资产收益率衡量; ( 4) 企业规模,用总资产的对数衡量。τ 代表季度( 时间) 固定效应,用来控制宏观经济环境; δ 代表企业个体固定效应,用来控制不随时间变化的企业特征; εit为残差项。考虑到扰动项的异方差性和序列相关性,使用在公司层面聚类的稳健标准误。
模型( 2) 主要研究经济政策不确定性感知对企业投资行为的影响,回归结果见表 1。第( 1) 列控制时间( 季度) 和企业固定效应,企业不确定性感知的系数为负,并且在 1%的水平上显著,说明经济政策不确定性感知上升会导致企业投资支出下降。需要指出的是,本文使用时间固定效应控制了宏观经济波动的影响,现有类似研究往往使用国家层面的经济政策不确定性指数,无法控制时间固定效应,也就无法区分不确定性因素和宏观经济因素的影响,这是本文的创新之处。第( 2) 列加入其他控制变量,企业不确定性感知的系数仍然显著为负。从经济显著性上看,企业的经济政策不确定性感知指标每上升 1 个标准差( 0. 089) ,投资支出占总资产的比例会下降 0. 097 个百分点( 0. 089 × 0. 011 ×100) 。在全样本中投资支出占总资产的比例为 3. 56%,说明企业的经济政策不确定性感知指标每上升 1 个标准差,企业投资支出降低量相当于投资支出均值的 2. 72%。
见推文末尾。
本数据为高级会员专属数据,添加客服微信,购买年度普通会员149元,年度高级会员299元,永久高级会员899元,可享CNDeepData所有会员数据免费获取。
▪ 客服微信方式:
扫描下方二维码,或搜索下方微信号。
1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。
2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。
任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。
中国深度数据库:让精品数据 得以流动
CNDeepData:Let high-quality data flow without barriers
部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001