CNDD文献复刻 | 数字技术与企业出口质量升级(免分享)

贸易是畅通国内国际双循环的关键枢纽。当前,以人工智能、大数据、云计算为代表的数字技术加速创新,不断融合渗透实体经济,成为支撑外贸转型升级的重要动能。2021年 11 月,商务部印发《“十四五”对外贸易高质量发展规划》,强调加快贸易全链条数字化赋能、推动贸易主体数字化转型,以“数字强贸”重点工程建设支撑贸易高质量发展。党的二十大报告也指出,加快建设制造强国、质量强国、贸易强国和数字中国,构建新一代信息技术、人工智能等新的增长引擎,促进数字经济和实体经济深度融合。那么,企业出口质量升级作为贸易强国建设中的重要一环,是否会受到数字技术的影响?如果数字技术有利于出口质量升级,其背后的异质性因素与作用机制又有哪些?深入探讨上述问题在以贸易高质量发展服务构建新发展格局、推进中国式现代化的进程中具有时代意义。

01 文献简介

▪ 文献来源黄先海,王瀚迪,孙涌铭等.数字技术与企业出口质量升级——来自专利文本机器学习的证据[J].数量经济技术经济研究,2023,40(12):69-89. 
▪ 数据与代码来源:《数量经济技术经济研究》编辑部 (jqte.net)
▪ 关键词::数字技术;出口质量;创造性破坏;服务化转型
▪ 主要内容:数字技术是支撑贸易数字化的重要基础,已逐渐成为新发展格局下推进贸易强国建设的强劲动能。本文基于 2007~2015 年中国制造业上市公司申请的数字技术领域专利文本,运用机器学习方法测算数字技术专利的创新度指标,进而考察了异质性数字技术对企业出口质量的影响及作用机制。研究发现,应用数字技术能显著促进企业出口质量升级;上述促进作用主要由高创新度的颠覆性数字技术引起,低创新度的渐进性数字技术对出口质量无显著影响;颠覆性数字技术通过优化生产经营效率、促进服务化转型和加速创造性破坏三方面机制作用于企业出口质量。本文研究结论提供了数字技术赋能贸易高质量发展的微观层面经验证据,为进一步提升贸易数字化水平、推进数字强贸工程建设提供了参考。
▪ 创新点:(1)在研究视角上,不同于已有文献大多关注企业推进数字化转型对出口升级的作用,文章侧重于探讨企业内源性的数字技术创新对出口质量的影响效应。(2)在指标测度上,相比于目前国内学者普遍采用上市公司年报文本中的数字化关键词词频衡量企业数字化水平的做法,文章基于企业申请专利的技术领域信息识别出数字专利,从而对企业的数字技术创新水平进行更为科学的测度。(3在机制分析上,区别于现有研究从整体上考察企业数字化对出口质量的影响机制并且侧重强调数字技术的积极作用,文章在利用机器学习方法测度专利创新度的基础上深入探讨了异质性数字技术对企业出口升级的差异化影响路径。
▪ CNDD相关数据推荐:
 CNDD-0048 1990-2022年上市公司数字经济创新数据(附Stata处理代码) 
02 研究模型与变量设计

▪ 样本选择:

本文选取 2007~2015 年中国 A 股制造业上市公司作为研究样本。企业基本信息与财务数据来源于国泰安数据库,我们对其中带有 ST 标识以及关键变量缺失的公司样本进行了剔除。企业出口数据来源于中国海关数据库,本文参考施炳展和邵文波(2014)的做法剔除了干扰样本。企业申请专利的详细信息来源于中国专利数据库。本文匹配上述数据库的大致流程如下:第一,处理企业原始名称。本文借鉴寇宗来和刘学悦(2020)的方法处理各数据库的企业原始名称并得到企业全称与企业简称。第二,匹配上市公司与海关数据。首先基于上市公司及其控股子公司的企业全称精确匹配海关出口数据,再将两个数据库中未匹配上的样本基于企业简称做精确匹配,然后合并企业全称和企业简称的匹配结果。第三,匹配专利数据库。基于步骤(2)的匹配结果同样根据企业全称、企业简称依次精确匹配专利数据。第四,按年度加总上市公司与子公司的出口、专利信息,最终得到的合并数据为1252 家上市公司共计 6724 条企业-年份观测值。本文对连续变量均进行上下 1%的缩尾处理。

▪ 模型设计:

为考察数字技术应用对企业出口质量的影响,本文设定基准模型为:

其中,Qualityft表示企业𝑓在第𝑡年的出口质量。Digitalft、Digital_Rft和 Digital_Ift分别表示企业对全部数字技术、颠覆性数字技术以及渐进性数字技术的应用程度,以相应的数字专利数应用反双曲正弦变换衡量。X 为控制变量集合,企业层面的变量包括:企业规模(Size),期末总资产取对数;资产负债率(Leverage),期末总负债除以期末总资产;盈利能力(ROA),净利润除以期末总资产;实际税率(Tax),所得税除以税前利润;企业绩效(TobinQ),市值除以期末总资产;企业年龄(Age),企业存续年限的对数值;资本劳动比(KL),期末总资产除以员工数;大股东持股(TopHold),第一大股东持股比例;补贴收入(Subsidy),政府补助金额取对数。地区层面的变量包括:经济发展(pGDP), 所在地级市的人均 GDP 对数值;劳动力成本(Wage),所在地级市的平均工资对数值;人力资源(HR),所在地级市的劳动力人口对数值。行业层面的控制变量为竞争程度(HHI),基于工业企业数据库计算 2位码制造业的赫芬达尔指数。θf 和θt分别表示企业与年度固定效应。εft是随机误差项。
▪ 变量测算:
1.数字技术:本文关注的核心解释变量是企业的数字技术应用程度,它并非一个具有客观衡量标准的概念。目前研究企业数字化的相关文献大多采用企业年报文本中数字技术关键词的出现次数衡量数字技术应用程度(吴非等,2021;张叶青等,2021),但年报文本信息存在被企业主观操纵和自我包装的可能,其中包含的数字技术关键词可能是企业为了迎合市场、吸引投资而采取的策略性披露,无法反应其真实的数字技术水平。本文借鉴 Trefler 和 Sun(2022)的研究,采用企业当年申请的数字技术相关领域的发明专利数量衡量其数字技术应用程度。这种衡量方式主要基于以下考虑:首先,专利行为反映了企业的技术发展方向,企业申请的数字相关专利数量较多表明其在数字领域取得较大技术进步;其次,只考虑发明专利申请量的原因是发明专利需要经过严格的实质审查,相较于实用新型与外观设计专利而言其创新程度更高,更能反映企业的数字技术成果;最后,与授权量相比,数字专利申请量更接近企业当年的数字技术创新水平。本文借鉴黄先海和王瀚迪(2022)的方法对数字技术专利进行识别,根据国家知识产权局发布的《战略性新兴产业分类与国际专利分类参照关系表(2021)》,将属于云计算、大数据、物联网、工业互联网、区块链、人工智能、虚拟现实、增强现实等数字技术产业对应 IPC 的专利识别为数字专利。为了缓解专利数据的偏态分布问题对估计系数的影响,本文将企业当年申请的数字发明专利数应用反双曲正弦变换后作为核心解释变量数字技术(Digital)的衡量。 
2.颠覆性数字技术与渐进性数字技术:理论分析部分指出,数字技术的创新度差异会影响其对企业出口质量的效果。本文运用自然语言处理技术测算了专利的创新度指标,从而对颠覆性数字技术专利和渐进性数字技术专利进行识别。具体而言,首先,本文提取了 1985~2019 年间中国全部数字技术领域的发明专利摘要文本并使用 python 进行分词。与新闻、博客等文本语料不同的是,专利文本包含大量特定技术领域的专业名词,而常规的中文分词词库对这些专业性词汇的覆盖不足,将极大影响分词的准确度。因此,本文在通用词典中进一步补充了数字技术关键词库以及与其相关度较高的电子、机械、数学、物理、计算机和软件等领域的术语词库①,实现了对专利文本的精确分词。第二步,将分词后的百余万条数字专利摘要文本作为语料库,使用 word2vec 模型进行无监督式机器学习训练,该模型主要通过词语间的位置关系分析语义,从而将包含所有词的高维向量空间降维至一个低维数的向量空间。第三步,基于训练后的模型将每条专利文本向量化,从而能够计算两两专利之间的向量距离,即相似度。最后,一项专利的创新度(Innovativeness)被定义为其与前五年内所有专利的平均语义相似度取倒数后的自然对数值。

其中,i、j 代表专利,t 代表年份, Bt 代表前五年内(即 t-5 至 t-1 年)的所有专利集合,ρij 是两专利间的语义相似度,N 代表专利数量。Innovativeness 取值越大,反映一项专利技术的文本表达中对已有专利的重复较少,而原创性的创新内容较多,即创新度越高。借鉴 Kelly等(2021)的做法,本文将全部数字专利中创新度位于前 10%的专利识别为颠覆性数字专利,其余专利识别为渐进性数字专利。相应地,本文将企业当年申请的颠覆性数字专利、渐进性数字专利数量分别应用反双曲正弦变换后作为变量颠覆性数字技术(Digital_R)与渐进性数字技术(Digital_I)的衡量。
3.企业出口质量:本文借鉴 Khandelwal 等(2013)的研究测算企业出口质量,考虑如下回归方程:

其中,f、h、g、t 分别代表企业、HS8 位码产品、出口目的国以及年份,qfhgt和 pfhgt分别表示出口数量与价格,σ为替代弹性,借鉴 Fan 等(2015)的研究根据不同 HS2 位码分行业赋值,αh为产品固定效应,αgt为出口目的国与年份联合固定效应。根据(2)式的估计结果得到的残差,产品 h 的出口质量可表示为 qualityfhgt=̂fhgt/(-1)。在此基础上,进一步根据每一 HS8 位码下 qualityfhgt的最大值与最小值进行标准化处理,再以出口额为权重将标准化后的产品质量加总至企业-年度层面,得到核心因变量企业出口质量(Quality)。

03 数据与代码

▪ 文章原网址:《数量经济技术经济研究》编辑部 http://www.jqte.net/
▪ 数据详情:

04 实证结果

表 1 中的第(1)~(3)列为基准模型式(3)逐步引入控制变量和固定效应的估计结果,各列结果中核心解释变量 Digital 的估计系数均显著为正,表明企业应用数字技术对自身出口质量升级发挥了正向的促进作用。第(4)~(6)列进一步区分企业所应用数字技术的创新度异质性,其中,Digital_R 的系数均显著为正,而 Digital_I 的估计系数在统计上不显著,说明只有创新度较高的颠覆性数字技术能够发挥出口质量升级作用。从估计结果的经济意义来看,以第(3)、(6)列为例,掌握一项数字创新专利的企业相比未应用数字技术的企业在出口质量上平均高出约 1.0%(ln(1+√2)×0.006/0.497),而掌握一项颠覆性数字专利的企业相比不具有颠覆性数字专利的企业在出口质量上平均而言高出 1.3%(ln(1+√2)×0.007/0.497),这说明了数字技术对企业出口质量的显著经济意义,特别是颠覆性数字技术具有更为突出的影响。

在基准回归中,高校固定效应控制了高校不随时间变化,同时影响考生选择的特征,例如高校风气与地理区位等。年份固定效应控制了考生报考面临的不随高校地区变化的特征例如全国层面的高考政策。在城市 -招生地固定效应中,城市为高校所在城市:招生地为高校招生省市,即考生所在省市。这样城市 -招生地固定效应控制了考生所在省市与目标城市之间非时变特征,如距离、文化差异和气候环境差异等。这些因素是考生报考时的重要参考依据,例如较远的距离,以及较大的文化差异和气候环境差异,可能会降低考生报考兴趣。本文将在稳健性检验中控制更为严格的固定效应,结果稳健。

     

05 获取方式

见推文末尾。

客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:

DeepData001

获取更多更新数据

版权声明 …

1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。

中国深度数据库:让精品数据 得以流动

CNDeepData:Let high-quality data flow without barriers

资源下载此资源仅限注册用户下载,请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部