CNDD文献复刻 | 人工智能技术、创业生态与新企业进入(免分享)

近年来,中国人工智能技术实现蓬勃发展。具体而言,2022 年中国人工智能核心产业规模超 5000 亿元;全球人工智能企业达 2.7 万家,其中中国人工智能企业 4227 家,占全球比重约为 16%;中 国人工智能专利申请量位居全球首位,2013~2022 年,中国人工智能专利累计申请数占全球总量超 过 50%。这些数据表明,中国不仅在政策上积极推动人工智能发展,也在产业和技术层面具有领 先优势。在此背景下,人工智能技术对就业与增长的影响引起学者们广泛讨论,但鲜有文献关注人 工智能技术对新企业进入的影响,以及这一影响在不同地区和行业层面是否表现出差异性特征。 而行业具有丰富异质性,人工智能技术不但会影响高科技行业中的企业进入,也会影响处于高科技 行业上下游的中低技术行业的企业进入。本文关注的问题是,人工智能作为通用技术(GPTs)之 一,是否能成为激发新企业进入的关键力量?为回答上述问题,本文从创业活动在经济体系中的重 要角色出发,深入探讨人工智能技术对新企业进入的影响效应和作用机理。

01 文献简介

▪ 文献来源:乔刚,钱圆圆.人工智能技术、创业生态与新企业进入[J].数量经济技术经济研究,2025,(8):110-130
▪ 数据与代码来源:《数量经济技术经济研究》编辑部(http://www.jqte.net/)
▪ 关键词:人工智能技术 新企业进入 创业 高质量发展
▪ 主要内容:加快新一轮人工智能发展对于科技创新、产业变革与创业生态优化具有重要意 义。本文基于全国企业工商注册大数据,重点考察人工智能技术对新企业进入的影响。 研究发现,人工智能技术对城市—行业层面新企业进入具有显著促进作用,能够激发地区 创业活力。机制检验表明,人工智能技术有利于优化地区创业生态,即通过提高地区技术 可及性和人才可得性、增加技术与知识溢出,促进创业水平提升。拓展性分析发现,人工 智能在降低行业进入壁垒和信息获取成本方面的重要作用是创业生态优化的最直接表 现。此外,人工智能技术对新企业进入的影响还与地区、行业及企业特征有关,即在人工 智能竞争力与经济发展水平较高地区以及高科技行业的企业创业从人工智能技术中获益 更大,存活时间长的企业、非个体工商户企业以及非国有企业创业受人工智能技术的影响 更明显。本文深刻揭示了人工智能技术在新企业进入中扮演的关键角色,为加快形成新 质生产力和推动高质量发展提供新的启示。
▪创新点:第一,基于城市—行业面板数据,系统评估人工智能技术对企业创业的 影响,拓展新兴技术驱动创业行为的实证研究。本文构建城市—行业维度数据结构,既有利于提高实证估计结果的精确度(Bruno 等, 2013),也能使研究结论与类似规范的创业文献具有可比性,从而弥补当前研究在数据维度与行业 层面识别方面的不足。第二,构建可推广的地区层面人工智能技术与创业指标,弥补人工智能技术 与新企业进入量化测度的局限。第三,识别人工智能技术促进创业的机制路径, 提出“创业生态优化”的作用渠道。本文使用丰富的行业和城市信息,从多个维度考察人工智能技 术驱动创业的内在渠道,揭示创业生态优化是人工智能技术增加创业活动的重要渠道,从优化创业 生态视角补充影响创业的新机制。

02研究方法

▪数据来源与指标构建:

本文选取 2007~2022 年地级市—行业层面新进入企业为研究对象,考察地区人工智能技术发 展对新创企业成立的影响。以 2007 年作为样本起点的原因在于,第一,中国人工智能兴起较晚,直 到 2006 年深度学习算法的出现使得大规模运算成为可能,这是人工智能发展历史上的重大技术突 破,自 2007 年开始,人工智能发展进入新的阶段;第二,根据《2019 年中国人工智能行业市场前景研 究报告》,自 2007 年起,中国人工智能专利申请量显著增长,为利用专利衡量地区人工智能发展水 平提供数据支持。本文使用的人工智能专利数据来源于国家知识产权局;新企业进入数据来自全 国企业工商注册数据库;城市层面变量来自《中国城市统计年鉴》;企业层面数据来源于国泰安数据 库(CSMAR)和中国研究数据服务平台(CNRDS)。

1.人工智能技术指标

 既有研究多采用工业机器人或计算机等 ICT 资本来表征人工智能技术(Beaudry 等,2010;吕越 等,2020;陈东和秦子洋,2022),使用工业机器人和 ICT 资本作为人工智能技术代理变量存在如下 问题:其一,工业机器人仅为人工智能技术应用众多领域之一,且工业机器人主要应用在制造业部 门,因其难以反映人工智能发展水平全貌,可能会低估人工智能技术真实发展水平;其二,计算机等 ICT 技术覆盖范围较为宽泛,人工智能技术仅是 ICT 技术发展和延伸的子集,使用 ICT 资本则难以 准确识别出人工智能技术,从而高估人工智能发展水平。

 通常而言,专利是衡量创新和技术进步的重要指标,能够反映技术投入和技术发展水平。为 精确识别人工智能技术,并将人工智能技术和其他数字技术做出区分,现有文献通常采用文本分 析法,通过检索专利文本中与人工智能相关的关键词来识别人工智能专利(王林辉等,2023;姚加 权等,2024)。Autor 等(2024)基于 1920~2018 年美国颁发的所有实用新型专利的语料库来识别自 动化创新,以考察新出现的工作类别在缓解自动化任务挤出劳动力过程中的作用。类似地,本文 使用人工智能授权专利数量作为人工智能技术的代理变量。首先,根据政府官方文件、人工智能 发展报告以及相关文献,本文整理出与人工智能相关的关键词词典,力求尽可能准确、科学反映人工智能发展水平。其次,根据关键词词典在授权专利文本中检索出人工智能专利,并将所有 识别出的人工智能授权专利在地级市层面加总,用来表征城市人工智能发展水平。为排除反向 因果问题,本文将人工智能授权专利滞后一期,并作加 1 取对数处理(王林辉等,2023;姚加权等, 2024)。

2.新企业进入指标

本文使用全国工商注册数据来识别新注册企业。该数据记录 1949 年以来 2 亿多条新企业注册 或注销信息,包括企业名称、注册时间、营业期限、行业信息、注册地址、注册资本以及企业类型等。 本文将数据加总到城市—行业—年份层面,得到 337 个城市、90 个 2 位码行业的面板数据,涵盖新 注册企业、注销或吊销企业以及现存企业。具体地,本文的被解释变量为新企业进入率,以新注册 企业数量与现存企业总量的比值表示。 

3.控制变量 

为排除城市层面其他因素可能干扰人工智能技术对新企业进入的影响,本文控制城市层面与 人工智能发展相关的部分特征变量。考虑到在回归中直接加入城市—年份控制变量可能会产生 “坏的控制变量”问题(Angrist 和 Pischke,2009),参考封进和李雨婷(2023)、Cui 和 Li(2023),本文在 基准回归中加入基期(2007 年)城市特征变量与时间趋势的交互项,以尽可能避免“坏的控制变量” 问题。基期城市特征变量包括经济发展水平(Pgdp),以城市人均 GDP 的对数值表示;人口密度 (Pop),为城市每平方公里的人口数量;固定资产投资比例(Fix),用城市固定资产投资总额与地区 生 产 总 值 之 比 衡 量 ;产 业 结 构(Stru),即 第 二 产 业 占 地 区 生 产 总 值 的 比 重 ;金 融 发 展 水 平 (Finance),为城市年末金融机构存贷款余额与地区生产总值之比;工业发展水平(Firmnum),采用 规模以上工业企业的对数值表示;数字基础设施建设水平(Internet),以互联网宽带接入用户数的 对数值表示。将上述变量与时间趋势交乘后加入回归方程中,以控制期初城市特征对估计结果可 能产生的影响。

▪模型设定:
为考察人工智能技术对新企业进入的影响,本文利用双向固定效应模型进行研究设计,构建基 准回归方程:

其中,i、j、t 分别表示城市、行业和年份。Entryijt 表示 i 城市 j行业在 t 年的创业活动强度,用新企 业进入率来衡量。为确保估计结果的稳健性,本文还采用每千人新注册企业数量作为被解释变量 重新进行回归;AIit 为城市 i 在第 t 年的人工智能发展水平,以人工智能授权专利表征,β 为本文关注 的估计系数,反映人工智能技术对新企业进入的边际影响,若 β 符号为正,则表明人工智能技术能 够驱动新企业进入;Xi,2007 × T 表示 2007 年控制变量与时间趋势交乘项,包括城市经济发展水平、人 口密度、固定资产投资、产业结构、金融发展水平、工业发展水平以及数字基础设施建设水平;δij 为 城市—行业固定效应,用于控制与进入壁垒和创业决策相关且不随时间变化的城市—行业特征,如地区地理文化因素、行业特定的技术和竞争因素、城市—行业特定的自然优势渠道等;νt 为时间固 定效应;λjt 表示行业—时间固定效应,用来控制行业层面时变特征的影响,诸如行业进入壁垒、竞 争程度和技术水平的变化。以上固定效应旨在消除所有行业在不同城市之间普遍存在的差异,同 时控制影响城市—行业层面新企业进入的不随时间变化因素,从而可以通过城市层面随时间变化 的人工智能技术冲击来解释城市—行业中新企业进入的差异性变化。εijt 为随机扰动项,考虑城 市—行业间的异方差问题,本文将回归标准误聚类到城市—行业水平上。

03 数据与代码

▪ 文章及代码原网址:《数量经济技术经济研究》编辑部(http://www.jqte.net/) 
▪ 数据详情:      

 

 ▪ 获取方式:关注本微信公众号,输入“rgcy”,即可获得。

04 实证结果

表 1 报告人工智能技术对新企业进入的影响。为排除反向因果的干扰,本文采用滞后一期的 人工智能授权专利对数来表征城市人工智能发展水平;为保证估计结果的稳健性,第(3)列也汇报 运用当期人工智能授权专利对数的估计结果。第(1)~(3)列将稳健标准误聚类在城市—行业层面, 第(4)列将标准误聚类到更高维度的省份水平上。其中第(1)列包括核心解释变量(LagAI)、基期城 市特征变量与时间趋势的交互项、时间固定效应以及城市—行业固定效应,结果显示,人工智能技 术的估计系数在 1% 水平上显著为正。第(2)列进一步加入行业—年份固定效应,以控制行业层面 时变特征对估计结果的影响,如行业进入壁垒和技术水平的变化等。不难发现,在控制行业—时间 固定效应后,LagAI 的系数为 0.002,且在 1% 水平上显著,表明在考虑诸多因素影响后,人工智能技 术对新企业进入的促进作用是真实存在的。同时人工智能技术的估计系数基本保持不变,也说明 本文潜在的遗漏变量问题不严重,计量回归模型构建较为合理。第(3)列报告使用当期人工智能技 术指标作为核心解释变量的回归结果。第(4)列汇报使用省份层面稳健聚类标准误的估计结果,人 工智能技术的系数均未发生明显变化。上述结果表明人工智能技术对新企业进入的显著促进作用 是稳健的,证实人工智能技术在激发地区创业活力过程中发挥着积极作用,这将赋能城市经济高质 量发展。

 

05 获取方式

见推文末尾。

或长按扫描下方二维码(客服工作时间为每天9:00—22:00),关注本微信公众号,在对话框输入“sjcz”,即可获得文章原文、复刻数据与代码。(数据和代码仅供参考)

客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:

DeepData001

获取更多更新数据

版权声明 …

1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。

中国深度数据库:让精品数据 得以流动

CNDeepData:Let high-quality data flow without barriers

资源下载此资源仅限注册用户下载,请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部