CNDD-0284 上市公司董事长致辞特质性信息文本指标及学术论文应用

01 数据介绍

▪ 数据名称: 董事长致辞、特质性信息文本

数据编号:0284

▪ 数据层级:A股上市公司层面

▪ 数据范围:2016-2023年

▪ 样本数量:1,189条

▪ 数据来源:根据上市公司每年董事长致辞文本爬取

▪ 数据说明: CNDD上市公司董事长致辞特质性信息文本数据参考伊志宏等(2019),统计了上市公司董事长致辞文本中含有“特质性词典”相关的词频指标。数据提供.xlsx和.dta两种格式,可用stata或excel打开。

▪ 数据维度:年度数据

▪ 数据介绍:在词典的选取上,特质性词典集借鉴伊志宏等(2019), 公司特质信息定义为“与公司战略、市场地位、产品、技术、销售、项目投资、融资策略、会计业绩、高管团队、公司治理、供应商、经销商、公司风险等各方面信息相关的信息”。本文采取人工标注加机器学习的方法对分析师报告中的公司特质信息进行判别,人工判断某一信息是否为“公司特质信息”的依据在于这一信息只对分析师跟踪的该企业产生影响还是对行业内所有公司产生影响。比如,某航空公司的研究报告中“2015 年夏秋计划航班增速明显收窄,三大航票价上行确立”这一信息中,航空业航班增速预期不仅影响该公司营收,同时也影响其他航空公司,因此应归类于非公司特质信息。而“上海港已连续数年蝉联国际集装箱港吞吐量第一,但从结构来看,中转箱占比始终低于其他国际大港如新加坡、釜山、香港”这一句子客观描述了上海港这一企业经营现状, 不影响其他公司经营状况, 应归类到公司特质信息。在人工标注 1500 份报告后采用机器学习方法对全部样本进行分类,得到任意股票 i 第 t 年第j 份分析师报告公司特质信息句子数量 (Co_Number i , t , j ) 和非公司特质信息句子数量(NCo_Numberi,t,j ) 。然后,计算出每一支股票 i 第 t 年第 j 份分析师报告中公司特质信息句子数量占全部句子数量的比例(CoRatioi,t,j ):

    最终,以公司—年度为标准,对股票 i 第 t 年所有的分析师报告中公司特质信息句子所占比例平均后得到每一公司年度内分析师报告公司特质信息含量的平均值 AVG_CORATIO。

      其中 n 为股票 i 第 t 年所有分析师发布的研究报告数量

CNDeepData 数据应用质量评级

 常用度:★★

▪ 稀缺度:★★

▪ 新颖度:★★★

▪ 总体级别:13颗星

  常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。

✔  稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。

  新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。

02 变量说明    

03 数据概览

▪  变量分布

04 前沿文献速递

▪ 文献来源

伊志宏,杨圣之,陈钦源.分析师能降低股价同步性吗——基于研究报告文本分析的实证研究[J].中国工业经济,2019,(01):156-173.

▪ 文献内容
股价同步性是衡量股票市场资源配置效率的重要指标。 党的十九大报告提出,要“增强金融服务实体经济能力”。 在这一要求下,探索如何降低股价同步性,提升金融市场合理配置资源的能力具有重要意义。 本文借助支持向量机的文本分类方法,通过机器学习度量了 2009—2015 年中国 A 股上市公司的分析师研究报告中公司特质信息,研究证券分析师报告内容对股价同步性的影响。 研究发现, 分析师报告中公司特质信息含量越高,所关注公司的股价同步性越低;当公司所面临的信息不对称问题更加严重、分析师报告影响力更大时,这一负向关系更加显著;进一步研究发现,分析师的能力越强,研究报告中公司特质信息含量越丰富,其盈余预测准确性也更高;分析师降低股价同步性的机制是因为公司特质信息含量高的报告更受投资者关注,能引起更强烈的市场反应,使得股价更多地吸收公司特质信息。 以上主要发现在控制样本选择偏差、变更主要变量衡量方式、变换实证模型后依然稳健。 本文首次在对分析师报告进行信息分类的基础上,研究分析师传递的具体信息对股价同步性的影响,不仅丰富了股价同步性影响因素的研究,同时从公司特质信息的角度丰富了分析师报告信息含量的研究,具有重要的理论与实践意义。
▪ 模型设计与变量说明

本文采用模型(5)验证分析师报告中公司特质信息含量与股价同步性之间的关系:

模型中,SYNCHi,t 衡量了股票 i 第 t 年的股价同步性,AVG_CORATIOi,t 衡量了股票 i 第 t 年所有分析师研报中公司特质信息含量的平均值
▪ 计算结果

本文首先采用模型(5)实证检验了分析师报告中公司特质信息含量与股价同步性之间的关系,回归结果见表 2。可以看出,AVG_CORATIO 变量的回归系数在 1%的水平上显著为负,这表明随着分析师报告中公司特质信息的增多,股价同步性降低。

05 其他相关文献

 刘会芹,杨翟婷,施先旺.年报特质性信息与机构投资者持股决策[J].证券市场导报,2024,(08):48-57. 

 潘璐璐,谭睿鹏,黄顺武.多元化战略与信息披露违规——基于年报业务段特质性信息的视角[J].会计研究,2023,(05):33-48. 

 朱琳,陈妍羽,伊志宏.分析师报告负面信息披露与股价特质性波动——基于文本分析的研究[J].南开管理评论,2023,26(03):75-87. 

06 获取方式

见推文末尾。

本数据为会员专属数据。添加客服微信,购买年度高级会员299元,永久高级会员899元,可享CNDeepData所有数据免费获取。

客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:

DeepData001

获取更多更新数据

版权声明 …

1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。

中国深度数据库:让精品数据 得以流动

CNDeepData:Let high-quality data flow without barriers

资源下载此资源下载价格为99积分(年度普通会员免费),请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部