CNDD-0089 2006-2021年上市公司社会责任报告可读性数据学术论文应用

01 数据介绍

▪ 关键词:上市公司社会责任报告 
▪ 数据编号0089
▪ 数据名称:上市公司社会责任报告可读性数据
▪ 数据区间:可读性文本信息2006-2021年;可读性计算指标2006-2020年
▪ 样本数量:可读性文本信息9,196条;可读性计算指标8,539条
▪ 数据来源:上市公司历年社会责任报告
▪ 数据说明:上市公司社会责任报告可读性数据是从上市公司社会责任报告中爬取的。数据指标涵盖证券代码、证券简称、文本序号、统计日期、会计年度、文本类型、总字数1、总字数2、总词数1、总词数2、专业词密度、句子数、分句中的平均字数、副词和连词的比例、每一千字中常用字字数(个)、每一千字中次常用字字数(个)、可读性等指标。
▪ 数据维度企业层面
▪ 综合评价近年来,社会责任报告备受关注,但因其披露的内容、形式无统一标准,使得报告的语言特征和表现形式各异,最终影响投资者的判断。企业披露非财务信息大部分通过社会责任报告,其可读性会通过不同的信息加工方式和属性框架效应对投资者判断产生重要的影响。在此背景下,CNDD推出依照上市公司社会责任报告可读性,以期为社会责任报告可读性具体影响的相关研究提供数据支持。
 

CNDeepData 数据应用质量评级

 常用度:★★★

▪ 稀缺度:★★★

▪ 新颖度:★★★

▪ 总体级别:13颗星

  常用度:是数据市场中需求指标,是指该数据在经济管理类学术论文中使用频率。

✔  稀缺度:是数据市场中供给指标,是指该数据在其他数据库的出现频率。

  新颖度:是数据市场中生成指标,是指该数据在生成时方法新颖程度和工作量。

02 主要指标

可读性指标构建方法:

Shin, Donghyuk, et al. (2020) 使用基于word2vec神经网络语言模型,构建了一个文本可读性指数。其原理是假设文本中句子相互独立,并考虑句中词汇的前后搭配顺序,将文本中各个句子生成概率乘积的对数似然的均值,其计算公式为: 
其中,Ps表示句子s生成的概率,N表示构成文本的句子数。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本越容易被理解,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本越不容易被理解,文本可读性越差。

03 数据特征概览

▪ 数据概览  
(1)可读性文本信息

(2)可读性计算指标

04 前沿文献速递

▪ 文献来源

黄珺,徐莹莹.女性高管对企业社会责任报告可读性的影响研究[J].经济与管理评论,2021,37(01):114-124.

▪ 文献内容

高管团队成员个体特质对企业信息披露质量具有重要影响。以2014-2018年A股上市公司为样本,文章从企业社会责任信息形式质量的角度出发,考察女性高管对企业社会责任报告可读性的影响,并对企业社会责任报告可读性的经济后果进行验证。研究发现女性高管对企业社会责任报告可读性有显著的正向影响,进一步分析认为在自愿披露CSR报告和媒体关注度低的企业中女性高管对企业社会责任报告可读性的改善作用更为明显,并且社会责任报告可读性有助于企业价值提升。

▪ 相关数据应用——CSR 报告可读性指标衡量 
可读性又称易读性、易懂性。综合现有文献,可读性高的信息能够增进信息使用者的理解
程度、增强阅读印象、提升阅读速度、使人更容易持续阅读到最后。借鉴吉利等( 2016) [23]和杨
丹等( 2018) 的研究,构建衡量可读性的 5 个指标,标准化之后来衡量被解释变量 CSR 报告可读性( CSRR
) 。
(1) CSR 报告中句子的平均长度( Sentence) 。短句与长句相比,更加简明、精炼,阅读者更能轻松地理解信息的意思,可读性更强。利用 Python 软件编码批量获取 CSR 报告的中文总字数以及句末标点,借鉴陈霄等( 2018) [24]的方法用中文总字数除以总的句末标点数来计算每个
报告的平均句长,再进行标准化和同方向处理。
处理公式为: 标准化平均句长 = ( 当前报告平
均句长-所有报告平均句长最小值) /( 所有报告平均句长最大值-所有报告平均句长最小值) ;
同向化标准平均句长= 1-标准化平均句长。
(2) CSR 报告的页数( Page) 。报告的页数越多,呈现的信息就越详细,阅读者才能正确理
解报告呈现的信息,因此报告的页数也作为可读性的一个量化指标。
同样对报告页数进行标
准化处理,标准化报告页数= ( 当前报告页数-所有报告页数最小值) /( 所有报告页数最大值-
所有报告页数最小值) 。
 
(3) CSR 报告是否有目录( Content) 。目录能够体现报告结构,有助于增进理解程度,并且
目录可以帮助阅读者快速准确地找到自己想要阅读的内容,因此将是否有目录作为 CSR 报告
可读性的一个标准。
(4) CSR 报告是否是彩色的( Color) 。颜色不仅影响人的心理体验,还影响着人的认知加
工。
彩色的报告不仅能够强化阅读印象,还会使报告更加富有层次和重点以增进理解,因此彩
色报告的可读性比黑白报告更高。
 
(5) CSR 报告是否有图表( Chart) 。图表是报告呈现的一种形式,不仅能够增强阅读者阅
读的兴趣、丰富报告的内容,还能增加报告的真实性,因此有图表的报告一定程度上可读性更
高。
选择是否有图表而没有用图表的数量作为量化可读性的标准,主要是因为在收集报告的
过程中发现公司之间报告页数相差很大,若以图表数量作为标准,那就意味着页数少图表少的
报告可读性比页数多图表多的报告可读性更低。

▪ 实证模型与结果
为了检验 CSR 绩效以及女性高管对企业社会责任报告可读性的影响,构建如下模型

 模型(1) 是未放入解释变量( FE_Ratio) 的模型,用以检验 CSR 绩效以及其他控制变量与
CSR 报告可读性之间的关系,即企业的哪些特征会使企业社会责任报告的可读性越好; 模型
(2) 中放入解释变量( FE_ratio) 用以检验假设 1,即高管女性比例越高的公司社会责任报告可读性越好。

表 3 报告了模型( 1) 与模型( 2) 的多元回归结果。列( 2) 显示,FE_Ratio 的回归系数为
0.716,并且在 1%的水平上显著,说明公司女性高管占比越多,其 CSR 报告的可读性越好,假设 1 得到了验证。

05 其他相关文献

[1]吉利,张丽,田静.我国上市公司社会责任信息披露可读性研究——基于管理层权力与约束机制的视角[J].会计与经济研究,2016,30(01):21-33.
[2]黄萍萍,李四海.社会责任报告语调与股价崩盘风险[J].审计与经济研究,2020,35(01):69-78.
[3]刘建秋,尹广英,吴静桦.企业社会责任报告语调与资产误定价[J].会计研究,2022(05):131-145.

06 获取方式

此数据为会员专享数据,可添加客服微信,购买年度普通会员149元,年度高级会员299元,永久高级会员899元,即可享受CNDeepData普通数据及会员专享数据免费获取。

▪ 添加客服微信方式

扫描下方二维码,或搜索下方微信号。

添加客服微信号:

DeepData001

获取更多更新数据

版权声明 …

1. 除中国深度数据库(CNDD)特殊声明外,CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权,不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分,否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体,CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人,承诺只将CNDD的数据等用于学术研究,并在所得研究成果(包括但不限于学术论文、咨询报告等)中注明数据来源于CNDD。数据来源的注明方式请参考:“本研究数据来源于中国深度数据库CNDD”;英文参考:“We get the data from CNDeepData (CNDD)”。

中国深度数据库:让精品数据 得以流动

CNDeepData:Let high-quality data flow without barriers

资源下载此资源下载价格为99积分(年度普通会员免费),请先

部分图片来源于网络,如涉侵权请告知,本站将第一时间删除。客服微信号:DeepData001

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部