上市公司数字技术风险暴露变量数据(2010-2024)

数据简介

CNPaperData

数字技术风险暴露变量作为量化企业数字技术应用风险水平的核心指标,是衡量上市公司在数字化转型进程中风险管控能力的关键标尺。在当前数字经济蓬勃发展的时代,企业积极投身数字化转型,但这一过程中也伴随着数据安全、网络安全等各类风险。该变量通过文本挖掘与自然语言处理技术,将企业数字技术风险相关的定性信息转化为可量化的定量指标,有效填补“风险识别—程度度量—影响评估”分析链条中的数据空白,为监管部门优化数字经济监管政策、高校开展数字技术风险研究、投资者评估企业运营风险提供权威可靠的数据支撑。

本数据核心来源为2010—2024年中国A股上市公司年度报告中“管理层讨论与分析(MD&A)”部分的文本信息。数据构建过程严格遵循“文本获取—分词处理—关键词拓展—数据标注—模型训练—指标计算”的标准化流程,具体构造方式如下:

使用数据皮皮侠数据库上市公司年报中的MD&A信息,基于《工业和信息化领域数据安全风险信息报送与共享工作指引(2021)》及《国家网络安全事件应急预案(2017)》选取关键词,并采用Word2vec模型训练各年份所有的MD&A语料后进行词集扩展。再随机抽样10%的数据,使用Openai的ChatGPT和智谱清言 的GLM人工智能模型分别进行标注,使用的提示词为“该论述是否反映了企业面临数字技术风险的暴露?”和“该论述是否反映了企业采取措施对数字技术风险进行了防范?”,对于模型标注不一致的样本进行人工复核。随后将其转化为模型训练集:对标注为 “风险暴露” 的文本赋值 - 1(对应负面情感),无关为0,标注为 “风险防范” 的文本赋值 1(对应正面情感),两者不一致的再人工判断。按照 0.6:0.4 的比例划分训练集与验证集,参考既有研究设置模型参数开展预训练至最终模型,获得全部数据的分类结果。最后构建企业数字技术风险暴露指标,Digi_Risk_Exposure_raw为原始指标,Digi_Risk_Exposure为将Digi_Risk_Exposure_raw为负的值按原文方法改为0后的指标。该指标的设计聚焦 “极端风险” 与 “防范能力” 的制衡关系,被定义为 企业年度MD&A信息中“负面文本的负面情感概率最大值” 与 “正面文本的正面情感概率平均值” 之间的差值。

数据信息

CNPaperData

  • 数据格式:excel

  • 数据字段:

股票代码

年份

Digi_Risk_Exposure_raw

Digi_Risk_Exposure

股票简称

中文全称

更多数据

数据展示

CNPaperData

图片

参考文献

cNPaperData

[1]陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.

选题方向

CNPaperData

选题1:数字技术风险暴露的时序演化与企业异质性研究(2010-2024)

基于数据集“年份—企业—行业—风险指标”四维信息,构建“风险演化趋势+企业异质性特征+政策驱动效应”的三维分析框架。运用时间序列分解(HP滤波)、核密度估计及技术图谱(CiteSpace)方法,系统刻画2010-2024年我国上市公司数字技术风险暴露的整体演化规律(如数字经济相关政策出台前后的风险关注差异)及企业分化特征(如高杠杆企业与低杠杆企业、传统企业与科技企业的风险水平差距)。结合面板数据回归模型,实证检验数字技术风险暴露对企业价值(托宾Q值)、经营绩效、转型效率的影响效应,识别不同类型企业中数字技术风险“从暴露到损失”的传导路径差异,为企业精准开展风险防控提供实证依据。

选题2:数字治理政策对企业技术风险暴露的调节效应研究

以《网络安全法》(2017年实施)、《数据安全法》(2021年实施)等政策出台为准自然实验,结合本数据集与上市公司数字治理投入数据(如网络安全费用、合规团队规模),构建“政策冲击—治理投入—风险暴露”的分析框架。运用双重差分倾向得分匹配(PSM-DID)方法,评估数字治理政策对上市公司数字技术风险暴露水平的净调节效应。通过异质性分析,对比政策在国有与非国有企业、大型与中小型企业中的效应差异,结合中介效应模型检验“合规意识提升”“技术投入增加”“流程优化完善”三大作用路径,为进一步完善数字治理政策体系、提升政策实施效能提供数据支撑。

选题3:数字经济背景下技术风险暴露与企业转型平衡研究

将本数据集与上市公司数字化转型投入数据、数字技术专利产出数据关联,构建“技术风险暴露—转型投入—转型产出”的分析框架。运用门槛回归模型,探究数字技术风险暴露对企业数字化转型的“双重效应”——适度风险暴露推动企业加大风险防控与技术创新投入,过度风险暴露抑制转型积极性的门槛特征,识别风险暴露的“最优区间”。结合LDA主题模型挖掘企业年度报告中转型相关文本信息,实证检验数字安全技术创新对“风险防控—转型提升”平衡关系的调节作用,为企业在数字经济中实现“风险可控下的转型突破”提供策略参考。

选题4:数字技术风险暴露对企业融资决策的影响机制研究

聚焦资本市场视角,将本数据集与上市公司融资成本、融资规模、信贷可得性等金融数据关联,构建“技术风险暴露—信息披露质量—融资决策”的分析框架。运用事件研究法,以企业数字技术风险相关公告发布为事件点,分析风险暴露水平对短期融资成本的影响;结合多元回归模型,实证检验数字技术风险暴露通过“信息不对称程度”“风险溢价水平”“投资者信心”三条路径影响企业融资决策的机制,为企业优化融资策略、金融机构完善风险定价模型、监管部门强化市场信息披露监管提供实证依据。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐