近日,一份涵盖2000年至2024年期间上市公司企业绿色数实产业技术融合的详细数据集引发学术界关注。该数据集包含约6.7万个样本,覆盖5600余家企业,通过专利引用信息分析技术融合行为,为研究数字经济与实体经济深度融合提供了重要支撑。
数据测算方法严格遵循学术规范,参考《中国工业经济》2023年第11期发表的研究成果。研究人员基于国家知识产权局2023年3月发布的《数字经济核心产业分类与国际专利分类参照关系表》,将企业专利的IPC主分类号与数字经济四类核心产业(数字产品制造、服务、应用及要素驱动)进行匹配,精准识别数字产业技术创新。通过分析专利引用关系,当非数字产业专利引用至少一项数字产业专利时,即定义为一次技术融合行为。
该数据集的创新性体现在多维度验证机制上。研究团队不仅提供原始专利数据、计算代码,还录制了完整操作视频(含关键节点标记),确保结果可复现。数据显示,约15%的样本存在技术融合行为,这种分布差异恰恰反映了不同企业的创新活跃度差异。最终指标采用"年度融合数量加1后取自然对数"的处理方式,既控制了极端值影响,又保持了数据分布特征。
值得关注的是,该数据集专门聚焦绿色技术领域,所有分析均基于绿色专利及相关环境数据构建。研究团队强调,这是国内首个系统梳理企业绿色数实技术融合的数据库,与普通技术融合数据存在本质区别。数据包中包含的详细技术分类表和匹配规则,为后续研究提供了标准化操作范本。
目前,该数据集已通过多重质量检验,包括代码逻辑审查、样本随机抽检和交叉验证。研究人员特别指出,数据生成过程完全基于公开专利信息,所有处理步骤均有完整记录,坚决杜绝"数据捏造"等学术不端行为。这份经过严格学术训练生成的数据集,为观察中国产业数字化转型提供了微观视角的实证依据。











