CNDeepData以 “ 让精品数据得以流动 ” 为核心,致力于把握学术前沿动态,打破数据流动壁垒,为学术人提供独创性强、数据质量高、数据可用性好的精品数据库。CNDeepData 提供包括数据零售、数据定制和数据分析等多项。具体业务为:

(1)数据零售

中国深度数据库(微信公众号CNDeepData),包括对中国上市公司数据、中国县域经济数据、中国地区经济数据、跨国面板数据等较常用的学术数据进行零售业务。本数据库均来自权威数据机构,并经过本数据库收集验证。

(2)数据定制

中国深度数据库(微信公众号CNDeepData),包括对中国裁判文书网司法判决数据、中国工商注册企业全信息数据、全球专利及引用被引用数据、中国专利文本数据、电商人口属性标签、人口互联网偏好标签、税收调查企业基本信息扩展数据等稀缺数据进行定制售卖,或者针对客户需求进行个性化定制。本数据库均来源于权威数据机构,并经过本数据库收集验证。

(3)数据分析业务

数据应用创新实验室,针对数据进行分析,其中包括数据清洗、数据可视化、文本分析、机器学习、实证回归等。使用软件可指定Stata或Python,保证全过程代码留存,分析结果可复制。其中文本学习包括词频分析、情感分析、语调分析、可读性分析、相似性分析以及Bert模型和Word2vec模型等算法。机器学习包括回归和聚类两类,其中包括Lasso回归、神经网络、支持向量机、Catboost、随机森林、KNN以及各种集成模型等各种机器学习算法。实证回归包括双重差分模型、倾向得分匹配法、工具变量方法等等。目前数据创新实验室已与多家中央企业和地方政府长期合作,并提供数据分析服务。

滚动至顶部