Indexed by:
Abstract:
现有企业生产安全氛围的主要描述载体是文本,但文本无法定量描述的特点是企业生产安全氛围分析面临的重要挑战.基于机器学习和自然语言处理技术处理企业生产安全氛围文本信息,着重从安全氛围主题辨识和安全氛围等级预测两方面,综合实现对企业生产安全氛围的智能感知.首先借鉴合成少数类过采样技术(SMOTE)算法思想,提出一种"类SMOTE"算法,用于解决非均衡文本数据问题;然后基于隐含狄利克雷分布(LDA主题模型)实现安全氛围主题辨识,得到文本主题词及相关权重;最后基于机器学习算法实现安全氛围等级预测.经过实例验证,提出的"类SMOTE+LDA+Bayes"组合模型,对于企业生产安全氛围智能感知效果较好.
Keyword:
Reprint 's Address:
Version: