摘要:
[目的/意义]构建一个标注全面的群体性突发公共事件数据集,并提出一种群体性突发公共事件识别模型,为群体性突发公共事件识别提供高质量的数据支持和有效的识别方法。[方法/过程]采用机器、人工双重标注,对群体性事件文档进行标注,提出动态BERT-LSTM-CNN模型进行突发事件全局及局部特征提取,实现突发事件识别。[结果/结论]得到一个标注全面、覆盖面广、高质量的群体性突发公共事件数据集,自动标注与手动标注两阶段均具有高一致性;本文所提出模型的识别效果比基准模型表现更好,在MED上的microF1达到92.96%。