王成顺, 张 玮, 王 辉, 宋立峰, 魏文淼, 张立华
变电站监控告警信息的正确处置对于确保变电站的安全运行和设备维护至关重要。实现正确处置的前提是能够快速、准确地抽取监控告警信息中的电力实体。由于目前已有的电力实体抽取方法,难以同时满足实际应用中对准确性和速度的双重要求。为解决以上问题,提出了一种基于知识集成增强语义表示(Enhanced Representation Through Knowledge Integration,ERNIE)和全局指针(Global Pointer,GP)并使用半监督学习策略的电力实体抽取方法(Semi-Supervised-ERNIE-GP)。该方法基于ERNIE-GP来提升电力实体抽取的准确性和速度,并引入半监督学习思想挖掘无标注数据中的实体抽取知识。为验证所提方法的有效性,利用变电站监控告警信息构建了数据集,并进行了一系列实验。实验表明,与基线较优模型BERT-Bi-LSTM-CRF相比,采用的Semi-Supervised-ERNIE-GP在精确率、召回率和F1分数上分别提高了4.90%、2.50%和3.71%。并通过曲线分析进一步证实了此方法在大规模数据应用场景中抽取速度的优越性。