摘要:
[目的/意义]旨在解决现有韩语文本分类研究中的文本表征不全面和语义融合不充分问题。\[方法/过程\]首先提取韩语文本的词素、音节和句子等多层面信息,分别使用word2vec和KLUE-BERT对词性、词素、音节粒度和句子粒度进行语义向量表示,并通过CNN和BiLSTM提取词素和音节粒度的深度语义;然后使用多头注意力机制融合各粒度语义,获取文本的深度语义表征;在此基础上,将Softmax分类器扩展为多头分类器,从而构建能够同时处理各粒度语义信息的文本分类模型。\[结果/结论\]在三个代表性数据集上实验的结果表明,该模型比常用的韩语文本分类模型的F1值大约高3%。