• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索 ›› 2025, Vol. 1 ›› Issue (7): 1-.

• 理论探索 •    

融合多粒度语义表征的韩语文本分类模型研究*

  

  1. (1.福州大学经济与管理学院 福建福州 350108)

    (2.华南理工大学工商管理学院 广东广州 510641)

  • 出版日期:2025-07-15 发布日期:2025-10-11
  • 作者简介:曾心怡(2000—),女,2022级硕士研究生,研究方向为数据挖掘与商务智能;于娟(1981—),女,博士,教授,博导,主要研究方向为数据科学与智能信息系统;李维婷(2000—),女,2022级硕士研究生,研究方向为数据挖掘与商务智能;席运江(1973—),男,博士,副教授,主要研究方向为智能算法等。
  • 基金资助:

    *本文系国家自然科学基金项目“虚拟健康社区信息可信度评价模型及智能推荐研究”(项目编号:72171090);国家自然科学基金项目“基于本体学习与本体映射的组织异构数据融合方法研究”(项目编号:71771054);福建省自然科学基金项目“多模态大数据融合分析的深度学习方法研究”(项目编号:2023J01393)成果之一。

  • Online:2025-07-15 Published:2025-10-11

摘要:

[目的/意义]旨在解决现有韩语文本分类研究中的文本表征不全面和语义融合不充分问题。\[方法/过程\]首先提取韩语文本的词素、音节和句子等多层面信息,分别使用word2vec和KLUE-BERT对词性、词素、音节粒度和句子粒度进行语义向量表示,并通过CNN和BiLSTM提取词素和音节粒度的深度语义;然后使用多头注意力机制融合各粒度语义,获取文本的深度语义表征;在此基础上,将Softmax分类器扩展为多头分类器,从而构建能够同时处理各粒度语义信息的文本分类模型。\[结果/结论\]在三个代表性数据集上实验的结果表明,该模型比常用的韩语文本分类模型的F1值大约高3%。

关键词:

韩语, 文本分类, 语义表征, 多粒度融合, 深度学习