高精度な流行語予測に向けて:n-gramトレンド分析における同形異義語の語義別成分分解

Sep 1, 2025·
神野 倫行
,
林 和樹
,
坂井 優介
,
上垣外 英剛
,
渡辺 太郎
· 0 min read
Abstract
n-gram における出現頻度の時系列変化(トレンド)は、語の流行や普及の動向を分析する手法として広く利用されている。しかし、n-gram に基づく集計は表層形に依拠しており、語義や実体の弁別を前提としていない。このため、同一表記に複数の語義が存在する場合、トレンド線はそれらの混合を反映し、個別の動向解析を困難にする。本研究では、独立成分分析(ICA)を適用し、n-gram トレンドを語義単位の成分に分解できるかを検証する。
Type
Publication
第20回NLP若手の会 シンポジウム