Noisy Channel に基づく生成確率による画像生成評価
Mar 5, 2026·,,,,·
0 min read
林 和樹
尾崎 慎太郎
神野 倫行
上垣外 英剛
渡辺 太郎
Abstract
近年の画像生成(T2I)モデルの進展により,生成画像の表現力や多様性は大きく向上している一方で,長文や複雑な指示を含む生成では,単一指標で出力を評価することが難しく,既存の評価手法は高度化した生成能力に十分対応できていない.本研究では,生成確率に基づくNoisy Channelにより T2I 評価を再定式化し,画像のテキスト整合性と視覚的品質を統一的に捉える確率的評価指標を提案する.提案手法は,LVLM の推論能力を教師強制尤度として用いた整合性評価と,自己回帰型画像生成モデルの尤度による品質評価を組み合わせることで,生成結果間の相対比較に依存せず,各画像を独立に評価できる.検証の結果,提案手法は人手による画像選好と高い整合性を示し,既存のスコアリング手法を一貫して上回る性能を達成した.また,評価観点を切り替えることで,同一の確率的枠組みのもとで多様な人手判断を柔軟に捉えられることを確認した.
Type
Publication
言語処理学会第32回年次大会発表論文集(NLP2026)