【IT Text 自然言語処理の基礎】第10章:意味解析

446 Views

January 11, 24

スライド概要

自然言語処理の基礎の輪読会第12回の発表スライドです。
2024年1月11日(木) 18:30~

profile-image

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

自然言語処理の基礎10章 意味解析 京都大学工学部 3回生 有福 遼太郎 0

2.

10章:意味解析の目次 目次 01 意味解析とは 02 テキスト間含意関係認識 03 NNによる意味解析 04 述語項構造解析 05 論理表現 06 セマンティックパージング 07 意味解析のその他の話題 1

3.

10.1 意味解析とは 2

4.

10章 10.1 意味解析とは 人間が言葉を受け取る際の「意味」とはなにか,またコンピュータ上でどう処 理すればよいのかを考えたい アプローチ方法 ● 構成的意味論:構成要素の意味と合成手続きによって決定される意味に関 する理論や技術(cf. 構成性の原理) ● 語彙的意味論:単語がもともと持っている意味に関する理論や技術 意味関係の種類 → 同義語,上位語・下位語,部分語などの意味関係がある 意味解析の目的 人間の意味理解能力を説明し,コンピュータ上に再現する. ex)犬を飼う → チワワを飼う 3

5.

10.2 テキスト間含意関係認識 4

6.

10章 10.2 テキスト間含意関係認識 テキスト間含意関係認識:2つの文章の間に意味的推論関係があるかどうかを 判別するタスク 含意関係がある t ex) A soccer game with multiple males playing. h ex) Some men are playing a sport. 「tならばhである」という命題の含意関係を判定する → 含意関係がある, ない or 矛盾 の3値分類タスクとして 定式化 いくつかのアプローチがある 5

7.

10.3 ニューラルネットワークによる意味解析 6

8.

10章 10.3 ニューラルネットワークによる意味解析 NNを用いて含意関係を出力する分類器を構成する 𝑃 𝑦 = 𝑠𝑜𝑓𝑡𝑚𝑎𝑥𝑦 𝑾 𝒕 ⊕ 𝒉 + 𝒃 ● ● ● 事前学習済み言語モデルで高い精度が報告されるが,その仕組みは明らか となっていない データセットのバイアスやショートカットを学習しやすく,本来の意味理 解が実現できていないため,学習データと異なる分布のデータでは精度が 低下するという指摘もある 人間と同等な意味理解を実現するための研究が続けられている 7

9.

10.4 述語項構造解析 8

10.

10章 10.4 述語項構造解析 述語項構造解析:一つの文の各単語間の基本的な意味構造を解析する技術 述語項構造 述語構造解析の定義 𝑠(𝑢, 𝑣, 𝑙)が最大となるラベルlを選択し,エッジを採用する 𝑠 𝑢, 𝑣, 𝑙 = 𝑠𝑜𝑓𝑡𝑚𝑎𝑥𝑙 𝑾 𝒖 ⊕ 𝒗 ⊕ 𝒍 + 𝒃 9

11.

10.5 論理表現 10

12.

10章 10.5 論理表現 量化,数量,否定などを含む文では述語項構造だけでは含意関係が正しく計算できな いことがある → 形式論理,述語論理を利用する 組合せ範疇文法(CCG) ● 非終端記号の代わりにカテゴリ(S, N, NP)とslash, backslashで構文情報を表す ● カテゴリの表現と論理表現の合成が文法規則によって表されていて,各ラムダ式を 構文木に沿ってbeta簡約することで文全体の論理表現が計算される ● ● ラムダ式:wikiが詳しい https://ja.wikipedia.org/wiki/%E3%83%A9%E3%83%A0%E3%83%80%E 8%A8%88%E7%AE%97 β-簡約:wikiが詳しい https://ja.wikipedia.org/wiki/%E3%83%A9%E3%83%A0%E3%83%80%E 8%A8%88%E7%AE%97#%CE%B2-%E7%B0%A1%E7%B4%84 11

13.

10.6 セマンティックパーシング 12

14.

10章 10.6 セマンティックパージング セマンティックパーシング:自然言語の文を機械が処理可能な表現に変換する 自然言語処理技術 アプローチ方法 ● 系列変換モデルを用いる • • ● 機械翻訳の手法を応用する 文法的制約を満たすデコードを行う手法が提案されている 構文解析・意味解析技術を応用するもの • CCGに基づいて計算する手法 13

15.

10.7 意味解析のその他の話題 14

16.

10章 10.7 意味解析のその他の話題 モディリティ 談話解析, 文脈解析 ● モディリティ • 文章から読み取れる話し手の評価や推論 • ex) 昨日は雨が降ったに違いない ● 談話構造解析 • 複数の文の間の文法や文間の意味のつなが りを解析するもの • 特に省略されている語(ゼロ代名詞)や代 名詞がどこに当たるのかを解析する • Cf. 共参照解析,談話表示理論 ● 一階記述論理でなく,高階論理が必要 エンティティリンキング, 語義曖昧性回避 語用論 ● 語義曖昧性 • Bankやキーボードなど,同じ単語で複数の 意味を表すもの ● 語用論 • 自然言語が使われている場面に応じて生じ る意味に関する理論 • ex) 「この部屋はちょっと暑いですね」 • 言外で意図する内容を読み取る • 比喩やアイロニーの意味を理解する ● エンティティリンキング • テキストの中で言及されている実体がどれ を表すのかを明確化する • ex) 菅首相 15