崩れた手書き文字データセット構築と平均化による可読性向上の検証

3.5K Views

August 15, 19

#手書き文字 #平均化 #可読性 #データセット #研究

スライド概要

コンピュータやスマートフォンが普及した現在においても，手書き文字を使う機会は多くある．また，自分の手書きに対して苦手意識を持っている人たちもいる．これまでの研究で，複数の手書き文字を合成し平均化した文字が綺麗であることや，それを用いた手書き平均化アプリケーションも実装されている．しかし，立った状態でメモを走り書きするなどのシーンのように，手書きが崩れてしまったものを読めるようにできるかについての検討は，十分に行われてこなかった．そこで本研究では，崩れた手書き文字データセットを構築するための手法について検討を行うとともに，構築したデータセットを用いて平均化によって美化し，読めるようにすることができるかを検証した．検証の結果，平均化によって可読性が向上することがわかった．また手書きの可読化においてユーザ間に相性が示唆された．

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 31.7K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 24.3K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 20.9K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 17.3K

ComiQA: A Comic Quiz Sharing Service that Helps Users to Recollect the Content of Previous Volumes

comic manga recollection qa service

Nakamura Laboratory (Meiji University) 17.3K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 17.1K

各ページのテキスト

崩れた手書き文字データセット構築と平均化による可読性向上の検証二宮洸太（明治大学総合数理学部 3年）又吉康綱，中村聡史第184回 HCI研究会 1

背景日常生活でよく使う手書き文字しかし，・人によっては苦手・他人に見せることを躊躇う 2

背景手書きに関する調査* 恥ずかしいと感じる苦手意識がある 64.3% 58.0% *株式会社ゼブラ 2014，2015 3

背景手書きに関する調査* 恥ずかしいと感じる苦手意識がある 64.3% 58.0% 多くの人が手書きにコンプレックスをもっている 4

実際に文字が崩れるケースメモ書き・急いで書く・立ったまま・電話しながら・他の文書を見ながら 5

動機崩れた文字を読めるように支援したい 6

これまでの研究平均化手法を用いた手書きの美化を行なってきた平均化数式化文字A 𝑥 𝑦 = 𝑥1 𝑥𝑛 , … , 𝑦1 𝑦𝑛 手書きを点集合として取得 𝑥 𝑦 = 𝑥1 𝑥1.1 𝑥1. 𝑚 𝑥𝑛 , , , … , 𝑦1 𝑦1.1 𝑦1. 𝑚 𝑦𝑛 𝑥 =𝑓 𝑡 𝑦 = 𝑔(𝑡) スプラインにフーリエ変換によってよって点を補完ストロークを数式化文字B 平均化平均文字 7

これまでの研究自身の平均文字は美しい [中村ら 2014] 複数の文字を平均化した平均文字は手書き文字よりきれい他者との融合文字は好感度が向上 [斉藤ら 2016] 他者と融合すると好感度が高い Mojirage: 平均手書きノート [又吉ら 2017] 自身と他者との平均化によるきれいなノート作成アプリケーション 8

これまでの研究利き手・非利き手の平均文字は類似 [佐藤ら 2018] 利き手・非利き手の文字は類似するこの中で，非利き手で書いた文字が平均化によってきれいになることが示された 9

10.

これまでの研究利き手・非利き手の平均文字は類似 [佐藤ら 2018] 利き手・非利き手の文字は類似するこの中で，非利き手で書いた文字が平均化によってきれいになることが示されたこれらは十分に読める文字での研究 10

11.

これまでの研究利き手・非利き手の平均文字は類似 [佐藤ら 2018] 利き手・非利き手の文字は類似するこの中で，非利き手で書いた文字が平均化によってきれいになることが示された崩れた文字に平均化は使えるのか？ 11

12.

本研究の目的崩れた手書き文字に対して平均化によって可読性が向上するかを検証崩れた文字同士を平均化して読めるようになるか平均化崩れた文字A 崩れた文字B ? 12

13.

本研究の検証内容 (1) 平均化手法によって崩れた手書き文字を可読化できるか (2) 平均化に際して，ユーザ間に相性はあるのか 14

14.

本研究の概要 (1) 崩れた手書き文字のデータセットを構築 (2) データセットをもとに平均文字を作成 (3) 平均化前後を比較し，可読性を評価する実験 (4) 評価結果をもとに可読性と相性を検証 15

15.

崩れた手書き文字データセット構築崩れた手書き文字データを収集したい・先行研究が見つからない・通常通り書いても崩れないデータセット構築手法を模索崩れる状況を仮定し，検証検証結果をもとに構築を行う 16

16.

データセット構築の流れ (1) どのようにすれば文字が崩れるかを調べる，予備実験を実施 (2) 予備実験の結果を踏まえて，本実験としてデータセットを構築する 17

17.

予備実験検証内容 (1) 用いる文字の検証 (2) 制限時間の検証 (3) 設定した環境でどのように文字が崩れるか 18

18.

予備実験文字の選定漢字出現順位対応表(文化庁)を中心に50字選定簡単すぎる文字は除く ex. 一，中，十制限時間画数に合わせて設定急いで書けば，書き終えられる時間 19

19.

実験設計 – 環境設定立った状態座った状態手元を見ない状態＊データセット構築はペンタブ型端末を使用 20

20.

データセット構築システム文字を書いてもらい，保存するシーケンスバーによって時間を制限 21

21.

予備実験大学生12名(男性11名，女性1名) 合計600回 22

22.

結果 – 予備実験実際に得られた文字の例立ったかかえた手元を見ない 23

23.

結果 – 予備実験実際に得られた文字の例立ったかかえた手元を見ない 24

24.

結果 – 予備実験複雑な文字の方が崩れやすいシンプルな文字複雑な文字 25

25.

結果 – 予備実験複雑な文字の方が崩れやすいシンプルな文字複雑な文字 26

26.

結果 – 予備実験時間内に書ききれていない文字が散見された 27

27.

結果 – 予備実験時間内に書ききれていない文字が散見された 28

28.

結果まとめ – 予備実験・手元を見ないが崩れやすい・複雑な文字が崩れやすい・制限時間内に書ききれていない場合がある 29

29.

データセット構築本実験予備実験の結果を踏まえ条件を手元を見ないに限定複雑な文字を中心に選定時間遵守 → 書き終えるよう指示 → 制限時間内に書き始めた一画は有効とした 30

30.

データセット構築本実験ディスプレイを使用手元を見ない方法の統一筆跡は非表示必要情報を常に提示 31

31.

データセット構築本実験ディスプレイを使用手元を見ない方法の統一提示情報筆跡は非表示・制限時間必要情報を常に提示・書く文字情報・タスクの進捗 32

32.

データセット構築本実験 50字 × 2回を1セットとして5セット(500回) 使用した文字私他場新現時気年書最的会家度身者思長戦情削貝国意野事学動通教見部理屋語後物発感顔前恩高業機間地実持数 33

33.

データセット構築本実験大学生20名(男性10名，女性10名) 合計10,000個のデータを収集最野顔後 34

34.

データセット構築本実験まとめ・手元を見ない状態で書いた，崩れた文字データセットを構築(10,000データ) ・複雑な文字が中心 35

35.

評価実験 – 概要・平均化による可読性の向上を調べる・2人のユーザの文字を平均化し，可読性を評価「教」という文字です，読めますか？平均化平均化前の文字平均化相手の文字平均文字平均化前の文字平均文字 36

36.

評価実験 – 文字ユーザ平均化平均化前の文字平均化相手の文字平均文字・平均化前の比較元となる文字・userα(β)と平均化する相手・全20人の中から崩れ方が顕著な 2人を選択(userα，userβ) ・userα(β)自身を除く19人 37

37.

評価実験文字崩れ方が顕著な6文字を使用教，業，実，場，度，動 38

38.

評価実験 – 平均化合計237種の平均文字が作成 1文字につき10種を選定合計120種を使用 39

39.

平均化前の文字 userα userβ 42

40.

評価実験 – 平均文字の一例 userα userβ 44

41.

評価実験大学生14名(男性7名，女性7名) 平均化前後の文字を上下に配置何の文字かを提示し，4択で評価 47

42.

結果 – 評価実験平均化後だけ読める → 可読性が向上可読性が向上したと判断された文字数 120データ中 115 データ 48

43.

結果 – 評価実験平均化後だけ読める → 可読性が向上可読性が向上したと判断された文字数 120データ中 115 データ平均化によって可読性が向上 49

44.

可読性が向上した文字の例 51

45.

考察 – ユーザ間相性調査 2人のユーザの文字を平均化した平均化 userα(β)の文字平均化相手の文字平均文字 53

46.

考察 – ユーザ間相性調査 2人のユーザの文字を平均化した平均化 userα(β)の文字平均化相手の文字このようなユーザ間に相性があるか検証平均文字 54

47.

考察 – ユーザ間相性調査可読化割合(R)を定義平均化後のみ読めると判断した人数（人） 𝑅= (0 ≤ 𝑅 ≤ 1) 平均化前読めないと判断した人数（人） *ただし分母が0より大きいデータに限定 1に近いほど多くの人が読めるようになったと判断 55

48.

考察 – ユーザ間相性調査表は分母が10人以上のデータのみ平均化前の文字ユ | ザ平均化相手の文字ユーザ userA userα 0.211 userβ 0.548 userK userα userβ データ不足 0.188 userC データ不足 0.519 userM 0.478 データ不足 userD 0.357 データ不足 userN 0.200 0.636 userE userF userI 0.195 0.146 0.297 0.449 0.395 0.443 userO 0.190 データ不足 userP 0.100 データ不足 userQ userJ 0.160 データ不足 userR 0.143 0.470 0.500 0.650 56

49.

考察 – ユーザ間相性調査表は分母が10人以上のデータのみ平均化前の文字ユ | ザ平均化相手の文字ユーザ userA userα 0.211 userβ 0.548 userK userα userβ データ不足 0.188 userC データ不足 userD 0.357 userE 0.195 userF 0.146 0.449 0.395 0.519 データ userRはuserα，β 不足どちらとも高い userM userN userO userP 0.478 データ不足 0.200 0.636 0.190 データ不足 0.100 データ不足 userI 0.297 0.443 userQ userJ 0.160 データ不足 userR 0.143 0.470 0.500 0.650 58

50.

userRとの平均文字の例平均化 userα userR 平均化 userβ userR 59

51.

考察 – ユーザ間相性調査可読化割合が高いものが観測されたユーザ間に相性がある可能性が示唆された 60

52.

検証結果 (1) 平均化手法によって崩れた手書き文字を可読化できるか可読化できる (2) 平均化に際して，ユーザ間に相性はあるのか相性が示唆された 61

53.

読めるようにならなかったもの可読化できなかったものもある業実度 62

54.

展望 – 筆談アプリへの応用崩れた文字は平均化によって可読化できる崩れた文字を可読化するアプリケーションの実装筆談聴覚障害者の方が多く用いる・タイピングではなく手書きを見せたい・崩れた手書きは恥ずかしい 64

55.

まとめ・崩れた文字データセットを構築した・崩れた文字は平均化によって可読性が向上する・ユーザ間の相性が示唆された平均化 65