【Ltech#11】ディープラーニングで間取り図を3Dにする

1.7K Views

October 29, 20

lifull lifull home's ltech dl ai 機械学習

スライド概要

2020/10/29　Ltech#11 不動産領域のAI活用最前線〜初完全リモート開催〜
AI戦略室データサイエンスグループ　椎橋怜史

株式会社LIFULL

スライド一覧

LIFULL HOME'Sを運営する株式会社LIFULLのアカウントです。 LIFULLが主催するエンジニア向けイベント「Ltech」等で公開されたスライド等をこちらで共有しております。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

<script async class="docswell-embed" src="https://bcdn.docswell.com/assets/libs/docswell-embed/docswell-embed.min.js" data-src="https://www.docswell.com/slide/5LE7QK/embed" data-aspect="0.5625"></script><div class="docswell-link"><a href="https://www.docswell.com/s/LIFULL/5LE7QK-%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E3%81%A7%E9%96%93%E5%8F%96%E3%82%8A%E5%9B%B3%E3%82%923D%E3%81%AB%E3%81%99%E3%82%8B">【Ltech#11】ディープラーニングで間取り図を3Dにする by @LIFULL</a></div>

ダウンロード

ダウンロード(pdf - 560.19kB)

関連スライド

slide-thumbnail

pmconf2023【プロダクトマネジメントで高速PDCA】アウトカムが激増したLIFULL HOME’Sのグロース事例

プロダクトマネジメントプロダクトマネージャー lifull

株式会社LIFULL 22.1K

slide-thumbnail

CloudWatch LogsからGrafana Lokiにログ基盤を移行

lifull aws grafana ログ

株式会社LIFULL 15.9K

slide-thumbnail

HNSWの内部構造

lifull hnsw search

株式会社LIFULL 15.6K

slide-thumbnail

LIFULL HOME'SでのSolrの構成と運用の変遷

lifull lifull home's engineering

株式会社LIFULL 10.7K

slide-thumbnail

PrometheusとGrafanaで追求する、より良いアプリケーションの可観測性

lifull grafana ログ kuberentes

株式会社LIFULL 10.6K

slide-thumbnail

趣味と仕事の違い、現場で求められるアプリケーションの可観測性

技育祭エンジニア engineering programming プログラミング

株式会社LIFULL 9.6K

各ページのテキスト

Ltech 11 ディープラーニングで間取り図を3Dにする株式会社LIFULL 椎橋怜史

自己紹介・椎橋怜史・2016年LIFULL入社・機械学習の研究開発をやっています・https://qiita.com/shiibass ・ https://github.com/shiibashi

空飛ぶホームズくんの裏側のアルゴリズムの話 https://japan.cnet.com/article/35159709/

https://japan.cnet.com/article/35159709/

アルゴリズムの流れ ④３D ①元画像 ②セマンティック画像ディープラーニング（画像認識） ③ポリゴンデータ画像処理（間取り解釈）

セマンティックセグメンテーションタスクで学習各ピクセルごとにクラス分類をする機械学習タスク

アルゴリズムの流れ ④３D ①元画像ここの話 ②セマンティック画像ディープラーニング（画像認識） ③ポリゴンデータ画像処理（間取り解釈）

参考にした論文：Deep Floor Plan Recognition Using a Multi-Task Network with Room-Boundary-Guided Attention この論文の特徴・attention層をいれることで精度向上・direction-aware kernelsをいれることで精度向上詳しくは https://openaccess.thecvf.com/content_ICCV_ 2019/papers/Zeng_Deep_Floor_Plan_Recogni tion_Using_a_MultiTask_Network_With_Room-BoundaryGuided_ICCV_2019_paper.pdf

https://openaccess.thecvf.com/content_ICCV_

LIFULLではアイコンを追加して3種類の出力層を構築 line出力層, LovasLoss room出力層, CrossEntropyLoss semantic-segmentation タスクとして最適化する icon出力層,CrossEntropyLoss

実装関連箇条書き ● minimize: LovaszLoss + w_1 CrossEntropyLoss_room + w_2 CrossEntropyLoss_icon w_1とw_2は定数 ● ● ● ● ● ● ● Pytorch, albumentations（augmentation用） opencv(画像処理) 活性化関数 Funnel Activation https://arxiv.org/pdf/2007.11824.pdf AWS EC2: p3.2xlarge 1台学習48時間学習データ間取り図3500枚、アノテーションはクラウドソーシング+自分たち line (壁, ドアの2種類) room(9種類) icon(6種類)

Data Augmentation https://github.com/albumentationsteam/albumentations ● ● ● ● VertivalFlip HorizontalFlip Rotate CLAHE ＋ Logo(custom augmentation) Logo

https://github.com/albumentations-

Annotation ● 外注したアノテーションの検収が大変 ● 単純作業だけど間違えられないので集中力使う ● 長時間アノテーションで肩がこる、腰が痛くなる ● 筋トレしてなかったら身体壊れてた ● エンジニアは運動も仕事の一貫アノテーションツールCVAT

推論結果

アルゴリズムの流れ ④３D ここの話 ①元画像 ②セマンティック画像ディープラーニング（画像認識） ③ポリゴンデータ画像処理（間取り解釈）

基本は輪郭抽出だが、プラスで工夫が必要ピクセル単位でラベルが割り当てられたデータ輪郭抽出してポリゴンの頂点のみ保持するデータ

プラスの工夫：認識と解釈は別問題1 ● 赤で囲った２つのドア ● ディープラーニングはこれらを同一視する ● 人間なら浴室にあるのは小窓でバルコニーにあるのは人間が行き来できるサイズと解釈できる ↓ ディープラーニングには認識のみさせる３D化で違和感ないような解釈はルールで記述

プラスの工夫：認識と解釈は別問題2 元画像どこがNGか？推論結果赤で囲ったドアは正しく認識できている輪郭抽出結果ドアの輪郭を正しく抽出できている

プラスの工夫：認識と解釈は別問題2 常識的に考えて、ドアは２つに分かれてるはず元画像推論結果赤で囲ったドアは正しく認識できている画像処理でドアを分割ディープラーニングの推論結果を塗り替える

アルゴリズムの流れ ④３D ここは省略 ①元画像 ②セマンティック画像ディープラーニング（画像認識） ③ポリゴンデータ画像処理（間取り解釈）

３Dになるとこうなります https://japan.cnet.com/article/35159709/

https://japan.cnet.com/article/35159709/

おわり