[ 技術についてのお知らせ ]
2020.5.13
「SuperMap GeoAI」、 GFDRR都市防災へのチャレンジに参加
都市における建物・施設の特定位置と潜在的な災害被害リスクを解明するための災害リスク管理(DRM)に向けて、防災グローバル・ファシリティ (GFDRR:Global Fasility for Disaster Reduction and Recovery Foundation)は、深層学習(ディープラーニング)と地理空間技術の融合による災害リスク管理における可能性に着目し、「Open Cities AI Challenge: Segmenting Buildings for Disaster Resilience」をテーマにしたコンテストを実施しています。これにSuperMap GeoAIチームも参加しました。
コンテストは精度の高い深層学習モデルの構築を目指し、アフリカの各都市においてドローンで取得した航空写真から建物等を識別し、各都市の災害リスク管理マップを作成して災害耐性の向上を目指しています。精度が高く、実用可能な空間深層学習モデルを開発することを目的としています。
SuperMap R&D GeoAIチームはコンテストに積極的に参加し、高解像度ドローン画像を使った建物のセマンティックセグメンテーション (Semantic Segmentation) を実装し最適化手法を導入したことによって、良い結果が得られています。
セマンティックセグメンテーションは、自動運転、医療画像解析、ロボットなどの分野で広く使用されています。地理情報画像解析での用途としては、主にディープニューラルネットワークモデルをトレーニングして、画像から道路、河川、建物などの様々な地物を認識します。
●実装プロセス
航空写真内の建物を特定するための深層学習に基づくセマンティックセグメンテーション技術には、主としてデータ準備、モデル構築、モデル推論といったプロセスが含まれます。SuperMap GeoAIは、空間深層学習ロジェクトを行うためのGeoAIプロセスツールを提供し、ワークフロー全体をサポートし、それぞれのニーズに適したモデルをすばやく構築し、推論結果を得ます。
SuperMap GeoAI空間深層学習実装プロセス
●使用データ
(1)訓練データとして、建物を含む画像(約2万枚、1024×1024ピクセル)と建物を含まない画像(約5万枚、1024×1024ピクセル)、地上解像度は2〜20cm、及びそれぞれの画像に対応したラベル付けられたベクタデータを使用しました。
(2)テストデータはアフリカのさまざまな地域の画像(約1万枚、1024×1024ピクセル)を使用しました。
訓練データ例(ベクタラベル付きの画像データ)
●モデルの選択
FPN、FCN、U-Net、PSPNet、DeepLabシリーズなど、画像のセマンティックセグメンテーションに使用できる多くのモデルが既に存在しています。分割モデルを選択するときは、プロジェクトの要件を考慮する必要があります。本プロジェクトでは、精度と効率を比較した上でFPNモデルを選択しました。EfficientNetで画像の基本特徴を抽出し、FPN(Feature
Pyramid Network)で抽出された特徴を更に処理します。
モデル全体のパフォーマンスを向上させるために、データ、訓練、推論の各プロセスから対象を絞った最適化を実施しました。訓練効率と推論の精度を大幅に向上させるいくつかの最適化方法の導入に焦点を当てました。
〇データの最適化
(1)データ強化深層学習では、一般的にデータが多いほど、良い訓練結果が得られます。データ強化により、限られたデータを用いてより効果的な訓練データを生成し、訓練データの量を増やして、モデルの一般化能力を向上させることができます。データ最適化のプロセスでは、クリッピング、スケーリング、回転などのさまざまなデータ強化方法を使用しました。
データ強化の効果例
建物のないエリアの訓練データ(耕地など)をネガティブサンプルとして増やします。訓練では、耕地などの非建物エリアを建物として識別してしまう誤判別を減らして推論の精度を向上させています。下図に示すように、ネガティブサンプルを追加すれば、黄色エリア(耕地)を建物に誤判別することが避けられます。
(左図)推論用画像 (右図)耕地と誤判別されやすいエリア
〇訓練の最適化
(1)オプティマイザー
モデル出力を最適値に近づけるために、さまざまな最適化戦略とアルゴリズムを使用して、モデルの訓練と出力に影響を与えるニューラルネットワークの各層の重みを更新する必要があります。通常オプティマイザーと呼ばれるもので、最も基本的なものとして勾配降下法などがあります。
実際のアプリケーションでは、特定の課題に合わせて適切なオプティマイザーを選択する必要があります。本プロジェクトでは、Radam
+ LookAheadオプティマイザーは顕著な効果があることが判明しました。RAdamとLookAheadを組み合わせて、より高いレベルの最適化を実現するオプティマイザーとなります。
マルチGPUは、訓練の効率を大幅に向上させるとともに、モデルの最終的な精度と一般化能力も一定程度向上させることができます。
(1)マルチスケール画像推論の重み付け推論プロセスでは、画像を拡大・縮小して得たマルチスケール画像を推論に使用し、結果が重み付けおよび平準化されて最終的な出力結果が得られます。この最適化方法により、アプリケーションでの推論の精度が大幅に向上します。
マルチスケール予測値加重平均
(2)マルチスケール画像推論の重み付け
一連の最適化を行った後、テストデータセットでのプロジェクトの最終的な精度値IoU(Intersection
over Union)は 0.83を上回り、画像内の建物を実用可能な範囲まで比較的に精度高くセグメント化できます。
推論結果例
下図に示すように、緑の枠は正しいポリゴンで、オレンジの枠はアルゴリズムによって予測した結果とします。IoUは、2つのポリゴンの重なり面積を2つのポリゴンの接合面積で割った結果となります。実用的には、IoU>0.5が必要だと思われます。
IoUの定義
お問合せ
日本スーパーマップ株式会社 事業統括部 イノベーション営業部門
TEL 03-5419-7912
E-Mail innov-sales@supermap.jp
[ 製品についてのお知らせ一覧に戻る ]