堀内 颯人 特徴量重要度を用いた決定木機械学習モデルの波高予測への適用 細山田 得三 洋上風力発電設備の施工や船舶の運行などの可否判断には,低波高時における7日先までの波高予測が求められる.しかし,現行の予測システムでは空間解像度や予測精度が,不十分である可能性が指摘されている.このことから先行事例『GWMとXGBoostを用いた1週間波浪予測』をはじめとして,機械学習による予測精度向上の検討が進められてきたが,機械学習に必要な特徴量エンジニアリングやモデルの予測理由や挙動の解釈が行われていないなど不完全な検討がほとんどであり,真に機械学習の性能を発揮しているとはいえない.そのため,本研究では,一般的とされる機械学習を用いて低波高時の波高予測を行い,その性能を評価するとともに適切な機械学習の手法を提案する.また,波高予測における風速データの違いが予測精度にどのような差異が発生するかを検討する.モデルおよびライブラリは,テーブルデータを扱うこと,モデルの解釈性を考慮し,TabNetとXGBoostを使用する.入力したデータはNOWPHAS:波高観測値の有義波・波高(m),JRA-55:長期気象再解析値の地表10(m)u・v方向風速(m/s)である.予測時点から過去のデータの変化や組み合わせから予測を行う回帰分析あるいは時系列解析として扱う.一般的な回帰分析として扱えば,今後発展的な手法やモデルを適用する際にその効果の推察が容易となる.提案するシステムの第一段階としてある予測時点までの観測値や解析値から特徴量を作成する.次に作成した特徴量をモデルに入力し,学習させる.その学習済みモデルが特に重視した特徴量のみを選択し,再びモデルに入力し,学習させる.そうして作成したモデルと選択した特徴量により予測を行った.特徴量の作成に用いる風速データの地点選定は,XGBoostの特徴量重要度を用いて,各風速地点の特徴量重要度を算出し,上位20地点を最適な風速地点として採用する.結果,風速地点の選定については,リードタイムが長くなるにつれて,西側に位置する風速地点が重要視されるが,その重要度は広範囲かつ低減する.また,予測対象地点による地理的特性や気象条件によって風の性質が変化し,重要視される風速地点に差異が発生する.波高予測については,短期予測であるほど予測精度は高く,風速地点の選定により予測精度は向上する.ただ,予測精度を評価する際には外れ値の扱いや波高観測点ごとの特性を考慮する必要がある.