vol.2
より正確な気象予測を可能にする
史上最大規模の計算を「富岳」で実現
天気予報の精度は年々向上していますが、集中豪雨の起こる場所や台風の進路を正確に予測することはまだ難しいのが現状です。天気予報はスパコンを使ったシミュレーションに基づいており、より精度の高い予報のためにはより多くの計算が必要ですが、それにはより高いスパコンの能力に加え、スパコンを活用できるアプリケーションの開発が求められています。この問題の解決に貢献すべく、八代さんは、スーパーコンピュータ「富岳」の成果創出加速プログラムの課題*1で、将来の天気予報に応用可能な史上最大規模の気象計算を実現しました。
よりよい天気予報のためには膨大な計算が必要
天気予報は、スパコンを使ったシミュレーションに基づいて行われています。スパコンの進歩に助けられ、天気予報の精度は年々向上していますが、予報が外れることもあり、集中豪雨の地域や台風の進路の正確な予測はまだ難しいのが現状です。気象シミュレーションの精度を上げるには膨大な計算が必要だからです。
「私は『富岳』の計算能力を生かして、より精度の高い天気予報の実現に貢献したいと考えました」と、八代さんは「富岳」の開発が始まったばかりの2014年を振り返ります。当時、ハードウェアとアプリケーションを協調させながら設計する「コデザイン」という方法で「富岳」を開発することが決まり、八代さんは気象・気候分野のアプリケーションコデザインの担当者となりました。そして、このコデザインチームは、「将来、気象機関が『富岳』並みの計算能力のスパコンをもつようになったときに、大規模計算についての課題が実利用レベルで解決できているアプリケーションを開発する」というプロジェクトをスタートさせたのです。
天気予報の出発点は、「現在の状態」をよりよく再現すること
雲、雨、雪といった気象現象はさまざまな大気の状態(温度、湿度、気圧、風向、風速など)によってもたらされます。天気予報のための気象シミュレーションでは、地球を取り巻く大気を細かいメッシュで分け、そのメッシュごとに、ある時点の大気の状態が物理法則に従って変化していく過程を計算します(図1a)。このとき簡単ではないのが、現実に近い大気の状態を初期値として与えることです。初期値が現実と大きく異なっている場合はそこから予報される結果の精度が下がってしまいます。現実の大気状態を表す観測データの観測点はメッシュの数よりもずっと少ないため、何かしらの方法ですべてのメッシュに適切な初期値を与えることが必要になります。八代さんたちが取り組んだのはそのための計算です。
八代さんたちは、「アンサンブルデータ同化」という方法を用いました。まず、過去のデータなどを参考にしてメッシュごとに仮の初期値を与え、天気予報の際と同様のシミュレーションを行って一定時間後の値を求めます。次に、観測データと組み合わせて、各メッシュの値をより適切な値に修正します(図1b)。この操作を「データ同化」と呼びます。「アンサンブル」とは「集団で同時に」という意味です。シミュレーションの結果は初期値の少しの違いに対して敏感に反応し、結果のずれ方も変わってきます。そこで、初期値が少しずつ異なるシミュレーションを何個も並行して行い、あるメッシュが初期値の違いに対して敏感であるほど、予報の誤差に大きな影響を与えうるという判断の下で、そのメッシュの値の観測データによる修正の重みを大きくします。
図1
大気シミュレーションとデータ同化
(a)大気シミュレーションでは、地球を取り巻く大気をメッシュで分け、その中の大気の状態が変化していく過程を物理法則に基づいて計算する。この例では水平方向は緯度経度で、鉛直方向は高度または気圧でメッシュを区切っている。メッシュが細かいほど、シミュレーションの精度は上がるが、計算量とその処理時間が増える。このシミュレーションは、天気予報にも、初期値の計算にも用いられる。なお、地球の左下の図では、それぞれのメッシュ内で計算される大気中のさまざまな物理現象と、陸や海との熱・水のやりとりの過程が示されている。(出典:アメリカ海洋大気庁)
(b)データ同化では、仮の初期値から始めた大気シミュレーションの結果と観測データを組み合わせて、各メッシュがより適切な値をもつように修正する。
(気象庁資料の図をもとに作成)
(a)
(b)
「データ同化でどれだけよく現実の大気の状態を再現できるかが、その後の予測シミュレーションの精度を大きく左右します」と八代さんは説明します。このため、各国の気象機関は、アンサンブルデータ同化を行うときのメッシュを細かくしたり、アンサンブルの個数を増やす努力をしていますが、スパコンの能力とアプリケーションの性能の制約から、地表でのメッシュのサイズは10~50km程度、アンサンブルの個数は数十個〜数百個程度にとどまっています。
今回、八代さんたちは「富岳」の全計算ノードの約80%を使って、メッシュサイズが3.5km、1024個のアンサンブルデータ同化計算を行いました。気象機関が行っている計算の約500倍という大規模な計算を、天気予報に利用可能な計算時間で行うことに成功したのです。
「富岳」の性能を生かし、計算効率を上げるアプリケーションを開発
八代さんたちが大気シミュレーションに用いたアプリケーションはNICAM(全球高解像度大気モデル)、データ同化に用いたのはLETKF(局所アンサンブル変換カルマンフィルタ)で、それぞれ理化学研究所の富田 浩文チームリーダーと三好 建正チームリーダーの研究チームが高度化を進めてきたものです。このうちNICAMでは、2013年にスーパーコンピュータ「京」を用いて、地球全体を水平870mメッシュに区切った世界最高解像度のシミュレーションに成功しています(図2)。当時、八代さんも富田チームの一員としてこの計算に携わりました。
図2
NICAMによる大気シミュレーションの例
2012年8月25日00時の観測データを初期値として、地球全体の大気をメッシュサイズ870mでシミュレーションした結果(6時間後)。「京」の全計算ノードの約4分の1にあたる2万ノードを使用することで、大気の流れ、台風の成長などを、精度よく再現することが可能となった。(海洋研究開発機構・東京大学大気海洋研究所(HPCI戦略プログラム分野3)および理化学研究所の共同研究/可視化 吉田 龍二)
今回は、メッシュサイズが3.5kmではあるもののNICAMでの計算を1024個並行して行い、それぞれの途中でLETKFを使ってデータ同化を行うという、史上最大規模の計算でした。さらに、この計算を実際の天気予報に応用するには、現実の時間の経過よりも速く計算を終える必要がありますが、これほどの膨大な計算を短時間で行うことは「富岳」の計算能力があればできるというほど簡単なことではありません。八代さんたちは膨大な計算を速くするために、アプリケーションにいろいろな工夫を施しました。
特に、大気シミュレーションプロセスからデータ同化プロセスに移る際には、大量のデータを受け渡すことが必要ですが、そのデータ移動に要する時間をなるべく減らすように、アプリケーションを工夫しました。また、「富岳」の計算ノードに付属しているSSDを最大限に利用してデータの読み書きを速くすることも心がけました。SSDは一般のパソコンにも使われ始めている記憶媒体で、データの読み書きを素早く行えるのが特徴です。今回は、SSDが搭載されているという「富岳」のハードウェアの特徴を、アプリケーションで活用したわけです。
「『富岳』は『京』のよいところを受け継いだ世界に誇るスパコンですが、性能を生かしきるためのさまざまな工夫ができたのは、スパコンをつくる側と使う側がコデザインをしてきたからです。コデザインによって、我々の成果だけでなく今後さまざまな科学分野での計算の成果が上がると思います」と八代さんはコデザインの意義を語ります。
今回のアンサンブルデータ同化の結果を用いた気象予測は、今後計算を行って精度を検証する予定ですが、「成果創出加速プログラムの別の研究チームによる計算結果(図3)から見て、精度はかなり上がると予想しています」と八代さんは自信をのぞかせます。10年後か20年後、今回開発されたアプリケーションの知見を反映したアプリケーションが世界の気象機関で開発され、使われるようになれば、集中豪雨の地域や台風の進路をこれまでよりさらに正確に予報できるようになり、被害を減らすのに役立つことでしょう。
図3
アンサンブル個数の増加による天気予報の精度向上の例
成果創出加速プログラム課題のテーマ1のチームが、「令和2年7月豪雨」の際の観測データを用いて「富岳」で計算を行った結果。アンサンブルデータ同化のあともアンサンブル計算を続けて、12時間後に大雨(3時間で50mmを超える雨)が起こる確率を予測した。赤に近いほど確率が高いことを示す。気象庁メソアンサンブルによる21個のアンサンブルでは大雨の位置がはっきりしないが、同チームによる1000個では位置がかなり特定され、有効な避難情報として利用可能な予測となった。1000個のアンサンブルで確率が高いと予測された地域は、実際に豪雨が降った地域とよく一致していた。
Le Duc et al. (2021): Forecasts of the July 2020 Kyushu heavy rain using a 1000-member ensemble Kalman filter, SOLA
アンサンブル数:21個
アンサンブル数:100個
アンサンブル数:1000個
【注 *1】
課題名「防災・減災に資する新時代の大アンサンブル気象・大気環境予測」(代表者:東京大学大気海洋研究所 佐藤 正樹 教授)。テーマ1「短時間領域スケール予測」(責任者:気象庁気象研究所 川畑 拓矢 室長)、テーマ2「全球スケール予測」(責任者:東京大学大気海洋研究所 宮川 知己 准教授)、テーマ3「先進的大規模データ同化」(責任者は八代さん)の3つからなる。
戻るRIST高度化支援が大アンサンブル気象・大気環境予測の研究に貢献しました
気象庁非静力学モデル(NHM)の並列前処理プログラム実行時間が伸びる問題について、RISTによる高度化支援で大幅な性能向上を実現しました。これにより、前処理を含めた計算を「富岳」1万656ノードまで規模を拡大した上に高速に処理するという、「京」ではできなかった計算が可能になりました。
研究者紹介
八代さんはもともと研究者になろうと思っていたわけではありませんでした。修士課程のときに就職活動の面接で自身の研究について熱く語ったところ、面接官から「その研究を続けないのか」と問われ、研究者として生きていく道に目覚めたそうです。学生時代の専門は物質循環学で、空気中の温室効果ガスの分析結果を解釈するためにシミュレーション結果を利用していました。それが次第に、シミュレーションをする、さらに、アプリケーションを開発するという方向へ研究がシフトしてきたのです。2019年7月に理化学研究所から国立環境研究所に移り、温室効果ガス観測衛星「いぶき」の観測結果と大規模シミュレーションを組み合わせる研究にも携わっています。趣味は学生時代から続けてきた合唱で、研究所内の同好会で活躍中です。
研究課題名:
防災・減災に資する新時代の大アンサンブル気象・大気環境予測(hp200128)
課題代表者:東京大学大気海洋研究所 佐藤 正樹
(2020 ACMゴードン・ベル賞ファイナリスト研究成果)
Connecting the dots
大学院生の頃、近くの研究室が並列計算機を研究していました。当時、古典分子動力学プログラムを作っていた私にソースコード提供の話があったので、お渡ししたところ、しばらくして星野 力 先生から、案外簡単に移植できたよ、と言われました。当時、その意味するところを私は理解できなかったのですが、その頃以来、計算物質科学周辺に居ます。
東芝に入って間もない頃、住友化学の吉田 元二 氏に定量的構造活性相関という考え方を教えていただきました。当時、CRAYを使って第一原理計算に没頭していた私には衝撃的な内容で、データの重要性を思い知らされました。
時は下って、ある日、文科省の企画官という方からスパコン開発について調査しているので話が聞きたい、と言われ、問われるままに思いを語っていたら、いつの間にか(?)矢川 元基 先生が主査を務める「計算科学技術推進ワーキンググループ」の委員になっていて、次世代スパコン開発計画を答申していました。答申した限りは使えなければ意味がないと思い、HPCI準備段階コンソーシアム報告書の産業利用の章の素案をいろいろな人に助けてもらいながら書きました。新しい道具を使える人の育成も重要と思い、特に産業界で活躍できる人材育成の提言を小柳 義夫 先生が主査を務める委員会で作成もしました。その後、平尾 公彦 先生に誘われて理研AICS(現R-CCS)に、寺倉 清之 先生に誘われてNIMSにと、国研に10年あまり在籍しました。
“Connecting the dots”、日本風に言えば“縁は異なもの”。現在、兵庫県下の団体に所属していますが、いろいろな環境に居たので、HPCコミュニティの外の風(期待と圧力)を感じてきました。中にいると保守的になりがちですが、(昔の)企業の新人研修で必ず聞かされた言葉「変化に対応できるものだけが生き残る」ということを最近、強く感じています。
次回は、私がこの世界に深入りする要因となった初代地球シミュレータやスーパーコンピュータ「京」の開発の中心人物、神戸大学 横川 三津夫 教授につなぎます。
現在の所属先での筆者