すべてを変えるコンピューター

ブログ

ホームページホームページ / ブログ / すべてを変えるコンピューター

May 11, 2023

すべてを変えるコンピューター

La nuova potente macchina di Argonne National, Aurora, in lavorazione da otto anni.

8 年かけて開発されたアルゴンヌ国立研究所の強力な新しいマシンである Aurora は、現代の最も差し迫った問題のいくつかを解決するのに役立つ可能性があります。 スーパーコンピューティングの新時代へようこそ。

もしあなたが、自分の人生でもっと何ができたのかを考えるタイプの人なら、私からいくつかのアドバイスがあります。リック・スティーブンスとは話さないでください。 彼と会話を始めてからわずか 15 分で、私はすでに馬鹿になったような気分になります。 表面的には、私は直接アイコンタクトを取り、メモを取り、指を唇に当てて、彼のすべての言葉に注目していることを示しています。 心の中では、YouTube でザ・ソプラノズ のクリップを何時間も繰り返し観てきたことを考えています。

Stevens は、ルモント南西部の郊外にあるアルゴンヌ国立研究所のコンピューティング、環境、生命科学の副研究所長です。 タイトルは彼の功績をくどくどと曖昧にしています。 14歳でコンピュータープログラミングを始めたスティーブンスは、まだミシガン大学の学部生だった1982年からアルゴンヌ(1946年に設立され、米国エネルギー省とシカゴ大学が共同運営する国内初の国立研究所)に勤務している。州。 アルゴンヌに入社した後、ノースウェスタン大学でコンピューター サイエンスの博士号を取得しました。 過去 40 年にわたり、彼はアルゴンヌのスーパーコンピューティングにおける重要な進歩の中心人物でした。

11 月の晴れた日、私はアルゴンヌの計算速度と処理能力における次の大きな飛躍である Aurora スーパーコンピューターについて詳しく学ぶために Stevens のオフィスに座っていました。 この研究所は、その歴史のほぼ全期間にわたり、概念化、策定、資金調達、設計、構築、テスト、運用という絶え間ない状態でスーパーコンピューターに取り組んできました。 しかし、数十年にわたる容赦ないイノベーションの中で、Aurora はユニークなマイルストーンです。 このマシンが完全に構築され、稼働すれば(アルゴンヌ当局は早春を期待している)、コンピューティングの新たな前例のない段階であるエクサスケールで稼働する世界初のスーパーコンピューターの1つとなる。

これが私がスティーブンスと話をしに来た理由です。 彼の身長は6フィートを超え、素晴らしい長い茶色の髪が肩を越えて垂れており、フットボールをしていそうな幅広の体格を持っています。 私が彼に会った日、彼は眼鏡をかけ、ビルケンシュトックのサンダルと靴下を履き、流れるような黒のヨガパンツ、そしてゆったりとしたスウェットシャツを着ていました。

私が彼に尋ねた最初の質問は、オーロラが私たちの日常生活にどのような影響を与えるかということです。

「その影響は何ですか?」 スティーブンスは修辞的かつ疲れ果てた様子で答える。 「そうですね、過去 20 年間にスーパーコンピューティングが世界に与えた影響から、そのヒントが得られるかもしれません。大規模な気候について私たちが知っていることはすべて、スーパーコンピューターでの気候シミュレーションから得られます。私たちが人間について知っていることは、ゲノムは大型コンピューターでの膨大なデータ分析から生まれています 現在 AI で起こっていることはすべて大型コンピューターで起こっています 車を運転できるかもしれないシステムを構築できるという考え自体が 膨大な量のコンピューティングの結果です原子炉を設計する私たちの能力も、新しい電池を思いつく能力も、すべてコンピューティングの結果なのです。」

気候、ヒトゲノム、原子力、ロボットだけです。

「エクサスケール マシンはその最新バージョンです。エクサスケール マシンは、今世紀初頭のマシンよりも 100 万倍高速です。」と Stevens 氏は続けます。

それにしても、「100万倍の速さ」を経験的にどうやって目撃できるのでしょうか? 日常生活の中でどうすればそれを物質的に見ることができるでしょうか? 最初の質問を繰り返したくなかったので、フォローアップの形で質問します。エクサスケール コンピューティングは、現在実行できない機能を実行する予定ですよね。

「そうですね、100 万倍速いです」とスティーブンスは答えます。別の言い方をすれば、当然です。

それから彼は、私がこれまでインタビューしたことのある人が誰もやったことのないことをします。彼は私がどのようにストーリーを書けばよいかを私に説明します。

「これらのマシンに関する奇抜なレポートは、あまり啓発的ではありません」と Stevens 氏は言います。 「記者がそうするのを好むのは、人々が『電話を持っていて巨大なクラウドと通信し、そこには何千ものプロセッサがある』という考えに慣れすぎているからであり、それは本当だ。業界は過去15年にわたってそれを構築してきた」私たちがこれらの科学マシンを構築するのは、それらが科学の問題に焦点を当てているからですが、クラウドはご存知のように、Twitter、Facebook、Discord サーバーやあらゆる種類のランダムなもの、フェイクニュースなどを動かしています。」

スティーブンスは、天体物理学と高度なコンピューターサイエンスに関する分厚い本の壁を背後に置いて、この大声を上げながら何度も目を丸くしました。 そして、単なる人間の計り知れない力を呼び起こすファンタジアの魔術師のように、彼は情熱的になります。

「スーパーコンピューターなしでは飛行機の設計はできません。スーパーコンピューターなしでは飛行機のエンジンの設計はできません。スーパーコンピューターなしでは車の設計もできません。スーパーコンピューターなしではガソリンの混合物の設計さえできません。おそらく何か、価値のあるものに名前を付けようとするでしょうが、そのルーツはある種のハイエンド コンピューティング シミュレーションやデータ分析システムにあるでしょう。」

スティーブンスがコンピューターに関するほとんどの話を否定したとき、私は何を意味していたのかがわかり始めました。 しかし、おそらく私が小さな子供のような知性を持っているように見えたので、彼は私に率直に言いました:「本当の話は、何十年にもわたって高性能コンピューティングの進歩に取り組んできた人々のコミュニティがあるということです。そしてそれが全体を動かしています」経済。"

私は、彼が私そのものに対してではなく、コンピューターが一般の人々にとって何を意味するかについて不満を抱いていることに気づき始めました。 コンピュータに関する会話は、コンピュータが人類全体にどのように利益をもたらしたかに焦点を当てるのではなく、コンピュータがどのように私たちの生活をより便利にするかに焦点を当てる傾向があります。 いずれにしても、スティーブンスの言うことは正しい。これは、オーロラが私たちの生活をどのように変えるかについての物語ではなく、オーロラが世界をどのように変えるかについての物語である。

Aurora について学び始める前、私のコンピューターの歴史に対する理解は明らかに還元的でした。 私が推測したのは、それは多かれ少なかれチューリングマシンであり、それに続いてガクガク音を立ててカタカタ音を立てて動き回り、政府職員、ロシアの科学者、IBMの従業員以外には使用するにはあまりに扱いにくい巨大でかさばる機構が続き、その後にPCとビル・ゲイツが続いたのではないかと推測した。そしてインターネット、そしてスティーブ・ジョブズと彼のiPhone、そして今では冷蔵庫のドアでウェブを閲覧している間、HomePodにBBCを再生するように頼むことができます。そしてすぐに、私たちが気づかないうちにロボットが私たちのためにすべてをやってくれるようになるでしょう。巨大なシミュレーションの中で生きている。 確かに、それは明らかにそれよりも複雑です。 しかし、本当にそうなのでしょうか?

もちろん本当にそうです。 コンピューティングの歴史は広大かつ多面的であり、さまざまなクラスのマシンが複雑に絡み合っていますが、スーパーコンピューターはそのうちの 1 つにすぎません。 彼らの物語は 1950 年代に遡り、米国本土で始まります。当時、シーモア クレイはミネアポリスのコントロール データ コーポレーションのエンジニア グループに加わり、1960 年にデビューした CDC 1604 を構築しました。これが本当に最初のスーパーコンピューターだったのかについては議論があります。しかし、議論の余地のないことは、それが世界最速のコンピューターであったこと、そしてそれがより高速なコンピューターを構築するという世界的な探求を引き起こしたということです。

1970 年代後半、スーパーコンピューターの設計者は問題に直面しました。中央処理装置 (CPU) の速度は 1 メガヘルツに達しており、これは 1 秒間に 100 万個の関数を循環できることを意味しますが、コンピューター科学者はそれが実現できるとは考えていませんでした。もっと早く。 解決策は並列処理、つまりより多くの CPU を使用してコンピュータをより高速かつ高性能にすることでした。

「それは脳について考えるようなものです」とスティーブンスは言う。 「人間の脳は一定の速度でしか動作しません。そして、より多くの知力を得たいのであれば、より速い脳ではなく、より多くの脳が必要です。」

このように考えると、スーパーコンピューターは、ジョン カーペンターやフランク ハーバートのグロテスクな SF 作品とそれほど変わりません。 それらはまったく怪物的ではありませんが、その非常に複雑なため、理解するのは恐ろしく難しい場合があります。 特に数学。

この時点で、スティーブンスはマーカーを取り出し、オフィスを横切ってホワイトボードに向かって歩きます。 私は今、彼の講義の一つを受けています(彼はシカゴ大学の教授でもあります)。

「個々のプロセッサの速度はどのくらいですか? 推測はありますか? あなたの iPhone のプロセッサはどのくらい速いですか?」

「本当に分かりません」と私は少し疲れながら答えた。

「何かをでっち上げてください。そこに時計があります。その時計はどれくらい速いですか?」

「1秒間に何回転しますか?」 私は、ただ教えてほしいと懇願するような口調で尋ねました。

「まあ、回らないよ」と余計なことを言う。 「でも、そうだね、数字をでっち上げてね。」

"100万。" それは合理的な推測だと私には思われます。

「実際には10億です。」

彼がボードに数字を書き始めるまで、永遠のように感じられる数秒の休止期間があります。

「iPhone や PC などの基本プロセッサは 1 ギガヘルツ、つまり 1 秒あたり 10 億サイクルで動作します。5 ギガヘルツで動作するものもあれば、2 ギガヘルツで動作するものもあります。iPhone は実際には約 1 ~ 3 ギガヘルツで動作しますが、実際にはそうではありません。 「問題はありません。これは約 10 の 9 乗です。そして、1 秒あたり 10 の 18 乗の演算を実現したいと考えていました。これはエクサスケールです。」

アルゴンヌの文献では、この動作速度は「10 億」と呼ばれており、既存の数字を 2 回繰り返す必要があるほど大きな数字のように思えますが、技術的には 1 秒あたり 1 京回の動作、つまり 1 エクサフロップスです。 これをより適切に組み立てる方法は次のとおりです。私が生きている間に、コンピューターは 1 兆倍も高速になりました (私はこの夏 40 歳になります)。

しかし 2007 年当時は、エクサスケールが可能かどうかさえ誰も知りませんでした。 その年、エネルギー省は、アルゴンヌ、バークレー、オークリッジの 3 つの国立研究所でタウンホールミーティングを開催し、エネルギー省の科学者たちがこの速度で動作するスーパーコンピューターをどのように実現できるかを議論しました。

スティーブンスとともに、それらの会話の参加者の一人は、彼の副官であるマイク・パプカでした。 パプカは 30 年前、イリノイ大学シカゴ校でコンピューター サイエンスの修士号を取得するために勉強していたときにスティーブンスと出会いました。 それ以来、彼はアルゴンヌ大学にいます(そしてシカゴ大学で博士号も取得しました)。 「マイク・パプカ」というと、街角の蛇口で一緒にビールを飲むような人の名前のように聞こえるかもしれませんが、まさにそのような人です。 彼の白髪は短く刈り込まれ、分厚い黒縁の眼鏡をかけており、リック・ルービンと同じくらい長い白いふさふさしたひげを生やしている。 彼の会話スタイルは現実的で気さくで、ジャルディニエラと同じくらい太いシカゴ訛りで話します。 16 年前の DOE の市庁舎について彼に尋ねると、彼は「漠然としたもの」だと言いましたが、「[エクサスケール] に必要なインフラストラクチャは不可能だ」と思ったことを覚えています。

DOE の科学者たちが招集されたとき、彼らは特に 3 つの困難な障害に直面しました。 1つ目はパワーでした。 当時、彼らはエクサスケール コンピューターには原子力発電所に相当する 1,000 メガワットの電力が必要であると見積もっていました。 彼らは、資金を確保するために政府に提出できる最も説得力のある主張は、それを20メガワットに削減することであると判断した。 980 メガワットをスライスするのは極端だと思われる場合、野心的な目標を設定することが最大限の進歩を達成するのに役立つとパプカ氏は指摘します。 「トレードオフをする必要がある」と彼は言う。 「そこにテクノロジーを導入する方法を見つけるまで、さらに 15 年待つつもりですか? それとも先に進むつもりですか?」

次の問題は信頼性でした。 ラップトップと同じように、スーパーコンピューターも過熱するとクラッシュする可能性があります (小規模工場と同じくらい多くの電力を必要とするマシンではよく起こります)。 DOE の乗組員は、エクサスケール マシンのクラッシュを 1 日 1 回に制限するという目標を設定しましたが、これはまだ多いように思えます。 しかしスティーブンス氏は、スーパーコンピューターがすべての仕事を失うわけではないと説明する。 「何が起こるかというと、マシンがクラッシュしたときに、復元して作業を続行できるように、常にスナップショットを取得していることになります。」と彼は言います。 「これはコンピューター ゲームのようなものです。人が殺されても、再起動するだけで中断したところからゲームが再開されます。」

オーロラは世界で最も複雑な交響曲のようなもので、何十万もの異なる楽器が一斉に演奏して音楽を続けます。

おそらくご想像のとおりではありませんが、最大の問題は規模でした。 確かにスーパーコンピューターは物理的に巨大ですが、理解するのが最も難しいと思われるのはマシンの内部にあるものです。

「ハードウェアに関しては、大したことはありません。ハードウェアを追加できるだけです」と Stevens 氏は言います。 「しかし、ソフトウェアの面では、大したことです。次のように考えてください。感謝祭のディナーを作り、これらすべての料理を並行して調理しています。そして、食事を調理するのにかかる時間は決まっています。」たとえパイが 1 時間しかかからなかったとしても、あるいは野菜が 30 分で調理できたとしても、最も遅いステップ [七面鳥] によって計算します。ですから、これらの計算で同じ問題を考えてください。ただし、感謝祭に 20 個のものを用意する代わりに、 100 万ものことを手に入れましたが、今は 10 億ものことを並行して実行しなければなりません。そして、これがどのくらい速いかは、最も長いステップによって決まります。つまり、その最も長いステップをできるだけ速くする必要があります。 」

スーパーコンピューター ソフトウェアはその複雑さに加えて高価です。 科学の世界はシリコンバレーのテクノロジー企業のようには機能しません。 ベンチャーキャピタリストがムーンショットプロジェクトの研究開発に資金を提供するようなスタートアップ文化は存在しません。 科学者にとって、資金を得るのは簡単ではありません。

2007 年から 2015 年の間、エクサスケール コンピューティングに関するすべての作業は研究開発、つまり問題解決と、できるだけ目立たず、最も安価なスーパーコンピュータを構築するためのアルゴリズムの作成でした。 Aurora 自体の費用は最終的に 5 億ドルかかりましたが、エクサスケール コンピューティング プロジェクト全体 (国立研究所間の共同作業) の費用はさらに高額になります。 そしてその資金を確保するために、科学者たちはエクサスケールの研究が可能であることを証明する必要がありました。

「50億ドルを要求するのは簡単ではありません」とスティーブンスは無表情で言う。 「つまり、質問するのは簡単です。しかし、『分からない』と言った場合、政府は50億ドルの小切手を振り出すつもりはありません。 チームは、『分かった、これを実現できると思われる方法がある、実験を行った、エラーバーを下げた』などと言わなければなりません。」

尋ねるプロセス自体が大変でした。 科学者たちが初めてエクサスケール コンピューティングについて DOE と議論したとき、ジョージ W. ブッシュが大統領でした。 それ以来、他に 3 つの政権が誕生し、さまざまなエネルギー長官が配置され、軽く言っても非常に異なる議題を抱えていました。 「政府が変わって全員を再教育しようとしているのに、あなたは同じ主張を何度も何度も繰り返している」とスティーブンスは言う。 「つまり、これらすべての問題に何らかの形で取り組み、計画を立て続け、新しい計画を立て、より良い計画を立てて、それを販売する必要がありました。それには膨大な努力が必要でした。」

アルゴンヌの科学者らが 2015 年に実際に Aurora の開発を開始する準備が整うと、ソフトウェアとハ​​ードウェアを製造したインテルおよびヒューレット・パッカード エンタープライズと調整して、そのプロセスも管理する必要がありました。 「火星に行くような気分でした」とスティーブンスは言う。 「あなたが今見ているのは、水面から突き出ている氷山にすぎません。ええ、私たちは機械を手に入れました。しかし、それ以前に起こった努力の90パーセントは見えません。」

ここはとてもうるさいんです」と、研究室のすべてのスーパーコンピューターを収容しているアルゴンヌのデータセンターの出入り口のすぐ外でデイビッド・マーティン氏は語った。私たちが中にいると、世界最大のエアコンの前に立っているような音がする。マーティンは業界パートナーシップとアウトリーチのマネージャーであり、研究のためにアルゴンヌのスーパーコンピューターにアクセスして使用する方法について、サードパーティ (通常はゼネラル・エレクトリック、ゼネラル・モーターズ、ボーイングなどの企業) と調整していることを意味します。 2011 年にここから始まり、IBM、フェルミ研究所、AT&T ベル研究所に勤務しました。

アルゴンヌ社は、スーパーコンピューターを収容するために、データ センターとそれをサポートするインフラストラクチャを、基本的にまったく新しい建物として建設しました。 実機は「機械室」にあります。 オーロラはバスケットボール コート 2 面とほぼ同じ大きさ (約 10,000 平方フィート) で、高さは約 8 フィートです。 アルゴンヌ社は、そのために機械室に全く新しい棟を追加しました。 ただし、最も多くのスペースを占めるのは、スーパーコンピューター自体ではなく、スーパーコンピューターを動作し続けるために必要なユーティリティです。

オーロラの上には電気室と呼ばれるフロア全体があり、スーパーコンピューターへの電力供給に専念しています。 このスペースは飛行機の格納庫と同じくらいの大きさで、巨大なブレーカーボックスのように見える金属ステーションの集合体があり、1万世帯以上に電力を供給するのに十分な最大60メガワットの電力を生成できます。 Papka 氏は、60 メガワットが絶対的な限界であると強調します。その場合、Aurora はおそらく 50 ~ 54 メガワット程度で動作するでしょう。 「私たちの古いシステム Mira の最高出力は 9 メガワットでした」と Papka 氏は言います。 「しかし、電気代を見てみると、約 3 年半かかりました。つまり、ピークを目標にすると、すべてが完璧で、そのチップ上のすべてのシリコンを使用することになります。そのすべてを消費することになります」力だ。しかしそこには決して到達しない。」

この部屋は、ペタスケールの Polaris を含むアルゴンヌの既存のスーパーコンピューターにも燃料を供給し、建物内のすべての電力を供給していることに留意することが重要です。 2007 年に DOE 市役所の科学者たちが、エクサスケール コンピューターには 1,000 メガワットの電力が必要になるのではないかと懸念していたことを考えると、940 メガワットの削減は驚異的な成果です。

しかし、本当の革新はオーロラの下の階、つまり機械式ブリッジにあります。 ここでは、さまざまな幅の迷路のようなパイプが部屋の周りを歩き回り、水を送り、冷却し、濾過します。 スーパーコンピューターは長い間液体冷却を使用してきました (パプカ氏は、冷却剤として石油を使用していた 90 年代初頭のクレイ製マシンを思い出します) が、配管コストを削減するために、アルゴンヌでは過熱を防ぐファンへの依存度が高まっています。 新しいスーパーコンピューターを冷却できるほど強力なファンはないため、科学者はより効率的な水冷システムを開発する必要がありました。 これは、より洗練されたバスルームであることを除けば、高級バスルームで輻射床が足の冷えを防ぐ方法とそれほど変わりません。

Polaris は、その下の水とその上のジェット ファンの組み合わせによって温度が制御されているため、データ センター内で大きな騒音が発生します。 Polaris が必然的に廃止されると、ファンの騒音は止まり、Martin が「ハム音」と表現する騒音に置き換わります。 主にファンによって冷却される別のスーパーコンピューターが登場するかどうかは疑わしい。 「責任ある環境市民である研究室の観点から見ると、水の良いところは、それが水であるということです」とパプカ氏は言う。 「あらゆる物質の移動熱に関して最高の係数を持っています。」

この機械室には Aurora と Polaris の両方が保管されており、おそらく当面はすべてのスーパーコンピューターがそこに残ることになるでしょう。 サッカー場ほどの大きさがあり、頭上には標準的なオフィスビルと同様の蛍光灯が設置されています。 床には、特大のピザ箱ほどの大きさの四角い灰色のタイルの格子があります。 タイルは取り外し可能であるため、建設作業員は床を通して機械室のパイプにアクセスでき、作業中に他のものを損傷することなく特定のパイプを隔離して修理できます。

私がアルゴンヌに来たその日、約 20 人の建設作業員がオーロラの建設に忙しく働いていました。 このスーパーコンピューターの当初の完成予定日は 2020 年だったが、新型コロナウイルス感染症のパンデミックによって引き起こされたサプライチェーンの問題により、予定は延長された。 建設現場への立ち入りは禁止されていますが、黒いキャビネットが何列も並んでいるように見えるものを見つけました。 最終的に、Aurora は、『スカイフォール』や、おそらく最も正確に言えば、マイケル マンの『ブラックハット』などのハイテク スパイ映画で見た大規模なコンピューター サーバーのさらに大きなバージョンに似たものになるでしょう。

機械室の外には長い廊下と窓があり、訪問者はオーロラの広角の景色を眺めることができます。 ここから、Martin はスーパーコンピューターの構成要素を形成するノードを見せてくれます。 これらのノードは、ラップトップのキーボード表面の下の外観 (チップ、ドット、金属棒の配列) に似ています。 片側に蛇行する小さな白いチューブは、プロセッサを冷却するために使用されます。 「冷凍工場の道路から始まるこの大きな24インチのパイプには、冷水が流れてきます」とパプカは言う。それがプロセッサに届きます。」 オーロラは世界で最も複雑な交響曲のようなもので、何十万もの異なる楽器が一斉に演奏して音楽を続けます。

スーパーコンピューターは、これらのノードを何列にも重ねて積み上げたもので、青と赤のチューブが各パネルからループ状に伸びており、電力と冷却を提供します。 これらの建設作業員は、インテルから段階的に出荷される各ノードにスロットを取り付けて配線する最終段階にあります。 Aurora のノードは、これまでスーパーコンピューターが動作していた CPU ではなく、主にグラフィックス プロセッシング ユニット (GPU) に依存しています。 GPU は、ビデオ ゲームや映画の特殊効果の設計に使用されるプロセッサと同じです。

「人々は、GPU が実際に非常に高速に計算を実行することに気づきました」と Martin 氏は説明します。 「そこで私たちは Intel と協力して GPU の設計を支援しました。Intel はグラフィック レンダリング エンジンとすべてのレイ トレーシングを取り除き、より多くの計算能力を追加しました。つまり、これらの GPU は計算アクセラレータです。」 パプカ氏は、このスーパーコンピューターの革新は 90 年代後半に遡ると述べ、「世界中が 14 歳のゲーム好きに感謝する必要があります。それが主にゲームの原動力だったからです。」と述べています。

Aurora の GPU はスーパーコンピューターの未来であるだけでなく、パーソナル コンピューターの未来でもあります。 最終的に、Intel はすべての PC にこれらの新しいプロセッサを搭載することになります。 その意味では、スーパーコンピューターはタイムマシンに似ています。 「政府が構築するこれらの共有リソースは、私たちに未来を垣間見せてくれます」とスティーブンス氏は言います。 「科学界は、5 年後、10 年後に誰でも簡単に利用できるようになるものを実験することができます。」

したがって、これらの強化された GPU の 1 つを搭載すると、10 年後にあなたの PC がどれほど高速になるか想像してみてください。 Aurora には各ノードに 6 つの GPU があり、ノード数は 10,000 です。つまり、今年は将来のコンピューターの 60,000 倍の速度で動作することになります。

そのスピードとパワーは現実世界の問題の解決にどのように反映されるのでしょうか? あるいは、アルゴンヌの従業員が好んで表現するように、「Aurora ではどのような問題に対処できないのでしょうか?」 エクサスケールに取り組んでいる科学者たちは、オーロラとそれに類するスーパーコンピューターが、より優れた新しい薬の開発、工学の改善、気候変動の軽減、さらには宇宙の謎への理解をさらに深めるのに役立つと考えていると述べています。 しかし、一体どうやって 1 台のマシンですべてのことを行うことができるのでしょうか? オーロラにガンの治し方を聞くだけで教えてくれるわけではありませんよね?

最短の答えはシミュレーションです。 今日、科学者が行う発見のほとんどは、現実世界の状況をスーパーコンピューターでシミュレーションすることによって実現されています。 「それは私たちが気候モデリングを行う方法とそれほど変わりません」とスティーブンス氏は言います。 「私たちは雲と気温を測定できる衛星を持っています。大気の現在の状態に関するデータを収集するためにあらゆることができ、そのデータは何年も遡って保存されています。しかし、理論を実際にテストするには、次のようなことが必要です。 「気候システムがメタンや二酸化炭素の変化にどれだけ敏感かを知るには、シミュレーションを行う必要があります。外に出て地球の複製を作り、大気の組成を変えて研究してみましょう、などとは言えません。」

スーパーコンピューターのシミュレーションが現実世界に影響を与える例を尋ねると、アルゴンヌの従業員は自動車の安全性を挙げます。 衝突試験用のダミー人形を車内に積んだ車が高速で石の壁に激突するスローモーションビデオが放映された古いテレビコマーシャルを覚えていますか? そうですね、それは今でも自動車メーカーが安全性をテストする方法です。 しかし、車の衝突には多額の費用がかかるため、企業は保護を強化しながらコストを削減する方法を常に模索しています。 最初にスーパーコンピューターのシミュレーションを実行することで、自動車メーカーは、自動車を物理的に衝突させる前に、複数のシナリオを計画し、調整することができます。 場合によっては、それが 1 台の車と数十台の車を建設するか破壊するかの違いを生みます。

研究室の一室で、アルゴンヌ大学の環境科学部門の主任科学者であるラオ・コタマルティ氏が、プロジェクターのスクリーンでさまざまなコンピューターのモデルを見せてくれた。 1 つはマンハッタンにゆっくりと氾濫するイースト川のものです。 「これは電力会社のために行われたことです」とコタマルティ氏は淡々と言う。 「そこで、私たちは将来の50年に一度の洪水を調べようとしているのです。彼らは、気候変動シナリオにおいて自社の施設が安全かどうかを調べようとしているのです。私たちはこれをポータルとして開発しました。都市や場所を特定し、気温に対する一種の影響分析を得ることができます。そして、地域コミュニティは回復力を計画することができます。」 コタマルティ氏は、2011年の福島原発メルトダウンを例に挙げている。 スーパーコンピューターは、日本の原子力発電所に被害を与えた地震や津波のような自然災害を防ぐことはできないが、人類が気候変動の影響と共存できるように、エネルギー施設が保護インフラを開発するのにスーパーコンピューターは役立つかもしれない。

標準的なコンピュータではそれを行うことはできません。 技術的には可能ですが、決してそうしたくないでしょう。 「星の爆発や宇宙の進化を計算したいとします」とパプカ氏は言う。 「ラップトップでそれを行うことはできますか? はい、コードを書くことはできます。しかし、私のシミュレーションはそれほど正確ではありません。」 次にキッカーが来ます。 「そして、計算するには7つの生涯が必要です。」

アルゴンヌ リーダーシップ コンピューティング施設の科学部門ディレクターであるキャサリン ライリー氏は、オーロラのようなスーパーコンピューターが達成できることの例として天体物理学を使用しています。「私たちは皆、原子があり、原子には陽子があり、その周りには中性子と電子があります。しかし、私たちはそれがそれよりも複雑であることを知っています。特定の原子にはもちろんのこと、素粒子の存在など、もっと多くの物質があることを私たちは知っています。つまり、それが意味するのは、物質がどのように形成されたかを理解することです。加速器で何が起こるかというと、膨大な量のデータを生成し、すべてのノイズからその信号を引き出すのです 宇宙のモデルを作成し、超新星のモデルを作成し、それを燃焼させます。それを現実の宇宙で実際に起こっていることと関連付けるためです。」 ライリー氏は、Aurora が処理できるデータ量に純粋に基づいて、より洗練されたモデルを生成できるようになると予想しています。

科学者たちはすでに何年も前からこの研究を行っています。 最も顕著な例はジェームズ ウェッブ宇宙望遠鏡で、前任者のハッブル宇宙望遠鏡よりもはるかに鮮明な詳細で深宇宙の画像を提供し、私たちに宇宙の質感をより深く理解させることができました。 ウェッブ望遠鏡とそれに対応する画像はすべて、スーパーコンピューターでのシミュレーションの結果です。

エクサスケール コンピューティングは、現在のペタスケール スーパーコンピューターよりも 1,000 倍速い計算速度の全く新しいフロンティアを開拓しますが、それは、私たちが突然すべての気候や工学的問題を解決したり、地球の起源や歴史を発見したりできるようになるという意味ではありません。大宇宙。 ライリーは、科学には答えはなく、部分的な答えしかないことをすぐに指摘しました。 あと20問。

変化しているのは、部分的な答えや新しい質問がどれだけ早く得られるかということです。 私たちがこれまでに経験してきたすべての技術革新と、それが年々どれだけ加速しているかを振り返ると、その速度は、私たちがコンピューターを開発する際の絶え間なく向上するスピードとスキルにほぼ対応しています。 Martin 氏はまた、エクサスケール コンピューティングは AI への依存度をさらに高めることになり、AI は人間の介入なしに機能を向上させるコンピューターの訓練に役立つだろうとも指摘しています。 いつかスーパーコンピューターが自らのより良いバージョンを構築するようになる日が来るのは、まったく不合理ではありません。

スティーブンスとの時間が終わる頃には、彼のホワイトボードには数字や図表、方程式がぎっしり詰まっています。 私たちは二人とも、少し唖然としながら静かにそれを眺めていますが、彼にとってそれは、Aurora の開発に費やされた数学的努力のほんの一部にすぎません。 そして、Aurora は最初のエクサスケール コンピューターではありません。テネシー州ノックスビル郊外にあるオークリッジ国立研究所は、インテルではなく AMD のテクノロジーを搭載したマシン、フロンティアを昨年 5 月に発売しました。 (どちらが速いかについては、Aurora がデビューするまでわかりません。)

エクサスケールに関する最初の真剣な議論は 16 年前に行われたので、DOE の科学者がスーパーコンピューターの次の段階であるゼッタスケール (10 の 21 乗) とヨッタスケール (10 の 24 乗) に取り組み始めているかどうかをスティーブンスに尋ねました。 同氏は、議論は確かに始まっているが、スーパーコンピュータの既存のアーキテクチャ内でどちらも実現可能であるかについては疑問を抱いていると述べた。 課題は膨大です。 ゼッタスケールのスーパーコンピューターを保管する施設には 5,000 万平方フィートの広さが必要で、年間の電気代は 5 億ドルになります。 私は、スティーブンス氏と彼の同僚が当初エクサスケールについて同様の懸念を抱いていたことを指摘しましたが、問題は単にそこまで大きくできないというだけではなく、エクサスケールについても同様の懸念を抱いていたと説明しています。 それはまた、それほど小さくすることができないということでもあります。

Aurora の各チップに充填されているトランジスタは 7 ナノメートルで、原子 70 個を並べたものに相当する滑稽なまでに微細な数字です。 原子 1 個分の幅 (可能な限り小さい) のトランジスタを構築することは現時点では非現実的であるため、唯一の選択肢はサブナノメートルのリソグラフィーです。 そのため、ジョー・バイデン大統領が昨年8月に署名した「CHIPSおよび科学法」は、マイクロチップの研究開発への資金提供が国の技術革新の速度を維持するために不可欠であるため、将来のスーパーコンピューターの開発にとって極めて重要である。 しかし、それでも、私たちはゼッタスケールからは程遠いとスティーブンス氏は考えています。もう限界に近いよ。」 私がパプカにどう思うかを尋ねると、彼はこう言いました。「私はどこかのビーチで引退するつもりです。このことについては心配しません。」

Aurora のようなスーパーコンピューターは、タイムマシンに似ています。 「政府が構築するこれらの共有リソースは、私たちに未来を垣間見せてくれます」とスティーブンス氏は言います。 「科学界は、5 年後、10 年後に誰でも簡単に利用できるようになるものを実験することができます。」

量子コンピューティングもあり、理論的には飛躍的に高速なデータ処理が可能になるため、スーパーコンピュータが不要になるのではないかという疑問が生じている。 しかしパプカ氏は、その可能性は低いと考えている。 「スーパーコンピューターは、私たちが質問に答えるのに役立ちます」と彼は言います、「そして、私たちのスーパーコンピューターが時代遅れになったら、もう質問はありません、私たちは世界中に存在するすべての問題を解決したと言わなければなりません。そして、私たちはそうするかもしれませんが、利己的になってもいいが、それが真実になるとは私は思わない。」

さらに可能性としては、スーパーコンピュータを高速化するために GPU を再利用したのと同じように、従来のコンピュータと調和して動作する量子アクセラレータが登場するだろうと同氏は予測しています。 しかし、これは厄介な領域に入りつつあります。 パプカさんは「物事のスピードが速いということを言うと、私もついていけない」と手を挙げて言う。 そして、量子コンピューティングが進歩するにつれ、アルゴンヌ大学は独自の研究開発を行っていますが、より高速で効率的なスーパーコンピューターの開発に取り組む人々は今後もたくさんいるでしょう。

スティーブンスにとって、それは私たちの多くが軽蔑するグループ、つまりZ世代で起こることだ。「この仕事を始めたとき、私は若かったが、もう若くない」と彼は言う。 「私たちが何十年も進歩できるように、若い人たちにこれに取り組んでもらう必要があります。スーパーコンピューティングに貢献するために人々が必要とするトレーニングと教育の量は膨大です。彼らは博士課程の学生、ポスドク、そして何年ものトレーニングを積んだ人たちです。」 」

このコメントを聞いて、コンピューターが私自身の生活をどのように形作ってきたかを考えさせられます。 90年代初頭、父が最初のApple Macintoshを家に持ち帰った日のことを今でも覚えています。そして、その翌日、私がうっかりハードドライブをゴミ箱に引きずり込んだ時の父の表情が、コンピュータープログラマーとしての私の将来を予感させました。 他に彼がそのような顔をしたのを見たのは、水槽が壊れて中の魚がすべて死んだときだけでした。

私の人生における人間以外の最も重要な関係は、コンピューターとの関係でした。 私はこの地球上で、読むこと、書くこと、他の人と話すこと、あるいは、これが重要なことですが、気を紛らわせるために、この地球上でほとんどの時間をスクリーンの前で過ごしてきました。 幼少期や青年期にコンピューターに対する見方が違っていたら、私の人生はどの程度変わっていただろうかと思います。 ここ数年、他の多くの人々と同様、私もソーシャルメディアの利用は途方もない時間の無駄だと嘆いており、ひねくれた一種の慰めとしてソーシャルメディアに頼りますが、それは私を気持ち悪く、苦く、空虚に感じるだけです。

その点において、科学コンピューティングは、技術的な解決策や宇宙の理解を深めるための単なる手段ではありません。 それは可能性の源でもあり、コンピューターを健康と平和的共存の主体として見るように私たちの世界観を再調整する方法でもあります。 おそらくそれは過度に感傷的かもしれないが、Web 2.0 の血の通わない超大企業のうさぎの穴よりは、ありのままの感傷的なほうが良い選択肢かもしれない。

しかし、その前に、アルゴンヌはまだオーロラをパワーアップする必要があります。そして科学者たちは、そのときに何が起こるかはっきりとは知りません。 5 億ドルのスーパーコンピューターの一部は動作しない可能性もあります。 それは、彼らがそれをジャンクして最初からやり直すという意味ではありません。いくつかの調整が必要なだけです。 「私たちはこのスーパーコンピューターのシリアル番号 1 のようなものです」と Martin 氏は言います。 「何か問題が発生した場合、(打ち上げは)1週間、1か月、あるいはそれ以上延びる可能性があります。」

戦略は、Aurora を断片的に実行し始めることです。 私がアルゴンヌに来たその日、ストレス テストのために 2 つのラックの電源を入れた後、すでに問題が発生していると Martin 氏は言いました。 それから 1 か月後、私がパプカにフォローアップすると、彼らはそれらのねじれの一部を解決し、科学者たちはシステムに慣れるためにすでにそれらのラックにアクセスし始めていると述べました。 しかし、オーロラの全機能が完全に理解されるまでにはしばらく時間がかかるだろうと同氏は強調する。 「60,000 個の GPU を組み合わせたわけですが、これまで誰もそんなことをしたことがありませんでした」と彼は言います。 「ソフトウェアはどのように動作するのでしょうか? それを手に入れるまでは、それを理解することさえできません。」

まだまだ未知のことがたくさんあります。 今私たちが知っているのは、それが未来になるということだけです。