アーキテクチャの解明: 分散システムを理解するための重要な論文!

分散システムとは、存在すら知らなかったコンピューターの障害によって、自分のコンピューターが使用できなくなる可能性があるシステムです。

AM チューリング賞受賞者のレスリー・ランポートのこの有名な言葉は、分散システムの構築と維持における課題を要約しています。しかし、なぜこのような複雑なシステムが必要なのでしょうか?

インターネットとよりスマートなデバイスの出現により、処理する必要のあるデータの量は爆発的に増加しました。Uber の注文、Netflix での番組の視聴、簡単な Google 検索、オンラインショッピング、ソーシャルメディアでのやり取りなど、私たちが当たり前だと思っている日常の些細な行動はすべて、数百の分散サービスによって実現されています。これらのサービスはすべて、分散システムに関するいくつかの基礎論文を基盤として構築されています。

このリストは決して包括的なものではありませんが、分散システムの世界に大きな影響を与えた私のお気に入りの論文をいくつか紹介します。

CAP定理

伝統的な論文ではありませんが、エリック・ブリューワーは2000年のACMシンポジウム「分散コンピューティングの原理（PODC）」の基調講演でこの仮説を初めて発表しました。この論文は後にナンシー・リンチとセス・ギルバートによって「ブリューワーの仮説と一貫性があり、利用可能で、パーティション耐性のあるWebサービスの実現可能性」という論文で形式化され、証明されました。

Eric Brewer の CAP 定理は分散システム理論の基本概念であり、分散データストアが一貫性、可用性、パーティション耐性の 3 つの保証のうち 2 つ以上を同時に提供することは不可能であると述べています。ここで言及されている他のすべての論文は、上記の原則を適用し、システム内で必要なトレードオフを行っています。

CAP 定理は、論文に対する読者の理解に基づいて、常に多くの議論を引き起こします。Martin Kleppmann の「 CAP 定理の批判」は、トレードオフについて議論するためのより優れたフレームワークを提供します。

Paxos をシンプルに

2001 年のこの独創的な論文で、Leslie Lamport は、分散システムで簡単かつアクセスしやすい方法で合意を達成するための Paxos アルゴリズムを紹介しています。Paxos ベースの合意プロトコルは、多くのテクノロジー企業が使用する多くの分散データベース、ストレージシステム、メッセージングプラットフォーム、調整サービスのバックボーンを形成しています。これは、Google の Chubby、Google の Spanner、Apache ZooKeeper、Apache BookKeeper などの他のテクノロジーに大きな影響を与えました。

Google ファイルシステム

Google File System (GFS) の論文では、コモディティハードウェア上の大規模な分散データ集約型アプリケーション向けのスケーラブルな分散ファイルシステムを紹介しており、これがその後の多くの分散ファイルシステムの基礎となっています。GFS は、Apache Hadoop フレームワークで使用される分散ファイルシステムである HDFS や、最終的には Amazon S3 (ただし、s3 は根本的に異なります) に大きな影響を与えました。

MapReduce: 大規模クラスタでの簡素化されたデータ処理

このホワイトペーパーでは、分散コンピューティングインフラストラクチャを使用して大規模なデータセットを処理するためのスケーラブルなアプローチを示す MapReduce プログラミングモデルを紹介します。MapReduce は「ビッグデータ」革命において極めて重要な役割を果たし、組織が分散コンピューティングのパワーを活用して大量のデータセットを分析し、そこから洞察を引き出すことを可能にしました。GFS と MapReduce を組み合わせることで、Google がペタバイト単位のデータを処理し、「インターネット」のデータを整理できるようになったことがわかります。

MapReduce の論文 (GFS とともに) は、Apache Hive (Hadoop 上に構築されたデータウェアハウスインフラストラクチャ)、Apache Pig (Hadoop 用の高レベルデータフロー言語)、Apache Spark (メモリ内データ処理エンジン)、Apache HBase (分散型 NoSQL データベース) など、Apache Hadoop を中心に構築されたツールとライブラリのエコシステム全体の開発に影響を与えました。

Bigtable: 構造化データ用の分散ストレージシステム

Bigtable の論文は、 Google で構造化データを管理するための分散ストレージシステムを表しています。MapReduce と GFS によって Google がコスト効率の高い方法で大規模なデータを処理できるようになった後、次のステップは信頼性が高く可用性の高い方法でデータにアクセスできるようにすることでした。Bigtable は、Web インデックス作成、Google Earth、Google Finance などのアプリケーションに柔軟で高性能なソリューションを提供できました。

MapReduce が「ビッグデータ」時代に革命をもたらしたのと同様に、BigTable 論文は「NoSQL」時代の原動力となりました。Bigtable 論文で紹介された設計原則やアーキテクチャ概念の多くは、「Apache HBase」、「Cassandra」、「MongoD」などのテクノロジーで使用されました。これらのアプリケーションの一部は異なるデータモデル (MongoDB など) を使用する場合もありますが、水平スケーラビリティ、フォールトトレランス、自動シャーディングなどの共通原則を共有しています。

Dynamo: Amazon の高可用性キーバリューストア

Dynamo の論文では、Amazon が開発した可用性の高いキーバリューストアの設計と実装について紹介されています。Dynamo は、ショッピングカート内のアイテムなど、非常に動的なデータへのリアルタイムアクセスのニーズに対処しました。この論文では、分散システム設計のコア原則として「最終的な一貫性」の概念を紹介し、緩やかな一貫性保証によって高い可用性とパフォーマンスを実現できるようにしています (CAP 定理のようなものです)。

論文自体には、「Bigtable と比較して、Dynamo は、ネットワークの分割やサーバーの障害が発生しても更新が拒否されない高可用性に主眼を置き、キー/値アクセスのみを必要とするアプリケーションを対象としています。」と書かれています。

BigTable と同様に、Dynamo の論文は、Riak、Voldemort、Cassandra などの後続のテクノロジー、さらには Apache Kafka などのイベントストリーミングテクノロジーに大きな影響を与えました。

Cassandra - 分散型構造化ストレージシステム

Facebook の急速な成長には、膨大な量のデータを処理し、多数の同時ユーザーをサポートできるデータベースソリューションが必要でした。BigTable と Dynamo はそれぞれ大きな影響力を持っていましたが、Cassandra は他のテクノロジよりも一歩先を行く最初のテクノロジでした。Facebook は、Apache ライセンスの下で Cassandra をオープンソースコントリビューションとしてリリースし、論文も公開することで、業界全体がこのようなテクノロジにアクセスできるようにすることに尽力しました。

Cassandra は、調整可能な一貫性モデルを提供することで、前の 2 つとの差別化を図り、ユーザーがアプリケーションの要件に基づいて、強力な一貫性 (BigTable など) と最終的な一貫性 (Dynamo など) を選択できるようにしました。

分散システムの勉強を始めてもっと学びたい場合、またはすでに専門家で基礎を復習したい場合、分散システムに関する基礎論文を読むことほど良い学習方法はありません。

アーキテクチャの解明: 分散システムを理解するための重要な論文!

長すぎる; 読むには

CAP定理

Paxos をシンプルに

Google ファイルシステム

MapReduce: 大規模クラスタでの簡素化されたデータ処理

Bigtable: 構造化データ用の分散ストレージシステム

Dynamo: Amazon の高可用性キーバリューストア

Cassandra - 分散型構造化ストレージシステム

ZooKeeper: インターネット規模のシステムのための待機なしの調整

Apache Kafka: ログ処理のための分散メッセージングシステム

回復力のある分散データセット: インメモリクラスタコンピューティングのためのフォールトトレラントな抽象化

About Author

ラベル

この記事は...

Categories

Trending Topics

アーキテクチャの解明: 分散システムを理解するための重要な論文!

長すぎる; 読むには

CAP定理

About Author

ラベル

この記事は...

関連ストーリー