Table of Contents

安全でコンプライアンスに配慮したクラウドベースのデータレイクを構築するためのガイドです。

クラウドベースのデータレイクは、大規模なデータセットを保存し分析するための貴重なツールです。しかし、政府規制へのコンプライアンスを確保するために対処しなければならない、独自のセキュリティ上の課題を抱えています。このガイドでは、安全でコンプライアンスに準拠したクラウドベースのデータレイクを構築するためのベストプラクティスを紹介します。

データレイクの計画

データレイクの構築を開始する前に、組織のセキュリティとコンプライアンス要件を考慮した計画を作成することが重要である。一般データ保護規則(GDPR)や医療保険の携行性と説明責任に関する法律(HIPAA)のような業界標準に準拠したフレームワークを作成することから始めましょう。

このようなコンプライアンス規制に対応した安全なソリューションを提供してきた実績のある、適切なクラウドプロバイダーを選ぶことが重要です。代表的なクラウドプロバイダーには、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud Platformなどがあります。

また、ユーザー、役割、権限について、明確なアクセスコントロール**を定義してください。これには、社内のチームメンバーだけでなく、時にアクセスを必要とする外部のベンダーやパートナーも含まれます。

データレイクの構築

データレイクを構築する場合、データレイクへのデータ移動、データレイク内でのデータ移動、データレイクからのデータ移動のすべての段階において、暗号化とアクセス制御を設計上実装する必要があります。インジェストプロセスでは、可能な限り、転送中および保存中のデータを暗号化する必要があります。インジェストクライアントのトランスポートレイヤーセキュリティプロトコルや、セキュアファイル転送プロトコル(SFTP)などのネットワークプロトコル、またはマネージドApache Kafkaサービスなどのベストプラクティスを使用します。

異なるシステムからデータをコピーするインジェストクライアントやアプリケーションは、最小特権の原則に基づくアクセスポリシーを採用する必要があります。つまり、外部ソースから関連情報をコピーするために必要な権限のみを付与します。

ストレージの面では、静止時の暗号化をサポートするプラットフォームや、顧客所有の鍵(CMK)によるサーバーサイドの暗号化など、鍵管理などの高度な暗号機能を提供するプラットフォームを選択する。

**AWS Identity and Access ManagementやAzure Active Directoryのようなソリューションは、オブジェクトレベルと管理プレーンの両方で権限を制御する効果的な手段を提供します。

データレイクの監視と管理

データレイクインフラの正確なモニタリングは、データレイク内で発生するセキュリティギャップや不審な活動の特定に役立ちます。データレイクに関連するすべてのアクティビティのロギングを実施し、データログを別の監査アカウントに保存して、攻撃者による削除や改ざんを防止する。これにより、ポートスキャン、DDos攻撃、ブルートフォース攻撃、ネットワークベースの攻撃など、疑わしい活動を迅速に検出することができます。

AWS CloudTrailやAzure Monitorに含まれるようなセキュリティ情報およびイベント管理(SIEM)ソリューションを使用して、ログの集中管理、警告の自動化、および高度な分析を実行します。

また、重要なコンポーネントには、定期的にパッチを適用してください。オペレーティングシステム、データベース、ウェブサーバー、サードパーティライブラリなどの基盤システムのソフトウェアパッケージの定期的な更新は、既知の脆弱性が資格のあるITサポートチームによって改善されるように、サポートモデルの一部であるべきです。

変化する脅威の状況に対応するために

**クラウドベースのデータレイクの安全性とコンプライアンスを維持するためには、継続的な警戒を怠らないことが重要な要件です。

データストレージに関する特定の規制への準拠を求める場合は、コンプライアンス監査や各サービスから作成される定期的なレポートを通じて、これらのコンプライアンス要件を維持するための対策を講じる。

結論

クラウドベースのデータレイクの導入には大きなメリットがありますが、セキュリティとコンプライアンスに関しては負担が大きくなります。しかし、保存時および転送時の暗号化、IAM(Identity and Access Management)による高レベルのアクセス制御、高度なロギングによる実装の監視、継続的なパッチ適用などの業界のベストプラクティスに従うことで、安全でコンプライアンスに準拠したクラウドベースのデータレイクを構築することができる。

適切なクラウド移行とガバナンスを維持することで、コンプライアンスとセキュリティを維持しながら、クラウドベースのサービスの利点を最大限に活用することができます。


参考文献

  1. Guide to using AWS EBS encryption
  2. Microsoft - HIPAA overview
  3. What is SIEM?
  4. AWS - Data ingestion methods
  5. HIPAA Security Rule Standards and Implementation Specifications