AWS Kinesis Data Streams と Kinesis Firehose の違いは何ですか？

Kinesis Data Streams は、カスタムコンシューマーアプリケーションが必要であり、低遅延（通常 1 秒未満）で処理を行うリアルタイムデータストリーミングサービスです。Kinesis Firehose は、S3、Redshift、または Elasticsearch などの宛先にデータを自動的に配送する完全に管理されるサービスで、ほぼリアルタイムの遅延（最小 60 秒）を実現します。

AWS Kinesis と Apache Kafka はどのように比較されますか？

両者は優れたストリーミングプラットフォームです。Kinesis は AWS が完全に管理するサービスであり、自動スケーリングとインフラ管理の不要さが特徴で、AWS ネイティブなアプリケーションに最適です。Kafka はより柔軟で制御性が高く、オープンソースですが、運用オーバーヘッドが大きいという点があります。Kinesis は AWS サービスとシームレスに統合される一方、Kafka はより広範なエコシステムのサポートを提供します。

AWS Kinesis の料金に関する考慮事項は何ですか？

Kinesis Data Streams の課金体系は、シャード時間、PUT ペイロードユニット、拡張データ保持期間に基づいています。2025 年現在、オンデマンドモードは自動スケーリングによりキャパシティプランニングを不要にしますが、プロビジョンドモードよりもコストが高くなります。コストを見積もる際は、データ容量、保持期間、スループット要件を考慮してください。

Kinesis を用いて、厳密に 1 回だけ処理するセマンティクスを実装するにはどうすればよいですか。

DynamoDB または他の永続化ストアに処理済みシーケンス番号を追跡することで、冪等なコンシューマーを実装してください。チェックポイント機能を備えた Kinesis Client Library (KCL) を使用します。ビジネスロジックが重複レコードを処理できることを確認し、アプリケーションレベルでの重複排除のために一意のメッセージ ID を使用してください。

Kinesis におけるシャード管理のベストプラクティスとは何ですか？

可変ワークロードには、手動でのシャード管理を回避するためにオンデマンドモードを使用してください。プロビジョンドモードの場合は、IncomingRecords や WriteProvisionedThroughputExceeded などの CloudWatch メトリクスを監視してください。トラフィックの少ない時間帯にシャードを分割またはマージすることで、段階的なスケーリングを実装します。データがシャードに均等に分散されるよう、パーティションキーを戦略的に使用してください。

Kinesis を使用して、どのように高い可用性と災害復旧を確保できますか？

Kinesis は、リージョン内の 3 つの可用性ゾーンにわたってデータを自動的にレプリケーションします。Lambda を使用してリージョン間でストリームをレプリケーションし、マルチリージョン構成による災害対策を実現します。複数のコンシューマーを想定した拡張ファンアウトを有効化し、適切なデータ保存期間（最大 365 日）を設定するとともに、自動化されたバックアップ戦略を実装します。

AWS Kinesis を用いたイベント駆動型マイクロサービスの構築

スケール対応のための AWS Kinesis を活用したイベント駆動アーキテクチャ

AWS Kinesis は、最小限の運用オーバーヘッドで大規模なリアルタイムデータ処理を可能にし、モダンなイベント駆動型マイクロサービスアーキテクチャを構築するための要となっています。

amazon-kinesis

イベント駆動型マイクロサービスアーキテクチャの理解

イベント駆動アーキテクチャ（EDA）は、サービスが同期呼び出しではなくイベントを通じて通信する設計パターンです。このアプローチには以下の利点があります。

疎結合: サービス同士が互いの存在を知る必要がない
スケーラビリティ: ワークロードに基づいて各サービスが独立してスケーリング可能
堅牢性: 1 つのサービスの障害が他のサービスに波及しない
柔軟性: 既存のサービスを変更せずに新しいサービスを追加可能

AWS Kinesis は、プロデューサーとコンシューマーを分離する分散型で耐久性のあるイベントストリームとして機能することで、EDA の実装を支える基盤を提供します。

ストリーミングプラットフォームに関するより広い視点については、セルフホスティングの代替案との比較として、Apache Kafka クイックスタートガイドをご覧ください。

AWS Kinesis の概要

AWS は特定のユースケース向けに設計された複数の Kinesis サービスを提供しています。ストリーミングソリューションを検討する際、異なるメッセージングパターンとコスト影響について、RabbitMQ on EKS vs SQS の比較も検討する価値があります。

Kinesis Data Streams

リアルタイムでデータレコードをキャプチャ、保存、処理するコアのストリーミングサービスです。Data Streams は以下に最適です。

カスタムなリアルタイム処理アプリケーション
サブ秒単位のレイテンシを持つデータパイプラインの構築
1 秒あたり数百万のイベントの処理
イベントソーシングパターンの実装

Kinesis Data Firehose

ストリーミングデータを S3、Redshift、Elasticsearch、または HTTP エンドポイントなどの宛先に配信するフルマネージドサービスです。以下に適しています。

シンプルな ETL パイプライン
ログの集約とアーカイブ
準リアルタイム分析（最小 60 秒のレイテンシ）
カスタム処理ロジックが不要なシナリオ

Kinesis Data Analytics

SQL または Apache Flink を使用してストリーミングデータを処理・分析します。ユースケースには以下が含まれます。

リアルタイムダッシュボード
ストリーミング ETL
リアルタイム異常検知
継続的なメトリック生成

Kinesis を活用したアーキテクチャパターン

1. イベントソーシングパターン

イベントソーシングでは、アプリケーションの状態変更をすべてイベントのシーケンスとして保存します。Kinesis はこれに最適です。Python の基礎を復習する必要がある場合は、Python チートシートをご覧ください。

import boto3
import json
from datetime import datetime

kinesis = boto3.client('kinesis', region_name='us-east-1')

def publish_event(stream_name, event_type, payload):
    """Kinesis ストリームにイベントを公開"""
    event = {
        'eventId': generate_unique_id(),
        'eventType': event_type,
        'timestamp': datetime.utcnow().isoformat(),
        'payload': payload
    }
    
    response = kinesis.put_record(
        StreamName=stream_name,
        Data=json.dumps(event),
        PartitionKey=payload.get('userId', 'default')
    )
    
    return response['SequenceNumber']

# 例：ユーザー登録イベント
publish_event(
    stream_name='user-events',
    event_type='USER_REGISTERED',
    payload={
        'userId': '12345',
        'email': 'user@example.com',
        'registrationDate': '2025-10-30'
    }
)

2. CQRS（コマンドとクエリの責任分離）

Kinesis をイベントバスとして利用し、読み取りと書き込み操作を分離します。

package main

import (
    "encoding/json"
    "github.com/aws/aws-sdk-go/aws"
    "github.com/aws/aws-sdk-go/service/kinesis"
)

type OrderCommand struct {
    CommandType string      `json:"commandType"`
    OrderID     string      `json:"orderId"`
    UserID      string      `json:"userId"`
    Items       []OrderItem `json:"items"`
}

func ProcessCommand(kinesisClient *kinesis.Kinesis, command OrderCommand) error {
    data, err := json.Marshal(command)
    if err != nil {
        return err
    }
    
    _, err = kinesisClient.PutRecord(&kinesis.PutRecordInput{
        StreamName:   aws.String("order-commands"),
        Data:         data,
        PartitionKey: aws.String(command.OrderID),
    })
    
    return err
}

3. Lambda を活用したファンアウトパターン

単一のストリームからのイベントを複数の Lambda 関数で処理します。より強力な型安全性を備えた TypeScript 実装については、TypeScript チートシートを参照してください。

// メール通知用 Lambda コンシューマー
exports.handler = async (event) => {
    for (const record of event.Records) {
        const payload = JSON.parse(
            Buffer.from(record.kinesis.data, 'base64').toString('utf-8')
        );
        
        if (payload.eventType === 'ORDER_PLACED') {
            await sendOrderConfirmationEmail(payload);
        }
    }
};

// 在庫更新用のもう一つの Lambda
exports.inventoryHandler = async (event) => {
    for (const record of event.Records) {
        const payload = JSON.parse(
            Buffer.from(record.kinesis.data, 'base64').toString('utf-8')
        );
        
        if (payload.eventType === 'ORDER_PLACED') {
            await updateInventory(payload.items);
        }
    }
};

本番環境でのベストプラクティス

1. 適切なシャード数の選択

シャード数の要件は以下に基づいて計算します。

イングリッジ: シャードあたり 1 MB/sec または 1,000 レコード/sec
エグレス: シャードあたり 2 MB/sec（標準コンシューマー）、またはエンハンスド・ファンアウトではコンシューマーあたり 2 MB/sec

def calculate_shards(records_per_second, avg_record_size_kb):
    """必要なシャード数を計算"""
    # イングリッジ容量
    ingress_shards = max(
        records_per_second / 1000,
        (records_per_second * avg_record_size_kb) / 1024
    )
    
    return int(ingress_shards) + 1  # バッファ分を加算

2. 適切なエラーハンドリングの実装

from botocore.exceptions import ClientError
import time

def put_record_with_retry(kinesis_client, stream_name, data, partition_key, 
                          max_retries=3):
    """指数バックオフによるリトライ付きレコード投入"""
    for attempt in range(max_retries):
        try:
            response = kinesis_client.put_record(
                StreamName=stream_name,
                Data=data,
                PartitionKey=partition_key
            )
            return response
        except ClientError as e:
            if e.response['Error']['Code'] == 'ProvisionedThroughputExceededException':
                if attempt < max_retries - 1:
                    time.sleep(2 ** attempt)  # 指数バックオフ
                    continue
            raise

3. 複数コンシューマー向けのエンハンスド・ファンアウトを利用

エンハンスド・ファンアウトは、各コンシューマーに専用スループットを提供します。

# エンハンスド・ファンアウトでコンシューマーを登録
aws kinesis register-stream-consumer \
    --stream-arn arn:aws:kinesis:us-east-1:123456789:stream/my-stream \
    --consumer-name my-consumer-app

4. 重要なメトリックの監視

追跡すべき重要な CloudWatch メトリックは以下の通りです。

IncomingRecords: 正常に投入されたレコード数
IncomingBytes: 入力データのバイト量
GetRecords.IteratorAgeMilliseconds: コンシューマーの遅れ具合
WriteProvisionedThroughputExceeded: スロットリングイベント
ReadProvisionedThroughputExceeded: コンシューマーのスロットリング

5. 適切なパーティションキー戦略の実装

import hashlib

def get_partition_key(user_id, shard_count=10):
    """均等な分布を持つパーティションキーを生成"""
    # 均等な分布のために一貫したハッシュを使用
    hash_value = int(hashlib.md5(user_id.encode()).hexdigest(), 16)
    shard_id = hash_value % shard_count
    return f"{user_id}#{shard_id}"

実世界での実装例

注文処理マイクロサービスアーキテクチャの完全な例を以下に示します。

import boto3
import json
from decimal import Decimal
from typing import Dict, List

class OrderProcessingService:
    def __init__(self, stream_name: str):
        self.kinesis = boto3.client('kinesis')
        self.stream_name = stream_name
    
    def create_order(self, user_id: str, items: List[Dict]) -> str:
        """注文を作成し、イベントを公開"""
        order_id = self.generate_order_id()
        
        # 注文作成イベントを公開
        self.publish_event('ORDER_CREATED', {
            'orderId': order_id,
            'userId': user_id,
            'items': items,
            'status': 'PENDING',
            'total': self.calculate_total(items)
        }, partition_key=user_id)
        
        return order_id
    
    def publish_event(self, event_type: str, payload: Dict, 
                     partition_key: str):
        """Kinesis ストリームにイベントを公開"""
        event = {
            'eventType': event_type,
            'timestamp': datetime.utcnow().isoformat(),
            'payload': payload
        }
        
        self.kinesis.put_record(
            StreamName=self.stream_name,
            Data=json.dumps(event, default=str),
            PartitionKey=partition_key
        )

class InventoryService:
    """注文イベントを消費し、在庫を更新"""
    
    def process_records(self, records):
        for record in records:
            data = json.loads(record['kinesis']['data'])
            
            if data['eventType'] == 'ORDER_CREATED':
                self.reserve_inventory(data['payload'])
            elif data['eventType'] == 'ORDER_CANCELLED':
                self.release_inventory(data['payload'])
    
    def reserve_inventory(self, order_data):
        # 在庫データベースを更新
        for item in order_data['items']:
            # ここに実装
            pass

モノリスからマイクロサービスへの移行戦略

フェーズ 1: スラングラー・フィグパターン

モノリスを維持しつつ、特定のイベントを Kinesis 経由でルーティングすることから始めます。

モノリス内のバウンデッドコンテキストを特定
境界を越えるイベント用 Kinesis ストリームを作成
これらのストリームから消費するサービスを徐々に抽出
モノリスとの後方互換性を維持

フェーズ 2: 並行処理

新旧のシステムを並行して実行します。

def dual_write_pattern(legacy_db, kinesis_stream, data):
    """レガシーシステムとイベントストリームの両方に書き込み"""
    try:
        # まず新しいシステムに書き込み
        publish_to_kinesis(kinesis_stream, data)
        
        # 次にレガシーシステムを更新
        legacy_db.update(data)
    except Exception as e:
        # 補償ロジックを実装
        rollback_kinesis_event(kinesis_stream, data)
        raise

フェーズ 3: 完全移行

信頼性が確立されたら、すべてのトラフィックをイベント駆動アーキテクチャ経由でルーティングします。

コスト最適化戦略

オブジェクトストレージやデータベースアーキテクチャを含むデータインフラパターンに関する包括的なガイダンスについては、AI システム向けデータインフラ: オブジェクトストレージ、データベース、検索および AI データアーキテクチャを参照してください。

1. 可変ワークロードにはオンデマンドモードを使用

オンデマンドモード（2023 年導入）は、トラフィックに基づいて自動的にスケーリングします。

# オンデマンドモードでストリームを作成
aws kinesis create-stream \
    --stream-name my-stream \
    --stream-mode-details StreamMode=ON_DEMAND

2. データ集約の実装

PUT ペイロードユニットを削減するためにレコードをバッチ処理します。

from aws_kinesis_agg.aggregator import RecordAggregator

def batch_put_records(kinesis_client, stream_name, records):
    """コスト削減のためにレコードを集約"""
    aggregator = RecordAggregator()
    
    for record in records:
        aggregator.add_user_record(
            partition_key=record['partition_key'],
            data=record['data']
        )
    
    # 集約されたレコードを送信
    kinesis_client.put_record(
        StreamName=stream_name,
        Data=aggregator.serialize(),
        PartitionKey=records[0]['partition_key']
    )

3. データ保持期間の最適化

デフォルトの保持期間は 24 時間です。必要な場合にのみ延長してください。

# 保持期間を 7 日に設定
aws kinesis increase-stream-retention-period \
    --stream-name my-stream \
    --retention-period-hours 168

セキュリティのベストプラクティス

1. 保存時と転送時の暗号化

# 暗号化されたストリームを作成
kinesis.create_stream(
    StreamName='secure-stream',
    ShardCount=1,
    StreamModeDetails={'StreamMode': 'PROVISIONED'}
)

# 暗号化を有効化
kinesis.start_stream_encryption(
    StreamName='secure-stream',
    EncryptionType='KMS',
    KeyId='alias/aws/kinesis'
)

2. 最小権限の IAM ポリシー

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "kinesis:PutRecord",
        "kinesis:PutRecords"
      ],
      "Resource": "arn:aws:kinesis:us-east-1:123456789:stream/orders"
    }
  ]
}

3. VPC エンドポイント

トラフィックを AWS ネットワーク内に留めます。AWS インフラストラクチャをコードとして管理するには Terraform を検討してください - Terraform チートシートを参照してください。

aws ec2 create-vpc-endpoint \
    --vpc-id vpc-12345678 \
    --service-name com.amazonaws.us-east-1.kinesis-streams \
    --route-table-ids rtb-12345678

可観測性とデバッグ

X-Ray による分散トレーシング

from aws_xray_sdk.core import xray_recorder
from aws_xray_sdk.core import patch_all

patch_all()

@xray_recorder.capture('publish_event')
def publish_event_with_tracing(stream_name, event_data):
    xray_recorder.put_annotation('eventType', event_data['type'])
    xray_recorder.put_metadata('payload', event_data['payload'])
    
    kinesis.put_record(
        StreamName=stream_name,
        Data=json.dumps(event_data),
        PartitionKey=event_data['id']
    )

CloudWatch Logs Insights クエリ

-- 処理時間の遅い件を検出
fields @timestamp, eventType, processingTime
| filter processingTime > 1000
| sort @timestamp desc
| limit 20

-- エラー率を追跡
fields @timestamp, eventType
| filter error = true
| stats count() by eventType

高度なパターン

分散トランザクション向けのサガパターン

マイクロサービスにわたる長期的なトランザクションを実装します。

class OrderSaga:
    def __init__(self, kinesis_client, stream_name):
        self.kinesis = kinesis_client
        self.stream_name = stream_name
        self.saga_id = str(uuid.uuid4())
    
    def execute(self, order_data):
        """補償ロジック付きサガを実行"""
        try:
            # ステップ 1: 在庫を予約
            self.publish_command('RESERVE_INVENTORY', order_data)
            
            # ステップ 2: 支払いを処理
            self.publish_command('PROCESS_PAYMENT', order_data)
            
            # ステップ 3: 注文を発送
            self.publish_command('SHIP_ORDER', order_data)
            
        except SagaException as e:
            # 逆順で補償
            self.compensate(e.failed_step)
    
    def compensate(self, failed_step):
        """補償トランザクションを実行"""
        compensation_steps = {
            'PROCESS_PAYMENT': ['RELEASE_INVENTORY'],
            'SHIP_ORDER': ['REFUND_PAYMENT', 'RELEASE_INVENTORY']
        }
        
        for step in compensation_steps.get(failed_step, []):
            self.publish_command(step, {'sagaId': self.saga_id})

テスト戦略

LocalStack を利用したローカル開発

# LocalStack を Kinesis で起動
docker run -d \
  -p 4566:4566 \
  -e SERVICES=kinesis \
  localstack/localstack

# テストストリームを作成
aws --endpoint-url=http://localhost:4566 kinesis create-stream \
    --stream-name test-stream \
    --shard-count 1

統合テスト

import pytest
from moto import mock_kinesis

@mock_kinesis
def test_event_publishing():
    """モック Kinesis を用いたイベント公開のテスト"""
    kinesis = boto3.client('kinesis', region_name='us-east-1')
    kinesis.create_stream(StreamName='test-stream', ShardCount=1)
    
    service = OrderProcessingService('test-stream')
    order_id = service.create_order('user123', [
        {'productId': 'prod1', 'quantity': 2}
    ])
    
    assert order_id is not None

パフォーマンスチューニング

バッチサイズの最適化

def optimize_batch_processing(records, batch_size=500):
    """最適化されたバッチでレコードを処理"""
    for i in range(0, len(records), batch_size):
        batch = records[i:i + batch_size]
        process_batch(batch)

接続プーリングの使用

from botocore.config import Config

config = Config(
    max_pool_connections=50,
    retries={'max_attempts': 3, 'mode': 'adaptive'}
)

kinesis = boto3.client('kinesis', config=config)

参考リンク

AWS Kinesis リソース:

関連記事:

結論

AWS Kinesis は、スケーラブルでイベント駆動型のマイクロサービスアーキテクチャを構築するための堅牢な基盤を提供します。これらのパターンとベストプラクティスを遵守することで、堅牢でスケーラブル、かつ保守可能なシステムを構築できます。単一のイベントストリームから小さく始め、アーキテクチャを検証し、システムが成長するにつれて徐々により複雑なパターンへと拡大させてください。

成功の鍵は、データフロー要件を理解し、ユースケースに適した Kinesis サービスを選択し、最初から適切な監視とエラーハンドリングを実装することにあります。