构建基于EKS、Kafka与WebSockets的CQRS实时推送架构：从命令投递到状态同步

分布式系统

文章字数: 4.6k

阅读时长: 19 分

要为一个需要支撑百万级并发连接、且读写模型存在显著差异的系统设计架构，直接采用传统的单体服务或标准的CRUD模型，很快就会在数据库层面遭遇瓶颈。写操作（例如，用户下单、提交表单）通常涉及复杂的业务验证和事务，而读操作（例如，实时仪表盘、状态更新）则要求极低的延迟和高吞吐。将这两者耦合在同一个服务和数据模型中，写操作的锁竞争会直接拖慢读请求，反之亦然。这种架构上的矛盾是许多大规模实时应用失败的根源。

我们的挑战具体化为：构建一个系统，它能接收高频的用户操作指令，同时将这些操作引发的状态变更以毫秒级延迟推送给海量在线的客户端。这是一个典型的命令（Command）与查询（Query）职责分离的场景，CQRS（Command Query Responsibility Segregation）模式是解决此类问题的理想范式。

定义问题：读写分离的极端需求

让我们将需求进一步分解：

命令侧（Write Path）: 必须能承受高峰期每秒数万次的写入请求。这些请求需要被可靠地接收、验证并处理，允许一定的处理延迟，但绝不能丢失。
查询侧（Read Path）: 必须为数百万个并发WebSocket连接提供服务。当任何一个客户端关联的状态发生变化时，更新必须立即被推送到对应的客户端，延迟应控制在100ms以内。
可伸缩性与韧性: 系统的任何组件都必须能够独立伸缩。命令处理的瓶颈不应影响状态推送，反之亦然。整个系统部署在AWS EKS上，需要充分利用云原生的弹性能力。
前端响应式: 客户端UI必须能无缝地响应服务端推送的数据流，避免复杂的轮询或手动状态管理。

方案权衡：同步RPC vs. 异步事件流

方案A：同步RPC与集中式数据库

一个直接的思路是构建一个庞大的后端服务集群，通过负载均衡器处理所有WebSocket连接。当一个写请求（命令）到达时，服务通过同步RPC调用内部模块，在单个事务中更新关系型数据库，然后查询受影响的客户端并推送更新。

优势:
- 逻辑简单，易于理解。
- 强一致性，写操作完成后，数据立即可读。
劣势:
- 性能瓶颈: 数据库成为中心瓶颈。写操作的行锁或表锁会直接阻塞大量的读操作，导致推送延迟急剧增加。
- 耦合严重: 读写逻辑、连接管理、业务处理全部耦合在一个（或一类）服务中。任何一部分的性能问题都会引发雪崩效应。
- 伸缩性差: 无法对读、写路径进行独立扩容。为应对写洪峰而扩容整个服务集群，会造成巨大的资源浪费。
- 可用性风险: 数据库的短暂抖动或过载，会直接导致整个实时推送功能的停摆。

在真实项目中，这种架构在连接数超过10万、写入QPS超过1000时就会开始出现明显的延迟抖动。对于我们的目标，此方案不可行。

方案B：基于事件流的CQRS架构

我们选择的方案是彻底解耦命令处理和状态查询。整个系统被划分为几个职责明确、通过消息队列异步协作的微服务。

graph TD
    subgraph Client-Side
        A[React UI w/ MobX] -- WebSocket Conn --> B{WebSocket Gateway};
    end

    subgraph AWS EKS Cluster
        B -- Command --> C[Kafka Topic: commands];
        C -- Consumed by --> D[Command Handler Service];
        D -- Business Logic --> E[Kafka Topic: state_events];
        E -- Consumed by --> F[State Projector Service];
        F -- Updates Read Model --> G[(Key-Value NoSQL Store)];
        E -- Also Consumed by --> H[WebSocket Gateway];
    end
    
    H -- State Update Push --> A;
    G -- Initial State Query --> H;

    style A fill:#f9f,stroke:#333,stroke-width:2px
    style G fill:#bbf,stroke:#333,stroke-width:2px

流程解析:
1. 命令入口: 客户端（React + MobX）通过WebSocket连接将用户操作（如 {"type": "UPDATE_ITEM", "payload": {...}}）发送到WebSocket Gateway。
2. 命令分发: Gateway服务不执行任何业务逻辑，它只做两件事：认证用户、将命令原封不动地投递到Kafka的commands主题中，然后立即响应客户端“命令已接收”。这使得Gateway极为轻量，可以水平扩展以处理海量连接。
3. 命令处理: Command Handler服务是commands主题的消费者。它负责执行复杂的业务验证、权限检查，并最终生成一个或多个领域事件（Domain Events），例如ItemUpdated。这些事件被发布到Kafka的state_events主题。
4. 状态物化: State Projector服务订阅state_events主题。它的唯一职责是根据接收到的事件来更新一个为快速读取而优化的键值型NoSQL数据库（Read Model）。例如，将最新的项目状态写入以item_id为键的记录中。
5. 实时推送: WebSocket Gateway同样订阅state_events主题。当它收到一个ItemUpdated事件时，它会查询自身维护的连接映射表，找到所有关注该item_id的客户端连接，并将最新的状态（或事件本身）推送下去。为了处理新连接的初始状态加载，Gateway会在连接建立时，直接从NoSQL读取快照数据。
技术选型理由:
- AWS EKS: 提供了一个弹性的、高可用的Kubernetes环境，用于部署和管理这些微服务。HPA（Horizontal Pod Autoscaler）可以根据CPU/内存使用率或自定义指标（如Kafka消费者延迟）自动伸缩各个服务。
- Kafka: 完美的系统总线。它的高吞吐量和持久性保证了命令和事件不会丢失。更重要的是，它扮演了一个天然的缓冲层和背压机制，保护了下游的命令处理器和数据库，即使上游流量洪峰来临。
- NoSQL (Key-Value): 我们使用类似Redis或DynamoDB的数据库作为读模型。查询侧的需求非常简单：通过ID获取最新状态。键值存储为此提供了毫秒级的读取性能，远胜于关系型数据库。
- WebSockets: 提供了客户端与服务器之间的全双工、低延迟通信通道，是实现实时推送的标准。
- MobX: 在前端，MobX的响应式状态管理能力与此架构完美契合。WebSocket消息到达后，只需更新MobX的observable状态，所有依赖该状态的UI组件都会自动、高效地重新渲染。

此架构的核心优势在于其彻底的解耦。命令处理的延迟不会影响状态推送的实时性。我们可以为Command Handler配置大量Pod来处理积压的命令，同时保持Gateway和Projector的轻量与高效。

核心实现与代码剖析

1. WebSocket Gateway (Node.js + ws + KafkaJS)

Gateway是连接管理和消息路由的核心。它需要高效地处理连接生命周期并将消息转发到Kafka。

gateway/server.ts

import { WebSocketServer, WebSocket } from 'ws';
import { Kafka, Producer } from 'kafkajs';
import { v4 as uuidv4 } from 'uuid';
import http from 'http';
import url from 'url';

// 在生产环境中，这些配置应来自环境变量或配置中心
const KAFKA_BROKERS = ['kafka-service:9092'];
const COMMAND_TOPIC = 'commands';
const STATE_EVENT_TOPIC = 'state_events';

const kafka = new Kafka({
  clientId: 'ws-gateway',
  brokers: KAFKA_BROKERS,
  retry: {
    retries: 5,
    initialRetryTime: 300,
  },
});

const producer: Producer = kafka.producer();
const consumer = kafka.consumer({ groupId: `gateway-group-${uuidv4()}` }); // 每个Pod一个独立的消费组，实现广播

// 使用Map来维护连接。key可以是userId或sessionId
// value可以是一个WebSocket实例集合，因为一个用户可能有多端登录
const connectionManager = new Map<string, Set<WebSocket>>();

async function main() {
  await producer.connect();
  await consumer.connect();
  await consumer.subscribe({ topic: STATE_EVENT_TOPIC, fromBeginning: false });

  // 消费者循环，用于接收状态事件并推送给客户端
  await consumer.run({
    eachMessage: async ({ topic, partition, message }) => {
      if (!message.value) return;

      try {
        const event = JSON.parse(message.value.toString());
        // 假设事件结构为 { metadata: { targetUser: 'user-123' }, payload: {...} }
        const { targetUser } = event.metadata;
        
        if (connectionManager.has(targetUser)) {
          const connections = connectionManager.get(targetUser)!;
          const messageStr = JSON.stringify(event.payload);

          connections.forEach(ws => {
            if (ws.readyState === WebSocket.OPEN) {
              ws.send(messageStr);
            }
          });
        }
      } catch (err) {
        console.error('Failed to process state event and push to client', err);
      }
    },
  });

  const server = http.createServer();
  const wss = new WebSocketServer({ server });

  wss.on('connection', (ws, req) => {
    // 这里的认证逻辑至关重要
    // 实际项目中会解析JWT或session来获取userId
    const { query } = url.parse(req.url!, true);
    const userId = query.userId as string;

    if (!userId) {
      ws.close(1008, 'User ID is required');
      return;
    }
    
    console.log(`Client connected: ${userId}`);

    // 管理连接
    if (!connectionManager.has(userId)) {
      connectionManager.set(userId, new Set());
    }
    connectionManager.get(userId)!.add(ws);

    ws.on('message', async (data) => {
      try {
        const command = JSON.parse(data.toString());
        // 为命令附加元数据，如userId，以便下游服务处理
        const commandWithMeta = {
          metadata: {
            userId,
            commandId: uuidv4(),
            timestamp: Date.now(),
          },
          payload: command,
        };
        
        // 生产命令到Kafka
        await producer.send({
          topic: COMMAND_TOPIC,
          messages: [{ value: JSON.stringify(commandWithMeta) }],
          // acks: 1 保证leader副本写入成功即可，性能较高
          acks: 1, 
        });
      } catch (err) {
        console.error(`Failed to produce command for user ${userId}:`, err);
        ws.send(JSON.stringify({ error: 'Failed to process command' }));
      }
    });

    ws.on('close', () => {
      console.log(`Client disconnected: ${userId}`);
      const userConnections = connectionManager.get(userId);
      if (userConnections) {
        userConnections.delete(ws);
        if (userConnections.size === 0) {
          connectionManager.delete(userId);
        }
      }
    });

    ws.on('error', (err) => {
      console.error(`WebSocket error for user ${userId}:`, err);
    });
  });

  const PORT = process.env.PORT || 8080;
  server.listen(PORT, () => {
    console.log(`WebSocket Gateway listening on port ${PORT}`);
  });

  // 优雅停机处理
  process.on('SIGTERM', async () => {
    console.log('SIGTERM signal received. Shutting down gracefully.');
    await consumer.disconnect();
    await producer.disconnect();
    wss.close(() => {
        server.close(() => {
            console.log('Server shut down.');
            process.exit(0);
        });
    });
  });
}

main().catch(console.error);

关键考量:

无状态与水平扩展: Gateway本身不存储持久化状态（连接映射表是内存中的，Pod重启即丢失，但客户端会自动重连）。这使得我们可以简单地通过增加Pod数量来线性扩展其连接处理能力。
消费者广播: 每个Gateway Pod都创建了一个拥有唯一groupId的消费者。这确保了state_events主题中的每条消息都会被广播到所有的Gateway Pod，从而保证无论客户端连接到哪个Pod，都能收到应有的更新。
背压: 当命令生产速度超过Kafka处理能力时，producer.send会根据配置的retry策略自动处理。它本身是异步的，不会阻塞WebSocket的消息接收循环。

2. State Projector (Go + Sarama + Redis)

Projector是一个简单但关键的服务，它将事件流转化为状态快照。使用Go语言可以获得更好的性能和并发处理能力。

projector/main.go

package main

import (
	"context"
	"encoding/json"
	"fmt"
	"log"
	"os"
	"os/signal"
	"strings"
	"sync"
	"syscall"

	"github.com/IBM/sarama"
	"github.com/go-redis/redis/v8"
)

var (
	kafkaBrokers = os.Getenv("KAFKA_BROKERS")
	kafkaTopic   = "state_events"
	redisAddr    = os.Getenv("REDIS_ADDR")
	consumerGroup = "state-projector-group"
)

func main() {
	if kafkaBrokers == "" || redisAddr == "" {
		log.Fatal("KAFKA_BROKERS and REDIS_ADDR must be set")
	}

	// 初始化Redis客户端
	rdb := redis.NewClient(&redis.Options{
		Addr: redisAddr,
	})
	if _, err := rdb.Ping(context.Background()).Result(); err != nil {
		log.Fatalf("Could not connect to Redis: %v", err)
	}

	// 初始化Kafka消费者
	config := sarama.NewConfig()
	config.Version = sarama.V2_8_0_0 // 根据Kafka版本调整
	config.Consumer.Group.Rebalance.Strategy = sarama.BalanceStrategyRoundRobin
	config.Consumer.Offsets.Initial = sarama.OffsetOldest

	consumer := Consumer{
		ready: make(chan bool),
		rdb:   rdb,
	}

	ctx, cancel := context.WithCancel(context.Background())
	client, err := sarama.NewConsumerGroup(strings.Split(kafkaBrokers, ","), consumerGroup, config)
	if err != nil {
		log.Fatalf("Error creating consumer group client: %v", err)
	}

	wg := &sync.WaitGroup{}
	wg.Add(1)
	go func() {
		defer wg.Done()
		for {
			if err := client.Consume(ctx, []string{kafkaTopic}, &consumer); err != nil {
				log.Panicf("Error from consumer: %v", err)
			}
			if ctx.Err() != nil {
				return
			}
			consumer.ready = make(chan bool)
		}
	}()

	<-consumer.ready // 等待Kafka consumer设置完成
	log.Println("Sarama consumer up and running!...")

	sigterm := make(chan os.Signal, 1)
	signal.Notify(sigterm, syscall.SIGINT, syscall.SIGTERM)
	select {
	case <-ctx.Done():
		log.Println("terminating: context cancelled")
	case <-sigterm:
		log.Println("terminating: via signal")
	}
	cancel()
	wg.Wait()
	if err = client.Close(); err != nil {
		log.Panicf("Error closing client: %v", err)
	}
}

// Consumer 实现了 sarama.ConsumerGroupHandler 接口
type Consumer struct {
	ready chan bool
	rdb   *redis.Client
}

func (consumer *Consumer) Setup(sarama.ConsumerGroupSession) error {
	close(consumer.ready)
	return nil
}

func (consumer *Consumer) Cleanup(sarama.ConsumerGroupSession) error {
	return nil
}

// 核心逻辑: 消费消息并更新Redis
func (consumer *Consumer) ConsumeClaim(session sarama.ConsumerGroupSession, claim sarama.ConsumerGroupClaim) error {
	for message := range claim.Messages() {
		log.Printf("Message claimed: value = %s, timestamp = %v, topic = %s", string(message.Value), message.Timestamp, message.Topic)
		
		var event struct {
			Type    string          `json:"type"`
			Payload json.RawMessage `json:"payload"`
		}
		if err := json.Unmarshal(message.Value, &event); err != nil {
			log.Printf("Error unmarshalling event: %v", err)
			session.MarkMessage(message, "") // 标记消息已处理，避免重试
			continue
		}

		// 这是一个简化的例子，实际项目中会有更复杂的逻辑
		// 来根据事件类型更新不同的Redis数据结构
		if event.Type == "ITEM_UPDATED" {
			var item struct {
				ID    string `json:"id"`
				Name  string `json:"name"`
				Value int    `json:"value"`
			}
			if err := json.Unmarshal(event.Payload, &item); err == nil {
				// 更新Redis中的哈希或字符串
				key := fmt.Sprintf("item:%s", item.ID)
				err := consumer.rdb.Set(session.Context(), key, string(event.Payload), 0).Err()
				if err != nil {
					log.Printf("Failed to update Redis for key %s: %v", key, err)
                    // 这里的错误处理很关键：是重试还是跳过？
                    // 如果Redis暂时不可用，消费者会阻塞在这里，Sarama会停止拉取新消息，形成背压。
				}
			}
		}

		session.MarkMessage(message, "")
	}
	return nil
}

关键考量:

幂等性: Projector必须能处理重复的消息。例如，如果一个事件被处理后，在提交Kafka offset之前服务崩溃，重启后会再次收到该事件。将状态写入Redis的SET操作本身是幂等的，多次执行结果一致。
错误处理: 如果Redis暂时不可用，消费逻辑会阻塞或失败。Sarama消费者组会停止从该分区拉取新消息，直到问题解决。这是一种有效的背压机制，防止数据丢失。
读模型设计: Redis的键设计至关重要。这里使用了简单的item:{id}。在真实场景中，可能需要使用Hash来存储对象，或者使用Sorted Set来维护排行榜，这完全取决于查询侧的需求。

3. 前端状态同步 (React + MobX)

前端的集成体现了这套架构的最终价值。UI可以毫不费力地“活”起来。

stores/RealtimeStore.ts

import { makeAutoObservable, observable, action } from 'mobx';

interface Item {
  id: string;
  name: string;
  value: number;
}

class RealtimeStore {
  // 使用 observable.map 更高效地处理集合
  items = observable.map<string, Item>();
  connectionStatus: 'connecting' | 'open' | 'closed' = 'connecting';
  private ws: WebSocket | null = null;

  constructor() {
    makeAutoObservable(this);
  }

  @action
  connect(userId: string) {
    if (this.ws && this.ws.readyState !== WebSocket.CLOSED) {
      return;
    }
    
    // 从环境变量获取WebSocket URL
    this.ws = new WebSocket(`ws://api.example.com/ws?userId=${userId}`);
    this.connectionStatus = 'connecting';

    this.ws.onopen = action(() => {
      this.connectionStatus = 'open';
      console.log('WebSocket connection established.');
      // 可以在这里请求初始快照数据
    });

    this.ws.onmessage = action((event) => {
      try {
        const data = JSON.parse(event.data);
        // 假设推送的数据结构与Item一致
        if (data.id) {
          // MobX的魔法：只需更新map，所有使用它的UI组件都会自动反应
          this.items.set(data.id, data as Item);
        }
      } catch (e) {
        console.error('Error parsing incoming message', e);
      }
    });

    this.ws.onclose = action(() => {
      this.connectionStatus = 'closed';
      console.log('WebSocket connection closed. Attempting to reconnect...');
      // 实现带退避策略的重连逻辑
      setTimeout(() => this.connect(userId), 5000);
    });

    this.ws.onerror = (err) => {
      console.error('WebSocket error:', err);
      this.ws?.close();
    };
  }

  // 暴露一个发送命令的方法
  sendCommand(command: object) {
    if (this.ws && this.ws.readyState === WebSocket.OPEN) {
      this.ws.send(JSON.stringify(command));
    } else {
      console.error('Cannot send command: WebSocket is not open.');
      // 可以实现一个命令队列，等待连接恢复后发送
    }
  }
}

export const realtimeStore = new RealtimeStore();

components/ItemList.tsx

import React, { useEffect } from 'react';
import { observer } from 'mobx-react-lite';
import { realtimeStore } from '../stores/RealtimeStore';

const ItemList: React.FC = observer(() => {
  useEffect(() => {
    // 假设用户ID从认证上下文中获取
    const userId = 'user-123'; 
    realtimeStore.connect(userId);
  }, []);

  const handleUpdate = (id: string) => {
    const newValue = Math.floor(Math.random() * 100);
    realtimeStore.sendCommand({
      type: 'UPDATE_ITEM',
      payload: { id, value: newValue },
    });
  };

  if (realtimeStore.connectionStatus !== 'open') {
    return <div>Connecting to real-time service...</div>;
  }

  return (
    <div>
      <h2>Real-time Item List</h2>
      <ul>
        {Array.from(realtimeStore.items.values()).map(item => (
          <li key={item.id}>
            {item.name}: {item.value}
            <button onClick={() => handleUpdate(item.id)}>Update Value</button>
          </li>
        ))}
      </ul>
    </div>
  );
});

export default ItemList;

关键考量:

UI与数据逻辑分离: ItemList组件完全不关心数据是如何来的，它只知道从realtimeStore中读取items。MobX的observer HOC确保了当items map发生任何变化时，组件都会自动重渲染。
乐观更新: 为了提升用户体验，可以在handleUpdate中实现乐观更新。即在发送命令的同时，立即在本地修改MobX的状态。当服务端推送回最终确认的状态时，再用权威数据覆盖本地状态。
连接管理: RealtimeStore中封装了完整的连接、重连和消息处理逻辑，对业务组件透明。

架构的局限性与未来路径

尽管此架构解决了核心的读写分离和伸缩性问题，但它并非银弹。

最终一致性: 最大的挑战是最终一致性。从用户提交命令到UI更新，中间存在一个可感知的延迟（Kafka传输 + 命令处理 + 事件传输）。对于某些对一致性要求极高的场景（如金融交易），需要引入客户端的乐观更新、请求-响应确认机制或更复杂的Saga模式来协调。
运维复杂度: 引入Kafka和多个微服务，显著增加了系统的运维复杂度。需要完备的可观测性体系（日志、指标、追踪），来监控Kafka消费者延迟、消息处理成功率等关键指标。在EKS上管理这一切需要成熟的DevOps实践。
事件模式演进: state_events主题中的事件结构一旦确定，任何修改都需要考虑向前和向后兼容性。否则，正在运行的旧版Projector或Gateway可能会因为无法解析新版事件而崩溃。Schema Registry（如Confluent Schema Registry）是解决此问题的工业级方案。

未来的一个演进方向是引入事件溯源（Event Sourcing）。即不存储当前状态快照，而是存储导致状态变化的所有事件流。读模型（NoSQL数据库）仍然由事件流生成，但我们获得了完整的历史记录、审计能力以及重建任何时间点状态的能力。这会进一步增加系统的复杂性，但为特定类型的业务带来了巨大的价值。

AWS EKS NoSQL Kafka WebSockets MobX CQRS 架构设计

MyBatis流式查询与Dask并行计算的异构集成方案

2023-10-27 架构与设计

Dask MyBatis gRPC 数据工程

利用装饰器模式在 Fastify 中构建贯穿前端至 Snowflake 的统一可观测性管道

2023-10-27 后端架构

可观测性 Fastify Snowflake 设计模式 Styled-components