v0.1

技术方案

统一入口、LLM 决策核心、可插拔后端适配——三层结构清晰解耦,路由逻辑集中且可观测。

设计目标

04 / 设计目标

分层结构

请求路径
┌─────────────┐
│   Client    │
└──────┬──────┘
       ▼
┌─────────────┐
│  Ingress    │  鉴权、限流、请求规范化
└──────┬──────┘
       ▼
┌─────────────┐
│ LLM Router  │  组装上下文、注入策略、选择后端
└──────┬──────┘
       ▼
┌─────────────┐
│  Adapters   │  OpenAI 协议、Anthropic 协议、自建节点 …
└─────────────┘

核心模块

结构
模块 职责 归类
Normalizer 将各客户端异构的请求体归一化为统一的内部格式。 ingress
Context builder 注入租户策略、会话摘要与硬性约束。 policy
Decision engine 调用 LLM,返回包含目标后端与理由的结构化结果(JSON 或类似格式)。 core
Registry 维护后端列表、能力标签(fast、code 等)与健康状态。 state
Observability 提供 trace,并为每次决策记录一条审计记录。 audit

一次请求的大致流程

生命周期
  1. 请求抵达入口层(Ingress):完成鉴权、限流与请求规范化。
  2. Normalizer 与 Context builder准备决策所需的输入。
  3. LLM 给出路由结果:目标后端、备选方案,或拒绝理由。
  4. Adapter 转发至选中的后端,并按其原生协议发出。
  5. 响应返回:响应阶段的二次路由能力为后续演进项。

安全与治理

不可妥协

演进路线

如实呈现
阶段 重点
当前 核心路由链路原型闭环,沉淀设计取舍与基准。
近期 端到端链路打通、可观测性与评测体系、错误决策回放。
远期 开源与试点落地,共建多模型路由生态。

欲了解上述选择的依据,详见背景页。如有疑问或不同意见,欢迎与团队交流