产品 / WatchTower
WatchTower 站点拨测与 AI 根因诊断
站点挂了,往往是用户先于你知道;而传统拨测告警只说「挂了」,不说「为什么」。WatchTower 用分布在新加坡、洛杉矶、东京的探针做多地域拨测,故障瞬间自动抓取响应头、traceroute、DNS 解析与源站指标组成证据链,再由 AI 生成根因报告推送到你的 IM——你看到告警的同时,就看到了诊断结论。
进入控制台 →受邀内测 · 真实可用
核心功能
多地域拨测
HTTP / TCP / SSL / DNS 四类探测,UEIC 自有 4 个全球节点(新加坡 / 洛杉矶×2 / 东京),分钟级频率,多点交叉确认避免误报。
证书与域名守护
SSL 证书与域名到期倒计时监控,提前 30 / 14 / 7 天分级提醒,杜绝「证书过期半天才发现」。
证据链自动采集
告警触发瞬间自动抓取:响应头、traceroute、各地 DNS 解析结果、源站 CPU/内存指标——故障现场不再靠事后回忆。
AI 根因报告
证据链喂给本地 LLM,输出结构化根因报告:是 DNS、CDN、证书、源站还是网络链路,附处置建议。
IM 通知
Telegram / 飞书机器人推送,告警与根因报告一条消息送达,支持值班分组与升级策略。
状态页生成
一键生成对外状态页(status page),让你的客户看到透明的可用性数据。
系统架构
01探测层
分布式拨测探针 — 新加坡 / 洛杉矶×2 / 东京,UEIC 自有节点复用
▼
02调度层
FastAPI — 拨测调度、告警判定、证据链采集编排
▼
03数据层
PostgreSQL — 拨测时序、证据链存档、可用性统计
▼
04诊断层
Ollama 本地 LLM — 证据链 → 根因报告
▼
05展示层
Next.js — 控制台 + 对外状态页
技术栈
- 分布式拨测探针(4 全球节点)
- FastAPI 调度服务
- PostgreSQL 时序存储
- Ollama 本地 LLM 诊断
- Next.js 控制台与状态页
- Telegram / 飞书 Bot 通知
定价方向
免费档
3 个监控项,基础告警,社区支持
订阅制
按监控项数量订阅(占位),含 AI 根因报告与状态页
私有化
探针与诊断层全部部署在客户侧(占位)
当前阶段
Stage: PoC — 基于 vps-monitor 多年值守经验沉淀。M0 拨测 + 证据链 + AI 报告闭环;M1 看护 UEIC 全部域名;M2 首批外部用户。