Khắc phục sự cố
Tìm triệu chứng của bạn trong bảng, nhảy tới bản sửa. Mọi trang runbook đều theo cùng một dạng: Triệu chứng → Xác nhận → Sửa → Phòng ngừa.
Tìm triệu chứng của bạn
Phần tiêu đề “Tìm triệu chứng của bạn”| Nếu bạn thấy… | Đi tới |
|---|---|
GPU đã cài nhưng suy luận chạy trên CPU; log hiện CUDA failure 500: named symbol not found | Không dùng GPU — CUDA error 500 |
| Container suy luận thoát/khởi động lại khi GPU bị ép buộc và GPU host hỏng | Không dùng GPU — CUDA error 500 |
| GPU host hoạt động, nhưng provider hiển thị một cấp thấp hơn kỳ vọng (ví dụ CUDA thay vì TensorRT, hoặc CPU) | Chạy trên CPU khi kỳ vọng GPU |
Dòng log Failed to load library libonnxruntime_providers_tensorrt.so | Chạy trên CPU khi kỳ vọng GPU |
Bật một datasource bị bật ngược về Disabled với model_not_paired hoặc adapter_connect_failed | Datasource sập hoặc lỗi |
| Một nguồn OPC-UA / MQTT / CSV đang truyền bị dừng; hàng hiện chỉ báo lỗi / banner đỏ | Datasource sập hoặc lỗi |
| Datasource ở trạng thái Enabled nhưng không có dự đoán nào xuất hiện | Datasource sập hoặc lỗi |
| Settings → About tô màu hổ phách cho phiên bản frontend / backend | Lệch phiên bản frontend / backend |
Phiên bản đọc là 0.0.0-dev… hoặc kết thúc bằng -dirty | Lệch phiên bản frontend / backend |
| Đĩa đầy lên; tệp cơ sở dữ liệu lớn hơn nhiều so với dữ liệu nó chứa; xóa hàng không làm nó co lại | Đĩa đầy / cơ sở dữ liệu phình không giới hạn |
Một container hiện unhealthy trong docker ps nhưng ứng dụng vẫn phục vụ tốt | Container bị đánh dấu unhealthy nhưng dịch vụ vẫn chạy |