LLM 推理延遲