相关问题
TG机器人语音转文本的流式处理延迟优化
延迟大主要在音频解码和模型推理,以下几点建议:1. 升级服务器配置:显存大能有效加速,尤其是ONNX、TensorRT加速模型时。2. 压缩音频流:opus编码+降采样(48KHz->16KHz)等,传输和解码更高效。
8 个点赞 2 回答 181 浏览
延迟大主要在音频解码和模型推理,以下几点建议:1. 升级服务器配置:显存大能有效加速,尤其是ONNX、TensorRT加速模型时。2. 压缩音频流:opus编码+降采样(48KHz->16KHz)等,传输和解码更高效。