Telegram 语音转文字识别后的文本能否添加时间戳，对应语音时间段？

Question

Telegram 官方 API 没有提供语音消息的时间戳功能，但是你可以自己添加。怎么实现？1. 上传语音后，获取语音文件，用第三方语音识别接口（比如 Google Speech-to-Text）进行识别，接口返回带有时间戳的文本结果。

始平卉 · Accepted Answer

Telegram 官方 API 没有提供语音消息的时间戳功能，但是你可以自己添加。
怎么实现？
1. 上传语音后，获取语音文件，用第三方语音识别接口（比如 Google Speech-to-Text）进行识别，接口返回带有时间戳的文本结果。
2. 然后把识别出来的文字，按照客户要求的格式“0:15-0:25：你好”进行处理，然后展示给用户。
这样就可以满足客户需求了。整个过程需要自己处理语音识别和格式转换部分，Telegram 只负责传语音文件。

敏婧 · Answer

Telegram 本身没有直接提供语音转文字带时间戳的功能。但你可以通过以下方式实现：
1. 使用第三方语音识别 API（如 Google、阿里云等），它们通常会返回带时间戳的字幕格式。
2. 获取到带时间戳的文字后，再上传到 Telegram 消息中显示即可。
关键点是语音识别服务的选择，要确保支持时间戳输出。其他部分实现起来相对简单。
如果你在开发过程中还有问题，可以继续问我。

印阳秋 · Answer

Telegram的语音转文字不带时间戳，但可以实现。
方法如下：
1. 记录语音总时长
2. 识别时获取每句话开始时间
3. 手动添加时间戳
你可以在后台处理语音文件时，用语音识别API（如谷歌语音识别）获取时间戳信息，再拼成“0:15-0:25：你好”这种格式。
这样就满足需求了。

校成礼 · Answer

Telegram官方API暂时不支持语音消息的时间戳识别。你可以试试下面几种方法：
1. 使用语音转文字的API，比如Google Speech-to-Text、阿里云ASR等，这些平台一般会返回带时间戳的文字结果。
2. 手动记录时间点。在前端播放语音时，监听播放进度，把文字片段与播放时间绑定，手动拼接成“0:15-0:25：你好”的格式。
3. 结合WebRTC或者FFmpeg处理音频文件，提取语音片段的时间范围。
这样虽然Telegram本身不支持，但是通过外部技术手段可以满足客户的需求。希望对你有帮助。

Telegram 语音转文字识别后的文本能否添加时间戳，对应语音时间段？

4 个回答

您的答案

Telegram 语音转文字识别后的文本能否添加时间戳，对应语音时间段？​

4 个回答

您的答案

Telegram 语音转文字识别后的文本能否添加时间戳，对应语音时间段？