如何在 TG 机器人源码里添加语音识别功能？

Question

你用Python写好了Telegram机器人，现在想加语音识别功能，其实就两步：接收语音、语音转文字。第一步，让机器人能接收语音，消息处理函数里判断消息类型是不是voice，然后把语音下载到本地。

亓官涵育 · Accepted Answer

你用Python写好了Telegram机器人，现在想加语音识别功能，其实就两步：接收语音、语音转文字。
第一步，让机器人能接收语音，消息处理函数里判断消息类型是不是voice，然后把语音下载到本地。
第二步，调用语音识别API把音频转成文字，推荐Google Speech-to-Text和Wit.ai，准确率高，支持中文。Python用google-cloud-speech或者requests调接口。
第三步，把识别出的文字传给你的机器人逻辑处理就好了。整个流程不复杂，就是音频处理和调API要熟悉一下。

水向荣 · Answer

给TG机器人加语音识别功能，首先得接收语音消息，然后把语音转成文字。
推荐使用 Google Speech-to-Text API 或者 Azure 的语音服务，这两个识别率比较高。
Python 可以用 pydub 转格式，然后用 requests 发送请求给 API。
记得先处理语音文件格式，比如转成 .wav 格式再发送给 API 识别。
最后把识别结果返回给用户即可。

素耘志 · Answer

想给TG机器人加上语音识别，其实就两步。
第一步，获取语音文件。当用户发语音消息时，你要通过Telegram API获取语音文件的file_id，再下载为本地文件（wav、mp3等）。
第二步，调用语音识别API。推荐使用Google Speech-to-Text（免费额度够用），也可以使用阿里云、百度语音识别（国内稳定）。用Python写的话，这些平台都提供SDK，直接pip安装，按文档调用接口即可。
代码也不难改，主要是监听语音消息，然后触发语音识别流程。建议先试试Google的，官方文档很详细。

渠晓君 · Answer

在TG机器人中加入语音识别功能，大致分三步：
第一步，接收语音消息。Telegram API会返回语音文件ID，使用getFile获取下载链接。
第二步，下载语音并转换为可处理格式。一般使用pydub转换为wav或mp3。
第三步，调用语音识别API。推荐使用Google Speech-to-Text，免费额度够用，Python库google-cloud-speech也很好用。
代码改动主要是消息处理部分，加一个判断，如果消息类型是语音，就执行上面流程。记得配置好API认证信息。

却谷菱 · Answer

1. 先确认你的 TG 机器人可以接收语音消息（voice）；
2. 然后把接收到的语音文件下载到本地，或上传至语音识别API；
3. 选API的话，建议阿里云、腾讯云或百度的语音识别服务，准确率高，文档齐全；
4. 用Python写一个调用这些API的接口，把语音转成文字，然后交给机器人处理；
5. 最后一步，把识别后的文本结果返回给用户即可。
加完语音识别，你的TG机器人就“会听”语音了。注意处理好异常，如语音太短、格式不对等。

如何在 TG 机器人源码里添加语音识别功能？

5 个回答

您的答案