【python】tkinter界面化+百度API—语音翻译(二)

2023年5月25日上午8:36 • 人工智能 • 阅读 71

实现结果如下：

百度API

这里实现语音翻译功能是结合上一遍的语音识别（https://blog.csdn.net/weixin_47292166/article/details/121273428）和新的百度API通用文本翻译去实现的。所以我们仍需要在百度AI开放平台-全球领先的人工智能服务平台里去进行通用文本翻译的应用创建然后获取自己的ID、API key和Secre Key。

进入百度AI平台后选择开放能力下的语音技术–>自然语言处理–>通用文本翻译

选择【立即使用】进入，然后选择【创建应用】，根据提示创建完成即可获得自己的ID、API key和Secre Key。

对百度API的调用和access_token的获取以及具体参数使用方法可以参考里面的【技术文档内容https://ai.baidu.com/ai-doc/MT/4kqryjku9】，这里只说在代码里具体用到的内容。（看代码部分）

tkineter界面设计

1.界面的初始化及布局：

    def __init__(self):
        self.api_key = '语音翻译的key'
        self.secret_key = '语音翻译的secret'
        self.token = self.get_token(self.api_key, self.secret_key)

        self.ID = '语音识别的ID'
        self.Key = '语音识别的key'
        self.Secret = '语音识别的secret'
        # 用语音类创建对象
        self.client = AipSpeech(self.ID, self.Key, self.Secret)  # 语音识别对象
        #创建窗口
        self.screen = Tk()# Toplevel() # Tk()
        self.screen.resizable(width=False, height=False)
        self.screen.title('语音翻译')  #设置标题
        self. screen. geometry('500x800') #设置窗口大小

        # 打开图像,转为tkinter兼容的对象,
        img = Image.open('3.jpg').resize([500,800])
        self.img = ImageTk.PhotoImage(img)
        #创建画布，将图像作为画布背景, 铺满整个窗口
        self.canvas = Canvas(self.screen, width=500, height=800) #设置画布的宽、高
        self.canvas.place(x=0, y=0)
        self.canvas.create_image(250,400,image = self.img) #把图像放到画布，默认放置中心点
        self.canvas.create_text(250, 100, text='语音翻译', font=('宋体', 40))
        self.canvas.create_text(110, 170, text='原文：', font=('宋体', 20),fill = 'green')
        self.canvas.create_text(110, 270, text='译文：', font=('宋体', 20),fill = 'blue')

        # 创建标题标签
        # Label(self.screen, bg='royalblue', text='语音翻译', font=('宋体', 40), fg='white').pack(pady=90)  # 上下间隔100
        # 创建原文标签
        # Label(self.screen, bg='dodgerblue', text='原文：', font=('宋体', 20), fg='white').place(x=100, y=150)
        # 创建原文文本框
        self.original = Text(self.screen, width=22,height = 2, font=('宋体', 20))
        self.original.place(x=100, y=200)
        # 创建译文标签
        # Label(self.screen, bg='dodgerblue', text='译文：', font=('宋体', 20), fg='white').place(x=100, y=250)
        # 创建译文文本框
        self.Translation = Text(self.screen, width=22,height = 2, font=('宋体', 20))
        self.Translation.place(x=100, y=300)
        # 创建按钮
        Button(self.screen, width=10, text='文本翻译', font=('宋体', 20), fg='white',
               command=lambda :self.text_run(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=80, y=600)  # activebackground 设置按键按下有变化 activebforeground设置前景色
        Button(self.screen, width=10, text='语音翻译', font=('宋体', 20), fg='white',
               command=lambda :self.adio_run(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=280, y=600)
        Button(self.screen, width=25, text='返回', font=('宋体', 20), fg='white',
               command=lambda :self.jumpweb(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=80, y=650)
        Button(self.screen, width=5, text='清空', font=('宋体', 20), fg='white',
               command=lambda: self.delete_text(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=330, y=380)
        self.screen.mainloop(0)

2.access_token的获取模块

    def get_token(self,key,secret):
        url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + key + '&client_secret=' + secret
        response = requests.post(url)
        result = response.json()
        result = result['access_token']
        return result

确定源语言和翻译的目标语言模块

    def is_eng(self,text):
        if ord(text[0]) in range(ord('a'), ord('z') + 1) or ord(text[0]) in range(ord('A'), ord('Z') + 1):
            return 'en', 'zh'
        else:
            return 'zh', 'en'

4.语言翻译模块（这里就是调用百度文本翻译API实现的）

    def translate(self,text,token):
        url = 'https://aip.baidubce.com/rpc/2.0/mt/texttrans/v1'
        # 参数：URL + access_token
        # 请求参数：from 什么语音 to 什么语音，q 翻译什么内容
        fr, tr = self.is_eng(text[0])
        url = url + '?access_token=' + token + '&from=' + fr + '&to=' + tr + '&q=' + text
        response = requests.post(url)
        result = response.json()
        result = result['result']['trans_result'][0]['dst']
        return result

5.录音模块（根据声音的有无决定录音的结束）：

    def get_adio(self,sec=0):
        p = pyaudio.PyAudio()
        stream = p.open(format=pyaudio.paInt16,
                        channels=1,
                        rate=16000,
                        input=True,
                        frames_per_buffer=1024)
        wf = wave.open('test.wav', 'wb')
        wf.setnchannels(1)
        wf.setsampwidth(p.get_sample_size(pyaudio.paInt16))
        wf.setframerate(16000)
        print('开始说话')
        stopflag = 0
        conflag = 0
        while True:
            data = stream.read(1024)
            rt_data = np.frombuffer(data, np.dtype(' 7000:
                conflag += 1
            else:
                stopflag += 1
            oneSecond = int(16000 / 1024)
            if stopflag + conflag > oneSecond:  # 如果两种情况的次数超过一帧的大小
                if stopflag > oneSecond // 3 * 2:  # 其中无声的部分超过一帧的2/3，则停止
                    break
                else:
                    stopflag = 0
                    conflag = 0
            wf.writeframes(data)
        print('停止说话')
        stream.stop_stream()
        stream.close()
        p.terminate()
        wf.close()
        return 'test.wav'

6.语音转文本模块（这里就是调用的百度API去语音识别）

    def StoT(self):
        file = self.get_adio()
        # 调用对象进行识别，需要为对象传递参数：
        # 识别三种格式：wav，pcm，amr
        # 语音文件，语音格式，采样频率，识别ID（1573：中文普通话）
        Format = file[-3:]
        data = open(file, 'rb').read()
        result = self.client.asr(data, Format, 16000, {'dev_pid': 1537})
        result = result['result'][0]
        # print(result)
        return result

7.文本朗读模块（这里是调用python里的pyttsx3库去实现将文本语音播放出来）

    def say(self,text):
        engine = pyttsx3.init()
        engine.say(text)
        engine.runAndWait()

PS：这里5-7步骤其实跟语言识别的2-4是一样的

完整代码：

from tkinter import *
from PIL import Image,ImageTk
import requests
import pyttsx3
import pyaudio
from scipy import fftpack
import wave
import numpy as np
from aip import  AipSpeech

#主界面面设计,创建类,在构造方法中没计界面
class TransPage():
    def __init__(self):
        self.api_key = '语音翻译的key'
        self.secret_key = '语音翻译的secret'
        self.token = self.get_token(self.api_key, self.secret_key)

        self.ID = '语音识别的ID'
        self.Key = '语音识别的key'
        self.Secret = '语音识别的secret'
        # 用语音类创建对象
        self.client = AipSpeech(self.ID, self.Key, self.Secret)  # 语音识别对象
        #创建窗口
        self.screen = Tk()# Toplevel() # Tk()
        self.screen.resizable(width=False, height=False)
        self.screen.title('语音翻译')  #设置标题
        self. screen. geometry('500x800') #设置窗口大小

        # 打开图像,转为tkinter兼容的对象,
        img = Image.open('3.jpg').resize([500,800])
        self.img = ImageTk.PhotoImage(img)
        #创建画布，将图像作为画布背景, 铺满整个窗口
        self.canvas = Canvas(self.screen, width=500, height=800) #设置画布的宽、高
        self.canvas.place(x=0, y=0)
        self.canvas.create_image(250,400,image = self.img) #把图像放到画布，默认放置中心点
        self.canvas.create_text(250, 100, text='语音翻译', font=('宋体', 40))
        self.canvas.create_text(110, 170, text='原文：', font=('宋体', 20),fill = 'green')
        self.canvas.create_text(110, 270, text='译文：', font=('宋体', 20),fill = 'blue')

        # 创建标题标签
        # Label(self.screen, bg='royalblue', text='语音翻译', font=('宋体', 40), fg='white').pack(pady=90)  # 上下间隔100
        # 创建原文标签
        # Label(self.screen, bg='dodgerblue', text='原文：', font=('宋体', 20), fg='white').place(x=100, y=150)
        # 创建原文文本框
        self.original = Text(self.screen, width=22,height = 2, font=('宋体', 20))
        self.original.place(x=100, y=200)
        # 创建译文标签
        # Label(self.screen, bg='dodgerblue', text='译文：', font=('宋体', 20), fg='white').place(x=100, y=250)
        # 创建译文文本框
        self.Translation = Text(self.screen, width=22,height = 2, font=('宋体', 20))
        self.Translation.place(x=100, y=300)
        # 创建按钮
        Button(self.screen, width=10, text='文本翻译', font=('宋体', 20), fg='white',
               command=lambda :self.text_run(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=80, y=600)  # activebackground 设置按键按下有变化 activebforeground设置前景色
        Button(self.screen, width=10, text='语音翻译', font=('宋体', 20), fg='white',
               command=lambda :self.adio_run(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=280, y=600)
        Button(self.screen, width=25, text='返回', font=('宋体', 20), fg='white',
               command=lambda :self.jumpweb(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=80, y=650)
        Button(self.screen, width=5, text='清空', font=('宋体', 20), fg='white',
               command=lambda: self.delete_text(), bg='dodgerblue', activebackground='black',
               activeforeground='white').place(x=330, y=380)
        self.screen.mainloop(0)

    def delete_text(self):
        self.original.delete(0.0,END)
        self.Translation.delete(0.0,END)

    def get_token(self,key,secret):
        url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + key + '&client_secret=' + secret
        response = requests.post(url)
        result = response.json()
        result = result['access_token']
        return result
    # print(get_token(api_key,secret_key))
    # 确定源语言和翻译的目标语言
    def is_eng(self,text):
        if ord(text[0]) in range(ord('a'), ord('z') + 1) or ord(text[0]) in range(ord('A'), ord('Z') + 1):
            return 'en', 'zh'
        else:
            return 'zh', 'en'
    def translate(self,text,token):
        url = 'https://aip.baidubce.com/rpc/2.0/mt/texttrans/v1'
        # 参数：URL + access_token
        # 请求参数：from 什么语音 to 什么语音，q 翻译什么内容
        fr, tr = self.is_eng(text[0])
        url = url + '?access_token=' + token + '&from=' + fr + '&to=' + tr + '&q=' + text
        response = requests.post(url)
        result = response.json()
        result = result['result']['trans_result'][0]['dst']
        return result
        # print(result)

    # 创建函数进行语音播放
    def say(self,text):
        engine = pyttsx3.init()
        engine.say(text)
        engine.runAndWait()

    def text_run(self):
        text = self.original.get(0.0,END)
        self.Translation.insert('insert',self.translate(text, self.token))
        # print('翻译内容：', self.translate(text, self.token))
        self.say(self.translate(text, self.token))

    def get_adio(self,sec=0):
        p = pyaudio.PyAudio()
        stream = p.open(format=pyaudio.paInt16,
                        channels=1,
                        rate=16000,
                        input=True,
                        frames_per_buffer=1024)
        wf = wave.open('test.wav', 'wb')
        wf.setnchannels(1)
        wf.setsampwidth(p.get_sample_size(pyaudio.paInt16))
        wf.setframerate(16000)
        print('开始说话')
        stopflag = 0
        conflag = 0
        while True:
            data = stream.read(1024)
            rt_data = np.frombuffer(data, np.dtype(' 7000:
                conflag += 1
            else:
                stopflag += 1
            oneSecond = int(16000 / 1024)
            if stopflag + conflag > oneSecond:  # 如果两种情况的次数超过一帧的大小
                if stopflag > oneSecond // 3 * 2:  # 其中无声的部分超过一帧的2/3，则停止
                    break
                else:
                    stopflag = 0
                    conflag = 0
            wf.writeframes(data)
        print('停止说话')
        stream.stop_stream()
        stream.close()
        p.terminate()
        wf.close()
        return 'test.wav'

    def StoT(self):
        file = self.get_adio()
        # 调用对象进行识别，需要为对象传递参数：
        # 识别三种格式：wav，pcm，amr
        # 语音文件，语音格式，采样频率，识别ID（1573：中文普通话）
        Format = file[-3:]
        data = open(file, 'rb').read()
        result = self.client.asr(data, Format, 16000, {'dev_pid': 1537})
        result = result['result'][0]
        # print(result)
        return result
    def adio_run(self):
        text = self.StoT()
        self.original.insert('insert',text)
        self.Translation.insert('insert',self.translate(text, self.token))
        # print('原文：',text)
        # print('翻译内容：', self.translate(text, self.token))
        self.say(self.translate(text, self.token))

    def jumpweb(self):
        self.screen.destroy()

TransPage()

素材：

Original: https://blog.csdn.net/weixin_47292166/article/details/121316745
Author: 张顺财
Title: 【python】tkinter界面化+百度API—语音翻译(二)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/513138/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习：摩尔纹识别（翻拍检测）

今年暑假开始在实习公司差不多从零基础学习深度学习，接到的第一个任务是CV的图像分类任务：翻拍检测。本文的目的是留档这次任务的一些思路以及tricks。翻拍（recapture）：…

人工智能 2023年5月28日
00107
YOLO-V5-超参数介绍及优化策略

这里写自定义目录标题 * – yaml文件 – 超参数 – 优化策略 yaml文件模型深度&宽度 nc: 3 # &#x7C7…

人工智能 2023年5月26日
0069
Python贪吃蛇 (完整代码+详细注释+粘贴即食）

文章目录代码运行截图笔记补充参考博客（阿里嘎多！）代码 ”’ 游戏玩法：回车开始游戏；空格暂停游戏/继续游戏；方向键/wsad控制小蛇走向 ”’ ”’ 思路：用列表…

人工智能 2023年7月6日
00262
Nginx学习（三）

目录：（1）Nginx-静态代理（2）Nginx-静态代理案例-静态资源后缀名拦截处理（3）Nginx-静态代理案例-静态资源关键字拦截处理（4）Nginx-动静分离案例 …

人工智能 2023年6月27日
0059
【论文笔记】Active Domain Adaptation via Clustering Uncertainty-weighted Embeddings(ICCV2021)

论文：Active Domain Adaptation via Clustering Uncertainty-Weighted Embeddings代码：https://githu…

人工智能 2023年5月31日
0083
传统目标检测算法

目标分类：给一张图片，分类目标检测：给一张图片，找到目标，并用矩形框画出分类是对一幅图整体，检测是更进一步，找出一幅图中一部分。一般检测以分类为基础，目标检测就是找出图像中…

人工智能 2023年7月12日
0098
万字长文文带你了解自动驾驶重要传感器——激光雷达

本篇是本人基本汇集全网信息，按照自己逻辑顺序写的。算是自动驾驶激光雷达基础，文中有错还请指出。如果此篇帮助到你，点个赞再走吧激光雷达背景 1.1. 概念与特点激光雷达是利用激…

人工智能 2023年6月1日
00108
【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition

论文题目：Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral In…

人工智能 2023年7月10日
0049
一文读懂K-Means原理与Python实现

目录一、K-Means原理 1.聚类简介 ①分层聚类 ②质心聚类 ③其他聚类 2.K-means的原理 3.K-means的应用场景二、K-Means的案例实战 1.数据查看 …

人工智能 2023年7月5日
0050
滑动平均滤波_【小工具教程】光谱平滑滤波

未经处理的实验光谱常伴有大量噪音，本工具采用Savitzky-Golay(S-G)卷积平滑算法对光谱数据进行处理，可提高光谱的平滑性，降低噪音的干扰。本工具适用于 &#x7…

人工智能 2023年6月10日
0061
python爬虫1——Requests库

我相信，大家既然想学python，那必然对爬虫有一定的了解，爬虫，是一门技术，大多数编程语言都能写爬虫。但是，为什么这么多人会选择学习python来写爬虫程序呢？python的魅…

人工智能 2023年7月16日
0056
深度学习之基于CNN实现汉字版手写数字识别（Chinese-Mnist）

Mnist数据集是深度学习入门的数据集，昨天发现了Chinese-Mnist数据集，与Mnist数据集类似，只不过是汉字数字，例如’一’、’二&…

人工智能 2023年5月26日
0076
【计算机视觉】数字图像处理（四）—— 图像增强

数字图像处理（四）—— 图像增强 * – 图像增强的定义 – + * 图像增强方法 – 一、图像增强的点运算 – + （一）灰度变换…

人工智能 2023年7月27日
00139
回归插补法_R语言缺失值的处理：线性回归模型插补

在当我们缺少值时，系统会告诉我用-1代替，然后添加一个指示符，该变量等于-1。这样就可以不删除变量或观测值。我们在这里模拟数据，然后根据模型生成数据。未定义将转换为NA。一般建议…

人工智能 2023年6月18日
00124
最小二乘法在回归问题中的应用

最小二乘法在回归问题中的应用线性回归基础知识假设我们有样本D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . . . ( x n , y n…

人工智能 2023年6月17日
0067
ChatGPT接入微信。

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0053

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【python】tkinter界面化+百度API—语音翻译(二)

大家都在看