百度语音合成在python中的使用

jibkfv

2019-06-28

今天来说一下在python中如何使用百度的语音合成功能；即输入一段文字，请求百度相关服务器后，会返回来一段二进制语音流，将这段二进制数据经过base64编码返回给前端，前端解码后，可以播放出这段语音；也可以将这段二进制语音流保存到一个wav文件中。

使用百度的语音合成，首先需要在百度的ai开放平台上注册。

具体代码如下:

import asyncio
from aiohttp import ClientSession

def get_baidu_voice(text, baidu_voice_token):
    content_audio = {
        'tex': text,
        'tok': baidu_voice_token,
        'cuid': 'default',
        'ctp': '1',
        'lan': 'zh',
        'per': '4',

    }
    
    speech_url = 'https://tsn.baidu.com/text2audio?'
    headers = {
        # 'Content-Type': 'audio/mp3'
        'Content-Type': 'application/json'
    }
    async with ClientSession() as session:
        async with session.post(url=speech_url, data=content_audio,
                                headers=headers) as res:
            ret = await res.content.read()
            try:
                # 将bytes类型转换为str类型
                ret_str = str(ret, encoding="utf-8")
            except Exception as e:
                # 正常返回
                self.speech = base64.b64encode(ret)
            else:
                # 异常返回
                ret_dict = json.loads(ret_str)
                if ret_dict["err_no"] == 502:
                    raise RuntimeError("access token expired, please check")
                elif ret_dict["err_no"] == 501:
                    raise RuntimeError("the input arguments is incorrect, please check")
                elif ret_dict["err_no"] == 503:
                    raise RuntimeError("合成后端出错")
                elif ret_dict["err_no"] == 500:
                    raise RuntimeError("unsupport input")

需要传入两个参数，分别是：需要转换成语音的文本和百度的语音token。

百度语音token的获取方式如下:

def get_baidu_voice_token():
    # client_id 为官网获取的AK， client_secret 为官网获取的SK
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id='+ client_id + '&client_secret=' + client_secret
    request = urllib.request.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib.request.urlopen(request)
    content_bytes = response.read()
    content_dict = json.loads(str(content_bytes, encoding="utf-8"))
    if content_dict:
        # 28天过期
        return content_dict["access_token"]

注意，token是有有效期的，需要定时获取新的token。

以上就是百度语音合成的调用，如有错误，欢迎交流指正！

语音合成百度语音合成 python

jibkfv

0 关注 0 粉丝 0 动态

相关推荐

极大提升合成速度，百度提出首个全并行语音合成模型ParaNet

当前所有基于神经网络的语音合成模型都依赖于自回归，或者循环神经网络，而百度最近提出了一种依赖于非自回归的全并行模型。该模型在合成速度和语音质量方面都有很大的提升。语音合成在智能家居、内容创作、人机交互领域有着广泛应用。该模型直接采用前馈神经网络，不依赖于

mingzheng 2019-05-29

语音合成首个完全端到端模型，百度并行音频波形生成模型ClariNet

选自百度，作者：Wei Ping、Kainan Peng、Jitong Chen，机器之心编辑。语音合成是将自然语言文本转换成语音音频输出的技术，在 AI 时代的人机交互中扮演至关重要的角色。此外，这也是语音合成领域第一个真正的端到端模型：单个神经网络，直

AI启蒙研究院 2018-07-25

新研究起底人类和机器注意力机制的区别｜一周AI最火论文

呜啦啦啦啦啦啦啦大家好，拖更的AIScholar Weekly栏目又和大家见面啦！AI ScholarWeekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。每周更新，做AI科研，每周从这一篇开

DSFG 2019-07-02

百度大脑5.0发布，宣布与华为重要合作，全新AI芯片「鸿鹄」面世

7 月 3 日，百度 AI 开发者大会在北京开幕。在大会上李彦宏展示的百度 AI 语音识别能力之外，最为引人注目的就是新任 CTO 王海峰向我们揭幕的，最新升级的百度大脑 5.0。新一代大脑在算法和算力上都有了重大突破。「百度大脑已经升级为软硬一体的 AI

Allsle 2019-07-03

「微信同声传译」小程序插件：快速实现语音转文字、文本翻译、语音合成等能力

上期，我们在《「医院 LBS 位置服务」插件：输出LBS室内位置能力，为改善就医服务提供解决方案》一文中介绍了「医院 LBS 位置服务」小程序插件的意义、使用场景以及使用方法。今天我们为大家推荐的插件是「微信同声传译」，如果你想在小程序中拥有快速实现语音转

klshige 2019-06-29

基于深度前馈序列记忆网络，如何将语音合成速度提升四倍？

研究背景语音合成系统主要分为两类，拼接合成系统和参数合成系统。其中参数合成系统在引入了神经网络作为模型之后，合成质量和自然度都获得了长足的进步。另一方面，物联网设备的大量普及也对在设备上部署的参数合成系统提出了计算资源的限制和实时率的要求。本工作引入的深度

格式化中 2019-06-28

在Python中使用科大讯飞Web API进行语音合成

前几日讯飞开放平台推出了WebAPI接口，恰好最近需要实现一个文字转语音的功能，于是就尝试着用了起来。但不知什么原因，官方文档的调用示例一直报错，最后自己照着示例的思路用python3重写了一遍。所以这次总结一下在Python中使用讯飞Web API进行语

LittleCoder 2019-06-26

基于深度前馈序列记忆网络，如何将语音合成速度提升四倍？

语音合成系统主要分为两类，拼接合成系统和参数合成系统。其中参数合成系统在引入了神经网络作为模型之后，合成质量和自然度都获得了长足的进步。另一方面，物联网设备的大量普及也对在设备上部署的参数合成系统提出了计算资源的限制和实时率的要求。本工作引入的深度前馈序列

王尧的技术 2018-11-02

阿里巴巴语音交互智能团队：基于线性网络的语音合成说话人自适应

语音领域的顶会 ICASSP 2018 将于 4 月 15-20 日在加拿大阿尔伯塔卡尔加里市举行。据机器之心了解，国内科技巨头阿里巴巴语音交互智能团队有 5 篇论文被此大会接收。本文对论文《Linear networks based speaker ad

dbhllnr 2018-03-16

智能语音交互：阿里的研究和实践

在众多的人工智能应用中，智能语音交互是大众能够最近距离接触到的一个。国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域，并视其为下一个最重要的流量入口和服务分发途径。不仅是在这些新兴领域，智能语音交互还逐步渗透到传统行业内，助力传统服务智能

倦鸟归时 2017-09-06

语音合成到了跳变点？深度神经网络变革TTS最新研究汇总

近年来，随着深度神经网络的应用，计算机理解自然语音能力有了彻底革新，例如深度神经网络在语音识别、机器翻译中的应用。但是，使用计算机生成语音，仍在很大程度上基于所谓的拼接 TTS。而这种传统的方法所合成语音的自然度、舒适度都有很大的缺陷。深度神经网络，能否像

liqing 2017-04-05

谷歌全端到端语音合成系统Tacotron：直接从字符合成语音

最近，谷歌科学家王雨轩等人提出了一种新的端到端语音合成系统 Tacotron，该模型可接收字符的输入，输出相应的原始频谱图，然后将其提供给 Griffin-Lim 重建算法直接生成语音。该论文作者认为这一新思路相比去年 DeepMind 的 WaveNet

Allsle 2017-03-31

人工智能已经掌握人类语言了吗？外表有时会骗人

人工智能领域的成就很容易被误读和高估。这一点在人类语言处理领域表现得最为明显，在人类语言领域中，表象可能会错误地暗示出深层次的能力。它需要常识和对环境、创造力的理解，而目前的人工智能趋势并不具备这些。事实上，深度学习和其他人工智能技术已经在让人类和电脑更接

湾区人工智能 2018-10-24

无需蝴蝶结变声器也能一秒变柯南——语音合成+深度学习

简单来说，语音合成分为文本分析、韵律分析和声学分析三个部分。通过文本分析提取出文本特征，在此基础上预测基频、时长、节奏等多种韵律特征，然后通过声学模型实现从前端参数到语音参数的映射。语音合成主要采用波形拼接合成和统计参数合成两种方式。通常情况下，波形拼接语

yueguizhilin 2018-07-09

为了合成让人类听懂的语音，机器做了哪些“深度学习”？

深度学习在2006年开始崭露头脚后，近几年取得了飞速的发展，无论是学术研究还是企业应用均呈现出指数级增长的趋势;伴随着这项技术的不断成熟，深度学习在智能语音领域率先发力，取得一系列成功的应用。例如，一. 音色的定制化，需要跟踪录大量的音库，重新训练一个模型

WeiXiaoyu 2017-09-05

从技术到产品，苹果Siri深度学习语音合成技术揭秘

Siri 是一个使用语音合成技术与人类进行交流的个人助手。从 iOS 10 开始，苹果已经在 Siri 的语音中用到了深度学习，iOS 11 中的 Siri 依然延续这一技术。使用深度学习使得 Siri 的语音变的更自然、流畅，更人性化。机器之心对苹果

MarTinGuo 2017-08-30

用于语音合成的深度前馈序列记忆网络

我们提出了一种基于深度前馈序列记忆网络的语音合成系统。该系统在达到与基于双向长短时记忆单元的语音合成系统一致的主观听感的同时，模型大小只有后者的四分之一，且合成速度是后者的四倍，非常适合于对内存占用和计算效率非常敏感的端上产品环境。其中参数合成系统在引入了

hnyzyty 2018-03-25

讯飞语音JavaWeb语音合成解决方案

在线语音合成将文字信息转化为声音信息，给应用配上“嘴巴”。我们提供了众多极具特色的发音人（音库）供您选择。其合成音在音色、自然度等方面的表现均接近甚至超过了人声。这种语音合成体验，达到了真正可商用的标准。平台环境JDK1.7、Tomcat8、Eclipse

深圳湾 2018-03-07

XML在语音合成中的应用

互联网以及和它相关的一切现在似乎随处可见。您也许已经试过接到夜间电话推销员的语音电话、又或者曾经接到过当地药店给您的处方通知。现在，有一种新技术可以使用语音合成结合XML技术传送语音信息了。以语音传递信息的手段并不是什么新东西。其中最普遍的问题之一就是缺少

XMLDBS 2016-11-07

jibkfv

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号