TextToSpeech

AI 语音对话技术

廉价感情. 提交于 2021-02-15 05:01:06
  机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品。 一、语音交互流程简介 AI 对话所需要的技术模块有 4 个部分,分别为: 自动语音识别(Automatic Speech Recognition, ASR) 自然语言理解(Natural Language Understanding, NLU) 自然语言生成(Natural Language Generation, NLG) 文字转语音(Text to Speech, TTS) 以叮咚开发文档中的语音交互流程图来看Ai 对话技术的主要路径: 从上图中可以看到,用户与设备之间的交互,主要是采用语音方式处理和完成的。 二、语音交互流程设计 一次完整的语音交互流程,成功的语音对话,通常是有以下几个阶段。 1.交互流程的核心—意图 所谓意图,表示用户在使用应用时所做的动作(譬如:问一个问题或发送一条指令),这些意图代表了应用的核心功能。 如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反馈给用户;如果应用无法识别用户意图,则需要给用户友好的提示,指导用户使用。 用户:七星彩的开奖时间是什么时候? Ai:体育彩票七星彩每周二、周四和周日开奖。 2. 如何识别意图

Android自带语音播报+讯飞语音播报封装(直接用)

岁酱吖の 提交于 2021-02-06 15:57:55
一、Android自带的语音播报 1.查看是否支持中文,在测试的设备中打开‘设置’ -->找到 '语言和输入法'-->查看语音选项,是否支持中文,默认仅支持英文. 使用如下: public class AndroidTTSActivity extends AppCompatActivity implements View.OnClickListener { private TextToSpeech textToSpeech = null ; // 创建自带语音对象 @Override protected void onCreate(@Nullable Bundle savedInstanceState) { super .onCreate(savedInstanceState); setContentView(R.layout.android_tts_layout); findViewById(R.id.btn0).setOnClickListener( this ); initTTS(); } private void initTTS() { // 实例化自带语音对象 textToSpeech = new TextToSpeech( this , new TextToSpeech.OnInitListener() { @Override public void onInit(

Android 简单的语音播报

南笙酒味 提交于 2021-02-06 15:52:20
不解释快上车 Main.class package com.example.myapp; import android.app.AlertDialog; import android.os.Bundle; import android.speech.tts.TextToSpeech; import android.speech.tts.TextToSpeech.OnInitListener; import android.speech.tts.TextToSpeechService; import android.support.v7.app.AppCompatActivity; import android.util.Log; import android.view.View; import android.widget.EditText; import android.widget.RadioButton; import android.widget.RadioGroup; import android.widget.Toast; import java.util.Date; import java.util.HashMap; import java.util.Locale; /** * 语音播报 * 局限不支持中文 */ public class Main extends

Visualize climate change by AI models?

本小妞迷上赌 提交于 2021-01-09 17:04:48
Generative AI models have been co-opted to synthesize things from faces and apartments to butterflies, but a novel subcategory seeks to bring awareness to climate change by illustrating the consequences of catastrophic flooding. In an effort to establish a metric to quantify the veracity of these synthetic climate change images, researchers University of Montreal and Stanford University researchers recently detailed “several” evaluation methods in a preprint paper. They say that their work, while preliminary, begins to bridge the gap between automated and human-based generative quantification.

android实现语音播报textToSpeech

半城伤御伤魂 提交于 2020-10-23 17:44:28
private void startAuto(String data) { // 设置音调,值越大声音越尖(女生),值越小则变成男声,1.0是常规 textToSpeech.setPitch(1.0f); // 设置语速 textToSpeech.setSpeechRate(1.0f); textToSpeech.speak(data,//输入中文,若不支持的设备则不会读出来 TextToSpeech.QUEUE_FLUSH, null); } private void initTTS() { //实例化自带语音对象 textToSpeech = new TextToSpeech(this, new TextToSpeech.OnInitListener() { @Override public void onInit(int status) { if (status == textToSpeech.SUCCESS) { textToSpeech.setPitch(1.0f);//方法用来控制音调 textToSpeech.setSpeechRate(1.0f);//用来控制语速 //判断是否支持下面两种语言 int result1 = textToSpeech.setLanguage(Locale.US); int result2 = textToSpeech

如何使用华为机器学习服务和Kotlin实现语音合成

点点圈 提交于 2020-08-18 14:31:50
1. 引言   你曾遇到过这种情况吗?一本小说太长,要花很长时间阅读,但如果有app能自动为你阅读,就会省时很多。因此,将文本转换成语音的工具应运而生。华为机器学习服务(HUAWEI ML Kit)具备语音合成(Text To Speech, TTS)功能,能让app快速实现从文本到语音的转换。TTS可以将文本转换成人声。这也可以通过默认方法实现,但这些方法不能提供自然或真实的声音。TTS服务全球通用,利用深度神经网络对文本进行处理,从而创造出自然的声音,同时也支持多种音色,以增强人声效果。TTS使用了云服务,字符数限制在500个以内,并使用UTF-8编码。   目前支持的音色如下: 英文-男声 英文-女声 中文-男声 中文-女声 英文+中文-男声 英文+中文-女声 2. 结果展示   视频展示了使用该服务后得到的结果。   视频链接: https://developer.huawei.com/consumer/cn/forum/topicview?fid=18&tid=0201314285827100291 3.集成步骤    步骤1: 在Android Studio中新建项目。    步骤2: 在app.gradle文件中添加依赖。   implementation 'com.huawei.hms:ml-computer-voice-tts:1.0.4.300'    步骤3:

编写使用Android 系统自带的文字转语音代码

回眸只為那壹抹淺笑 提交于 2020-08-18 12:19:32
调用Android系统语音TextToSpeech实例对象 具体代码写法如下: TextToSpeech mTextToSpeech = new TextToSpeech(this, new TextToSpeech.OnInitListener() { @Override public void onInit(int status) { if (status==TextToSpeech.SUCCESS) { //设置语言朗读 int supported= mTextToSpeech.setLanguage(Locale.US); if ((supported!=TextToSpeech.LANG_AVAILABLE)&& (supported!=TextToSpeech.LANG_COUNTRY_AVAILABLE)) { Toast.makeText(this, "不支持当前语言!", Toast.LENGTH_SHORT).show(); } } } }); mTextToSpeech.speak("这里填入想要转成语音的文字", TextToSpeech.QUEUE_FLUSH, null); 来源: oschina 链接: https://my.oschina.net/u/4285706/blog/4503554

如何使用华为机器学习服务和Kotlin实现语音合成

跟風遠走 提交于 2020-08-17 10:36:53
1. 引言   你曾遇到过这种情况吗?一本小说太长,要花很长时间阅读,但如果有app能自动为你阅读,就会省时很多。因此,将文本转换成语音的工具应运而生。华为机器学习服务(HUAWEI ML Kit)具备语音合成(Text To Speech, TTS)功能,能让app快速实现从文本到语音的转换。TTS可以将文本转换成人声。这也可以通过默认方法实现,但这些方法不能提供自然或真实的声音。TTS服务全球通用,利用深度神经网络对文本进行处理,从而创造出自然的声音,同时也支持多种音色,以增强人声效果。TTS使用了云服务,字符数限制在500个以内,并使用UTF-8编码。   目前支持的音色如下: 英文-男声 英文-女声 中文-男声 中文-女声 英文+中文-男声 英文+中文-女声 2. 结果展示   视频展示了使用该服务后得到的结果。   视频链接: https://developer.huawei.com/consumer/cn/forum/topicview?fid=18&tid=0201314285827100291 3.集成步骤    步骤1: 在Android Studio中新建项目。    步骤2: 在app.gradle文件中添加依赖。   implementation 'com.huawei.hms:ml-computer-voice-tts:1.0.4.300'    步骤3:

TensorFlow非常出色的30个机器学习数据集

拟墨画扇 提交于 2020-08-15 12:14:15
本文转自雷锋网,如需转载请至雷锋网官网申请授权。 TensorFlow是由谷歌大脑的研究人员创建、最大的机器学习和数据科学的开源数据库之一。它是一个端到端平台,适合完全没有经验的初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习教程以及一整套公开数据集。为了帮助你找到所需的训练数据,本文将简单介绍一些TensorFlow中用于机器学习的大型数据集。我们将以下数据集的列表分为图像、视频、音频和文本。 TensorFlow图像数据集 CelebA:明星脸属性数据集(CelebA)是最大的公开可用的人脸图像数据集,其中包含200,000多个名人图像。 每个图像包括5个面部标注和40个二进制属性标注。 Downsampling Imagenet:该数据集是为密度估计和生成性建模任务而建立的。它包括了130多万张物体、场景、车辆、人物等图像。这些图像有两种分辨率规格:32×32和64×64。 Lsun—Lsun是一个大规模的图像数据集,创建该数据集是为了帮助训练模型进行场景理解。该数据集包含超过900万张图像,按场景类别划分,如卧室、教室和餐厅。 Bigearthnet—Bigearthnet是另一个大规模数据集,它包含来自Sentinel-2卫星的航空图像。每张图像覆盖了1.2公里×1.2公里的一片地面。该数据集中有43个类别不平衡的标签。 Places

Docker 部署 FreeSWITCH

别来无恙 提交于 2020-05-07 13:20:37
前言   Linux 上部署 FreeSWITCH 是一件比较麻烦的事情,用 Docker 部署相对方便且更容易运维。下面详述官方项目部署步骤。 容器公开以下端口: 5060/tcp 5060/udp 5080/tcp 5080/udp作为SIP信令端口。 5066/tcp 7443/tcp作为WebSocket信令端口。 8021/tcp作为事件套接字端口。 64535-65535/udp作为媒体端口。 部署步骤 一、克隆git 执行命令 git clone https://github.com/BetterVoice/freeswitch-container.git 得到一个名为 freeswitch-container 的文件夹 # Jenkins. FROM ubuntu: 16.04 MAINTAINER Thomas Quintana <thomas@bettervoice.com> # Enable the Ubuntu multiverse repository. RUN echo " deb http://us.archive.ubuntu.com/ubuntu/ trusty multiverse " >> /etc/apt/ source.list RUN echo " deb-src http://us.archive.ubuntu.com/ubuntu/