51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#语音
什么是文本转语音?
文本转语音是一种语音合成形式,可将任何文本字符串转换为语音输出。研究表明,以类似人类的声音做出响应时,人们会更自在地交流。神经网络使文本转语音系统产生的声音领域得以扩充,而无连接合成的用度或发音合成的复杂性。将文本低延迟转换为高质量、自然发音的语音,即文本转语音API (TTS)的职能,这是数十年来一直颇具挑...
开发笔记
·
2024-08-27
什么
文本
语音
语音转文字开源工具-Buzz
Buzz是一款开源的实时语音转文字工具,基于OpenAIWhisper的开源音频转文字模型。多操作系统支持包括Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。功能特性:实时语音转文字、实时翻译(多国语言,包括中文)导入音频、视频文件(mp3、wav、...
开发笔记
·
2023-02-26
语音
文字
开源
工具
-Buzz
泡沫下的破浪者,智能语音产品到底落地何处?
如今的科技在各个方面的发展都非常的迅速,越来越多“不切实际”的幻想也在被实现!而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音,这条路就摆在我们面前。演讲嘉宾:盛京,阿里云达摩院-机器智能技术专家达摩院语音组成立于2014年,具有语音识别、语音合成、声纹识别、自然语言处理、语音交互等等的能力。以下内容根据演...
代码星球
·
2021-02-24
泡沫
破浪
智能
语音
产品
科大讯飞语音合成系统 V5.0绿色便携版
中文名:中科大讯飞Interphonic5.0语音合成系统英文名:Interphonic5.0版本:5.0发行时间:2006年制作发行:中科大讯飞语言:简体中文系统简介InterPhonic系列语音合成系统是科大讯飞公司推出的中英文混读语音合成系统,主要功能就是提供中英文混合文本连续语音合成服务,提供调用语音合成服务的...
代码星球
·
2021-02-23
科大
讯飞
语音
合成
系统
基于讯飞语音API应用开发之——离线词典构建
最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别、语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不到人帮忙解决(地图开发者群里都是潜水的)...不得不说,科大讯飞在语音这块尤其是中文识别方面做的真心不错,而且And...
代码星球
·
2021-02-21
基于
讯飞
语音
API
应用
在Activity不可见时暂停WebView的语音播放,可见时继续播放之前的语音
privateAudioManagermAudioManager;privateAudioManager.OnAudioFocusChangeListenermFocusChangeListener;@OverrideprotectedvoidonPause(){ super.onPause(); stopPlay...
代码星球
·
2021-02-20
可见
语音
播放
Activity
暂停
[转]Freeswitch在阿里云服务器语音不通问题小记(FS的NAT穿越穿透)
网上找了一大堆,基本都是说设置ext-rtp-ip和ext-sip-ip为公网地址就可以,但没有效果!最后,我在 这篇CSDN博主「flybird_168」的原创文章 找到的处理,真谢谢他了!下面对他的文章调整一下内容说明一下: 1、路由器去掉upnp和alg功能。服务器的路由本身没进行U...
代码星球
·
2021-02-20
Freeswitch
阿里
服务器
语音
不通
如何用java实现语音播报?
1.用Java实现语音播报,分为四步①音响;②调节语速;③调节音量;④执行对象;⑤执行朗读;packagenet.yuying;/***一个用java代码实现语音播报示例**/importcom.jacob.activeX.ActiveXComponent;//如此处报错,可能是jar的问题可能要到网上下一个jacob...
代码星球
·
2021-02-14
何用
java
实现
语音
播报
讯飞语音语音听写,设置识别语言
privatevoidinitIfly(){//SpeechUtility.createUtility(getActivity(),SpeechConstant.APPID+"=5b94432a");initListener=newInitListener(){@OverridepublicvoidonIn...
代码星球
·
2021-02-13
语音
讯飞
听写
设置
识别
讯飞语音:客户端未被授权
同一个appID在两个应用中使用了。或者超过了免费的试用时间...
代码星球
·
2021-02-13
讯飞
语音
客户端
未被
授权
讯飞语音的中的bug用户校验失败
用户校验失败:原因是目录没有复制粘贴正确. 下面是刚刚下载的SDK目录:下面的是自己Android工程中的目录:注意复制粘贴的文件路径要正确 ...
代码星球
·
2021-02-13
讯飞
语音
中的
bug
用户
freeswitch配置既能打电话又能语音识别问题(并个unimrcp传自定义参数)
双腿识别,通过订阅事件获取识别结果为了能实现双腿识别,这里通过Lua脚本使用freeswitch.Session来实现,call.lue放在freeswitch的script目录下--call.luasession:answer();localcaller_number=argv[1];--主叫号码localcalle...
代码星球
·
2021-02-11
freeswitch
配置
既能
打电话
又能
阿里巴巴语音识别模型 DFSMN 的使用指南
阿里巴巴2018年开源的语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%。DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。本场Chat的主要内容包括:语音识别流程简介;Kaldi的部署使用;...
代码星球
·
2021-02-11
阿里巴巴
语音
识别
模型
DFSMN
微信小程序语音识别开发过程笔记
由于业务需求,需要使用微信小程序语音识别的功能,查找了好多发难,也踩了好多坑,把过程记录一下,或许会帮助到需要的朋友。在小程序中识别用户语音输入的命令关键流程流程:录音存储-->上传录音文件到服务器后台-->读取服务器返回结果关键代码://按键按下事件startRec:function(res){varth...
代码星球
·
2021-02-03
微信
程序
语音
识别
开发
ekho安装及测试(中文文字转语音)
1.官网下载源码包地址:http://www.eguidedog.net/ekho.php2.安装1xz-dekho-7.5.tar.xz2tar-xvfekho-7.5.tar3apt-getinstalllibespeak-dev4apt-getinstallpulseaudio5apt-getinstalllib...
代码星球
·
2021-01-23
ekho
安装
测试
中文
文字
首页
上一页
1
2
3
4
5
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他