#语音

什么是文本转语音?

文本转语音是一种语音合成形式,可将任何文本字符串转换为语音输出。研究表明,以类似人类的声音做出响应时,人们会更自在地交流。神经网络使文本转语音系统产生的声音领域得以扩充,而无连接合成的用度或发音合成的复杂性。将文本低延迟转换为高质量、自然发音的语音,即文本转语音API (TTS)的职能,这是数十年来一直颇具挑...
开发笔记 ·2024-08-27

语音转文字开源工具-Buzz

Buzz是一款开源的实时语音转文字工具,基于OpenAIWhisper的开源音频转文字模型。多操作系统支持包括Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。功能特性:实时语音转文字、实时翻译(多国语言,包括中文)导入音频、视频文件(mp3、wav、...

泡沫下的破浪者,智能语音产品到底落地何处?

如今的科技在各个方面的发展都非常的迅速,越来越多“不切实际”的幻想也在被实现!而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音,这条路就摆在我们面前。演讲嘉宾:盛京,阿里云达摩院-机器智能技术专家达摩院语音组成立于2014年,具有语音识别、语音合成、声纹识别、自然语言处理、语音交互等等的能力。以下内容根据演...

科大讯飞语音合成系统 V5.0绿色便携版

中文名:中科大讯飞Interphonic5.0语音合成系统英文名:Interphonic5.0版本:5.0发行时间:2006年制作发行:中科大讯飞语言:简体中文系统简介InterPhonic系列语音合成系统是科大讯飞公司推出的中英文混读语音合成系统,主要功能就是提供中英文混合文本连续语音合成服务,提供调用语音合成服务的...

基于讯飞语音API应用开发之——离线词典构建

  最近实习在做一个跟语音相关的项目,就在度娘上搜索了很多关于语音的API,顺藤摸瓜找到了科大讯飞,虽然度娘自家也有语音识别、语义理解这块,但感觉应该不是很好用,毕竟之前用过百度地图的API,有问题也找不到人帮忙解决(地图开发者群里都是潜水的)...不得不说,科大讯飞在语音这块尤其是中文识别方面做的真心不错,而且And...

在Activity不可见时暂停WebView的语音播放,可见时继续播放之前的语音

privateAudioManagermAudioManager;privateAudioManager.OnAudioFocusChangeListenermFocusChangeListener;@OverrideprotectedvoidonPause(){  super.onPause();  stopPlay...

[转]Freeswitch在阿里云服务器语音不通问题小记(FS的NAT穿越穿透)

网上找了一大堆,基本都是说设置ext-rtp-ip和ext-sip-ip为公网地址就可以,但没有效果!最后,我在 这篇CSDN博主「flybird_168」的原创文章 找到的处理,真谢谢他了!下面对他的文章调整一下内容说明一下: 1、路由器去掉upnp和alg功能。服务器的路由本身没进行U...

如何用java实现语音播报?

1.用Java实现语音播报,分为四步①音响;②调节语速;③调节音量;④执行对象;⑤执行朗读;packagenet.yuying;/***一个用java代码实现语音播报示例**/importcom.jacob.activeX.ActiveXComponent;//如此处报错,可能是jar的问题可能要到网上下一个jacob...

讯飞语音语音听写,设置识别语言

 privatevoidinitIfly(){//SpeechUtility.createUtility(getActivity(),SpeechConstant.APPID+"=5b94432a");initListener=newInitListener(){@OverridepublicvoidonIn...

讯飞语音:客户端未被授权

同一个appID在两个应用中使用了。或者超过了免费的试用时间...

讯飞语音的中的bug用户校验失败

用户校验失败:原因是目录没有复制粘贴正确. 下面是刚刚下载的SDK目录:下面的是自己Android工程中的目录:注意复制粘贴的文件路径要正确 ...

freeswitch配置既能打电话又能语音识别问题(并个unimrcp传自定义参数)

双腿识别,通过订阅事件获取识别结果为了能实现双腿识别,这里通过Lua脚本使用freeswitch.Session来实现,call.lue放在freeswitch的script目录下--call.luasession:answer();localcaller_number=argv[1];--主叫号码localcalle...

阿里巴巴语音识别模型 DFSMN 的使用指南

阿里巴巴2018年开源的语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%。DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。本场Chat的主要内容包括:语音识别流程简介;Kaldi的部署使用;...

微信小程序语音识别开发过程笔记

由于业务需求,需要使用微信小程序语音识别的功能,查找了好多发难,也踩了好多坑,把过程记录一下,或许会帮助到需要的朋友。在小程序中识别用户语音输入的命令关键流程流程:录音存储-->上传录音文件到服务器后台-->读取服务器返回结果关键代码://按键按下事件startRec:function(res){varth...

ekho安装及测试(中文文字转语音)

1.官网下载源码包地址:http://www.eguidedog.net/ekho.php2.安装1xz-dekho-7.5.tar.xz2tar-xvfekho-7.5.tar3apt-getinstalllibespeak-dev4apt-getinstallpulseaudio5apt-getinstalllib...
首页上一页12345下一页尾页