语音主题的文章列表，还有语音的技术要点_第1页

语音转文字开源工具-Buzz

Buzz是一款开源的实时语音转文字工具，基于OpenAIWhisper的开源音频转文字模型。多操作系统支持包括Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字，也支持将视频、音频文件转换为文字、字幕。功能特性：实时语音转文字、实时翻译（多国语言，包括中文）导入音频、视频文件（mp3、wav、...

开发笔记·2023-02-26

泡沫下的破浪者，智能语音产品到底落地何处？

如今的科技在各个方面的发展都非常的迅速，越来越多“不切实际”的幻想也在被实现！而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音，这条路就摆在我们面前。演讲嘉宾：盛京，阿里云达摩院-机器智能技术专家达摩院语音组成立于2014年，具有语音识别、语音合成、声纹识别、自然语言处理、语音交互等等的能力。以下内容根据演...

代码星球·2021-02-24

科大讯飞语音合成系统 V5.0绿色便携版

中文名:中科大讯飞Interphonic5.0语音合成系统英文名:Interphonic5.0版本:5.0发行时间:2006年制作发行:中科大讯飞语言:简体中文系统简介InterPhonic系列语音合成系统是科大讯飞公司推出的中英文混读语音合成系统，主要功能就是提供中英文混合文本连续语音合成服务，提供调用语音合成服务的...

代码星球·2021-02-23

基于讯飞语音API应用开发之——离线词典构建

　　最近实习在做一个跟语音相关的项目，就在度娘上搜索了很多关于语音的API，顺藤摸瓜找到了科大讯飞，虽然度娘自家也有语音识别、语义理解这块，但感觉应该不是很好用，毕竟之前用过百度地图的API，有问题也找不到人帮忙解决（地图开发者群里都是潜水的）...不得不说，科大讯飞在语音这块尤其是中文识别方面做的真心不错，而且And...

代码星球·2021-02-21

在Activity不可见时暂停WebView的语音播放，可见时继续播放之前的语音

privateAudioManagermAudioManager;privateAudioManager.OnAudioFocusChangeListenermFocusChangeListener;@OverrideprotectedvoidonPause(){　　super.onPause();　　stopPlay...

代码星球·2021-02-20

[转]Freeswitch在阿里云服务器语音不通问题小记（FS的NAT穿越穿透）

网上找了一大堆，基本都是说设置ext-rtp-ip和ext-sip-ip为公网地址就可以，但没有效果！最后，我在这篇CSDN博主「flybird_168」的原创文章找到的处理，真谢谢他了！下面对他的文章调整一下内容说明一下： 1、路由器去掉upnp和alg功能。服务器的路由本身没进行U...

代码星球·2021-02-20

如何用java实现语音播报？

1.用Java实现语音播报，分为四步①音响；②调节语速；③调节音量；④执行对象；⑤执行朗读；packagenet.yuying;/***一个用java代码实现语音播报示例**/importcom.jacob.activeX.ActiveXComponent;//如此处报错，可能是jar的问题可能要到网上下一个jacob...

代码星球·2021-02-14

讯飞语音语音听写，设置识别语言

privatevoidinitIfly(){//SpeechUtility.createUtility(getActivity(),SpeechConstant.APPID+"=5b94432a");initListener=newInitListener(){@OverridepublicvoidonIn...

代码星球·2021-02-13

讯飞语音：客户端未被授权

同一个appID在两个应用中使用了。或者超过了免费的试用时间...

代码星球·2021-02-13

讯飞语音的中的bug用户校验失败

用户校验失败：原因是目录没有复制粘贴正确. 下面是刚刚下载的SDK目录:下面的是自己Android工程中的目录：注意复制粘贴的文件路径要正确 ...

代码星球·2021-02-13

freeswitch配置既能打电话又能语音识别问题（并个unimrcp传自定义参数）

双腿识别，通过订阅事件获取识别结果为了能实现双腿识别，这里通过Lua脚本使用freeswitch.Session来实现，call.lue放在freeswitch的script目录下--call.luasession:answer();localcaller_number=argv[1];--主叫号码localcalle...

代码星球·2021-02-11

阿里巴巴语音识别模型 DFSMN 的使用指南

阿里巴巴2018年开源的语音识别模型DFSMN，将全球语音识别准确率纪录提高至96.04%。DFSMN模型，是阿里巴巴的高效工业级实现，相对于传统的LSTM、BLSTM等声学模型，该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。本场Chat的主要内容包括：语音识别流程简介；Kaldi的部署使用；...

代码星球·2021-02-11

微信小程序语音识别开发过程笔记

由于业务需求，需要使用微信小程序语音识别的功能，查找了好多发难，也踩了好多坑，把过程记录一下，或许会帮助到需要的朋友。在小程序中识别用户语音输入的命令关键流程流程：录音存储-->上传录音文件到服务器后台-->读取服务器返回结果关键代码：//按键按下事件startRec:function(res){varth...

代码星球·2021-02-03

ekho安装及测试（中文文字转语音）

1.官网下载源码包地址：http://www.eguidedog.net/ekho.php2.安装1xz-dekho-7.5.tar.xz2tar-xvfekho-7.5.tar3apt-getinstalllibespeak-dev4apt-getinstallpulseaudio5apt-getinstalllib...

代码星球·2021-01-23

FreeSWITCH中文语音包

一、中文语音资源的获取1官方提供的资源：http://files.freeswitch.org/releases/sounds/2自己录音3实在不行可以@我给你发一份。二、中文资源的安装1英文资源的路径为conf/sounds/en/us/callie/...2类似的设置中文资源的路径为conf/sounds/zh/c...

代码星球·2021-01-22