语音主题的文章列表，还有语音的技术要点_第4页

语音识别（ASR）阿里云

做语音识别这块的呢，国内领先的有科大讯飞，BAT这几家公司，鉴于使用科大讯飞的接口需要付费，腾讯云的语音识别申请了几天也没给通过，比较了一下阿里和百度的，个人觉得阿里云的好用一些，这篇博客来讲讲怎么讲阿里云的语音识别应用到项目中。首先是一些链接阿里云语音识别官网：https://help.aliyun.com/docu...

代码星球 ·2020-04-13

利用百度语音识别接口将语音转换成文字教程

如果有一个工具能识别音视中的语音并转换成文字输出，由于可以复制粘贴而不需要逐字逐句地打，那我们进行为音频配字幕工作时将会事半功倍。其中的关键点是音文转换，音文转换其实在很多地方都可以看到比如qq，百度搜索，讯飞输入法等等，具体到技术而言前述的三个场景其背后的技术都是一样的，都是利用AI进行语音识别。而且腾讯、百度、讯飞...

代码星球 ·2020-04-13

语音识别（LSTM+CTC）

完整版请微信关注“大数据技术宅”序言：语音识别作为人工智能领域重要研究方向，近几年发展迅猛，其中RNN的贡献尤为突出。RNN设计的目的就是让神经网络可以处理序列化的数据。本文笔者将陪同小伙伴们一块儿踏上语音识别之梦幻旅途，相信此处风景独好。内容目录环境准备RNN与LSTM介绍RNNL...

代码星球 ·2020-04-12

淘宝语音搜索的实现——html5

作为一个专业的淘宝控，不知道从什么时候开始发现淘宝上居然还有语音搜索，好吧，因为好奇心作祟还是想一探究竟。不过我想仔细一点的人，都会发现在只有在webkit内核的浏览器上有，原因是它只支持webkit内核浏览器。我们先看下他们的不同显示下面是在火狐...

代码星球 ·2020-04-09

C#中调用SAPI实现语音识别的2种方法

通过微软的SAPI，不仅仅可以实现语音合成TTS，同样可以实现语音识别SR。下面我们就介绍并贴出相关代码。主要有两种方式：1、使用COM组件技术，不管是C++，C#，Delphi都能玩的转，开发出来的东西在XP和WIN7都能跑。（注意要引入系统组件SpeechLib，XP要安装识别引擎）2、使用WIN7的windows...

代码星球 ·2020-04-07

python实现语音录入识别

1.第一步录音存入本地2.调用百度语音识别sdk注意点：百度语音识别对声音源有要求，比特率必须是256kbps#安装必要库pipinstallbaidu-aip#百度sdkpipinstallpyaudioimportwaveimportpyaudiofromaipimportAipSpeechdefrecord():...

代码星球 ·2020-04-07

python性能优化、内存优化、内存泄露；与其他语音比较效率如何？

1、内存泄露：http://www.cnblogs.com/xybaby/p/7491656.html2、内存优化：http://www.cnblogs.com/xybaby/p/7488216.html3、性能提升：http://www.cnblogs.com/xybaby/p/6510941.html4、与其他语音...

代码星球 ·2020-04-06

webrtc笔记(2): 1对1实时视频/语音通讯原理概述

开始正文之前，先思考1个问题：2个处于不同网络环境的(具备摄像头/麦克风多媒体设备的)浏览器，要实现点对点的实时视频/语音通讯，难点在哪？至少得先搞定下面2个问题：1、彼此要了解对方支持的媒体格式、支持的最大分辨率等媒体信息比如：peerA端可支持MPEG-1/2、H264多种编码格式，而peerB端支持MPEG-4、...

代码星球 ·2020-04-06

Android利用RecognizerIntent识别语音并简单实现打电话动作

关于Android利用RecognizerIntent识别语音并简单实现打电话，详细看实现代码例如以下：packagecom.example.recognizerintentactivity;importjava.util.ArrayList;importandroid.app.Activity;importandro...

代码星球 ·2020-04-06

Android短信收到，语音播报

发送短信功能界面/***发送短信Demo**@description：*@authorldm*@date2016-4-22上午9:07:53*/publicclassSmsActivityextendsActivityimplementsOnClickListener{publicstaticfinalStringSM...

代码星球 ·2020-04-06

h5语音录制及上传(Java版语音聊天系统)

SinceChromeversion47,VoiceRecordingworksonlyonHTTPSsites目前基于webikit(谷歌之类的webikit)和Gecko(Firefox52~57)都可以(不支持苹果移动设备)，测试地址https://sms.reyo.cn/用户名:aa密码：123456源码下载：...

代码星球 ·2020-04-04

2019年，这8款自动语音识别方案你应该了解！

原创： AI前线小组译 AI前线 1周前作者|DerrickMwiti翻译|核子可乐编辑|LindaAI前线导读：基于计算机的人类语音识别与处理能力，被统称为语音识别。目前，这项技术被广泛用于验证系统中的某些用户，以及面向谷歌智能助手、Siri或者Cortana等智能设备下达指...

代码星球 ·2020-04-03

Python实现语音识别和语音合成

目录语音识别 MFCC 隐马尔科夫模型声音合成声音的本质是震动，震动的本质是位移关于时间的函数，波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换，可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加，通过频率谱线的特殊分布，建立音频内容和文本的...

代码星球 ·2020-04-03

Python调用百度接口（情感倾向分析）和讯飞接口（语音识别、关键词提取）处理音频文件

本示例的过程是：1.音频转文本2.利用文本获取情感倾向分析结果3.利用文本获取关键词提取首先是讯飞的语音识别模块。在这里可以找到非实时语音转写的相关文档以及Python示例。我略作了改动，让它可以对不同人说话作区分，并且作了一些封装。weblfasr_python3_demo.py 文件：1#!/...

代码星球 ·2020-04-02

数字语音信号处理学习笔记——语音信号的短时频域分析（2）

4.3滤波器的解释 1.短时傅里叶变换的滤波器实现形式一 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvam9q...

IT猿 ·2020-03-27

语音识别（ASR） 阿里云

利用百度语音识别接口将语音转换成文字教程

语音识别（LSTM+CTC）

淘宝语音搜索的实现——html5

C#中调用SAPI实现语音识别的2种方法

python实现语音录入识别

python性能优化、内存优化、内存泄露；与其他语音比较效率如何？

webrtc笔记(2): 1对1实时视频/语音通讯原理概述

Android利用RecognizerIntent识别语音并简单实现打电话动作

Android短信收到，语音播报

h5语音录制及上传(Java版语音聊天系统)

2019年，这8款自动语音识别方案你应该了解！

Python实现语音识别和语音合成

Python调用百度接口（情感倾向分析）和讯飞接口（语音识别、关键词提取）处理音频文件

数字语音信号处理学习笔记——语音信号的短时频域分析（2）

语音识别（ASR）阿里云