51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#语音
语音识别(ASR) 阿里云
做语音识别这块的呢,国内领先的有科大讯飞,BAT这几家公司,鉴于使用科大讯飞的接口需要付费,腾讯云的语音识别申请了几天也没给通过,比较了一下阿里和百度的,个人觉得阿里云的好用一些,这篇博客来讲讲怎么讲阿里云的语音识别应用到项目中。首先是一些链接阿里云语音识别官网:https://help.aliyun.com/docu...
代码星球
·
2020-04-13
语音
识别
ASR
阿里
利用百度语音识别接口将语音转换成文字教程
如果有一个工具能识别音视中的语音并转换成文字输出,由于可以复制粘贴而不需要逐字逐句地打,那我们进行为音频配字幕工作时将会事半功倍。其中的关键点是音文转换,音文转换其实在很多地方都可以看到比如qq,百度搜索,讯飞输入法等等,具体到技术而言前述的三个场景其背后的技术都是一样的,都是利用AI进行语音识别。而且腾讯、百度、讯飞...
代码星球
·
2020-04-13
语音
利用
百度
识别
接口
语音识别(LSTM+CTC)
完整版请微信关注“大数据技术宅”序言:语音识别作为人工智能领域重要研究方向,近几年发展迅猛,其中RNN的贡献尤为突出。RNN设计的目的就是让神经网络可以处理序列化的数据。本文笔者将陪同小伙伴们一块儿踏上语音识别之梦幻旅途,相信此处风景独好。内容目录 环境准备RNN与LSTM介绍RNNL...
代码星球
·
2020-04-12
语音
识别
LSTM+CTC
淘宝语音搜索的实现——html5
作为一个专业的淘宝控,不知道从什么时候开始发现淘宝上居然还有语音搜索,好吧,因为好奇心作祟还是想一探究竟。不过我想仔细一点的人,都会发现在只有在webkit内核的浏览器上有,原因是它只支持webkit内核浏览器。我们先看下他们的不同显示 下面是在火狐...
代码星球
·
2020-04-09
淘宝
语音
搜索
实现
html5
C#中调用SAPI实现语音识别的2种方法
通过微软的SAPI,不仅仅可以实现语音合成TTS,同样可以实现语音识别SR。下面我们就介绍并贴出相关代码。主要有两种方式:1、使用COM组件技术,不管是C++,C#,Delphi都能玩的转,开发出来的东西在XP和WIN7都能跑。(注意要引入系统组件SpeechLib,XP要安装识别引擎)2、使用WIN7的windows...
代码星球
·
2020-04-07
调用
SAPI
实现
语音
别的
python实现语音录入识别
1.第一步录音存入本地2.调用百度语音识别sdk注意点:百度语音识别对声音源有要求,比特率必须是256kbps#安装必要库pipinstallbaidu-aip#百度sdkpipinstallpyaudioimportwaveimportpyaudiofromaipimportAipSpeechdefrecord():...
代码星球
·
2020-04-07
python
实现
语音
录入
识别
python性能优化、内存优化、内存泄露;与其他语音比较效率如何?
1、内存泄露:http://www.cnblogs.com/xybaby/p/7491656.html2、内存优化:http://www.cnblogs.com/xybaby/p/7488216.html3、性能提升:http://www.cnblogs.com/xybaby/p/6510941.html4、与其他语音...
代码星球
·
2020-04-06
优化
内存
python
性能
泄露
webrtc笔记(2): 1对1实时视频/语音通讯原理概述
开始正文之前,先思考1个问题:2个处于不同网络环境的(具备摄像头/麦克风多媒体设备的)浏览器,要实现点对点的实时视频/语音通讯,难点在哪?至少得先搞定下面2个问题:1、彼此要了解对方支持的媒体格式、支持的最大分辨率等媒体信息比如:peerA端可支持MPEG-1/2、H264多种编码格式,而peerB端支持MPEG-4、...
代码星球
·
2020-04-06
webrtc
笔记
实时
视频
语音
Android利用RecognizerIntent识别语音并简单实现打电话动作
关于Android利用RecognizerIntent识别语音并简单实现打电话,详细看实现代码例如以下:packagecom.example.recognizerintentactivity;importjava.util.ArrayList;importandroid.app.Activity;importandro...
代码星球
·
2020-04-06
Android
利用
RecognizerIntent
识别
语音
Android短信收到,语音播报
发送短信功能界面/***发送短信Demo**@description:*@authorldm*@date2016-4-22上午9:07:53*/publicclassSmsActivityextendsActivityimplementsOnClickListener{publicstaticfinalStringSM...
代码星球
·
2020-04-06
Android
短信
收到
语音
播报
h5语音录制及上传(Java版语音聊天系统)
SinceChromeversion47,VoiceRecordingworksonlyonHTTPSsites目前基于webikit(谷歌之类的webikit)和Gecko(Firefox52~57)都可以(不支持苹果移动设备),测试地址https://sms.reyo.cn/用户名:aa密码:123456源码下载:...
代码星球
·
2020-04-04
h5
语音
录制
上传
Java
2019年,这8款自动语音识别方案你应该了解!
原创: AI前线小组译 AI前线 1周前作者|DerrickMwiti翻译|核子可乐编辑|LindaAI前线导读: 基于计算机的人类语音识别与处理能力,被统称为语音识别。目前,这项技术被广泛用于验证系统中的某些用户,以及面向谷歌智能助手、Siri或者Cortana等智能设备下达指...
代码星球
·
2020-04-03
2019年
8款
自动
语音
识别
Python实现语音识别和语音合成
目录语音识别 MFCC 隐马尔科夫模型声音合成声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的...
代码星球
·
2020-04-03
语音
Python
实现
识别
合成
Python调用百度接口(情感倾向分析)和讯飞接口(语音识别、关键词提取)处理音频文件
本示例的过程是:1.音频转文本2.利用文本获取情感倾向分析结果3.利用文本获取关键词提取 首先是讯飞的语音识别模块。在这里可以找到非实时语音转写的相关文档以及Python示例。我略作了改动,让它可以对不同人说话作区分,并且作了一些封装。weblfasr_python3_demo.py 文件:1#!/...
代码星球
·
2020-04-02
接口
Python
调用
百度
情感
数字语音信号处理学习笔记——语音信号的短时频域分析(2)
4.3滤波器的解释 1.短时傅里叶变换的滤波器实现形式一 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvam9q...
IT猿
·
2020-03-27
数字
语音
信号处理
学习
笔记
首页
上一页
1
2
3
4
5
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他