sphinx系统是一个拥有悠久历史的语音识别系统, 传说中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和sphinx2请大家不要去研究了。
Audio-Fingerprinting 是一个音乐指纹识别系统,使用的语言为 JAVA,同时需要用到 MySQL 数据库(虽然不是必须的,但这个系统采用他保存指纹和音乐信息)。他包含了指纹生成,数据库存储,和简易的服务器和客户端。
MathOCR是用Java语言编写的一个印刷体数学公式识别系统,可以识别图片中数学公式并转换为相应的LaTeX代码。 项目主页: http://www.open-open.com/li
最佳选择。但对于我们这些整天与代码打交道的人来说,有个更有效的工具,那就是Matlab。提起Matlab,知道的人可能不是很多,即使用过也多是用 作一种数学工具,但搞图像研究的人都知道,Matlab在图像处理上的强大远远超过了photo
今天从网上找了个例子实现了语音识别,个人感觉挺好玩的,就把代码贴出来与大家分享下: Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到设置,就会抛出异常
语言检测是一个很有意思的话题,不过相对比较成熟,这方面的解决方案很多,也有很多不错的开源工具包,不过对于Python来说,可以使用langid这个工具包,也非常愿意推荐它。
区间。当激活函数采用双极S形函数(值域为(-1,1))时这条式子适用。 (4) Matlab 数据归一化处理函数 Matlab中归一化处理数据可以采用premnmx , postmnmx , tramnmx
Matlab 的计算机视觉包,包含用于观察结果的 GUI 组件,貌似也停止开发了,拿来做学习用挺不错的。 项目主页: http://www.open-open.com/lib/
Julius 是一种高性能,两通大词汇量连续语音识别(LVCSR)语音相关的研究和开发的解码器软件。基于字的N-gram和上下文相关的HMM模型,它可以进行几乎实时实时解码目前大多数电脑在60K字听写
前段时间,在google官方,看语音识别这里, 觉得挺有意思的,所以自己写了一个小小的例子,和大家一起分享!注意如果手机的网络没有开启,就无法实现识别声音的!所以一定要开启手机的网络,如果手机不存在语音识别功能的话,就
Luasynth 是个小型 Lua 语音框架,使用 Lua 编写,非常简洁,模块化,声明式代码。可以查看 (effects/pan.lua) 和延迟 (effects/delay.lua)的源代码,都非常短。 计划:允许声音生成器
用于Web的语音识别库 在线示例: live demo. JuliusJS is an opinionated port of Julius to JavaScript. It actively
首先,我为XcodeGhost事件给大家带来的困惑致歉。XcodeGhost源于我自己的实验,没有任何威胁性行为,详情见源代码: https://github.com/XcodeGhostSource/XcodeGhost
SpeakRight 是一个 Java 框架,用于编写语音识别应用,基于 VoiceXML 技术。使用 StringTemplate 模板引擎自动生成 VoiceXML 文档。 项目主页:
使用Intent调用语音识别程序 说明 Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到语音识别设备,就会抛出异常 Activity
VoiceChatter 是一个跨平台支持的语音聊天工具,主要是为游戏设计,是一个轻量级的可以再很窄的带宽上传递高质量的语音。 Talk with friends, family, or teammates
Artyom.js 是一个语音识别 JavaScript 库。你可以用 Google Chrome 的语音合成和语音识别功能做出一些很厉害的东西出来。你可以在 Web 应用内部开发自己的 Siri、Google
Toolkit ) 是 Intel 开源的语音通讯系统。 Assistive Context-Aware Toolkit (ACAT) 是 Intel 实验室开源的语音系统,提供给运动神经元受伤的患者和其
Cainteoir Engine 是一个用于读取、记录不同文档格式 (如 ePub, HTML, MHT, RTF, email, and others) 到不同音频格式输出的库 (例如 PulseAudio, WAV, and Ogg/Vorbis).
eSpeak 是一个紧凑的开放源码软件的语音合成器为英语和其他语言,为Linux和Windows 。 eSpeak生产高质量的英语演讲。 它使用了不同的合成方法从其他开源语音合成引擎,和声音完全不同。 这也许不是作为自然人或“平稳”