查理·马什(Charlie Marsh)和希波罗·萨哈(Shubhro Saha)是来自普利斯顿大学(Princeton University)的两名本科生,一个巨大的机遇可能已经来到他们的面前。我敢打赌,一些人才猎头在第一轮筛选中就想把他们招致麾下。
虽然苹果(Apple)可能正在为Siri制定大计划,微软(Microsoft)最近为Windows Phone 8.1发布的Cortana个人助理看起来十分诱人,但那些希望在自己应用中为各种设备开发类似功能的开发者只能自己重新发明一些非常复杂的功能——至少是在此之前。
年轻的查理和希波罗开发了一款他们称为“Jasper”的开源语音识别和控制应用,并附带其“极其简单的”API(应用程序接口)以及基于B型树莓派(Raspberry Pi)的开发套件。Jasper的语音识别技术基于PocketSphinx软件,这是由卡内基梅隆大学开发的另一套开源工具包。这些软件都能在树莓派的ARM处理器上完美运行,因此开发者应该能轻松将其移植到安卓乃至iOS平台。
希波罗·萨哈和查理·马什——开源、青春、活力、创新
你可以对着Jasper说出常用指令,他们在自己的文档中列举了一些例子。
跟Jasper对话的最常见方式是依照下面的顺序进行:
你:“Jasper”
Jasper:高蜂鸣声
你:讲出指令
Jasper:低蜂鸣声
Jasper:讲出回答
在默认情况下,我们已经提供了以下模块来展示Jasper的能力:
时间:“现在几点?”
天气:“天气怎样?……明天天气如何?”
新闻:“有什么新闻?”
Gmail:“我有邮件吗?”
Hacker News:“Hacker News有什么新闻?”
Facebook信息:“Facebook上有信息吗?”
生日:“今天谁生日?”
笑话:“给我讲一个敲门笑话。”
人生:“人生的意义是什么?”
如果你聪明到能够写出自定义模块,你可以在这里查看一下开发者API文档。查理和希波罗还在自己的首个YouTube视频中演示了开发工具包。
Jasper还使用了Phonetisaurus,这是用语和词汇的开源库,它可以学习用户的语言模式来进行文本—语音合成。
如果你想学习如何利用树莓派、麦克风以及一组扬声器来打造自己的Jasper,你可以在这里查看Jasper的所有开发文档。
有个声音告诉我,一旦查理和希波罗的新API得到一些普及,有人可能就要打电话给他们了。这是一种令人印象深刻的技术,它已经足够完善,并且为上手开发做好了准备。而且,由于它是开源的,很有可能许多人会立刻投身其中。