微软早些时候宣布了一个Project Oxford的计划,它可以帮助开发者创建可以语音识别的智能应用,通过微软内部的算法,给用户提供更智能的解决方案和服务。
11月12日微软开放了表情识别、拼写检查等智能API,并承诺将在年内推出语音识别/视频等新API预览,今天微软兑现承诺。微软对这两项API的描述为:
“语音识别API将提供通过语音识别用户的技能,不过这项功能并不能取代指纹和虹膜等强类型身份认证方式,可作为辅助认证方式来提升安全性。这项功能还可用于提升客服体验,通过客户声音自动识别客户,不必再通过询问确定客户身份。”
“视频API使得视频的分析和编辑变得更加简单,还可以使用微软的视频处理算法检测视频中的人脸,通过稳定背景的方式检测运动状态,以平滑和稳定视频。
微软开放智能应用,语音识别只是这些应用功能的一部分。通过Project Oxford可以自动生成更智能的应用,对开发者来说也是非常方便的。