您当前的位置:首页 > 科技 >

搜狗语音,为文字编辑者带来福音

  智能语音技术发展到今天,已经成功实现落地应用并走进人们的日常生活中,但是对于多数普通人来说,它仍然是一个充满神秘的存在。

  搜狗公司语音交互技术中心总经理王砚峰表示,搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互+知识计算”的技术战略。发展一年之后,目前已经完善了引擎架构:基于搜狗输入法和搜索引擎两个入口,以大数据+深度学习为基础,上层建造语言AI+语音AI+图像AI,再延伸至对话、翻译、TTS、OCR、识图等。搜狗的语音识别技术服务的日访问量也从2015年的0.55亿次/日一路发展到2017年的2.6亿次/日。

  目前,搜狗已经建立了语音自研团队,每天超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断学习,识别准确率越来越高,可应用的场景也越来越广泛。

  此次推出搜狗听写产品,是搜狗语音深入用户垂直场景下的又一个全新探索,通过更加专注于特定的场景和人群,去理解用户需求、解决实际问题,从而让语音技术为更多人所用。综合搜狗在人工智能上的产品布局,可以清晰地发现,让人工智能更接地气,已经成为搜狗在人工智能领域的独特标志。

   同时,为了使的文字整理效率更高,搜狗听写还加入了边听边改、无线标重点(通过一个蓝牙外设实现)、多端同步、信息分享等功能。

  对于很多文字工作者来说,最痛苦的工作莫过于花费几个小时去听一段录音。近日,搜狗公司正式推出语音实时变文字的速记工具——搜狗听写,可谓是文字工作者的福音。

  语音记录,是记者、编辑、作家等文字工作者们常用的记录方式。但是,对于记录者来说,语音并不方便后期的整理、分享和追溯,这也导致听语音记录的过程耗时耗力,影响信息的沟通。

  8月8日,搜狗召开发布会,正式推出其自研的速记神器--搜狗听写。这是一款能够将语音实时转变成文字的速记工具,使用了搜狗知音引擎的长时语音转写技术,为文字工作者提供会议、采访、写作等场景下的速记要求,用户可以在App商店免费下载。

  根据搜狗听写产品经理牛露云介绍,搜狗听写包括“听写”和“转写”两种模式:“听写”模式可在录音的同时给出实时识别结果;“转写”模式则可在离线状态下录音,录音完成后一次性获取文字结果。为了保证在各种复杂场景下都能精准转写,搜狗听写使用了搜狗知音独家研发的长时语音转写技术,并与业内领先的端到端深度神经网络技术深度整合。

  搜狗很早就开始做语音识别,并通过雄厚的语音技术储备,在去年语音产品开始爆发的情况下开始对外输出,并且也开始逐步进行产品落地。从去年开始到今年,已经有些产品使用搜狗的AI能力。相信在未来,搜狗将会有更多的产品获得AI技术结合的能力。


相关新闻