快捷搜索:

离线转写、拍摄转写还会加字幕,讯飞智能录音笔SR702评测

 

在快节奏的工作当中,我们经常需要把一些会议、交流中的内容转化成为电子文档,以便后续参考,比如商务谈判、内部会议、领导讲话或者媒体采访等等,自己手写或者打字的话,因为速度太慢,根本无法完成这样的工作,而请一名速记的成本又太高,那么有没有什么好的方法能够解决这个问题呢?当然有,其实只需要一支靠谱儿的智能录音笔,便能轻松解决这一难题。

尤其值得大家惊喜的是,在智能录音笔领域,以科大讯飞为代表的国产力量,早已超越海外巨头,站在了世界之巅,成为了智能录音笔甚至语音识别技术的引领者。9月1日,全新旗舰级的讯飞智能录音笔SR702正式发布,在提升硬件配置、语音转写体验的同时,离线转写、OCR文字提取、视频自动加字幕等全新功能的加入,则让智能录音笔技术再次进阶。那么在实际使用过程中讯飞智能录音笔SR702究竟表现如何?能够给我们带来哪些便利?一段时间的体验后,今天燕山派就来和大家详细聊聊。

外观设计如何?讲真,极具高级感

在拿到讯飞智能录音笔SR702后,开箱将其取出的瞬间,燕山派便感受到了这款产品浓浓的高级感,同时对其用料和工艺也感到赞叹。

讯飞智能录音笔SR702采用了星空灰配色设计,正面配备了一块3.5英寸高清屏幕,屏幕像素密度达到了超视网膜级的445ppi。讲真,这块屏幕的显示和触控素质已经达到了旗舰级智能手机的水准,但是你要知道这只是一款智能录音笔,由此也可以看出,为了带来更好的体验,这次讯飞也是下了血本。另外,大家通过上图大家也可以看到讯飞智能录音笔SR702除了顶部设计有2颗直径10mm的定向麦克风外,在屏幕四周还有6颗矩阵麦克风,共8颗麦克风除了可以有效提升拾音距离外,还能更好的实现降噪效果,后面我们会对其效果进行详细讲解。

材质方面也是讯飞智能录音笔SR702的一大亮点,其中框采用了航空级铝合金材质打造,表面运用了阳极氧化工艺,极具质感。而其背部则采用了一体化设计的3D陶瓷背板,要知道陶瓷的硬度要远高于玻璃和不锈钢,光亮温润的同时还拥有更强的抗刮划能力。

尤其值得一提的是,讯飞智能录音笔SR702背部还采用了更为舒展流畅的曲面造型,与3D陶瓷背板完美衔接,外观要更显高端,手感也更为顺滑,大家可以通过上图感受下。另外其背部上方,两颗定向麦克风中间,还有配备了补光灯的800万像素摄像头模块,这也是本次讯飞智能录音笔SR702的重要升级点之一,而且这颗摄像头并不是拍拍照、录录视频记录画面素材那么简单,而是还带来了两项创新体验,后面的部分我们再详细介绍。

机身顶部,两颗大尺寸定向麦克风非常醒目,金色麦克风护罩配合整体星空灰的配色,质感十足。

机身底部设计有对称的外放孔,中间是Type-C接口,充电、数据传输的同时还能连接耳机,而且为了方便大家使用3.5mm耳机,其还标配了一个Type-C转3.5mm的耳机转接线。当然,个人更喜欢用讯飞智能录音笔SR702连接蓝牙耳机来听录音,因为用起来会更加方便。

电源键和SIM卡槽设计在机身右侧,通过这张图大家可以感受下讯飞智能录音笔SR702整机曲线,非常优美。

讯飞智能录音笔SR702除支持WiFi接入网络外,还可以通过SIM卡接入网络,尤其这家伙还是一个4G全网通网络。

机身左侧设计有录音键和音量键,讯飞智能录音笔SR702的所有按键都采用了和中框同样的材质和工艺,整体一体化程度极高。

简约大气上档次,可以说讯飞智能录音笔SR702的外观设计极具商务范儿,非常适合办公一族和商务人士。

录转写实际体验如何?实测,场景足够丰富,识别率和精度极高

录音笔就录音笔,为啥叫智能录音笔?其实原因很简单,因为讯飞智能录音笔SR702在录音的基础上还加入了科大讯飞在业界拥有绝对领先优势的人工智能技术,让这款设备更加智能,使得远超普通录音笔的体验。

一般的录音笔只是记录音频资料,而讯飞智能录音笔SR702则在录音的同时,能够自动将语音转写成文字内容,可以说一名“AI速记员”。尤其值得一提的是,讯飞智能录音笔SR702的录转写功能还针对不同的使用场景分别进行了优化,包括会议模式、演讲模式、采访模式、通用模式、备忘模式和音乐模式,几乎实现了全场景覆盖。

我们也进行了实际测试,有几点感受让燕山派印象非常深刻。

首先是讯飞智能录音笔SR702不仅识别率极高,在长时间大篇幅的讲话或者对话过程中,也能精准将讲话内容转化成文字,而且还做到了实时录转写。也就是说在录音的同时便能瞬间将每一句话转化成文字,并且支持实时撰写中添加重要节点添加标签,以便我们在后期的转写内容中重点关注进行校对,保证更高的文本内容精准度。

其次是讯飞智能录音笔SR702除了纯中文、纯英文模式识别外,还做到了中英混合识别。例如上图中我们模仿采访进行的一段对话测试,在中文中夹杂了英文,讯飞智能录音笔SR702居然也能精准识别出来。另外,讯飞智能录音笔SR702在识别英语的同时,还能识别包括日语、韩语、俄语、法语、西班牙语、越南语在内的多种外语,这一点其实已经超出了一名普通速记员的水平,而是一名精通多国语言的速记员,而且这名速记员还要需要懂那些生僻的专业词汇。

第三点个人印象比较深刻的是讯飞智能录音笔SR702,也做到了智能化编辑,能够有效过滤语气词、进行讲话人区分和非人声过滤。这样的功能,有效提升了我们后期对内容梳理的工作效率。其中讲话人区分最赞,在多人交流或者采访过程中,可以将在撰写内容进行精准分配给对应的人,不用我们再听着音频仔细辨别每一个人的音色进行内容梳理,大大降低了我们的工作量。

还有一点就是讯飞智能录音笔SR702充分利用了云技术的优势,可以将录音文件以及转写内容同步至云盘,这样的话我们便可以通过手机、PC甚至苹果电脑登录云盘后对其内容进行编辑和管理,相比通过数据线把内容传入电脑要方便了很多。

普通话好使,方言和外语能识别吗?讲真,一样能

泱泱中国幅员辽阔,不只有普通话这种官话,还有各种方言,而且方言之间的差异还非常巨大,那么遇到方言讯飞智能录音笔SR702是不是就不灵了呢?还真不是,因为讯飞智能录音笔SR702就是一名中国通。

讯飞智能录音笔SR702能够自动识别方言,并精准撰写,包括粤语、天津话、河北话、东北话、甘肃话、山东话、太原话、河南话、西南官话(四川、重庆、云南、贵州)以及藏语和维吾尔语。

出于好奇燕山派也通过我大河北的方言进行了测试,结果和普通话识别一样精准。看来讯飞智能录音笔SR702不只是一名精通各国语言的速记员,还是一名中国通,精通各地方言。

这种惊人的识别效果,要得益于讯飞智能录音笔SR702全新升级的科大讯飞转写引擎,基于科大讯飞的新一代识别(转写)引擎的突破——转写ED新引擎,该引擎基于端到端的全新语音识别框架,在传统引擎通用功能的基础上作了升级迭代,除了纯中文、纯英文模式识别,同时支持中英混合识别场景,以及中豫、中川等普通话-方言混合识别,实现语种无缝切换。

有噪音怎么办?不用怕,前段降噪很稳

有朋友可能会说你这是在一个理想环境下测试的,结果肯定精准,但是实际使用环境没有这么理想,会有很多噪音干扰,是不是识别就没这么准了?其实我们也考虑到了这一点,所以也针对包括室外、办公区、小市场等不同环境进行了测试。

最终发现,讯飞智能录音笔SR702在各个环境下均能保持极高的精度。以室外街道上测试为例,路过的汽车、行人的对话以及吵闹的知了叫声,形成了复杂的噪音,但是讯飞智能录音笔SR702依然没有受到干扰,仍能精准识别。

这样的前端降噪能力,一方面得益于讯飞智能录音笔SR702的2+6麦克风矩阵,以及基于讯飞深度定制的Voice Cube 声立方技术,做到了最远拾音距离达15m,轻松应对各种商务场景。另一方面则要得益于其讯飞Focus++智能降噪技术以及讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME),不仅可以根据场景主动识别人声,而且还可以有效降低环境干扰噪声,有效消除干扰说话人的声音,从而大幅降低语音识别的处理难度。专业技术有点高深,直白点讲,大家别担心噪音对讯飞智能录音笔SR702的干扰就对了。

没有网络咋整?首创离线转写一招儿搞定

懂行的朋友应该都知道,不管是智能手机的语音助手还是智能录音笔的转写功能,以往都需要保证设备连接网络才能使用,因为语音的识别和转写需要在线完成,所以大家自然会担心没有网络的话讯飞智能录音笔SR702是不是就不灵了?别的录音笔可能会是这种情况,但是讯飞智能录音笔SR702还真不是,没有网络一样能转写,这也是讯飞智能录音笔SR702的重要升级点之一,也是业界首创的功能。

离线转写与翻译机、输入法等应用上的离线听写有极大的区别,主要表现在,一般离线听写为短语音,偶尔性调用,对瞬间运算能力有较大要求,但离线转写为长语音,长时间调用(持续1小时,甚至数小时以上),对长时间运算能力、CPU功耗及散热情况有极高的要求。但是基于全新一代的转写引擎,讯飞智能录音笔SR702却实现了无网络情况下语音实时转文字。

这是为今年科大讯飞在端上设备落地语音转写能力的首次尝试的成果,也是业界首创的技术。无需4G/WIFI网络,依旧可以进行语音实时转写,离线转写准确率高达95%;无惧断网环境,语音内容实时呈现,转写后的文字内容即刻保存,更多使用场景。同时,可避免对于高度机密内容的泄露,时刻保障用户信息安全。在体验过程中,我们也进行了离线转写测试,几次测试下来识别率确实很高,几乎和在线转写达到了一样的水准,这一点不得不让我们对科大讯飞的技术实力感到赞叹。

摄像头是干啥用的?OCR拍撰写,拍视频自动加字幕了解一下

一个录音笔整个摄像头是干啥用的?开始燕山派也好奇,但是进一步了解之后燕山派发现这颗摄像头的加入直接拓宽了讯飞智能录音笔SR702的能力“带宽”,因为这个摄像头在录转写的基础上让讯飞智能录音笔SR702还拥有了拍转写的能力,而且还不仅局限于图片,视频也行。

在工作过程中,我们经常需要把一些纸质文件中的内容整理成电子文档,或者把一些图画中的文字提取出来。面对这种工作,使用手敲键盘来录入,那工作量太大了,相比而言使用OCR技术,直接把纸质文档或者图画中的文字提取出来要方便的多,而讯飞智能录音笔SR702在配备800万像素数字变焦后置摄像头后就拥有了这样的功能。只需要拍一张照片,其便可以瞬间将 PPT/图片等形式的内容提取为文字,内容实时呈现,方便我们后期记录及整理。

实测,讯飞智能录音笔SR702的拍转写识别率几乎达到了100%,不只是文字,连标点符号几乎都不会错的那种。

PPT/图片OCR之外,讯飞智能录音笔SR702这颗摄像头还可以用来拍摄视频,并且能够精准识别视频中的人声,从而智能生成字幕,这相当于将摄像头和录转写功能做了一个结合,带来的是1+1>2的效果。

对于字幕内容,我们还可以进行再次编辑。这一功能可以说相当强大,不仅能够同步记录画面资料,还能为视频画面加上字幕,对于一些会议记录或者访谈来说相当实用。对于一些喜欢拍摄视频的朋友来说,这一功能也极具吸引力,可以大大提升我们的工作效率。

中英互译它会吗?必须会

作为一款智能录音笔,讯飞智能录音笔SR702的功能远不止于我们上面说到的那些。讯飞智能录音笔SR702运用了TTS语音合成技术,结合讯飞Voice Cube AI降噪拾音技术,可完成10米远距离实时中英互译。这一功能对于跨国会议及外语学习场景,可以说相当实用。

实际使用过程中,讯飞智能录音笔不仅能把录下的声音实时转写下来,还能实时翻译出来形成文字,而且实测无论是中译英还是英译中,也都相当精准。

写在最后

能够识别多国语言、多种方言和民族语,无惧噪声,拾音距离远,录转写精准度高,还支持中英混合场景识别,更首创了离线转写功能,让讯飞智能录音笔SR702摆脱了网络的束缚;而智能编辑,自动区分讲话人、口语规整、过滤语气词,智能摘要等以及云端同步,则让转写内容编辑更加简单轻松;摄像头和OCR技术的加入,则让讯飞智能录音笔SR702拥有了超出录音笔定义的功能,实现了图片文字提取、视频加字幕能功能;再加上精准、可视化的中英互译,12小时熄屏录音超长续航。讯飞智能录音笔SR702称得上是一款高度智能的超级终端,能够大幅提升我们的办公效率。在一段时间的使用之后,燕山派在感受讯飞智能录音笔SR702带来的硬核体验同时,也感受到了科大讯飞在人工智能核心技术方面的强大,难怪其被称为无惧美国制裁的国货之光。

[注:本文部分图片来自互联网!未经授权,不得转载!每天跟着我们读更多的书]


互推传媒文章转载自第三方或本站原创生产,如需转载,请联系版权方授权,如有内容如侵犯了你的权益,请联系我们进行删除!

如若转载,请注明出处:http://www.hfwlcm.com/info/226398.html