当前位置:主页 > 讯飞录音笔 >

给行业树一个新标杆:科大讯飞智能录音笔SR502日本人不懂中文,胡乱给

2023-10-26 讯飞录音笔

作者:善生的善生

录音笔的发展,从最初的功能单一化逐渐演变到「办公神器」。科大讯飞的发展史,也在一定程度上代表了录音笔的发展史。早期的录音笔仅能录制声音,后续还需要大量整理的工作。科大讯飞也根据市场需求,陆续推出了具有文字转写、更清晰收音、更智能整理的智能录音笔。

每次科大讯飞的产品升级,也带动了一次又一次的行业革新。

我也是录音笔的长期用户,很多商务或者办公人士,其实都是离不开录音笔的。但痛点在于文字转写准确度不高、收音距离不够远、整理录音文件很麻烦等等。

所以2022年了,既然要买录音笔,何不一步到位买个好点的呢?

而科大讯飞推出的智能录音笔SR502,可以说又给业界树立了一个全新的标杆。

高精度的转文字准确率、远距离收音、支持离线转文字、区分多人讲话、多语种的转写与翻译等特性,也是新时代录音笔应该具备的,更是我们日常选购要首先考虑的。

广告
胆小者勿入!五四三二一...恐怖的躲猫猫游戏现在开始!
×

外观与设计

很喜欢包装上的这句话「智能转写,落字有声」。

新时代的录音笔,就是需要厂商为其赋予高度的智能化与精准的转写效率。

因为是支持插入sim卡联网的,所以除了常规的充电器和数据线外,还附送了卡针。

广告
从秘书起步,十年内无人超越,以一己之力力挽狂澜成就一段传奇
×

录音笔加屏幕不新鲜,但是科大讯飞给SR502设计了一块3.5英寸的大尺寸触屏。除了观看更清楚外,日常操作交互也更方便了。

再好的算法,也要有完备的硬件作为支撑。

顶部2颗10毫米的定向麦克风+6颗全向麦克风,在多种复杂场景下依然可以做到更佳的人声拾音,并大幅增加拾音距离,最远拾音距离达到了15米。

框架和麦克风都是金属材质,整体设计很有质感,也符合自身的产品定位。

背面是一颗800万像素的摄像头,可以用来OCR识别或者拍照。别小看这颗摄像头,它可以实现智能提取PPT、EXCEL、图内文字信息等,相比一般录音笔属于降维打击了。

和6.7英寸的iPhone 14 Pro Max对比一下,SR502的体积小巧了很多。日常随身携带,也不会成为累赘。

侧面分别是一键录音、音量按键、电源开关和SIM卡槽。

收音效果怎么样

虽然SR502功能非常多,但作为录音笔,我们还是先来测试一下基础的收音效果。

首先是一米和五米的录音效果,

(插入视频1)

 1米距离收音很清楚,即使加大到5米,除了能感到声音距离的增加外,人声依然非常清晰。

鉴于SR502的性能太强,下面直接上地狱难度吧,和iPhone 14 Pro Max对比一下在嘈杂环境下的收音表现。

在非常嘈杂的闹市区,iPhone 14 Pro Max的人声和背景声都混在了一起,很难听清楚。而SR502通过2+6麦克风的组合与智能降噪,大幅降低了背景噪音,人声拾音依然非常清晰,优势非常明显。

要知道iPhone的收音在手机里应该是最好的了,但遇到专业设备还是差了很远。

实时转写转译

科大讯飞SR502内置了六种模式,分别是会议、演讲、采访、通用、备忘和音乐模式。

我觉得就日常使用来讲,无论是什么行业都可以非常好的满足需求了。

目前用户都是有10G的云空间附送,可以做到云端的多端同步备份。比如你可以实现手机、电脑端的互通,非常方便。

当然你也可以在电脑手机端的App读取,或者微信扫码直接下载。

在设置里,你可以打开录音转文字、离线转写/在线转写。

实时转写

做好录音不难,但难点在于实时的转写与转译,这对智能算法要求非常高。

在这个领域,科大讯飞就是目前的业界第一,没有争议的那种。

在录音的同时,SR502会实时转写出文字。

 支持多语言多语种,甚至还有12种方言转写支持。

 放个视频来看一下转写速度,从发声人单词结束到屏幕显示文字,只需不到一秒。

打开手机或电脑端的App,你就直接可以看到音频文件和刚转写的文字内容了。准确率非常高,几乎没有什么错词。

在录音笔云盘中可以免费下载转写好的文字和录的音频文件。

这里我模拟了一段会议室的白噪音,包括风声、写字声、雨声等,自己录了一段声音供大家参考。

 SR502距离我大概2米左右,演讲模式收音。我发音并没有可以加大声量,但SR502仍然做到了非常清晰的人声拾音。

再来看下转写情况,几乎完美。

离线转写

 如果有隐私和保密性需求,那么也可以开启离线转写。不必上传云端,直接机内就能完成,这也是对机器性能与算法要求很高的功能。

可以看到开启离线转写后,自动上传功能显示已经关闭。

我把离线转写上传到了电脑端,方便大家查看转写准确度。整体没什么问题,除了「清华」两个字勿转成了计划,自行修改一下即可。

边录边译

 此外还支持边录边译,这也依然是科大讯飞的强项所在。

同样也支持多种语言翻译。

 视频中可以看到翻译的速度很快,且错误率也非常低。

智能整理与编辑

以往录音笔的一大痛点就是录音文件的整理,现在SR502直接内置了文件整理功能。

分类

 你可以自由的选择分类名称以及领域,在每次录音完毕可以直接归纳进去。

智能语义分段

转写的文字直接是分好段落的,这也是SR502的功能:智能语义分段。它会根据录制的内容语义,自行判断分析并把文字自动分段。相比一般的录音笔,一片密密麻麻的文字,智能分段无疑要方便了太多。

智能区分发言人

在多人交谈时,还可以智能的实时区分发言人。

并且能自动过滤掉语气词、叹词和非人声噪音等。

为了验证这个功能到底如何,我做了一个小测试。

左侧的iPad Pro、中间的Studio Display、右侧的手机加上我自己,三台设备加我自己,一共是三个声音、五段对话模拟多人会议场景。

中间和右侧是声音1,左侧iPad Pro是声音2,我自己是声音3。

结果出来之后我吓了一跳,现在都这么智能的嘛?!

可以看到智能区分出了1、2、3三个声音,1和2的两段发言也正确识别了,并且都智能分段标了出来。

当然了,如果你想更极致一些的话,可以录入多人的声纹,这样转写的内容还可直接显示已录入声纹对应的昵称,整体对话内容更加清晰直观。

OCR识别

因为自带800万像素的摄像头,所以SR502是支持OCR识别转写的。

分别打印了一张表格、一张文字,来测试一下效果如何。

拍照自动识别后,文字很快就自动生成好了。

在电脑端读取出来看一下,没有一个错误,非常强大。

下载到电脑上,文件夹内是一张拍摄的图片和生成的文字TXT。

而给表格拍照后,可以看到机内已经自动生成了完整的表格图片。

如果说文字识别是科大讯飞基操的话,那表格识别又震惊了我一下。

直接生成了一个表格文件,且非常完美。仅通过一张照片就能识别并重新画出完整无误的表格,实在是太强了。

总结

最近一段时间用下来,我只能用「比强更强」来形容科大讯飞的SR502了,我觉得也算给行业树立一个2000元档的新标杆了。

在智能录音笔领域,科大讯飞的AI算法与优化,赋予了录音笔更强的产品力。

无论是在线/离线转写、实时翻译的准确率,还是智能编辑智能整理、OCR识别,综合来看表现都非常出色。

而基础的硬件设备,比如2+6的麦克风组合和清晰的人声拾音,反而变成了科大讯飞出色算法上的锦上添花了。

双十一期间,SR05仅需2000元左右即可到手,感兴趣的一定不要错过。