语音+AI: 我找到了比打字快10倍的工作方式

为什么我需要语音输入?

你有没有遇到过这种情况:AI 干活的速度,居然比你打字下命令的速度还快?

我就经常被 AI 催着走——它 3 秒钟就完成了任务,而我光打字描述需求就要花 30 秒。这个矛盾一度让我很抓狂,直到我在 X 上看到一个大佬的解决方案:直接用语音给 AI 下命令

所以我也想着试一试,但是专门去买一个麦克风又觉得性价比不高,而且放在桌子上很占空间,所以我一开始的方案就是我的大疆一代麦克风。

500x667

Typeless:我用过最好的语音转文字工具

看到 Typeless 有一个月的免费试用期,所以我开始用了,然后就被彻底震惊到了。终于解开了我之前的疑惑,我看到那些大佬都在说 Whisper 以及 Typeless,如何如何强,如何极大地增加了他们输入的效率,简直是革命性的效率转变。

我一开始想的是不就一个语音转文字吗?有这么夸张吗?

现在我是彻底折服了,它和传统的语音转文字完全是两个物种:

  • 智能去噪:自动过滤”额””啊””嗯”等语气词
  • AI 排版:自动整理句子结构,合并重复表达
  • 中英混输神器:我做海外营销经常中英文夹杂着说,Typeless 识别准确率接近 100%
  • 自动纠错:前后说错的词会根据上下文自动修正

用了一周后,我的工作效率至少提升了 3 倍。

Typeless 30天试用期过完之后,我就继续试用语音转文字的鼻祖Whisper,结果发现真的差得很远,后来我才知道,Typeless 应该是专门针对中文优化过的,所以在中英文混合场景下碾压 Whisper。

硬件折腾记:从大疆一代到 DJI Mic Mini

不过大疆一代麦克风有个痛点:不能边充边用,两个麦克风轮换也经常要拔下来充电,很麻烦。虽然可以用苹果耳机替代,但我不喜欢长时间戴耳机的束缚感。

后来我发现 DJI Mic Mini 手机套装不到 200 块,果断入手(懒人文具多~)。

500x539

大疆麦克要别在衣服上,上厕所或走动时得摘下来,很不方便。我看到有人用磁吸支架固定在桌面上,灵机一动用上了我的磁吸手机支架,完美解决👇

500x666

顺便说一句,大疆这个麦克风的收音很灵敏,气声级别的悄悄话也能清晰录入(比如我现在这段就是用气声说的)。所以即使在办公室,也不用担心打扰同事。当然,我现在大部分时间在家办公,就更自由了。

Typeless 试用期结束后,Whisper 又不好用,我当时很郁闷:这么刚需的工具,怎么没有大厂做呢?

免费替代方案:手把手调教 AutoGLM

直到我发现了智谱的 AutoGLM 语音输入法——虽然开箱效果不如 Typeless,但它有个杀手锏:可以自己写 Prompt 调教它

500x370

原系统 Prompt(太简单):

1
让文本保持自然、清晰、口语化的语气,同时更精炼易读,要把句尾的句号去掉。

我调教后的 Prompt(针对我的需求深度优化):

1
2
3
4
5
6
7
8
让文本保持自然、清晰、口语化的语气,同时更精炼易读,要把句尾的句号去掉。
去掉语气词,例如“额”, “啊” 以及重复的“就是”,“也”,“然后”等等
重新整理所有语句,如果有意思一样,但是表达略有不同的语句请合并成一句。
如果说到 1, 2, 3 等序列,但用户没有完整的说完完整序列,例如,1….., 2……, 之后跳到 5 了,请根据上下文判断帮用户把序列补上,并按照序列输出。
有的时候会在话说完后补充“这是第一点”,然后直接“第二点”等类似不那么严谨的序列表述输出,请根据上下文重新排版序列内容。
如果句子里有中英文夹杂,请在英文单词两边加上空格。
当整段话完整说完,请根据上下文修复那些可能识别错误的词并更正再输出
如果我结束的时候说“把上面这些或者刚刚说的翻译成英语”,那你就把我刚刚说的话全部翻译成英语输出

最后一句是我最喜欢的彩蛋:说完中文后,只要加一句”把刚刚说的转成英文”,它就自动翻译了,省去了复制粘贴的步骤。虽然调教后的 AutoGLM 还是比不上 Typeless,但每月 12 美金的订阅费确实让我肉疼,所以暂时用免费方案凑合。

⚠️ 使用技巧:别忘了维护你的专属词典

还有一点要注意的是,它有一些词会比较相近,特别是有一些中文和英文读起来会有点像,所以你要经常给他的 Dictionary 里面补充你经常会说的词以及他会识别错的词。比如我不知道为什么SEO就是经常会识别成SO,即使我很缓慢地说SEO,他最后也会把它调整成SCO,所以我会把SEO这个词加入到 Dictionary 里面去。还有其他一些非标准单词,比如品牌词之类的,我都会加入到这个 Dictionary 里面去。

好消息是,豆包语音输入法已经上线,口碑不错;微信输入法最近也对语音功能做了重大更新。大厂们终于意识到这个赛道的价值了,相信很快就会有更多好用的免费工具出现。

500x960

未来已来:动动嘴就能指挥 AI

这不是科幻,而是正在发生的现实。如果你还在用键盘和 AI 对话,不妨试试语音输入——效率提升的感觉,真的会上瘾

如果你还尝试过 AI 语言输入法,强烈建议你从 Typeless 开始尝试一下!

欢迎留言分享你的体验~