QuQu:本地化语音输入工具,替代 Wispr Flow,支持大模型

QuQu 是一款针对中文用户的桌面端语音输入与文本处理工具,提供本地识别、隐私保护及丰富的中文语音工作流功能。

4AI工具语音输入文本处理开源工具AI 语音识别

QuQu 概览

QuQu 是一款专为中文用户设计的桌面端语音输入与文本处理工具。它区别于 Wispr Flow,QuQu 完全开源免费,所有语音识别与处理都在本地计算机完成,注重隐私保护和提升中文用户体验。

与 Wispr Flow 的差异

  • 价格:QuQu 免费使用;Wispr Flow 每月需支付 12 美元。
  • 隐私:QuQu 本地处理;Wispr Flow 依赖云端处理。
  • 中文体验:QuQu 针对中文优化;Wispr Flow 为通用支持。
  • 模型生态:QuQu 支持国产 AI 模型与 OpenAI API 兼容服务;Wispr Flow 仅国外模型。

核心优势

顶尖中文识别,兼顾隐私

QuQu 内置阿里巴巴 FunASR Paraformer,本地运行,能理解中文口语与网络语境,确保语音数据不出设备。

蛐蛐(QuQu):开源免费的 Wispr Flow 替代品,FunASR 本地识别 + 可配置大模型的中文语音工作流

“ASR + LLM”的两段式引擎

QuQu 先进行高精度识别,再利用大模型进行智能优化与重写,自动过滤口头禅,修正表达,生成更适合阅读与发送的文本。

面向国内的开放 AI 生态

QuQu 兼容 OpenAI API,优先适配国内模型如通义千问、Kimi 等,提供更快响应、更低成本和更好合规性。

贴合开发与效率场景

QuQu 可准确识别并格式化编程术语,支持自定义 AI 指令,根据应用情境自动调整输出。

蛐蛐(QuQu):开源免费的 Wispr Flow 替代品,FunASR 本地识别 + 可配置大模型的中文语音工作流

关键功能

  • 一键唤醒:全局快捷键 F2。
  • 实时识别:本地 FunASR 引擎高精度中文转写。
  • 智能优化:连接大模型,自动润色、纠错、总结、重写为邮件或代码片段。
  • 无缝粘贴:转换完成自动粘贴到光标位置,减少手动切换。

使用场景

  • 日常语音输入、会议纪要、学习记录、邮件与文档撰写。
  • 开发者代码注释、提交信息、接口说明的口述生成。
  • 对隐私敏感、希望离线处理的个人与团队。

迁移理由

在 Wispr Flow 的基础上,QuQu 可节省订阅费用、提升中文体验并将数据留在本地。

QuQu 开源地址

https://github.com/yan5xu/ququ