SoloDev.Cool
社区
KOL达人
工具集
题库
登录
注册
全部
365
系统节点
📢
社区公告
4
📊
行业资讯
28
🧠
奇思妙想
24
🍼
经验分享
58
🚀
分享创造
100
❓️
问题求助
30
🙋♂️
招聘合作
23
🐑
羊毛福利
28
📝
运营反馈
18
兴趣节点
全部
登录后查看
返回
🚀 分享创造
长图
我花了一个月时间做了一款开源语音输入法 Typeflux,希望让每个人都能用上 Typeless 级别的体验
gillian
0
2026-04-27 09:25 ·
113 次浏览 ·
0 条评论 ·
0 cool
事情要从一篇产品体验说起。 年初第一次用到 [Typeless](https://www.typeless.com/),被它的效果震惊了。它能把你口语化、零散的表达转换成结构清晰的专业内容,用起来像是给大脑装了个翻译器。但它太贵了——按年订阅每月 12 美金,按月订阅要 30 美金。 当时我就想:能不能做一个自己的版本? 然后花了一个下午让 Codex 给我搭了个基本框架,居然跑起来了。但因为有其它项目在忙,就搁置了。 直到 3 月底,X 上突然涌现了大量关于语音输入法的讨论,闪电说、西瓜说、智谱语音输入法……那个时间节点让我重新把这个项目捡了起来。 其中智谱语音输入法([AutoGLM](https://autoglm.zhipuai.cn/autotyper/))的"人设"功能给了我很大启发——能为不同场景配置不同的指令集和写作风格,这个设计被我借鉴到了 Typeflux 的 Persona 系统里。在这里也记一笔致敬,他们是先把这个想法做成成熟产品的人。 最初我以为花一两天就能跑通。结果发现,做一个"能用的原型"和做一个"可以给别人用的产品"之间,差的是一个月的废寝忘食。 到今天,我终于把它发布出来了。 * * * **Typeflux 是什么?** 一款开源的 macOS 菜单栏语音输入工具。按住快捷键说话,松开就把文字输入到当前任何 App 的光标位置。 但我对它的定位不仅仅是语音输入法。 我希望它成为一款**桌面端的语音 Agent**——不仅能帮你输入内容,还能改写、润色、基于桌面内容问答,通过语音控制电脑完成工作。Agent 功能目前在 Beta ,还在持续迭代中,但这是我最终想去的方向。     * * * **主要功能:** + 按住快捷键说话,松开自动插入当前光标位置,无需切换窗口 + 选中文字后用语音指令润色 / 翻译 / 缩写,LLM 直接替换选中内容 + STT 支持:Apple Speech 、Whisper API / Groq 、本地模型( SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR )、阿里云实时 ASR / Qwen ASR 、豆包实时 ASR 、Google Cloud Speech 、多模态 LLM 、Typeflux Cloud + LLM 支持:OpenAI 兼容接口( 15+ 提供商:OpenAI 、Anthropic 、Gemini 、DeepSeek 、Kimi 、Qwen 、Zhipu 、MiniMax 、xAI 、Groq 等)+ Ollama 本地模型 + 完全本地推理可选(本地语音模型 SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR + Ollama 本地大模型),不需要任何 API Key ,隐私友好 + Persona 系统:为不同场景配置不同的指令集(设计灵感来自智谱语音输入法的人设功能) + 历史记录:每次对话存档,可回放音频、重新转录 * * * **关于 Typeflux Cloud:** 同时上线了 Typeflux Cloud ,提供云端语音和大模型服务。早期测试阶段,**目前完全免费**。 后续如果推出会员服务,也会定价非常亲民。不想折腾的朋友直接注册账号,开箱即用。 核心功能会一直开源,始终支持你自己配置任意语音模型和大语言模型,这是项目的根本基石,不会改变。 * * * + **项目地址:** [https://github.com/mylxsw/typeflux](https://github.com/mylxsw/typeflux) + **官方网站:** [https://typeflux.app](https://typeflux.app/) 我现在是全职独立开发者(开发的一些好玩儿的东西我会在 [这里](https://github.com/mylxsw) 发布,欢迎关注),这个项目也是我目前最重要的方向。欢迎大家试用、提问题、给建议。一起把它做好。
原创
0
cool
评论
(0)
暂无评论,来说两句吧
登录后评论
游客
0
主题
0
已关注
0
粉丝
0
酷能量
2核2G4M 服务器新客99元/年起
2核2G4M 服务器新客99元/年起
广告
热门节点
🚀
分享创造
100
🍼
经验分享
58
❓️
问题求助
30
🐑
羊毛福利
28
📊
行业资讯
28
🧠
奇思妙想
24
🙋♂️
招聘合作
23
📝
运营反馈
18
🤖
AI 语言大模型
18
☁️
云计算
10
分享创造 更多主题
做了个 AI 优先的运维工具, SSH、数据库、Redis 等资产集中管理
4 days前
做了一个 AI 国学文化的工具,想听听大家的反馈
4 days前
[开源分享] lathe - 可以把 api/proto 一键转为 CLI...
4 days前
FileCracker文件破解器
5 days前
极简但强大的个人财务管理软件 —— 溪流记账(Rivulet)
5 days前
SoloDev.Cool
🚀 分享创造
我花了一个月时间做了一款开源语音输入法 Typeflux,希望让每个人都能用上 Typeless 级别的体验
gillian
2026-04-27 09:25 · 113 浏览 · 0 评论 · 0 cool
来自 SoloDev.Cool 独立开发者社区
扫码或访问链接查看更多