
最近、音声入力系のAIが一気に増えました。
Aqua Voiceのような月額8〜13ドル前後のサービスもあれば、クラウド前提の文字起こしツールもあります。どれも便利なのは間違いない。でも、毎月払うか?と言われると少し迷う。
「本当に使い続けるのか?」
この疑問がある限り、サブスクは地味に重い。そんな中で見つけたのが、GitHub配布のオープンソース音声AI「Amical」です。
しかも――無料。そしてオフライン対応。
ここが異常なんです。
Whisper Large v3 Turboがローカルで動く衝撃
このソフトの核は、OpenAIの音声認識モデル「Whisper」をローカルで動かせる点にあります。特に Large v3 Turbo をオフラインで回せる。これは何がすごいかというと、

つまり、一度環境を整えればランニングコストがかからない。これはかなり評価が高いポイントです。
スペックで化けるタイプのAI
ただし、これはマシンスペック依存が強いです。
- ミニPC → 反応まで約10秒
- GPU搭載ゲーミングPC → ほぼリアルタイム
やっぱりWhisper Largeは重い。だからこそ、ハイスペックPCを持っている人には刺さる。「GPUを積んだPCをどう活かすか?」その答えの一つになります。
MacのM4系でAIを回す人も増えていますが、WindowsのゲーミングPCでも十分戦えます。むしろ、既存のGPU資産を活かせる分、現実的です。
実際に使って驚いた“文章の完成度”
今回この記事の下書きも、ChatGPTに渡す前にAmicalで整形しています。これが想像以上に良い。何がいいかというと、音声入力 → ほぼ完成形の文章になる。普通は、
- 音声入力
- 誤字修正
- 文法調整
- 整形
- ようやくAIに投げる
これが、1 の段階で完成形に近い文章の差はあまりにも大きい。
AIに命令を書く人ほど恩恵が大きい
例えば、
そのまま使える。これは単なる文字起こしではありません。思考整形ツールに近い。誤認識が少ないと、思考が止まらない。これが本当に大きい。しかもオフラインでこの精度。正直、驚異的です。
精度を上げる小技:AdWord登録
固有名詞は誤認識されやすい。

Gemini
ChatGPT
Steam
Python
これを事前登録すると精度が跳ね上がります。これは実用レベルで重要。
FreeHandモードはマウスと組み合わせるべき
個人的に一番おすすめなのが、フリーハンドモード。押している間だけ録音、離すと確定。これをマウスのサイドボタンに割り当てる。これが最高。
キーボードショートカットより圧倒的に直感的。ゲーミングマウスとの相性は抜群です。物理ボタンで操作する音声AI。これ、かなり快適です。
デメリットも正直に
もちろん弱点もあります。
特にマイク相性問題はありました。安いマイクで「読み取り失敗」が出ることがある。USBマイクの方が安定する可能性は高いです。
ヒストリーは表示必須
フォーカスが外れてテキストが入らない問題。これがあるので、Historyウィンドウは常時表示推奨。

デュアルモニター環境だと快適。片側にHistory固定、もう片側で作業。これが現実的な運用です。
無料だからではなく「無料なのにここまで」
これは、無料だから試すツールではありません。無料なのにこの完成度。GPUを積んだPCを持っている人、AIに命令を書く人、文章を量産する人、この層には本気で刺さります。
そして何より、オフラインでここまで来た。
これが一番の衝撃でした。
AIはもうクラウド前提だけの時代ではない。ローカルで回す選択肢が、本気で現実になってきています。間違いなく、これは面白いです。














