ご連絡・ご予約・アクセスはこちら

無料でここまで来たか。オフライン利用も可能な音声AI「Amical」を本気で使ってみた

無料でここまで来たか。オフライン利用も可能な音声AI「Amical」を本気で使ってみた

最近、音声入力系のAIが一気に増えました。

Aqua Voiceのような月額8〜13ドル前後のサービスもあれば、クラウド前提の文字起こしツールもあります。どれも便利なのは間違いない。でも、毎月払うか?と言われると少し迷う。

本当に使い続けるのか?

この疑問がある限り、サブスクは地味に重い。そんな中で見つけたのが、GitHub配布のオープンソース音声AI「Amical」です。

Amical - Open source AI Dictation and Note-taking

しかも――無料。そしてオフライン対応

ここが異常なんです。

Whisper Large v3 Turboがローカルで動く衝撃

このソフトの核は、OpenAIの音声認識モデル「Whisper」をローカルで動かせる点にあります。特に Large v3 Turbo をオフラインで回せる。これは何がすごいかというと、

  • ネット不要
  • 機密情報が外に出ない
  • API課金ゼロ
  • 会議文字起こしも完全ローカル

つまり、一度環境を整えればランニングコストがかからない。これはかなり評価が高いポイントです。

スペックで化けるタイプのAI

ただし、これはマシンスペック依存が強いです。

  • ミニPC → 反応まで約10秒
  • GPU搭載ゲーミングPC → ほぼリアルタイム

やっぱりWhisper Largeは重い。だからこそ、ハイスペックPCを持っている人には刺さる。「GPUを積んだPCをどう活かすか?」その答えの一つになります。

MacのM4系でAIを回す人も増えていますが、WindowsのゲーミングPCでも十分戦えます。むしろ、既存のGPU資産を活かせる分、現実的です。

実際に使って驚いた“文章の完成度”

今回この記事の下書きも、ChatGPTに渡す前にAmicalで整形しています。これが想像以上に良い。何がいいかというと、音声入力 → ほぼ完成形の文章になる。普通は、

  1. 音声入力
  2. 誤字修正
  3. 文法調整
  4. 整形
  5. ようやくAIに投げる

これが、1 の段階で完成形に近い文章の差はあまりにも大きい。

AIに命令を書く人ほど恩恵が大きい

例えば、

  • ChatGPTにプログラムを書かせる
  • Geminiに具体的な命令を出す
  • LINEで丁寧な文章を書く
  • Google検索で自然文を投げる

そのまま使える。これは単なる文字起こしではありません。思考整形ツールに近い。誤認識が少ないと、思考が止まらない。これが本当に大きい。しかもオフラインでこの精度。正直、驚異的です。

精度を上げる小技:AdWord登録

固有名詞は誤認識されやすい。

Gemini
ChatGPT
Steam
Python

これを事前登録すると精度が跳ね上がります。これは実用レベルで重要。

FreeHandモードはマウスと組み合わせるべき

個人的に一番おすすめなのが、フリーハンドモード。押している間だけ録音、離すと確定。これをマウスのサイドボタンに割り当てる。これが最高。

  • 手の移動がない
  • 思考が止まらない
  • 親指で録音開始

キーボードショートカットより圧倒的に直感的。ゲーミングマウスとの相性は抜群です。物理ボタンで操作する音声AI。これ、かなり快適です。

デメリットも正直に

もちろん弱点もあります。

  • 左右Ctrlの個別設定ができない
  • UIは英語
  • 安価マイクで入力エラーが出る場合あり

特にマイク相性問題はありました。安いマイクで「読み取り失敗」が出ることがある。USBマイクの方が安定する可能性は高いです。

ヒストリーは表示必須

フォーカスが外れてテキストが入らない問題。これがあるので、Historyウィンドウは常時表示推奨。



デュアルモニター環境だと快適。片側にHistory固定、もう片側で作業。これが現実的な運用です。

無料だからではなく「無料なのにここまで」

これは、無料だから試すツールではありません。無料なのにこの完成度。GPUを積んだPCを持っている人、AIに命令を書く人、文章を量産する人、この層には本気で刺さります。

そして何より、オフラインでここまで来た。

これが一番の衝撃でした。

AIはもうクラウド前提だけの時代ではない。ローカルで回す選択肢が、本気で現実になってきています。間違いなく、これは面白いです。