音声カテゴリ

音声ツール完全ガイド

会議録音・インタビュー・オンライン講義・ボイスメモを、ブラウザ内で動くAI(Whisper)に文字起こしさせる完全ガイドです。音声ファイルはあなたのデバイスから外に出ないため、社外秘の打ち合わせや個人情報を含む音声でも安心して処理できます。軽量モード(約90MB)と高精度モード(約750MB/WebGPU推奨)から、用途に合わせて選べます。登録不要・完全無料・回数制限なし。

このカテゴリで解決できる課題

  • ZoomやTeamsの会議録音を議事録テキストに自動変換したい
  • インタビュー音声をテキスト化して記事執筆や引用に活用したい
  • オンライン講義・セミナーの内容を保存・検索可能なテキストにしたい
  • 個人情報を含むカウンセリング・面談録音を外部に渡さず文字起こししたい
  • 医療・法務・専門用語が多い音声を高精度モードで処理したい

ツール一覧

使い方の流れ(共通3ステップ)

1

ツールを開く

上の一覧から目的のツールをクリックします。アカウント登録もインストールも不要です。

2

ファイルをドロップ

ファイルをドラッグ&ドロップまたはクリックで追加。ブラウザのメモリ上に読み込まれるだけで、サーバーには送信されません。

3

実行してダウンロード

ボタンを押すとブラウザ内のWebAssemblyランタイムが処理を行い、完了次第ダウンロードできます。

セキュリティ・プライバシー

サーバー送信ゼロのブラウザ完結型

OpenAI Whisperの量子化済み軽量モデルをonnxruntime-webでブラウザに読み込み、推論まですべてローカルで実行します。録音音声がFreeTool側のサーバーやOpenAIに送信されることは一切ありません。会議・面接・診療記録など、外部に出せない音声でもプライバシーを保ったまま文字起こしできます。F12→Networkタブで音声データの送信が発生しないことを確認できます。

よくある質問

会議録音をAIに渡しても情報漏洩しませんか?
FreeToolの音声文字起こしは、OpenAIのWhisperモデルをブラウザ内で実行する仕組みです。音声ファイルはあなたのデバイスのメモリ上だけで処理され、FreeTool側はもちろん、OpenAIや外部のクラウドにも送信されません。NDA・人事面談・顧客との打ち合わせなど、社外に漏らせない録音音声を安心して文字起こしできます。
軽量モードと高精度モードの使い分けは?
軽量モード(whisper-small、約90MB)は会議や日常会話の文字起こしに十分な精度で、WebGPUなしでも動作します。高精度モード(whisper-large-v3-turbo、約750MB)は専門用語が多い医療・法務・多言語混在の音声に適しています。高精度モードはWebGPU対応ブラウザ(Chrome/Edge 113以降)を強く推奨します。
MP3以外の音声ファイルも処理できますか?
MP3・WAV・M4A・WebM・OGG・FLACなど、お使いのブラウザがデコードできる音声形式すべてに対応しています。ZoomやTeamsの録音、スマホのボイスメモ、ICレコーダーの音声、YouTubeダウンロードのMP3など、形式を意識せず投入できます。
1時間以上の長い録音も処理できますか?
可能です。FreeToolは音声を30秒ごとのチャンクに自動分割して順次処理するため、1時間以上の会議録音にも対応します。ただしブラウザのメモリに依存するため、長時間・大容量の音声はPC(8GB RAM以上)での処理を推奨します。WebGPU対応環境なら大幅に高速化されます。
初回の大容量ダウンロードは毎回必要ですか?
いいえ。初回のみWhisperモデル(軽量90MB/高精度750MB)をブラウザがダウンロードしますが、その後はブラウザのキャッシュに保存されるため、2回目以降は即座に起動できます。キャッシュをクリアしない限り再ダウンロードは発生しません。