Skip to content

原文(日本語に翻訳)

  • 音声モードの複数の問題を修正:時折発生する入力遅延、push-to-talkリリース後の誤った「音声が検出されません」エラー、送信後に古い文字起こしがプロンプトに再表示される問題

原文(英語)

  • Fixed several voice mode issues: occasional input lag, false "No speech detected" errors after releasing push-to-talk, and stale transcripts re-filling the prompt after submission

概要

Claude Codeの音声モードで発生していた複数の問題が修正されました。具体的には、(1)時折発生する入力遅延、(2)push-to-talkのキーを離した後に「音声が検出されません」と誤って表示される問題、(3)メッセージ送信後に以前の文字起こし内容がプロンプトに再表示される問題が解消されました。これにより、音声入力をよりスムーズに使用できるようになります。

基本的な使い方

Claude Codeの音声モードを使って、通常通り音声で指示を入力します:

# push-to-talkキー(デフォルト: Space)を押しながら話す
[Space長押し] 「このファイルのバグを修正して」 [Spaceリリース]
# 音声が正しく認識され、テキストに変換される

# 送信後、プロンプトはクリアされる(古い文字起こしが再表示されない)

実践例

push-to-talkでの連続入力

連続して音声入力を行う場合の問題が解消されました:

# 1回目の入力
[Space長押し] 「テストファイルを作成して」 [リリース]
# → 正しく認識、送信

# 2回目の入力(以前は前回の文字起こしが残ることがあった)
[Space長押し] 「型エラーを修正して」 [リリース]
# → プロンプトには「型エラーを修正して」のみ表示される

短い発話の認識改善

push-to-talkキーを素早く押して離した場合に「No speech detected」エラーが表示される問題が解消されました:

# 短い発話でも正しく認識
[Space長押し] 「はい」 [リリース]
# → 以前は「No speech detected」エラーになることがあったが、正しく認識される

注意点

  • push-to-talkのデフォルトキーはSpaceキーです。keybindings.jsonvoice:pushToTalkで変更可能です
  • 音声入力の遅延が完全になくなるわけではなく、ネットワーク状況やマイクの品質に依存します
  • 文字起こしの精度は別途改善されています(リポジトリ名や開発用語の認識精度向上)

関連情報