Skip to content

原文(日本語に翻訳)

p90プロンプトキャッシュ率を改善しました。

原文(英語)

Improved p90 prompt cache rate

概要

プロンプトキャッシュはAnthropicのAPIで提供される機能で、繰り返し使用されるプロンプトコンテンツをキャッシュすることでレスポンスの高速化とコスト削減を実現します。v2.1.84ではp90(90パーセンタイル)のキャッシュヒット率が改善されました。これは、特にキャッシュが効きにくかった「重いユーザー」でも安定してキャッシュの恩恵を受けられるようになることを意味します。

基本的な使い方

プロンプトキャッシュは自動的に機能します。ユーザーが意識することなく、APIコストの削減とレスポンス速度の向上が期待できます。

bash
# キャッシュは透過的に動作します
claude "プロジェクトのコードをレビューしてください"
# システムプロンプトやCLAUDE.mdの内容がキャッシュされ
# 2回目以降のリクエストではキャッシュから読み込まれます

実践例

ユースケース: 長いシステムプロンプトを持つプロジェクト

CLAUDE.mdが充実しているプロジェクトでのメリット:

markdown
<!-- CLAUDE.md が詳細な場合 -->
# プロジェクト概要
このプロジェクトは...(長い説明)...

## コーディング規約
...(詳細なルール)...
bash
# CLAUDE.mdの内容がキャッシュされるため
# 複数のリクエストでコスト効率が向上します
claude "新しい機能を追加してください"
claude "バグを修正してください"
claude "テストを追加してください"

ユースケース: 大規模コードベースでの作業

bash
# 大きなリポジトリで繰り返し作業する場合
# コンテキスト(コード、設定など)のキャッシュが改善されます
claude "このプロジェクト全体のアーキテクチャを分析してください"
# → 次のリクエストではキャッシュが活用されます
claude "先ほどの分析を踏まえてリファクタリング計画を立ててください"

注意点

  • キャッシュヒット率の改善はp90(90パーセンタイル)に焦点を当てています。すべてのユーザーで同じ改善が保証されるわけではありません
  • キャッシュはAPIのセッションやモデルのバージョンによって無効化されることがあります
  • キャッシュの効果は主にAPIコストの削減として現れますが、レスポンス速度の向上にも寄与します
  • Bedrock、Vertex、Foundryユーザーへのキャッシュ改善は別の最適化(v2.1.86)で対応されています

関連情報