Cursor Composer 2が出たので1週間ガチで使ってみた所感

2026年3月19日、CursorがAIコーディングモデル「Composer 2」をリリースしました。コスト86%削減でClaude Opus 4.6超えのベンチマーク——と聞くと話がうますぎる気もしますが、実際に1週間メインで使ってみたので、良かった点と「ここはまだだな」と思った点を正直に書きます。

そもそもComposer 2って何?

Cursorが自社で開発(正確にはMoonshotのKimi K2.5をベースにファインチューニング)したコーディング特化モデルです。CursorのエディタでCmd+IやComposerパネルから使えます。

ざっくり言うと「Cursorの中で動く、コーディングに最適化された安いAI」。これまでCursorはClaude SonnetやGPT-4oを裏で呼んでいましたが、自前モデルを持ったことでコストと最適化の自由度が上がりました。

ベンチマークの数字

ベンチマーク              Composer 2    Composer 1.5    Opus 4.6
─────────────────────────────────────────────────────────────
CursorBench              61.3          44.2            --
Terminal-Bench 2.0       61.7          47.9            58.0
SWE-bench Multilingual   73.7          65.9            --

料金(1Mトークンあたり)
  Standard: $0.50 / $2.50(入力/出力)
  Fast:     $1.50 / $7.50(入力/出力)

Terminal-BenchでOpus 4.6を上回っているのが目を引きます。ただしGPT-5.4の75.1にはまだ届いていません。

1週間使って「おっ」と思ったこと

マルチファイル編集の精度が上がった

Composer 1.5の頃は、3ファイル以上を同時に編集させると途中で文脈を見失うことがありました。2では20万トークンのコンテキストと「自分で文脈を要約する」仕組みが入ったおかげか、10ファイル規模のリファクタリングでも破綻しにくくなっています。

試しに「このReactプロジェクトのstate管理をuseContextからZustandに移行して」と投げてみたら、関連する8ファイルを正しく特定して、import文の変更まで含めて一発で通りました。Composer 1.5では同じ指示で2〜3回やり直しが必要でした。

ターミナル操作との連携がスムーズ

Composerがコードを書く→ターミナルでテストを走らせる→エラーがあれば自動で修正、という流れがかなり自然になりました。「テスト通るまで直して」と言えば、本当に3〜4回ループして全テストグリーンにしてくれることが増えました。

安い。とにかく安い

Standardプランだと入力$0.50/1Mトークン。Claude Opus 4.6の$15と比べると30分の1です。「まあ試しに投げてみるか」のハードルが劇的に下がる。雑な指示でも気軽に試行錯誤できるのは、開発体験として結構デカい変化でした。

「うーん」と思ったところ

複雑なアーキテクチャ判断は苦手

コードを書く・直すのは得意ですが、「マイクロサービスの境界をどこで切るべきか」「このデータモデルで将来のスケーラビリティは大丈夫か」みたいな設計レベルの相談は、Claude Opus 4.6のほうが的確でした。Composer 2はあくまで「実装寄り」のモデルだと思ったほうがいい。

日本語のコメント生成が微妙

コードは問題ないんですが、コメントやコミットメッセージを日本語で書かせると、たまに不自然な表現が混ざります。「テストを実行させていただきます」みたいな過剰敬語が出てきたときは笑いました。英語で使う分には全く問題ないです。

Kimi K2.5ベースという点

中国のMoonshotが開発したKimi K2.5がベースだと公表されています。技術的には問題ないですが、企業によってはセキュリティポリシー的に気にするところもあるかもしれません。Cursorのサーバーで推論が走る構成なので、データがMoonshotに送られるわけではないとCursorは説明しています。

どう使い分けるのが正解か

1週間使った結論としては、こんな感じに落ち着きました。

日常的なコーディング(実装・バグ修正・テスト) → Composer 2 Standard。安いので気軽に回せる。
設計の壁打ち・コードレビューClaude Opus 4.6。深い思考が必要な場面では差が出る。
速度重視の補完 → Composer 2 Fast。レスポンスが速くて開発のリズムが崩れない。

CursorのSettings > Modelsから切り替えられるので、タスクに応じて使い分けるのがベストです。

よくある質問

Composer 2自体はCursor Proプラン(月$20)で利用可能です。API料金は別途かかりますが、Standardプランの単価が安いので、通常の開発なら月の追加コストは数ドル程度で済むはずです。

従来通り選択可能です。Composer 2が追加されただけで、他のモデルが消えたわけではありません。モデルセレクタで自由に切り替えられます。

CursorはVS Codeのフォークなので、拡張機能や設定はほぼそのまま引き継げます。乗り換えコストは低いです。ただし「GitHub Copilotで十分」という人も多いので、無料トライアルで自分のワークフローに合うか試してからでいいと思います。

まとめ

  • Composer 2はKimi K2.5ベースのコーディング特化モデルで、コストはOpus 4.6の30分の1
  • マルチファイル編集とターミナル連携の精度が大幅に向上した
  • 設計レベルの判断や日本語生成はまだ他モデルに劣る場面がある
  • 日常コーディングはComposer 2、設計の壁打ちはOpusという使い分けが現実的

参考: Cursor公式 - Introducing Composer 2

K
AWS・Python・生成AIを専門とするソフトウェアエンジニア。AI・クラウド・開発ワークフローの実践ガイドを執筆しています。詳しく見る →