【Kimi(キミ) K2 Thinking】
思考するAIエージェントの全貌
2025年11月、中国AIスタートアップMoonshot AIの「Kimi K2 Thinking」は、AI業界に衝撃を与えています。
わずか460万ドルの開発費ながら、OpenAIのGPT-5やAnthropicのClaude4.5を主要ベンチマークで上回る性能を出したこのモデルは、自ら計画を立て、最大300回ものツールを連続して呼び出しながら思考を続けるAIエージェントとしての能力を持っています。
そこで本記事では、Moonshot AIの「Kimi K2 Thinking」について、徹底的に解説します。

本記事は、Kimi K2 Thinkingを使って作成しています。
もちろん無料です。
もちろん無料です。
Moonshot AI(月之暗面)について
企業概要
Moonshot AI(月之暗面) は、中国北京に拠点を置くAIスタートアップ企業です。
2025年7月にKimi K2を発表し、11月にはその進化版であるKimi K2 Thinkingを公開しました。
2025年7月にKimi K2を発表し、11月にはその進化版であるKimi K2 Thinkingを公開しました。
中国のAIユニコーン企業として注目を集めており、わずか460万ドルの開発費で最先端モデルを実現した点が話題となっています。
技術的特徴
Moonshot AIの開発アプローチには、下記の特徴があります。
- 高速なリリースサイクル:米国企業と比較して、圧倒的に速い開発ペース
- 効率的な学習方法:4ビット精度での学習により、実運用速度を2倍にしながらベンチマーク結果を維持
- オープンソース戦略:最先端技術をオープンソースで公開し、技術の民主化を推進
企業ビジョン
「AIエージェント」の普及を通じて、複雑なタスクを自律的に処理する「思考するパートナー」の実現を目指しています。
情報検索から、計画・実行・回答を繰り返す能動的なAIへのパラダイムシフトを推進しています。
Kimi K2 Thinkingの概要
Kimi K2 Thinkingは、Moonshot AIが開発した大規模言語モデル「Kimi K2シリーズ」の最新版で、2025年11月に公開されました。
-
アーキテクチャ:Mixture-of-Experts(MoE)モデル
-
総パラメータ数:1兆(推論時に活性化されるパラメータは約320億)
-
コンテキストウィンドウ:256kトークン(約2百万文字)
-
量子化:INT4量子化にネイティブ対応(推論速度2倍高速化)
-
ライセンス:オープンウェイト(Apacheスタイルライセンス)
従来モデルが30~50ステップ程度で推論精度が低下する中、Kimi K2 Thinkingは200~300回の連続ツール呼び出しを維持できる点が特徴です。
Kimi K2 Thinkingの3つの特徴
思考の可視化 | 段階的な推論プロセス
Kimi K2 Thinkingは、複雑な問題を解く過程で内部的な「思考トークン」を保持しながら、思考の流れをユーザーに可視化します。
例えば、博士課程レベルの数学問題を解く際には、
-
問題を分析
-
関連論文を検索
-
Pythonで数式を計算
-
結果を考察
といった一連のプロセスが表示され、AIが結論に至った経緯を理解できる仕組みになっています。この透明性は、AIの判断根拠に対する信頼性を大きく向上させます。
自律実行 | 最大300回のツール連携
従来のAIは「考えてから動く」か「動いてから考える」かのいずれかでしたが、Kimi K2 Thinkingは 「考えながら動き続ける」 能力を持ちます。
ウェブ検索、コード実行、ファイル編集などのツールを、人間の介入なしに最大200~300回連続して呼び出すことが可能で、多段階の調査タスクも、粘り強く自律的に処理できます。
技術の民主化 | オープンソース提供
高性能なモデルがオープンソースで公開されている点は、業界に大きな衝撃を与えています。
世界中のユーザーが、Hugging Faceからモデルをダウンロードして自由に利用・改良できます。
Moonshot AIは独自の量子化対応訓練により、INT4量子化版を提供することにより、精度を落とすことなく推論速度を2倍近く高速化し、巨大モデルのレイテンシとメモリ使用量を大幅に削減しています。
驚異的な性能 | GPT-5を超える実力
Kimi K2 Thinkingは、複数の主要ベンチマークで最先端モデルを上回るスコアを記録しています。
-
Humanity’s Last Exam (HLE):専門知識を問うテスト
-
BrowseComp:ウェブ検索能力を測るベンチマーク
-
Seal-0:推論能力評価
SWE-bench Verified(コーディングタスク)では71.3点を記録し、Claude Sonnet 4.5に匹敵する性能を発揮。
最も優れているのは「エージェント能力」を測る分野で、複雑なタスクを自律的に完遂する能力が高く評価されています。
Kimi K2 Thinkingの使い方
公式ウェブサイトで利用
kimi.com にアクセスして、無料でチャットインターフェースを利用できます。
無料プランでもコンテキストウィンドウ(約128Kトークン)とドキュメント分析、ウェブブラウジング機能が利用可能です。
無料プランでもコンテキストウィンドウ(約128Kトークン)とドキュメント分析、ウェブブラウジング機能が利用可能です。
応答速度が遅くなる可能性や、出力長の上限(約4,000文字/返信)があります。
API経由での開発利用
Moonshot AIが提供するAPIを通じて、自社アプリケーションに統合できます。
PythonやJavaScriptなど、一般的なプログラミング言語から簡単に呼び出せます。
PythonやJavaScriptなど、一般的なプログラミング言語から簡単に呼び出せます。
-
ToolCalls(ツール呼び出し)
-
JSONモード
-
自動コンテキストキャッシング
-
インターネット検索機能
ローカル環境での自己ホスティング
オープンソースモデルなので、Hugging Faceからモデルウェイトをダウンロードし、ローカルサーバーで動作させることが可能です。
OllamaやvLLMなどのツールを使ってローカルで実行できます。
OllamaやvLLMなどのツールを使ってローカルで実行できます。
1兆パラメータのモデルは非常に大きく、量子化版(約245GB) でも高性能なGPU環境が必要です。実用的には、マルチGPUセットアップやクラウド上での展開が推奨されます。
料金プラン詳細
Moonshot AIは、多層的かつ競争力の高い料金体系を提供しています。
公式ウェブサイト利用プラン

| プラン名 | 月額料金 |
|---|---|
| 無料プラン | $0 |
| Moderato | $19 |
| Allgretto | $39 |
| Vivace | $199 |
API従量制料金
API利用では、トークン使用量に基づいた従量課金制が適用されます。
他社と比較して10~100倍も安価です。
他社と比較して10~100倍も安価です。
| モデル | 入力トークン | 入力トークン | 出力トークン | 備考 |
|---|---|---|---|---|
| kimi-k2-thinking | $0.60 /100万トークン |
$0.15 /100万トークン |
$2.50 /100万トークン |
256kコンテキスト |
| kimi-k2-thinking-turbo | – | $0.15/100万トークン | $8.00 /100万トークン |
高速版 |
料金比較表
| モデル | 入力トークン/100万 | 出力トークン/100万 | 比率 |
|---|---|---|---|
| Kimi K2 Thinking | $0.15~0.60 | $2.50 | 基準 |
| OpenAI GPT-4 | ~$2.00 | ~$8.00 | 5~13倍高 |
| Anthropic Claude 4 | ~$15.00 | ~$75.00 | 30~100倍高 |
セキュリティと留意点
データプライバシー
公式プライバシーポリシーによると、無料プランでは利用データがモデル改善のために使用される可能性があります。
中国発モデルに関する課題
- 透明性の問題:データ処理の詳細やサーバー所在地についての不明瞭な点が指摘
- ベースモデルの脆弱性:Kimi K2で指摘された安全性の問題がK2 Thinkingにも引き継がれる可能性
- 規制リスク:特定の地域での利用制限や、機密情報の取り扱いには注意が必要
エージェント型AI特有のリスク
自律的なツール呼び出し機能は、意図しない操作や無限ループの可能性を含みます。
実運用では、適切なサンドボックス環境や人間の承認プロセスを組み込むことが推奨されます。
実運用では、適切なサンドボックス環境や人間の承認プロセスを組み込むことが推奨されます。
Kimi K2 Thinkingを使ってみた!
UIの言語は、中国語と英語のみですが、日本語テキストでのやり取りが可能です。
ブログ記事作成

調査、思考、文章作成、ブログ記事作成までを一貫して対応してくれています。
日本語の表現に大きな違和感は無く、少しの手直しだけでした。
多少の間違いはありましたが、他のツールと同レベルです。
日本語の表現に大きな違和感は無く、少しの手直しだけでした。
多少の間違いはありましたが、他のツールと同レベルです。
画像生成を依頼してみた!

ブログ用のアイキャッチ画像を生成してもらいたかったのですが、画像生成はできませんでした。
代わりに、画像生成プロンプトを考えてくれます。
マルチモーダルに使えるようになると良いですね。
代わりに、画像生成プロンプトを考えてくれます。
マルチモーダルに使えるようになると良いですね。

ゲームを作ってみた!

横スクロールのシューティングゲームを作ってもらいます。


簡単なプロンプトで、ゲームも作ることができます。
バイブコーディングができています。
バイブコーディングができています。
まとめ
Kimi K2 Thinkingは、パフォーマンスの高さだけでなく、AIの役割を根本から変える革命的なモデルです。
✅ 自ら行動するAI:計画→ツール利用→推論を自律的に実行するエージェント
✅ 世界最高水準の性能:GPT-5に迫るベンチマーク結果
✅ 圧倒的なコストパフォーマンス:商用モデルの10~100分の1の料金
✅ 透明性と民主化:思考プロセスの可視化とオープンソース提供
✅ 柔軟な利用方法:Web、API、自己ホスティングの3つの選択肢
✅ 世界最高水準の性能:GPT-5に迫るベンチマーク結果
✅ 圧倒的なコストパフォーマンス:商用モデルの10~100分の1の料金
✅ 透明性と民主化:思考プロセスの可視化とオープンソース提供
✅ 柔軟な利用方法:Web、API、自己ホスティングの3つの選択肢
Kimi K2 Thinkingは、AIが複雑なタスクを共に解決する思考パートナーに進化しています。
活用する上でのおすすめは、無料プランから始め、実証後にAPI利用を検討するのが良いです。
ただし、セキュリティとデータプライバシーには十分注意し、ユースケースに応じた適切な利用環境を構築することが重要です。
Kimi K2 Thinkingは、高性能で低コスト、オープンであることで、AIエージェントの普及を大きく後押しするモデルとなるでしょう。
関連記事

【ERNIE(アーニー)】Baidu(百度)が開発したLLMの全貌!
「ChatGPT」や「Gemini」など、大規模言語モデル(LLM)の進化が目覚ましい今日、中国のBaidu(百度)が開発したERNIEシリーズも注目を集めています。最新モデルであるERNIE 5.0は、従来のLLMの概念を覆すほどの進化を遂げたと言われています。
閲覧ありがとうございました。
*****************
中年独身男のお役立ち情報局
Friends-Accept by 尾河吉満
*****************

