【Zhipu(ジープ)AI】
また中国からAIエージェント登場!
米中でAI覇権争いをしている中で、中国のAI企業であるZhipu AIが開発した大規模言語モデル「GLM(General Language Model)」シリーズは、多言語対応と高度な自然言語処理能力で注目を集めています。
Zhipu AI(智谱AI、正式名称:北京智谱华章科技有限公司)は、中国を代表するAIテクノロジー企業の一つとして、急速に成長を遂げているAIスタートアップ企業です。清華大学計算機科学技術系の技術成果を基に2019年に設立され、現在では中国の大規模言語モデル(LLM)市場で第3位の地位を築いています。
本記事では、Zhipu AIの概要から特徴、機能まで詳しく解説します。
なお、この記事は、Zhipu AIのGLM-4.5で作成しています。
Zhipu(ジープ)AIとは?
会社概要
正式名称 | 北京智谱华章科技有限公司 |
設立年 | 2019年 |
創業者 | 唐杰、李涓子 |
CEO | 張鵬 |
従業員 | 800人 |
本社 | 北京 |
ビジョン | 機械を人間のように思考させる |
Zhipu AIの特徴
- 学術的バックグラウンド
清華大学からスピンオフした企業という強みを活かし、学術研究と実用化の両面で高い技術力を誇ります。特に知識グラフ構築やデータマイニング技術に強みを持っています。 - オープンソース戦略
多くのモデルをオープンソースとして公開し、開発者コミュニティの育成に力を入れています。ChatGLM3-6BやGLM-4-9Bなどのモデルは無料で商用利用が可能です。 - 多様なモデルラインナップ
言語モデルから画像生成、音声処理まで、多様なAIモデルを開発・提供しており、様々なユースケースに対応できます。 - 国際展開
中東・東南アジア市場への積極的な展開を進めており、OpenAIの一部地域でのAPI利用制限を受けるユーザー向けに「特別移行プログラム」も提供しています。
主要製品と機能
GLMシリーズ(言語モデル)
- 特徴:AIエージェント時代に向けた設計、理解力・推論力・ツール使用能力を強化
- アーキテクチャ:Mixture-of-Experts(MoE)
- コンテキスト長:最大128K
- 推論モード:「思考モード」と「非思考モード」のデュアルモード対応
- 主なモデル:
GLM-4.5 | 標準 |
GLM-4.5-X | 高性能 |
GLM-4.5-Air | コストパフォーマンス重視 |
GLM-4.5-AirX | 高速 |
GLM-4.5-Flash | 無料 |
専門モデル
CodeGeeX | 機能:AIプログラミングアシスタント 特徴:130億パラメータのコード生成専用モデル 100以上のプログラミング言語に対応 コード生成、補完、翻訳、コメント、バグ修正など多彩な機能 毎日2000万行以上のコードを生成 |
CogView | 機能:画像生成モデル 特徴:大規模事前学習により、画像の本質的な属性、シーン構成、画風を理解 言語描述から高品質でユニークな画像を生成 |
CogVLM | 多モーダルビジョンモデル 画像と言語の統合理解を実現 |
アプリケーション製品
ChatGLM | 機能:対話型AIアシスタント 特徴:GLMモデルをベースに開発 多輪対話に対応 コンテンツ作成、情報要約などの能力を備える モバイルアプリやブラウザ拡張機能としても提供 |
AutoGLM | 機能:音声コマンドでスマートフォンを操作するAIエージェント 特徴:複雑なタスクを分析し実行可能 近隣店舗からの商品注文、購入履歴に基づく再注文などに対応 Apple Intelligenceの競合として開発 |
CoCo | 機能:企業向け自律型AIエージェント 特徴:自律的な計画立案、非同期実行、結果納品が可能 企業の業務効率化を支援 |
GLM-PC | 機能:PC用AI操作アシスタント 特徴:CogAgentをベースに、PC操作を支援 |
Zhipu AIの強みと今後の展望
- 技術力:清華大学の学術的バックグラウンドを活かした高度なAI技術
- コスト競争力:オープンソース戦略と効率的なモデル設計による低コスト化
- 多様性:言語、画像、音声など多様なAIモデルを提供
- 柔軟性:API、クラウド、ローカルデプロイメントなど多様な導入形態に対応
- 今後の展望:Zhipu AIは人工一般知能(AGI)の実現を目指し、Soraのような技術開発を進めています。2024年にはテキストから動画を生成する「Ying」モデルをデビューさせるなど、マルチモーダルAIの分野でも積極的な展開を行っています。
Zhipu AIを使ってみた!
ブログ記事生成
このブログ記事は、Zhipu AIのGLM-4.5を使って、作成しました。
AIエージェント比較表
項目
|
Zhipu AI
|
OpenAI
|
Anthropic
|
Google
|
Meta
|
---|---|---|---|---|---|
主要モデル
|
GLM-4-Plus, GLM-4-Air, GLM-4-Long, GLM-Z1-Air, GLM-4V-Plus
|
GPT-4.1, GPT-4o, o3, o4-mini
|
Claude 4 Opus, Claude 4 Sonnet
|
Gemini 2.5 Pro
|
Llama 4 Scout, Llama 4 Maverick, Llama 4 Behemoth
|
パラメータ数
|
非公開(複数モデルラインナップ)
|
GPT-4.1: 非公開
GPT-4o: 非公開 o3: 非公開 |
非公開
|
非公開
|
Scout: 17B活性/400B総計
Maverick: 17B活性/400B総計 Behemoth: 288B活性 |
アーキテクチャ
|
Transformerベース
|
Transformerベース
|
Transformerベース
|
Transformerベース
|
Mixture of Experts (MoE)
|
コンテキストウィンドウ
|
GLM-4-Long: 超長文対応
標準: 128K-256K |
GPT-4.1: 128K
GPT-4o: 128K o3: 200K |
200K
|
100万トークン(200万トークン準備中)
|
1000万トークン(Scout)
|
主要機能
|
• 言語理解・生成
• 推論能力 • マルチモーダル(画像・動画) • コード生成 • 音声処理 • ベクトル検索 • 心理カウンセリング |
• 言語理解・生成
• 推論能力 • マルチモーダル • コード生成 • 音声処理 • 画像生成 • Web検索 • ツール使用 |
• 言語理解・生成
• 推論能力 • マルチモーダル • コード生成 • 拡張思考 • 並列ツール使用 • メモリ機能 |
• 言語理解・生成
• 推論能力 • ネイティブマルチモーダル • コード生成 • 思考モデル • 長文コンテキスト |
• ネイティブマルチモーダル
• 言語理解・生成 • 推論能力 • コード生成 • 200言語対応 |
推論パフォーマンス
|
GLM-Z1-AirX: 最大200トークン/秒
|
o4-mini: 高速推論
GPT-4o: バランス型 |
Claude 4 Opus: 複雑タスク向け
Claude 4 Sonnet: バランス型 |
Gemini 2.5 Pro: 高精度推論
|
Llama 4 Scout: 単一H100対応
Maverick: 高性能 |
主要ベンチマーク
|
• コーディング: 高性能
• 推論: 強力 • マルチモーダル: 優秀 |
• SWE-bench: 高性能
• GPQA: 優秀 • コーディング: 業界トップ |
• SWE-bench: Opus 4 (72.5%)
• Terminal-bench: Opus 4 (43.2%) • GPQA: Opus 4 (79.6%) • AIME 2025: Opus 4 (75.5%) |
• SWE-Bench: 63.8%
• Humanity’s Last Exam: 18.8% • LMArena: 1位 |
• LMArena: Maverick (1417 ELO)
• STEMベンチマーク: BehemothがGPT-4.5を上回る |
価格設定
|
GLM-4-Flash: 無料
有料モデル: 別途設定 |
o4-mini: 低価格
o3: 高価格 GPT-4.1: $15/$75(入力/出力) |
Claude 4 Opus: $15/$75
Claude 4 Sonnet: $3/$15 |
近日公開予定
|
オープンウェイト(無料)
|
特長
|
• 幅広いモデルラインナップ
• 日本語対応強化 • 心理カウンセリングモデル • リアルタイム音声・動画対応 |
• 最先端の推論能力
• 豊富なツール統合 • 多彩なモデルバリエーション • 開発者向けAPI充実 |
• 世界最高のコーディング性能
• 拡張思考機能 • 並列ツール使用 • メモリ機能向上 • 65%のショートカット削減 |
• 思考モデルアーキテクチャ
• 超長コンテキスト • ネイティブマルチモーダル • コード生成に強み |
• オープンウェイト
• 単一GPU対応 • 200言語サポート • MoEアーキテクチャ • 効率的な推論 |
利用可能環境
|
自社プラットフォーム
API |
OpenAI API
ChatGPT Azure OpenAI |
Claude Web
API Amazon Bedrock Google Vertex AI |
Google AI Studio
Gemini Advanced Vertex AI(近日) |
Hugging Face
llama.com Meta AIアプリ |
最新リリース
|
GLM-4.5シリーズ(2025年)
|
GPT-4.1(2025年)
o3シリーズ(2025年) |
Claude 4(2025年)
|
Gemini 2.5 Pro(2025年3月)
|
Llama 4(2025年4月)
|
Zhipu AI | 強み: 幅広いモデルラインナップ、日本語対応、心理カウンセリング専門モデル 特徴: リアルタイム音声・動画処理、無料モデル提供、多言語対応 適用分野: カスタマーサポート、教育、メンタルヘルス、コンテンツ生成 |
OpenAI | 強み: 業界最高の推論能力、豊富なツール統合、開発者エコシステム 特徴: oシリーズによる複雑タスク対応、マルチモーダル対応、画像生成 適用分野: 研究開発、エンタープライズソリューション、コーディング支援 |
Anthropic | 強み: 世界最高のコーディング性能、拡張思考機能、安全性 特徴: 並列ツール使用、メモリ機能向上、65%のショートカット削減 適用分野: ソフトウェア開発、研究、複雑な問題解決、エージェント |
強み: 思考モデルアーキテクチャ、超長コンテキスト、ネイティブマルチモーダル 特徴: 100万トークンコンテキスト、強力な推論能力、Googleサービス統合 適用分野: 大規模データ分析、長文処理、マルチモーダルアプリケーション |
|
Meta | 強み: オープンウェイト、単一GPU対応、200言語サポート 特徴: MoEアーキテクチャ、効率的な推論、コミュニティ駆動 適用分野: エッジコンピューティング、多言語アプリケーション、研究開発 |
使ってみた感想
少ない情報の中から、情報収集してくれています。
日本語の表現についても、それほど違和感はありませんが、稀に中国語が混じっていました。
無料で使ってみましたが、文書作成だけでファイル出力が出来ず、画像生成も出来ませんでした。
主要AIエージェント(含むManus、Genspark)と比べると多少見劣りしますが、無料で使えるため、使うのもアリです。
生成AI関連ツール紹介ページ

生成AI関連ページ
生成AIとは、文章や画像、音声、動画などを新しく生み出す能力を持つ人工知能のことです。従来のAIがデータ分析を行うのに対して、生成AIは創造的な内容を生成する点で注目されています。文章を生成するAIチャットや、画像を生成するAIツールなど、クリエイティブな領域で急速に広がりを見せており、日常生活やビジネスに新たな可能性を提供しています。このページでは、生成AIに関する記事を紹介します。
閲覧ありがとうございました。
*****************
中年独身男のお役立ち情報局
Friends-Accept by 尾河吉満
*****************