【Google DeepMind】
AGIへの進捗を測る認知フレームワーク

大規模言語モデルの登場によって、汎用人工知能（AGI：Artificial General Intelligence）の実現が現実味を帯びてきました。AGIとは、人間が持つ広範な認知能力を模倣し、多様なタスクを自律的に学習・実行できるAIを指します。

いつ実現するの？【AGI（汎用人工知能）】がもたらす未来！

特定の目的に特化したAI「ANI（特化型人工知能）」に対して、「AGI（汎用人工知能）」は、人間と同等かそれ以上の知能を持ち、さまざまなタスクを柔軟にこなし、未知の状況にも適応して自ら学習して問題解決ができる人工知能です。

【AGIの父ベン・ゲーツェルが警鐘】将来訪れる仕事の黙示録とは

「AGI（汎用人工知能）」という言葉を生み出した男、ベン・ゲーツェル（Ben Goertzel）。SingularityNETのCEOであり、AI研究の最前線で40年以上闘ってきたゲーツェルは、鋭く警鐘を鳴らしています。「人間レベルのAGIがひとたび存在すれば、人間の仕事の大半は時代遅れになる」「実現までの猶予は、わずか2〜3年」OpenAIのサム・アルトマンとも一致する衝撃的な予測は、SF映画の話ではなく現実の話です。

しかし、AGIの進捗を客観的に評価し、その能力を測定するための共通の基準はこれまで不明確でした。このような背景から、Google DeepMindはAGIの能力、汎用性、自律性を分類し、進捗を測るための認知フレームワークを提唱しました。

【Google DeepMind】 CEOデミス・ハサビスのAI未来予想図

Google DeepMindのCEOデミス・ハサビスは、AIは「見る」だけの存在から「理解し、行動し、世界を創造する」存在へと変貌を遂げると語っています。そこで本記事では、ハサビスの発言と最新の研究動向をもとに、予測される2026年の世界と、これから起こる3つの巨大トレンドを深掘りします。

そこで本記事では、Google DeepMindが発表したAGI認知フレームワークの概要、主要な原則、AGIの各レベルについて解説します。また、OpenAIが提唱するAGIレベルとの比較を通じて、異なる視点からAGIの進捗をどのように捉えるかについても考察します。

Google DeepMindのAGI認知フレームワーク
OpenAIのAGIレベルとの比較
1. フレームワーク比較
フレームワークの意義と課題
AGI実現に向けて
関連記事

Google DeepMindのAGI認知フレームワーク

Google DeepMindが提唱するAGI認知フレームワークは、AGIモデルとその前身の能力と振る舞いを分類するためのものです。このフレームワークは、モデルを比較し、リスクを評価し、AGIへの道のりの進捗を測定するための共通言語を提供することを目的にしています。

AGI定義のための6つの原則

Google DeepMindは、AGIを定義する上で6つの原則が重要であると述べています。

メカニズムではなく能力に焦点を当てる：AIが「何ができるか」に注目し、「どのように機能するか」ではない。
汎用性とパフォーマンスに焦点を当てる：能力の「深さ（パフォーマンス）」と「広さ（汎用性）」の両方を考慮する。
認知的・メタ認知的タスクに焦点を当てる：物理的なタスクではなく、思考や学習といった非物理的なタスクを重視する。
展開ではなく潜在能力に焦点を当てる：システムの潜在的な能力と、それがどのように展開されるかを区別する。
生態学的妥当性に焦点を当てる：現実世界のタスクにおける有効性を重視する。
AGIへの道筋に焦点を当てる：段階的なレベルを通じてAGIへの進捗を評価する。

AGIのレベル分け

Google DeepMindのフレームワークでは、AGIの進捗をパフォーマンス（深さ）と汎用性（広さ）の2つの軸で評価し、6つのレベル（レベル0からレベル5）に分類しています。

レベル	名称	パフォーマンス	狭いタスク	汎用タスク
0	AIなし	ー	電卓、コンパイラ	ヒューマン・イン・ザ・ループ（例：Mechanical Turk）
1	創発的	未熟な人間と同等か、やや優れている	GOFAI、単純なルールベースシステム	GPT-4、Llama 2、Gemini
2	有能	熟練した成人の上位50%以上	Siri、Alexa、Google Assistant、Watson	未達成
3	専門家	熟練した成人の上位90%以上	Grammarly、Imagen、DALL-E 2	未達成
4	例外的	熟練した成人の上位99%以上	Deep Blue、AlphaGo	未達成
5	超人的	人間の100%を上回る	AlphaFold、AlphaZero、StockFish	人工超知能（ASI）

現在のAIの立ち位置

Google DeepMindのフレームワークでは、現在のLLMが「レベル1 汎用（創発的AGI）」に分類され、特定の狭いタスクだけでなく、広範なタスクにおいて未熟な人間と同等か、やや優れていることを示しています。

しかし、「真のAGI」と考える「有能なAGI（レベル2 汎用）」は、まだ達成されていません。熟練した成人の上位50%以上のパフォーマンスを広範なタスクで発揮できるAIを指します。「狭いAI（特定のタスク）」と「汎用AI（広範なタスク）」を明確に区別しており、自律性は能力とは別の次元として扱われています。

能力と自律性の両方が高まるにつれて、リスクも増大するとも指摘されています。

OpenAIのAGIレベルとの比較

Google DeepMindのフレームワークと同様に、OpenAIもAGIへの進捗を測るための独自の5段階のレベル分けを発表しています。

チャットボット：会話型言語を持つAI（現在の状態）。
推論者：人間レベルの問題解決能力を持つAI（このレベルに近づいている）。
エージェント：ユーザーに代わって行動を実行できるシステム。
イノベーター：コンテンツ作成や科学的発見を支援できるAI。
組織：組織全体の業務を遂行できるAI。

フレームワーク比較

両者のフレームワークには、AGIの進捗を評価するという共通の目的がありますが、その焦点には違いがあります。

Google DeepMind：より学術的で、6つのレベルにわたる「狭い」タスクと「汎用」タスクの両方に焦点を当てています。パフォーマンスと汎用性の「深さ」と「広さ」を重視しています。
OpenAI：より産業志向で、AIシステムの機能的な進化に焦点を当てています。自律性と機能的な範囲を重視しています。

現在のAIがAGIの初期段階にあるという点では一致しています。

フレームワークの意義と課題

AGI認知フレームワークは、AI研究コミュニティにとって非常に重要です。共通の評価基準を提供することで、異なるAIモデル間の比較を可能にし、AGIへの進捗を客観的に測定できるようになります。AGIの能力とリスクを評価するための明確な枠組みを提供し、AIの安全性と倫理的な展開に関する政策立案にも貢献します。

しかし、これらのフレームワークには課題も存在します。AGIの定義自体が進化する概念で、新しい能力や技術の登場によってフレームワークも継続的に更新される必要があります。特定のタスクにおけるパフォーマンスだけでなく、真の汎用性や自律性をどのように測定するかは依然として研究テーマです。