【Google DeepMind】
AGIへの進捗を測る認知フレームワーク
大規模言語モデルの登場によって、汎用人工知能(AGI:Artificial General Intelligence)の実現が現実味を帯びてきました。AGIとは、人間が持つ広範な認知能力を模倣し、多様なタスクを自律的に学習・実行できるAIを指します。


しかし、AGIの進捗を客観的に評価し、その能力を測定するための共通の基準はこれまで不明確でした。このような背景から、Google DeepMindはAGIの能力、汎用性、自律性を分類し、進捗を測るための認知フレームワークを提唱しました。

そこで本記事では、Google DeepMindが発表したAGI認知フレームワークの概要、主要な原則、AGIの各レベルについて解説します。また、OpenAIが提唱するAGIレベルとの比較を通じて、異なる視点からAGIの進捗をどのように捉えるかについても考察します。
Google DeepMindのAGI認知フレームワーク
Google DeepMindが提唱するAGI認知フレームワークは、AGIモデルとその前身の能力と振る舞いを分類するためのものです。このフレームワークは、モデルを比較し、リスクを評価し、AGIへの道のりの進捗を測定するための共通言語を提供することを目的にしています。
AGI定義のための6つの原則
Google DeepMindは、AGIを定義する上で6つの原則が重要であると述べています。
- メカニズムではなく能力に焦点を当てる:AIが「何ができるか」に注目し、「どのように機能するか」ではない。
- 汎用性とパフォーマンスに焦点を当てる:能力の「深さ(パフォーマンス)」と「広さ(汎用性)」の両方を考慮する。
- 認知的・メタ認知的タスクに焦点を当てる:物理的なタスクではなく、思考や学習といった非物理的なタスクを重視する。
- 展開ではなく潜在能力に焦点を当てる:システムの潜在的な能力と、それがどのように展開されるかを区別する。
- 生態学的妥当性に焦点を当てる:現実世界のタスクにおける有効性を重視する。
- AGIへの道筋に焦点を当てる:段階的なレベルを通じてAGIへの進捗を評価する。
AGIのレベル分け
Google DeepMindのフレームワークでは、AGIの進捗をパフォーマンス(深さ)と汎用性(広さ)の2つの軸で評価し、6つのレベル(レベル0からレベル5)に分類しています。
| レベル | 名称 | パフォーマンス | 狭いタスク | 汎用タスク |
| 0 | AIなし | ー | 電卓、コンパイラ | ヒューマン・イン・ザ・ループ(例:Mechanical Turk) |
| 1 | 創発的 | 未熟な人間と同等か、やや優れている | GOFAI、単純なルールベースシステム | GPT-4、Llama 2、Gemini |
| 2 | 有能 | 熟練した成人の上位50%以上 | Siri、Alexa、Google Assistant、Watson | 未達成 |
| 3 | 専門家 | 熟練した成人の上位90%以上 | Grammarly、Imagen、DALL-E 2 | 未達成 |
| 4 | 例外的 | 熟練した成人の上位99%以上 | Deep Blue、AlphaGo | 未達成 |
| 5 | 超人的 | 人間の100%を上回る | AlphaFold、AlphaZero、StockFish | 人工超知能(ASI) |
現在のAIの立ち位置
Google DeepMindのフレームワークでは、現在のLLMが「レベル1 汎用(創発的AGI)」に分類され、特定の狭いタスクだけでなく、広範なタスクにおいて未熟な人間と同等か、やや優れていることを示しています。
しかし、「真のAGI」と考える「有能なAGI(レベル2 汎用)」は、まだ達成されていません。熟練した成人の上位50%以上のパフォーマンスを広範なタスクで発揮できるAIを指します。「狭いAI(特定のタスク)」と「汎用AI(広範なタスク)」を明確に区別しており、自律性は能力とは別の次元として扱われています。
能力と自律性の両方が高まるにつれて、リスクも増大するとも指摘されています。
OpenAIのAGIレベルとの比較
Google DeepMindのフレームワークと同様に、OpenAIもAGIへの進捗を測るための独自の5段階のレベル分けを発表しています。
- チャットボット:会話型言語を持つAI(現在の状態)。
- 推論者:人間レベルの問題解決能力を持つAI(このレベルに近づいている)。
- エージェント:ユーザーに代わって行動を実行できるシステム。
- イノベーター:コンテンツ作成や科学的発見を支援できるAI。
- 組織:組織全体の業務を遂行できるAI。
フレームワーク比較
両者のフレームワークには、AGIの進捗を評価するという共通の目的がありますが、その焦点には違いがあります。
- Google DeepMind:より学術的で、6つのレベルにわたる「狭い」タスクと「汎用」タスクの両方に焦点を当てています。パフォーマンスと汎用性の「深さ」と「広さ」を重視しています。
- OpenAI:より産業志向で、AIシステムの機能的な進化に焦点を当てています。自律性と機能的な範囲を重視しています。
現在のAIがAGIの初期段階にあるという点では一致しています。
フレームワークの意義と課題
AGI認知フレームワークは、AI研究コミュニティにとって非常に重要です。共通の評価基準を提供することで、異なるAIモデル間の比較を可能にし、AGIへの進捗を客観的に測定できるようになります。AGIの能力とリスクを評価するための明確な枠組みを提供し、AIの安全性と倫理的な展開に関する政策立案にも貢献します。
しかし、これらのフレームワークには課題も存在します。AGIの定義自体が進化する概念で、新しい能力や技術の登場によってフレームワークも継続的に更新される必要があります。特定のタスクにおけるパフォーマンスだけでなく、真の汎用性や自律性をどのように測定するかは依然として研究テーマです。
AGI実現に向けて
Google DeepMindが提唱するAGI認知フレームワークは、AGIへの進捗を体系的に理解し、評価するための重要な一歩です。パフォーマンスと汎用性の両面からAGIのレベルを定義することで、現在のAI技術の立ち位置を明確にし、今後の研究開発の方向性を示す羅針盤になります。
OpenAIのフレームワークとの比較からもわかるように、AGIの評価には複数の視点が存在し、それぞれがAGIの異なる側面を捉えようとしています。
AGIの実現は、人類に計り知れない影響を与える可能性を秘めています。これらのフレームワークが、AGIの責任ある開発と安全な展開に向けた議論を促進し、人類全体に利益をもたらすAIの未来を築くための基盤になることが期待されます。
関連記事




閲覧ありがとうございました。
*****************
中年独身男のお役立ち情報局
Friends-Accept by 尾河吉満
*****************


