【AIが数学の未解決問題を解く】
数学者の相棒になるAI
「AIが本当に数学者を超える日なんて来るの?」
そんな問いに、もはや「来るかどうか」ではなく「どこまで来たか」を語る時代になりました。
2023年末から2026年にかけて、AIが数10年〜60年以上未解決だった数学の難問を次々と打ち破る事例が報告されています。
そこで本記事では、世界を驚かせた代表的な事例を時系列で整理し、その意義と限界を率直にまとめます。
なぜ「AI×数学」なのか
数学界における転換点は、2025年夏でした。
2025年7月、複数のAIモデルが「国際数学オリンピック(IMO)」の6問中5問を解き、世界に衝撃を与えます。2026年初頭には、驚きが「畏敬の念」へと変わり、研究レベルの問題の半数以上をAIが解くようになりました。
「2026年レベルのAIは、適切に使えば数学の信頼できる共著者になる」
と予言しましたが、その予言は概ね的中しています。
【FunSearch】「未知の数学的事実」を発見した瞬間(2023年12月)
Google DeepMindが開発したFunSearchは、組合せ論の重要問題「キャップセット問題(cap set problem)」で、これまで知られていなかった大きなキャップセット構造を発見しました。
- 問題内容:「グラフ用紙にいくつドットを置けば、3点が決して直線上に並ばないか」という問題
- 手法:大規模言語モデル「Codey」に Pythonコードの空白を埋めさせ、誤答を排除しつつ最良案を反復
- 意義:DeepMindのPushmeet Kohli副社長は「訓練データに存在しない、未知の情報」と明言
テレンス・タオも、
「私のお気に入りの未解決問題のひとつ」
とブログで言及していた問題で、AIが解への新たな道を切り開いた歴史的事例です。
【AlphaProof & AlphaGeometry 2】IMOで銀メダル級(2024年7月)
DeepMindの「AlphaProofとAlphaGeometry 2」は、国際数学オリンピック(IMO)2024で6問中4問を解き、合計28点(銀メダル上位相当)を獲得しました。
| システム | 解いた問題 | 技術的特徴 |
| AlphaProof | 代数2問 + 整数論1問 | 形式言語 Lean + AlphaZero型強化学習 |
| AlphaGeometry 2 | 幾何1問 | Geminiベースのニューロ・シンボリック・ハイブリッド、シンボリックエンジンが先代の100倍高速 |
「自然言語の数学問題をLeanに自動翻訳し、強化学習で証明を探索する」という発想は、数学界全体に大きなインパクトを与えました。
【AlphaEvolve】67問中23問で人類記録を更新(2025年)
2025年初頭、テレンス・タオとブラウン大学のハビエル・ゴメス・セラーノは、DeepMindの研究者と共に「AlphaEvolve」を起動しました。
- 試した問題数:数学の様々な分野で67問
- 成果:そのうち 23問で既存の最良解を改善
- 時間スケール:人間の数学者が数ヶ月かかる作業を1〜2日で実行
これは「ピンポイントで一問を解く」のではなく、「広範な問題群に対して人類の最良記録を体系的に更新する」という、まったく新しい数学研究のスタイルを示したと言えます。
GPT-5 が42年来の最適化問題を解明(2025年秋)
UCLA/OpenAIのアーネスト・K・リュー教授は、GPT-5を共同研究者として活用し、1983年に数学者ユーリ・ネステロフが提唱した「Nesterov加速勾配法(NAG)」に関する42年来の理論的問題を解きました。
なぜNAGは「速いのに不安定にならない」のか?
この長年の謎に対し、GPT-5は数式の再構成案を提示。そのアイデア自体は不完全だったものの、リューが構造的特徴を見抜き、厳密な証明へと昇華させました。通常数日かかる探索が数時間に短縮されたといいます。
「AIは新しい道具を発明したのではなく、既存の道具を異分野から器用に持ち込む達人だった」
とOpenAIは表現しています。
素人がChatGPTで60年来のErdős問題を解いた(2025年)
数学者ではない23歳のリアム・プライスが、ChatGPT Pro(GPT-5.4 Pro)へのプロンプトだけで、60年間誰も解けなかった「エルデシュ(Erdős)問題」を解いてしまったのです。
- 問題:「原始集合(primitive sets)」のErdős和は、集合内の数が無限大に近づくと最大値がちょうど1に収束するか?
- AIの貢献:関連分野ではよく知られていたが、この問題には誰も適用しようとしなかった公式を持ち込んだ
テレンス・タオは「大きな数とその構造についての新しい考え方を発見した」と評価。これまで研究者が陥っていた「思い込みのブロック」を、AIが軽々と打ち破った瞬間でした。
Bruhat間隔の隠れた構造発見(2025年10月)
ウィスコンシン大学のジョーダン・エレンバーグらはAlphaEvolveを使い、順列群のBruhat間隔の構造を解析し、これまで誰も気づかなかった「ハイパーキューブ(高次元立方体)」構造が浮かび上がりました。
これは「AIがパターン発見器として機能し、数学者がそれを定理化する」という新しい共同研究モデルの典型例です。
Flag varietiesの一般証明(2026年1月)
スタンフォード大学のRavi Vakilらは、GeminiベースのDeepThink / FullProofを用いて、球体が「フラッグ多様体(flag varieties)」にどう埋め込まれるかという一般ケースの証明をAIに完成させました。
数学者がスケッチを与え、AIが詳細を埋めるという「指揮者と楽団」のような役割分担が機能した好例です。
Aletheiaが4つのErdős問題を「自律的に」解決
Google DeepMindの「Aletheia」は、トマス・ブルームのErdős予想データベースから4つの未解決問題を自律的に解決したと報告されています。テレンス・タオも自身のMastodonで、Erdős問題の728番が解決されたマイルストーンを称賛しました。
本当に「AIが数学を解いた」のか?
率直に言えば、過剰な期待には注意が必要です。
2025年10月、OpenAIの研究者がGPT-5の「未解決問題解決」を発表しましたが、後に「既知の結果をモデルが知らずに再発見しただけ」と判明した事例もありました。
2026年2月のPhys.org記事は、「AIはコンテスト形式は得意だが、独創的な深さと直感が足りない」と指摘。
FunSearchが「キャップセット問題を解いた」と報じられたが、実際には下界を改善しただけで、問題自体は依然として未解決。
つまり、「AIが解いた」と「AIが手助けした」は別物。報道の見出しに惑わされず、原典をたどることが大切ですね。
数学者の「相棒」としてのAI
- アイデア生成器:GPT-5がNAG問題で構造提案
- 異分野翻訳者:ChatGPTがErdős問題に他分野の公式を持ち込む
- パターン発見器:AlphaEvolveがBruhat間隔の隠れ構造を発見
- 証明補助者:DeepThinkがflag varietiesの詳細を埋める
- 形式検証者:AlphaProofがLeanで厳密な証明を構築
AIは、人間の創造性を10倍速にする触媒として機能し始めています。「AIに何をどう任せ、人間が何を判断するか」という視点は、数学に限らずあらゆる創造活動の核になります。
「ペンと紙の数学が革命される」 テレンス・タオ
革命は、もう始まっています。
私たちにできるのは、怖がらず、鵜呑みにもせず、賢く付き合うことですね。
Google DeepMind AlphaProof Nexus が50年来の難問撃破
2026年5月21日、Google DeepMindがarXivに公開した一本の論文「Advancing Mathematics Research with AI-Driven Formal Proof Search」が、数学界に激震を走らせました。Google DeepMindが開発したAIエージェント「AlphaProof Nexus」が、353問の未解決「エルデシュ問題」のうち9問を自律的に証明してしまったのです。中には56年間未解決だった難問も含まれており、かかったコストはなんと1問あたり数百ドル程度。エンジニアリングと数学が交差する歴史的瞬間の幕開けです。
- 未解決エルデシュ問題の解決数:9/353
- OEIS未解決予想の証明数:44/492
- 解決された問題の最長未解決期間:56年
- 1問あたりのクラウド推論コスト:数百ドル
何がそんなにすごいのか?
「エルデシュ問題」とは、伝説的なハンガリーの数学者ポール・エルデシュ(1913-1996)が生涯にわたって提示し続けた数百の難問群のことです。組合せ論、数論、グラフ理論の最前線に位置し、解決者には彼自身がポケットマネーから賞金を出していたことでも知られています。
「未解決」であることの重みは計り知れません。世界中の優秀な数学者たちが数十年間挑んでも歯が立たなかった問題です。今回、AlphaProof Nexusは全353問中9問を解決しただけでなく、15年来の代数幾何学の難問も撃破し、最適化理論において人間が見つけていなかった新しいアルゴリズム的パラメータまでも発見しました。
AlphaProof Nexus の仕組み
アーキテクチャの根幹は、大規模言語モデル(おそらくGemini 3.1 Pro)と、Lean形式証明アシスタントの強力なタッグにあります。
システムは「basic agent」と「full-featured agent」の二段構成です。
高度なfull-featured agentは、AlphaEvolve由来の進化的アルゴリズムを用いて複数のサブエージェントを協調させます。必要に応じて、2024年の国際数学オリンピック(IMO)で銀メダル相当の成績を残した「AlphaProof」を専門ツールとして呼び出すことも可能です。
特筆すべきは「Ralphループ」と呼ばれる反復プロセスです。LLMが証明のスケッチを生成し、それをLeanコンパイラにかけます。エラーが出れば、フィードバックをLLMに戻して修正させる。これを繰り返すのです。Leanが「AIの出した答案を採点する厳しい先生」として機能することで、LLM特有のハルシネーション(もっともらしい嘘)が完全に排除され、すべての推論ステップが数学的公理に照らして機械検証されるというわけです。
解決されたエルデシュ問題9問
今回見事に解決されたエルデシュ問題は下記の通りです。特に #12 や #741 のように、複数のサブパートを一気に片付けた点には驚かされます。
#12(i) #12(ii) #12(iii) #125 #138 #26† #741(i) #741(ii) #1196
※ #26† はエルデシュが提起したものではない一般化されたもの
「15年来の代数幾何学の難問」とは
エルデシュ問題以外にも大きな成果がありました。それは「純粋O-列(pure O-sequences)」、すなわち単項アルティニアン・レベル代数のヒルベルト関数に関する問題です。これはスタンリーの予想に関連するもので、AIは「余次元3、タイプ2」の場合における対数凹性(log-concavity)を見事に確立しました。
OEIS の44予想証明
OEIS(オンライン整数列大百科)に登録されている492の未解決予想のうち、44個を証明することにも成功しました。Geminiを用いて自然言語の予想を自動形式化し、組合せ論や数論など幅広い領域の定理を証明したことは、このAIの圧倒的な汎用性を示しています。
【コスト革命】1問数百ドルの衝撃
ビジネスや工学の観点から最も衝撃的なのは、その「コスト」です。AlphaProof単体での稼働は1問あたり約27.5 TPU時間(約60ドル)。フル機能のエージェントを回しても、1問数百ドル(数万円)に収まっています。従来、博士課程の優秀な研究者が数年、数十年かけて挑んでいた未解決問題がクラウドのコンピューティングリソース数万円分で解けてしまうのです。形式検証(formal verification)のコスト構造が根底から覆ったと言えるでしょう。
数学界の反応
この事態に対し、数学界も大きく揺れています。DeepMindのCEOであるデミス・ハサビスは慎重な姿勢を崩していません。
「これはAGI(汎用人工知能)ではありません」デミス・ハサビス
一方で、カーネギーメロン大学のジェレミー・アヴィガド教授は、事態の深刻さとパラダイムシフトを率直に表現しています。
「我々はもう逃げ場がない。AIはまもなく我々より上手に定理を証明できるようになる」ジェレミー・アヴィガド
折しも数日前には、OpenAIが80年来のエルデシュ問題「単位距離予想」を解決したと発表し、競争は激化しています。また、Math, Inc.のAI「Gauss」が、マリーナ・ヴィアゾフスカのフィールズ賞受賞論文(8次元・24次元の球充填問題)をLeanで形式化したことも話題になりました。
何を意味するのか?
研究者は、「AIの証明試行は、たとえ最終的な証明に至らなかった場合でも、問題に対する我々の理解を大いに深めてくれた」と証言しています。
この形式検証技術は数学にとどまりません。
- 暗号技術
- ゼロ知識証明
- スマートコントラクトの監査
など、論理的な正しさが死活問題となるソフトウェア工学の分野へ急速に波及していくでしょう。AIによる証明の民主化が進めば、Leanなどの形式言語を習得する障壁も一気に下がるはずです。
AIが「オリンピアド級(既知の答えがある難問)」から「研究レベル(人類の誰も答えを知らない未踏破領域)」へと跳躍したことは、性能向上を超えた質的転換です。2026年5月は、AIが本格的に研究数学者の領域に踏み込んだ歴史的瞬間として、後世に記憶されることでしょう。
関連記事



閲覧ありがとうございました。
*****************
中年独身男のお役立ち情報局
Friends-Accept by 尾河吉満
*****************



