【LLM-jp-4】
国産LLMが切り拓く新時代の幕開け

2026年4月3日、国立情報学研究所（NII）が新しいLLM「LLM-jp-4」を公開しました。

一部ベンチマークでGPT-4oやQwen3-8Bを上回りながら、Apache License 2.0で完全オープンソースで、商用利用も改変も再配布も可能、学習データまで公開する透明性へのこだわりです。

そこで本記事では、完全オープンソースの大規模言語モデル「LLM-jp-4」について解説します。

【LLM-jp-4とは何か】プロジェクトの概要

国立情報学研究所（NII）の大規模言語モデル研究開発センター（LLMC）が主導しており、LLM-jpコミュニティという大学・企業から2600名以上が参加する巨大な産学官連携コミュニティが支えています。早稲田大学、東北大学、東京大学、東京科学大学、名古屋大学。日本の錚々たる知の巨人たちが集結しています。

前世代のLLM-jp-3.1シリーズと比較して、学習データ量は約6倍に拡大しました。「量より質」とよく言われますが、LLM-jp-4は「質を保ちながら量も6倍」という両立を果たしました。

文科省補助金事業「生成AIモデルの透明性・信頼性の確保に向けた研究開発拠点形成」の支援を受け、産業技術総合研究所（産総研）が提供するAI橋渡しクラウド「ABCI 3.0」の計算資源を活用。個人や一企業では到底できない規模の学習を実現しました。

アーキテクチャは、MetaのLlama 2ベースのDense構造。「フルスクラッチ」で、重みをゼロから学習している点が重要です。

Alibaba CloudのQwen3 MoEアーキテクチャを採用。「A3B」は「アクティブパラメータが3.8B（約38億）」という意味です。

MoE（Mixture of Experts）とは？
128個の「エキスパート（専門家）」が内蔵されていて、入力に応じてその中から8つだけを起動する仕組み。全員を一斉に動かす必要がないから、計算効率が劇的に上がります。「脳みそは大きいが、使うのは必要な部分だけ」という賢い設計です。

AIの性能は、何を学んだかで決まります。LLM-jp-4の学習コーパスは、徹底的な品質管理です。

特筆すべきは、学習コーパス自体がGitLabで公開・完全開示されています。オープンソースAIの定義（OSAID）に準拠した設計で、第三者も入手可能なデータのみを使用しています。

評価には、GPT-5.4を審判（LLM-as-a-Judge方式）にして使用しています。

英語でも同等以上。「日本語特化なら英語が弱い」という先入観を見事に覆しました。32B-A3Bモデルは7.86を記録し、GPT-4o（7.69）を上回っています。

注意：比較の落とし穴
評価者がGPT-5.4（新）に変わったため、旧LLM-jp-3シリーズの評価（GPT-4oが審判）とは直接比較できません。スコアが違うように見えても、物差しが変わったと思ってください。

LLM-jp-4の新機能が「Thinkingモデル」です。「llm-jp-4-8b-thinking」と「llm-jp-4-32b-a3b-thinking」の2種類が公開されています。

通常のモデルは「質問 → 回答」と直結します。Thinkingモデルは「質問 → 思考プロセス → 回答」と分離して出力します。「なぜその答えになったのか」がトレースできる。デバッグや品質検証に非常に有用です。