OpenAIのChatGPT、東大と京大にて「首席合格」水準レベルへ 数学は満点 AIはどう進化していくのか

OpenAIロゴ


画像出典: OpenAI
共同通信と読売新聞によると
今年実施された東大と京大の入試問題をOpenAIが提供するAI(人工知能)「チャットGPT」(通称:チャッピー)に解かせた結果が
合格者の最高得点を上回り「首席合格」水準のレベルに達したことを27日、AIベンチャーのライフプロンプト(東京)の分析で分かったそうです。

最も得点が高いと言われる東大理科3類の最高点より50点高かった。数学は満点。
2024年の東大入試では全科類不合格でしたのでチャットGPT(以下AI)はたった2年間で首席での合格水準のレベルに達したことになります。

ポイント

これまでの東大・京大入試は、「膨大な知識を頭に入れ、複雑な計算をミスなくこなし、制限時間内に答えを導き出す」という、人間の脳の限界に挑む持久戦でした。 今回のAIによる「首席合格」は、その戦場に「辞書」と「高性能な電卓」を持っていて、疲れを知らない計算機が投入されようなものです。

一見、AIが人間を超えたように見えますが、その中身は「自ら考える知能」というよりは、「究極の効率化ツール」という見方もできます。

なぜ「国語」はうまくいきにく、「数学」は満点なのか?

背景にあるのは、AIの構造的な「得意」と「不得意」です。
人間も、これを読む読者も苦手なことってあると思います。それがAIにもあるということです。

「数学は計算機」 数学で満点を取れたのは、AIが内部でプログラミングコードを生成し、「電卓」を叩く手法を使ったからです。数式を見ると、自分でサッと計算プログラムを作って答えを出すような仕組みを使っており、これが満点につながりました

「国語は難しい」 一方で、国語や論述はうまくいきませんでした。AIには言葉の「意味」や「言葉の裏にある気持ちや書かれていない気持ちを察する」といった読み解く力が苦手とされています。
なんとなくそれっぽい言葉を並べることはできますが、「300文字以内で」という指示が守れなかったり、話のつじつまが合わなくなったりするなど、人間ならつまづきにくい部分でつまづいてしまうのが今のAIの課題点です。

問われる「学び」の価値

このニュースが突きつけているのは、AIの凄さということだけでなく「電卓や検索で解決できる能力」を競ってきたこれまでの入試の評価基準に一石を投じる結果となりました
「正解を出す力」をAIが担う時代、私たち人間に求められるのは、AIが投げ出した国語の記述回答のような「矛盾」を正し、「納得感のあるストーリーを作る力」や「問いを立てる力」へとシフトしていく必要があります。

【みんなの疑問】AIは私たちにどう影響を与えるのか、今回の結果にどう感じるか

議論

利便性と教育の進化という見方

AIの躍進を、単なる「受験の道具」の進化ではなく、教育や社会の構造的な課題解決へ向かう一歩だと捉える声があります。

SNSの声:「人類の結晶である難関入試を、AIが解けない方が困る。早く数学の未解決問題などを解くフェーズへ進んでほしい」といった、AIの進化を人類の進歩として歓迎する声や、全落ちから2024年の結果と比べると首席相当まで上り詰めた「圧倒的な伸び代」に賞賛の声も上がっています。

専門的な視点:AIが「正解のある問い」で満点を取り始めた以上、教育の価値は「正解を出す力」から、「何を明らかにすべきか(問いを立てる力)」へとシフトします。仕事においても、AIの結果をどう判断し、どう活用するかの重みが上がるという前向きな変化として考えられています。

公平性と「知能」の本質を問う現実論

一方で、実際の試験ルールや「知能」の本質を踏まえた、見方も目立ちます。

SNSの声:「世界中からカンニングしているのだから当然」「内部で電卓(Python等)を使っているなら、人間と同じ土俵ではない」といった、ルールの不公平さを指摘する声もありました。(Pythonとはコンピュター内での様々な計算をする電卓のような存在です。)

専門的な視点:採点基準が不透明な中で「合格」と呼ぶことへの疑念があります。特に、国語や世界史の論述が「依然として難しい」ことだった点は重要です。
AIには文脈を組み立てる心がなく、言葉と言葉の組み合わせに過ぎないという限界が、皮肉にも「人間にしかできない強み」を再確認させる結果となっています。

制度の改善と活用という見方

構造的な課題や、これからの「知力」の測り方を指摘する視点です。

SNSの声:これからは「勉学の努力」よりも、AIへの問いかけ(プロンプト)や情報の受信技術を磨く「情報収集の技術」が重要になるという意見があります。また、既存の暗記・計算中心の入試を維持することへの疑問や、AIの使用を前提とした新しい評価軸を求める声も上がっています。

有識者の指摘:AIが東大最高点を超える時代、知識量や計算力だけで知能を測る時代は終わりました。採点者に専門家を入れ、どういうプロンプト(AIへの指示文章)でどう回答したのかを確認するなど、AIと人間の共存を前提とした、より透明性の高い「能力の測定」の議論が不可欠であるという見方です。

ニュースのまとめ

AIの東大・京大「首席合格レベル」は、計算機としての圧倒的な優位性を見せつけた一方で、文脈を読み解く「国語力」の欠如という依然として課題として残る部分もありました。

SNSでは技術の進化を歓迎しつつも、ルールの不透明さへの不信感も根強く、単なるスコア比較を超えた「知能の定義」の再考が迫られています。
今後は、AIを「不正な道具」として排除するのではなく、AIが導き出した答えを人間がどう判断し、どう「問い」を立て直すかという、ハイブリッドな知性のあり方を模索することも期待されています。
※本記事の情報は、2026年4月28日 23時(日本時間)時点のものです。
本ニュースサービスのコンセプトにもある通り、内容を分かりやすくお伝えするため、表現を簡略化したり補足を入れたりしている箇所があります。
情報の正確さについては万全を期しておりますが、時間の経過とともに状況が変化する場合や、立場によって主張が異なる場合もあるため、最新の公式発表など複数の情報をあわせてご確認ください。