從不及格到榜首!ChatGPT拿下東大京大狀元 全面超越人類最高分

日本 AI 新創 LifePrompt 於 4 月 27 日公布一項引發關注的測試結果,顯示 ChatGPT 在模擬作答 2026 年東京大學與京都大學入學考試時,總分全面超越人類考生最高分,甚至在最難的理科考試中領先約 50 分,凸顯生成式 AI 能力正以驚人速度進化,對教育制度與人才評量帶來衝擊。

此次測試採用 OpenAI 最新模型「ChatGPT-5.2 Thinking」,以影像形式輸入試題,並涵蓋論述題等複雜題型,最終由補教機構講師人工評分,並結合大學入學共通測驗成績計算總分,使結果更貼近真實考試情境。

根據公布數據,AI 在兩校主要科系中均取得壓倒性優勢,整體成績如下:

項目 ChatGPT 成績 人類最高分 差距
東大文科一至三類 452 分 434 分 +18 分
東大理科一至三類 503 分 453 分 +50 分
京大法學系 771 分 734 分 +37 分
京大醫學系醫學科 1176 分 1098 分 +78 分

從細項來看,AI 在標準化與邏輯導向科目表現突出,但在論述題仍有明顯差距:

科目類型 表現
數學 滿分
英語 約 9 成
世界史(論述) 約 2 成 5

參與評分的講師指出,AI 在解題邏輯上「相當完整」,但部分論述仍欠缺人類觀點的細膩性與深度。

值得注意的是,這項成果建立在極短時間的技術躍進之上。LifePrompt 指出,2024 年使用當時模型測試時,ChatGPT 在東大考試中「全科未及格」;2025 年採用新一代模型後首次達到及格水準;2026 年則直接躍居第一名。

年份 模型表現
2024 年 全科未及格
2025 年 首次超過及格線
2026 年 全面第一名

對此,LifePrompt 負責人遠藤聰志表示:「AI 的聰穎得到了充分展現,其進化速度飛快。」他並指出:「企業在導入 AI 時,應著眼於 10 年、20 年後的業務形態。」

此次測試結果也與全球 AI 發展趨勢相呼應。隨著大型語言模型持續升級,AI 已從過去的輔助工具,逐步轉向可執行高階認知任務的系統,甚至在標準化考試中超越人類頂尖群體。分析人士認為,這不僅對教育制度構成挑戰,也可能改變未來人才評量方式。

教育界普遍認為,傳統以解題能力為核心的考試模式正面臨壓力,未來可能需更強調創造力、批判思考與跨領域整合能力。同時,人機協作能力也可能成為新的關鍵指標。

隨著 AI 能力持續突破,類似情況預料將不僅限於考試場域,醫療、法律與金融分析等專業領域亦可能出現 AI 與人類直接競爭的局面。觀察指出,這次 ChatGPT 在東大與京大考試中的表現,可能只是 AI 全面進入高知識密集領域的開端。