AIが国家試験に合格する日は近い?

教育

司法・医療分野における挑戦とその先

AIが高度専門職の登竜門である国家試験に挑戦し、合格水準に達したという報告が相次いでいます。かつては人間の知性の象徴ともされた試験の数々を、AIが突破する時代が現実のものとなりつつあります。これまでのAIは「特定領域の支援ツール」と見なされていましたが、いまや「専門知識を体系的に理解し、応用できる存在」としての片鱗を見せ始めています。

GPT-4が司法試験を突破――「論理」を操るAIの進化

その代表的な例が、OpenAIの大規模言語モデル「GPT-4」がアメリカの司法試験(Bar Exam)で合格水準を超えるスコアを記録したという報告です。この司法試験は、日本で言えば予備試験+司法試験に相当する難易度であり、法律の条文知識のみならず、事例に基づいた論理的思考や適用力が試されます。GPT-4は選択式、記述式いずれの問題でも人間の平均合格者を上回る成績を出し、多くの法曹関係者に衝撃を与えました。

これは単なる記憶力の勝利ではありません。むしろ、事例問題における論点抽出、論理構成、反論の想定といった法的思考プロセスがある程度再現可能になったことを意味します。法学とはしばしば「人文学と数学の融合」とも言われ、抽象的な価値判断と厳密な論理のバランスが求められます。AIがこの領域に足を踏み入れたことで、「弁護士の仕事の一部は将来AIに代替され得るのではないか」といった議論が再燃しています。

医療分野でも成果:AIが医師国家試験に挑戦

医療分野でも同様の動きが見られます。特に注目されたのが、米国医師国家試験(USMLE)におけるAIのパフォーマンスです。USMLEは3段階に分かれ、医学知識だけでなく、臨床的判断、診断推論、患者との対応まで幅広い能力を評価します。

2023年に発表された研究によると、GPT-4はこのUSMLEの複数のセクションで60%以上の正答率を記録し、合格ラインに到達したと報告されました。これは決して「暗記力」だけで説明できるものではありません。AIが膨大な症例データと教科書的知識を組み合わせて「この症状ならこの疾患を疑う」「この検査が必要」といった臨床判断を導き出せたという事実は、医療現場でのAIの応用可能性を一気に現実的なものとしました。

たとえば画像診断AIはすでに一部の病院で活用されていますが、今後は問診や初期診断支援、症例レビュー、医療文書の自動作成など、より“頭脳労働”に近い領域に進出する可能性があります。

「合格」と「実務」は別物:AIの限界と倫理的課題

とはいえ、「国家試験に合格した=人間の専門職に匹敵する」と結論づけるのは早計です。法曹や医師に求められるのは、単なる知識や思考能力ではなく、対人スキル、共感力、倫理的判断といった“非言語的”な能力も含まれます。

たとえば、法廷で被告の人生を語り、陪審員に訴えかける弁護士の言葉には、人間的な説得力や感情のコントロールが必要です。また、医師が末期の患者に病状を説明する場面では、言葉の選び方、沈黙の意味、表情一つひとつがコミュニケーションの一部になります。AIがこれを代替するのは、現時点では不可能であり、今後も容易には克服できない壁です。

また、AIが試験に合格できたとしても、「誰が責任を取るのか」という倫理的・法的問題も残ります。誤診、誤判、情報の解釈ミスといったトラブルが起きた際に、AIを用いた意思決定がどこまで許容されるのかは、今後の制度設計と社会的合意に委ねられています。

では、AIは「専門職」になれるのか?

現時点では、AIはあくまで「支援者」に留まり、意思決定や責任の最終判断は人間が担うべきだという考え方が主流です。しかし、試験合格レベルの知識を持ったAIが身近な存在になることで、医療や法律の「民主化」が進む可能性も指摘されています。

たとえば、地方や発展途上国において専門家が不足する地域では、AIが一次診断や法的アドバイスの役割を果たすことが期待されています。すでに「AI弁護士」や「AI医師アシスタント」といったサービスはプロトタイプ段階にあり、今後数年のうちに実用化が進むでしょう。

終わりに:信頼されるAIへ

国家試験の突破は、AIが人間の知的活動の一端を担えることを示す“象徴的な通過点”にすぎません。真の課題は、AIが人間社会の中で信頼され、補完関係を築けるかどうかにあります。

「AIが合格した」という事実は、AIの進化を示す一方で、私たち自身に「専門職とは何か」「人間にしかできないこととは何か」を改めて問いかけています。司法も医療も、単なる知識ではなく、人間の痛みや希望に寄り添う仕事です。AIがその役割をどこまで担えるのか、今後も注視が必要です。