Tanulmány: Az AI tutorok felülmúlják a jogi kart
A Stanford Egyetem vezetésével készült legújabb tanulmány megdöbbentő eredményeket hozott az oktatási célú mesterséges intelligencia területén. Egy szigorú vakteszt során tizennégy egyetem tizenhat szerződésjogi professzora értékelte a hallgatói kérdésekre adott válaszokat. Az anonimizált kimenetek egy része maguktól a professzoroktól, míg a másik része a Google két fejlett AI rendszerétől származott. Az eredmények alapján a jogi kar szaktekintélyei az esetek hetvenöt százalékában az AI által generált válaszokat találták jobbnak és meggyőzőbbnek a kollégáik által megfogalmazott szakmai magyarázatokkal szemben.
A vizsgálat során kifejezetten olyan szerződésjogi fogadóórás kérdéseket teszteltek, amelyek megválaszolásához nem létezik egyetlen, egyértelműen helyes megoldás. Ezek a mindennapi szituációk komoly szakmai ítélőképességet, árnyalt megközelítést és kritikus gondolkodást igényelnek a szakemberektől. A professzorok összesen 2918 párosítást bíráltak el teljesen vakon a saját válaszaik, valamint a Google Gemini 2.5 Pro és a NotebookLM rendszerek válaszai között. A megmérettetés során a modellek elsöprő sikert arattak, és a teljes mezőnyből mindössze egyetlen kiváló professzor volt képes arra, hogy az értékelések során az AI modellekkel megegyező szintű teljesítményt nyújtson. A kutatócsapat a tesztelést később egy AI-bíró bevonásával is kiegészítette, amelynek segítségével további kilenc rendszert rangsoroltak. Ebben a bővített összehasonlításban a Claude Opus 4.7 végzett az élen, és végső soron az összes vizsgált modell felülmúlta a hús-vér professzorok teljesítményét.
Ez az áttörés azért rendkívül fontos, mert rávilágít az új generációs AI technológiák rendkívül gyors fejlődésére. Baur a korábbi modellek, mint például a GPT-4, már korábban is sikeresen teljesítették a jogi szakvizsgát, a mostani tanulmány sokkal nehezebb, szubjektívebb megítélést igénylő helyzetekbe kényszerítette a rendszereket a szerződésjogi fogadóórákon. Az AI oktatásbeli elterjedése és integrációja továbbra is egy meglehetősen ellentmondásos és rögös út, amely sok vitát vált ki a szakemberek körében. Ugyanakkor az olyan jól meghatározott területek, mint az igény szerinti, személyre szabott korrepetálás, határozottan jobb és hatékonyabb irányba terelhetik a tanulási folyamatot a jövőben.
- A vizsgálat szerződésjogi fogadóórás kérdéseket tesztelt, ahol a jó válaszokhoz nem egyetlen helyes megoldásra, hanem ítélőképességre és kritikus gondolkodásra van szükség.
- 14 egyetem tizenhat professzora 2918 párosítást bírált el vakon a saját válaszaik, valamint a Google Gemini 2.5 Pro és a NotebookLM válaszai között.
- A kar 75%-ban a Gemini 2.5 Pro és a NotebookLM válaszait választotta, és mindössze egyetlen kiváló professzor teljesített azonos szinten a modellekkel az értékelések során.
- A tesztelést egy AI-bíróval kiegészítve a csapat további kilenc rendszert rangsorolt, ahol a Claude Opus 4.7 végzett az élen, és minden modell felülmúlta a professzorokat.
A korai modellek, mint a GPT-4, már korábban is sikeresen teljesítették a jogi szakvizsgát, de ez a tanulmány az AI-t nehezebb, szubjektívabb megítélést igénylő helyzetekbe helyezi a szerződésjogi fogadóórákon. Az AI oktatásbeli elterjedése továbbra is ellentmondásos és rögös, de az olyan területek, mint az igény szerinti korrepetálás, jobb irányba terelhetik a tanulási folyamatot.