ADATKÉSZLETEK
A Tencent és a Shanghai Jiao Tong Egyetem közzétette a DeepMath-103k érvelési adatkészletet
A Tencent és a Shanghai Jiao Tong Egyetem kutatói közzétették a DeepMath-et, egy nagyméretű matematikai adatkészletet AI rendszerek tanításához. A DeepMath-103k összesen „103 ezer matematikai problémát tartalmaz, amelyeket kifejezetten fejlett érvelési modellek megerősítéses tanuláson (RL) alapuló tanításához terveztek”. Az adatkészlet minden problémája tartalmaz egy ellenőrizhető végeredményt, valamint három különböző megoldást, amelyeket a DeepSeek R1 generált. Az adatkészlet többek között az algebra, az analízis, a számelmélet, a geometria, a valószínűségszámítás és a diszkrét matematika témaköreit fedi le.
- Az adatkészlet 103 000 válogatott matematikai feladatot tartalmaz különböző területekről
- Minden feladathoz tartozik három megoldás a DeepSeek R1-től a megerősítéses tanulás elősegítése érdekében
- Az adatkészleten végzett tanítás arra ösztönzi a modelleket, hogy hosszabb és részletesebb érvelési lépéseket generáljanak
- A DeepMath-en tanított modellek hatékonyabbak a mentális rövidítések, például a részcélok kitűzése, az ellenőrzés és a visszalépés (backtracking) terén
- Az adatkészlet segít a stabil „matematikai gondolkodás” átadásában a puszta mechanikus feladatmegoldás helyett