Richard Sutton - 'LLMs su slijepa ulica' (druga, korisna perspektiva)
Zašto Richard Sutton - otac reinforcement learninga - current LLM-ove naziva 'slijepom ulicom' i što to znači za istrazivace i praktikante.
Tag
1 odgovarajućih blog objava pod ovom konkretnijom implementacijskom temom.
Vodič kroz tag
Što pokazuje
Richard Sutton kanadski je računalni znanstvenik i jedan od glavnih utemeljitelja modernog učenja s potkrepljenjem, poznat po učenju s vremenskom razlikom, arhitekturi Dyna, okviru opcija i knjizi Učenje s potkrepljenjem: Uvod s Andrewom Bartom.
Zašto je važan
On je bitan kada se rasprava okrene učenju iz iskustva, dodjeli kredita tijekom vremena, kontinuiranoj prilagodbi i zašto statično ponašanje modela nije dovoljno za sustave koji moraju poboljšati posao.
U arhivi
U ovoj se arhivi Richard Sutton pojavljuje kao referentna točka za učenje s pojačanjem, kontinuirano učenje, Gorku lekciju i šire argumente o tome kako bi budući sustavi umjetne inteligencije trebali učiti iz interakcije. Trenutno se pojavljuje u 1 objava i prelazi kroz 1 kategoriju.
Najbliže kategorije
Referenca
Često se pojavljuje uz
Zašto Richard Sutton - otac reinforcement learninga - current LLM-ove naziva 'slijepom ulicom' i što to znači za istrazivace i praktikante.