Forskellen mellem dyb læring og forstærkningslæring

Både dyb læring og forstærkning er meget forbundet med computerkraften til kunstig intelligens (AI). Det er autonome maskinindlæringsfunktioner, som baner vej for computere til at skabe deres egne principper i at komme med løsninger. Disse to former for læring kan også eksistere i flere programmer. Generelt anvender dyb læring aktuelle data, mens forstærkningslæring bruger prøve- og fejlmetoden til at finde ud af forudsigelser. De følgende diskussioner dækker yderligere sådanne sondringer.

Hvad er dyb læring?

Dyb læring betegnes også som dybstruktureret læring eller hierarkisk læring. Dette blev først introduceret i 1986 af Rina Dechter, en datalogiprofessor. Den gør brug af aktuelle oplysninger i undervisningsalgoritmer for at se efter relevante mønstre, der er essentielle i prognosedata. Et sådant system bruger forskellige niveauer af kunstige neurale netværk svarende til den menneskelige hjerne neuronale makeup. Ved hjælp af komplekse links kan algoritmen muligvis behandle millioner af oplysninger og zone ind på en mere specifik forudsigelse.

Denne form for indlæring kan anvendes, når udviklere ønsker en software til at se farven violet på forskellige billeder. Programmet blev derefter fodret med et antal billeder (dermed "dyb" læring) med og uden violette farver. Gennem klynger kan programmet være i stand til at identificere mønstre og lære, hvornår en farve skal markeres som violet. Dyb læring bruges i forskellige genkendelsesprogrammer, såsom billedanalyser og prognoseropgaver, såsom i tidsserier forudsigelser.

Hvad er forstærkningslæring?

Forstærkningslæring beregner generelt forudsigelser gennem prøve og fejl. Med hensyn til dens historie fra AI-perspektivet blev den udviklet i slutningen af ​​1980'erne; det var baseret på resultaterne fra dyreforsøg, koncepter om optimal kontrol og tidsmæssige forskelle. Foruden overvåget og uovervåget læring er forstærkning en af ​​de grundlæggende paradigmer i maskinlæring. Som navnet antyder, trænes algoritmen gennem belønninger.

For eksempel er AI udviklet til at lege med mennesker i et bestemt mobilspil. Hver gang AI mister, revideres algoritmen for at maksimere sin score. Således lærer denne form for teknik af sine fejl. Efter adskillige cykler har AI udviklet sig og er blevet bedre til at slå menneskelige spillere. Forstærkningslæring anvendes i forskellige avancerede teknologier, såsom forbedring af robotik, tekstminedrift og sundhedsydelser.

Forskellen mellem dyb læring og forstærkningslæring

Læringsteknik

Deep learning er i stand til at udføre måladfærden ved at analysere eksisterende data og anvende det, der blev lært på et nyt sæt information. På den anden side er forstærkningslæring i stand til at ændre sin respons ved at tilpasse kontinuerlig feedback.

Eksistens af data

Deep learning fungerer med en allerede eksisterende data, da det er bydende nødvendigt i træning af algoritmen. Med hensyn til forstærkningslæring er den efterforskende karakter, og den kan udvikles uden et aktuelt datasæt, som det lærer via prøve og fejl.

Ansøgning

Dyb læring bruges til billed- og talegenkendelse, dyb netværksforuddannelse og dimensionreduktionsopgaver. Til sammenligning bruges forstærkningsindlæring i interaktion med eksterne stimuli med optimal kontrol såsom robotik, elevatorplanlægning, telekommunikation, computerspil og sundheds-AI.

Også kendt som

Dyb læring er også kendt som hierarkisk læring eller dyb struktureret læring, mens forstærkende læring ikke har andre kendte udtryk.

Maskinelæring

Deep learning er blandt de mange metoder til maskinlæring. På den anden side er forstærkningslæring et område med maskinlæring; det er en af ​​de tre grundlæggende paradigmer.

Menneskelig hjerne

Sammenlignet med dyb læring er forstærkningsindlæring tættere på den menneskelige hjerne, da denne form for intelligens kan forbedres gennem feedback. Dyb læring er hovedsageligt til anerkendelse, og den er mindre forbundet med interaktion.

Historie

Dyb læring blev først introduceret i 1986 af Rina Dechter, mens forstærkningslæring blev udviklet i slutningen af ​​1980'erne baseret på begreberne dyreforsøg, optimal kontrol og tidsmæssig forskellingsmetoder.

Deep Learning vs Reinforcement Learning

Resumé

  • Dyb og forstærkningslæring er autonome maskinindlæringsfunktioner, som gør det muligt for computere at skabe deres egne principper i at komme med løsninger.
  • Deep learning gør brug af aktuelle oplysninger i undervisningsalgoritmer til at se efter relevante mønstre, der er essentielle i prognosedata.
  • Forstærkningslæring beregner generelt forudsigelser gennem prøve og fejl.
  • Dyb læring anvender indlærede mønstre på et nyt datasæt, samtidig med at læringsgevinster ved feedback styrkes.
  • Dyb læring kræver et allerede eksisterende datasæt for at lære, mens forstærkningslæring ikke har brug for et aktuelt datasæt for at lære.
  • Anvendelsen af ​​dyb læring handler oftere om genkendelses- og områdeducerende opgaver, mens forstærkningslæring normalt er forbundet med miljøinteraktion med optimal kontrol.
  • Dyb læring er også kendt som hierarkisk læring eller dyb struktureret læring, mens forstærkende læring ikke har nogen anden sigt.
  • Dyb indlæring er en af ​​de mange maskinlæringsmetoder, mens forstærkningslæring er en blandt de tre grundlæggende maskinlæringsparadigmer.
  • Dyb læring blev indført i 1986, mens forstærkende læring blev udviklet i slutningen af ​​1980'erne.