Per què l'avaluació és del 80% per a la formació i del 20% per a l'avaluació però no el contrari?

by Nguyen Xuan Tung / Dijous, 17 Agost 2023 / Publicat a Intel·ligència Artificial, EITC/AI/GCML Google Cloud Machine Learning, Primers passos de l'aprenentatge automàtic, Els 7 passos de l'aprenentatge automàtic

L'assignació d'un 80% de ponderació a l'entrenament i del 20% a l'avaluació en el context de l'aprenentatge automàtic és una decisió estratègica basada en diversos factors. Aquesta distribució pretén aconseguir un equilibri entre l'optimització del procés d'aprenentatge i garantir una avaluació precisa del rendiment del model. En aquesta resposta, aprofundirem en els motius d'aquesta elecció i explorarem el valor didàctic que ofereix.

Per entendre la raó de la divisió d'un 80% de formació i un 20% d'avaluació, és crucial entendre els set passos de l'aprenentatge automàtic. Aquests passos, que inclouen la recollida de dades, la preparació de dades, l'entrenament del model, l'avaluació del model, l'ajust del model, el desplegament del model i el seguiment del model, formen un marc complet per crear models d'aprenentatge automàtic.

El pas inicial, la recollida de dades, consisteix a reunir dades rellevants per entrenar el model. A continuació, aquestes dades es preprocessen i es preparen en la fase de preparació de dades. Un cop les dades estan a punt, comença la fase d'entrenament del model, on el model s'exposa al conjunt de dades d'entrenament per aprendre patrons i relacions. A continuació, s'avalua el rendiment del model mitjançant un conjunt de dades independent en la fase d'avaluació del model.

La decisió d'assignar un 80% de ponderació a l'entrenament i un 20% de ponderació a l'avaluació prové del fet que l'entrenament és la fase principal on el model aprèn de les dades. Durant l'entrenament, el model ajusta els seus paràmetres interns per minimitzar la diferència entre les seves sortides previstes i les sortides reals al conjunt de dades d'entrenament. Aquest procés implica l'actualització iterativa dels paràmetres del model mitjançant algorismes d'optimització com ara el descens del gradient.

En assignar un pes més elevat a l'entrenament, prioritzem la capacitat del model per aprendre de les dades i capturar patrons complexos. La fase d'entrenament és on el model adquireix els seus coneixements i es generalitza a partir del conjunt de dades d'entrenament per fer prediccions sobre dades no vistes. Com més dades d'entrenament estigui exposat el model, millor podrà aprendre i generalitzar-se. Per tant, dedicar una part important del procés d'avaluació a la formació garanteix que el model tingui prou exposició a les dades de formació per a un aprenentatge efectiu.

D'altra banda, la fase d'avaluació té un paper crucial a l'hora d'avaluar el rendiment del model amb dades no vistes. El conjunt de dades d'avaluació, que és independent del conjunt de dades d'entrenament, serveix com a intermediari per a escenaris del món real. Ens permet mesurar fins a quin punt el model pot generalitzar el seu aprenentatge a instàncies noves i no vistes. Avaluar el rendiment del model és essencial per mesurar-ne la precisió, la precisió, la recuperació o qualsevol altra mètrica rellevant, depenent del domini específic del problema.

El pes del 20% que es dóna a l'avaluació garanteix que el model es prova rigorosament amb dades no vistes i ofereix una avaluació realista de les seves capacitats. Aquesta fase d'avaluació ajuda a descobrir qualsevol problema potencial com ara l'ajustament excessiu, l'ajustament insuficient o el biaix en les prediccions del model. També permet ajustar els hiperparàmetres i l'arquitectura del model per millorar el rendiment.

Per il·lustrar aquest concepte, considerem un exemple pràctic. Suposem que estem entrenant un model d'aprenentatge automàtic per classificar imatges de gats i gossos. Durant la fase d'entrenament, el model aprèn a diferenciar les característiques dels gats i els gossos mitjançant l'anàlisi d'un gran conjunt de dades d'imatges etiquetades. Com més imatges pugui entrenar el model, millor es farà per distingir entre les dues classes.

Un cop finalitzada la formació, el model s'avalua mitjançant un conjunt de dades independent que conté imatges que mai no havia vist abans. Aquesta fase d'avaluació posa a prova la capacitat del model per generalitzar el seu aprenentatge i classificar amb precisió imatges noves no vistes. En assignar un 20% de pes a l'avaluació, ens assegurem que el rendiment del model s'avalua a fons a partir de dades no vistes, proporcionant una mesura fiable de la seva eficàcia.

La distribució del 80% de ponderació a l'entrenament i del 20% de ponderació a l'avaluació en aprenentatge automàtic és una opció estratègica destinada a optimitzar el procés d'aprenentatge alhora que garanteix una avaluació precisa del rendiment del model. En dedicar una part important del procés d'avaluació a la formació, prioritzem la capacitat del model per aprendre de les dades i capturar patrons complexos. Simultàniament, la fase d'avaluació prova rigorosament el model en dades no vistes, proporcionant una avaluació realista de les seves capacitats.

Altres preguntes i respostes recents sobre EITC/AI/GCML Google Cloud Machine Learning:

Consulta més preguntes i respostes a EITC/AI/GCML Google Cloud Machine Learning

Més preguntes i respostes:

Camp: Intel·ligència Artificial
programa: EITC/AI/GCML Google Cloud Machine Learning (anar al programa de certificació)
Lliçó: Primers passos de l'aprenentatge automàtic (anar a la lliçó relacionada)
Tema: Els 7 passos de l'aprenentatge automàtic (anar al tema relacionat)

Etiquetat sota: Intel·ligència Artificial, Preparació de dades, Aprenentatge automàtic, Avaluació del model, Formació de models, Algoritmes d'optimització

Acadèmia EITCA

Per què l'avaluació és del 80% per a la formació i del 20% per a l'avaluació però no el contrari?

Altres preguntes i respostes recents sobre EITC/AI/GCML Google Cloud Machine Learning:

Més preguntes i respostes:

EITCA Academy forma part del marc europeu de certificació informàtica

Elegibilitat per a la subvenció EITCA Academy 80% EITCI DSJC

Acadèmia EITCA

INICIU LA sessió del vostre compte mitjançant el vostre nom d’USUARI O L’ADREÇA DE CORREU E-MAIL

He oblidat els vostres detalls?

CREAR UN COMPTE

Per què l'avaluació és del 80% per a la formació i del 20% per a l'avaluació però no el contrari?

Altres preguntes i respostes recents sobre EITC/AI/GCML Google Cloud Machine Learning:

Més preguntes i respostes:

Elegibilitat per a la subvenció EITCA Academy 80% EITCI DSJC