Quins són els components clau d'una xarxa neuronal convolucional (CNN) i els seus respectius papers en les tasques de reconeixement d'imatges?

by Acadèmia EITCA / Dimarts, agost 08 2023 / Publicat a Intel·ligència Artificial, EITC/AI/DLTF Deep Learning amb TensorFlow, Xarxes neuronals convolucionals a TensorFlow, Xarxes neuronals convolucionals amb TensorFlow, Revisió de l'examen

Una xarxa neuronal convolucional (CNN) és un tipus de model d'aprenentatge profund que s'ha utilitzat àmpliament en tasques de reconeixement d'imatges. Està dissenyat específicament per processar i analitzar dades visuals de manera eficaç, la qual cosa la converteix en una eina potent en aplicacions de visió per ordinador. En aquesta resposta, parlarem dels components clau d'una CNN i els seus respectius papers en les tasques de reconeixement d'imatges.

1. Capes convolucionals: les capes convolucionals són els blocs de construcció d'una CNN. Consisteixen en un conjunt de filtres o nuclis que es poden aprendre que es combinen amb la imatge d'entrada per produir mapes de característiques. Cada filtre detecta un patró o una característica específica de la imatge, com ara vores, cantonades o textures. L'operació de convolució consisteix a fer lliscar el filtre sobre la imatge i calcular el producte puntual entre els pesos del filtre i el pegat d'imatge corresponent. Aquest procés es repeteix per a cada ubicació de la imatge, generant un mapa de característiques que destaca la presència de diferents característiques.

Exemple: considerem un filtre 3×3 que detecta vores horitzontals. Quan es combina amb una imatge d'entrada, produirà un mapa de característiques que emfatitza les vores horitzontals de la imatge.

2. Capes d'agrupació: les capes d'agrupació s'utilitzen per rebaixar els mapes de característiques generats per les capes convolucionals. Redueixen les dimensions espacials dels mapes de característiques alhora que conserven la informació més important. L'operació d'agrupació més utilitzada és la agrupació màxima, que selecciona el valor màxim dins d'una finestra d'agrupació. Això ajuda a reduir la complexitat computacional de la xarxa i la fa més robusta a petites variacions espacials en la imatge d'entrada.

Exemple: l'aplicació de l'agrupació màxima amb una finestra d'agrupació de 2×2 en un mapa de característiques seleccionarà el valor màxim a cada regió de 2×2 no solapada, reduint efectivament les dimensions espacials a la meitat.

3. Funcions d'activació: les funcions d'activació introdueixen la no linealitat a la CNN, la qual cosa li permet aprendre patrons complexos i fer prediccions. La funció d'activació més utilitzada a les CNN és la unitat lineal rectificada (ReLU), que calcula la sortida com el màxim de zero i l'entrada. Es prefereix ReLU per la seva senzillesa i capacitat per alleujar el problema del gradient de desaparició.

Exemple: si la sortida d'una neurona és negativa, ReLU la posa a zero, apagant efectivament la neurona. Si la sortida és positiva, ReLU la manté sense canvis.

4. Capes totalment connectades: les capes totalment connectades són les responsables de fer les prediccions finals basades en les característiques extretes. Agafen els mapes de característiques aplanades de les capes anteriors i els passen per una sèrie de neurones completament connectades. Cada neurona de la capa totalment connectada està connectada a totes les neurones de la capa anterior, la qual cosa li permet aprendre relacions complexes entre característiques i fer prediccions precises.

Exemple: en una tasca de reconeixement d'imatges, la capa completament connectada pot tenir neurones corresponents a diferents classes, com ara "gat", "gos" i "cotxe". La sortida de la capa totalment connectada es pot interpretar com les probabilitats de la imatge d'entrada pertanyent a cada classe.

5. Funció de pèrdua: la funció de pèrdua mesura la discrepància entre les sortides previstes i les etiquetes de veritat del sòl. Quantifica el rendiment de la CNN en la tasca en qüestió i proporciona un senyal per actualitzar els paràmetres del model durant l'entrenament. L'elecció de la funció de pèrdua depèn de la tasca específica de reconeixement d'imatges, com ara l'entropia creuada binària per a la classificació binària o l'entropia creuada categòrica per a la classificació multiclasse.

Exemple: en una tasca de classificació binària, la pèrdua d'entropia creuada binària compara la probabilitat prevista de la classe positiva amb l'etiqueta real (0 o 1) i penalitza grans discrepàncies entre elles.

Una xarxa neuronal convolucional (CNN) consta de capes convolucionals, capes d'agrupació, funcions d'activació, capes completament connectades i una funció de pèrdua. Les capes convolucionals extreuen característiques significatives de la imatge d'entrada, mentre que les capes d'agrupació redueixen els mapes de característiques. Les funcions d'activació introdueixen la no linealitat i les capes completament connectades fan les prediccions finals. La funció de pèrdua mesura la discrepància entre les sortides previstes i les etiquetes de veritat bàsica, guiant el procés d'entrenament.

Altres preguntes i respostes recents sobre Xarxes neuronals convolucionals a TensorFlow:

Més preguntes i respostes:

Etiquetat sota: Intel·ligència Artificial, CNN, Visió per ordinador, Xarxa neuronal convolucional, Aprenentatge profund, Reconeixement d’imatges

Acadèmia EITCA

Quins són els components clau d'una xarxa neuronal convolucional (CNN) i els seus respectius papers en les tasques de reconeixement d'imatges?

Altres preguntes i respostes recents sobre Xarxes neuronals convolucionals a TensorFlow:

Més preguntes i respostes:

EITCA Academy forma part del marc europeu de certificació informàtica

Elegibilitat per a la subvenció EITCA Academy 80% EITCI DSJC

Acadèmia EITCA

INICIU LA sessió del vostre compte mitjançant el vostre nom d’USUARI O L’ADREÇA DE CORREU E-MAIL

He oblidat els vostres detalls?

CREAR UN COMPTE

Quins són els components clau d'una xarxa neuronal convolucional (CNN) i els seus respectius papers en les tasques de reconeixement d'imatges?

Altres preguntes i respostes recents sobre Xarxes neuronals convolucionals a TensorFlow:

Més preguntes i respostes:

Elegibilitat per a la subvenció EITCA Academy 80% EITCI DSJC