TensorFlow Lite és una solució lleugera proporcionada per TensorFlow per executar models d'aprenentatge automàtic en dispositius mòbils i IoT. Quan l'intèrpret de TensorFlow Lite processa un model de reconeixement d'objectes amb un fotograma d'una càmera de dispositiu mòbil com a entrada, la sortida sol incloure diverses etapes per proporcionar, finalment, prediccions sobre els objectes presents a la imatge.
En primer lloc, el marc d'entrada de la càmera del dispositiu mòbil s'introdueix a l'intèrpret TensorFlow Lite. Llavors, l'intèrpret preprocessa la imatge d'entrada convertint-la en un format adequat per al model d'aprenentatge automàtic. Aquest pas de preprocessament sol implica redimensionar la imatge perquè coincideixi amb la mida d'entrada esperada pel model, normalitzar els valors de píxels i, potencialment, aplicar altres transformacions específiques de l'arquitectura del model.
A continuació, la imatge preprocessada passa pel model de reconeixement d'objectes dins de l'intèrpret TensorFlow Lite. El model processa la imatge utilitzant els seus paràmetres i arquitectura apresos per generar prediccions sobre els objectes presents al marc. Aquestes prediccions solen incloure informació com ara les etiquetes de classe dels objectes detectats, les seves ubicacions a la imatge i les puntuacions de confiança associades a cada predicció.
Un cop el model ha fet les seves prediccions, l'intèrpret TensorFlow Lite envia aquesta informació en un format estructurat que pot ser utilitzat per l'aplicació que utilitza el model. Aquesta sortida pot variar segons els requisits específics de l'aplicació, però normalment inclou les classes d'objectes detectats, els quadres delimitadors que descriuen els objectes de la imatge i les puntuacions de confiança associades.
Per exemple, si el model de reconeixement d'objectes està entrenat per detectar objectes comuns com ara cotxes, vianants i senyals de trànsit, la sortida de l'intèrpret de TensorFlow Lite pot incloure prediccions com ara "cotxe" amb un quadre delimitador que especifiqui la ubicació del cotxe al imatge i una puntuació de confiança que indica la certesa del model sobre la predicció.
La sortida de l'intèrpret TensorFlow Lite per a un model d'aprenentatge automàtic de reconeixement d'objectes que processa un fotograma des de la càmera d'un dispositiu mòbil implica el preprocessament de la imatge d'entrada, passar-la a través del model per a inferència i proporcionar prediccions sobre els objectes presents a la imatge en un format estructurat. adequat per al processament posterior per part de l'aplicació.
Altres preguntes i respostes recents sobre Fonaments de TensorFlow de l’EITC/AI/TFF:
- Com es pot utilitzar una capa d'incrustació per assignar automàticament eixos adequats per a una trama de representació de paraules com a vectors?
- Quin és l'objectiu de la agrupació màxima en una CNN?
- Com s'aplica el procés d'extracció de característiques en una xarxa neuronal convolucional (CNN) al reconeixement d'imatges?
- És necessari utilitzar una funció d'aprenentatge asíncrona per als models d'aprenentatge automàtic que s'executen a TensorFlow.js?
- Quin és el paràmetre del nombre màxim de paraules de l'API TensorFlow Keras Tokenizer?
- Es pot utilitzar l'API TensorFlow Keras Tokenizer per trobar les paraules més freqüents?
- Què és TOCO?
- Quina relació hi ha entre diverses èpoques en un model d'aprenentatge automàtic i la precisió de la predicció a partir de l'execució del model?
- L'API de pack neighbors a Neural Structured Learning de TensorFlow produeix un conjunt de dades d'entrenament augmentat basat en dades de gràfics naturals?
- Què és l'API pack neighbors en Neural Structured Learning de TensorFlow?
Vegeu més preguntes i respostes a EITC/AI/TFF TensorFlow Fundamentals