Per extreure totes les anotacions d'objectes de la resposta de l'API en l'àmbit de la Intel·ligència Artificial – API de Google Vision – Comprensió avançada d'imatges – Detecció d'objectes, podeu utilitzar el format de resposta proporcionat per l'API, que inclou una llista d'objectes detectats juntament amb els seus corresponents. quadres delimitadors i puntuacions de confiança. Analitzant aquesta resposta, podeu extreure les anotacions dels objectes desitjades.
La resposta de l'API normalment consisteix en un objecte JSON que conté diversos camps, inclòs el camp "localizedObjectAnnotations", que conté els objectes detectats. Cada anotació d'objecte inclou informació com ara el nom de l'objecte, les coordenades del seu quadre delimitador i una puntuació de confiança que indica la confiança de l'API en la detecció.
Per extreure les anotacions dels objectes, podeu seguir aquests passos:
1. Analitzeu la resposta de l'API: comenceu analitzant la resposta JSON rebuda de l'API. Això es pot fer mitjançant una biblioteca d'anàlisi JSON o funcions integrades proporcionades pel vostre llenguatge de programació.
2. Accediu al camp "localizedObjectAnnotations": un cop analitzada la resposta, accediu al camp "localizedObjectAnnotations", que conté els objectes detectats. Aquest camp normalment és una matriu d'anotacions d'objectes.
3. Iterar a través de les anotacions d'objectes: iterar a través de cada anotació d'objectes de la matriu. Cada anotació representa un objecte detectat a la imatge.
4. Extreu la informació rellevant: extreu la informació rellevant de cada anotació d'objecte, com ara el nom de l'objecte, les coordenades del quadre delimitador i la puntuació de confiança. Es pot accedir a aquests detalls com a camps separats dins de cada anotació d'objecte.
5. Emmagatzemar o processar la informació extreta: segons els vostres requisits, podeu emmagatzemar la informació extreta en una estructura de dades o processar-la més per a l'anàlisi o altres finalitats. Per exemple, és possible que vulgueu emmagatzemar els noms dels objectes i les seves coordenades de quadre delimitadors corresponents en una base de dades o utilitzar-los per a més tasques de comprensió d'imatges.
Aquí teniu un exemple simplificat per il·lustrar el procés d'extracció:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"nom": "gat",
"puntuació": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"name": "gos",
"puntuació": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
En aquest exemple, suposem una resposta JSON que conté dos objectes detectats: un gat i un gos. El codi analitza la resposta, accedeix al camp "localizedObjectAnnotations", itera a través de cada anotació d'objecte i extreu el nom de l'objecte, les coordenades del quadre delimitador i la puntuació de confiança. Finalment, s'imprimeix la informació extreta, però podeu modificar el codi per adaptar-lo a les vostres necessitats específiques.
Seguint aquests passos, podeu extreure eficaçment totes les anotacions d'objectes de la resposta de l'API en l'àmbit de la Intel·ligència Artificial – API de Google Vision – Comprensió avançada d'imatges – Detecció d'objectes.
Altres preguntes i respostes recents sobre Comprensió avançada d’imatges:
- Quines són algunes de les categories predefinides per al reconeixement d'objectes a l'API de Google Vision?
- Quin és l'enfocament recomanat per utilitzar la funció de detecció de cerca segura en combinació amb altres tècniques de moderació?
- Com podem accedir i mostrar els valors de probabilitat de cada categoria a l'anotació de cerca segura?
- Com podem obtenir l'anotació de cerca segura mitjançant l'API de Google Vision a Python?
- Quines són les cinc categories incloses a la funció de detecció de cerca segura?
- Com detecta la funció de cerca segura de l'API de Google Vision contingut explícit a les imatges?
- Com podem identificar i destacar visualment els objectes detectats en una imatge mitjançant la biblioteca de coixins?
- Com podem organitzar la informació de l'objecte extret en un format tabular mitjançant el marc de dades pandas?
- Quines biblioteques i llenguatge de programació s'utilitzen per demostrar la funcionalitat de l'API de Google Vision?
- Com realitza l'API de Google Vision la detecció i localització d'objectes a les imatges?
Vegeu més preguntes i respostes a Comprensió avançada d'imatges