Aquesta aplicació sap exactament on es trobava quan vau fer una foto

Fins i tot sense coordenades GPS, PoseNet diu que pot indicar la ubicació exacta de qualsevol fotografia, fins i tot en quina direcció s’enfrontava el fotògraf.

Si mostreu una foto a PoseNet, us indicarà exactament on es va fer. Sembla fàcil en un món on totes les fotografies que feu són etiquetades amb coordenades GPS, però PoseNet no necessita GPS. En lloc d’això, en realitat reconeix l’escena de la imatge i es basa en allà on es trobava.

per què es retarden algunes comprovacions d’estímuls?



El sistema té una precisió de fins a 6 peus i fins i tot pot indicar cap a quina manera s’enfrontava quan vau fer la foto, a menys de tres graus.

PoseNet , d’investigadors de la Universitat de Cambridge, utilitza una cosa anomenada xarxes neuronals convolucionals profundes per fer la seva màgia, que es basa en la forma en què l’escorça visual dels animals processa estímuls visuals. Aquestes xarxes es poden utilitzar per al reconeixement d’imatges, inclosa la selecció de cares d’una multitud, fins i tot quan estan parcialment amagades o al revés.

La tècnica té alguns avantatges respecte a altres tipus de reconeixement d’imatges. En primer lloc, és ràpid. Mostreu una foto a PoseNet i us indicarà on es va fer en cinc milisegons. A continuació, és lleuger. El sistema PoseNet es basa en una base de dades de menys de 50 megabytes, mentre que alguns sistemes rivals necessiten emmagatzemar gigabytes de fotografies de referència i després processar-les.



Crec que PoseNet té tres avantatges principals sobre el GPS i les tecnologies relacionades, explica Alex Kendall, de PoseNet, a Co.Exist. En primer lloc, el GPS requereix infraestructura (per exemple, els satèl·lits). En segon lloc, el GPS no us proporciona una estimació d’orientació. En tercer lloc, el GPS sovint és imprecís i no funciona en entorns interiors.

Primer s’ha de formar PoseNet, que implica mostrar-li moltes fotografies, que estudia i redueix a una petita base de dades. Les imatges s’han d’etiquetar amb dades d’ubicació de la càmera en 3D, que indiquen al sistema cap a quina cara estava la càmera, però això és habitual en les càmeres actuals.

Actualment, PoseNet només funciona a una part de Cambridge, Anglaterra (és una demostració de tecnologia), però podeu proveu-ho vosaltres mateixos . El sistema es va formar mitjançant un conjunt de dades de 12.000 imatges, que abastaven sis escenes al voltant de la Universitat de Cambridge. Com que el sistema és tan ràpid i els requisits d’emmagatzematge de dades tan baixos, es podria escalar fàcilment per a ús mundial. Imagineu-vos si a aquesta tecnologia se li donés accés a les dades de Google Street View: podríeu mostrar pràcticament qualsevol fotografia i saber a l'instant on es va fer.



Parlant de Google: l’empresa de cerca té el seu propi projecte que intenta fer el mateix: esbrinar la ubicació d’una foto només mirant-la. Però, a diferència de PoseNet, el de Google PlaNet aconsegueix col·locar només el 3,6% de les imatges amb precisió a nivell de carrer. La taxa d’èxit s’eleva fins al 10,1% a nivell de ciutat, però amb prou feines són els nivells de precisió sobrehumans reclamat per l’equip de PlaNet.

Probablement el nostre enfocament és més precís ja que es forma a una escala menor que PlaNet, diu Kendall. I PoseNet pot fer alguna cosa que el projecte de Google no pot fer. PoseNet és atractiu perquè és capaç d’estimar la ubicació de la càmera en coordenades mètriques. En canvi, PlaNet simplement classifica una imatge en una regió discreta.

Per descomptat, hi ha problemes de privadesa amb aquesta tecnologia. Podeu eliminar les coordenades GPS de les vostres fotos fàcilment i dispositius com l’iPhone l’eliminaran automàticament quan compartiu una imatge. Però PoseNet no necessita aquestes dades GPS, només necessita la imatge i sap on ets. No hi ha cap amagatall. A les forces de l'ordre els encantarà. La resta de nosaltres podríem pensar-ho dues vegades en publicar totes les nostres fotos en línia.