Oct 28, 2023
Dentro la sorveglianza di Amazon
By now many have heard of Amazon’s most audacious attempt to shake up the retail
Ormai molti hanno sentito parlare del tentativo più audace di Amazon di scuotere il mondo della vendita al dettaglio, il Go Store senza contanti e senza cassieri. Entra, prendi quello che vuoi ed esci. Ho avuto l'opportunità di farlo di recente, oltre a raccogliere il cervello di uno dei suoi principali architetti. (Il negozio, nel centro di Seattle, è ora aperto al pubblico.)
La mia intenzione era provare a rubare qualcosa e sorprendere questi compiacenti tipi di Amazon a sonnecchiare. Ma quando sono entrato è diventato chiaro che questa non sarebbe stata un'opzione. Non sono mai stato a più di un metro o due da un rappresentante delle pubbliche relazioni di Amazon e, come mi ha convinto Dilip Kumar, il vicepresidente della tecnologia del progetto, avevano già provveduto contro attacchi così grossolani al loro sistema.
Come avrai visto nel video promozionale, si entra nel negozio (finora accessibile solo ai dipendenti Amazon) attraverso un cancello che si apre quando si scansiona un codice QR generato dall'app Amazon Go sul tuo telefono. In questo momento (beh, in realtà nel momento in cui sei entrato o forse anche prima) il tuo account è associato alla tua presenza fisica e le telecamere iniziano a monitorare ogni tuo movimento.
Le tante, tantissime telecamere.
[ID galleria="1589027,1589028,1589038"]
Quando è stata proposta per la prima volta l'idea del negozio senza cassiere di Amazon, mi sono chiesto come sarebbe stata realizzata. Telecamere sul soffitto, dietro le vetrine, sui piedistalli? Che tipo? Sensori di prossimità e di peso, riconoscimento facciale? Dove verrebbe raccolto ed elaborato tutto questo?
L'approccio di Amazon non è stato così complesso come mi aspettavo, o meglio non nel modo in cui mi aspettavo. Principalmente il sistema è composto da decine e decine di unità di ripresa montate sul soffitto, che coprono e riprendono ogni centimetro quadrato del negozio da più angolazioni. Immagino che ce ne siano forse un centinaio nel negozio che ho visitato, che aveva all'incirca le dimensioni di una normale bodega o di una stazione di servizio.
Si tratta di normali telecamere RGB, realizzate su misura con schede nell'involucro per eseguire alcuni lavori di base di visione artificiale, presumibilmente cose come il rilevamento del movimento, l'identificazione di base degli oggetti e così via.
Sono potenziati da telecamere separate con rilevamento della profondità (utilizzando una tecnica del tempo di volo, o almeno così ho capito da Kumar) che si fondono con lo sfondo come il resto, tutto nero opaco.
Le immagini catturate da queste telecamere vengono inviate a un'unità di elaborazione centrale (in mancanza di un termine migliore, non si sa esattamente di cosa si tratta), che svolge il vero lavoro di identificare rapidamente e accuratamente le diverse persone nel negozio e gli oggetti ritirati o tenuto. Raccogliere qualcosa lo aggiunge al tuo "carrello della spesa virtuale" e puoi inserirlo in una borsa o in una borsa della spesa velocemente quanto vuoi. Non c'è bisogno di tenerlo premuto affinché il sistema lo veda.
[ID galleria="1589031,1589029,1589033,1589035,1589030"]
È qui che sta la salsa segreta, mi ha detto Kumar, e io gli credo. Per quanto banale possa sembrare il problema di determinare quale persona vestita in modo simile abbia preso una tazza di yogurt quasi identica, è molto difficile raggiungere il livello di velocità e precisione necessario per basare un'intera attività su di esso.
Dopotutto, uno studente, con le risorse disponibili al giorno d'oggi, potrebbe probabilmente progettare in poche settimane una versione di questo negozio che funzionerebbe nell'80% delle volte. Ma riuscire a farlo bene il 99,9% delle volte, senza attriti e istantaneamente, è una sfida che richiede molto lavoro.
In particolare, non viene utilizzato il riconoscimento facciale (ho chiesto). Amazon forse ha intuito fin dall'inizio che questo gli avrebbe fatto guadagnare il rimprovero da parte degli acquirenti attenti alla privacy, anche se l'idea che quelle persone venissero in questo negozio mi sembra improbabile. Invece, il sistema utilizza altri segnali visivi e controlla la continuità tra le telecamere: non sei mai in vista di un obiettivo, quindi è facile per il sistema vedere un acquirente spostarsi da una telecamera all'altra e stabilire la connessione.
Se si verifica un problema tecnico con la fotocamera o se in qualche modo si sporca l'obiettivo, il sistema non si guasta del tutto. È stato testato con le fotocamere mancanti, anche se naturalmente non passerà molto tempo prima che venga effettuata una sostituzione e il sistema si ricalibra.