Home
La ricerca binaria spiegata bene

10 Ottobre 2022

La ricerca binaria spiegata bene

di

Il più semplice degli algoritmi nel suo genere, ma non per questo il meno efficace: la ricerca binaria merita di essere imparata, con questo articolo.

Perché ricorrere alla ricerca binaria

Supponiamo di cercare una persona nell’elenco telefonico (oddio, che frase antiquata!). Il suo cognome inizia per K. Potremmo iniziare dall’inizio e continuare a sfogliare le pagine fino ad arrivare alle K. Ma è più probabile che inizieremo da una pagina centrale, perché sappiamo che la K è più a metà dell’alfabeto. Questo è l’inizio del viaggio che porta all’uso della ricerca binaria.

Donna che legge un libro

Oppure supponiamo di cercare una parola in un dizionario e che inizi con O. Di nuovo, inizieremo in prossimità del centro.

Supponiamo ora di accedere a Facebook. Facebook deve verificare che noi abbiamo un account, quindi, deve cercare il nostro nome-utente nel suo database. Supponiamo che il nostro nome-utente sia karlmageddon. Facebook potrebbe iniziare dalla A e cercare il nostro nome, ma ha più senso che inizi da qualche parte nel mezzo.

Questo è un problema di ricerca. E tutti questi casi usano lo stesso algoritmo per risolvere il problema: quello di ricerca binaria.

La ricerca binaria è un algoritmo; il suo input è una lista ordinata di elementi. Se l’elemento che stiamo cercando è in quella lista, la ricerca binaria restituisce la sua posizione. In caso contrario, la ricerca binaria restituisce null.

Per esempio, osserviamo la figura seguente.

Ricerca di aziende in una rubrica telefonica con la ricerca binaria

Ricerca di aziende in una rubrica telefonica con la ricerca binaria.

Ecco un esempio di come funziona la ricerca binaria. Sto pensando a un numero compreso tra 1 e 100.

Bisogna indovinare il mio numero nel minor numero possibile di tentativi. Io dirò se la ciascuna ipotesi è troppo bassa, troppo alta o corretta.

Supponiamo di iniziare a indovinare in questo modo: 1, 2, 3, 4, …. Ecco come andrebbe.

Un cattivo approccio per indovinare i numeri

Un cattivo approccio per indovinare i numeri.

Questa è una ricerca semplice (ma forse sarebbe meglio chiamarla ricerca stupida). A ogni ipotesi, stiamo eliminando un solo numero. Se il mio numero fosse 99, ci vorrebbero 99 tentativi per arrivarci!

Un modo migliore per cercare

Ecco una tecnica migliore. Partiamo da 50.

Partiamo da 50

Troppo basso, ma abbiamo appena eliminato metà dei numeri! Ora sappiamo che i numeri da 1 a 50 sono tutti troppo bassi. Prossima ipotesi: 75.

Prossima ipotesi 75

Troppo alto, ma di nuovo abbiamo ridotto la metà dei numeri rimanenti! Con la ricerca binaria, proponiamo il numero centrale ed eliminiamo ogni volta la metà dei numeri rimanenti. Il prossimo numero è 63 (a metà tra 50 e 75).

Il prossimo numero è 63

Questa è una ricerca binaria. Abbiamo appena imparato il nostro primo algoritmo! Ecco quanti numeri possiamo eliminare ogni volta.

Con la ricerca binaria eliminiamo ogni volta la metà dei numeri

Con la ricerca binaria eliminiamo ogni volta la metà dei numeri.

Qualsiasi sia il numero che ho in mente, dovremo fare al massimo sette ipotesi, perché a ogni ipotesi eliminiamo così tanti numeri inutili!

Leggi anche: Che cos’è un algoritmo e come progettarlo

Supponiamo di stare cercando una parola nel dizionario. Il dizionario contiene 240 mila parole. Nel caso peggiore, quanti passi richiederà ogni ricerca?

La ricerca semplice potrebbe richiedere 240 mila passi, se la parola che stiamo cercando è l’ultima del dizionario. A ogni passo della ricerca binaria, invece, dimezziamo il numero di parole rimanenti, finché non ne rimane una sola.

Ricerca binaria in 18 passi

Quindi, la ricerca binaria richiederà 18 passi: una grande differenza! In generale, per qualsiasi lista di n elementi, la ricerca binaria richiederà il log2 n passi, nel caso peggiore, mentre una ricerca semplice richiederà n passi.

Scrivere una ricerca binaria in Python

Vediamo come scrivere una ricerca binaria in Python. Il seguente esempio di codice usa gli array. Se non sappiamo come funzionano gli array, non preoccupiamoci; dobbiamo solo immaginare di memorizzare una sequenza di elementi in una fila di caselle consecutive, chiamata array. Le caselle sono numerate a partire da 0: la prima casella si trova nella posizione 0, la seconda nella posizione 1, la terza nella posizione 2 e così via.

La funzione binary_search accetta un array ordinato e un elemento. Se l’elemento è contenuto nell’array, la funzione ne restituisce la posizione. Occorre registrare in quale parte dell’array dobbiamo cercare. All’inizio, si tratta dell’intero array:

low = 0
high = len(list) - 1

Low e High di partenza

Ogni volta, controlliamo l’elemento centrale:

mid = (low + high) // 2 
guess = list[mid]

mid viene arrotondato automaticamente per difetto da Python se (low + high) non è un numero pari.

Se guess è troppo basso, aggiorniamo low in modo appropriato:

if guess < item:
    low = mid + 1

Nuovi low e high

E se guess è troppo alto, aggiorniamo high. Ecco il codice completo:

def binary_search(list, item):
    low = 0
    high = len(list)—1
    while low <= high:
        mid = (low + high) // 2
        guess = list[mid]
        if guess == item:
            return mid
        if guess > item:
            high = mid - 1
        else:
            low = mid + 1
    return None
my_list = [1, 3, 5, 7, 9]
print binary_search(my_list, 3) # => 1
print binary_search(my_list, -1) # => None

low e high tengono traccia della parte della lista in cui eseguiremo la ricerca.

Finché non avremo ristretto la ricerca a un solo elemento…

…controlliamo l’elemento centrale.

Trovato l’elemento.

guess era troppo alto.

guess era troppo basso.

L’elemento non è presente.

Proviamolo!

Ricordiamo, le liste iniziano da 0. La seconda casella ha indice 1.

None significa nulla in Python. Indica che l’elemento non è stato trovato.

Tempo di esecuzione

In genere si desidera scegliere l’algoritmo più efficiente, indipendentemente dal fatto che si stia cercando di ottimizzare il tempo di esecuzione o lo spazio occupato.

Torniamo alla ricerca binaria. Quanto tempo risparmiamo usandola? Bene, il primo approccio è stato controllare ogni numero, uno per uno. Se questa è una lista di 100 numeri, avremo bisogno di fare fino a 100 ipotesi.

Se la lista contiene 4 miliardi di numeri, dovremo fare fino a 4 miliardi di ipotesi. Quindi il numero massimo di ipotesi corrisponde alle dimensioni della lista. Questo è chiamato tempo lineare.

La ricerca binaria è diversa. Se la lista è lunga 100 elementi, avremo bisogno, al massimo, di 7 tentativi. Se la lista è lunga 4 miliardi di elementi, avremo bisogno, al massimo, di 32 tentativi. Potente, vero? La ricerca binaria viene eseguita in un tempo logaritmico (o tempo log, come dicono gli iniziati). Ecco una tabella che riassume le nostre scoperte di oggi. Buona ricerca binaria!

Tempi di esecuzione degli algoritmi di ricerca

Tempi di esecuzione degli algoritmi di ricerca.

Questo articolo richiama contenuti da Algoritmi spiegati in modo facile.

Immagine di apertura di Markus Winkler su Unsplash.

L'autore

  • Aditya Y. Bhargava
    Aditya Y. Bhargava è un ingegnere del software con un duplice background formativo, da una parte l'Informatica dall'altra le Belle Arti. Cura un blog sulla programmazione e condivide i suoi studi e le sue passioni.

Vuoi rimanere aggiornato?
Iscriviti alla nostra newletter

Novità, promozioni e approfondimenti per imparare sempre qualcosa di nuovo

Gli argomenti che mi interessano:
Iscrivendomi dichiaro di aver preso visione dell’Informativa fornita ai sensi dell'art. 13 e 14 del Regolamento Europeo EU 679/2016.

Libri che potrebbero interessarti

Tutti i libri

Algoritmi spiegati in modo facile

Guida illustrata per programmatori curiosi

28,41

29,90€ -5%

di Aditya Y. Bhargava