Teorema di Bayes: spiegazione, applicazioni, esercizi

Il Teorema di Bayes è una procedura che ci consente di esprimere la probabilità condizionale di un evento casuale A data B, in termini di distribuzione di probabilità dell'evento B dato A e distribuzione di probabilità solo di A.

Questo teorema è molto utile, poiché grazie ad esso possiamo mettere in relazione la probabilità che si verifichi un evento A sapendo che B si è verificato, con la probabilità che si verifichi l'opposto, cioè che B si manifesti dando A.

Il teorema di Bayes era una proposta d'argento del reverendo Thomas Bayes, un teologo inglese del diciottesimo secolo che era anche un matematico. Fu autore di numerose opere in teologia, ma è attualmente noto per un paio di trattati matematici, tra cui spicca il già citato teorema di Bayes come principale risultato.

Bayes ha trattato questo teorema in un articolo dal titolo "Un saggio per risolvere un problema nella dottrina delle probabilità", pubblicato nel 1763, e sul quale sono stati sviluppati grandi lavori per risolvere un problema nella dottrina delle possibilità. Studi con applicazioni in diversi settori della conoscenza.

spiegazione

Innanzitutto, per un'ulteriore comprensione di questo teorema, sono necessarie alcune nozioni di base della teoria della probabilità, in particolare il teorema di moltiplicazione per la probabilità condizionale, che afferma che

Per E e A eventi arbitrari di uno spazio campionario S.

E la definizione di partizioni, che ci dice che se abbiamo A 1, A 2, ..., A n eventi di uno spazio campione S, questi formeranno una partizione di S, se gli A i si escludono a vicenda e la loro unione è S.

Avendo questo, sia B un altro evento. Quindi possiamo vedere B come

Dove l'A i intersecato con B sono eventi che si escludono a vicenda.

E di conseguenza,

Quindi, applicando il teorema della moltiplicazione

D'altra parte, la probabilità condizionale di Ai data da B è definita da

Sostituendo adeguatamente dobbiamo per qualsiasi io

Applicazioni del teorema di Bayes

Grazie a questo risultato, gruppi di ricerca e diverse corporazioni sono riusciti a migliorare i sistemi basati sulla conoscenza.

Ad esempio, nello studio delle malattie, il teorema di Bayes può aiutare a discernere la probabilità che una malattia sia trovata in un gruppo di persone con una determinata caratteristica, prendendo come dati i tassi globali della malattia e la predominanza di tali caratteristiche in persone sia sane che malate.

D'altra parte, nel mondo delle alte tecnologie, ha influenzato le grandi aziende che hanno sviluppato, grazie a questo risultato, il software "Based on Knowledge".

Come esempio di tutti i giorni abbiamo l'assistente di Microsoft Office. Il teorema di Bayes aiuta il software a valutare i problemi che l'utente presenta e determina quali consigli fornire e quindi essere in grado di offrire un servizio migliore in base alle abitudini dell'utente.

Va notato che questa formula è stata ignorata fino a tempi recenti, questo è principalmente dovuto al fatto che quando questo risultato è stato sviluppato 200 anni fa, c'era poco uso pratico per loro. Tuttavia, ai nostri giorni, grazie ai grandi progressi tecnologici, gli scienziati hanno raggiunto dei modi per mettere in pratica questo risultato.

Esercizi risolti

Esercizio 1

Una società cellulare ha due macchine A e B. Il 54% dei telefoni cellulari prodotti sono realizzati dalla macchina A e il resto dalla macchina B. Non tutti i telefoni cellulari prodotti sono in buone condizioni.

La proporzione di telefoni cellulari difettosi prodotti da A è 0, 2 e da B è 0, 5. Qual è la probabilità che un telefono cellulare di detta fabbrica sia difettoso? Qual è la probabilità che, sapendo che un cellulare è difettoso, provenga dalla macchina A?

soluzione

Qui, hai un esperimento che viene fatto in due parti; nella prima parte si verificano gli eventi:

A: cellulare realizzato dalla macchina A.

B: cellulare realizzato dalla macchina B.

Poiché la macchina A produce il 54% dei telefoni cellulari e il resto è prodotto dalla macchina B, la macchina B produce il 46% dei telefoni cellulari. Le probabilità di questi eventi sono date, vale a dire:

P (A) = 0, 54.

P (B) = 0, 46.

Gli eventi della seconda parte dell'esperimento sono:

D: cellulare difettoso

E: cellulare non difettoso.

Come si dice nella dichiarazione, le probabilità di questi eventi dipendono dal risultato ottenuto nella prima parte:

P (D | A) = 0, 2.

P (D | B) = 0, 5.

Utilizzando questi valori, puoi anche determinare le probabilità dei complementi di questi eventi, ovvero:

P (E | A) = 1 - P (D | A)

= 1 - 0, 2

= 0.8

e

p (E | B) = 1 - P (D | B)

= 1 - 0, 5

= 0, 5.

Ora, l'evento D può essere scritto come segue:

Usando il teorema della moltiplicazione per la probabilità condizionale, risulta:

Con il quale viene data una risposta alla prima domanda.

Ora abbiamo solo bisogno di calcolare P (A | D), per il quale si applica il teorema di Bayes:

Grazie al teorema di Bayes, si può affermare che la probabilità che un telefono cellulare sia stato realizzato dalla macchina A, sapendo che il cellulare è difettoso, è 0, 319.

Esercizio 2

Tre scatole contengono palline bianche e nere. La composizione di ciascuno di essi è la seguente: U1 = {3B, 1N}, U2 = {2B, 2N}, U3 = {1B, 3N}.

Una delle caselle viene scelta a caso e da essa viene estratta una palla casuale, che risulta essere bianca. Quale casella è più probabile che sia stata scelta?

soluzione

Per mezzo di U1, U2 e U3, rappresenteremo anche la casella scelta.

Questi eventi costituiscono una partizione di S e si verifica che P (U1) = P (U2) = P (U3) = 1/3 poiché la scelta della casella è casuale.

Se B = {la palla estratta è bianca}, avremo P (B | U1) = 3/4, P (B | U2) = 2/4, P (B | U3) = 1/4.

Quello che vogliamo ottenere è la probabilità che la palla sia stata tolta dalla scatola Ui sapendo che la palla era bianca, cioè P (Ui | B), e vedere quale dei tre valori era il più alto per sapere quale la scatola è stata più probabile l'estrazione della palla bianca.

Applicando il teorema di Bayes al primo dei riquadri:

E per gli altri due:

P (U2 | B) = 2/6 e P (U3 | B) = 1/6.

Quindi, la prima delle caselle è quella che ha una maggiore probabilità di essere stata scelta per l'estrazione della bilia battente.