
Bayesin lause on yksi todennäköisyyslaskennan pilareista . Se on Thomas Bayesin (1702-1761) 1700-luvulla esittämä teoria. Mutta mikä on tämän kuuluisan tiedemiehen tutkimuksen tarkoitus? Todennäköisyys ilmaisee satunnaisessa prosessissa myönteisten tapausten määrän ja mahdollisten tapausten määrän välisen suhteen.
On kehitetty monia todennäköisyysteorioita, jotka hallitsevat nykyistä olemassaoloamme. Kun menemme lääkäriin, hän määrää lääkkeen, joka todennäköisesti osoittautuu hyödylliseksi meidän tapauksessamme, aivan kuten mainostajat omistavat kampanjansa ihmisille, jotka todennäköisimmin ostavat mainostettavan tuotteen, tai turisteille ja matkailijoille, jotka valitsevat reitin, jolla todennäköisesti on vähiten jonoa.
Kokonaistodennäköisyyslaki on yksi tunnetuimmista, joten ennen kuin puhumme siitä Bayesin lause meidän on omistettava muutama rivi ensimmäisen selittämiseen. Yrittääksesi ymmärtää sen, anna vain esimerkki .
Mikä on todennäköisyys (P), että tämän maan työväestöstä satunnaisesti valittu henkilö on? työttömänä ?

Todennäköisyysteorian mukaan data ilmaistaan seuraavasti:
- Todennäköisyys, että henkilö on nainen: P (M)
- Todennäköisyys, että henkilö on mies: P (H)
Kun tiedämme, että 39 % väestöstä koostuu naisista, päättelemme, että P (M) = 039.
Siksi on selvää, että: P (H) = 1 – 039 = 061. Alussa esitetty ongelma antaa meille myös ehdolliset todennäköisyydet:
- Todennäköisyys, että henkilö on työtön tietäen olevansa nainen -> P (P | M) = 022
- Todennäköisyys, että henkilö on työtön tietäen olevansa mies – P (P | H) = 014
Käyttämällä kokonaistodennäköisyyden laki meillä tulee olemaan:
P (P) = P (M) P (P | M) P (H) P (P | H)
P (P) = 022 × 039 014 × 061
P (P) = 017
The . Huomaamme, että tulos on kahden ehdollisen todennäköisyyden puolivälissä (022<017 <014). Inoltre è più prossimo al valore degli uomini perché nella popolazione di questo paese immaginario sono la maggioranza.
Tutustutaan Bayesin lauseeseen
Oletetaan nyt, että aikuinen valitaan sattumanvaraisesti täyttämään lomake, ja hänen havaitaan olevan työtön. Millä todennäköisyydellä tässä tapauksessa ja ottaen huomioon edellinen esimerkki on, että tämä satunnaisesti valittu henkilö on nainen -P (M | P) -?
Tämän ongelman ratkaisemiseksi käytämme Bayesin lausetta jota käytetään tapahtuman todennäköisyyden laskemiseen saamalla siitä tietoa etukäteen . Voimme laskea tapahtuman A todennäköisyydet tietäen, että se täyttää tietyt ominaisuudet (B).
Tässä tapauksessa puhutaan todennäköisyydestä, että satunnaisesti lomakkeen täyttäjäksi valittu henkilö on nainen. Mutta se
Bayesin lauseen kaava
Kuten kaikki muutkin lauseet, tarvitsemme kaavan.

Vaikuttaa monimutkaiselta, mutta kaikella on selitys. Ajatellaanpa osissa. Mitä kukin kirjain tarkoittaa?
- L kirjain A (n) viittaa erilaisiin ehdollisiin tapahtumiin.
- Osoittajaosassa meillä on ehdollinen todennäköisyys . Tämä viittaa todennäköisyyteen, että jotain (tapahtuma A) tapahtuu tietäen, että myös toinen tapahtuma (B) tapahtuu. Se määritellään P (A | B) ja ilmaistaan seuraavasti: A:n todennäköisyys tietylle B:lle .
- Nimittäjässä on P (B) vastine ja sama selitys kuin edellisessä kohdassa.

Esimerkki
Palatakseni edelliseen esimerkkiin oletetaan, että aikuinen valitaan satunnaisesti täyttämään kyselylomakkeen ja havaitaan, että hän on työttömänä . Mikä on todennäköisyys, että tämä valittu henkilö on nainen?
Tiedämme, että 39 prosenttia aktiivisesta väestöstä on naisia, kun taas loput ovat naisia miehet . Tiedämme myös, että työttömien naisten osuus on 22 prosenttia ja miesten 14 prosenttia.
Lopuksi tiedämme myös, että todennäköisyys, että satunnaisesti valittu henkilö on työtön, on 017. Jos sovellamme Bayesin lauseen kaavaa, saadaan tulokseksi, että on todennäköisyys 05, että satunnaisesti valittu henkilö työttömien joukosta
P (M | P) = (P (M) * P (P | M) / P (P)) = (022 * 039) / 017 = 05
Bayesin lause on johdettu alussa selittämämme yhdistelmä- ja absoluuttisen todennäköisyyden lauseiden konjunktiosta. Sen pääominaisuus on, että se toimii kaikissa todennäköisyystulkinnoissa.
Koska sitä voidaan käyttää laskemaan tapahtuman laukaisevan syyn todennäköisyys sen merkitys on siinä, miten se on historiallisesti vaikuttanut tilastotutkimukseen . Nykyään tunnetaan itse asiassa kaksi pääkoulukuntaa (toinen frekventisti ja toinen bayesilainen), jotka asettavat vastakkain tämän teorian tulkinnasta lähtien.
Päätämme uteliaisuudella: tiesitkö, että sähköinen roskaposti (että Internet sähköpostimainokset) toimiiko se Bayesin lauseen ansiosta?