2013 m. rugsėjo 18 d., trečiadienis

Kulbako-Leibliero ir Censovo atstumai



Susipažinsime su pagrindinėmis sąvokomis, kurios pateiktos [9] ir [1] knygose. Tarkime, kad turime binarinį  statistinį eksperimentą e = (X", 23™, {P", P"} su stebėjimais X" G X ir mačioje erdvėje (X", 23") apibrėžtas dar vienas tikimybinis matas Q,
toks, kad                                   .

1.4.1 APIBRĖŽIMAS: Kulbako-Leibliero informaciniu atstumu tarp matų P" ir P" vadiname skaičių žymimą /( P", P") ir apskaičiuojamą pagal formulę:


/(Pon,P")= f Po(x)/nP°(X)dC(x),      (9)
J                 pi(X)
X


čia   ( ) yra   tankiai Q mato atžvilgiu.
Nesunku matyti, kad                    , tuomet galime užrašyti tokį pavidalą:


/(P",Po")= f Pi(x)/nPl(X)dC(x).   ( 1 0)
J                 P o(x)
X

Tarkim, kad (                                        )                   - binarinė statistinių eksperimentų šeima su
stebėjimais X" G Xn , //" ir //" - dvi paprastos hipotezės, reiškiančios, kad stebėjimai X" turi tikimybinį matą     ir     atitinkamai.

Sakykim, kad mačioje erdvėje (                      ) turime tris tikimybinius matus
tokius, kad P" « Qt = 0, 1, Vn G N. Tada tikimybinių matų P" ir P", a G [0, 1] eilės Helingerio integralu vadiname dydį

r  E £z" 1(z">0),a = 0, //*(a) = //(a, P", P") = { E 3(z")a(z") 1 "a,a G ( 0, 1),
(  E £z" 1(z">0 ),a = 1,


čia E q - matematinis vidurkis mato Q " atžvilgiu, 1(4) - aibės A indikatorius, z" = —^, t =
Įveskime sąlygas S:
(51)   Tikimybiniai matai P" ir P" yra tarpusavyje ekvivalentūs, t.y. P"~ P", n G JV;
(52)   egzistuoja riba li mn- ^ "1 n //n( a, P", P") = c( a), a G [0, 1 ];
(53)   funkcija c( a) diferencijuojama ir griežtai iškila intervale (0,1); (S4): egzistuoja konstanta, žymima /( P", P") > 0 ,


dPn        p
n ~1 z n-TPr(Xn) - /( P", P") < oo, ka i n - oo, aP0

Pagal tokį     ( ) apibrėžimą  ( )     ( )     , o funkcija  ( ) yra griežtai iškila,
vadinasi., egzistuoja taškas       (    ) toks, kad (   )
                                            ( )
Žymėsime                       (   ).

1.4.2 APIBRĖŽIMAS: Česnovo asimptotiniu atstumu tarp matų P" ir P" (žymime (        )) vadinamas skaičius


/o, i = - i n f c( a),
0<a<l


kur
1
c( a) = li m-/n //( a, P", P"), ( 7 )
n->oo 77.


čia //n( P", P", a) yra a eilės Helingerio atstumas-integralas tarp matų P" ir P" .

1.5 Markovo proceso su r būsenomis Helingerio integralas

Susipažinsime su pagrindiniais aspektais, pateiktais [3] literatūros šaltinyje.
Nagrinėjame   binarinę   statistinių   eksperimentų   šeimą   (Xn, 23n,{ P
0\
stebėjimais                 (                            ). Sprendžiame dviejų paprastų hipotezių


}),   su






atskyrimo uždavinį. Čia Xn = (XO,X2 ,. . .,Xn), o Zfc = Z(/c), /c = 1, 2 ,. ..,n, kur Z(/c ), /c G N yra diskretaus laiko atsitiktinis procesas (Markovo grandinė su r būsenomis tikimybinio mato PO atžvilgiu), turintis pradines tikimybes:


W D = 2)


ir perėjimo tikimybių matricą

Atitinkamai, Markovo grandinė tikimybes:
PO1 =               1) = 1),
( )                     mato     atžvilgiu turi pradines



ir perėjimo tikimybių matricą

Tada, sukonstruotas pagal du tikimybinius matus Pn ir Pn, atitinkančius anksčiau nusakytas r būsenų Markovo grandines a E [0, 1 ] eilės Helingerio integralas turi pavidalą:
nn(a)=h>, pn 0, pni) = į į į ..± (p0Ą2       r( ^       y-.
'1 =1 '2 =1 'i =1      'n =1
1.6 Hipotezių tikrinimas

Susipažinsime su pagrindiniais principais ir sąvokomis hipotezėms tikrinti, kurie pateikti [6] knygoje.

Tarkim, kad turime binarinį statistinį eksperimentą

su imtimi

Xn G X. Iš anksto nėra žinoma, kuris tikrasis imties Xn skirstinys P^1 ar Pn

1.6.1 APIBRĖŽIMAS: Bet koks teiginys apie tikrąjį imties Xn skirstinį vadinamas hipoteze.
Kadangi mūsų atveju tėra dvi galimybės, tai tikriname tik dvi hipotezes:





1.6.2  APIBRĖŽIMAS: Hipotezė, sudaryta iš vienos galimybės (taško), vadinama
paprastąja.
Tokiu būdu mes sprendžiame dviejų paprastųjų hipotezių tikrinimo uždavinį.

1.6.3  APIBRĖŽIMAS: Hipotezių H01 ir Hn tikrinimo (nerandomizuotu) statistiniu
kriterijumi vadiname kiekvieną statistiką 6 = 6(Xn), įgyjančią dvi reikšmes 0 ir 1. Kada
6(Xn) įgyja reikšmę 0, tada hipotezė H
01 priimama (Hn atmetama), o kada įgyja reikšmę 1,
tada hipotezė     priimama, o     atmetama.
Akivaizdu, kad taip apibrėžtas statistinis kriterijus 6(Xn) padalija galimas X reikšmes X į dvi nesikertančias aibes X0 = X\VK, kur priimama hipotezė n (H{* atmetama), ir , kur priimama hipotezė      (    atmetama).

1.6.4  APIBRĖŽIMAS: Sritis w, kurioje priimama hipotezė Hį1 (atmetama H01),
vadinama kritine sritimi.
Kiekvienas statistinis kriterijus 6 = 6(Xn) gali būti išreikštas per W tokiu būdu:
Todėl kritinės srities W


( )


Taigi, hipotezė       atmetama, jei konkreti reikšmė                           . Todėl
nusakymas ekvivalentus kriterijaus  (   ) apibrėžimui.
Kriterijaus  (   ) (kritinės srities W) gerumą charakterizuoja skaičiai:
(8) = P0(8(Xn) = 1) = P0(Xn EW) = E08(Xn)
ax = ax(8) = P1(8(Xn) = 0) = Px(Xn W) = 1 - Px(Xn EW) = E±(l - 8(Xn)), čia Et - vidurkis pagal Pi.

1.6.5 APIBRĖŽIMAS: Skaičius a0 (atitinkamai ax), vadinamas kriterijaus 8 =
8(Xn)
1-osios (atitinkamai 2-osios) rūšies klaidos tikimybe, žymi tikimybę atmesti hipotezę
(atitinkamai    ), kada ji teisinga.
Kriterijus 8 = 8(Xn) bus tuo geresnis, kuo mažesnės jo abiejų rūšių klaidų tikimybės. Tačiau, jei stebėjimų Xn apimtis fiksuota, tada mes negalime valdyti abiejų rūšių klaidų tikimybių kartu. Vienu iš būdų gauname optimalų kriterijų, kai fiksavę vienos rūšies klaidos tikimybę minimizuojame kitą. Tuo tikslu įvedame kriterijų klasę:
Ka = {8 = 8(Xn):a0(8)<a},
kur      (    ) - duotas mažas skaičius, vadinamas kriterijaus   reikšmingumo lygmeniu.
1.6.6 APIBRĖŽIMAS: Kriterijus 80 E Ka vadinamas galingiausiu (klasėje Ka), jei su
visais


a1(80) < a1(8).

Tarkim skirstinių     ir     tankiai erdvėje (                          ) yra    ir    tam tikro mato   atžvilgiu,
t.y. su visais


Pi(®n)= \ Pi(x)diL(x),      i = 0,1. Jb


Jei funkcij a


(h) = P°{¥p)>-h)

tolydi h atžvilgiu, tai Neimano-Pirsono (maksimalaus tikėtinumo) kriterijus



( )

i(X") o(X") l(X")
)(X")


( )



su konstanta                  , tenkinančia sąlygą







yra galingiausias klasėje    .

2. PAGRINDINIAI REZULTATAI


2.1 Dviejų paprastų hipotezių asimptotinis atskyrimas

Tarkim, kad (Xn , 23n, , P?}), n > 0, - binarinė statistinių eksperimantų šeima su stebėjimais Xn E Xn , Hn ir H? - dvi paprastos hipotezės, reiškiančios, kad stebėjimai Xn turi tikimybinį matą P? ir P? atitinkamai. Be to, tegu S:(Xn,%>n) ([0, 1 ],B[0,1]) -statistinis kriterijus, kur 58[0,1] yra Borelio a-algebra. Tegu An - visuma tokių kriterijų. Apibrėžiame pirmos ir antros rūšies klaidų tikimybes:
( )     ( )        ( )    (    ( ))
čia    yra matematinis vidurkis mato                                  atžvilgiu.
2.1.1 APIBRĖŽIMAS: Kriterijus S0 E An vadinamas minimakso, jei
m ax{a0(S0),a^S0)} = minsEAnmax{a0(S ),a^S )}.

Tegu                             yra matas mačioje erdvėje (        ), toks, kad
. Pažymėkime


Hį(a) = EnQ(zn)a(zn)1 ~a, a E [0,1],


dpV-
čia zn = —n, i = 1,2, EQ - matematinis vidurkis mato Qn.
Priminsime sąlygas S:
(51)   tikimybiniai matai P? ir P? yra tarpusavyje ekvivalentus, t.y.       Pn , n E N;
(52)   egzistuoja riba \imn-nHn(a,P? P?) = c(a), a E [0,1] ;
(53)   funkcija c(a) diferencijuojama ir griežtai iškila intervale (0,1); (S4): egzistuoja konstanta, žymima I(P?, P?) > 0, tokia, kad


dPn        p n~1 ln—n(Xn) - I(p?, P£) < oo,kai n- o,



čia    žymi konvergavimą pagal tikimybę   .
2.1.2 TEOREMA: [5] Jei tenkinamos (S1)-(S3) sąlygos, tai

1
1 i m — i n f 1 n m ax { a 0( 5), a 1( 5)} = —/01 , ( 1 2 )
n->oo n 5eAn

čia 0 < /o 1 = — c( a 0 ) = — i n f0 < a < c( a), kur vadinama Černovo-Salichovo informacija [2], [11].


Vienas iš pagrindinių darbo rezultatų yra įrodyta tokia teorema:
2.1.3 TEOREMA: Tarkime, kad yra tenkinamos (S1) ir (S4) sąlygos. Tada


1 i m    įnf )n " !1na 0( 5) = — /( P0",P"), ( 1 3 )


čia   (    )                          ( )                                          - statistinių kriterijų klasė, su aprėžtomis antros
rūšies klaidos tikimybėmis.


ĮRODYMAS: Pagal pirmos rūšies klaidos tikimybės apibrėžimą turime


dPn                                                  (    ldPn      1
a0(5) = E"5(X") = E"5(X")^"(X") = E"5(X")exp{n ■ n^tf")). ( 14)


Kadangi, pagal (S4) sąlygą


dPn       p
n ~ 1/n^P°r(Xn)- —/( P0",P") < oo, n-oo,      ( 1 5 )


tai įvedus aplinką


(                       dPn                                                      1
tffon) = {X" :n " 1/n^(X») + /^P?) > —a).


Iš (  ) seka, kad


(      (   ))                                                            (   ) ( )
Pagal antros rūšies klaidos tikimybės apibrėžimą
( )    (   ( ))
Kadangi 8 G 5(b,n), tai
( )     (    ( ))                                             ( )                              ( )
Vadinasi, kai n > no iš ( 1 4) atsižvelgus į ( 1 5 ) ir ( 1 6 ) ir ( 1 7 ) gauname


ao(8) = E"8(X")exp{n-n^P"(X")j
> E "l(X G t/Gu,n))8(X") e xp { - n/( P", P") - nu} .
Iš čia,                     gauname
li m   įnf )n " !1 na o( 8) = - /( P",P").
"—oo SGį(f,")


Teorema įrodyta.

IŠVADOS:
1) Tarkime, kad X" = (X1 ,X2 ,. . .,Xn) - stebėjimai, kur (X1 ,X2 ,. . .,Xn) -nepriklausomi ir vienodai pasiskirstę atsitiktiniai dydžiai su skirstiniu . Tikriname dvi paprastas hipotezes:




Tada galioja teoremos rezultatas su Kulbako-Leibliero informacija:


+ 00
/(P",Po")=  I P i(x)1n^4dx<oo,
J                 Po(x)
— oo


jei matai     ir    turi tankius   ( ) ir   ( ) Lebego mato atžvilgiu.
PASTABA: Tokioje formoje, šis rezultatas buvo gautas įvairių autorių darbuose, pavyzdžiui: N.N. Čensovo [1].


Čia galima pastebėti, kad (S4) sąlyga, kai /( PO1, P^) < o° pagal didžiųjų skaičių dėsnį:







2) Tarkime, kad Xn = (XO ,X2 ,. . -,^n) - stebėjimai, atitinkantys Markovo grandinę
( )
                     su perėjimo tikimybių matrica


/Pll    Pl2             Plr\
pn =    p2 O    p22    " " "    p2r )

\Prl    Pr2    '"    Prr /
ir pradinėmis tikimybėmis


)
Tikriname dvi paprastas hipotezes:
H%:Pn = P£,   H?:Pn = P?, kur tikimybinius matus     ir     atitinka perėjimo tikimybių matricos


/Pll    P12    P13                 Plr\
Pll    p22    p23    "■    Plr
P(i) =      i        i        i                                 i
^     _    P\l    p32    p33                        p3r
(pr O    p r 2    pr 3    """    prr'


ir pradinės invariantinės tikimybės
( )

w

Dabar mūsų tikslas užrašyti atitinkamą tikimybinių matų Radono-Nikodino išvestinę
dPn
(X"). Kaip žinome iš (1.1.2) teoremos, ji turi pavidalą

dR"        pIpIpL-pI x
lll        0    (X") ln        1     Zfor x2x3      r xn-1xn   _
dR                           Px1 Px1x2 Px2x3 '"Pxn-1 xn
                       p°           ^  
_ ln     + ln P^- + ln p^3- +... + ln        _ ln ^-f + £ ln p^-.
Px1              Pxix2               Px2x3                      Pxn-1xn                Px1         '_2        Pxi-1xi

Pagal perėjimo tikimybės apibrėžimą, gautos sumos elementai tarpusavyje yra nepriklausomi, todėl


dPn
E" /n^P1"(Xn) = (n — 1)/(P0",P") + /^"P"). Čia Kulbako-Leibliero informacija pagal apibrėžimą yra

r    r                   ^
/(P0",P")=yypi/n^f, ( 1 s)




r(P0n,P")= > P^n,



P f=Pfc(Xi = 1 ),  t = 1,. . .r,      k = 0, 1 .

Vadinasi teoremos rezultatas galioja Markovo grandinei su r būsenų skaičiumi ir Kulbako-Leibliero informacija ( 1 8 ).

Komentarų nėra:

Rašyti komentarą