Skip to content

Lo Stoch è arricchito in Met?

Non smettere di condividere il nostro sito Web e i codici con gli altri, abbiamo bisogno del tuo aiuto per espandere la nostra comunità.

Soluzione:

Un modo per arricchire $mathsf{Stoch}$ potrebbe essere il seguente.

Sia $X$ sia uno spazio misurabile e sia $PX$ sia lo spazio delle misure di probabilità su $X$. Possiamo equipaggiare $PX$ con la distanza variazionale totale, che è data dalle seguenti forme equivalenti.
$$
d(p,q) ;=; sup_{Asubseteq X} |p(A) - q(A)| ;=; sup_{f:Xto[0,1]} left| int_X f, dp - int_X f; dq right| .
$$

Sopra, e in ciò che segue, i sottoinsiemi $A{subseteq X$ e le funzioni $f:XtoBbb{R}$ sono assunte come misurabili.

Ora, prima di tutto, lasciamo che $f:X ´a Y$ sia una funzione misurabile (deterministica).
Denotiamo con $f_*:PXa PY$ il pushforward delle misure (per i teorici delle categorie, l'azione del funtore $P$ sui morfismi).
Si ha
begin{align*}
d( f_*p, f_*q ) ;&=; sup_{Bsubseteq Y} |f_*p(B) - f_*q(B)| \\code(0144)\code(0144)\code(0144)}
;&=; sup_{Bsubseteq Y} |p(f^{-1}(B)) - q(f^{-1}(B))| \code(0144)}
;≤ sup_{Asubseteq X} |p(A) - q(A)| \code(0144)}
;&=; d( p, q ) ,
fine{align*}

il che significa che $f_*:PXa PY$ è l'abbreviazione della metrica appena definita. Questo sarà utile in seguito.

Possiamo ora equiparare gli insiemi $Mathsf{Stoch}(X,Y)$ con il "prodotto" o "$L^infty$" indotto dalla costruzione metrica su $PY$, come segue. Utilizziamo la seguente notazione: una mappa stocastica $k:X a PY$ valutata in un punto $x in X$ dà la misura $k_x_in PY$. Ora per le mappe stocastiche $k,h:X´in PY$, impostiamo
$$
d(k,h) ;=; sup_{xin X} dbig( k_x, h_y big) .
$$

Questo numero è limitato da $1$. (Grazie a Martin Hairer per averlo fatto notare, si vedano i commenti).

Dobbiamo ora dimostrare che la composizione (Kleisli) di $mathsf{Stoch}$ è breve. Dato $h:X ´a PY$ e $l: Y ´a PZ$, la loro composizione Kleisli, che denotiamo con $lh$ è data dalla formula di Chapman-Kolmogorov. Esplicitamente, per ogni misurabile $C subseteq Z$, si ha
$$
lh_x(C) ;=; int_{PZ} q(C) ,d(l_*h_x)(q) ;=; int_{Y} l_y(C) ,dh_x(y) .
$$

Ora, per vedere che la postcomposizione è breve, lasciamo che $h,k:X ´a PY$ e $l: Y a PZ$. Abbiamo
begin{align*}
d( lh, lk ) ;&=; sup_{xin X} sup_{Csubseteq Z} | lh_x(C) - lk_x(C) | ´
;&=; sup_{xin X} sup_{Csubseteq Z} left| int_{PZ} q(C) ,d(l_*h_x)(q) - int_{PZ} q(C) ,d(l_*k_x)(q) right| \
´;≤ ´sup_{x_in X} d_big( l_*h_x , l_*k_x big) \
code(01); sup_{xin X} d( h_x , k_x ) \}
code(01)code(01)´; d( h, k ) .
fine{align*}

(Abbiamo usato il fatto che la mappa di valutazione $PX a Bbb{R}$ data da $pmappa a p(A)$ per un insieme misurabile $A´sottoinsiemeq X$ è misurabile per l'insieme $sigma$-su $PX$ nella costruzione della monade di Giry).

Per vedere che la precomposizione è breve, si consideri anche $g: W in PX$. Allora
begin{align*}
d( hg, kg ) ;&=; sup_{w in W} sup_{Bsubseteq Y} | hg_w(B) - kg_w(B) | ´
;&=; sup_{w in W} sup_{Bsubseteq Y} left| int_{X} h_x(B) ,dg_w(x) - int_{X} k_x(B) ,dg_w(x) right| \
´;&´le´; ´sup_{w_in W} ´int_{X} ´sup_{B_subseteq Y} | h_x(B) - k_x(B) | ,d(g_w)(x) \
;&=; sup_{w in W} ´int_{X} d( h_x, k_x ) ,d(g_w)(x) \}
;≤ d( h_x, k_x ) .
fine{align*}

Consideriamo ora l'insieme $mathsf{Stoch}(X,Y)timesmathsf{Stoch}(Y,Z)$. Possiamo dotarlo della metrica
$$
d big( (h_1,l_1), (h_2,l_2) big) ;=; max{ d(h_1,h_2), d(l_1,l_2) },
$$

che corrisponde alla metrica del prodotto cartesiano (categorico) di $$ o con la metrica
$$
d big( (h_1,l_1), (h_2,l_2) big) ;=; d(h_1,h_2) + d(l_1,l_2) ,
$$

che è la metrica del prodotto monoidale chiuso di $$ $mathsf{Met}$ come an (cioè inibendo un'adjunzione omotensiva).

Per entrambe le scelte, la mappa $circ: mathsf{Stoch}(X,Y)timesmathsf{Stoch}(Y,Z) to a mathsf{Stoch}(X,Z)$ data dalla composizione è breve.
Si ottiene così l'arricchimento desiderato.

A proposito, se vogliamo parlare di diagrammi "commutativi" fino a $varepsilon$", allora per definizione della metrica, $varepsilon$ deve essere un uniforme vincolato. Ad esempio, per il diagramma
$Requisito{AMScd}$begin{CD}
A @>f> B
@V m V V @VV n V
C @>g> D
fine{CD}

per commutare fino a $varepsilon$, nel senso che $d(ncirc f,gcirc m)´ltvarepsilon$, è necessario che
$$
´sup_{a´ in A} d'big(n(f(a)),g(m(a))´big) ´;´lt´;´varepsilon,
$$

dove la distanza di cui sopra è quella di $D$. Perché ciò avvenga, $varepsilon$ deve essere indipendente da $a$, che è una condizione piuttosto forte nella pratica (se $A$ non è compatto).

Un modo noioso è quello di impostare $d(f,g)=1$ se $f$ e $g$ sono diversi.

Un modo leggermente meno noioso è quello di prendere $d(f,g)$ sia la suprema su $x$ della probabilità che due variabili indipendenti con leggi $f(x)$ e $g(x)$ differiscono. Funzioni diverse possono quindi avere una piccola distanza se la loro immagine consiste in distribuzioni con atomi.

Se si è disposti a lavorare con spazi metrici generalizzati, la risposta è sì. $Mathsf{Stoch}$ è arricchita sulla categoria degli spazi convessi, che a sua volta è arricchita su $V$-poiché esiste un funtore chiuso dagli spazi convessi a $V$-cat, dove $V=([0,infty], ge)$ è l'SMCC i cui oggetti possono essere visti come spazi metrici generalizzati e le frecce come mappe brevi. Tutto ciò deriva dalla tesi di Meng, proposizione 5. (Disponibile su nLab)

In realtà si può dire qualcosa di più notando che $mathsf{Stoch}$ è arricchito sulla categoria degli spazi superconvessi, che differisce dagli spazi convessi in quanto si considerano somme contate di uno, piuttosto che somme finite, e richiede che i morfismi conservino le somme contate. (La prova dell'arricchimento su spazi superconvessi è essenzialmente identica a quella di Meng). Il vantaggio di lavorare con spazi superconvessi (coseparati) è che si tratta di una soluzione $*$-categoria autonoma.

Puoi aiutarci la nostra occupazione impostando un commento e valorizzandolo, ti ringraziamo.



Utilizzate il nostro motore di ricerca

Ricerca
Generic filters

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.