Skip to content

Incoerenza con le derivate parziali come vettori base?

Dopo aver cercato in diversi repository e pagine, abbiamo finalmente trovato la risposta che ti mostreremo qui.

Soluzione:

Alzare e abbassare gli indici in un vettore non è un'operazione valida. I vettori base non fanno eccezione. Mentre $x_mu=g_{munu}x^nu$ è un'operazione valida, $hat e^mu=g^{munu}hat e_nu$ non lo è. Il motivo è che nel primo caso si ha a che fare con l'operazione componenti di un vettore, mentre nel secondo caso si tratta di un vettore stesso.

Mi spiego meglio. Dato un vettore $che X$
$$
hat X=x^muhat e_mu
$$
è possibile abbassare l'indice $mu$ in $x^mu$ attraverso
$$
x_muequiv g_{munu}x^nu
$$

Vale a dire: l'innalzamento e l'abbassamento degli indici è un'operazione definita per le componenti di un vettore (o di un covettore).

L'indice $mu$ in $hat e_mu$ non è un indice vettoriale, ma etichetta semplicemente i diversi vettori base. Non è possibile aumentare o diminuire questo indice, perché $hat e_mu$ non denota le componenti di alcun vettore. L'operazione
$$
phantom{color{red}{text{NO!}}}qquadhat e^muequiv g^{munu}hat e_nuqquadcolor{red}{text{NO!}}
$$
è un'operazione priva di significato.

La stessa cosa si può dire dei covettori. Dato un covettore $milite X$
$$
tilde X=x_mutilde e^mu
$$
è possibile aumentare l'indice in $x_mu$. Ma non si può abbassare l'indice di $tilde e^mu$, perché questo indice non denota le componenti di un covettore, ma etichetta solo i diversi covettori base.

Ma soprattutto, mentre $hat e_mu$ è una base dello spazio dei vettori e $tilde e^mu$ è una base dello spazio dei covettori, questi oggetti sono non correlati attraverso
$$
phantom{color{red}{text{NO!}}}qquadhat e^mu= g^{munu}tilde e_nuqquadcolor{red}{text{NO!}}
$$
o qualsiasi altra relazione simile.

In breve: si possono alzare/abbassare gli indici quando questi indici denotano le componenti di un oggetto - sia esso un vettore o un covettore - ma non si possono alzare/abbassare gli indici delle basi di vettori/covettori, perché questi indici non denotano le componenti di nulla. Sono solo etichette.

Tuttavia, si veda l'isomorfismo musicale.

Spero che a questo punto siate ancora con me. Dato un vettore arbitrario $$hat v$ (come $$hat X$ o $$hat e_mu$), e una certa funzione $$f$, possiamo definire l'azione di $$hat v$ su $$f$ come segue: definiamo
$$
hat e_mu[f]equiv frac{parziale f}{parziale x^mu}inmathbb R
$$
ed estendiamo questo attraverso la linearità: se $$ v=v^mu hat e_mu$, allora
$$
hat v[f]=v^mufrac{parziale f}{parziale x^mu}inmathbb R
$$

Non mi soffermerò sul perché questa nuova operazione sia utile. Ma permettetemi di sottolineare che questa operazione è qualcosa di nuovo, qualcosa che forse non avete mai visto prima: ora i vettori possono agire sulle funzioni! In ogni caso, utile o meno che sia, questa nuova operazione ci spinge a prendere in considerazione la seguente comoda notazione: scriveremo $$hat partial_mu$ invece di $$hat e_mu$:
$$
hat partial_muequiv hat e_mu
$$

In questo modo, la nostra equazione di prima diventa
$$
hatparziale_mu[f]=frac{parziale f}{parziale x^mu}
$$

Si noti che stiamo usando lo stesso simbolo, $parziale$, con due significati diversi: da un lato, denota un vettore base, e dall'altro, denota una derivata parziale. Di solito non si fa distinzione: si scrive semplicemente $parziale_mu$ per entrambi e si lascia che sia il contesto a decidere il significato del simbolo.

Allo stesso modo, di solito usiamo il simbolo $mathrm dx^muequivtilde e^mu$. Cioè, denotiamo la base dei covettori con il simbolo $mathrm dx^mu$. È solo una notazione.

Passiamo ora al gradiente. Definiamo il covettore $mathrm d f$ come il covettore che ha come componenti $frac{parziale f}{parziale x^mu}$:
$$
mathrm d f=frac{partial f}{partial x^mu}tilde e^mu
$$
oppure, usando la nostra nuova notazione,
$$
mathrm d f=parziale_di_mu f,mathrm dx^mu
$$

È possibile alzare e abbassare l'indice $mu$ in $frac{parziale f}{parziale x^mu}$, perché questo indice denota le componenti di un covettore. In questo senso, si può dire che si può alzare/abbassare l'indice di $mu$ in $partial_mu$, quando questo simbolo denota una derivata. Ma non si può alzare/abbassare l'indice di $mu$ in $partial_mu$, quando questo simbolo denota un vettore base (per lo stesso motivo per cui non si può alzare/abbassare l'indice di $mu$ in $partial_mu$).

In breve: gli oggetti $partial_mu$ e $mathrm dx^mu$ sostituiscono le vecchie notazioni $hat e_mu$ e $tilde e^mu$, ma denotano esattamente lo stesso oggetto: sono una base per lo spazio dei vettori e dei covettori. Ciò significa che non è possibile aumentare o diminuire i loro indici. D'altra parte, l'oggetto $partial_mu f$ denota le componenti del covettore $mathrm df$ e, come tale, è possibile alzare/abbassare il suo indice.

Per capire cosa succede quando alziamo o abbassiamo gli indici, dobbiamo vedere quali sono effettivamente gli oggetti su cui stiamo operando.

TL;DR - Si alzano (abbassano) le componenti dei vettori (vettori doppi), non la loro base.

Per capire perché le derivate vengono usate come base, usiamo la seguente motivazione:
Immaginiamo una curva da qualche parte in $Mathbf{R}^3$. La curva avrà un vettore tangente in ogni suo punto. Se denotiamo la curva come $r(lambda)$ (una funzione), con $lambda$ come parametro della curva, il vettore tangente sarà $mathbf{t} = frac{dmathbf{r}(lambda)}{dlambda} = sumfrac{dx^i}{dlambda}{hat{x}^i$.
Ora conosciamo la "velocità e la direzione di cambiamento" della curva in un punto $r(lambda)$.
Abbiamo ottenuto un vettore, che vorremmo utilizzare per descrivere altre cose che accadono su quel manifold.

La domanda successiva che ci poniamo è: qual è il tasso di variazione di un altro oggetto nella direzione del primo vettore? Bene, siamo ancora in $mathbf{R}^3$, quindi sappiamo come trovare questi "tassi di cambiamento" - l'operatore nabla $nabla = frac{partial}{partial x} hat{x} + frac{partial}{partial y} hat{y} + frac{parziale}{parziale z} hat{z}$. Per trovare il tasso di variazione nella direzione del vettore precedentemente acquisito, proiettiamo la $nabla$ sulla $mathbf{t}$

$$mathbf{t}nabla = sum frac{dx^i}{dlambda}frac{partial}{partial x^i}$ Qui vediamo che usando i vettori tangenti possiamo sondare e ottenere informazioni sui tassi di cambiamento degli oggetti in determinate direzioni.

Ora, se usiamo questa motivazione, cioè che i vettori, agendo su alcuni oggetti, ci danno informazioni su una certa velocità di cambiamento, possiamo costruire una base per i vettori tangenti su $mathbf{R}^3$ che è ${{ frac{partial}{partial x} , frac{partial}{partial y}, frac{partial}{partial z} }$

Si può dimostrare che una base di questo tipo può essere costruita su ogni punto di un manifold generale, con la scrittura abbreviata di ${partial_muequivfrac{partial}{partial x^mu}}$.

I vettori sono stati costruiti come oggetti che agiscono sulle funzioni, ed esistono anche oggetti che agiscono sui vettori e li inviano ai numeri reali, chiamati vettori duali. Anche in questo caso, basandoci su $mathbf{R}^3$, possiamo costruire una base per questi vettori duali, e denotiamo questa base come $${ dx^mu}$, dove questa base è definita da come agisce sulla base vettoriale: $$dx^mu(partial_nu) = delta^mu_nu$$

Ora arriva uno dei punti chiave in cui si è verificato l'errore: abbiamo definito una base per i vettori, e un vettore è un oggetto come $u = u^muparziale_mu$. Per esempio, possiamo costruire un vettore $v=1cdotpartial_1$. Quindi, qui il numero 1 è una componente del vettore, mentre $parziale_1$ è la componente di una base. Ad esempio, un vettore duale si scrive come $omega = omega_nu dx^nu$.

I vettori e i vettori duali hanno una relazione speciale: un vettore duale $omega$ agisce su un vettore $v$ e lo invia a un numero reale.
Possiamo esprimerlo usando le loro basi.
$$omega(v) = omega_mu dx^mu v^nuparziale_nu = omega_mu v^nu dx^muparziale_nu = omega_mu v^nudelta^mu_nu = omega_mu v^mu$$$

Ora arriviamo alla tensore metrico. Un tensore è un oggetto che agisce su un certo numero di vettori e vettori doppi, a seconda del tipo di tensore. Un tensore metrico è un tensore che agisce su due vettori.

Possiamo scrivere il tensore metrico utilizzando le basi precedentemente definite come:
$$g = g_{munu}dx^mu otimes dx^nu$$$.
L'azione di un tensore metrico consiste nel prendere in ingresso due vettori e nel restituire un numero reale. Scritto completamente in una base questo è:
$$g(u, v) = g_{munu}dx^mu(u^alfa partial_alfa) ´otimes dx^nu (v^beta partial_beta)$$
$$g(u, v) = g_{munu}u^alpha v^beta dx^mu (parziale_alfa) dx^nu(parziale_beta)$$
$$g(u, v) = g_{munu}u^alpha v^beta delta^mu_alpha delta^nu_beta = g_{munu}u^mu v^nu$$$

Questa operazione ha una notazione abbreviata
$$g_{munu}u^mu v^nu = u_nu v^nu$$$
e solo qui avviene l'abbassamento e l'innalzamento. Questo può anche essere formalmente ben definito dicendo che la metrica induce un isomorfismo naturale tra vettori e vettori duali.

Quindi, quando si abbassano gli indici, si deve agire solo sulle componenti dei vettori, non sulla base; allo stesso modo, quando si alzano gli indici si deve agire solo sulle componenti dei vettori duali, non sulla loro base.

Per un buon riferimento, consiglio "An introduction to manifolds" di Loring W. Tu

Credo che la vostra fonte di confusione stia confondendo l'uso degli indici di enumerazione per i vettori base e l'uso degli indici vettoriali per le componenti di un vettore. Questi due tipi di indici devono essere trattati in modo diverso. Prima dirò che cosa intendo con i due tipi di indici, poi dirò come devono essere trattati in modo diverso.

Il primo tipo di indice è un indice di enumerazione per la base. Supponiamo di avere uno spazio vettoriale di $n$ dimensioni e di scegliere una base. I vettori base possono essere scritti come
$$hat{e}_mu,quad mu = 1,2,3,cdots,n.$$
In questo caso, l'indice $mu$ è un indice di enumerazione usato solo per elencare i vettori base.

Ora un vettore $v$ può essere scritto utilizzando le coordinate rispetto a questa base. In questo caso scriveremmo $v=v^mu hat{e}_mu$. In questo caso, l'$mu$ in $v^mu$ è un indice vettoriale. La differenza è che per ogni valore di $mu$, $v^mu$ è solo un numero dove $hat{e}_mu$ era un vettore. Inoltre, se cambiamo base con una nuova base $hat{tilde{e}}_mu$, correlata alla base originale $hat{e}_mu$ da
$$hat{tilde{e}}_nu = R_nu{}^mu hat{e}_mu, $$
allora le coordinate ${tilde{v}^nu$ di $v$ rispetto alla nuova base $hat{tilde{e}}_nu$ sono legate alle vecchie coordinate $v^mu$ rispetto alla vecchia base $hat{e}_mu$ da
$$tilde{v}^nu = R^{-1}{}^nu{}_mu v^mu.$$

Credo di aver già spiegato come questi due tipi di indici debbano essere trattati in modo diverso. Uno enumera un insieme di vettori, l'altro enumera un insieme di coordinate di numeri reali che si trasformano sotto trasformazioni di coordinate.

Supponiamo ora di avere un prodotto interno con coordinate $g_{munu}$. Allora, per qualsiasi base $hat{e}_mu$, si può ottenere una base duale $hat{e}^mu$ per lo spazio dei covettori, soddisfacente
$$hat{e}^mu(hat{e}_nu) = delta^mu{}_nu.$$

Ora, dato un qualsiasi vettore $v$, è possibile associare ad esso un vettore duale $v'$, dove questo vettore duale $v'$ agisce sui vettori $w$ prendendo il prodotto interno con esso $angolo v, w rangolo$. Per ottenere le coordinate di questo prodotto duale $v'$, possiamo scrivere nella forma $v' = v'_mu hat{e}^mu$. Troviamo che
$$ v^mu g_{mu nu} = langolo v, hat{e}_nu rangle = langolo v'_mu hat{e}^mu, hat{e}_nu rangle = v'_mulangolo hat{e}^mu, hat{e}_nu rangle = v'_mudelta^mu{}_nu = v'_nu. $$
Pertanto troviamo che se $v^mu$ sono le coordinate di un vettore rispetto a una base, allora le coordinate $v'_mu$ del vettore duale $v'$ rispetto alla base duale sono date da $v'_nu = v^mu g_{mu nu}$. In questo senso, è possibile utilizzare la metrica per elevare gli indici delle coordinate. Questo è possibile perché ogni coordinata è un numero reale e quando si prendono combinazioni lineari di numeri reali, si ottiene un altro numero reale.

D'altra parte, non si può dire che $$ $hat{e}_nu = hat{e}^mu g_{mu nu}$, perché la parte destra è un vettore e la parte sinistra è una combinazione lineare di covettori, che dà un altro covettore, ma covettori e vettori sono tipi diversi di oggetti, quindi non possono essere uguali.

Penso che questo dovrebbe rispondere alle prime due domande. Non conosco la risposta alla terza domanda, se non per dire che il modo più semplice di definire lo spazio tangente è in termini di operatori derivativi e le derivate parziali rispetto alle coordinate costituiscono una base naturale.

Se capisci che il nostro post ti è stato utile, ti saremmo grati se lo condividessi con il resto degli sviluppatori in questo modo ci aiuti a diffondere i nostri contenuti.



Utilizzate il nostro motore di ricerca

Ricerca
Generic filters

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.