Che materia stai cercando?

Teoria della relatività speciale

Dispense di Fisica matematica del prof. Moretti sulla teoria della relatività speciale, spiegazione della teoria della relatività generale, costanza della velocità della luce, postulati fondamentali della relatività speciale, gruppi di Lorentz e gruppi di Poincare, lo spaziotempo... Vedi di più

Esame di Fisica matematica docente Prof. V. Moretti

Anteprima

ESTRATTO DOCUMENTO

4.3.1 Contrazione dei Volumi.

Assumiamo che Ω sia una sottovarietà tridimensionale che indicheremo con V con misura (vo-

0 0

lume) finita. Confronteremo i volumi di V , vol(V ) con quello di V , vol(V ) riferiti alle metriche

spaziali dei corrispettivi riferimenti inerziali.

A tal fine si ha Z

0 1 2 3

p 0

vol(V ) = detg dy dy dy

D

0 0

dove g è la matrice di coefficienti g , mentre

αβ Z 1 2 3

vol(V ) = dx dx dx

D

F

dato che la metrica spaziale di nelle coordinate minkowskiane è rappresentata da g =

αβ

√ 1 2 3 α α

0

detg è una costante nelle coordinate y , y , y e ancora y = x su D.

δ . Per costruzione

αβ

Concludiamo che 0 p 0

vol(V ) = detg vol(V ) .

×

Lemma 4.1. Se A è una matrice complessa n n di coefficienti A = δ + C C , vale

α

αβ αβ β

n

X 2

det A = 1 + C .

α

α=1

Dimostrazione. Vale ···α

α · · ·

n A

det A = A ,

1 1α nα

n

1 ···α

α ±1 · · ·

dove è la densità tensoriale di Ricci-Levi-Civita [1] e vale = se α α è una

n

1 1 n

± −

permutazione di 1, . . . , n ed il segno è dato dalla parità della permutazione: se la permu-

···α

α · · ·

tazione è dispari, mentre + se la permutazione è pari. Infine = 0 se α α non è una

n

1 1 n

permutazione di 1, . . . , n.

In altre parole ···α

α

· · · · · · · · · · · ·

n

det A = δ δ + C C δ δ + + δ δ C C ,

1 1α nα 1 α 2α nα 1α n−1α n α

n n n

1 1 2 1 n−1

tutti gli altri termini forniscono contributo nullo perché sono del tipo

···α ···α ···α ···α ···α ···α

α α

· · · · · · · · ·

· · · · · · · · ·

n n

C C

C C C C

= C C

1 1

k h h k

α α α α

k h h k

k h h k

e ···α ···α ···α ···α ···α ···α

α α

n n

= .

1 1

k h h k

Ma ···α

α

· · · · · · · · · · · ·

n

δ δ + C C δ δ + + δ δ C C ,

1 1α nα 1 α 2α nα 1α n−1α n α

n n n

1 1 2 1 n−1

74

vale proprio n

X

1···n 1···n 2 1···n 2 2

···

+ C + + C =1+ C .

1 n α

α=1

2

Nel caso in esame applicando, il lemma con 0

Λ α

C = i

α 0

Λ 0

si ottiene ‚ Œ 2

2 v

0

Λ F 0

|F

α

0 X

− −

det g = 1 =1 .

0 2

Λ c

0

α

Concludiamo che vale la formula di contrazione relativistica dei volumi:

Ê 2

v

0 −

vol(V ) = vol(V ) , (4.21)

1 2

c 0

dove vol(V ) è valutato in quiete con l’insieme di punti materiali V , mentre vol(V ) è il volume

dello stesso insieme di punti materiali valutato in un riferimento inerziale in cui i punti materiali

sono visti muoversi con la stessa velocità costante di modulo v.

4.3.2 Contrazione delle lunghezze.

Passiamo a considerare il caso in cui Ω sia un varietà unidimensionale, che indicheremo con,

Γ, come per esempio un segmento, con misura (lunghezza) finita. Vogliamo ora confrontare le

0

lunghezze `(Γ) e `(Γ ). α α

3 7→ 7→

Possiamo parametrizzare Γ come [a, b] u Γ(u), cioè in coordinate x , u x (u) e la sua

lunghezza sarà data da Ì  ‹

3 2

b α

dx

Z X

`(Γ) = du ,

du

a α=1 F

dove abbiamo usato il fatto che la metrica spaziale di nelle coordinate dette è banalmente

F

0 0 α α

g = δ . Similmente se g data da (4.20)è la metrica spaziale di nelle coordinate y = x

αβ αβ αβ Ê

si ha b α β

dx dx

Z

0 0

) =

`(Γ g du .

αβ du du

a

Sopra  ‹

3 3

2

α β α α α β

β

dx dx

dx dx Λ dx Λ

0 0

0 X X

g = .

αβ 0 0

du du du du Λ du Λ

0 0

α=1 α,β=1

75

Questo può essere riscritto: ‚ Œ

 ‹ 2

α

3 3

2 v

β

α α α

dx

dx dx dx F 0 |F

0 X X

g = .

αβ du du du du c

α=1 α=1

e quindi Ì ‚ Œ

 ‹ 2

α

3 3 v

2

b α α

dx dx

Z F 0 |F

0 X X

`(Γ ) = du .

du du c

a α=1 α=1

Nel caso la curva sia un segmento, lo possiamo sempre parametrizzare come

α α α

x (u) = x + u`(Γ)n ,

0 F

α

dove u [0, 1] e n sono le componenti di un versore nello spazio di quiete considerato per .

In tal caso otteniamo subito: s 2

·

(n v)

0 − , (4.22)

`(Γ ) = `(Γ) 1 2

c F

·

dove v := v e indica il prodotto scalare associato alla metrica spaziale di . Ci sono due

F 0 |F

situazioni interessanti in cui la formula di sopra si applica:

(a) Γ è un segmento perpendicolare a v . In tal caso il secondo addendo sotto il segno di

F 0 |F

radice si annulla e troviamo 0

`(Γ ) = `(Γ) .

(b) Γ è un segmento parallelo a v . In tal caso troviamo subito la formula della

F 0 |F

contrazione relativistica delle lunghezze o formula della contrazione di Lorentz

Ê 2

v

0 −

`(Γ ) = `(Γ) (4.23)

1 2

c

dove `(Γ) è valutata in quiete con l’insieme di punti materiali formanti il segmento Γ, mentre

0

`(Γ ) è la lunghezza dello stesso insieme di punti materiali valutato in un riferimento inerziale

in cui i punti materiali sono visti muoversi con la stessa velocità costante di modulo v nella

direzione stessa del segmento.

Nota 4.4. Ci si può chiedere se la contrazione di cui sopra si veda in senso proprio. Questa è

una domanda complessa che implica nozioni di ottica relativistica. Diciamo solo che la cosa non

è ovvia. Per esempio si può mostrare che una sorgente luminosa sferica in moto non viene vista

contratta nella direzione del moto, ma si osserva una contrazione uniforme.

In ogni caso la contrazione di Lorentz è un fenomeno reale indipendentemente dal fatto di ciò

che si osservi o meno. Per esempio, un’automobile di lunghezza L misurata in quiete, può es-

0

sere tutta contenuta per breve tempo in un garage di lunghezza L /2 con due porte (di entrata

0

e di uscita lungo il moto dell’auto) che si chiudono e si riaprono contemporaneamente e molto

76

velocemente, purchè la velocità dell’auto rispetto al garage sia tanto sostenuta che la contrazione

0

di Lorentz ne riduca la lunghezza a L < L /2.

0

Esercizi 4.2.

1. In riferimento all’osservazione di sopra, si supponga che la velocità costante dell’auto

rispetto al garage sia tale che la lunghezza dell’auto nel riferimento del garage sia esattamente

L /2. Si supponga che le porte del garage di spessore nullo si aprano e si chiudano contempo-

0

raneamente ed istantaneamente. Esattamente quando tutta l’auto si trova a passare nel garage,

per un solo istante l’auto viene chiusa nel garage dalle due porte, che poi si riaprono lasciando

l’auto uscire dal garage senza incidenti.

Si consideri ora la descrizione del fenomeno data dal guidatore dell’auto. Per lui il garage do-

vrà avere una lunghezza sicuramente inferiore a L /2 per la contrazione di Lorentz. Come è

0

possibile, a giudizio del guidatore, che l’auto venga chiusa nel garage sia pure per un istante?

2. Nell’esperimento ideale di sopra si supponga che invece della seconda porta, a parità di

tutte le altre condizioni, ci sia un muro impenetrabile e che l’auto sia fatta di materiale fragilissi-

mo. Un osservatore in quiete con il garage vedrà la porta (l’unica rimasta) chiudersi dietro l’auto

incolume un istante prima che essa si schianti contro il muro. Tenendo chiusa la porta, supposta

impenetrabile, tutti i pezzi dell’auto rimangono nel garage. Per il guidatore invece ciò non può

accadere essendo il garage troppo corto: la porta dovrebbe abbattersi per ”tagliare” parte del-

l’auto prima che la punta si schianti contro il muro. Come mettere d’accordo i due punti di vista?

4.3.3 Deformazione degli angoli.

L’equazione (4.20) permette di confrontare anche le deformazioni cinematiche degli angoli. Con-

7→ 7→ ∈

sideriamo due sottovarietà Ω date da due segmenti Γ : u O+un e Γ : u O+un , u [0, 1]

1 1 2 2

uscenti dallo stesso punto O, con versori tangenti n e n e sia θ l’angolo (acuto) tra tali seg-

1 2

β 0 0

α . Le corrispondenti sottovarietà Γ e Γ , avranno vettori

menti. Ovviamente cos θ = δ n n

αβ 1 2

1 2

0 0 0 1 2 3

tangenti n e n formanti un angolo θ , che nelle coordinate y , y , y hanno le stesse componenti

1 2

β

α

n e η (ma non saranno più versori!). Avremo che, in virtù di (4.20) e con le stesse notazioni

1 2 · ·

(n v)(n v)

1 2

0 0 0

|n ||n | · −

cos θ = n n .

1 2

1 2 2

c

0 0

|n |, |n |

I moduli non sono altro che le norme dei vettori calcolate con la metrica spaziale di

1 2

F 0 . La struttura affine identifica i moduli di tali vettori con le lunghezze di corrispondenti

segmenti. Possiamo quindi usare (4.22) per valutare questi moduli ottenendo la formula della

deformazione relativistica degli angoli: ·v)(n ·v)

(n

1 2

cos θ 2

É

0 c

cos θ = , (4.24)

2 2

·v) ·v)

(n (n

1 2

− −

1 1

2 2

c c

77

dove, lo ricordiamo v = v .

F 0 |F 0

6

Nota 4.5. In generale risulterà θ = θ . Tuttavia ci sono alcuni casi notevoli in cui sussiste

±1),

l’uguaglianza. (1) se n e n sono paralleli (cos θ = e quindi il concetto di parallelismo

1 2

è invariante al variare del riferimento inerziale quando sussista nel riferimento di quiete con

l’angolo. (2) oppure se ciascuno dei due vettori n , n è o parallelo o ortogonale a v . In

F 0

1 2 |F

particolare la condizione di ortogonalità non è preservata al variare del riferimento.

78

Capitolo 5

Dinamica in Relatività Speciale:

covarianza delle leggi fisiche ed

equazioni della dinamica.

Ci occuperemo ora della formulazione della dinamica nella teoria della relatività speciale. Avre-

mo due principi guida. In realtà useremo diverse altre ipotesi ad hoc strada facendo. In ogni

caso ci sono, come detto due grandi principi guida.

Uno è il principio di relatività:

RS3. Principio di Relatività. Le leggi della fisica assumono la stessa forma in ogni sistema

di riferimento inerziale.

In meccanica classica l’analogo principio ristretto alla meccanica veniva tradotto in termini

matematici richiedendo l’invarianza della forma delle leggi della meccanica quando scritte in

coordinate cartesiane solidali con ogni sistema di riferimento inerziale. Un modo (ma non l’uni-

co) di esprimere il principio di relatività è quello di richiedere che le leggi fisiche siano descritte

in termini di tensori (più in generale campi tensoriali). In tal modo, in componenti e rispetto

a coordinate minkowskiane associate ad ogni riferimento inerziale, la forma delle leggi fisiche è

preservata. Questo principio, che una versione più precisa di RS3, cade sotto il nome di Prin-

cipio di Covarianza. Esso afferma che le leggi fisiche hanno forma invariante sotto l’azione del

1

gruppo di Poincaré ortocrono . Si osservi che esistono formulazioni equivalenti della relatività

che non sono formulate in termini di tensori e che preservano la forma delle leggi fisiche al variare

1 Più precisamente si è visto sperimentalmente negli anni ’50 che il gruppo ortocrono contiene trasformazioni

(inversioni di parità) che non lasciano invariata la forma delle leggi fisiche: le leggi fisiche sono in realtà invarianti

sotto l’azione del sottogruppo di Poincaré ortocrono proprio che introdurremo più avanti. Esiste un teorema della

teoria quantistica relativistica che afferma che oltre all’invarianza sotto l’azione del gruppo ortocrono proprio,

sussiste anche l’invarianza sotto l’azione combinata di inversione del tempo T , inversione di parità P e coniugazione

di carica C (operazione che consiste nello scambiare il segno di tutte le cariche elettriche). Tale teorema cade

sotto il nome di teorema P CT (vedi per es [22]). 79

del riferimento inerziale, per esempio la formulazione hamiltoniana.

Il secondo pricipio di cui faremo uso è il

Principio di corrispondenza. Le leggi della meccanica in relatività si devono ridurre a quelle

della meccanica classica nel limite di piccole velocità.

5.1 Nozione di massa, quadriforza e quadrimpulso per punti

materiali.

In base al principio di corrispondenza sopra citato, la definizione della massa di un punto ma-

teriale può ancora essere data assumendo la validità della legge di conservazione dell’impulso

totale di un sistema di punti materiali nel limite di velocità piccole rispetto a quelle della luce:

le masse sono definite da rapporti di velocità una volta scelta la massa unitaria. Non è impor-

tante il valore di tali velocità che possono essere piccole a piacere purché non tutte nulle. Si

osservi ancora che dal punto di vista fisico possiamo controllare le condizioni iniziali assumendo

le velocità iniziali piccole a piacere, lavorando con intervalli di tempo sufficientemente piccoli

tali velocità rimarranno piccole.

Nota 5.1. In realtà, con questo approccio ci sono dei problemi (già presenti classicamente)

quando si tenta di definire la massa di una particella carica, in quanto è ben noto che le par-

ticelle cariche emettono onde elettromagnetiche nel momento in cui sono accelerate (anche se

la velocità è nulla) e l’onda elettromagnetica sottrae impulso al sistema. Noi ignoreremo tale

problema pensando di lavorare con particelle prive di carica.

Definizione 5.1. (Punto materiale o particella.) Un punto materiale o particella è

4 3 7→

dato tramite l’assegnazione di una linea di universo in , ρ : (a, b) u ρ(u) di tipo tempo

M

(futuro) detta linea di universo del punto materiale o particella, ed uno scalare m > 0

delle dimensioni di un massa detto massa del punto materiale o particella.

Consideriamo dunque un punto materiale di linea di universo ρ di massa m e supponiamo che

il punto sia sottoposto a qualche forma di interazione. Parametrizziamo la linea di universo del

punto materiale con il tempo proprio τ : ρ = ρ(τ ). Ci aspettiamo dal principio di corrispondenza

F

che qualunque sia l’equazione della dinamica, lavorando nel riferimento di quiete istantanea τ

con la particella, ad un fissato valore del tempo proprio τ , essa assuma la forma

α

dv

α

F = m .

τ dt F

α

Sopra v sono le componenti della velocità del punto nel riferimento di quiete istantanea e

τ

α

t è la coordinata temporale di tale riferimento. Il vettore F dipenderà dall’ambiente con cui

τ

80

interagisce la particella. Nell’istante considerato possiamo identificare dt con dτ :

α

dv

α

F = m .

τ dτ

Notiamo che abbiamo omesso la componente temporale, che in meccanica classica, e quindi

nel riferimento di quiete istantanea, non gioca alcun ruolo nelle equazioni della dinamica. Nel

α α

riferimento di quiete istantanea, V = γv , γ = 1 ed un semplice calcolo prova che

α α

dv dV

= ,

dτ dτ

mentre dγ =0 .

Quindi l’equazione di sopra si riscrive, nel riferimento di quiete istantanea ed all’istante consi-

derato: i

dV

i

F = m .

τ dτ

0

dove abbiamo supposto che F = 0. Descriviamo la stessa equazione di sopra in un altro sistema

τ

di riferimento in cui la velocità della particella non è nulla.

i ij j

F := Λ F

τ

dove Λ è la matrice di Lorentz che trasforma le coordinate del sistema di quiete nelle coordinate

di un’altro arbitrario sistema di riferimento inerziale. Siamo naturalmente portati ad assumere

che le equazioni della dinamica abbiano la forma, in ogni sistema di riferimento:

i

dV

i .

F = m dτ

Affinché valga il determinismo, cioé esista un’unica soluzione una volta assegnate condizioni

iniziali in termini dell’evento da cui esce la linea di universo e del vettore tangente di tale curva

i

nell’evento considerato, assumeremo che F siano funzioni note dell’evento e del vettore tangente

alla curva in tale evento. Abbiamo quindi: i

dV

i

F (ρ(τ ), V (τ )) = m , (5.1)

i 4

Non possiamo dire che F individui un campo vettoriale su , dato che esso dipende anche dal

M

vettore V (τ ) che, in generale può scelto in diversi modi una volta che è stato fissato l’evento ρ(τ ).

i i

Un modo naturale di pensare le componenti F è il seguente. Le componenti F possono essere

4

viste come le prime 4 componenti di un campo vettoriale differenziabile sulla varietà T ,

M

le rimanenti 4 componenti avendo forma ovvia in modo da produrre il sistema di equazioni

4

differenziali del prim’ordine su T :

M i

( dV

i

F (ρ(τ ), V (τ )) = m ,

dτ (5.2)

i

i

mV = m .

81

Questo sistema di equazioni differenziali del prim’ordine è equivalente, ovviamente, al sistema di

equazioni (5.1). Si osservi che ora l’esistenza e l’unicità della soluzione è assicurata, ma niente ci

assicura che (a) la soluzione sia una curva di tipo tempo futuro e che (b) τ sia il tempo proprio

i 2

−c

(che equivale a dire V V = ovunque sulla soluzione).

i

D’altra parte ci ricordiamo che rimane un vincolo da imporre sul vettore F : cioé che nel sistema

di quiete della particella, la componente temporale si annulli. Tale vincolo può esprimersi con

la richiesta i

F (p, S)S = 0 , (5.3)

i

4 i 2

∈ −c

per ogni scelta di (p, S) T tale che S S = e S è diretto verso il futuro. Infatti

M i

(5.3) è una condizione che non dipende dalle coordinate minkowskiane usate e se espressa nel

riferimento di quiete istantanea dice proprio che

0

F (ρ(τ ), V (τ )) = 0 .

Si osservi che in realtà la richiesta (5.3) è necessaria quando si assume, come facciamo noi,

che la massa m della particella non dipenda dal tempo (proprio) e che la curva soluzione delle

equazioni sia una linea di universo di tipo tempo. Infatti dall’equazione

i 2

−c

V V =

i

segue subito che i

dV

V =0

i dτ

da cui, segue subito la (5.3) se si assume (5.2) e tenuto conto che la quadrivelocità in ogni evento

i 2

−c

può essere scelta arbitrariamente rispettando V V = e l’orientazione nel futuro. Il punto

i

importante è che vale anche il viceversa: 4

Proposizione 5.1. Si consideri un campo vettoriale differenziabile su T definito da, in un

M 4

sistema di coordinate globali naturali indotte da un sistema di coordinate minkowskiane su :

M

∂ ∂

k k

+ mS

F ((p, S)) k k

∂x ∂S

6

con m = 0 che soddisfi il vincolo: i

F ((p, S))S = 0

i I

4 2 +

∈ −c ∈

per ogni (p, S) T tale che η(S, S) = e S . Si considerino una curva integrale di

M p

4

3 7→ ∈

tale campo, ossia (a, b) u (ρ(u), S(u)) T soddisfacente

M i

( dS

i

F (ρ(u), S(u)) = m ,

du

i

i

mS = m .

du

82 I

2 +

∈ −c ∈

Se per u = u (a, b) vale η(S(u )|S(u )) = e S(u ) allora la curva è una linea di

0 0 0 0 p ♦

universo di tipo tempo, u è il tempo proprio e S la quadrivelocità.

6

Dimostrazione. Essendo m = 0, l’equazione del vincolo, su una soluzione del sistema di sopra

implica immediatamente d i

S (u)S (u) = 0 .

i

du

Di conseguenza i i 2

−c

S (u)S (u) = S (u )S (u ) = .

i 0 i 0

F

Ulteriormente, se è un riferimento inerziale, dato che ∂ e S sono entrambi di tipo tempo la

F

7→ |S(u)) ∈

funzione u η(∂ è non nulla per ogni u (a, b) dalla proposizione 3.3. Il segno è quello

F

|S(u

fissato da η(∂ )). Tale segno è negativo perché S(u ) punta verso il futuro, ma allora per

F 0 0

ogni u (a, b), S(u) punta verso il futuro. Concludiamo che S(u) è parallelo e orientato tempo-

i 2

−c

ralmente come la quadrivelocità ∂ = V , avendo anche la stessa “lunghezza” (S (u)S (u) = )

τ i

2

deve coincidere con V . Di conseguenza u = τ + costante.

Possiamo dare la seguente definizione: ∈

Definizione 5.2. (Quadri forza.) L’assegnazione differenziabile di un vettore F (p, S)

I

4 4 + i 2

∈ ∈ −c

T per ogni p per ogni S con S S = è detta quadriforza se soddisfa il

M M

p i

p

vincolo i

F (p, S)S = 0

i

I

4 + i 2

∈ ∈ −c ♦

per ogni p e S con S S = .

M i

p

Possiamo quindi enunciare la prima delle leggi della dinamica relativistica per punti materiali

sottoposti a forze esterne.

DRS1. Le linee di universo delle particelle di massa m sono determinate risolvendo l’equazione

dV

F (ρ(τ ), V (τ )) = m ,

dove il primo membro è la quadriforza agente sulla particella considerata.

Torna utile la seguente definizione che generalizza la nozione di impulso in meccanica classica.

Definizione 5.3. (Quadri impulso.) Data una particella con linea di universo ρ = ρ(τ ),

τ (a, b), e massa m > 0 il campo vettoriale tangente alla curva e diretto verso il futuro definito

da P := mV ,

è detto quadri impulso associato alla particella.

83

Commenti 5.1.

(1) Il quadri impulso soddisfa ovunque sulla linea di universo:

i 2 2

−m

P P = c . (5.4)

i

(2) Il quadri impulso può anche essere assegnato a particelle di massa nulla (tipicamente foto-

ni trattati per quanto possibile non quantisticamente) e lo schema dinamico precedentemente

spiegato si estende a questa situazione con qualche accorgimento. È necessaria una regola, per

il tipo di particella di massa nulla assegnato, che selezioni un vettore tangente (di tipo luce fu-

turo) alla linea di universo della particella le cui componenti abbiano dimensioni di un impulso.

Nel caso dei fotoni questo viene fatto in funzione della frequenza e del vettore d’onda dell’onda

F

associata alla particella. Fissato un riferimento inerziale e in esso un sistema di coordinate

minkowskiane, rispetto a tali coordinate:

0 α α

P = e P := ,

~ω/c ~k F α

dove ω è la frequenza dell’onda associata al fotone misurata nel riferimento , k sono le

−27

·

componenti spaziali del vettore d’onda e = h/(2π) essendo h = 6.626 10 erg sec la costante

~ i

di Planck. A causa delle relazioni ben note ω = c|k|, risulta P P = 0.

i

Nel caso di massa nulla (5.4) diventa ovviamente:

i

P P = 0 . (5.5)

i

L’estensione di DRS1 al caso di particelle senza massa è molto più complesso e non ce ne oc-

cuperemo.

(3) Le componenti spaziali del quadri impulso, riferite a coordinate minkowskiane di un riferi-

mento inerziale e per una particella con massa non nulla, sono

mv

α α

P = mγv = ,

q 2

v

1 2

c

dove v è la velocità della particella nel riferimento considerato. Nel regime di piccole velocità

(rispetto a quella della luce), le componenti spaziali di P si riducono alle componenti dell’impulso

classico come ci si aspetta in conformità del principio di corrispondenza. Più complicato è il

significato della componente temporale che studieremo sotto.

(4) Nelle vecchie trattazioni della relatività l’equazione di sopra si riscriveva

α

P = m(v)v ,

dove m

m(v) := q 2

v

1 2

c

era la cosiddetta massa relativistica che si contrapponeva alla massa di quiete m. Questa proli-

ferazione dei concetti di massa, del tutto inutile e concettualmente deleteria a parere dell’autore,

è caduta in disuso con gli anni. 84

5.1.1 Teorema “delle forze vive” relativistico.

Ci occupiamo ora di stabilire il significato fisico della componente temporale dell’equazione del

moto (5.1) in un generico sistema di riferimento che non è in quiete (istantanea) con la particella

e della componente temporale del quadrimpulso.

Il vincolo (5.3) in un sistema di coordinate suddetto si scrive esplicitamente

X

0 α α

−cγF + F V = 0

α

ossia X

0 α α

cF = F v .

α

Di conseguenza la componente temporale di (5.1) risulta essere scrivibile come

d

X α α 2

F v = γmc ,

α

Notiamo che d

d = γ

dτ dt

e 2 2 4

γ(v/c) = 1 + v /(2c ) + o((v/c) ) .

Se trascuriamo nelle formule di sopra le potenze di v/c ad ordini superiori al secondo e poniamo

α α

· P

F v := F v , si ritrova l’identità

α ‹



d 1

2 2

·

F v = .

mc + mv

dt 2

Questo è il teorema delle forze vive che afferma che la potenza uguaglia la derivata temporale

2

dell’energia cinetica se si trascura il termine costante mc che non fornisce comunque contribu-

to al secondo membro per l’azione della derivata, e se si pensano le componenti spaziali della

α

quadriforza F come componenti di una forza classica. Quindi la componente temporale dell’e-

quazione (5.1) è una generalizzazione relativistica del teorema delle forze vive. Ulteriormente,

0

se P è la componente temporale del quadri impulso,

0 2

T := cP mc

si può pensare come la generalizzazione relativistica dell’energia cinetica della particella in quan-

0

to si riduce ad essa nel caso di velocità basse rispetto a c. Nello stesso modo cF deve essere

pensata come una generalizzazione della potenza al caso relativistico: si tratta dell’energia mec-

canica ceduta al punto materiale per unità di tempo proprio.

Mettiamo tutto insieme in una definizione che includa anche le definizioni di impulso e forza

relativistica. 85

Definizione 5.4. (Impulso, energia cinetica, forza e potenza relativistica.) Data una

particella con linea di universo ρ = ρ(τ ), τ (a, b) e massa m e fissato un riferimento inerziale

F F

, l’impulso e l’energia cinetica (relativistici) della particella rispetto al riferimento sono

definiti rispettivamente come, per ogni evento su ρ,

p := P , (5.6)

F 0 2 2

− −cη(P |∂ −

T := cP mc = ) mc , (5.7)

F F

− F

0

dove P = P + P ∂ è la decomposizione canonica indotta da in ogni spazio tangente.

F

Se sulla particella agisce una quadriforza F , la forza e la potenza (relativistiche) rispetto al

F

riferimento agenti sulla particella sono definite rispettivamente come, per ogni evento su ρ

f := F , (5.8)

F 0 −cη(F |∂

Π := cF = ) , (5.9)

F F

− F

0

dove F = F + F ∂ è la decomposizione canonica indotta da in ogni spazio tangente.♦

F

Chiaramente la componente temporale dell’equazione (5.1) non è altro che il teorema delle

forze vive relativistico:

Teorema 5.1. (Teorema delle forze vive.) Si consideri un punto materiale soggetto ad

F

una quadriforza F . In ogni riferimento inerziale e per ogni istante di tempo proprio sulla

linea di universo del punto materiale valgono le equazioni:

·

f v = Π , (5.10)

F F F

d 2

(mc + T ) , (5.11)

Π =

F F

dτ F F

· ♦

dove indica il prodotto scalare negli spazi di quiete con indotto dalla metrica spaziale di .

Commenti 5.2.

(1) Una differenza con il teorema classico è che la derivata temporale è riferita al tempo proprio.

(2) Nel sistema di quiete istantanea, il teorema delle forze vive si riduce ad una banalità:

0 = 0, perché la potenza dissipata in quel riferimento sul punto è nulla. Tra poco esamineremo

un’estensione dei concetti definiti, di fondamentale importanza dal punto di vista fisico, in cui

la situazione sarà completamente modificata.

(3) Nel caso di particella a massa nulla, semplicemente si definisce

0

T := cP .

(4) Un altro modo di scrivere la formula dell’energia cinetica è il seguente. Dato che vale

i 2 2

−m

P P = c , si ha:

i Ì 3

X

0 2 4 2 α 2

cP = (P ) , (5.12)

m c + c α=1

86

quindi Ì 3

X 2

2 4 2 α 2 −

T = m c + c (P ) mc .

α=1

È facile provare che se p := mv dove v è la velocità rispetto al riferimento considerato, risulta

‚ Œ

2 4

|p|

p 2

T = + mc O .

4 4

2m m c

2

A meno di termini infinitesimi del quarto ordine (p /2m è del secondo ordine), ritroviamo

l’espressione classica dell’energia cinetica in termini dell’impulso. Nel caso di particelle a massa

nulla semplicemente risulta Ì 3

X α 2

T = c (P ) ,

α=1

Il limite a piccole velocità, o piccole componenti spaziali del quadri impulso, non è di molto

interesse: le particelle senza massa hanno significato solo relativistico.

5.2 Conservazione del quadri impulso e principio di equivalenza

massa-energia.

Se un punto materiale è sottoposto ad una quadriforza nulla in un intervallo di tempo proprio,

la linea di universo del punto materiale è un segmento di retta affine, cioè un moto rettilineo

uniforme rispetto a qualche sistema di riferimento inerziale. Quello che più ci interessa è che il

quadri impulso è conservato sulla linea di universo considerata. Quindi, rispetto ad un qualsiasi

sistema di riferimento inerziale l’energia cinetica relativistica e l’impulso relativistico saranno

costanti del tempo proprio e quindi della coordinata temporale del riferimento.

5.2.1 Legge di conservazione del quadri impulso.

Vogliamo ora cercare di formulare la legge di conservazione del quadri impulso che generalizza

quella di conservazione dell’impulso e dell’energia per un sistema di punti materiali isolati all’e-

sterno ma interagenti tra di essi. La formulazione più elementare di tale principio sembrerebbe

consistere nella richiesta che il quadri impulso totale del sistema di punti materiali sia conservato

nel tempo di ogni riferimento inerziale. Le cose non sono tanto semplici perché non è per nulla

ovvio come definire il quadri impulso totale. Il passaggio dalla meccanica del punto a quella di

un sistema di punti non è per nulla ovvia quanto lo era in meccanica classica. Ciò è dovuto al

fatto che in generale non possiamo più banalmente definire delle quantità totali, come il quadri

impulso totale o la quadriforza totale, sommando le rispettive quantità associate a singoli punti

materiali. Vediamo perché. Prima di tutto dobbiamo decidere quali eventi considerare sulla linea

87

di universo di ciascuna particella su cui leggere il quadri impulso per eseguire le somme dei vari

quadri impulsi. Prendiamo a titolo di esempio il caso di due punti materiali isolati dall’esterno,

ma che interagiscono tra di loro con interazioni “a distanza”. Assumiamo che l’interazione a

distanza sia tale che le loro linee di universo, quando i punti sono abbastanza “spazialmente

vicini”, smettono di essere dei segmenti e si incurvano, per poi diventare nuovamente segmenti

quando i punti si sono sono sufficientemente “spazialmente allontanati”. Cosa è il quadri im-

pulso totale del sistema dei due punti? Dato che il quadri impulso totale in componenti sarà

valutato da riferimenti, è naturale pensare che la procedura per definirlo sia quella di sezionare

0

le due linee di universo ρ, ρ con le sottovarietà Σ spazi di quiete di un riferimento inerziale

F t

F 0

. Il quadri impulso totale al tempo t dovrebbe essere definito come P + P dove tali quadri

t t

0

∩ ∩

impulsi sono quelli valutati in Σ ρ e Σ ρ rispettivamente. Il principio di conservazione

F F

t t 0

del quadri impulso dovrebbe quindi consistere nella richiesta che P + P non dipenda da t.

t t

Nota 5.2. Questa procedura di definire il quadri impulso totale e quindi enunciare la legge

di conservazione del quadri impulso per sistemi di punti materiali isolati all’esterno non è co-

munque una buona procedura per due motivi importanti.

(a) Con la definizione data, il principio di conservazione dell’impulso relativistico in ogni rife-

rimento inerziale, che segue immediatamente dal principio di conservazione del quadri impulso,

sarebbe equivalente al principio di azione e reazione. Tuttavia, in assenza del tempo assoluto

e se le forze si esercitano a distanza, il principio di azione e reazione può solo essere formulato

separatamente in ogni sistema di riferimento inerziale rispetto alla coordinata temporale di tale

riferimento. Tuttavia è facile produrre esempi semplici in cui la validità del principio di azione

e reazione in un riferimento inerziale implica che tale principio non valga in un altro sistema di

riferimento inerziale. Concludendo, con la procedura indicata per dare le definizioni ed enuncia-

re il principio, avremmo che la validità del principio di conservazione del quadri impulso totale

dovrebbe dipendere dal riferimento inerziale in netto contrasto con il principio di relatività.

(b) Un secondo motivo per rigettare le definizioni e l’enunciazione proposta del principio di con-

servazione del quadri impulso totale è il seguente. Il quadri impulso totale definito come detto

dipenderà in generale dal riferimento a differenza dei quadri impulsi dei singoli punti materiali

del sistema che contribuiscono a definirlo. Per provare ciò consideriamo ancora il sistema dei due

punti materiali di sopra. Si fissi un evento p sulla linea di universo ρ, nella regione di spaziotem-

po Ω in cui avviene l’interazione per cui cui le due linee non sono segmenti in Ω. Tenendo fisso

p scegliamo due spazi di quiete Σ , Σ riferiti rispettivamente a due diversi riferimenti inerziali

1 2

F F

e e assumiamo che entrambi gli spazi intersechino la prima linea in p. È chiaro che i due

1 2 0 0

spazi di quiete intersecheranno l’altra linea di universo ρ in due eventi diversi q in Σ ρ e q

1 1 2

0 0 0

∩ 6

in Σ ρ e q = q . In q e q , in generale, i quadri impulsi del secondo punto materiale P e P

2 1 2 1 2 1 2

0

saranno differenti perché la linea di universo ρ non è un segmento (a causa dell’interazione) e

non ha quindi vettore tangente costante. Di conseguenza la procedura suggerita sopra fornisce

0 0

due quadri impulsi totali P + P e P + P in generale diversi, indipendentemente dal fatto che

p p

1 2

essi si conservino o meno al variare del tempo del corrispondente riferimento.

Torneremo successivamente sui problemi sollevati nelle precedenti osservazioni. Passiamo a con-

88

siderare la situazione particolare, ma fisicamente interessante in cui le interazioni tra particelle

sono puntuali ed istantanee, cioé avvengono in eventi isolati. In tal caso non ci sono problemi

con il principio di azione e reazione. In altre parole considereremo sistemi di punti materiali

4

le cui linee di universo sono segmenti di rette affini (o semirette) di di tipo tempo futuro e

M

confluiscono o escono da singoli eventi. Assumeremo, in tutta generalità, che per ogni evento

in cui avvengono interazioni, il numero di linee di universo entranti ed il numero di linee di

universo uscenti possano essere in numero (finito) diverso (nessuno dei due può comunque essere

nullo). Ciò fisicamente corrisponde alla creazione o distruzione di particelle. Tali fenomeni sono

ammessi sia in meccanica classica (si pensi ai possibili fenomeni di urto di palline di plastilina),

sia in fenomeni connessi alla fisica delle particelle atomiche e sub atomiche.

DRS2 (Principio di conservazione del quadri impulso per interazioni puntuali ed

4

istantanee) Si consideri un processo di interazione tra particelle nello spaziotempo descritto

M

4

∈ ≥

in un intorno aperto Ω dell’evento s come segue. Ci sono N 0 linee di universo (di

M

4

→ ≥

tipo tempo futuro) ρ : (α , β ] , i = 1, . . . , N ed altre M 0 linee di universo (di tipo

M

(i) (i) (i)

0 0 0 4

tempo futuro) ρ : [α , β ) , j = 1, . . . , M corrispondenti al moto rettilineo uniforme

M

(j) (j) (j)

in qualche riferimento inerziale di corrispondenti punti materiali, tali che

lim ρ (u) ∂Ω e ρ (β ) = s per ogni i = 1, . . . , N

i

(i) (i)

+

u→α i

e 0 0 0 ∈

ρ (u) ∂Ω per ogni j = 1, . . . , M

ρ (α ) = s e lim −

0

j

(j) (j)

u→β j 0

In tale processo, se P sono i quadri impulsi sulle linee di universo ρ e P sono i quadri impulsi

i i j

0

sulle linee di universo ρ vale che il quadri impulso totale prima dell’interazione uguaglia

j

quello totale dopo l’interazione: N M 0

X X

P = P . (5.13)

i j

i=1 j=1

Commenti 5.3.

(1) È importante notare che le linee di universo primate sono necessariamente nel futuro causale

di s mentre quelle non primate sono nel passato causale si s per la proposizione 2.6. Di con-

seguenza ogni riferimento inerziale descriverà le linee di universo ρ come quelle delle particelle

i

0

prima dell’interazione e le linee di universo ρ come quelle delle particelle dopo l’interazione.

j N

P

Per lo stesso motivo ogni riferimento inerziale interpreterà P come il quadri impulso tota-

i

i=1

0

M

P

le prima dell’interazione e P come il quadri impulso totale dopo l’interazione.

j=1 j

F ∈

(2) Se ha uno spazio di quiete Σ che interseca tutte le linee ρ ma non s allora tale

S F i

t 0

spazio di quiete non può avere intersezione con le linee ρ . Se ciò fosse, avremmo due eventi

j

spazialmente separati (perché appartenenti alla stesso spazio di quiete e non coincidenti avendo

coordinata temporale differente) che devono essere anche causalmente connessi per l’esercizio

89

3.1.2 (o 3.1.3 se qualche linea di universo è di tipo luce), e ciò è impossibile. Se Σ contiene s,

F t

ovviamente non può contenere altri punti delle linee di universo. Se Σ interseca tutte le linee

F t

0

ρ ma non s allora tale spazio di quiete non può avere intersezione con le linee ρ similmente a

i

j

sopra. In tal modo, dato che i quadri impulsi sono costanti sulle linee di universo, il quadri im-

N

P

pulso totale iniziale P si può effettivamente calcolare sommando i quadri impulsi nei punti

i

i=1

di intersezione con le ρ tra uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che

i 0

M

P

abbia intersezione con tutte le ρ ). Nello stesso modo, il quadri impulso totale finale P si

j j=1 j

0

può effettivamente calcolare sommando i quadri impulsi nei punti di intersezione con le ρ tra

j

uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che abbia intersezione con tutte

0

le ρ ).

i

(3) Se qualche linea di universo è di tipo luce, il principio di conservazione del quadri impulso

totale per interazioni puntuali ed istantanee si estende banalmente purché ovviamente siano

definiti i quadri impulsi sulle linee di universo di tipo nullo.

(4) Il principio di conservazione del quadri impulso totale si applica al caso seguente in par-

4

ticolare. Si consideri un diagramma d’interazione nello spaziotempo costituito da una

M

rete i cui rami elementari detti gambe sono un numero finito tra segmenti (non degeneri) e

4

semirette di , tutti di tipo causale futuro e i cui nodi detti vertici sono eventi isolati e sono

M

dati dai punti estremi delle gambe. Vi sono due tipi di gambe: quelle esterne date da semirette

e quelle interne definite dai segmenti. Una gamba si dice: uscente da un vertice se i punti della

gamba sono nel futuro causale del vertice, entrante in un vertice se i punti della gamba sono

nel passato causale del vertice. (I punti interni a segmenti o semirette che siano attraversati dal

solo segmento o semiretta considerati non sono vertici per definizione.)

Una rete di questo tipo descrive un processo di scattering o diffusione di un numero finito

di particelle che evolvono liberamente lungo le linee di universo date dalle gambe entranti, in-

teragiscono puntualmente ed istantaneamente tra di loro nei vertici e i prodotti dell’interazione

tornano ad evolvere liberamente, come particelle uscenti dal processo, lungo le gambe uscenti

della rete.

Consideriamo, in un diagramma di interazione come quello definito sopra, un vertice s e un

intorno Ω di s che non contenga altri vertici e gambe che non passano per s. Ammettendo che

il diagramma descriva un processo di interazione tra particelle e che quindi ogni linea di uni-

verso del diagramma abbia associato un quadri impulso, in Ω possiamo imporre il principio di

conservazione del quadri impulso DRS2 e fare altrettanto per ogni altro vertice del diagramma

d’interazione.

Se tale principio è valido per il diagramma considerato si può verificare che vale il seguente fatto.

F ∈

Consideriamo e un suo spazio di quiete Σ . Le intersezioni tra tale spazio di quiete ed

S F t

il diagramma sono costituite da un numero finito di punti. La somma dei quadri impulsi definiti

su tali punti (associati alle corrispondenti linee di universo) non dipende nè dallo spazio di quiete

F

Σ e nemmeno dal riferimento inerziale . Tale quadri impulso è il quadri impulso totale del

F t

sistema. In particolare, andando sufficientemente “indietro nel tempo”, Σ intersecherà solo

F t

gambe esterne entranti. In tal modo il quadri impulso totale coincide con il quadri impulso

totale delle particelle entranti. Nello stesso modo il quadri impulso totale risulta coincidere con

il quadri impulso totale delle particelle uscenti.

90

Esercizi 5.1.

1. Mostrare che in un diagramma di interazione come quello definito nel punto (4) sopra,

se è valido DRS2, non ci possono essere vertici senza linee entranti oppure senza linee uscenti.

Interpretare fisicamente il risultato come l’impossibilità della creazione/sparizione (di che cosa?)

dal/nel nulla. 0

Suggerimento. Il punto cruciale è che, in ogni riferimento inerziale, P > 0 per ogni quadri

impulso di una particella anche a massa nulla. La somma di numeri positivi non può mai

produrre il numero 0.

5.2.2 Il principio di equivalenza massa energia.

Il principio di conservazione del quadri impulso, anche nella sua forma elementare enunciata

sopra, ha delle conseguenze importantissime per quanto riguarda la relazione tra massa ed

energia.

Per illustrare tali conseguenze, consideriamo preventivamente la seguente situazione. Si consideri

un sistema di punti materiali (di massa non nulla) non interagenti tra di essi e isolati con l’esterno,

con quadri impulsi P e masse m , i = 1, . . . , N . È possibile trattare, matematicamente, il

(i) (i)

sistema complessivo come un unico punto associando ad esso un unico quadri impulso ed una

P

unica massa. Dato che P := P è di tipo tempo futuro essendo tali i P ed essendo un cono

(i) (i)

i

I F

+

ogni , per la proposizione 2.3, ci sarà un unico riferimento inerziale con ∂ parallelo a

F

G

q G

P . Tale riferimento è detto baricentrale. In tale riferimento solo la componente temporale di

P è non nulla e vale: N

N

0 T

P F (i)

X

X

M := m +

= .

(i) 2

c c

i=1

i=1

Se dunque vogliamo dare senso al concetto di massa totale del sistema per questa via, dobbia-

mo definirla come la somma delle masse delle particelle componenti con l’aggiunta delle energie

cinetiche delle stesse particelle valutate nel riferimento baricentrale. In tal modo si vede che le

energie cinetiche danno sorprendentemente un contributo alla massa complessiva del sistema.

Si può obiettare che in realtà il discorso è del tutto formale e che in realtà non esiste alcun

punto materiale associato al sistema complessivo. Questo è vero, ma la situazione cambia radi-

calmente con il seguente esempio dove le formule matematiche sono simili ma il significato fisico

è profondamente diverso. Consideriamo un processo di decadimento di particelle comunemente

osservato in fisica delle particelle. Una particella di massa M e quadri impulso P , istantanea-

mente e puntualmente decade in due particelle di masse m , m e quadri impulsi P , P . Prima

1 2 1 2

e dopo il decadimento le particelle sono libere. Classicamente il fenomeno è possibile solo se

M = m + m ,

1 2

per la legge di addizione delle masse. Ulteriormente, sempre nel caso classico, l’energia cinetica

delle particelle finali se non è nulla è creata a spese di qualche forma di energia interna della

particella iniziale (per esempio energia chimica negli esplosivi). Relativisticamente ci sono altre

91

possibilità. Se ci poniamo nel sistema baricentrale delle due particelle finali, in tale riferimento

la particella iniziale di massa M è vista in quiete (fino a quando esiste) e gli impulsi delle due

particelle finali sono uguali ed opposti. La conservazione del quadri impulso in tale riferimento

ha come unica equazione non banale quella data dalla componente temporale:

T T

(1) (2)

M = m + m + + .

1 2 2 2

c c

Questa equazione dice che la massa complessiva delle due particelle finali può essere inferiore

alla massa della particella iniziale, e la differenza di massa si trasforma in energia cinetica delle

particelle finali secondo la celeberrima equazione di Einstein

2

E = mc , − −

dove in questo casso E = T + T è un’energia cinetica e m = M m m è la differenza

1 2

(1) (2)

delle masse.

Deve essere precisato che non solo l’enunciato teorico del principio di conservazione del qua-

dri impulso ammette tali fenomeni in linea di principio, ma sperimentalmente si osservano

effettivamente fenomeni come quello suddetto in cui

m + m < M .

1 2

In tali casi la differenza di massa è davvero “tramutata” in energia cinetica secondo l’equazione

di Einstein.

È fondamentale notare che l’energia cinetica non è l’unica forma di energia nota, ma ne esisto-

no di diverso tipo: meccanica, chimica, termodinamica, ecc. Tali forme di energia si possono

trasformare l’una nell’altra in conformità con la legge generale di conservazione dell’energia. È

allora naturale formulare il:

Principio di equivalenza massa energia. Il contenuto complessivo energetico di un cor-

po, valutato in quiete con esso, corrisponde alla massa dello stesso corpo tramite l’equazione:

2

E = mc .

Tale principio, unito al principio di conservazione dell’energia, ha ricevuto e riceve continuamen-

te nella fisica delle alte energie molteplici conferme sperimentali ed è oggi accettato come vero.

Commenti 5.4.

(1) Come conseguenza della conservazione dell’energia e del principio di equivalenza massa ener-

gia, la massa cessa di essere una grandezza additiva e conservata. Ulteriormente sono possibili

“trasmutazioni” di massa in diverse forme di energia” (nel rispetto dell’equazione di Einstein).

(2) Consideriamo il processo inverso di quello studiato sopra, in cui due punti materiali macro-

scopici, per esempio due palline di plastilina, si scontrano nel riferimento baricentrale e danno

luogo ad un unico punto materiale fermo, con massa

T T

(1) (2)

M = m + m + + ,

1 2 2 2

c c

92

dove abbiamo usato la stessa notazione di sopra. Osserviamo che a causa del valore enorme

2 −

di c , la differenza M (m + m ) risulta essere molto piccola nelle scale usuali di energie e

1 2

masse. Infatti dal punto di vista classico tale differenza è considerata nulla. Dal punto di vista

classico si afferma anche che l’energia cinetica T + T viene immagazzinata sotto forma di

(1) (2)

energia interna nella particella di massa M finale: in quest’ottica il punto finale è in realtà

un sistema termodinamico. A conferma di tale fatto, in conformità con le proprietà generali

dell’energia interna termodinamica, si assiste sperimentalmente ad un aumento della tempera-

tura della particella finale rispetto alla temperatura delle due particelle iniziali (supposte con

la stessa temperatura). Un modo naturale di fare coesistere i due punti di vista è quello di

affermare che la massa M finale definisce il contenuto complessivo di energia della particella

2

nel suo riferimento di quiete: l’energia interna termodinamica è inclusa nel calcolo di M c . In

altre parole, se scaldiamo un sistema termodinamico, quindi cedendogli energia non meccanica

2

(senza variazioni di energia cinetica), la massa del sistema deve aumentare di Q/c dove Q è la

quantità complessiva di energia non meccanica (calore) ceduta al sistema.

Da questo punto di vista si può generalizzare la legge DRS1 definendo quadri forze non meccani-

che ed assumendo variabile la massa del punto materiale soggetto alla quadriforza. Assumiamo

ancora valida dP

F = ,

ma omettiamo il vincolo |P

η(F ) = 0

|P

nella definizione di quadriforza. Lo scalare η(F ) valutato in un evento della linea di universo

del punto materiale risulta avere il valore 0

|P −m(τ

η(F ) = )cF

τ

dove il secondo membro è riferito al sistema di riferimento istantaneamente in quiete con il punto

materiale. Quindi −1

Q 0

−m |P

:= η(F ) = cF

τ

misura l’energia non meccanica ceduta al punto materiale nel suo sistema di quiete istantanea e

per unità di tempo proprio. Dalla condizione 2 2

|P −m

η(P ) = c

si ricava subito che vale: d

Q 2

= m(τ )c . (5.14)

È immediato verificare che la stessa equazione si trova scrivendo la componente temporale del-

l’equazione della dinamica nel riferimento di quiete istantanea della particella.

|P

Si osservi che l’assenza del vincolo η(F ) = 0 impone un’equazione di più sul moto della

particella: la componente temporale dell’equazione della dinamica nel sistema di quiete della

93

particella non è più banale, ma diventa l’equazione (5.14). Tuttavia, ora anche m = m(τ ) è

una variabile del problema per cui il problema del moto risulta comunque essere determinato.

Per concludere, notiamo che nel caso di quadriforze completamente meccaniche, il vincolo (5.3)

comporta immediatamente la costanza della massa della particella attraverso la stessa (5.14).

Esercizi 5.2.

1. Può una particella di massa M diminuire la sua massa ed aumentare la sua energia

cinetica spontaneamente in modo istantaneo e puntuale?

Suggerimento: si esamini la conservazione del quadri impulso nel riferimento di quiete con la

particella prima della trasformazione.

2. Un fotone può trasformarsi spontaneamente, istantaneamente e puntualmente in due

particelle di massa non nulla?

Suggerimento: si esamini la conservazione del quadri impulso nel riferimento baricentrale della

coppia di particella dopo la trasformazione.

3. Si consideri una quadriforza non totalmente meccanica F , la si decomponga in parte

meccanica e parte non meccanica come F = F + F

m nm

dove |F

η(P )P

F := .

nm 2 2

m c

Mostrare che il teorema delle forze vive ora assume la forma

d

Q 2

·

f v + = (mc + T ) ,

F F F

m dτ

dove la forza relativistica f è riferita alla sola parte meccanica della quadriforza.

F m

Concludere che vale anche la forma completamente meccanica del teorema delle forze vive:

d

·

f v = T .

F F F

m dτ

Suggerimento: Esplicitare la componente temporale della legge della dinamica in un arbitrario

F |P

riferimento , quindi notare che per costruzione η(F ) = 0 e scrivere tale equazione come

m

0 ·

una relazione tra F e f v . L’ultima relazione da provare segue dalla prima relazione da

F F

m

m

provare e da (5.14).

4. Nei processi di fusione nucleare, due nuclei si fondono per dare luogo a un unico nucleo

finale. La massa del nucleo finale è inferiore alla somma delle masse dei due nuclei iniziali: si

ha cioè un difetto di massa. Cercare di spiegare in termini semiclassici, tenendo conto che lo

stato finale si può considerare come uno stato legato, perché tale difetto di massa appare. Dove

è finita la massa che manca?

Suggerimento: L’energia meccanica del sistema finale si può pensare come data dai contributi

delle due masse più l’energia meccanica del sistema (potenziale + cinetica). Per liberare i

due nuclei dallo stato legato bisogna compiere del lavoro positivo sul sistema per cui l’energia

meccanica è negativa. 94

5.3 Il tensore energia-impulso.

Eccettuata la situazione in cui i punti materiali di un sistema non interagiscano oppure interagi-

scano con interazioni puntuali (cioè non “a distanza”) ed istantanee, i problemi posti nella nota

5.2 della sezione 5.2.1 sono effettivi e non si risolvono. In realtà c’è un motivo profondamente

fisico che andiamo ad illustrare. Già in elettrodinamica classica in cui le forze non sono a di-

stanza, il tentativo classico di definire l’impulso totale di un insieme di cariche come la somma

degli impulsi delle cariche, generalmente in moto, fallisce miseramente perché non include un

contributo essenziale: l’impulso del campo elettromagnetico e senza di esso l’impulso totale del

sistema non si conserva. Il fallimento del principio di azione e reazione nell’elettrodinamica,

a causa della velocià finita con cui si propagano le perturbazioni del campo elettromagnetico

costringe ad attribuire al campo elettromagnetico un contributo all’impulso totale del sistema

se si vuole mantenere valido il principio di conservazione dell’impulso. La stessa cosa accade

per l’energia. In relatività, non esistono velocità di propagazione di alcunché che possa definire

relazioni causali nello spaziotempo, a causa della struttura causale dello stesso. In particolare

quindi, non solo sarà necessario attribuire un quadri impulso al campo elettromagnetico ma a

qualsiasi campo che descrive interazioni “a distanza” tra particelle. Quello che di fatto accade,

è che ad ogni campo che descrive interazioni viene associato un campo tensoriale doppio simme-

trico detto tensore energia-impulso. Fissato un riferimento inerziale ed un suo spazio di quiete,

il tensore energia impulso definisce una densità di quadri impulso su tale spazio di quiete che

deve essere integrata spazialmente per dare luogo al quadri impulso del campo valutato in quel

riferimento ed all’istante considerato. Il quadri impulso totale, definito dalla somma dei quadri

impulsi dei punti e del quadri impulso del campo, gode di due proprietà che risolvono i proble-

mi sollevati nella nota 5.2: (1) esso non dipende dal riferimento inerziale usato per eseguire la

somma, (2) esso non dipende dal tempo del riferimento che etichetta lo spazio di quiete: cioè è

conservato.

Lo sforzo di impostare la teoria in termini di densità, definite puntualmente è anche importante

in prospettiva per un secondo fine. Quando si passa dalla relatività speciale alla relatività ge-

nerale, cessa di esistere la struttura di spazio affine che permette di sommare vettori applicati

in punti distinti dello spaziotempo, come abbiamo fatto precedentemente per definire la nozione

di quadrimpulso complessivo di un insieme di punti materiali non interagenti o interagenti in

singoli eventi. Una descrizione in termini di densità, da integrare su opportune ipersuperfici

tridimensionali di tipo spazio può ancora avere senso. In tale contesto le densità devono essere

rappresentate, punto per punto, da opportuni campi tensoriali.

5.3.1 Teorema della divergenza in forma covariante.

Abbiamo bisogno di qualche strumento tecnico per introdurre il tensore energia-impulso.

Se (M, g) è una varietà (pseudo-)riemanniana, la metrica g indice una misura naturale di volume

µ (sulla classe dei sottoinsiemi di Borel di M ) che, in ogni carta locale definita su M , cioè

g 95

1 n n

3 7→ ∈

ψ : U p (x (p), . . . , x (p)) , assume l’espressione

R È

Z 1 n

1 n

|g(x · · ·

µ (E) = , . . . , x )|dx dx ,

g ψ(E) 1 n

⊂ ⊂ · · ·

dove E U M è un insieme di Borel, dx dx denota la solita misura di Lebesgue in

n 1 n

coordinate, cioè definita in ψ(U ) e g(x , . . . , x ) indica il determinante della matrice che,

R

nelle coordinate considerate, individua il tensore metrico g. La definizione di un integrale sulle

funzioni (a supporto compatto) definite su M , sfruttando la paracompattezza di M , si ottiene in

2

{f }

modo standard con una partizione dell’unità subordinata ad un atlante localmente finito

i i∈I 3

{(U →

, ψ )} . Se F : M è continua a supporto compatto si definisce:

R

i i i∈I È

Z Z

X 1 ni

1 ni

◦ ◦ |g · · ·

F dµ := (F ψ )(f ψ ) (x , . . . , x )|dx dx .

g i i i i i

i

M U i

i∈I

Si dimostra che il funzionale lineare sulle funzioni continue a supporto compatto, definito in

questo modo dal secondo membro non dipende dall’atlante e dalla partizione dell’unità. Dato

che il funzionale definito sopra è positivo, il teorema della rappresentazione di Riesz assicura che

esista un’unica misura positiva σ-additiva di Borel regolare, indicata appunto con µ , che asse-

g

gna ai compatti misura finita e il cui integrale coincida con il funzionale definito sopra quando

ci si restringe a lavorare con funzioni continue a supporto compatto.

Se S M è una sottovarietà tridimensionale embedded e h è la metrica indotta da g su S,

viene a definirsi una misura naturale di volume ν considerando (S, h) come varietà (pseudo-

h

)riemanniana, nel caso in cui la metrica indotta h sia una vera (pseudo-)metrica, cioè sia non

degenere. In caso contrario il determinante h si annulla e la costruzione è problematica.

Si può dimostrare che il teorema di Stokes-Poincaré dato in termini di forme differenziali, assume

la seguente espressione facendo uso della connessione di Levi-Civita di (M, g).

Teorema 5.2. Sia (M, g) una varietà lorentziana di dimensione 4, X un campo vettoriale

smooth su M e N M un sottoinsieme aperto chiusura compatta la cui frontiera ∂M sia

orientabile e sia l’unione disgiunta di un numero finito di sottovarietà embedded di dimensione

3, ciascuna separatamente di tipo spazio oppure tempo, e di un numero finito di sottovarietà

embedded di dimensione 2. In questo caso:

Z I

∇ · hX,

Xdµ = nidν . (5.15)

g h

N +∂N

L’integrale a secondo membro è da intendersi come la somma degli integrali sulle sottovarietà

tridimensionali di cui ∂N è composta e n è il covettore normale uscente a ∂N normalizzato a

2 {(U ∈

Come noto si tratta di un atlante , ψ )} tale che ogni p M ammette un intorno aperto O che

i i i∈I p

{f }

interseca un numero finito di domini U . è quindi una classe di funzioni continue a supporto compatto

i i i∈I

P

→ ∈ ⊂ ∈

f : M [0, 1] tali che f (p) = 1 per ogni p M e con suppf U per ogni i I; la somma è sempre

i i i i

i∈I

eseguita su un insieme finito di indici per la proprietà degli intorni O suddetta.

p

3 Dato che il supporto di F è compatto, esso può essere ricoperto con un numero finito di intorni aperti O

p

della nota precedente e quindi la somma a secondo membro è finita.

96

±1 ∇ ·

g(n|n) = a seconda del caso, infine X indica la divergenza calcolata rispetto alla connes-

a

∇ · ∇

sione di Levi-Civita: X = X in ogni sistema di coordinate locali.

a 4

Supponiamo che il campo X sia di tipo tempo nello spaziotempo di Minkowski e soddisfi la

M

condizione: ∇· X =0 (5.16)

ovunque. Consideriamo un “tubo” T di linee integrali di X limitato da due sottovarietà embed-

ded S e S tridimensionali di tipo spazio – per esempio due spazi di quiete Σ , Σ a tempi

F F

1 2 t t

1 2

F hX,

diversi, t > t , di un sistema di riferimento inerziale – dato che ni = 0 sulla superficie

2 1

laterale del tubo (che risulta essere di tipo tempo), l’equazione (5.15) per il cilindro N ottenuto

racchiudendo la porzione di T tra S e S fornisce l’identità

1 2

I hX,

0= nidν . (5.17)

h

+∂N

Teniamo ora conto che le pareti laterali del cilindro non forniscono alcun contributo, dato che

hX,

risulta ni = 0 su di esse per costruzione. Possiamo allora riscrivere l’identità trovata come:

Z Z

hX, hX,

nidν = nidν , (5.18)

h h

∩T ∩T

S S

2 1

dove i due versori n sono ora diretti uno in direzione entrante e l’altro in direzione uscente (per

4

esempio entrambi verso il futuro, pensando il tutto in ) e non in direzione uscente da dalla

M −

porzione di tubo di flusso che stiamo considerando. Questa scelta spiega l’assenza del segno

a secondo membro.

Si osservi che in (5.18), nel caso generale non è richiesto che S e S siano normali a X.

1 2

La (5.18) si presta ad un’interpretazione fisica interessante: si tratta di un equazione di con-

hX,

servazione, nel tempo, della grandezza ottenuta integrando la densità ni. In componenti, se

4

pensiamo il tutto in ed immaginiamo che S e S siano due spazi di quiete Σ , Σ a

F F

M 1 2 t t

1 2

F

tempi diversi, t > t , di un sistema di riferimento inerziale con coordinate minkowskiane

2 1

0 1 2 3 0

−dx

x , x , x , x , risulta subito che n = , quando il vettore controvariante associato a n (che

0

hX, −X

in questo caso è ∂ ) è diretto verso il futuro, abbiamo che ni = .

0

x

Tuttavia si possono anche considerare spazi di quiete di due distinti sistemi di riferimento iner-

ziali. La (5.18) implica allora anche che valori delle grandezze ottenute integrando la densità

hX, ni non dipendano dal riferimento.

Nota 5.3.

(1) Il fatto di usare una versione del teorema di Stokes-Poincaré (5.15) che tiri in causa esplici-

tamente la struttura metrica dello spaziotempo invece di lavorare con forme differenziali è, da

una parte scomodo, dato che non è possibile trattare adeguatamente il caso in cui ∂N includa

porzioni estese di tipo luce su cui la misura indotta dalla metrica è degenere. D’altra parte, tale

formulazione si presta ad interpretazioni fisiche importanti, dato che entra in gioco esplicitamen-

te la connessione di Levi-Civita che ha un importante significato fisico, specialmente in relatività

97

generale, e che la misura spaziale è fissata una volta per tutte dalla metrica, cioè fisicamente

parlando, dagli strumenti di misura a disposizione in ogni sistema di riferimento, indipendenti

dalla densità che di deve integrare.

(2) Si può provare facilmente che, per X smooth di tipo tempo, la richiesta (5.18), assunta

valida per ogni scelta del tubo T di linee integrali e delle sottovarietà spaziali S , S , è in realtà

1 2

∇ ·

equivalente alla richiesta X = 0. Proviamolo. Assumiamo che valga (5.18) e quindi (5.17) in

∈ ∇ · 6

modo del tutto generale. Se in un punto p M fosse X = 0 allora, in un intorno O di tale

|∇ ·

punto, per continutà, dovrebbe risultare X| > c per qualche costante c > 0. Scegliendo un

cilindro N O costruito con un tubo di linee integrali di X e due sottovarietà di tipo spazio

S , S come detto sopra (è sufficiente lavorare in una carta locale restringendo O attorno a p

1 2 R ∇ · 6

se necessario), si arriverebbe ad ottenere Xdµ = 0 (dato che la misura degli aperti non

g

N

vuoti è strettamente positiva per la misura µ ) che in virtù della (5.15) renderebbe impossibile

g

la (5.17). hX,

(3) L’interpretazione data della (5.18) come legge di conservazione per la grandezza ni

prescinde completamente dal fatto di lavorare in relatività speciale e può essere data in uno

spaziotempo del tutto generale.

5.3.2 Il tensore energia impulso per il fluido di materia non interagente.

Partendo dalle considerazioni della sezione precedente, consideriamo il caso di un sistema esteso

più semplice possibile: una polvere di particelle, ciascuna con una massa assegnata, che non

interagiscono e che evolvono con linee di universo tangenti ad un campo di quadrivelocità V .

Tale campo è assunto essere smooth, definito in una qualche regione aperta T dello spaziotempo

di Minkowski di “forma tubolare”, in modo tale che prese due sottovarietà embedded tridimen-

sionali di tipo spazio date da spazi di quiete di due riferimenti (non necessariamente lo stesso),

la porzione di T che cade tra di esse sia a chiusura compatta.

Si osservi che la non interazione tra le particelle implica che esse descrivano moti rettilinei uni-

formi in ogni sistema di riferimento inerziale; in altre parole le loro storie sono segmenti di retta

quando parametrizzate con il tempo proprio. Conseguentemente soddisfano l’equazione delle

geodetiche V = 0.

V

Il sistema che stiamo descrivendo non è altro che la versione “continua” dell’insieme discreto di

punti materiali non interagenti considerato precedentemente. Possiamo associare a tale sistema

una densità di massa µ pensata come una funzione smooth nella regione di spaziotempo che

0

consideriamo. Qui si apre un problema: se parliamo di densità di massa significa che la massa

si deve ottenere integrando tale densità nello spazio (tridimensionale) rispetto alla misura ν .

h

A quale riferimento inerziale ci stiamo riferendo per definire lo spazio di quiete? Una risposta

sensata è quella di considerare un sistema di riferimento differente per ogni evento p dello spa-

ziotempo attraversato da una linea integrale di V . La densità di massa µ (p) in p sarà riferita

0

F

allo spazio del sistema di riferimento inerziale con = V (p). In altre parole, ci stiamo riferendo

al sistema di riferimento inerziale in quiete con la particella la cui storia passa per p. Quale

sarà la densità di massa in un qualsiasi altro sistema di riferimento? Ragionando in via del

tutto euristica, se ∆ rappresenta un “piccolo volume spaziale” nel riferimento associato a V (p)

0 98 F

attorno a p, in un qualunque altro sistema di riferimento , ∆ corrisponderà ad un “piccolo

0

volume spaziale” attorno a p: Ê 2

v

∆ = ∆ 1

F 0 2

c F

dove v è la velocità della particella considerata nel riferimento , come abbiamo visto nella

sezione 4.3.1. La stessa relazione può essere scritta:

µ 0

µ =

F q 2

v

1 2

c

F

dove µ è la densità di massa vista nel riferimento , tenuto conto del fatto che la massa è uno

0

scalare per cui ∆ µ = ∆ µ . Abbiamo ottenuto che µ = µ V , ovvero

F F 0 0 0

µ 0

− hV, i

µ = n (5.19)

F F

c F

dove n è il covettore normale agli spazi di quiete di e diretto verso il futuro.

F

Dobbiamo infine imporre un vincolo sulla densità µ che corrisponde all’idea che: la massa

0

contenuta in una porzione di continuo che evolve secondo le curve integrali di V rimanga costante

nel tempo. In altre parole stiamo pensando che la massa non sia altro che la somma delle masse

“infinitesime” associate ad ogni storia V e che ciascuna massa non vari nel tempo, perché i

punti non interagiscono; conseguentemente inseguendo una porzione di continuo associato ad un

insieme di punti materiali, la massa di tale porzione deve rimanere sempre la stessa, dato che i

punti materiali che la compongono sono sempre gli stessi.

Il vincolo detto si esprime come

Z Z

hµ hµ

V, nidν = V, nidν , (5.20)

0 0

h h

0 0

∩T ∩T

Σ Σ

F F

,t ,t

2 2

0 ⊂

dove T T è una qualsiasi sotto regione tubolare ottenuta selezionando un sottoinsieme aperto

in Σ e facendolo evolvere secondo V . Il risultato deve essere valido comunque scegliamo il

F ,t 2 F

sistema di riferimento inerziale . Per quanto detto in (3) nella nota 5.3, la richiesta fatta è

equivalente alla richiesta espressa in forma locale:

∇ · (µ V ) = 0 , (5.21)

0

che assumeremo essere valida d’ora in poi, per ogni punto di T . F

Consideriamo ora la densità di quadri impulso del sistema di punti. Nel riferimento , dato che

µ è la densità di massa, essa sarà descritta da:

µ 0

− hV, i

µV = V n .

F

c

Integrando questa grandezza, rispetto alla misura spaziale dν , sullo spazio di quiete Σ del

F

h ,t

F F

riferimento otteniamo infatti l’impulso totale del sistema calcolato nel riferimento , al

99

tempo t di tale riferimento: non facciamo altro che sommare (attraverso un integrale) tutti i

contributi mV dovuti a ciascun punto materiale la cui storia attraversa σ al tempo t. Tutto

F ,t

ciò ci porta a definire il campo tensoriale controvariante, detto tensore energia impulso del

sistema: ⊗

T := µ V V . (5.22)

0

Nel seguito indicheremo con T (ω) il campo vettoriale che si ottiene contraendo il fattore V di

sinistra con il campo vettoriale covariante ω. In componenti:

k ik

T (ω) := ω T per ogni campo vettoriale covariante ω.

i F

In base a quanto detto sopra, dato un sistema di riferimento con associate coordinate min-

F

0 1 2 3

kowskiane x , x , x , x , l’impulso totale nel riferimento nella direzione ∂ e nell’evento p è

i

x

data da: 1 Z i

i hT

− (dx ), nidµ , (5.23)

P =

F h

t c Σ

F t

mentre la densità di energia è data da: Z 0

− hT

E = (dx ), nidµ . (5.24)

F h

t Σ

F t

Vogliamo ora mostrare che, in virtù del fatto che le particelle del nostro continuo sono non

i

interagenti e pertanto le loro linee di universo sono geodetiche, le grandezze P e E sono

F

F t

t

costanti al variare del tempo, cioè sono conservate. Ulteriormente vedremo anche che le quattro

grandezze dette sono le componenti di un quadrivettore, che dunque non dipende dalla scelta

F

del riferimento inerziale .

Teorema 5.3. Il campo tensoriale energia impulso T in (5.22), nell’ipotesi che il campo di

velocità V sia quello di particelle in moto geodetico e che valga l’equazione di conservazione della

massa (5.21) soddisfa l’equazione: ab

∇ T = 0 . (5.25)

b

Conseguentemente: F i

(a) per ogni fissato sistema di riferimento inerziale , le quattro grandezze E /c, P ,

F F

t t

definite in (5.24) e (5.23), sono costanti nel tempo;

F

(b) al variare del riferimento , tali grandezze costituiscono le componenti di un quadrivet-

F

tore P indipendente dalla scelta di .

ab a b b a b a

∇ ∇ ∇ ∇

Dimostrazione. Vale T = (µ V V ) = (µ V )V + µ V V . Entrambi gli adden-

0 0 0

b b b b

di finali sono nulli, il primo per la (5.21) ed il secondo perché vale l’equazione delle geodetiche

b a

V V = 0 per ogni linea di universo delle particelle.

b F 0 1 2 3 a

Fissato un riferimento con coordinate minkowskiane x , x , x , x , dato che il campi dx sono

a

campi costanti (rispetto alla connessione di Levi-Civita), abbiamo che, se ω = c dx con c

a a

ab ab

∇ · ∇ ∇

costanti arbitrarie: T (ω) = (c T ) = c T = 0. Usando il teorema 5.2 con X = T (ω)

a a

b b

100 i

segue immediatamente la conservazione delle quattro grandezze E /c, P comunque si scelga

F F

t t

il sistema di riferimento. Per provare (b), consideriamo un covettore ω costante rispetto alla

F F 0

connessione di Levi-Civita e due sistemi di riferimento inerziali e . Fissiamo Σ e Σ in

F F 0 0

t t

modo tale che le loro intersezioni con T non abbiano punti in comune ed individuino una regione

N limitata nel passato e nel futuro rispettivamente da Σ e Σ . Applicando nuovamente il

F F 0 0

t t

teorema 5.2 alla regione N si ottiene che

Z Z

0

hT idν hT

(ω), n = (ω), nidν .

0 0

h h

∩T ∩T

Σ Σ

F

0 0

F ,t

,t 0 0k

1

che si può scrivere, se ω = ω dx = ω dx

i k

3 3

0 0

X X

k i

−E −E

ω + cP ω = ω + cP ω .

F

F 0 0 F F

0 0 0 i

t

t 0 t k t

i=1

k=1 7→ hP,

Questo significa che i due membri definiscono lo stesso funzionale lineare ω ωi sullo spazio

dei covettori costanti ω, cioè sullo spazio duale allo spazio delle traslazioni dello spazio affine

4 . In altre parole definiscono un elemento dello spazio delle traslazioni stesso, cioè un vettore

M −1 1 2 3

controvariante: P che ha componenti c E , P ,P ,P nella base pseudo-ortonormale

F 0 0 F F

F

t 0 0 0 0 0 0

t t

t

F 0 −1 1 2 3

associata alle coordinate minkowskiane di e componenti c E , P , P , P nella base

F F F F

t t t t

F 2

pseudo-ortonormale associata alle coordinate minkowskiane di .

5.3.3 Il tensore energia impulso.

L’equazione di conservazione (5.25) è molto interessante dal punto di vista fisico: è espressa in

forma completamente locale e quindi non necessita della struttura di spazio affine per sussistere

e pertanto si può imporre anche in ambienti in cui la struttura di spazio affine non può esistere:

lo spaziotempo della relatività generale. Ulteriormente è espressa in termini di operazioni tra

tensori e pertanto si esprime, in componenti, nello stesso modo in ogni sistema di riferimento

inerziale, rispettando “a vista” il principio di relatività. Si può supporre che la (5.25) sia il

modo in cui il principio di conservazione energia-impulso si debba esprimere nelle teorie relati-

vistiche, anche quando il sistema interagisca. In effetti le cose stanno davvero in tal modo: ad

ogni sistema fisico trattato in relatività speciale (includendo i sistemi di campi come il campo

elettromagnetico) si riesce sempre ad associare un tensore energia-impulso che, nel caso in cui

il sistema sia isolato (ma possa auto interagire), integrato sugli spazi di quiete dei riferimenti

inerziali, definisce l’energia e l’impulso complessivi del sistema in tali riferimenti e che soddisfa

l’equazione (5.25) che garantisce la conservazione di tali quantità ed il fatto che diano luogo ad

un unico quadrivettore energia impulso del sistema, indipendentemente dal riferimento.

In via del tutto generale, se un campo tensoriale doppio controvariante T soddisfa l’equazione

(5.25) e se ω è un campo vettoriale covariante costante rispetto alla connessione di Levi-Civita:

∇ω = 0 ,

101

allora, come si verifica immediatamente, il campo vettoriale:

b ab

X := ω T , (5.26)

a

soddisfa l’equazione (5.16) e pertanto vale l’equazione di conservazione (5.18), che permette di

definire grandezze conservate.

La procedura più diretta per definire il tensore energia impulso per un sistema fisico passa per

la formulazione lagrangiana e attraverso la formulazione del teorema di Nöther esteso al caso

di sistemi continui (tipicamente campi). La formulazione lagrangiana è talmente potente che il

risultato sopravvive anche passando in relatività generale, dove il teorema di Nöther non può

più essere formulato (almeno nella stessa forma in cui si formula in relatività speciale).

Vogliamo nel seguito fare ancora qualche osservazione rimanendo ancora fuori dalla formulazione

lagrangiana, provando come l’esistenza del tensore energia-impulso sia fortemente compatibile

con risultati ben noti della meccanica dei continui classica.

Le due equazioni fondamentali dei continui dalla meccanica classica sono le seguenti, valide in

1 2 3

coordinate cartesiane t, x , x , x di un qualsiasi sistema di riferimento inerziale ed assumendo

che il continuo evolva solo tramite auto interazione (non ci siano forze esterne di alcun genere):

3

∂µ ∂

X β

+ µv = 0 (5.27)

β

∂t ∂x

β=1

„ Ž

3 3

α

∂v ∂ ∂

X X

β α αβ

µ + v v = σ , α = 1, 2, 3 . (5.28)

β β

∂t ∂x ∂x

β=1 β=1

α

dove: v è la componente generica del campo di velocità del continuo, µ la densità di massa

e σ indica il tensore degli sforzi di Cauchy del continuo: si tratta di un campo tensoriale

dipendente anche dal tempo, tale che, se V è una porzione di continuo nello spazio di quiete del

riferimento al tempo t, con bordo regolare orientabile ∂V , allora, se P ∂V vale:

3

X

α αβ

s (t, P ) = σ (t, P )n (t, P ) ,

β

β=1

α

dove s (t, P ) è la densità superficiale di forza (detta anche “sforzo”) che la porzione esterna

di continuo esercita in P quando il covettore normale uscente a ∂V in P è n(t, P ). Il tensore

degli sforzi è una proprietà del continuo considerato ed è in generale, legato con leggi costitutive

alla deformazione del continuo oppure ad altre sue proprietà (per esempio, alle variazioni del

campo di velocità nel caso dei fluidi). L’equazione (5.27) esprime la legge di conservazione della

massa in regime non relativistico, attraverso un’equazione di continuità. La (5.28) corrisponde

invece alla seconda legge della dinamica per ogni particella di continuo. Si può dimostrare che

la conservazione classica del momento della quantità di moto impone al tensore degli sforzi

l’ulteriore richiesta di simmetria: αβ βα

σ = σ . (5.29)

102

Tenendo conto del fatto che: α

∂v ∂ ∂µ

α α

µ = µv v

∂t ∂t ∂t

∂µ

ed esprimendo la in termini di derivate spaziali tenendo conto della (5.27), il set di equazioni

∂t

(5.27)-(5.28) si riscrive del tutto equivalentemente:

3 ∂

∂µ X β

µv = 0 (5.30)

+ β

∂t ∂x

β=1

€ Š

3

∂ ∂

X

α α β αβ

µv + µv v σ = 0 , α = 1, 2, 3 . (5.31)

β

∂t ∂x

β=1

Vogliamo ora provare che se assumiamo che il nostro continuo ammetta una descrizione relativi-

00

stica ed in particolare ammetta un tensore energia impulso T che soddisfi (5.25), e tale che T

1 0β

T rappresentino la densità di energia e la densità di impulso, la (5.25) si può interpretare

e c

come una diretta generalizzazione del set di equazioni (5.27)-(5.28). Fissando un sistema di

F 0 1 2 3

riferimento inerziale e riferendosi a coordinate minkowskiane x = ct, x , x , x associate ad

esso, la (5.25) si esplicita in: 3

∂ 1 ∂ 1

X

00 0β

T + T = 0 (5.32)

2 β

∂t c ∂x c

β=1

3

∂ 1 ∂

X

0α αβ

T + T = 0 , α = 1, 2, 3 . (5.33)

β

∂t c ∂x

β=1 00 2 0β

Se ammettiamo che, in regimi di piccole velocità (rispetto a c), T /c e T /c abbiano la stessa

00 2 0β β

' '

forma classica: T /c µ e T /c µv , la prima delle due equazioni scritte sopra diventa la

αβ α β αβ

(5.32). La seconda diventa la (5.28) pur di identificare T con µv v σ in regime di piccole

velocità. In particolare esattamente nel sistema di quiete con una particella di continuo risulta:

αβ αβ

T = σ nel riferimento di quiete del continuo.

αβ αβ α β

Nel caso del fluido di particelle non interagenti vale σ = 0, ed infatti risulta T = µ V V =

0

0 se α, β = 1, 2, 3 nel riferimento di quiete con una particella di continuo, dato che in tale riferi-

mento V ha solo componente temporale.

Nota 5.4. Nel caso in cui si trattino due sistemi fisici in interazione, ciascuno dotato del

0

suo tensore energia impulso T e T , ci si aspetta che il tensore energia impulso del sistema

complessivo sia dato dalla somma dei due tensori energia impulso più un terzo tensore che tiene

0

conto dell’interazione dei due sistemi: T + T + T . Dal punto di vista fisico ci si aspetta che

int

0

se i due sistemi interagiscano, separatamente T , T e T non soddisfino la (5.25), mentre essa

int

sia soddisfatta dalla somma dei tre tensori energia impulso.

103

5.3.4 Il tensore energia impulso del fluido perfetto.

In meccanica dei continui classica, l’esempio più semplice di fluido auto interagente è il cosiddetto

fluido perfetto, caratterizzato dal fatto che il suo tensore degli sforzi abbia struttura comple-

tamente isotropa, in coordinate cartesiane ortonormali dello spazio di quiete di un riferimento

inerziale: αβ αβ

−pδ

σ = (5.34)

dove p 0 è la pressione del fluido (all’istante e nel punto considerato). La pressione è legata

alle altre proprietà del fluido, in particolare la densità di massa µ ed il campo di velocità v,

attraverso una qualche relazione costitutiva dipendente dal tipo di fluido.

Per costruire la generalizzazione relativistica di un tale sistema fisico, osserviamo che in base alla

discussione di sopra, nel riferimento inerziale di quiete istantanea con una particella di fluido, ci

si aspetta che valga: αβ αβ 00 2

(T ) = pδ , (T ) = c µ ,

0 0 0

dove µ è la densità di massa valutata nel sistema di quiete (istantanea) con la particella di con-

0

tinuo considerata. In un riferimento inerziale generico, in cui le linee di universo delle particelle

a

di fluido hanno componenti V dovrà essere

ab a a cd

T = (Λ ) (Λ ) (T ) ,

p p 0

c d →

dove la matrice di Lorentz Λ è data dalla (7.29) (dove V è il vettore colonna delle 3 componenti

p

spaziali della quadrivelocità V e cγ è la componente temporale):

− t

 

γ V /c

 

Λ = ,

− →

− →

 

p t 2

 

V /c I+ V V /[c (1 + γ)]

  t 4

ed è tale che trasformi il vettore colonna di componenti (c, 0, 0, 0) nel vettore colonna le

R

cui componenti sono quelle del quadrivettore V . Il calcolo diretto mostra che:

‚ Œ

a b

V V

ab a b ab

T = µ V V + p g + . (5.35)

0 2

c

Questo tensore energia impulso viene detto tensore energia impulso relativistico del fluido

perfetto. Nella (5.35), µ è la densità di massa misurata in quiete con le particelle di fluido

0

mentre V è il campo di quadrivelocità di tali particelle.

Nota 5.5. Il modello (5.35) di tensore energia impulso è usato in regimi relativistici molto

spinti: per trattare la cosmologia. In tal caso le particelle sono le galassie (o gli ammassi galattici)

che riempiono l’universo. In tali contesti, il vincolo classico p 0 cessa di essere, in generale

valido e sono ammesse pressioni negative. 104

Capitolo 6

Elementi di teoria dei gruppi di Lie

matriciali.

In questo capitolo vedremo alcune proprietà dei gruppi di Lie matriciali che poi applicheremo

nel caso del gruppo di Lorentz.

6.1 Richiami sui gruppi di Lie.

Definizione 6.1. (Gruppo di Lie.) Un gruppo di Lie è una varietà differenziabile (di

classe C ) G dotata di applicazioni differenziabili −1

3 7→ ∈

φ : G g g G ,

e × 3 7→ ∈

ψ : G G (g, h) gh G ,

×

dove G G è dotata della struttura differenziabile prodotto, tali che (G, ψ, φ) sia un gruppo in

cui ψ è la moltiplicazione gruppale e φ è la funzione che associa l’inverso ad ogni elemento del

gruppo.

Nota 6.1. La richiesta di differenziabilità può essere indebolita fino a considerare gruppi, che

0

diremo topologici, che siano solamente varietà di classe C (varietà topologiche) con operazioni

di gruppo continue rispetto alla topologia del della varietà. Viceversa su alcuni testi la richiesta

di differenziabilità è rafforzata con quella di analiticità: si richiede cioè che la varietà sia una

ω

varietà analitica (C ) e che le operazioni di gruppo siano funzioni analitiche. Se si accetta la

ω

definizione di gruppo di Lie che abbiamo dato noi, i gruppi di Lie con struttura C appena

introdotti vengono detti gruppi di Lie analitici. In realtà queste definizioni apparentemente

diverse sono tutte equivalenti a causa di un famoso teorema di Gleason, Montgomery e Zippin

del 1952. Tale teorema prova che ogni gruppo topologico ammette sempre una sotto-struttura

105

ω

differenziabile di classe analitica C rispetto a cui le operazioni di gruppo sono funzioni anali-

tiche e tale struttura è univocamente determinata.

∈ 3 7→

Consideriamo un elemento g G, esso definisce un’applicazione differenziabile P : G h

g

P (h) = gh. Quindi, se P := dP , P : T G T G. Ulteriormente dalle proprietà del

g g∗ g g∗ h gh

differenziale vale P = P P . Fissato A T G, possiamo allora considerare l’equazione

∗ g∗ 1

f g∗ f

differenziale del prim’ordine df = P A .

f (t)∗

dt

con la condizione iniziale f (0) = 1 elemento neutro di G.

In base ai noti teoremi di esistenza ed unicità una soluzione f = f (t) esiste ed è unica local-

A

0 0

∈ 7→

mente. Consideriamo ora la funzione, per t fissato t H(t) := f (t )f (t). Se deriviamo

R A A

in t avremo: 0

H(t) = f (t )f (t) = P (f (t))

0

A A A

f (t )

A

per come è definita P e quindi segue che

0

dH(t) df (t )f (t) df (t)

A A A

= = P = P P A = P A .

0 0

f (t )∗ f (t )∗ f (t)∗ H(t)∗

A A A

dt dt dt

0 0

7→

D’altra parte la funzione t H (t) := f (t + t) soddisfa la stessa equazione differenziale:

A

0 0

0 df (t + t) df (t + t)

dH (t) A A

= = = P A = P A .

0 0

f (t +t)∗ H (t)∗

0 A

dt dt d(t + t)

0 0

e vale la condizione iniziale comune H(0) = H (0) = f (t ). Per il teorema di unicità conclu-

A

0 ∈

diamo che H(t) = H (t) ossia, per ogni A T G vale la proprietà di sottogruppo ad un

1

parametro 0 0 0

f (t )f (t) = f (t + t)( = f (t)f (t ) )

A A A A A

0 0

purché t, t , t + t appartengano al dominio della soluzione. La soluzione può essere estesa in

una soluzione massimale (che è sicuramente completa se G è compatto usando la proprietà di

sottogruppo ad un parametro).

Definizione 6.2. (Sottogruppo ad un parametro.) Sia G un gruppo di Lie. Per ogni

vettore A T G, la soluzione massimale dell’equazione

1 df = P A ,

f (t)∗

dt

indicata con 7→

t exp(tA) ♦

è detta sottogruppo ad un parametro generato da A.

106 −1 −t

Nota 6.2. Si osservi che in particolare (exp(tA)) = exp(−tA) purchè sia t che appar-

tengano al dominio della funzione.

Consideriamo ora A T G fissato e la classe di applicazioni parametrizzate per t definito in un

1

intorno di 0: 3 7→

F : G g exp(tA) g exp(−tA)

t,A |

Dato che F (1) = 1, il differenziale dF definisce un’applicazione da T G nello spazio tan-

1 1

t,A t,A

gente al punto exp(tA) 1 exp(−tA) cioè T G.

1

Definizione 6.3. (Aggiunto e commutatore.) Sia G un gruppo di Lie e si ponga, per

A T G,

1 3 7→

F : G g exp(tA) g exp(−tA) .

t,A

|

(a) Il differenziale dF indicato con

1

t,A →

Ad F : T G T G ,

1 1

t,A

e detto l’aggiunto di F .

t,A ×

(b) Il commutatore è l’applicazione da T G T G in T G data da

1 1 1

d |

[A, B] := (Ad F ) B .

t=0 t,A

dt

∈ ♦

per ogni coppia A, B T G.

1

Proposizione 6.1. In riferimento alle definizioni date si verificano facilmente le seguenti

proprietà del commutatore, la linearità a sinistra:

[aA + bB, C] = a[A, C] + b[B, C]

l’antisimmetria: −[B,

[A, B] = A]

(questa implica che la linearità valga anche a destra) e l’identità di Jacobi:

[A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0

∈ ∈ ♦

dove A, B, C T G e a, b sono arbitrari.

R

1 2.

Dimostrazione. Vedi [23]

Nota 6.3. Si noti che la linearità a sinistra e l’anti simmetria implicano immediatamente la

linearità a destra, per cui il commutatore è bilineare.

107

Definizione 6.4. (Algebre di Lie.) La struttura algebrica data da uno spazio vettoriale V

{ } × →

con un’applicazione, detta commutatore, , : V V V che gode delle proprietà di linearità

a sinistra, antisimmetria e identità di Jacobi è detta algebra di Lie. Ulteriormente:

0 0 0

{ }) { } →

(a) date due algebre di Lie (V, , e (V , , ), un isomorfismo di spazi vettoriali φ : V V è

detto isomorfismo di algebre di Lie se conserva la struttura di algebra di Lie, ossia soddisfa

0

{φ(A), ∈

anche φ(B)} = φ({A, B}) per ogni A, B V ;

(b) se G è un gruppo di Lie, l’algebra di Lie costituita dallo spazio tangente T G insieme al

1

commutatore [ , ] di definizione 6.3 è detta algebra di Lie del gruppo G.

Un famoso teorema dovuto a Lie prova che: 0

Teorema 6.1. (Teorema di Lie.) Se due gruppi di Lie G e G hanno algebre di Lie isomorfe

0

allora esiste un diffeomorfismo da un intorno dell’identità di G ad un intorno dell’identità di G

che è isomorfismo di gruppo: tali gruppi di Lie sono detti localmente isomorfi.

Inoltre per ogni algebra di Lie c’è un gruppo di Lie semplicemente connesso che ammette tale

algebra di Lie come algebra di Lie del gruppo, tale gruppo è determinato a meno di isomorfismi

di gruppi di Lie, cioè di diffeomorfismi che sono anche isomorfismi gruppali.

2.

Dimostrazione. Vedi [23] 0 ⊂

Definizione 6.5. (Sottogruppo di Lie.) Se G è un gruppo di Lie e G G è una sottova-

0

rietà embedded di G che è ancora gruppo rispetto alle operazioni di gruppo di G ristrette a G ,

0

allora G acquista naturalmente una struttura di gruppo di Lie indotta da quella di G e si dice

sottogruppo di Lie di G.♦

Commenti 6.1. 0

(1) È immediato provare che l’algebra di Lie di G risulta essere una sottoalgebra di Lie di

0 0

G, nel senso che T G è sottospazio vettoriale di T G e il commutatore su T G è la restrizione

1 1 1

0

del commutatore di T G a T G .

1 1

(2) Esiste un teorema molto potente (es. vedi [24]) che assicura che ogni sottogruppo chiuso

K di un gruppo di Lie analitico G è un sottogruppo di Lie analitico di G. La dimostrazione

richiede tecniche avanzate. In realtà il teorema ha validità generale per gruppi di Lie con la

nostra definizione: la richiesta di analiticità può essere omessa a causa del teorema di Gleason,

Montgomery e Zippin che assicura che ogni gruppo di Lie è anche un gruppo analitico di Lie

rispetto ad una struttura differenziabile analitica univocamente determinata.

In virtù dell’ultimo commento possiamo enunciare il seguente fondamentale teorema.

0 ⊂

Teorema 6.2. Se G G è sottogruppo chiuso del gruppo di Lie G, allora è anche sottogrup-

♦.

po di Lie di G.

Esercizi 6.1. 108

1. Se G è un gruppo di Lie e A , . . . A è una base nella sua algebra di Lie, essendo il

1 n

commutatore bilineare sull’algebra a valori nell’algebra, deve essere rappresentato da un tensore

∗ ∗

∈ ⊗ ⊗

C T G T G T G

1

1 1

In componenti k

[A , A ] = C A .

i j ij k

Le componenti di T sono dette costanti di struttura del gruppo.

Dimostrare che se due gruppi di Lie hanno le stesse costanti di struttura rispetto a due basi

nelle rispettive algebre di Lie allora sono localmente isomorfi nel senso del teorema di Lie.

Suggerimento: Provare che l’applicazione lineare che identifica le due basi è un isomorfismo

di algebre di Lie.

2. Sia G un gruppo di Lie e sia A , . . . , A una base della sua algebra di Lie. Si consideri

1 n n

l’applicazione definita su un intorno sufficientemente piccolo dell’origine di R

n n

P x A

1 n 7→ n .

F : (x , . . . , x ) e k=1

Dimostrare che tale applicazione (1) è ben definita, cioè l’intorno sufficientemente piccolo di cui

sopra esiste davvero, e che (2) definisce un sistema di coordinate della struttura differenziabile

di G nell’intorno dell’identità del gruppo. Tale sistema di coordinate viene detto sistema di

coordinate di prima specie.

Suggerimento: dai teoremi sulla dipendenza dai parametri dell’equazione nelle soluzioni delle

equazioni differenziali del prim’ordine su varietà segue che la funzione detta è localmente ben

n 7→

definita. Inoltre, se e , . . . , e è la base canonica di , dF : e A per ogni i = 1, . . . , n, per

R

1 n 0 i i

n →

cui dF : T G è iniettiva (e quindi surgettiva essendo i due spazi delle stesse dimensioni).

R

0 1 n

Il teorema della funzione implicita implica subito che F sia un diffeomorfismo locale tra e G

R

a valori in un intorno di 1 G.

3. Sia G un gruppo di Lie e sia A , . . . , A una base della sua algebra di Lie. Si consideri

1 n n

l’applicazione definita su un intorno sufficientemente piccolo dell’origine di R

1 n

1 n x A x A

7→ · · · n

H : (x , . . . , x ) e e .

1

Dimostrare che tale applicazione (1) è ben definita, cioè l’intorno sufficientemente piccolo di cui

sopra esiste davvero e che (2) definisce un sistema di coordinate della struttura differenziabile

di G nell’intorno dell’identità del gruppo. Tale sistema di coordinate viene detto sistema di

coordinate di seconda specie. i

i x A i

7→

Suggerimento: Ognuno dei gruppi ad un parametro x e è definito per x in un intorno

i

n

di 0, per cui c’è un intorno rettangolare dell’origine di in cui la funzione è definita. Inoltre,

R

n 7→

se e , . . . , e è la base canonica di , si prova facilmente che dH : e A per costruzione

R

1 n 0 i i

n →

per ogni i = 1, . . . , n, per cui dH : T G è iniettiva (e quindi surgettiva essendo i due

R

0 1

spazi delle stesse dimensioni). Il teorema della funzione implicita implica subito che H sia un

n ∈

diffeomorfismo locale tra e G a valori in un intorno di 1 G.

R 109

6.2 Gruppi di Lie di matrici.

Passiamo a specializzare la teoria a gruppi di Lie di matrici. È importante precisare che questa

non è una forte restrizione in quanto si può provare che ogni gruppo di Lie compatto è isomorfo ad

un gruppo di Lie matriciale (per quelli non compatti il teorema non vale, un controesempio tipico

è il rivestimento universale del gruppo SL(2, Nel seguito GL(n, indicherà il gruppo delle

R)). K)

×

matrici n n non singolari (cioè con determinante non nullo) sul campo e M (n, indicherà

K K)

×

l’insieme completo delle matrici n n sul campo che è sempre oppure

K R C.

2 2

n 1 n

Le coordinate naturali di , x , . . . , x determinano una matrice di M (n, se si identificano

K K)

le righe di quest’ultima come gli n gruppi di coordinate contigui di n elementi. D’ora in poi

seguiremo questa convenzione. 2

n

Possiamo mettere su M (n, la topologia indotta dalla norma naturale di che lo rende

K) K

spazio normato completo. Possiamo riscrivere tale norma come, se A M (n, K):

Ì n

X 2

||A|| |A |

:= .

ij

i,j=1

Abbiamo ora bisogno di alcuni risultati riguardanti l’estensione della funzione esponenziale a

valori in M (n, Tali risultati sono enunciati in tre lemmi di seguito. Il primo è in realtà più

C).

generale.

Lemma 6.1. Si consideri l’applicazione Ì n

X 2

3 7→ ||A|| |A |

M (n, A := .

K) ij

i,j=1

con = o Valgono le seguenti proprietà.

K C R.

(1) Tale applicazione è una norma su M (n, K).

(2) Se A, B M (n, allora

K) ||AB|| ≤ ||A||||B|| .

(3) Lo spazio M (n, dotato della norma detta sopra è completo.

C)

3 7→ ∈

(4) Se z A(z) M (n, è una funzione arbitraria a valori in M (n, allora

K R) R),

lim A(z) = A 0

z→z 0

se e solo se per ogni i, k = 1, . . . , n lim (A(z)) = (A ) .

0

ik ik

z→z 0

♦ 110 2

n

Dimostrazione. (1) L’applicazione definita sopra non è altro che la norma di scritta in

K

modo differente. (2) Ê

n n n sX X

X X X

2 2 2 2 4 4

|B |

||AB|| |A | |A | |B | ≤ |A | ,

= B =

ij ij ij pk

jk jk p

j

i,j,k=1 i,j,k=1 i,k=1

dove abbiamo applicato la disuguaglianza di Cauchy-Schwartz. Si tenga ora conto che banal-

mente (basta quadrare ambo membri):

sX X 2

4

|A | ≤ |A |

ij ij

j j

e vale la stessa cosa per B. Per cui dalle disuguaglianze di sopra n n

n n X X X

X X X 2 2 2

2 2 2 |B | ≤ |A | |B |

||AB|| |A | ≤ |A |

= B ij

ij ij pk pk

jk p i,j=1

j k,p=1

i,j,k=1 i,k=1

che significa 2 2 2

||AB|| ≤ ||A|| ||B|| .

Estraendo la radice quadrata ad ambo membri si ha la tesi. (3) È un risultato generale che tutti

gli spazi vettoriali di dimensione finita dotati di norma sono completi rispetto alla topologia

indotta dalla norma (vedi [25]). p

(4) Si tratta della ben nota proprietà (dai corsi elementari di analisi) di funzioni da a

K K

2

p 2

tenendo conto che la norma definita è quella di con p = n .

K ×

Nota 6.4. L’insieme delle matrici complesse n n unitamente alla norma definita sopra per

la completezza di M (n, definiscono quella che si chiama un’algebra di Banach.

K)

∈ ∈

Lemma 6.2. Se A M (n, e z la serie

C) C, ∞ k

A

X k

z k!

k=0

converge assolutamente (rispetto a alla norma di M (n, ed uniformemente nella topologia di

C))

|z| ≤

M (n, in ogni disco R < +∞ e può essere derivata sotto il segno di serie in z infinite

C)

volte. In particolare:

(1) la funzione ∞ k

A

X

zA k

3 7→ := z

z e (6.1)

C k!

k=0

è ben definita e infinitamente differenziabile su C;

(2) per ogni z vale

C d zA zA zA

e = Ae = e A , (6.2)

dz 111

0 ∈

(3) per ogni coppia z, z vale

C 0 0 0

zA+z A zA z A z A zA

e = e e = e e . (6.3)

Dimostrazione. La dimostrazione si basa sulla validità degli analoghi teoremi delle serie di

funzioni complesse a valori complessi che si estendono banalmente per serie di funzioni da a

C

valori in spazi di Banach. In particolare vale il teorema di Weierstrass che assicura che se una

serie è dominata da una serie di termini numerici positivi allora si ha la convergenza assoluta e

|z| ≤

uniforme. Nel nostro caso, se R, per il lemma 6.1

k k k

||A|| ||A||

A k k

k ≤ |z| ≤

z R

k! k! k!

e la serie di termini positivi ∞ k

||A||

X k

R k!

k=0

converge (a exp(R||A||)). |z| ≤

(1) Similmente, la serie delle derivate di ordine p converge uniformemente in R perché

dominata dalla serie convergente di termini positivi

∞ k

||A||

X k p p R||A||

||A|| ||A||

R = e .

k!

k=0

questo implica che per ogni intero p e per ogni coppia i, j = 1, . . . , n la serie di funzioni a valori

in C ∞ p k

d (A )

ij

X k

z

p

dz k!

k=0

converge assolutamente ed uniformemente. Usando iterativamente un noto teorema di analisi si

trova allora che, per ogni intero q e per ogni coppia i, j = 1, . . . , n esiste la derivata q esima di

(exp(zA)) e vale

ij ∞

q q k

d d (A ) ij

X k

(exp(zA)) = z .

ij

q q

dz dz k!

k=0 || ||

In base alla proprietà (4) del lemma 4.1, esiste la derivata q esima di exp(zA) nella norma

e vale ∞

q zA q k

d e d (A )

X k

= z .

q q

dz dz k!

k=0

In particolare la somma della serie può essere derivata sotto il segno di somma infinite volte.

Passiamo a (2) Semplicemente derivando sotto il segno di somma si ha

∞ ∞

k−1 k−1

d A A

X X

zA k−1 k−1

e = Az = z A

− −

dz (k 1)! (k 1)!

k=1 k=1

112

Ridefinendo k = p 1 e usando il lemma 4.1 da cui le proprietà

||A(exp(zA) − ≤ ||A||||(exp(zA) − →

S )|| S )|| 0

n n

e ||(exp(zA) − ≤ ||(exp(zA) − →

S )A|| S )||||A|| 0

n n

dove S è la ridotta della serie troncata all’ordine n, si ha

n Ž

„

∞ ∞ ∞

p p p

A A A

X X X

p p p

Az A :,

= A z = z

p! p! p!

p=0 p=0 p=0

che è la tesi.

Per concludere la prova di (3) è identica a quella che si ha per la funzione esponenziale a valori

0 0

numerici complessi, tenendo conto del fatto che (zA)(z A) = (z A)(zA) che viene usato in un

2

passaggio (vedi per esempio le prime pagine di [25]).

Nota 6.5. La proprietà (3) si può rinforzare, usando la stessa dimostrazione, in

A+B A B B A

e = e e = e e

sotto l’ipotesi che AB = BA .

In assenza di tale ipotesi la proprietà enunciata è generalmente falsa.

∈ ∈

Lemma 6.3. Se A M (n, allora, per ogni t

C) C

tr

tA t A

det e = e ,

in particolare tr

A A

det e = e .

Dimostrazione. Si consideri l’applicazione tA

3 7→

t det e .

C

Vogliamo calcolarne la derivata per t arbitrario. Ci interessa cioè

(t+h)A tA tA hA tA hA

− − −

dete dete det(e e ) dete dete 1

tA

lim = lim = dete lim

h h h

h→0 h→0 h→0

purché l’ultimo limite esista. Vale hA

e = I + hA + ho(h) ,

113 2

n

→ →

dove o(h) 0 se h 0 nella topologia metrica di per cui

C

(t+h)A tA

− −

det e dete det(I + hA + ho(h)) 1

tA

lim = dete lim .

h h

h→0 h→0

Ricordiamo che i ...i · · ·

n ,

B

detB = B

1 ni

1i n

1

per cui si ha subito che n

X

det(I + hA + ho(h)) = 1 + h A + h0(h) .

ii

i=1

Inserendo sopra troviamo che: tA

ddete tA

= dete trA .

dt

Ciò prova anche che la funzione considerata è infinitamente differenziabile. Quindi la funzione

tA

3 7→

infinitamente differenziabile f : t det e soddisfa l’equazione differenziale

C

A df (t)

A = (tr A)f (t) .

A

dt tr

t A

3 7→

La funzione infinitamente differenziabile g : t e soddisfa banalmente la stessa

C

A

equazione differenziale dg (t)

A = (tr A)g (t) .

A

dt

Entrambe le funzioni soddisfano la condizione iniziale f (0) = g (0) = 1, di conseguenza per il

A A

teorema di unicità delle soluzioni massimali delle equazioni differenziali del prim’ordine, le due

funzioni coincidono per ogni t e deve essere:

C tr

tA t A

dete = e .

2

Questo implica la tesi per t = 1.

Proposizione 6.2. (Il gruppo di Lie GL(n, Il gruppo GL(n, delle matrici reali

R)). R) 2

n

×

n n invertibili è un gruppo di Lie con la struttura di varietà differenziabile indotta da .

R

Valgono ulteriormente le seguenti proprietà. ×

(1) L’algebra di Lie di GL(n, è data dall’insieme di matrici reali n n, M (n, ed il

R) R)

commutatore è definito come −

[A, B] = AB BA ,

per ogni coppia A, B M (n, R). n

(2) I sottogruppi ad un parametro di GL(n, ) sono completi (cioè definiti su tutto nel

R R

parametro) ed hanno la forma tA

3 7→

t e

R 114

per ogni A M (n, dove l’esponenziale è quello definito nel lemma 6.2

R), 2

n

×

Dimostrazione. Pensiamo le matrici A reali n n come punti di le cui coordinate naturali

R

individuano, se lette di seguito in gruppi contigui di n elementi (le n righe di A). Per quanto

riguarda il fatto che GL(n, sia un gruppo di Lie, è sufficiente dimostrare due cose:

R)

(1) GL(n, è una varietà differenziabile;

R)

(2) le operazioni di composizione e di calcolo dell’inversa sono differenziabili rispetto alla strut-

2

n

tura differenziabile di .

R 2

n

La funzione determinante da in è indubbiamente differenziabile in quanto è un polinomio

R R

2

n \ {0}

nelle coordinate globali di . La controimmagine di secondo tale funzione è chiara-

R R

mente un insieme aperto essendo la funzione continua. Possiamo assegnare a tale insieme la

2

n

struttura di varietà differenziabile restringendo la carta globale naturale di a tale insieme.

R

Ciò definisce una struttura differenziabile su GL(n, che altro non è che l’insieme dei punti

R)

2

n

di sui quali la funzione determinante è non nulla. La seconda proprietà è ovvia per quanto

R

riguarda la moltiplicazione, per il calcolo della funzione inversa lo è anche usando, nell’insieme

aperto che definisce la varietà GL(n, la regola di Kramer per il calcolo dell’inversa, in quanto

R),

2

n ∈

le componenti (coordinate di ) della matrice inversa di A GL(n, sono funzioni razionali

R R),

con denominatori mai nulli nelle coordinate che definiscono la matrice A.

Veniamo alla seconda parte. Dimostriamo (1) e (2) insieme. Se A M (n, si consideri la

R),

tA

3 7→

funzione t e . In base al lemma 6.3 tale funzione ammette valori solamente in GL(n,

R R)

tr

tA t A ∈

perché det e = e > 0 per ogni A M (n, Usando (2) di lemma 4.2 otteniamo

R).

d tA tA tA

e = Ae = e A .

dt 0A

Per t = 0 si riottiene la matrice A che dunque è in T GL(n, perchè e = 1. Abbiamo provato

R)

1 2

⊂ ≤

che M (n, T GL(n, Dato che deve essere per costruzione dim T GL(n, n e che

R) R). R)

1 1

2 ∈

dim M (n, = n allora M (n, = T GL(n, Se A T GL(n, = M (n, l’equazione

R) R) R). R) R),

1 1

che definisce il sottogruppo ad un parametro generato da A si scrive banalmente (specializzando

la definizione 6.1 e tenendo conto che il prodotto del gruppo è quello matriciale ordinario):

df (t)

A = f (t)A .

A

dt

tA

3 7→

La funzione t e definita nel lemma 6.2 soddisfa banalmente tale equazione differenziale

R

di sopra a causa di (2) del suddetto lemma. Per l’unicità della soluzione questa è l’unica soluzione

ed è dunque la forma esplicita del sottogruppo ad un parametro generato da A. Si noti che per

costruzione la soluzione è completa. Applicando la definizione in (b) di definizione 6.3 si ha

immediatamente che il commutatore dell’algebra di Lie di GL(n, è

R)

€ Š

d −tA

tA

| −

[A, B] = e Be = AB BA

t=0

dt

2

per ogni coppia A, B M (n, R). 115

Possiamo allora dare la seguente definizione. ×

Definizione 6.6. (Gruppo di Lie matriciale reale n n). Un gruppo di Lie matriciale

× ♦

reale n n è un sottogruppo di Lie di GL(n, R).

Abbiamo le seguenti proprietà elementari dei gruppi di Lie matriciali di immediata verifica.

Proposizione 6.3. (Proprietà dei gruppi di Lie matriciali). Sia G un gruppo di Lie

×

matriciale reale n n allora valgono le seguenti proprietà. 2

n

(1) G è un gruppo di Lie con la struttura di varietà differenziabile indotta da .

R

(2) L’algebra di Lie di G è una sotto algebra di M (n, dotata del commutatore

R)

[A, B] = AB BA .

(3) I sottogruppi ad un parametro di G sono completi ed hanno la forma

tA

3 7→

t e

R

∈ ♦

per ogni A T G, dove l’esponenziale è quello definito nel lemma 6.2

1 2

Dimostrazione È tutto immediata conseguenza della proposizione 6.2

6.3 I gruppi di Lie O(3) e SO(3).

Esaminiamo un gruppo di Lie molto importante, il gruppo delle rotazioni n-dimensionali O(n):

t

{R ∈ |

O(n) := M (n, RR = I} .

R)

Abbiamo il seguente teorema.

Teorema 6.3. (Proprietà elementari del gruppo di Lie O(n).) si consideri l’insieme di

matrici: t

{R ∈ |

O(n) := M (n, RR = I} .

R)

Allora valgono le seguenti proprietà. ×

(1) O(n) è un gruppo di Lie matriciale reale n n chiuso rispetto alla trasposizione di matrici

ed è detto gruppo delle rotazioni n-dimensionali. ×

(2) L’algebra di Lie di O(n), indicata con o(n), è data dallo spazio vettoriale delle matrici n n

reali antisimmetriche. Tale spazio ha dimensione n(n 1)/2.

(3) O(n) è compatto. 116

Dimostrazione. (1) Prima di tutto mostriamo che O(n) è un gruppo ed è chiuso rispetto alla

0

∈ ∈

trasposizione. I O(n) banalmente, se R, R O(n) allora

0 0 0 0t

t t t t

(RR )(RR ) = RR R R = RIR = RR = I ,

per cui O(n) è chiuso rispetto al prodotto.È sufficiente provare, per concludere che O(n) è un

t

gruppo, che esso è chiuso rispetto al calcolo dell’inversa. Il fatto che RR = I implica che

t 2 ±1, 6

detR detR = 1 ossia (detR) = 1 da cui detR = ma in ogni caso detR = 0 per cui

esiste la matrice inversa di ogni R O(n) e coincide con la trasposta di R. Se proviamo che

−1 ∈ ∈

R O(n) abbiamo provato anche la chiusura rispetto alla trasposizione. Se R O(n), dato

−1 −1

t t

che l’inversa destra coincide con quella sinistra si ha R R = I, trasponendo R (R ) = I

−1 −1 −1 −1

t t ∈

ma essendo R = R , abbiamo che R (R ) = I ossia R O(n). Con ciò abbiamo

provato che O(n) è un gruppo rispetto al prodotto di matrici, per cui è anche sottogruppo di

GL(n, Per concludere il punto (1) dato che O(n) GL(n, è sufficiente provare che O(n)

R). R),

2

n

è una sottovarietà embedded di . Ricordiamo un ben noto teorema detto teorema dei valori

R

regolari [27, 2]:

si considerino due varietà differenziabili M, N con dimensione rispettivamente m, n con m > n, e

−1

→ ∈ ∈

una funzione differenziabile f : M N . Se p N è tale che per tutti i punti x P := f ({p})

df è suriettiva (cioè la matrice jacobiana associata ha rango n) allora P M è una sottovarietà

x −

embedded di M di dimensione m n.

Notiamo che la richiesta che df sia suriettiva è equivalente alla richiesta che:

x −

il nucleo di df abbia dimensione m n.

x 2

n

Consideriamo allora la definizione di O(n). In coordinate di R

n

X ij kj

ik − x x = 0 .

δ j=1

Queste equazioni non sono tutte indipendenti: se scambio i e k riottengo le stesse equazioni. Le

equazioni indipendenti sono per esempio quelle corrispondenti alla matrice triangolare superiore

× ≤

di una matrice simmetrica n n, cioè le equazioni di sopra con la restrizione i k. Quindi sono

n(n + 1)/2. Definiamo allora una funzione da

2

n n(n+1)/2

f : R R

con componenti n

X

ik 11 12 nn ik ij kj

f (x , x , . . . , x ) = δ x x

j=1 −1

≤ ∈

dove i k. f è chiaramente differenziabile, mostriamo che i punti R O(n) = f ({0}), dove

n(n+1)/2 2 −

0 è il vettore nullo di , sono tali che il nucleo di df ha dimensione n n(n + 1)/2(=

R R

n(n 1)/2). In base al teorema dei valori regolari ciò mostra che O(n) è una sottovarietà

2

n (e quindi GL(n, che contiene O(n) ed ha la struttura differenziabile indotta

embedded di R)

R

2

n −

) di dimensione n(n 1)/2. Cominciamo a provare che il nucleo di df ha dimensione

da R I

117

n(n−1)/2. Per calcolare la dimensione del nucleo di df consideriamo tutte le curve differenziabili

I

t

R = R(u) che soddisfano R(u)R(u) = I e R(0) = I e calcoliamo la dimensione dello spazio

generato dai vettori tangenti nel punto I a tali curve. Per costruzione tale spazio è il nucleo di

t

df . Da R(u)R(u) = I otteniamo, se Ṙ denota il vettore tangente in u = 0 cioè in I:

I t

Ṙ + Ṙ = 0

ossia t

Ṙ = Ṙ .

×

Le matrici trovate sono antisimmetriche reali n n. D’altra parte se A è una matrice antisim-

uA

×

metrica reale n n, la curva R(u) := e , che ammette A come vettore tangente in I, soddisfa

t

R(u)R(u) = I: direttamente dalla definizione di esponenziale

t −uA

uA uA t uA uA uA (u−u)A

e (e ) = e e = e e = e = I ×

Dunque il nucleo di df è dato dallo spazio vettoriale reale delle matrici reali n n antisimme-

I −

triche. È facile provare che tale spazio ha dimensione n(n 1)/2.

Passiamo ora a considerare il generico punto g O(n). Come sopra consideriamo tutte le cur-

t t

ve differenziabili R = R(u) che soddisfano R(u) R(u) = I (che equivale a R(u)R(u) = I) e

R(0) = g e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a tali

t

curve. Per costruzione tale spazio è il nucleo di df . Da R(u) R(u) = I otteniamo, se Ṙ denota

g

il vettore tangente in u = 0 cioè in g: t t Ṙ = 0

Ṙ g + g

−1

t

ossia, essendo g = g , t

−1

−1 −(g Ṙ) .

Ṙ =

g

Questo significa che Ṙ appartiene al nucleo di df se e solo se

g

Ṙ = gA

t t t

dove A = Ṙ g è antisimmetrica reale per Ṙ g + g Ṙ = 0. Cioè A appartiene al nucleo di df .

I

L’applicazione generata da g è per costruzione P e quindi è un isomorfismo di spazi vettoriali

g∗ →

essendo il differenziale del diffeomorfismo P : GL(n, GL(n, Quindi il nucleo di df ha

R) R).

g g

la stessa dimensione di quello di df e ciò prova che siamo nelle ipotesi del teorema dei valori

I

regolari: O(n) è una sottovarietà embedded di GL(n, R).

(2) In realtà la dimostrazione è stata data sopra in quanto i vettori tangenti a I in O(n) si

t

ottengono come i vettori tangenti per u = 0 delle curve R = R(u) che soddisfano R(u)R(u) = I

e R(0) = I. Abbiamo visto sopra che tale spazio coincide con quello delle matrici antisimmetriche

× −

reali n n che ha dimensione n(n 2)/2. 2

n k

(3) È sufficiente provare che O(n) è un sottoinsieme chiuso e limitato di in quanto, in , i

R R

chiusi limitati sono compatti (e viceversa). Per quanto riguarda la chiusura, è chiaro che O(n)

2

n

∈ → ∈ → ∞

contiene i suoi punti di accumulazione: se A O(n) e A A per k allora

R

k k

118 2

tk t tn t n

→ → ∈

banalmente A A e I = A A AA . Quindi A O(n). La limitatezza nella norma di R

n

è ovvia. Infatti, se R O(n): „ Ž

n n n

X X X

2

||R|| = =

R R δ = n .

ij ij ii

i=1 j=1 i=1

2

Teorema 6.4. (Struttura topologica di O(3) rispetto alla connessione.) Il gruppo di

Lie matriciale O(3) ha due componenti connesse date rispettivamente da:

il gruppo di Lie matriciale compatto (e connesso)

{R ∈ |

SO(3) := O(3) det R = 1}

detto gruppo speciale delle rotazioni tridimensionali e l’insieme compatto (che non è

sottogruppo) {P ∈ | ∈

P SO(3) := R O(3) R SO(3)}

−I

dove P := è l’inversione di parità.♦

∈ ±1

Dimostrazione. Si consideri R O(3). Allora det R = direttamente dalla definizione di

O(3). È immediato provare che il sottoinsieme delle matrici di O(3) con determinante 1 forma

un sottogruppo di O(3) che indicheremo con SO(3). Indichiamo con P SO(3) l’insieme conte-

−1, \

nente le matrici con determinante O(3) SO(3). È chiaro che tali due insiemi sono disgiunti

−I, ∈ ∈

e la loro unione è O(3). Definiamo P := vale P P SO(3). Se R O(3) può solo essere

∈ ∈ ∈

R SO(3) oppure R P SO(3). Valendo P P = I segue subito che P R, R P SO(3) se e solo

∈ {P ∈ | ∈

se rispettivamente R, P R SO(3). Di conseguenza, P SO(3) = R O(3) R SO(3)}.

Mostreremo ora che SO(3) è aperto, connesso e compatto. (Le stesse proprietà varranno anche

6∈

per P SO(3) perchè l’azione di P è un diffeomorfismo. Tuttavia I P SO(3) per cui quest’ultimo

non è sottogruppo.)

Consideriamo R SO(3). Dato che R è reale e che il polinomio caratteristico associato è di

terzo grado, dal teorema fondamentale dell’algebra segue che R dovrà avere almeno un auto-

valore reale λ che corrisponde ad una radice reale di tale polinomio (le altre due o sono reali

3

o sono complesse coniugate). La matrice R può sempre pensarsi come matrice unitaria in C

in tal caso è noto che (1) è diagonalizzabile, (2) gli autovalori sono della forma e per qualche

α Riassumendo: uno dei tre autovalori λ deve essere reale con modulo 1 e gli altri due

R. 1

devono essere anche essi reali oppure complessi coniugati ed in ogni caso tutti con modulo 1.

−1.

Per cui può essere solo λ = +1 o λ = Nel secondo caso, al fine di avere determinante,

1 1

1 cioè prodotto degli autovalori uguale a 1, anche gli altri due autovalori devono essere reali e,

iα ∈

dovendo essere della forma e almeno uno dei due deve essere 1. In definitiva: ogni R SO(3)

ammette sempre l’autovalore 1.

Sia e un autovettore normalizzato associato all’autovalore 1. Completiamo e a base ortonor-

1 1

3

male di : e , e , e . La trasformazione dalla base canonica a quella ottenuta sarà rappresentata

R 1 2 3 119

da una matrice L di O(3) perché entrambe le basi sono ortonormali. Quindi avremo che esiste

L O(3) tale che  

1 0 0

0

t e a b

LRL = R := . (6.4)

 

 

f c d

La matrice a secondo membro sarà necessariamente in O(3) perchè composizione di matrici

di O(3). Il calcolo del determinante con la regola di Binet mostra che R SO(3) implica

0 ∈

R SO(3). Imponendo la condizione di appartenenza a SO(3) si vede subito che

 

1 0 0

0 0 a b

R = . (6.5)

 

 

0 c d 0

2 2 2 2 −

dove a + b = c + d = 1, ac + bd = 0 e ad bc = 1. Si conclude facilmente che le matrice R

deve avere la forma  

1 0 0

0 cos θ sin θ

R := . (6.6)

 

θ  

0 sin θ cos θ

∈ ∈ ∈

dove θ Abbiamo provato che per ogni R SO(3) esiste L O(3) tale che

R. t L

R = L R

θ R t

∈ 7→

per qualche θ Se lasciamo variare θ da 0 a θ abbiamo una curva continua θ L R L

R.

R R θ

che congiunge I a R. Quindi SO(3) è connesso per archi continui. Di conseguenza è connesso.

Si osservi che SO(3) è anche un sottoinsieme aperto (nella topologia relativa) di O(3) essendo

l’intersezione tra O(3) e la controimmagine di (0, +∞) della funzione continua che calcola il

determinante su GL(n, R). 7→

Come già detto, dato che R P R è un diffeomorfismo di O(3), manda aperti connessi in aperti

connessi per cui essendo SO(3) aperto e connesso, P SO(3) è aperto e connesso. Essendo i due

insiemi connessi disgiunti con unione pari a O(3), essi costituiscono le componenti connesse di

O(3).

Per costruzione essendo SO(3) una componente connessa di O(3) è anche banalmente una sot-

tovarietà di O(3) nella struttura differenziabile indotta e quindi SO(3) è un sottogruppo di Lie

di O(3) e quindi un gruppo di Lie matriciale. Dato che le componenti connesse sono banalmente

aperte e chiuse, SO(3) è chiuso nel compatto O(3) per cui è compatto. Dato che I SO(3)

2

segue anche che l’algebra di Lie di SO(3) coincide con quella di O(3).

Corollario. Vale so(3) = o(3) dove so(3) := T SO(3).

1

120

Dimostrazione. P SO(3) non è un sottogruppo di O(3) perchè non contiene l’identità. Solo la

componente connessa SO(3) contiene l’identità e ciò implica immediatamente che

T SO(3) = T O(3) .

1 1

2

6.4 Teorema di rappresentazione di O(3) e SO(3).

Introduciamo una base particolare di so(3) data dalle matrici

(S ) = ,

i jk ijk

dove è la solita densità tensoriale di Ricci-Levi-Civita, esplicitamente

 

0 0 0

−1

0 0

S := , (6.7)

 

1  

0 1 0 

 0 0 1

0 0 0 , (6.8)

S := 

2 

 −1 0 0 

 −1

0 0

1 0 0 , (6.9)

S := 

3 

 0 0 0

Tali matrici sono antisimmetriche e quindi appartengono a so(3), inoltre è immediato provare

che sono linearmente indipendenti per cui sono una base di so(3). Le costanti di struttura

assumono una forma semplice in questa base, come si prova per computo diretto

k

[S , S ] = S , (6.10)

i j ij k

k

dove = sono le componenti della solita densità tensoriale di Ricci-Levi-Civita.

ij ijk

Vogliamo infine provare un teorema di rappresentazione delle matrici di SO(3). Abbiamo biso-

gno di alcuni risultati preliminari.

Lemma 6.4. Per ogni R SO(3) vale l’identità

3

X

t t

RS R = R S .

i j

ij

j=1

121

Dimostrazione. Partiamo dalla nota relazione

ijk

R R R = (det R) ,

pi qj pqr

rk ∈

dove gli indici sono stati abbassati con la metrica δ e la matrice R è arbitaria. Se R SO(3),

ij

la relazione di sopra diventa, cambiando anche i segni ad ambo membri:

ijk

− −

R R R =

pi qj pqr

rk

ossia X t

R (RS R ) = (S )

pi i qr p qr

i

ossia moltiplicando per R e sommando su p

pj X X

t

δ (RS R ) = R (S )

ij i qr pj p qr

p

i

che si riscrive X

t t

(RS R ) = R (S )

j p

jp

p

2

Il lemma appena provato permette di concludere con un teorema di rappresentazione di SO(3).

Teorema 6.5. (Rappresentazione di SO(3).) R SO(3) se e solo se esistono un versore

2

∈ ∈

n e un numero θ tale che

S R θn·S

R = e

dove 3

X i

·

n S := n S

i

i=1

essendo le matrici S T SO(3) date da

i 1 −

(S ) = .

i jk ijk

♦ ∈

Dimostrazione. Come provato nella dimostrazione del teorema 6.4, se R SO(3) allora esiste

t

L O(3) tale che R = LR L dove R è data in (6.6). Possiamo sempre cambiare, se necessario,

θ θ

−L ∈

L in P L = al fine di avere L SO(3) senza alterare il risultato di sopra. È facile provare

che θS

R = e 1

θ 122

Infatti calcolando la derivata in θ del primo membro tramite la (6.6), si trova facilmente che

dR

θ = S R .

1 θ

D’altra parte vale anche θS

de 1 θS

= S e .

1

1

per cui le due funzioni soddisfano la stessa equazione differenziale, ma anche la stessa condizione

iniziale: 0S

R = e = I ,

1

0 i

· P

per cui coincidono. Ne consegue che (dove usiamo la notazione n S := n S ):

i

i

·S −1

θS t θe

R = Le L = Le L .

1 1

Usando lo sviluppo dell’esponenziale si ha

1 1

·S −1 −1 −1 −1 −1

θe ·S+ ·Sθe ·S+· · · ·LSL ·LSL ·LSL · ·

Le L = L(I+θe θe )L = I+θe + θe θe +·

1 1 1 1 1 1 1

2 2

−1

dove abbiamo inserito dei fattori I = L L nei punti opportuni, per cui

−1 t

·S −1 ·LSL ·LSL

θe θe θe

Le L = e = e .

1 1 1

Usando il lemma 4.4, con ovvie notazioni

t t

· · ·

n LSL = e (L S) = (Le ) S ,

1 1

2 ∈

In definitiva, tenendo conto che n è un versore di se e solo se n = Ae per qualche A SO(3),

S 1

2

∈ ∈ ∈

abbiamo provato che, se R SO(3) allora per qualche θ e n ,

R S

θn·S

R = e .

2

∈ ∈

Viceversa se scegliamo n e θ e definiamo:

S R θn·S

R := e ,

allora, ricordando che le matrici S sono antisimmetriche:

i t −θn·S

t θn·S θn·S t θn·S θn·S θn·S (θ−θ)n·S

RR = e (e ) = e e = e e = e = I .

2

θn·trS 0

∈ ∈

Per cui R O(3). D’altra parte detR = e = e = 1, per cui R SO(3).

Si ha ovviamente il seguente corollario. 123 2

∈ ∈ ∈

Corollario. R P SO(3) se e solo se esistono un versore n e un numero θ tale che

S R

θn·S

−e

R = .

♦ ∈ ∈

Dimostrazione. Dato che P P = I, vale R P SO(3) se e solo se P R SO(3), da cui segue

2

−I.

immediatamente la prova della tesi essendo P =

Commenti 6.2. ∈

(1) Ci si può chiedere se per una R SO(3) la coppia θ, n che rappresenta R tramite il teorema

6.5 sia unica. È chiaro che se θ la risposta è negativa. Se restringiamo a [0, 2π] l’intervallo

R

di variazione di θ la risposta è ancora negativa perché una rotazione di θ riferita al versore n è

− −n

la stessa cosa che una rotazione di 2π θ riferita al versore (bisogna associare le rotazioni

ai versori secondo la stessa orientazione, per es la “legge della mano destra”). Possiamo allora

scegliere il range di θ in [0, π]. In tal caso le uniche ambiguità sono la descrizione di I che

2

∈ −n

corrisponde a θ = 0 e qualunque n e le rotazioni di π rispetto a n e che sono in realtà

S

la stessa rotazione.

(2) Quanto detto sopra consente una descrizione della topologia di SO(3) più approfondita. I

3 2

∈ ∈ ∈

punti di SO(3) li possiamo infatti determinare dai vettori θn con θ [0, π] e n . In

R S

3

tal modo i punti di SO(3) corrispondono ai punti di una palla chiusa in di raggio π tale che,

R

per ogni diametro, i punti diametralmente opposti sulla superficie della palla sono identificati.

±n

Tali punti corrispondo alle rotazioni di θ attorno a che sono, come detto la stessa cosa.

Possiamo mettere una topologia su tale spazio di punti P , semplicemente inducendola da quella

di SO(3) mappando le basi di intorni di SO(3) in P . Ogni cammino (continuo) chiuso in P

che non interseca il bordo della palla, è omotopo ad un punto in P . La stessa cosa accade per

cammini chiusi che arrivano fino al bordo della palla, eccetto il caso di cammini che connettono

due punti diametralmente opposti posti sulla superficie della palla: questi cammini apparente-

mente aperti, sono chiusi per la struttura dello spazio topologico e non sono omotopi a punti:

lo spazio non è semplicemente connesso. Si osservi che ognuno di tali cammini che connette

due punti diametralmente opposti sulla superficie della palla, purché si avvolga una volta sola,

è banalmente omotopo al cammino corrispondente dato dallo stesso diametro che connette i

due punti. Due cammini del tipo detto dati da due diametri differenti, sono sempre tra di loro

omotopi ruotando un diametro verso l’altro tenendo fisso il centro della palla. In definitiva ci

sono solo cammini omotopi a punti e cammini, che non lo sono, ma sono omotopi tra di loro a

patto che si avvolgano una volta sola. Per cammini che si avvolgono più volte la situazione è la

3

stessa di cammini in privato di un retta, per cammini che si avvolgono più volte attorno a ta-

R

le retta. Ciò porta a intuire che π (SO(3)) = In effetti tale fatto si può rigorosamente provare.

Z.

1

Esercizi 6.2. n n n

1. Si consideri il gruppo commutativo delle traslazioni su dato da stesso: se t

R R R

n n

3 7→ ∈

L : x x + t .

R R

t 124

Mostrare che tale gruppo è un gruppo di Lie matriciale sottogruppo di GL(n + 1, con algebra

R)

n

di Lie identificabile con stesso.

R n n+1

Suggerimento. Considerare come il piano in di equazione

R R

1 n+1 n+1 n+1

{(x ∈ |

, . . . , x ) x = 1} .

R

Quindi considerare la classe di matrici ™

– I t . (6.11)

0 1

2. Mostrare che il gruppo di Galileo è un gruppo di Lie matriciale sottogruppo di GL(5, R).

Suggerimento. Considerare la classe di matrici

– ™

Ω C

R,V 0 ; (6.12)

0 1

4 t

dove C è il vettore colonna con C = (c, X ) e

R 0 ™

– 0

1

Ω ; (6.13)

R,V 0 V R

0

3

∈ ∈

dove V e R O(3).

R

0 7

3. Mostrare che l’algebra di Lie del gruppo di Galileo è isomorfa alla somma diretta so(3)⊕R

come spazio vettoriale ma non lo e’ come algebra di Lie (cioè il commutatore non soddisfa

0 0 0

[(A, t), (A , t )] = ([A, A ], 0) ,

0 7

∈ ∈

dove A, A so(3) e t ).

R 125

Capitolo 7

La struttura del gruppo di Lie

O(1, 3).

In questa parte studieremo O(1, 3) come gruppo di Lie matriciale e daremo alcuni teoremi sulla

rappresentazione delle sue matrici. In particolare proveremo il teorema 2.4 che afferma che le

matrici di Lorentz sono decomponibili in una trasformazione di Lorentz speciale preceduta e

seguita da due rotazioni spaziali.

7.1 Il gruppo di Lie matriciale O(1, 3).

Similmente a quanto provato per O(n) dimostriamo che O(1, 3) è un gruppo di Lie matriciale.

Teorema 7.1. (Proprietà elementari del gruppo di Lie O(1, 3).) Il gruppo di Lorentz

t

{Λ ∈ |

O(1, 3) := M (4, ΛηΛ = η} ,

R)

dove  

−1 0 0 0

0 1 0 0

  , (7.1)

η =  

0 0 1 0

 

 0 0 0 1

soddisfa le seguenti proprietà. ×

(1) O(1, 3) è un gruppo di Lie matriciale reale 4 4 chiuso rispetto alla trasposizione di matrici.

(2) L’algebra di Lie di O(1, 3), indicata con o(1, 3) è data dallo spazio vettoriale a 6 dimensioni

×

delle matrici L, 4 4 reali che soddisfano la proprietà

t −L

ηL η = . (7.2)

126

16 ♦

(3) O(1, 3) è chiuso in ma non è compatto.

R

Dimostrazione. (1) Il fatto che O(1, 3) è un sottogruppo di GL(4, ed è chiuso rispetto alla

R)

trasposizione è stato provato nel teorema 2.2 Vogliamo provare che O(1, 3) è una sottovarietà

16

embedded di usando la stessa procedura seguita nel teorema 6.3 per O(n).

R 16

Consideriamo allora la definizione di O(1, 3). In coordinate di R

n

X

ik ij kr

η x η x = 0 .

jr

j,r=1

Queste equazioni non sono tutte indipendenti: se si scambiano i e k si riottengono le stesse equa-

zioni. Le equazioni indipendenti sono per esempio quelle corrispondenti alla matrice triangolare

× ≤

superiore di una matrice simmetrica 4 4, cioè le equazioni di sopra con la restrizione i k.

Quindi sono 10. Definiamo allora una funzione da

16 10

f : R R

rs

con componenti (se η := η )

rs n

X ij kr

ik 11 12 44 ik − x η x

f (x , x , . . . , x ) = η jr

j,r=1 −1

≤ ∈

dove i k. f è chiaramente differenziabile, mostriamo che i punti Λ O(1, 3) = f ({0}), dove

10 −

0 è il vettore nullo di , sono tali che il nucleo di df ha dimensione 16 10 = 6. In base al

R Λ 16

teorema dei valori regolari ciò mostra che O(1, 3) è una sottovarietà embedded di (e quindi

R

16

di GL(4, che contiene O(1, 3) ed ha la struttura differenziabile indotta da ) di dimensione

R) R

6. Cominciamo a provare che il nucleo di df ha dimensione 6. Per calcolare la dimensione del

I t

nucleo di df consideriamo tutte le curve differenziabili Λ = Λ(u) che soddisfano Λ(u)ηΛ(u) = η

I

e Λ(0) = I e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a

t

tali curve. Per costruzione tale spazio è il nucleo di df . Da Λ(u)ηΛ(u) = η otteniamo, se Λ̇

I

denota il vettore tangente in u = 0 cioè in I: t

Λ̇η + η Λ̇ = 0

−1

t

ossia, ricordando che η = η = η , t

−η

Λ̇ = Λ̇ η .

Le matrici trovate hanno la struttura: t

 

1 c

 

L = , (7.3)

 

c A

 

 

127 3

×

dove A è una matrice antisimmetrica reale 3 3 e c un vettore colonna di . D’altra parte

R

uL

se L ha la struttura di sopra, la curva Λ(u) := e , che ammette L come vettore tangente in

t

I, soddisfa Λ(u)ηΛ(u) = η: direttamente dalla definizione di esponenziale e tenendo conto che

ηη = I, t t t −uL

uL uL t uL uL uL uL uL uηL η uL

e η(e ) = e ηe = e ηe ηη = e e η = e e η = η

×

Dunque il nucleo di df è dato dallo spazio vettoriale reale delle matrici reali 4 4 che soddisfano

I

(7.3). È facile provare che tale spazio ha dimensione 6: la matrice antisimmetrica A dipende da

3 elementi, mentre il vettore c ha 3 componenti.

Passiamo ora a considerare il generico punto g O(1, 3). Come sopra consideriamo tutte le curve

t t

differenziabili Λ = Λ(u) che soddisfano Λ (u)ηΛ(u) = η (che equivale a Λ(u)ηΛ(u) = η per la

chiusura del gruppo rispetto al calcolo della trasposta) e Λ(0) = g e calcoliamo la dimensione

dello spazio generato dai vettori tangenti nel punto g a tali curve. Per costruzione tale spazio è

t

il nucleo di df . Da Λ (u)ηΛ(u) = η otteniamo, se Λ̇ denota il vettore tangente in u = 0 cioè in

g

g: t t

Λ̇ ηg + g η Λ̇ = 0 .

−1

t ∈

Essendo ηη = 1 e valendo ηg η = g da g O(1, 3), l’identità di sopra si riscrive con qualche

passaggio: t

−1 −1

−η(g

g Λ̇ = Λ̇) η .

Questo significa che Ṙ appartiene al nucleo di df se e solo se

g

Λ̇ = gL

dove L soddisfa (7.3). Cioè L appartiene al nucleo di df . L’applicazione generata da g è

I

per costruzione P e quindi è un isomorfismo di spazi vettoriali essendo il differenziale del

g∗ →

diffeomorfismo P : GL(4, GL(4, Quindi il nucleo di df ha la stessa dimensione di

R) R).

g g

quello di df e ciò prova che siamo nelle ipotesi del teorema dei valori regolari: O(1, 3) è una

I

sottovarietà embedded di GL(4, R).

(2) In realtà la dimostrazione è stata data sopra in quanto i vettori tangenti a I in O(1, 3) si

t

ottengono come i vettori tangenti per u = 0 delle curve Λ = Λ(u) che soddisfano Λ(u)ηΛ(u) = η

×

e Λ(0) = I. Abbiamo visto sopra che tale spazio coincide con quello delle matrici reali 4 4 che

ha dimensione 6 definito da (7.2).

(3) Per la chiusura si procede esattamente come per O(3), per la non compattezza è sufficiente

16 k

provare che O(1, 3) non è limitato in in quanto, in , i chiusi limitati sono tutti e soli

R R

compatti e viceversa. Si consideri a tal fine la matrice 

 cosh χ sinh χ 0 0

sinh χ cosh χ 0 0

  ,

Λ(χ) = 

 0 0 1 0 

 

0 0 0 1 2

∈ ∈ ||λ(χ)||

è immediato verificare che (1) Λ(χ) O(1, 3) per ogni χ ma anche (2) =

R,

2

2 2 → →

2 + 2 cosh χ + 2 sinh χ +∞ per χ +∞.

128

Passiamo a studiare O(1, 3). Una base di matrici di tale spazio vettoriale è data, come si prova

facilmente, dalle seguenti 6 matrici. le prime tre, S , S e S sono definita da, per i = 1, 2, 3

1 2 3

 

0 0 0

0

0

 

S = , (7.4)

 

i 0 S

 

i

 

0

dove S , S e S sono definite in (6.7), (6.8), (6.9) rispettivamente. Le rimanenti 3 matrici dette

1 2 3

boosts sono date da  

1 0 0

0

1 0 0 0

 

K = , (7.5)

 

1 0 0 0 0

 

 

0 0 0 0 

 0 1 0

0

0 0 0 0 

 , (7.6)

K = 

2 1 0 0 0 

 

 0 0 0 0

 

0 0 0 1

0 0 0 0

  . (7.7)

K =  

3 0 0 0 0

 

 

1 0 0 0

k

Se poniamo := , si verifica facilmente per computo diretto che valgono le seguenti

ij ijk

relazioni di commutazione (dove c’è la regola di somma sugli indici ripetuti):

k

[S , S ] = S , (7.8)

i j ij k

k

[K , K ] = S , (7.9)

i j ij k

k

[S , K ] = K . (7.10)

i j ij k

Tali relazioni sono spesso chiamate impropriamente, le relazioni di commutazione del grup-

po di Lorentz.

Commenti 7.1.

(1) Se definiamo  

1 0 0 0

0 

 ; (7.11)

Ω = 

R 0 R

 

 

0 129

∈ 3 7→ ∈

dove R O(3), l’applicazione O(3) R Ω O(1, 3) è una rappresentazione fedele (cioè

R

iniettiva) di O(3) data in termini di matrici di Lorentz. ∈

(2) Il teorema 6.5 si estende banalmente alle matrici Ω , con R SO(3), nell’asserto che se

R

R SO(3) allora θm·S

Ω = e , (7.12)

R

2

∈ ∈

per qualche scelta di θ e m , e viceversa ogni matrice nel secondo membro di (7.12) è

R S

della forma (7.11) dove θm·S

R = e .

L’ultima delle relazioni di commutazione del gruppo di Lorentz ha un importante corollario che

2

è il corrispondente del lemma 6.4 e che ci servirà tra poco. Al solito se n e A = (A , A , A )

S 1 2 3

è un vettore di matrici usiamo la notazione (dove è sottintesa la somma sugli indici ripetuti):

i

·

n A := n A .

i

Lemma 7.1. In riferimento alle matrici scritte sopra, vale l’identità:

€ Š

−θn·S

θn·S θn·S

· ·

e m K e = e m K , (7.13)

2

∈ ∈ ♦

per ogni coppia n, m e θ

S R.

Dimostrazione. La dimostrazione si ottiene come segue. Si definiscano le due funzioni

differenziabili a valori matriciali: θn·S θn·S

f : θ e K e

p p

e € Š

−θn·S

X

g : θ e K .

p k

pk

k

Derivando f in θ ed usando le regole di commutazione (7.10) si prova facilmente che

p df p i j

−n

= f (θ) .

pi j

Nello stesso modo, usando la definizione delle matrici S :

k

dg

p i j

−n

= g (θ) .

pi j

Dunque le due funzioni soddisfano la stessa equazione differenziale e coincidono in θ = 0

banalmente. Per il teorema di unicità globale sono la stessa funzione:

€ Š

−θn·S

X

θn·S θn·S e

e K e = K

p k

pk

k

130

da cui € Š

−θn·S

X

θn·S p θn·S p K

e m K e = m e

p k

pk

k

ossia € Š

−θn·S

θn·S θn·S

· ·

e m K e = m e K

e quindi € Š

−θn·S

θn·S θn·S

· ·

e m K e = e m K .

2

7.2 Le trasformazioni pure di Lorentz o “boosts” e la decompo-

sizione polare del gruppo di Lorentz.

Abbiamo bisogno di qualche risultato e definizione preliminare.

Ricordiamo l’enunciato del teorema di decomposizione polare [2] specializzato al caso di dimen-

sione finita.

Teorema 7.2. (Teorema di decomposizione polare in dimensione finita.) Sia V

uno spazio vettoriale di dimensione finita sul campo oppure dotato di prodotto scalare

C R, →

hermitiano, rispettivamente prodotto scalare reale simmetrico. Sia A : V V un operatore

iniettivo (equivalentemente suriettivo).

(1) Se = allora:

K C →

(i) esistono e sono unici un operatore strettamente positivo M : V V ed un operatore

unitario, rispettivamente ortogonale, U : V V tali che sussista la decomposizione:

A = UM , 0 →

(ii) esistono e sono unici un operatore strettamente positivo M : V V ed un operatore

0 →

unitario, rispettivamente ortogonale, U : V V tali che sussista la decomposizione:

0 0

A = M U ,

0 0 †

(iii) Vale U = U e M = U M U . 0

(2) Se = valgono ancora (i), (ii) e (iii) di sopra con le uniche differenze che M e M sono

K R 0 ♦

operatori simmetrici strettamente positivi e U , U sono operatori ortogonali.

Definiamo preventivamente una matrice che sarà utile in tutto il seguito.

 

1 0 0 0

0

 

−η)

P (= := ; (7.14)

 

−I

0

 

 

0

131 −I

è detta inversione di parità. Si osservi che la matrice tridimensionale è stata preceden-

temente indicata con P . In questa sezione P indicherà invece la matrice di sopra che ne è una

banale estensione. Ricordiamo che l’inversione del tempo

 

−1 0 0 0

0

 

T (= η) := ; (7.15)

 

0 I

 

 

0

Le matrici I, P, T, P T = T P formano un sottogruppo commutativo di O(1, 3) che diremo sot-

togruppo discreto di Lorentz. 4

Ora, per prima cosa mostriamo che il teorema di decomposizione polare per operatori su R

applicato a matrici di Lorentz produce una coppia di matrici di Lorentz. Tale risultato non è

4

affatto banale: se Λ O(1, 3) il teorema di decomposizione polare per operatori su (con

R

prodotto scalare positivo usuale) assicura che (in una delle due versioni)

Λ = MU

t ∈ ∈

dove M = M e M > 0 e U O(4). Niente assicura a priori che M, U O(1, 3)! In realtà vale

il seguente teorema. ∈

Teorema 7.3. (Decomposizione polare di O(1, 3).) Sia Λ O(1, 3) allora vale quanto

segue: ∈

(1) esiste ed è unica una coppia di matrici Λ , Ω M (4, tali che

R)

p

Λ = Λ Ω (7.16)

p

tp ∈

, Λ > 0 e Ω O(4);

unitamente a Λ = Λ p

p 0 0 ∈

(2) esiste ed è unica una coppia di matrici Λ , Ω M (4, tali che

R)

p 0 0

Λ = Ω Λ (7.17)

p

tp 0 0

0 0 ∈

, Λ > 0 e Ω O(4);

unitamente a Λ = Λ

p p

(3) vale in realtà: 0

Ω = Ω , (7.18)

0 t

Λ = Ω Λ Ω ; (7.19)

p

p

(4) le decomposizioni in (1) e (2) sono decomposizioni all’interno di O(1, 3) in quanto risulta

0 ∈

Λ , Λ , Ω O(1, 3) ,

p p

ed ulteriormente:

(i) Ω = Ω , oppure

R 132

(ii) Ω = T Ω , oppure

R

(ii) Ω = P Ω , oppure

R

(iv) Ω = P T Ω ,

R

e Ω è una pura rotazione speciale spaziale data dalla (7.11):

R  

1 0 0 0

0

 

Ω = ;

 

R 0 R

 

 

0

dove R SO(3). 0

(5) le matrici Λ , Λ godono delle seguenti proprietà:

p p 0

(i) det Λ = det Λ = 1,

p p

0 ∈ ♦

(ii) Λ , Λ O(1, 3)↑.

p p

Dimostrazione. Riguardo ai punti (1),(2) e (3) la dimostrazione segue immediatamente dal

4

teorema di decomposizione polare (teorema 7.2) per operatori sullo spazio vettoriale reale R

4 i i

P

dotato del prodotto scalare (u|v) = u v . Per provare la prima parte del punto(4) proce-

i=1 −1

diamo come segue. Notiamo che, dato che esiste Λ per la stretta positività di Λ , è sufficiente

p

p −1

∈ ∈

provare che Λ O(1, 3). Ciò implica subito che Ω = Λ Λ O(1, 3) perché prodotto di due

p p

0 t ∈

= Ω Λ Ω O(1, 3) perchè prodotto di tre elementi di O(1, 3). Quindi

elementi di O(1, 3) e Λ p

p

proviamo che Λ O(1, 3).

p

3

Da O(1, 3) Λ = Λ Ω e tenendo conto che Λ è simmetrica troviamo che

p p t

Λ ΩηΩ Λ = η

p p

e quindi −1 −1

t

ΩηΩ = Λ ηΛ . (7.20)

p p −1

t

Eseguendo il calcolo dell’inversa ad ambo membri e tenendo conto che Ω = Ω e ηη = I, si ha

t

ΩηΩ = Λ ηΛ . (7.21)

p p

Uguagliando i secondi membri di (7.20) e (7.21) ed usando ancora ηη = I si ha subito

−2

2

ηΛ η = Λ . (7.22)

p p

2 ≥

Notiamo che ηΛ η 0 ed è simmetrico per costruzione per cui ammette un’unica radice qua-

p 2

drata. Quest’ultima deve essere ηΛ η in quanto ηΛ η è simmetrica e positiva e vale (ηΛ η) =

p p p

−2

2

ηΛ ηηΛ η = ηΛ η. D’altra parte l’unica radice quadrata di Λ (che è simmetrica e positiva) è

p p p p

−1

Λ (che è simmetrica e positiva). In definitiva, estraendo le radici quadrate da ambo membri

p

di (7.22) otteniamo: −1

ηΛ η = Λ ,

p p

133

che equivale, moltiplicando a destra per Λ ed a sinistra per η (usando ηη = I), a

p tp

Λ ηΛ = η ,

p

tp ∈

dove si è tenuto conto del fatto che Λ = Λ . Abbiamo ottenuto che Λ O(1, 3) con ciò, come

p p

detto è provata la prima parte di (4). Per la seconda parte, è sufficiente notare che in base a alla

t t

∈ ∩

prima parte, Ω O(1, 3) O(4), ossia ΩηΩ = η e ΩΩ = I. Imponendo entrambe le condizioni

×

su una generica matrice reale 4 4 risulta immediatamente che essa deve avere la forma

 

±1 0 0 0

0

 

 

0 R

 

 

0

dove R O(3) da cui segue immediatamente la tesi tenendo conto del teorema 6.4 Tale risultato

completa la dimostrazione di (4).

La prova di (5) è immediata. Consideriamo solo Λ senza perdere generalità. La positività di Λ

p p

0 ≥ ∈

implica che Λ 0 per cui Λ O(1, 3)↑. La stessa positività implica che tutti gli autovalori

0 p tp

≥ ±1

di Λ siano non negativi per cui det Λ 0, ma dovendo essere det Λ = (perchè Λ ηΛ = η

p p p p

2

2

da cui (detΛ ) = 1) deve valere det Λ = 1.

p p ∈

Definizione 7.1. (Trasformazioni Pure di Lorentz.) Una trasformazione Λ O(1, 3) è

p

detta trasformazione o matrice pura di Lorentz se soddisfa le due condizioni:

(a) tp

Λ = Λ ,

p

(b) Λ > 0 .

p

Equivalentemente una trasformazioni di Lorentz è pura se è il fattore simmetrico positivo della

decomposizione polare di una matrice di Lorentz.

Commenti 7.2. ≥

(1) È chiaro che, essendo Λ simmetrica e non singolare Λ > 0 equivale a Λ 0 usando la

p p p

decomposizione spettrale.

(2) È chiaro che le trasformazioni pure sono tutte e sole le matrici Λ del teorema 7.3 che si

p

ottengono decomponendo polarmente tutte le matrici di Lorentz. Si tenga conto del fatto che la

decomposizione polare di una trasformazione pura coincide con la stessa matrice da decomporre

per l’unicità della decomposizione. ∈

(3) In particolare quindi ogni trasformazione pura soddisfa det Λ = 1 e Λ O(1, 3)↑.

p p

Passiamo a dare un primo teorema di rappresentazione delle trasformazioni pure di Lorentz.

Tale teorema ed il successivo servirà sia a studiare le componenti connesse del gruppo di Lorentz

sia a dare un teorema di rappresentazione del gruppo di Lorentz.

134

Teorema 7.4. (Rappresentazione delle trasformazioni pure.) Le matrici pure di Lo-

rentz soddisfano le seguenti proprietà:

(a) il loro insieme coincide con la classe di matrici di M (4, della forma:

R)

t

 

B

γ

  , (7.23)

 

t

B I+ BB /(1 + γ)

 

 

dove p 2

γ = 1 + B (7.24)

3

e B è un qualsiasi vettore colonna,

R ∈

(b) se Λ è definita come in (7.23), R SO(3) e Ω è definita da (7.11), allora

p R t

 

(RB)

γ

 

tR

Ω Λ Ω = , (7.25)

 

p

R t

RB I+ RB(RB) /(1 + γ)

 

 

È √

2 2 ♦

dove γ = 1 + (RB) (= 1 + B ).

Dimostrazione. Cominciamo con la prova di (b). Tale prova si ottiene facendo il calcolo diretto

tR ∈

del prodotto Ω Λ Ω per una generica R M (4, Tale prodotto fornisce immediatamente il

R).

p

R √ 2 ∈

secondo membro di (7.25) dove però γ = 1 + B . Se ulteriormente vale R SO(3), il modulo

di B coincide con quello di RB e ciò non altera il valore di γ.

(a) Partendo da una generica matrice di M (4, della forma

R)

t

 

γ c

 

Γ := , (7.26)

 

b A

 

 

3

∈ ∈

dove b, c sono due qualsiasi vettori colonna e A M (3, è arbitraria, la simmetria di Γ

R R) t

implica che b = c, il cui valore comune lo indicheremo con B, e A = A , la richiesta di positività

della matrice Γ implica che γ > 0 e A > 0. Infine l’imposizione della condizione di Lorentz

t

ΓηΓ = η porta alle condizioni:

√ 2

±

(1) γ = 1 + B in cui si deve scegliere il segno positivo per la positività di gamma;

(2) AB = γB;

t t 2 t

(3) AA = I + BB che equivale a A = I + BB per la simmetria di A.

Dall’ultima equazione e tenuto conto del fatto che A > 0, si evince che A deve coincidere

t

con la radice quadrata di I + BB che è univocamente definita come sappiamo dalla sezione

precedente. Tenendo conto di (1), una matrice evidentemente (strettamente) positiva il cui

135

t t

quadrato è I + BB è I + BB /(1 + γ) e che soddisfa anche (2). Questa è dunque la soluzione.

Abbiamo provato che le matrici pure hanno la forma (7.23). D’altra parte, se Λ O(1, 3) ha

p

la forma (7.23), è immediato provare che si tratta di una matrice simmetrica che soddisfa il

tp

vincolo Λ ηΛ = η. Mostriamo che tale matrice è anche necessariamente (strettamente) positiva

p 6

e ciò conclude la dimostrazione. Se Λ ha la forma (7.25) con B = 0 (in caso contrario la tesi è

p ∈

ovviamente vera), usando la formula (7.25) con una R SO(3) opportuna possiamo ruotare il

vettore B in modo che abbia solo la prima componente non nulla. È chiaro che, essendo Ω non

R

tR

singolare, la matrice Ω Λ Ω è (strettamente) positiva se e solo se Λ è (strettamente) positiva.

p p

R

Quindi la tesi si riduce a provare che una matrice della forma

 

γ B 0 0

2

B (1 + γ + B )/(1 + γ) 0 0

  , (7.27)

 

0 0 1 0

 

 

0 0 0 1

2 2

∈ −

è positiva dove B Si noti che B = γ 1 per costruzione, per cui la matrice di sopra è

R.

scrivibile come: 

 B 0 0

γ

B γ 0 0 

 , (7.28)

 0 0 1 0 

 

 0 0 0 1

Il calcolo degli autovalori fornisce oltre a 1 contato due volte

± |B|

λ = γ .

±

√ 2 |B|

Essendo γ = 1 + B > risulta λ > 0, per cui tutti gli autovalori sono strettamente posi-

± 2

tivi e la matrice è strettamente positiva.

Nota 7.1. Supponiamo che Λ sia la matrice di Lorentz pura che connette coordinate

p F F 0

minkowskiane dei riferimenti inerziali e :

i

0 i ip j

x = C + Λ x .

j →

− F 0

3

Il vettore B è costituito dalle componenti di V /c nelle coordinate di , dove V =

R

− F 0

cγ∂ + V è la quadri velocità di . Nella componente temporale, il fattore γ è proprio Λ .

F 0 0

p

In questo senso e con notazione impropria, si può scrivere

− t

 

γ V /c

 

Λ = , (7.29)

− →

− →

 

p t 2

 

V /c I+ V V /[c (1 + γ)]

 

136

3

Similmente, se v denota il vettore colonna di le cui componenti sono le componenti della

R

F F 0

velocità di trascinamento di in allora si può scrivere

t

 

γv /c

γ

 

Λ = , (7.30)

 

p 2 t 2

γv/c I+ γ vv /[c (1 + γ)]

 

  È 2 2

1 v /c .

dove la relazione tra γ e v come già provato (vedi sotto la definizione 4.3) è γ = 1/

Un’ultima parametrizzazione si ottiene come segue partendo direttamente da (7.23). L’equazione

|B|

(7.24) implica che possiamo parametrizzare γ e come segue:

γ = cosh χ , (7.31)

|B| = sinh χ , (7.32)

2

∈ ∈ 7→

dove χ [0, +∞). Introducendo il versore n , la corrispondenza (χ, n) B := (sinh χ)n è

S

biunivoca eccetto per B = 0 che corrisponde a tutti i valori di n e χ = 0. Infine notiamo che,

2 2 −

essendo sinh χ = cosh χ 1,

t 2 t t

BB /(1 + γ) = (sinh χ)nn /(1 + cosh χ) = (cosh χ 1)nn .

In definitiva, le trasformazioni pure le possiamo rappresentare come

t

 

cosh χ (sinh χ)n

 

Λ = , (7.33)

 

p t

(sinh χ)n I+ (cosh χ 1)nn

 

 

2

∈ ∈

dove χ [0, +∞) e n ed, eccetto per χ = 0, la corrispondenza sopra scritta tra trasforma-

S 2

∈ ×

zioni pure di Lorentz e parametri (χ, n) [0, +∞) è biunivoca.

S

F F 0

In termini di velocità di trascinamento di rispetto a , con le convenzioni usate sopra, si ha

subito che v/|v| = n , (7.34)

|v|/c = tanh χ . (7.35)

L’ultima rappresentazione trovata nell’osservazione di sopra può anche essere scritta in altro

modo.

Teorema 7.5. (Rappresentazione esponenziale delle trasformazioni pure.) Le tra-

sformazioni pure di Lorentz sono tutte e sole le matrici della forma

χn·K

e , (7.36)

137

2

∈ ∈

dove n e χ Inoltre la corrispondenza tra matrici pure di Lorentz e coppia di parametri

S R. 2

∈ ♦

(χ, n) ad esse associate è biunivoca se n e χ > 0.

S ∈

Dimostrazione. In base all’osservazione di sopra,è sufficiente provare che, per ogni (χ, n)

2

× :

R S t

 

cosh χ (sinh χ)n

 

χn·K

e = . (7.37)

 

t

(sinh χ)n I+ (cosh χ 1)nn

 

 

0 00

Per provare ciò indichiamo con Λ e Λ il primo e secondo membro della (7.37). Vogliamo provare

che 0 00

Λ = Λ .

2

∈ ∈

A tale scopo notiamo che per ogni n esiste R SO(3) tale che Rn = e primo vettore della

S 1

3

base canonica di . Consideriamo allora Ω associata a R secondo la (7.11). Il calcolo diretto

R R

(o passando per (b) del teorema 7.4) prova subito che t

 

cosh χ (sinh χ)e 1

 

00 tR

Ω Λ Ω = . (7.38)

 

R t

(sinh χ)e I+ (cosh χ 1)e e

 

1 1 1

 

In altre parole:  

cosh χ sinh χ 0 0

sinh χ cosh χ 0 0

 

00 tR

Ω Λ Ω = . (7.39)

 

R 0 0 1 0

 

 

0 0 0 1

0

Consideriamo ora Λ . Usando lo sviluppo dell’esponenziale non ci sono difficoltà a provare che

t

0 tR χn·Ω KΩ .

Ω Λ Ω = e R R

R

Usando (7.12) ed il lemma 6.1 nel secondo membro abbiamo immediatamente che

0 tR χ(Rn)·K

Ω Λ Ω = e ,

R

ossia 0 ·K

tR χe χK

Ω Λ Ω = e = e .

1 1

R χK

Infine il calcolo esplicito dell’esponenziale e (per esempio con la solita procedura basata sul

1

teorema di unicità delle soluzioni di equazioni differenziali) mostra che

 

cosh χ sinh χ 0 0

sinh χ cosh χ 0 0

 

0 tR χK

Ω Λ Ω = e = . (7.40)

1  

R 0 0 1 0

 

 

0 0 0 1

138

Per confronto con (7.39) abbiamo ottenuto che

0 00

tR tR

Ω Λ Ω = Ω Λ Ω ,

R R

tR

che implica subito, moltiplicando a sinistra per Ω e a destra per Ω R

0 00

Λ = Λ .

2

la dimostrazione è conclusa.

Le trasformazioni pure di Lorentz includono le ben note cosiddette trasformazioni speciali di

Lorentz che si ottengono quando la velocità di trascinamento è parallela ad uno dei tre assi delle

coordinate spaziali minkowskiane. Abbiamo già incontrato le trasformazioni speciali lungo l’asse

3

x varie volte nelle sezioni precedenti.

Definizione 7.2. (Trasformazioni speciali di Lorentz.) Una trasformazione pura di

Lorentz tale che, in riferimento alla rappresentazione del teorema 6.4, n = e (i-esimo versore di

i

3 i ♦

) è detta trasformazione speciale di Lorentz lungo l’asse x .

R F F 0

Se v è il valore scalare con segno della velocità di trascinamento di rispetto a dotati di

coordinate minkowskiane in modo tale che la trasformazione di coordinate

i

0 i j

x = Λ x

j 0

0 0

0

sia una trasformazione speciale lungo l’asse i−esimo, risulta subito che, posto x = ct e x = ct

6

e j = i, v

0 i

t = γ(t + x ) , (7.41)

2

c

i

0 i

= γ(x + vt) , (7.42)

x j

0 j

= x . (7.43)

x

È 2 2

dove al solito γ = 1/ 1 v /c .

Commenti 7.3.

(1) Come già osservato precedentemente le trasformazioni di Lorentz non preservano gli angoli

tra i versori. Tuttavia ciò accade per trasformazioni speciali di Lorentz: in entrambi i riferimenti

connessi da una trasformazione speciale di Lorentz, la terna dell’altro riferimento individuerà una

terna in movimento che sarà ancora ortogonale. Si osservi che ciò non accade per trasformazioni

pure generiche per cui non si può affermare che le trasformazioni pure sono le trasformazioni che

corrispondono ai moti relativi di terne inerziali ad assi paralleli. L’unica affermazione fisicamente

sensata è che, in base al teorema di decomposizione delle matrici di Lorentz, le trasformazioni

pure sono le trasformazioni di Lorentz che non contengono rotazioni. A differenza della situazione

139

classica ciò non implica automaticamente che le terne di assi rappresentate nei rispettivi spazi

di quiete “procedano ad assi paralleli”.

(2) È immediato provare che:

le trasformazioni speciali di Lorentz lungo l’asse i-esimo costituiscono un sottogruppo ad un

parametro del gruppo di Lorentz generato dal boost K .

i

Tuttavia, a causa della relazione di commutazione k

[K , K ] = S ,

i j ij k

la composizione di due trasformazioni speciali lungo assi differenti non è nemmeno una trasfor-

mazione pura! L’insieme delle trasformazioni pure di Lorentz non è un sottogruppo del gruppo

di Lorentz.

Questo risultato ha conseguenze fisiche non banali, per esempio nel fenomeno della precessione

F

di Thomas in cui in un riferimento inerziale si descrive una terna di assi solidale ad un altro

F F

0

riferimento inerziale (e quindi in moto in ) come se “ruotasse”, anche se tale terna soddisfa

una definizione relativisticamente invariante di terna non rotante.

(3) In riferimento alla rappresentazione delle trasformazioni pure discussa sopra:

t

 

γ γv /c

 

Λ = ,

 

p 2 t 2

γv/c I+ γ vv /[c (1 + γ)]

 

 

si verifica subito che (essendo immutato il valore di γ in tutti e tre i casi)

t

 

−γv

γ /c

 

P Λ P = ,

 

p 2 t 2

−γv/c I+ γ (−v)(−v )/[c (1 + γ)]

 

 

e t 

 −γv

−γ /c 

 ,

T Λ T = 

p 2 t 2

−γv/c I+ γ (−v)(−v )/[c (1 + γ)] 

 

mentre t

 

−γ γv /c

  .

P T Λ T P =  

p 2 t 2

γv/c I+ γ vv /[c (1 + γ)]

 

 

Il significato fisico di queste identità è ovvio se si tiene conto che sia l’inversione del tempo e sia

l’inversione di parità devono cambiare segno al vettore velocità. Si osservi che come conseguenza

140

di quanto ottenuto e del fatto che T T = P P = T P T P = I, si ha che T, P, T P non commutano

con le matrici del gruppo di Lorentz quando queste contengano trasformazioni pure di Lorentz

nella decomposizione polare.

7.3 Teoremi di decomposizione e rappresentazione del gruppo

di Lorentz.

Per concludere possiamo enunciare e provare un teorema di rappresentazione del gruppo di Lo-

rentz ortocrono proprio ed in particolare possiamo provare il teorema 3.1.

Teorema 7.6. (Rappresentazione del gruppo di Lorentz ortocrono proprio.) Le

matrici Λ SO(1, 3)↑ sono tutte e sole le matrici di M (4, della forma

R)

Λ = Ω Λ , (7.44)

p

R

per ogni scelta di R SO(3) e per ogni trasformazione pura di Lorentz Λ ; ovvero

p

θn·S χm·K

Λ = e e , (7.45)

2

∈ ∈

per ogni scelta di n, m , θ, χ

S R.

Equivalentemente, le matrici Λ SO(1, 3)↑ sono tutte e sole le matrici di M (4, della forma

R)

0

Λ = Λ Ω , (7.46)

0

R

p

0 0

per ogni scelta di R SO(3) e per ogni trasformazione pura di Lorentz Λ ; ovvero

p

0 0 0 0

·K ·S

χ m θ n

e , (7.47)

Λ = e

0 0 0 0

2

∈ ∈

per ogni scelta di n , m , θ , χ Inoltre valgono i seguenti fatti.

S R. 0 0 6 ∈

(1) In entrambi i casi le coppie (m, χ) e (m , χ ) sono determinate biunivocamente da I = Λ

2 ×

SO(1, 3)↑ purchè ci si restringa all’insieme (0, +∞).

S

0 0 6 ∈

(2) In entrambi i casi le coppie (θ, n) e (θ , n ) sono determinate biunivocamente da I = Λ

2

↑ ×

SO(1, 3) purchè ci si restringa all’insieme (0, π] e con l’eccezione che (n, π) e (−n, π)

S 0 0

producono lo stesso primo fattore nel secondo membro di (7.45), e rispettivamente (n , π ) e

0 0

(−n , π ) che producono lo stesso secondo fattore nel secondo membro di (7.47).

∈ 6

(3) Per una fissata Λ SO(1, 3)↑, Λ = I, in riferimento alle decomposizioni (7.45) e (7.47) e

con le restrizioni in (1) e (2) valgono le identificazioni

0

n = n , (7.48)

0

θ = θ, (7.49)

0 θn·S

m = e m, (7.50)

0

χ = χ . (7.51)

141

♦ ∈

Dimostrazione. Se Λ SO(1, 3)↑, per il teorema 7.3, Λ = Λ Ω dove Λ è pura. Si noti che

p p

−1 ∈ ↑ ↑

Λ Λ SO(1, 3) per il punto (5) del teorema 7.3 ed essendo SO(1, 3) un gruppo. Allora

p −1 ∈ ↑ ∈

Ω = Λ Λ SO(1, 3) e deve essere necessariamente della forma Ω (7.11) con R SO(3).

R

p

Usando (7.12) ed il teorema 7.5 abbiamo infine che:

θm·S χn·K

Λ = e e

2

∈ ∈

per qualche θ, χ e n, m . Se, viceversa consideriamo una matrice della forma Λ =

R S

θm·S χn·K χn·K θm·S

∈ ↑.

e e il teorema 7.5 assicura che e SO(1, 3) Inoltre e è della forma (7.11)

θm·S θm·S

∈ ∈ ↑ ↑

con R = e SO(3) per cui è immediato avere che e SO(1, 3) Essendo SO(1, 3)

θm·S χn·K ∈

un gruppo, Λ = e e SO(1, 3)↑. La dimostrazione si esegue nello stesso modo con le

debite differenze considerando una decomposizione Λ = ΩΛ . Il punto (1) segue dall’osserva-

p

zione (1) dopo il teorema 6.5 e dall’unicità dei fattori della decomposizione polare del teorema

7.3. Il punto (2) segue dal teorema 7.5 e dall’unicità dei fattori della decomposizione polare del

2

teorema 7.3. Il punto (3) segue dal punto (3) del teorema 7.3.

Segue immediatamente un importante conseguenza che presentiamo come teorema. ∈

Teorema 7.7. (Decomposizione in trasformazioni speciali e rotazioni.) Se Λ

0 ∈

SO(1, 3)↑ allora esistono R, R SO(3) ed una trasformazione speciale di Lorentz lungo il terzo

asse Λ tali che:

3 Λ = Ω Λ Ω ,

0

3

R R

ovvero in altri termini 0 0 ·S

θn·S χK θ n

Λ = e e e ,

3

0 0

2

∈ ∈ ♦

per qualche n, n , θ, θ , χ

S R. θn·S χm·K

∈ ↑,

Dimostrazione. In base al teorema precedente, se Λ SO(1, 3) Λ = e e . Sia

B SO(3) tale che Bm = e . Allora usando il lemma 7.1 e la (7.12):

3 t

·KΩ ·K

χm·K χ(Be )·K Ω χe χe tB χK

= Ω e Ω = Ω e Ω

e = e = e .

3 3 3 3

B B t

B B B

θn·S

Di conseguenza, ponendo Ω = e ,

R θn·S χK χK tB

Λ = e Ω e Ω = Ω Ω e Ω .

3 3

t

B R B

B

7→

Dato che A Ω è una rappresentazione gruppale, Ω Ω = Ω e dunque

A R B RB

χK

Λ = Ω e Ω .

3 t

RB B 2

0

t

Ridefinendo le matrici di SO(3): RB come R e B come R segue banalmente la tesi.

142 F F 0

Nota 7.2. Il teorema provato ha come conseguenza il teorema 3.1. Infatti se e sono

F F

0 0

∈ ∈

sistemi di riferimento inerziali, scelti due sistemi di coordinate minkowskiane φ ,φ , la

0 −1

trasformazione di Poincaré che lega tali sistemi di coordinate, ossia φ φ , sarà della forma

0i i ij j

z = C + Γ z . F 0

i

∈ ∈

dove Γ O(1, 3)↑ e C Ridefinendo le coordinate in come

R. j

0

i i j

y = (Ω ) (z C )

j

R F 0

dove R O(3), il nuovo sistema di coordinate sarà ancora solidale con e varrà

i i j

y = Λ z ,

j ∈

dove Λ = Ω Γ. Ci sono due possibilità: det Γ = 1 ed in tal caso Λ SO(1, 3)↑ con la scelta

R −1; −I, ∈ ↑.

banale R = I, oppure det Γ = in tal caso, scegliendo R = risulta Λ SO(1, 3)

F F 0

In definitiva abbiamo trovato due sistemi di coordinate minkowskiane solidali con e e

connessi da una trasformazione di Lorentz ortocrona propria.

j

i i z ,

y = Λ j i

0 i j i i j

con Λ SO(1, 3)↑. Applicando il teorema 7.7 a Λ e definendo x := (Ω ) y e x = (Ω ) z ,

0

t j j

R

R F 0

per costruzione i due nuovi sistemi di coordinate minkowskiane sono ancora solidali con e

F e inoltre vale € Š

i

i

0 χK j

= e x ,

x 3 j

cioè la trasformazione di coordinate è una trasformazione speciale lungo il terzo asse.

7.4 Le componenti connesse del gruppo di Lorentz.

Consideriamo i seguenti sottoinsiemi di O(1, 3): 0

↑ {Λ ∈ | > 0} , (7.52)

O(1, 3) := O(1, 3) det Λ > 0 , Λ 0

+ 0

↑ {Λ ∈ |

O(1, 3) := O(1, 3) det Λ < 0 , Λ > 0} , (7.53)

− 0

0

↓ {Λ ∈ |

O(1, 3) := O(1, 3) det Λ > 0 , Λ < 0} , (7.54)

+ 0

0

↓ {Λ ∈ | < 0} . (7.55)

O(1, 3) := O(1, 3) det Λ < 0 , Λ

− 0

È chiaro che si tratta di insiemi disgiunti per costruzione, inoltre

↑ ∪ ↑ ∪ ↓ ∪ ↓

O(1, 3) := O(1, 3) O(1, 3) O(1, 3) O(1, 3) (7.56)

− −

+ +

143 00

∈ ±1 ≥

in quanto se Λ O(1, 3), come più volte notato, det Λ = ed ulteriormente Λ +1 oppure

00 ≤ −1

Λ per il il teorema 2.3. Per gli stessi motivi possiamo equivalentemente riscrivere il

membro di destra delle definizioni di sopra come: 0

↑ {Λ ∈ |

O(1, 3) := O(1, 3) det Λ = +1 , Λ > +1} , (7.57)

+ 0

0

↑ {Λ ∈ | −1

O(1, 3) := O(1, 3) det Λ = , Λ > +1} , (7.58)

− 0

0

↓ {Λ ∈ | −1}

O(1, 3) := O(1, 3) det Λ = +1 , Λ < , (7.59)

+ 0

0

↓ {Λ ∈ | −1 −1}

O(1, 3) := O(1, 3) det Λ = , Λ < . (7.60)

− 0

Notiamo ancora che O(1, 3) è un sottogruppo di O(1, 3) come è immediato provare tenendo

+ ↑

conto che risulta essere l’intersezione del sottogruppo ortocrono O(1, 3) e del sottogruppo

SO(1, 3) costituito dalle matrici di Lorentz con determinante +1 (il fatto che tale insieme sia

un sottogruppo è di verifica immediata).

↑, ↓, ↓

I rimanenti sottoinsiemi O(1, 3) O(1, 3) O(1, 3) non sono sottogruppi perché non

− −

+

contengono I per definizione.

Tenendo conto del fatto che T T = P P = I dove l’inversione del tempo T e l’inversione di parità

P sono definite in (7.15) (ovvero nel teorema 2.3) e (7.14) segue subito che, con ovvie notazioni:

↑ ↑

O(1, 3) = P O(1, 3) ,

− +

↓ ↑

O(1, 3) = P T O(1, 3) ,

+ +

↓ ↑

O(1, 3) = T O(1, 3) .

− +

Il risultato più importante è comunque che i 4 sottoinsiemi di O(1, 3) sopra definiti sono le

componenti connesse del gruppo di Lorentz:

Teorema 7.8. (Componenti connesse del gruppo di Lorentz.) I quattro sottoinsiemi

di O(1, 3) definiti in (7.57)-(7.60) costituiscono le componenti connesse del gruppo di Lorentz di

cui solo ↑

SO(1, 3)↑:= O(1, 3)

+

detto (sotto) gruppo ortocrono proprio o (sotto) gruppo ortocrono speciale è sotto-

gruppo di O(1, 3).

Valgono infine le relazioni: ↑

O(1, 3) = P SO(1, 3)↑ , (7.61)

− ↓

O(1, 3) = P T SO(1, 3)↑ , (7.62)

+ ↓

O(1, 3) = T SO(1, 3)↑ . (7.63)

Dimostrazione. Dato che i quattro insiemi sono disgiunti e la loro unione è O(1, 3) l’unica

cosa che rimane da provare e che non è stata già provata sopra è che essi sono aperti e connessi.

144

È sufficiente provare che SO(1, 3) è aperto e connesso. Una volta provato ciò, essendo la

moltiplicazione per T, P, T P un diffeomorfismo di O(1, 3) in O(1, 3), segue che anche O(1, 3)

↓, ↓

, O(1, 3) O(1, 3) sono aperti e connessi.

+

SO(1, 3) è aperto (nella topologia di O(1, 3)) perché dato dall’intersezione di due insiemi

aperti: rispettivamente la controimmagine dell’insieme (0, +∞) rispetto a det : O(1, 3) e la

R

0 ∈

controimmagine dello stesso insieme rispetto alla funzione che calcola Λ per ogni Λ O(1, 3).

0

La connessione di SO(1, 3)↑ si prova come segue. Se Λ SO(1, 3)↑, per il teorema 7.3, Λ = Λ Ω

p

−1 ∈ ↑

dove Λ è pura. Si noti che Λ Λ SO(1, 3) per il punto (5) del teorema 7.3 ed essendo

p p −1 ∈

SO(1, 3)↑ un gruppo. Allora Ω = Λ Λ SO(1, 3)↑ e deve essere necessariamente della forma

p

Ω (7.11) con R SO(3). Usando (7.12) ed il teorema 7.5 abbiamo infine che:

R θm·S χn·K

Λ = e e

2

∈ ∈

per qualche θ, χ e n, m . Possiamo costruire un cammino continuo

R S 3 7→ ∈

[0, 2] t γ(t) SO(1, 3)↑

che connette I a Λ in SO(1, 3)↑: tθm·S ∈

γ(t) := e se t [0, 1) ,

θm·S (t−1)χn·K ∈

γ(t) := e e se t [1, 2] .

Il fatto che per ogni t [0, 2] gli elementi del cammino siano in SO(1, 3)↑ è immediato. Scegliendo

di seguito u e v in modo da esaurire tutti i casi possibili da verificare, si ha

uθm·S vχn·K uθm·S vχn·K vχn·trK uθm·trS 0 0

det e e = det e det e = e e = e e = 1 ,

uθm·S uθm·S uθm·trS

dove e = Ω è dato da (7.11) per cui e O(1, 3)↑ e infine e è una trasforma-

R ↑

zione pura per il teorema 7.5 per cui è un elemento di O(1, 3) per il teorema 7.3 punto (5).

2

Dunque SO(1, 3)↑ è connesso per archi e quindi connesso.

Segue immediatamente un ovvio ma importante corollario.

Corollario. SO(1, 3)↑ è un gruppo di Lie matriciale in quanto sottogruppo di Lie di O(1, 3),

inoltre, se so(1, 3)↑ denota l’algebra di Lie di SO(1, 3)↑, so(1, 3)↑= o(1, 3).

Nota 7.3. È ovvio che da (7.61), (7.62) e (7.63) seguano teoremi di decomposizione e rap-

presentazione delle componenti connesse del gruppo di Lorentz diverse da quella che contiene

l’identità gruppale.

Esercizi 7.1. .

1. Mostrare che il gruppo di Poincaré è un gruppo di Lie matriciale sottogruppo di GL(5, R).

Suggerimento. Considerare la classe di matrici

– ™

Λ C ; (7.64)

0 1

145

4

∈ ∈

dove C e Λ O(1, 3).

R 4

2. Mostrare che l’algebra di Lie del gruppo di Poincaré è la somma diretta so(1, 3) R

come spazio vettoriale, ma non lo e’ come algebra di Lie (cioè il commutatore non soddisfa

0 0 0

[(A, t), (A , t )] = ([A, A ], 0) ,

0 4

∈ ∈

dove A, A so(1, 3) e t ).

R 146

Capitolo 8

Le idee fisico-matematiche alla base

della teoria Generale della Relatività.

In questo capitolo esamineremo in termini rigorosi le idee che stanno alla base della Relatività

Generale. Nella prima sezione introdurremo le idee fisiche fondamentali e, nella seconda, gli

strumenti matematici necessari a trascrivere nel linguaggio della geometria differenziale loren-

tziana tali idee fisiche. Nelle sezioni successive procederemo con la costruzione esaminandone le

prime importanti conseguenze.

8.1 Fisica: il Principio di Equivalenza di Einstein.

La teoria della Relatività Generale fu formulata da Einstein dieci anni dopo la teoria della

Relatività Speciale. La seconda ingloba la teoria del campo gravitazionale all’interno della

geometria dello spaziotempo. L’idea centrale di Einstein per rappresentare la gravità in termini

geometrici è basata sul cosiddetto principio di equivalenza. Il principio di equivalenza che

formuleremo tra poco è basato sull’osservazione fondamentale, sottolineata da Einstein, che la

massa gravitazionale e la massa inerziale coincidono. La prima è la costante M , caratteristica

di un corpo, che compare nella formula della gravitazione universale di Newton:

0

MM

~ −G −

F = (P Q) ,

3

||P − Q||

~ 0

dove F è la forza gravitazionale che il corpo di massa M in Q esercita sul corpo di massa M in

P . La massa inerziale m è invece la costante, caratteristica di un corpo, che appare nel secondo

principio della dinamica: ~

F (t, P, ~v ) = m~a ,

dove veca è l’accelerazione del punto materiale P di massa inerziale m, valutata in un riferimento

inerziale, e vecF è la forza totale agente sul punto materiale. Newton postulò che

M = m.

147

Questa coincidenza di valori è stata verificata sperimentalmente con incredibile precisione in di-

−9

versi esperimenti con pendoli a torsione di Eötvos (con un errore di relativo di 10 ) e da Dicke

−12

e collaboratori in tempi pi recenti (con un errore relativo di 10 ). La coincidenza delle due

nozioni di massa ha l’importante conseguenza stabilita dal cosiddetto Principio di Equivalenza

di Einstein (in forma debole) che sancisce, in fisica classica, l’equivalenza tra locale i campi

gravitazionali e le forze inerziali:

Principio di Equivalenza di Einstein. È possibile annullare localmente l’effetto dinamico

del campo gravitazionale tramite le forze inerziali in un riferimento in caduta libera nel campo

gravitazionale. Viceversa è possibile creare gli effetti dinamici dovuti ad un campo gravitazionale

lavorando in un riferimento accelerato rispetto ad un riferimento inerziale.

Nota 8.1. “Localmente” significa sopra: in regioni spaziali sufficientemente piccole e per

intervalli di tempo sufficientemente brevi.

Esemplifichiamo il significato fisico di tale principio. In fisica classica, consideriamo un campo

I

gravitazionale ~g = ~g (t, P ) arbitrario valutato in coordinate di un riferimento inerziale . ~g (t, P )

è quindi il vettore accelerazione di gravità nel punto P nello spazio di quiete del riferimento

I 0

ed all’istante t. Consideriamo ora un nuovo riferimento, non inerziale, in caduta libera nel

campo gravitazionale. Tale riferimento si costruisce prendendo una particella O che si muove

I

nel riferimento con accelerazione: |

~g (t) = ~g (t, O(t)) .

I

O

Dotiamo quindi il punto O di un sistema di assi cartesiani ortonormali centrati ad ogni istante

I

in O(t) e assumiamo che tali assi non ruotino rispetto agli assi di . In tal modo il riferimento

I I

0 solidale con O e con gli assi costruiti non ruota rispetto a . I 0

Svolgiamo ora elementari esperimenti di dinamica nel riferimento . Prendiamo un punto

materiale P dotato di massa inerziale m e massa gravitazionale M e lanciamolo, partendo da O

I 0

con una arbitraria velocità iniziale. Quale sarà il suo moto in ? Le equazioni del moto di P

I

in si scrivono: |

m~a = M~g (t, P (t)) .

I

P

I I

0

Ma, essendo il moto di rispetto a puramente traslatorio, abbiamo anche che:

| | |

~a (t) = ~a (t) + ~a (t)

I I

I 0

P P O

I 0

Pertanto le equazioni del moto di P nel riferimento si possono scrivere

| −m~a |

m~a (t) = (t) + M~g (t, P (t)) ,

I

I 0

P O

|

ovvero, tenendo conto di ~a (t) = ~g (t, O(t)),

I

O | −m~g

m~a (t) = (t, O(t)) + M~g (t, P (t)) .

I 0

P 148

Infine tenendo conto che m = M si trova che, per ogni punto materiale di massa inerziale

arbitraria m: | −

m~a (t) = m (~g (t, P (t)) ~g (t, O(t))) .

I 0

P

Vediamo allora che tanto più il punto P si trova vicino all’origine O delle coordinate del rife-

I 0

rimento – e questo succederà considerando tempi sufficientemente piccoli dato che il punto

materiale P parte inizialmente da O – tanto più il suo moto assomiglierà al moto rettilineo

uniforme, come se il punto non fosse sottoposto ad alcuna forza, alla forza gravitazionale in

particolare.

Viceversa possiamo creare gli effetti di un campo gravitazionale lavorando in un riferimento non

I I

0

inerziale accelerato rispetto ad un riferimento inerziale . A titolo esemplificativo, suppo-

I I

0

niamo che sia determinato rispetto al riferimento inerziale assegnando, come prima, il

I 0

moto accelerato dell’origine degli assi di , indicata con O e supposta avere accelerazione co-

I I 0

|

stante ~a rispetto a . Supporremo nuovamente che il moto di sia puramente traslatorio

I

O I

rispetto a . L’equazione della dinamica, per un punto materiale P di massa m non sottoposto

I

a forze, sarà nel riferimento : ~

|

m~a = 0

I

P

I 0

e quindi, nel riferimento : | −m~a |

m~a (t) = ~g .

I

I 0

P O

I 0

In altre parole, nel riferimento vale, per ogni punto materiale di qualunque massa inerziale

m e massa gravitazionale M : |

m~a (t) = M~g (8.1)

I 0

P I −~a |

dove il campo gravitazionale che appare in è definito da ~g = . L’equazione (8.1),

I

O

ancora una volta, ha senso perché M = m.

Nota 8.2. Questi risultati non sono affatto banali perché coinvolgono la natura del campo

gravitazionale e la struttura generale della formulazione della dinamica in fisica classica. Con-

siderando altri tipi di campi di forze in luogo del campo gravitazionale, non si ha lo stesso

risultato, anche assumendo l’uguaglianza della massa inerziale e di quella gravitazionale.

Un secondo risultato conseguente dal fatto che la massa gravitazionale coincida con quella iner-

ziale, è che il moto di un punto materiale in un assegnato campo gravitazionale non dipende

dalla massa del corpo, ma solo dalla sua posizione e velocità iniziale.

Questi due fatti portarono Einstein, nel tentativo di dare una descrizione relativistica della

gravità estendendo la teoria della relatività speciale, ad assumere i seguenti tre principi, che

fondano la teoria della relatività generale.

RG1. Lo spaziotempo, anche nella situazione che corrisponde classicamente alla presenza di

gravitazione, è descritto da varietà differenziabile quadridimensionale M con metrica lorentziana

g, connessa e temporalmente orientata. Ulteriormente, generalizzando le analoghe identificazioni

dalla Relatività Speciale, valgono le seguenti identificazioni tra enti fisici ed enti matematici.

149

(a) La storia di un punto materiale è descritta nello spaziotempo da una curva differenziabile

di tipo causale futuro orientata, cioé da una linea di universo nel senso della definizione 3.11.

(b) Nel caso di una linea di universo di tipo tempo, il tempo proprio (cioé il tempo misurato

da un orologio ideale in quiete con un punto materiale) coincide con l’ascissa curvilinea della

curva (definizione 4.1) divisa per c, definendo il vettore tangente quadrivelocità V che soddisfa

2

|V −c

g(V ) = .

(c) Lo spazio fisico di quiete con il punto materiale in un evento della sua storia è descrit-

to, a livello infinitesimo, dal sottospazio dello spazio tangente a quell’evento normale al vettore

tangente all curva dotato del prodotto scalare definito positivo indotto da g.

Nota 8.3. La richiesta di connessione (necessaria per l’orientabilità temporale) è fisicamente

ovvia: non ci sarebbe nessuna possibilità di comunicare tra regioni sconnesse.

RG2. Il moto dei corpi puntiformi che classicamente erano visti come sottoposti al solo campo

gravitazionale è descritto dalle geodetiche (di tipo causale futuro) nello spaziotempo rispetto alla

connessione di Levi-Civita associata a g. In questo senso, il contenuto fisico del campo gravita-

zionale classico è ora descritto da proprietà della metrica dello spaziotempo.

L’ultimo dei tre principi, che enunciamo di seguito, cade spesso sotto il nome di principio di

equivalenza forte. Tale principio è il più difficile da interpretare matematicamente, in particolare

è difficile dare un significato preciso alle locuzioni locale e localmente nel contesto geometrico

differenziale introdotto dai precedenti due principi. Per fare ciò abbiamo bisogno di nuovi stru-

menti e risultati matematici che introdurremo nella prossima sezione.

RG3. Esistono sistemi di coordinate locali, associati a sistemi di riferimento di caduta libera, in

cui i moti descritti da geodetiche temporali appaiono localmente come moti rettilinei uniformi.

In tali sistemi di riferimento le leggi della fisica assumono la stessa forma che avevano nei si-

stemi di riferimento inerziali della teoria relativistica speciale.

Nota 8.4. Deve essere chiaro che la prima parte di RG3 è una riformulazione della prima

affermazione del principio di equivalenza, quando si tiene conto di RG2.

8.2 Matematica: l’exponential map.

Introdurremo ora uno strumento matematico importante che ci permetterà di dare significato

matematicamente rigoroso alla prima affermazione contenuta nel principio RG3. Questo stru-

mento è un particolare sistema di coordinate nell’intorno di un fissato punto di una varietà

(pseudo)riemanniana o più in generale di una varietà dotata di connessione affine. Attraverso

tale sistema di coordinate si può identificare un intorno della varietà con lo spazio tangente alla

varietà . 150

8.2.1 L’exponential map e le coordinate normali attorno ad un punto.

∇.

Consideriamo una varietà differenziabile M dotata di una connessione affine Assumere-

∞ 2

mo che entrambe siano C anche se C è sufficiente per quanto segue. Se (U, φ) è una car-

1 n

ta locale su M con coordinate x , . . . , x , consideriamo le coordinate naturali locali su T M ,

1 n

0 0

1 n

(x , . . . , x , x , . . . , x ) indotte dalla carta (U, φ).

Ricordiamo che questo sistema di coordinate naturali indotto dalla carta locale (U, φ) su M con

1 n 3

coordinate x , . . . , x è definito dal fatto che ogni vettore tangente in T M con U p e con

p

1 np

coordinate x , . . . , x , ha componenti:

p ∂

i

0 |

x .

p

v i

∂x 1 nv

0 0

1 np

L’elemento (p, v) T M è dunque individuato dalla 2n-pla (x , . . . , x , x , . . . , x ).

p v ∇,

Il problema di Cauchy associato all’equazione delle geodetiche della connessione visto come

un problema di Cauchy del prim’ordine in T M , si scrive esplicitamente nelle coordinate dette:

i

0

 dx j k

0 0

1 n ijk

−Γ(x ,

= (t), . . . , x (t)) x x

 dt

 i

dx i = 1, . . . n . (8.2)

i

0

= x (t) ,

 dt

 ip

i

 0

0

i ip ,

(0) = x

x

x (0) = x

1 np ∈

In particolare (x , . . . , x ) sono le coordinate di p U , il punto di partenza dalla geodetica con

p ip

0 0 ∂ | ∈

vettore tangente iniziale x = x . Indichiamo con γ = γ(p, v , t) U , la proiezione in U

p p p

i

∂x ∈ ∈

dell’unica soluzione massimale di (8.2) dove p U , v T M e t appartiene a qualche intervallo

p p

3

aperto I 0 che dipende da p e v in generale. Nel seguito rappresenteremo (p, v ) in termini

p p

nv

1 0

0 n n n

1 np ∈ × ⊂ ×

) φ(U ) .

, . . . , x

delle corrispondenti coordinate (x , . . . , x , x R R R

v

p p

p

Come ben noto, dalla teoria generale dei sistemi di equazioni differenziali, se uno considera

∈ ∈

soluzioni massimali e ne varia le condizioni iniziali p U , v T M , prendendo t nel risultante

p p

n n

⊂ × ×

intervallo, il dominio globale Ω di γ = γ(p, v , t), al variare di tutte le variabili

R R R p

n n

× × ∈

(p, v , t) risulta essere un insieme aperto di Di conseguenza, se fissiamo r U , ci

R R R.

p n

× ×

sarà un insieme di forma V B (0) (−, ) – con > 0, essendo B (0) la palla aperta in R

r δ δ

di raggio δ > 0 centrata in 0 ed essendo V U un intorno aperto di r – tale che

r

× × 3 7→

V B (0) (−, ) (p, v , t) γ(p, v , t)

r p p

δ

è ben definita. Riduciamoci d’ora in poi a lavorare su questo insieme.

L’equazione (8.2) ed il teorema di unicità delle soluzioni dei sistemi di equazioni differenziali

7→ ∈

implicano subito che, per ogni λ > 0, se la geodetica t γ(p, v , t) è definita per t (−, ),

p

7→ ∈

allora la geodetica t γ(p, λv , t) è definita per t (−/λ, /λ), e

p γ(p, λv , t) = γ(p, v , λt) . (8.3)

p p ∈

(Infatti il membro di destra, pensato come una funzione di t (−/λ, /λ), soddisfa l’equazione

delle geodetiche con vettore tangente iniziale in p dato da λv .) Quindi possiamo fissare λ > 0

p

151

0 ∈ ×

piccolo a sufficienza al fine di ottenere := /λ > 1. Concludiamo che, se (p, u ) V B (0)

0

p r δ

0

con δ = λδ, allora la funzione: × 3 7→

V B (0) (p, u ) γ(p, u , t)

0

r p p

δ

0 0

∈ ⊃

è ben definita per t (− , ) (−1, 1). In definitiva, se δ > 0 è sufficientemente piccolo, la

funzione × 3 7→

V B (0) (p, u ) exp (u ) := γ(p, u , 1) (8.4)

r p p p

δ p

è ben definita. Si osservi che teoremi noti riguardanti la dipendenza regolare delle soluzioni di

7→

equazioni differenziali dai dati iniziali implicano che (p, u ) exp (u ) è una funzione C .

p p

p

n 1

∈ ⊂

Per ogni p V , la palla B (0) si identifica con un intorno aperto e stellato dell’origine

R

r δ n

di T M . L’identificazione avviene tramite la funzione che associa al vettore colonna di il

R

p i

{∂/∂x | }

corrispondente vettore di T M con le stesse componenti rispetto alla base .

p p i=1,...,n

∞ ∇

Definizione 8.1. Sia M una varietà differenziabile C dotata di una connessione affine

di classe C . ⊂

(a) La funzione (8.4) definita in un insieme aperto E T M , (sufficientemente piccolo e rappre-

×

sentato, in coordinate locali naturali di T M , come prodotto V B (0)) è detta exponential

0

r δ

map su E.

∈ {p} ×

(b) Se p M , la restrizione dell’exponential map a U , dove U è un opportune intorno

0 0 ♦

aperto e stellato dell’origine 0 di T M , è detto exponential map centrato in p.

p

Nota 8.5. L’equazione (8.3) con t = 1 si scrive

γ(p, λv , 1) = γ(p, v , λ) ,

p p

ossia: (λv ) = γ(p, v , λ) .

exp p p

p

Questa identità dice che la funzione (ben definita perché l’intorno di definizione di exp è stellato)

p

3 7→ (λv ) M, (8.5)

[0, 1] λ exp p

p

definisce l’unico segmento di geodetica che parte da p, con vettore tangente v e parametro affine

p

λ [0, 1].

Possiamo ora enunciare e provare il risultato fondamentale riguardante l’exponential map.

∞ ∇

Teorema 8.1. Sia M una varietà differenziabile C dotata di una connessione affine di

∞ ∈

classe C . Si consideri l’exponential map centrato in un punto p M . Valgono i seguenti fatti.

1 Un intorno aperto e stellato dell’origine O di uno spazio vettoriale topologico V è un intorno aperto U di 0

tale che, se v U , allora il segmento che unisce 0 a v è anch’esso completamente contenuto in U .

152

(a) In un intorno aperto e stellato U dell’origine di T M , l’exponential map definisce un diffeo-

0 p

morfismo sull’insieme aperto exp (U ). In tal modo i vettori in un intorno aperto dell’origine di

0

p

T M vengono differenziabilmente e biunivocamente identificati con i punti in un intorno aperto

p

di p. ∇ {e } ⊂

(b) Se ha torsione nulla e T M è una base, si consideri il sistema di coordinate

pi i=1,...,n p −1

locali su exp (U ) che associa q exp (U ) alle componenti di exp (q) respetto alla base detta:

0 0

p p p

€ Š

−1 ∗1 −1 ∗1 i

7→ hexp i, · · · hexp (q), e .

q (q), e ,

p p p p

In quel sistema di coordinate i coefficienti di connessione di si annullano in p. ∞

(c) Se è la connessione di Levi-Civita associata con una (pseudo)metrica g di classe C su

{e } ⊂

M , e T M è una base, in riferimento alle coordinate locali introdotte in (a), le

pi i=1,...,n p ♦

componenti delle derivate della metrica rispetto alle coordinate si annullano in p.

|

Dimostrazione. Per dimostrare (a) è sufficiente fare vedere che d exp è non singolare.

p

p

1 n

Fissiamo un sistema di coordinate locali attorno a p con coordinate x , . . . , x and denotiamo

i

con (exp (v)) la componente i-esima della funzione di exp (v). Vale, dove non usiamo la

p p

convenzione di somma sugli indici ripetuti:

k € € ŠŠ

n !!

∂ ∂ ∂

k k

X i j

exp v e = exp v e = (exp (λe )) .

pi pj pj

j j

∂v ∂v ∂λ

v=0 v=0 λ=0

i=1

Usando l’osservazione 8.5 si ha infine: k

n !! ∂

∂ X i k kpj

v e =

exp γ (p, e , λ) = e ,

pi pj

j

∂v ∂λ

v=0 λ=0

i=1

kpj i

{∂/∂x | }

dove e è la k-esima componente di e rispetto alla base . Le la matrice le cui

pj p i=1,...,n

n {e }

colonne sono le componenti di questi vettori di è non singolare dato che è una

R pj j=1,...,n

base. La dimostrazione di (a) è terminata.

1 n ∈

In coordinate y , . . . , y definite su exp (U ) e che associano q exp (U ) con le componenti

0 0

p p

−1 {e }

di exp (q) rispetto alla base , ogni geodetica che parte da p con vettore tangente

pi i=1,...,n

p i i i

iniziale v = v e ha equazione: y (λ) = λv come segue immediatamente dalla (8.5). Per le

p pi

geodetiche uscenti da p e lavorando in tali coordinate vale allora che, per i = 1, . . . , n

2 i

d y (λ) =0 .

2

D’altra parte deve anche valere, per la definizione generale di geodetica:

2 i j k

d y dy dy

i 1 n

+ Γ (y (λ), . . . , y (λ)) =0 .

jk

2

dλ dλ dλ

Di conseguenza, per ogni λ [0, 1]: j k

dy dy

ijk 1 n

Γ (y (λ), . . . , y (λ)) =0 .

dλ dλ

153

In particolare, se λ = 0:

ijk j k j ∈

Γ (p)v v = 0 , per ogni scelta dei v j = 1, . . . , n. (8.6)

R,

ijk ikj i i i

Se la connessione ha torsione nulla, cioé Γ = Γ , (8.6) implica, scegliendo v = u + z per

i i ijk j k i i

∈ ∈

ogni u , z che deve valere Γ (p)u z = 0 per ogni u , z Di conseguenza:

R, R.

ijk

Γ (p) = 0 . ∇g

La dimostrazione di (c) ora segue immediatamente tenendo conto del fatto che l’identità = 0,

i j

valida per la connessione di Levi-Civita, in coordinate ha la forma, se g = g dx dx :

ij

∂g

ki sjk sji

= Γ g + Γ g .

si ks

j

∂y

2 ∞ ∇

Definizione 8.2. Sia M una varietà differenziabile C dotata di una connessione affine

∞ ∈

di classe C e sia p M . Si consideri un intorno aperto stellato dell’origine 0 di T M su cui

p

{e } ⊂

exp definisce un diffeomorfismo locale. Se T M è una base, le coordinate locali

pi i=1,...,n p

p −1

definite su exp (U ) che associano ogni q exp (U ) alle componenti di exp (q) sulla base

0 0

p p p

detta: € Š

−1 ∗1 −1 ∗1

7→ hexp i, · · · hexp i

q (q), e , (q), e

p p p p

sono dette coordinate normali (riemanniane) centrate in p.

8.2.2 Coordinate normali adattate ad una curva assegnata.

Passiamo a considerare un sistema di coordinate normali più complesso ed associato ad una

assegnata curva differenziabile. Se M è la solita varietà differenziabile dotata di una metrica

i j

⊗dx →

riemanniana o lorentziana g = g dx , sia α : (a, b) M una curva differenziabile regolare,

ij

6 ∈

cioé con α̇(t) = 0 per ogni t (a, b). Nel caso lorentziano assumeremo ulteriormente che α sia

di tipo tempo, cioé g( α̇(t), α̇(t)) < 0 per ogni valore del parametro t (a, b).

Fissiamo t (a, b) e consideriamo una base del sottospazio N α di T normale a α̇(t ),

0 0

α(t ) α(t )

0 0

{e } . Quindi trasportiamo parallelamente tale base lungo α usando la procedura del

i=2,...,n

α(t )i

0

trasporto parallelo. Dato che la procedura del trasporto parallelo conserva le relazioni metriche

{e }

ed è biettiva, definisce ancora una base per il sottospazio N α di T M normale

i=2,...,n

α(t)i α(t) α(t)

a α̇(t). Infine consideriamo la funzione: n !

X

n 2 n i

3 7→

(t, v , . . . , v ) exp v e (8.7)

R α(t)i

α(t) i=2

Il significato geometrico della funzione definita in (8.7) dovrebbe essere chiaro: tale funzione

2 n

associa (t, v , . . . , v ) con il punto in M raggiunto dalla geodetica che parte da α(t) con vettore

ni=2 i

P

tangente iniziale v e normale ad α, quando il valore del parametro affine su di essa vale

α(t)i 154

1. 1 n

Discutiamo il dominio di definizione della funzione (8.7). Fissiamo coordinate locali x , . . . , x

3

su un insieme aperto U α(t ). La funzione exp su T M è definita su un insieme aperto

0 1 n

0 0

1 n

piccolo a sufficienza E T M tale che, nelle coordinate x , . . . , x , x , . . . , x , ha la forma

n n

× ⊂ ×

V B (0) , dove V corrisponde ad un intorno aperto di α(t ) e B (0) è una palla

R R 0

δ δ

n

aperta di raggio δ > 0 centrata nell’origine di . In queste coordinate (8.7) si esplicita come:

R

n !

k

0

X

2 n 2 n

7→

(t, v , . . . , v ) exp x (t, v , . . . , v ) , (8.8)

1 n

(x (t),...,x (t)) k

∂x 1 n

(x (t),...,x (t))

k=1

k k

dove α è parametrizzata come x = x (t) e

¬ ¶

n

k

0 X

2 n i k |

x (t, v , . . . , v ) := v e , dx .

1 n 1 n

(x (t),...,x (t))i (x (t),...,x (t))

i=2

Dato che tutte le funzioni coinvolte sono continue, si prova facilmente che il membro di destra

2 n n−1

∈ − × ⊂

in (8.8) è ben definito per (t, v , . . . , v ) (t , t + ) D, essendo D qualche palla

R

0 0

n−1

aperta centrata nell’origine di .

R ∞ ∞

Teorema 8.2. Sia M una varietà differenziabile C dotata di una metrica C riemanniana

i j

⊗ → 6

o lorentziana g = g dx dx , e sia α : (a, b) M una curva differenziabile con α̇(t) = 0 per

ij

∈ ∈

ogni t (a, b), α è assunta essere di tipo tempo nel caso lorentziano. Si scelga t (a, b), e

0

{e }

si consideri una base del sottospazio N α di T M normale a α̇(t ), e si

0 i=2,...,n

α(t ) α(t ) α(t )i

0 0 0

{e } ∈

trasporti tale base lungo α in per ogni t (a, b) usando la procedura del trasporto

i=2,...,n

α(t)i

parallelo. Infine si consideri la funzione: n !

X

2 n i

− × 3 7→

(t , t + ) D (t, v , . . . , v ) exp v e (8.9)

0 0 α(t)i

α(t) i=2

n−1 n−1

per qualche > 0 ed essendo D una palla aperta centrata nell’origine di . Valgono

R R

i seguenti fatti.

(a) Restringendo se necessario l’insieme di definizione, la funzione (8.9) definisce un diffeomor-

fismo locale.

(b) Nella carta locale attorno ad α dotata di coordinate

1 2 n 2 n

(y , y , . . . , y ) := (t, v , . . . , v ) ,

i coefficienti di connessione della connessione di Levi-Civita soddisfano, per i = 1, . . . , n,

ijk ∈ − 6

Γ (α(t)) = 0 , se t (t , t + ) e (j, k) = (1, 1). (8.10)

0 0

(c) Se α è una geodetica, nel sistema suddetto di coordinate locali attorno ad α, i coefficienti di

connessione della connessione di Levi-Civita soddisfano:

ijk ∈ −

Γ (α(t)) = 0 , se t (t , t + ) e i, j, k = 1, . . . , n. (8.11)

0 0

155

Ulteriormente, nel sistema di coordinate detto, le derivate delle componenti della metrica si an-

∈ − ♦

nullano lungo α per t (t , t + ).

0 0 1 n

Dimostrazione. Si considerino coordinate normali x , . . . , x centrate in p = α(t ) ed associate

0

1 i

{ ∪ {e } | |

alla base α̇(t )} . In questo caso ∂/∂x = α̇(t ) e ∂/∂x = e per

0 i=2,...,n p 0 p

α(t )i α(t )i

0 0

i = 2, . . . , n.

La formula di derivazione delle funzioni composte produce immediatamente:

k € Š n

n !!

∂ ∂ k X

X i k 2 n

i +

exp (0) y g (t, y , . . . , y )

exp y e = ,

α(t)i α(t)

α(t)

1

∂y ∂t t=t

α(t ) 0 i=2

i=2

0 2 n

(y ,...,y )=(0,...,0)

k

dove le funzioni g sono C . Dato che exp (0) = α(t), si conclude che:

α(t) ‚ Œ

k k

n !!

∂ ∂ ∂

X k k

i k

= α (t) + 0 = α̇ (t ) =

exp y e = δ ,

0

α(t)i

α(t) 1

1 1

∂y ∂t ∂y

t=t

α(t ) α(t )

0

i=2

0 0

Per j = 2, . . . , n, usando l’osservazione 8.5 si arriva a (dove non vale la somma sugli indici

ripetuti): k € € ŠŠ

n !! ∂

∂ k

X i j k k

y e = exp y e = (e ) = δ .

exp α(t)i α(t )j α(t )j

α(t) α(t ) j

j j 0 0

0

∂y ∂y 2 n

α(t ) (y ,...,y )=(0,...,0)

i=2

0

Quindi, per h, k = 1, . . . , n, si ha: k

n !!

∂ X i k

y e

exp = δ ,

α(t)i

α(t) h

h

∂y α(t ) i=2

0

e pertanto il rango della funzione (8.9) vale n in α(t ) e quindi tale funzione definisce un diffeo-

0

morfismo locale attorno a p. Questo risultato conclude la prova di (a). La prova di (b) si ottiene

procedendo come nella prova dell’analogo statement nel teorema 8.1, usando i fatti seguenti. (i)

ni=2 i |

P

Le geodetiche che partono da α(t) con vettore tangente iniziale v hanno equazio-

α(t)

i

∂y

1 j j kij

ne y (λ) = t (costante!) e y (λ) = λv per j = 2, . . . , n, questo comporta che Γ (α(t)) = 0 if

j

i, j = 2, . . . , n. (ii) I vettori ∂/∂y con j = 2, . . . , n soddisfano l’equazione del trasporto parallelo

1

rispetto ad α, cioé rispetto a ∂/∂y :

d k i kir r

δ + δ Γ (α(t))δ = 0 ,

j 1 j

dt

k kj1

questo fatto implica che Γ (α(t)) = Γ (α(t)) = 0 per j = 2, . . . , n.

1j 1 n

Per la dimostrazione di (c) notiamo che, se α è una geodetica, in coordinate y , . . . , y , la curva

j 1

y (λ) = 0 costantemente se j = 2, . . . , n e y (λ) = λ è una geodetica perché coincide con α.

k

Quindi con la stessa procedura usata precedentemente ne consegue che deve essere Γ (α(t)) = 0.

11

156

2 ∞

Definizione 8.3. Sia M una varietà differenziabile C dotata di una metrica riemanniana o

∞ →

lorentziana g di classe C . Si consideri una curva differenziabile non singolare α : (a, b) M

che è ulteriormente assunta essere di tipo tempo se la metrica è lorentziana. Un sistema di

coordinate definito in un intorno di un segmento di curva centrato in t (a, b):

0

{α(t) | ∈ −

t (t , t + )} ,

0 0 ♦

come precisato in (b) di teorema 8.2 è detto sistema di coordinate riemanniane adattate a α.

8.3 La versione geometrica di RG3 e nozione relativistica di

gravità.

Procediamo ora con la trascrizione, in termini matematici, del principio RG3. Successivamente

ci interrogheremo sul significato della nozione di gravità in relatività generale e vedremo che

essa coincide con la curvatura dello spaziotempo.

Partiamo, in conformità con i principi RG1 e RG2, con la seguente definizione di spaziotempo

del tutto generale, che sarà l’ambiente nel quale sviluppare tutta la teoria della Relatività gene-

rale:

Definizione 8.4. Uno spaziotempo della relatività generale, o più brevemente uno

spaziotempo, è una varietà differenziabile di dimensione 4 e classe C dotata di una metrica

C lorentziana g. Tale varietà è assunta essere connessa ed orientata temporalmente e non

ammettere curve causali futuro orientate (definizione 3.11) che siano chiuse.

♦.

Commenti 8.1.

(1) La richiesta di non ammettere curve causali (futuro orientate) chiuse serve ad evitare proble-

mi di carattere fisico, per esempio riguardanti l’esistenza delle soluzioni di equazioni differenziali

iperboliche descriventi l’evoluzione di sistemi fisici, oltre ad evitare i paradossi causali della fan-

tascienza. Nel caso dello spaziotempo di Minkowski, tali curve non possono esistere, ma possono

esistere su varietà lorentziane connesse orientate temporalmente. Tale condizione viene spesso

rafforzata richiedendo che non possano esistere curve causali futuro orientate che tornino arbi-

trariamente vicine a loro stesse. In termini matematici questa richiesta viene enunciata dalla

cosiddetta condizione di causalità forte come segue: per ogni intorno aperto U di ogni

p

∈ ⊂

punto p M esiste un secondo intorno aperto di p, V U , tale che ogni curva causale futuro

p p

orientata interseca V una volta sola, cioé dando luogo ad un insieme connesso.

p

(2) Si potrebbe assumere che lo spaziotempo sia, più semplicemente, temporalmente orienta-

bile e non temporalmente orientato. In effetti, volendo essere rigorosi dal punto di vista fisico

fondazionale, la scelta dell’orientazione temporale deve essere fissata dalle stesse leggi fisiche (la

termodinamica), piuttosto che essere messa a mano.

157

8.3.1 L’interpretazione di RG3: sistemi di coordinate localmente inerziali.

In conformità con il principio RG1 le storie dei punti materiali nello spaziotempo sono descritte

da curve differenziabili di tipo causale, cioé da linee di universo nel senso della definizione 3.11.

Se, in conformità con il principio RG2 assumiamo in particolare che la descrizione relativistica

del moto in caduta libera nel campo gravitazionale classico assegnato sia data dal moto geodeti-

co nello spaziotempo M rispetto alla connessione di Levi-Civita della metrica g, abbiamo come

risultato che la linea di universo di un corpo classicamente sottoposto alla sola forza di gravità

non dipende dalla massa, ma solo dall’evento da cui parte la geodetica e dalla quadrivelocità

iniziale della geodetica. Questo è in perfetta armonia con il risultato classico che il moto di un

punto materiale soggetto al solo campo gravitazionale non dipenda dalla massa del punto, ma

solo dalla posizione ed dalla velocità iniziale del punto.

Consideriamo ora un corpo in caduta libera nel campo gravitazionale, ossia, nella visione einstei-

niana, una geodetica causale diretta verso il futuro. Assumiamo più fortemente che la geodetica

γ, parametrizzata nel tempo proprio τ , sia di tipo tempo futuro (è sufficiente assumere ciò in

un evento, le proprietà del trasporto parallelo implicano che ciò sarà vero in tutti gli altri eventi

raggiunti dalla geodetica). Parametrizziamo la geodetica con il tempo proprio τ che può essere

definito esattamente come nella definizione 4.2 senza alcun problema. In virtù di RG1, nello

spazio tangente a ciascun evento raggiunto dalla geodetica possiamo dare significato fisico agli

oggetti matematici, mutuando tale significato da quello che si ha in relatività speciale. Lo spazio

tangente T M sarà decomposto in una somma diretta ortogonale:

γ(τ ) ⊕

L( γ̇(τ )) Σ ,

γ(τ )

dove Σ ha la naturale interpretazione di spazio di quiete istantaneo con un osservatore la cui

γ(τ )

evoluzione temporale è descritta dalla geodetica e il cui asse temporale è indicato dal vettore

quadrivelocità V (τ ) := γ̇(τ ). In tale spazio di quiete, per costruzione, la velocità della luce vale

c in ogni direzione isotropicamente, dato che la struttura è la stessa che si ha in un riferimento

inerziale nello spaziotempo di Minkowski. Possiamo ripristinare la definizione di velocità di una

0

curva di universo γ (generalmente diversa da γ), rispetto all’osservatore in quiete con γ, nel-

l’evento γ(τ ) in cui le due curve si intersecano. La definizione 4.3 può essere usata senza alcun

problema e con le stesse proprietà già viste nello spazio di Minkowski. Si ha in particolare che

le curve di tipo luce descrivono punti materiali in moto alla velocità della luce per ogni osser-

vatore. In questo contesto possiamo introdurre la nozione di sistema di coordinate localmente

inerziale attorno ad una geodetica di tipo tempo. Un sistema di coordinate localmente inerziale

∈ −

nell’intorno di un segmento di geodetica γ(τ ) con t (τ , τ + ) è un sistema di coordinate

0 0

0 1 2 3 0 α

riemanniane adattate a γ, x = cτ, x , x , x . Al solito x indica la coordinata temporale e x

indica la generica coordinata spaziale α = 1, 2, 3. Questo sistema di coordinate è quello assunto

esistere nel principio RG3 come ora discuteremo.

Consideriamo una geodetica ρ di tipo tempo futuro corrispondente all’evoluzione spaziotempo-

rale di un corpo puntiforme lanciato dall’osservatore descritto da γ e lasciato evolvere in caduta

libera. Il lancio avviene nell’evento γ(τ ). In coordinate riemanniane si ha che ρ è descritta da

0

i i α

x = x (λ), dove λ è un qualsiasi parametro affine, con ρ(0) = γ(τ ) e pertanto x (0) = 0 e

0

158


PAGINE

189

PESO

1.01 MB

AUTORE

Jacko

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Dispense di Fisica matematica del prof. Moretti sulla teoria della relatività speciale, spiegazione della teoria della relatività generale, costanza della velocità della luce, postulati fondamentali della relatività speciale, gruppi di Lorentz e gruppi di Poincare, lo spaziotempo della Relativita Speciale, cinematica in relatività speciale, dinamica in relatività speciale, teorema delle forze vive, teorema della divergenza in forma covariante, legge di conservazione del quadri impulso, gruppo di Lie O, principio di Equivalenza di Einstein.


DETTAGLI
Corso di laurea: Corso di laurea magistrale in matematica
SSD:
Università: Trento - Unitn
A.A.: 2012-2013

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Jacko di informazioni apprese con la frequenza delle lezioni di Fisica matematica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Trento - Unitn o del prof Moretti Valter.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Fisica matematica

Equazioni a derivate parziali
Dispensa
Meccanica dei continui
Dispensa