The Hopfield model

Mattis model (1977)

Abbiamo studiato il comportamento termodinamico del Modello di Curie-Weiss. In particolare, sotto una certa temperatura critica, il modello arrivava ad uno stato di equilibrio con magnetizzazzione media (caso di campo esterno nullo). Di fatto il sistema (visto come rete di neuroni McCulloch-Pitts con rumore) sta “ricordando” uno dei due stati a magnetizzazzione unitaria. E’ facile riadattare le interazioni affinchè la rete converga ad un pattern arbitrario: sia un pattern, l’Hamiltoniana di Mattis

dove abbiamo introdotto la magnetizzazzione di Mattis

A livello matematico il modello è identico a quello di Curie-Weiss, ed al di sotto della temperatura critica il sistema ha come configurazione di equilibrio gli stati con , ovvero .

Notiamo che abbiamo usato la regola di Hebb per definire le interazioni.

Low load

Studiamo il caso di numero di pattern finito, detto basso carico. Le interazioni sono definite in accordo con la regola di Hebb

e con pattern Rademacher.

L’hamiltoniana del sistema è

ovviamente il termine costante è ininfluente nel limite termodinamico. Calcoliamo la funzione di partizione dipendente da una specifica realizzazzione dei pattern rademacher.

un trucco per svolgere questo conto è introdurre una densità degli stati continua

ovviamente siccome le magnetizzazzioni di mattis hanno solo alcuni valori razionali tra ed , dovremmo intrdurre delle delta, che rappresenteremo come la loro trasformata

quindi

usando l’integrale di picco prima per l’integrale sulle e dopo sulle i termini di ordine che sopravvivono dell’energia libera intensiva del limite termodinamico sono

dove le magnetizzazzioni di mattis soddisfano l’equazione di autoconsistenza

il valore atteso è su Rademacher.

Studiamo il caso di pattern puro, ovvero mentre tutte le altre magnetizzazzioni di mattis sono nulle. L’equazione di autoconsistenza diventa semplice da analizzare, infatti

dove abbiamo soppresso date che la tangente iperbolica è dispari. Abbiamo ottenuto proprio l’equazione di autoconsistenza del Modello di Curie-Weiss.

L’analisi della stabilità suegue direttamente da Curie-Weiss, avremo quindi una regione di retrivial (fase ferromagnetifca) ed una caotica (paramagnetica).

Osservando che la derivata è proprio , sappiamo che il valore critico .

Si possono poi studiare gli stati detti misture simmetriche, ovvero il vettore delle magnetizzazzioni di mattis è non nullo per pattern, e con stesso valore di overlap.

Scrivendo in forma vettoriale le equazioni di autoconsistenza

per ogni termine

definendo le somme parziali

Possiamo studiare analiticamente il caso noiseless (la tangente iperbolica vale uno)

La conclusione è che stati misti simmetrici dispari sono stabili (minimi dell’eneregia libera), mentre gli stati pari sono instabili (punti di sella).

Se la temperatura è abbastanza alta (ma sempre nella regione di retrival) gli stati misti diventano instabili (nice!) ma il recupero degli stati puri perde qualità ;(.

Signal-to-noise analysis

Analisi euristica per stimare la stabilità dei pattern, vale sia per il caso a basso carico che alto.

Se vogliamo che uno dato pattern sia stabile (nella dinamica deterministica) deve valere

Esplicitiamo il campo locale quando

se devono avere lo stesso segno il prodotto deve essere maggiore di zero. separando il termine

Nel limite termodinamico il primo termine tende ad uno, e viene detto termine di segnale. Il restante è detto termine di rumore.

assumendo indipendenti le , il termine di rumore è composto da termini . Sempre per grandi sarà distribuito come una gaussiana di varianza , dunque alla fine

questa analisi rudimentale ci dice che se il numero di pattern cresce più lentamente rispetto ad , tutti i pattern sono stabili (anche il rumore tende a zero).

Consideriamo una -mistura simmetrica. . Se calcoliamo la magnetizzazzione di mattis di uno dei tre stati con questa mistura

La media empirica () converge al valore atteso

mentre è nulla per .

Controlliamo la stabilità

per il termine di rumore vale la stessa analisi del caso puro, ho una somma di circa termini , dunque il termine di rumore è del tipo

Analizziamo la stabilità dei pattern puri nel caso ad alto carico. E’ chiaro che se , il termine di rumore nel limite converge ad una gaussiana non varianza non nulla:

Quindi la probabilità che un sito sia stabile è la probabilità che

probabilità esprimibile in termine della cumulativa, ovvero la . Se assumiamo possiamo usare l’espressione approssimata ed ottenere

Affinchè lo stato sia stabile, tutti gli siti lo dovranno essere. Assumendo indipendenza la proabilità che uno stato puro sia stabile diventa

l’evento complentare è la probabilità di avere degli errori, quindi il valore atteso di errori sarà

vogliamo siano molto minori di uno. Possiamo risolvere per ed ottenere

se richiediamo la stabilità di tutti i pattern ( siti)

notiamo che questi casi sono sempre in basso carico, ovvero .

High load