The Hopfield model
Mattis model (1977)
Abbiamo studiato il comportamento termodinamico del Modello di Curie-Weiss. In particolare, sotto una certa temperatura critica, il modello arrivava ad uno stato di equilibrio con magnetizzazzione media (caso di campo esterno nullo). Di fatto il sistema (visto come rete di neuroni McCulloch-Pitts con rumore) sta “ricordando” uno dei due stati a magnetizzazzione unitaria. E’ facile riadattare le interazioni affinchè la rete converga ad un pattern arbitrario: sia un pattern, l’Hamiltoniana di Mattis
dove abbiamo introdotto la magnetizzazzione di Mattis
A livello matematico il modello è identico a quello di Curie-Weiss, ed al di sotto della temperatura critica il sistema ha come configurazione di equilibrio gli stati con , ovvero .
Notiamo che abbiamo usato la regola di Hebb per definire le interazioni.
Low load
Studiamo il caso di numero di pattern finito, detto basso carico. Le interazioni sono definite in accordo con la regola di Hebb
e con pattern Rademacher.
L’hamiltoniana del sistema è
ovviamente il termine costante è ininfluente nel limite termodinamico. Calcoliamo la funzione di partizione dipendente da una specifica realizzazzione dei pattern rademacher.
un trucco per svolgere questo conto è introdurre una densità degli stati continua
ovviamente siccome le magnetizzazzioni di mattis hanno solo alcuni valori razionali tra ed , dovremmo intrdurre delle delta, che rappresenteremo come la loro trasformata
quindi
usando l’integrale di picco prima per l’integrale sulle e dopo sulle i termini di ordine che sopravvivono dell’energia libera intensiva del limite termodinamico sono
dove le magnetizzazzioni di mattis soddisfano l’equazione di autoconsistenza
il valore atteso è su Rademacher.
Studiamo il caso di pattern puro, ovvero mentre tutte le altre magnetizzazzioni di mattis sono nulle. L’equazione di autoconsistenza diventa semplice da analizzare, infatti
dove abbiamo soppresso date che la tangente iperbolica è dispari. Abbiamo ottenuto proprio l’equazione di autoconsistenza del Modello di Curie-Weiss.
L’analisi della stabilità suegue direttamente da Curie-Weiss, avremo quindi una regione di retrivial (fase ferromagnetifca) ed una caotica (paramagnetica).
Osservando che la derivata è proprio , sappiamo che il valore critico .
Si possono poi studiare gli stati detti misture simmetriche, ovvero il vettore delle magnetizzazzioni di mattis è non nullo per pattern, e con stesso valore di overlap.
Scrivendo in forma vettoriale le equazioni di autoconsistenza
per ogni termine
definendo le somme parziali
Possiamo studiare analiticamente il caso noiseless (la tangente iperbolica vale uno)
La conclusione è che stati misti simmetrici dispari sono stabili (minimi dell’eneregia libera), mentre gli stati pari sono instabili (punti di sella).
Se la temperatura è abbastanza alta (ma sempre nella regione di retrival) gli stati misti diventano instabili (nice!) ma il recupero degli stati puri perde qualità ;(.
Signal-to-noise analysis
Analisi euristica per stimare la stabilità dei pattern, vale sia per il caso a basso carico che alto.
Se vogliamo che uno dato pattern sia stabile (nella dinamica deterministica) deve valere
Esplicitiamo il campo locale quando
se devono avere lo stesso segno il prodotto deve essere maggiore di zero. separando il termine
Nel limite termodinamico il primo termine tende ad uno, e viene detto termine di segnale. Il restante è detto termine di rumore.
assumendo indipendenti le , il termine di rumore è composto da termini . Sempre per grandi sarà distribuito come una gaussiana di varianza , dunque alla fine
questa analisi rudimentale ci dice che se il numero di pattern cresce più lentamente rispetto ad , tutti i pattern sono stabili (anche il rumore tende a zero).
Consideriamo una -mistura simmetrica. . Se calcoliamo la magnetizzazzione di mattis di uno dei tre stati con questa mistura
La media empirica () converge al valore atteso
mentre è nulla per .
Controlliamo la stabilità
per il termine di rumore vale la stessa analisi del caso puro, ho una somma di circa termini , dunque il termine di rumore è del tipo
Analizziamo la stabilità dei pattern puri nel caso ad alto carico. E’ chiaro che se , il termine di rumore nel limite converge ad una gaussiana non varianza non nulla:
Quindi la probabilità che un sito sia stabile è la probabilità che
probabilità esprimibile in termine della cumulativa, ovvero la . Se assumiamo possiamo usare l’espressione approssimata ed ottenere
Affinchè lo stato sia stabile, tutti gli siti lo dovranno essere. Assumendo indipendenza la proabilità che uno stato puro sia stabile diventa
l’evento complentare è la probabilità di avere degli errori, quindi il valore atteso di errori sarà
vogliamo siano molto minori di uno. Possiamo risolvere per ed ottenere
se richiediamo la stabilità di tutti i pattern ( siti)
notiamo che questi casi sono sempre in basso carico, ovvero .