Calcolo della somma dei quadrati (sse)

La somma dei quadrati, o SSE, è un calcolo statistico preliminare che porta a valori di dati diversi. Quando si dispone di un insieme di valori di dati, è utile poter determinare quanto strettamente questi valori sono correlati tra loro. Devi organizzare i tuoi dati in una tabella e poi fare dei calcoli piuttosto semplici. Dopo aver trovato l`SSE per un set di dati, puoi trovare la varianza e la deviazione standard.

Passi

Metodo 1 di 3: Calcola manualmente l`SSE

Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 1
1. Crea una tabella di tre colonne. Il modo più semplice per calcolare l`SSE è iniziare con una tabella di tre colonne. Etichetta le tre colonne Dove la{displaystyle {text{Valore}}}{displaystyle {text{Valore}}}, deviazione{displaystyle {text{Deviazione}}}{displaystyle {text{Deviazione}}}, e deviazione2{displaystyle {text{Deviazione}}^{2}}{displaystyle {text{Deviazione}}^{2}}.
Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 2
2. Compila i dettagli. La prima colonna contiene i valori delle tue misurazioni. Riempi la colonna Dove la{displaystyle {text{Valore}}}{displaystyle {text{Valore}}} con le tue letture. Potrebbero essere i risultati di un esperimento, uno studio statistico o semplicemente i dati di un problema di matematica.
  • In questo caso, supponiamo di lavorare con dati medici e di avere un elenco delle temperature corporee di dieci pazienti. La temperatura corporea normale prevista è di 98,6 gradi. Viene misurata la temperatura di dieci pazienti e fornisce i valori 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 e 99,1. Viene misurata la temperatura di dieci pazienti e fornisce i valori 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 e 99,1. Scrivi questi valori nella prima colonna.
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 3
    3. Calcola la media. Prima di poter calcolare l`errore per ciascuna misurazione, è necessario calcolare la media dell`intero set di dati.
  • La media di un set di dati è la somma dei suoi valori divisa per il numero di valori nel set. Questo può essere rappresentato simbolicamente, con la variabile μ{ displaystyle mu}mu:
  • μ=ΣXn{displaystyle mu ={frac {Sigma x}{n}}}{displaystyle mu ={frac {Sigma x}{n}}}
  • Per questi dati, la media è calcolata come segue:
  • μ=99,0+98,6+98,5+101,1+98,3+98,6+97,9+98,4+99,2+99,110{displaystyle mu ={frac {99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.1} {10}}}{displaystyle mu ={frac {99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.1} {10}}}
  • μ=988,710{displaystyle mu ={frac {988,7}{10}}}{displaystyle mu ={frac {988,7}{10}}}
  • μ=98,87{ displaystyle mu = 98,87}{ displaystyle  mu = 98,87}
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 4
    4. Calcolare i singoli valori di errore. Nella seconda colonna della tua tabella devi inserire i valori di errore per ogni valore di dati. L`errore è la differenza tra la lettura e la media.
  • Per il dato set di dati, sottrarre la media, 98,87, da ciascun valore misurato e compilare la seconda colonna con i risultati. Questi dieci calcoli funzionano così:
  • 99,0-98,87=0,13{ displaystyle 99,0-98,87=0,13}{ displaystyle 99,0-98,87=0,13}
  • 98,6-98,87=-0,27{ displaystyle 98,6-98,87=-0,27}{ displaystyle 98,6-98,87=-0,27}
  • 98,5-98,87=-0,37{ displaystyle 98,5-98,87=-0,37}{ displaystyle 98,5-98,87=-0,37}
  • 101,1-98,87=2,23{ displaystyle 101,1-98,87 = 2,23}{ displaystyle 101,1-98,87 = 2,23}
  • 98,3-98,87=-0,57{ displaystyle 98,3-98,87=-0,57}{ displaystyle 98,3-98,87=-0,57}
  • 98,6-98,87=-0,27{ displaystyle 98,6-98,87=-0,27}{ displaystyle 98,6-98,87=-0,27}
  • 97,9-98,87=-0,97{ displaystyle 97,9-98,87=-0,97}{ displaystyle 97,9-98,87=-0,97}
  • 98,4-98,87=-0,47{ displaystyle 98,4-98,87=-0,47}{ displaystyle 98,4-98,87=-0,47}
  • 99,2-98,87=0,33{ displaystyle 99,2-98,87=0,33}{ displaystyle 99,2-98,87=0,33}
  • 99,1-98,87=0,23{ displaystyle 99,1-98,87=0,23}{ displaystyle 99,1-98,87=0,23}
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 5
    5. Calcola il SSE. Nella terza colonna della tabella, trova il quadrato di ciascuno dei valori risultanti nella colonna centrale. Questi rappresentano i quadrati della deviazione dalla media per ogni valore di dati misurato.
  • Per ogni valore nella colonna centrale, usa una calcolatrice per calcolare il quadrato. Registrare i risultati nella terza colonna, come segue:
  • 0,132=0,0169{displaystyle 0,13^{2}=0,0169}{displaystyle 0,13^{2}=0,0169}
  • (-0,27)2=0,0729{displaystyle (-0,27)^{2}=0,0729}{displaystyle (-0,27)^{2}=0,0729}
  • (-0,37)2=0,1369{displaystyle (-0,37)^{2}=0,1369}{displaystyle (-0,37)^{2}=0,1369}
  • 2,232=4,9729{displaystyle 2.23^{2}=4.9729}{displaystyle 2.23^{2}=4.9729}
  • (-0,57)2=0,3249{displaystyle (-0,57)^{2}=0,3249}{displaystyle (-0,57)^{2}=0,3249}
  • (-0,27)2=0,0729{displaystyle (-0,27)^{2}=0,0729}{displaystyle (-0,27)^{2}=0,0729}
  • (-0,97)2=0,9409{displaystyle (-0,97)^{2}=0,9409}{displaystyle (-0,97)^{2}=0,9409}
  • (-0,47)2=0,2209{displaystyle (-0,47)^{2}=0,2209}{displaystyle (-0,47)^{2}=0,2209}
  • 0,332=0,1089{displaystyle 0,33^{2}=0,1089}{displaystyle 0,33^{2}=0,1089}
  • 0,232=0,0529{displaystyle 0,23^{2}=0,0529}{displaystyle 0,23^{2}=0,0529}
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 6
    6. Somma i quadrati degli errori. L`ultimo passaggio è trovare la somma dei valori nella terza colonna. Il risultato desiderato è l`SSE, ovvero la somma dei quadrati degli errori.
  • Per questo set di dati, l`SSE viene calcolato sommando i dieci valori nella terza colonna:
  • SSe=6,921{displaystyle SSE=6.921}{displaystyle SSE=6.921}
  • Metodo 2 di 3: crea un foglio di calcolo Excel per calcolare l`SSE

    Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 7
    1. Etichetta le colonne del foglio di calcolo. Crei una tabella con tre colonne in Excel, con le stesse tre intestazioni di cui sopra.
    • Nella cella A1, digita "Valore" come intestazione.
    • Nella casella B1, digitare "Deviation" come intestazione.
    • Nella casella C1, digitare `Deviazione al quadrato` come intestazione.
    Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 8
    2. Inserisci i tuoi dati. Nella prima colonna devi inserire i valori delle tue misure. Se il set è piccolo, puoi facilmente digitarlo a mano. Se si dispone di un set di dati di grandi dimensioni, potrebbe essere necessario copiare e incollare i dati nella colonna.
    Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 9
    3. Determina la media dei punti dati. Excel ha una funzione che calcola la media per te. In una cella vuota sotto la tabella dei dati (non importa quale cella scegli), inserisci:
  • =Media(A2:___)
  • Non digitare spazi vuoti. Riempi quello spazio con il nome della cella del tuo ultimo punto dati. Ad esempio, se hai 100 punti dati, utilizzeresti la funzione:
  • =Media(A2:A101)
  • Questa funzione contiene i dati dalle celle da A2 a A101, perché la riga superiore contiene le intestazioni di colonna.
  • Quando si preme Invio o si fa clic su un`altra cella nella tabella, la cella appena programmata viene riempita automaticamente con la media dei valori dei dati.
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 10
    4. Entra nella funzione di misurazione dell`errore. Nella prima cella vuota della colonna "Deviazione", devi inserire una funzione per calcolare la differenza tra ciascun punto dati e la media. Per fare ciò, usa il nome della cella in cui si trova la media. Supponiamo che tu stia utilizzando la cella A104 per ora.
  • La funzione di calcolo dell`errore, che inserisci nella cella B2, è:
  • =A2-$A$104. I segni del dollaro sono necessari per assicurarsi di bloccare la casella A104 per ogni calcolo.
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 11
    5. Compila la funzione per gli errori al quadrato. Nella terza colonna puoi indicare a Excel di calcolare il quadrato desiderato.
  • Nella cella C2, inserisci la seguente funzione:
  • =B2^2
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 12
    6. Copia le funzioni per riempire l`intera tabella. Dopo aver inserito le funzioni nella cella in alto di ciascuna colonna, rispettivamente B2 e C2, è necessario riempire l`intera tabella. Potresti ridigitare la funzione in ogni riga della tabella, ma ciò richiederebbe troppo tempo. Usando il mouse, evidenzia le celle B2 e C2 insieme e, senza rilasciare il pulsante del mouse, trascina fino alla cella inferiore di ciascuna colonna.
  • Supponendo di avere 100 punti dati nella tabella, trascina il mouse sulle celle B101 e C101.
  • Quando si rilascia il pulsante del mouse, le formule vengono copiate in tutte le celle della tabella. La tabella dovrebbe essere riempita automaticamente con i valori calcolati.
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 13
    7. Trova la SSE. La colonna C della tabella contiene tutti i valori di errore al quadrato. L`ultimo passaggio consiste nel lasciare che Excel calcoli la somma di questi valori.
  • In una cella sotto la tabella, probabilmente C102 in questo esempio, inserisci la seguente funzione:
  • =Somma(C2:C101)
  • Facendo clic su Invio o facendo clic in un`altra cella della tabella otterrai il valore SSE dei tuoi dati.
  • Metodo 3 di 3: mettere in relazione SSE con altri dati statistici

    Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 14
    1. Calcola la deviazione della SSE. Trovare l`SSE per un set di dati è generalmente un elemento costitutivo per trovare altri valori più utili. Il primo di questi è la varianza. La varianza è una misura che indica quanto i dati misurati deviano dalla media. In realtà è la media delle differenze al quadrato dalla media.
    • Poiché SSE è la somma degli errori al quadrato, puoi trovare la media (questa è la varianza) semplicemente dividendo per il numero di valori. Tuttavia, se stai calcolando la varianza di un insieme di campioni, piuttosto che di un`intera popolazione, stai dividendo la varianza per (n-1) invece di n. Così:
    • Varianza = SSE/n, se si calcola la varianza di un`intera popolazione.
    • Varianza = SSE/(n-1), se si calcola la varianza di un campione di dati.
  • Per il problema del campione della temperatura dei pazienti, possiamo supporre che 10 pazienti costituiscano solo un campione. Pertanto, la varianza viene quindi calcolata come segue:
  • Varianza=SSE(n-1){displaystyle {text{Variazione}}={frac {text{SSE}}{(n-1)}}}{displaystyle {text{Variazione}}={frac {text{SSE}}{(n-1)}}}
  • Varianza=6,9219{displaystyle {text{Variazione}}={frac {6,921}{9}}}{displaystyle {text{Variazione}}={frac {6,921}{9}}}
  • Varianza=0,769{displaystyle {text{Variazione}}=0,769}{displaystyle {text{Variazione}}=0,769}
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 15
    2. Calcola la deviazione standard dell`SSE. La deviazione standard è un valore comunemente usato che indica quanto i valori di un set di dati si discostano dalla media. La deviazione standard è la radice quadrata della varianza. Si noti che la varianza è la media delle misure di errore al quadrato.
  • Pertanto, dopo aver calcolato l`SSE, puoi trovare la deviazione standard come segue:
  • deviazione standard=SSEn-1{displaystyle {text{Deviazione standard}}={sqrt {frac {text{SSE}}{n-1}}}}{displaystyle {text{Deviazione standard}}={sqrt {frac {text{SSE}}{n-1}}}}
  • Per il campione delle misurazioni di temperatura, puoi trovare la deviazione standard come segue:
  • deviazione standard=SSEn-1{displaystyle {text{Deviazione standard}}={sqrt {frac {text{SSE}}{n-1}}}}{displaystyle {text{Deviazione standard}}={sqrt {frac {text{SSE}}{n-1}}}}
  • deviazione standard=6.9219{displaystyle {text{Deviazione standard}}={sqrt {frac {text{6,921}}{9}}}}{displaystyle {text{Deviazione standard}}={sqrt {frac {text{6,921}}{9}}}}
  • deviazione standard=0,769{displaystyle {text{Deviazione standard}}={sqrt {0,769}}}{displaystyle {text{Deviazione standard}}={sqrt {0,769}}}
  • deviazione standard=0,877{displaystyle {text{Deviazione standard}}=0,877}{displaystyle {text{Deviazione standard}}=0,877}
  • Immagine titolata Calculate the Sum of Squares for Error (SSE) Step 16
    3. Utilizzare SSE per determinare la covarianza. Questo articolo si è concentrato sui set di dati che misurano un solo valore alla volta. Tuttavia, in molti studi potresti confrontare due valori separati. Ad esempio, vuoi sapere come si relazionano questi due valori, non solo alla media del set di dati. Questo valore è la covarianza.
  • I calcoli per la covarianza sono troppo dettagliati per essere descritti qui, tranne per notare che utilizzerai l`SSE per ogni tipo di dati e quindi lo confronterai. Per una descrizione più dettagliata della covarianza e dei calcoli coinvolti, cfr trova articoli su questo argomento su wikiHow.
  • Come esempio dell`uso della covarianza, è possibile confrontare l`età dei pazienti in uno studio medico con l`efficacia di un farmaco nell`abbassare la temperatura febbrile. Quindi hai un set di dati di età e un secondo set di dati di temperature. Quindi trovi l`SSE per ogni set di dati e da lì la varianza, le deviazioni standard e la covarianza.

  • Condividi sui social network: