ETFFIN Finance >> Finanza personale corso >  >> Financial management >> finanza

Somma dei quadrati

Qual è la somma dei quadrati?

La somma dei quadrati è una tecnica statistica utilizzata nell'analisi di regressione per determinare la dispersione dei punti dati. In un'analisi di regressione, l'obiettivo è determinare quanto bene una serie di dati può essere adattata a una funzione che potrebbe aiutare a spiegare come è stata generata la serie di dati. La somma dei quadrati viene utilizzata come metodo matematico per trovare la funzione che meglio si adatta (varia meno) dai dati.

La formula per la somma dei quadrati è

Per un insieme X di n Oggetti: Somma dei quadrati = ? io = 0 n ( X io X io ) 2 dove: X io = Il io T h articolo nel set X io = La media di tutti gli elementi del set ( X io X io ) = La deviazione di ciascun elemento dalla media \begin{allineato} &\text{Per un insieme } X \text{ di } n \text{ elementi:}\\ &\text{Somma dei quadrati}=\sum_{i=0}^{n}\left (X_i-\overline{X}\right)^2\\ &\textbf{dove:}\\ &X_i=\text{L'elemento } i^{th} \text{ nel set}\\ &\overline{ X}=\text{La media di tutti gli elementi nel set}\\ &\left(X_i-\overline{X}\right) =\text{La deviazione di ogni elemento dalla media}\\ \end{allineato } ​Per un insieme X di n elementi:Somma dei quadrati=i=0∑n​(Xi​−X)2dove:Xi​=L'i-esimo elemento nell'insiemeX=La media di tutti gli elementi nell'insieme(Xi​−X )=La deviazione di ogni elemento dalla media​

La somma dei quadrati è anche nota come variazione.

Cosa ti dice la somma dei quadrati?

La somma dei quadrati è una misura della deviazione dalla media. Nelle statistiche, la media è la media di un insieme di numeri ed è la misura di tendenza centrale più comunemente usata. La media aritmetica viene semplicemente calcolata sommando i valori nel set di dati e dividendo per il numero di valori.

Diciamo che i prezzi di chiusura di Microsoft (MSFT) negli ultimi cinque giorni sono stati 74,01, 74.77, 73.94, 73.61, e 73,40 in dollari USA. La somma dei prezzi totali è $ 369,73 e il prezzo medio o medio del libro di testo sarebbe quindi $ 369,73 / 5 =$ 73,95.

Ma conoscere la media di un insieme di misurazioni non è sempre sufficiente. Qualche volta, è utile sapere quanta variazione c'è in una serie di misurazioni. La distanza tra i singoli valori dalla media può fornire un'idea di quanto le osservazioni o i valori siano adatti al modello di regressione creato.

Per esempio, se un analista volesse sapere se il prezzo delle azioni di MSFT si muove di pari passo con il prezzo di Apple (AAPL), può elencare la serie di osservazioni per il processo di entrambi gli stock per un certo periodo, dire 1, 2, o 10 anni e creare un modello lineare con ciascuna delle osservazioni o misurazioni registrate. Se la relazione tra entrambe le variabili (cioè, il prezzo di AAPL e il prezzo di MSFT) non è una linea retta, poi ci sono variazioni nel set di dati che devono essere esaminate.

Nelle statistiche parlano, se la linea nel modello lineare creato non passa attraverso tutte le misurazioni di valore, quindi parte della variabilità che è stata osservata nei prezzi delle azioni è inspiegabile. La somma dei quadrati viene utilizzata per calcolare se esiste una relazione lineare tra due variabili, e qualsiasi variabilità inspiegabile è indicata come somma residua dei quadrati.

La somma dei quadrati è la somma dei quadrati di variazione, dove la variazione è definita come lo spread tra ogni singolo valore e la media. Per determinare la somma dei quadrati, la distanza tra ogni punto di dati e la linea di miglior adattamento viene squadrata e quindi sommata. La linea di miglior adattamento ridurrà al minimo questo valore.

Come calcolare la somma dei quadrati

Ora puoi vedere perché la misura è chiamata somma delle deviazioni al quadrato, o la somma dei quadrati in breve. Usando il nostro esempio MSFT sopra, la somma dei quadrati può essere calcolata come:

  • SS =(74,01 - 73,95) 2 + (74,77 - 73,95) 2 + (73,94 - 73,95) 2 + (73,61 - 73,95) 2 + (73,40 - 73,95) 2
  • SS =(0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS =1.0942

Sommando la sola somma delle deviazioni senza quadratura risulterà un numero uguale o vicino a zero poiché le deviazioni negative compenseranno quasi perfettamente le deviazioni positive. Per ottenere un numero più realistico, la somma delle deviazioni deve essere al quadrato. La somma dei quadrati sarà sempre un numero positivo perché il quadrato di qualsiasi numero, sia positivo che negativo, è sempre positivo.

Esempio di come usare la somma dei quadrati

Sulla base dei risultati del calcolo MSFT, un'elevata somma dei quadrati indica che la maggior parte dei valori è più lontana dalla media, e quindi, c'è una grande variabilità nei dati. Una bassa somma dei quadrati si riferisce alla bassa variabilità nell'insieme delle osservazioni.

Nell'esempio sopra, 1.0942 mostra che la variabilità del prezzo delle azioni di MSFT negli ultimi cinque giorni è molto bassa e gli investitori che desiderano investire in azioni caratterizzate da stabilità dei prezzi e bassa volatilità possono optare per MSFT.

Punti chiave

  • La somma dei quadrati misura la deviazione dei punti dati dal valore medio.
  • Un risultato di somma dei quadrati più elevato indica un elevato grado di variabilità all'interno del set di dati, mentre un risultato più basso indica che i dati non variano notevolmente dal valore medio.

Limitazioni dell'uso della somma dei quadrati

Prendere una decisione di investimento su quale titolo acquistare richiede molte più osservazioni rispetto a quelle elencate qui. Un analista potrebbe dover lavorare con anni di dati per sapere con maggiore certezza quanto sia alta o bassa la variabilità di un asset. Man mano che vengono aggiunti più punti dati al set, la somma dei quadrati diventa più grande man mano che i valori saranno più distribuiti.

Le misure di variazione più utilizzate sono la deviazione standard e la varianza. Però, per calcolare una delle due metriche, si deve prima calcolare la somma dei quadrati. La varianza è la media della somma dei quadrati (cioè, la somma dei quadrati divisa per il numero di osservazioni). La deviazione standard è la radice quadrata della varianza.

Esistono due metodi di analisi di regressione che utilizzano la somma dei quadrati:il metodo dei minimi quadrati lineari e il metodo dei minimi quadrati non lineari. Il metodo dei minimi quadrati si riferisce al fatto che la funzione di regressione minimizza la somma dei quadrati della varianza dai punti dati effettivi. In questo modo, è possibile disegnare una funzione che fornisce statisticamente il miglior adattamento ai dati. Nota che una funzione di regressione può essere lineare (una linea retta) o non lineare (una linea curva).