Koeficient določitve (R na kvadrat)
Koeficient določitve je delež celotne variance spremenljivke, ki je pojasnjena z regresijo. Koeficient določitve, imenovan tudi R na kvadrat, odraža dobro prileganje modela spremenljivki, ki jo namerava pojasniti.
Pomembno je vedeti, da rezultat koeficienta določitve niha med 0 in 1. Bolj ko je njegova vrednost na 1, večja je prilagoditev modela spremenljivki, ki jo skušamo razložiti. Nasprotno, bližje ničli, manj tesen bo model in zato manj zanesljiv.

V prejšnjem izrazu imamo ulomek. Torej, pojdimo po delih. Najprej bomo analizirali števnik, to je zgornji del.

Tistim, ki ne poznajo izraza variance, priporočam, da preberete članek o tem. Tisti, ki ga poznajo, se morda zavedajo, da je izraz variance, vendar z dvema bistvenima razlikama.
Prva razlika je v tem, da ima Y cirkumfleks ali tisto, kar učitelji didaktično imenujejo "klobuk". Podrobnosti tega klobuka je, da je Y ocena modela, kaj je glede na pojasnjevalne spremenljivke vredno Y, vendar ni resnična vrednost Y, ampak ocena Y.
Drugič, deliti bi bilo treba s T. Kar je v drugih primerih zabeleženo kot N ali število opažanj. Ker pa bi jo nosila tudi imenovalna formula, iz obeh formul odstranimo imenovalce (spodaj), da poenostavimo izraz. Tako je lažje delati z njim.
Nato bomo izvedli isto analizo z imenovalnim delom (spodnji del).

V tem primeru je edina razlika od prvotne formule variance odsotnost njenega imenovalca. To pomeni, da se ne delimo s T ali N. Na ta način, ko bomo razložili dva dela splošnega izraza R kvadrata ali koeficienta določitve, bomo videli primer.
Koeficient variacijeLinearni korelacijski koeficientRegresijska analizaRazlaga koeficienta določljivosti
Recimo, da želimo pojasniti število zadetkov, ki jih Cristiano Ronaldo doseže na podlagi števila odigranih tekem. Predvidevamo, da več kot bo odigranih tekem, več golov bo dosegel. Podatki se nanašajo na zadnjih 8 sezon. Tako po ekstrakciji podatkov model da naslednjo oceno:

Kot lahko vidimo iz grafa, je razmerje pozitivno. Več odigranih tekem je seveda, več golov v sezoni doseže. Na podlagi izračuna R-kvadrata ustreza 0,835. To pomeni, da gre za model, katerega ocene se precej ujemajo z realno spremenljivko. Čeprav tehnično ne bi bilo pravilno, bi lahko rekli kaj takega, da model pojasnjuje 83,5% realne spremenljivke.
Koeficient določitvene težave
Problem koeficienta določitve in razlog, zakaj nastane prilagojeni koeficient določitve, je ta, da ne kaznuje vključitve nepomembnih pojasnjevalnih spremenljivk. Če modelu dodamo pet pojasnjevalnih spremenljivk, ki so malo povezane s cilji, ki jih v sezoni doseže Cristiano Ronaldo, se bo kvadrat R povečal. Zato mnogi ekonometrični, statistični in matematični strokovnjaki nasprotujejo uporabi kvadrata R kot reprezentativnega merila dobrega dejanskega stanja.
Prilagojeni koeficient določljivosti
Prilagojeni koeficient določitve (prilagojeni R na kvadrat) je mera, ki določa odstotek, ki je razložen z varianco regresije glede na varianco pojasnjene spremenljivke. To je enako kot R na kvadrat, vendar z razliko: prilagojeni koeficient določitve kaznuje vključitev spremenljivk.
Kot smo že povedali, se koeficient določitve modela poveča, tudi če spremenljivke, ki jih vključimo, niso pomembne. Ker je to težava, jo poskušamo rešiti, prilagojeni R na kvadrat je tak, da:

V formuli je N velikost vzorca, k pa število pojasnjevalnih spremenljivk. Z matematičnim odštevanjem bodo višje vrednosti k, bolj kot bo prilagojen R-kvadrat od običajnega R-kvadrata. Nasprotno pa bo pri nižjih vrednostih k, bližje bo osrednji ulomek 1, zato bosta prilagojeni R na kvadrat in normalni R na kvadrat bolj podobna.
Če se spomnimo, da je k število pojasnjevalnih spremenljivk, ugotovimo, da to ne more biti nič. Če bi bila nič, modela ne bi bilo. Vsaj eno spremenljivko bomo morali razložiti z drugo spremenljivko. Ker mora biti k najmanj 1, prilagojeni R-kvadrat in običajni R-kvadrat ne moreta imeti enake vrednosti. Poleg tega bo prilagojeni R-kvadrat vedno manjši od običajnega R-kvadrata.