Możesz znaleźć błąd standardowy związany z regresją, znany również jako błąd standardowy samego oszacowania i całkowity błąd standardowy, obok R-kwadratu w sekcji zgodności bardzo statystycznych wyników. Obie wartości dodane do produktów dają liczbowe oszacowanie, jak kompetentnie model pasuje do większości danych próbki. Jednak generalnie są różnice między tymi dwiema statystykami.
- Standardowy błąd typowej regresji jest fantastyczną miarą bezwzględną typowej odległości między punktami pliku na linii regresji. S jest wyjaśnione w kategoriach zmiennej zależnej.
- R-kwadrat zapewnia względną miarę procentu z wariancją zmiennej zależnej uwolnionej przez telefon. R-kwadrat może dotyczyć 0 i 100%.
Porównanie bez wątpienia bardzo wyraźnie pokazuje różnicę. Powiedzmy, że komunikujemy się o prędkości samochodu.
R-kwadrat odpowiada stwierdzeniu, że klasyczny samochód jechał o 80% szybciej. Wydaje się, że wewow dodatkowo szybko! Jednak to, czy prędkość początkowa wynosiła 20 mil na godzinę, czy 90 mil na godzinę, zrobiła ogromną różnicę. Procentowa prędkość jazdy do przodu może automatycznie wynosić odpowiednio 16 lub 72 mile na godzinę. Jeden jest sparaliżowany, a drugi ogólnie robi wrażenie. Jeśli chcesz dokładnie wiedzieć, o ile wcześniej, pomiar w zasadzie nic Ci nie powie.
Standardowy błąd, który znika bezpośrednio, informuje o tym, ile mil na godzinę samochód pokonuje szybciej. Auto jechało 72 km/h szybciej. Imponujący!
Przyjrzyjmy się, w jaki sposób możemy wykorzystać te kilka angażujących metryk do pomiaru jakości dopasowania pod kątem analizy regresji.
Błąd standardowy, który w praktyce najczęściej kojarzy się z regresją i R-kwadratem
Moim zdaniem pozostały błąd wymagań ma kilka zalet. Informuje razem, w jakim stopniu przewidywania modelu wykorzystują współzależne etykiety zmiennych. Ta statystyka pokazała, jak daleko, wzdłuż średniej, znajdują się punkty danych od większości linii regresji. Dążysz do niższej etyki, ponieważ oznacza to, że odległości między głównymi lokalizacjami danych a dopasowanymi wartościami są wyjątkowo kompaktowe. S obowiązuje dla modeli regresji liniowej i nieliniowej. Fakt ten jest istotny, gdy pragniesz porównać korespondencję między dwoma typami najczęściej kojarzonymi z modelami.
W przypadku twojego r-kwadrat chcesz, aby każdy z naszych modeli regresji wyjaśniał najwyższy procent, podobnie jak wariancja. Pomysły z wyższym R-kwadratem wskazują, że punkty danych odpowiadają dokładnie obszarom. Chociaż duże wartości R-kwadrat są dobre, mogą nie informować Cię, jak daleko punkty danych będą z pewnością znajdować się od regresji liniowej. Ponadto R-kwadrat wynika tylko z prawidłowych wzorców liniowych. Nie można użyć R-kwadrat do porównania kopii liniowej z modelem nieliniowym.
Uwaga. W modelach prostoliniowych wielomiany mogą być używane do symulowania krzywej. Użycie „ja jestem” to wyrażenie „liniowe” w odniesieniu do modeli, których parametry na ogół są w dużej mierze liniowe. Przeczytaj Wpisz my, która wyjaśnia ogólną różnicę między modelami regresji liniowej i nieliniowej.
Przykład modelu regresji: BMI ciała i procent zawartości tłuszczu
Ten model regresji opisuje pokrewieństwo między wskaźnikiem masy ciała (BMI) a procentem wraz z zawartością tkanki tłuszczowej u dziewcząt w liceum. Strategia liniowa, która używa wyrażenia wielomianowego do modelowania wszystkich krzywych. Pokazana linia jest wykresem, który widzisz, standardowy błąd widzisz, regresja powinna wynosić 3,53399% tkanki tłuszczowej. Interpretacja związana z tym S jest taka, że standardowa odległość łącząca twoje obserwacje i linię regresji może być nieco większa niż 3,5% tłuszczu.
S mierzy dokładność porównywalną z przewidywaniami modelu. Dlatego możemy użyć samej wynikowej wartości S, aby z grubsza oszacować najnowszy 95% przedział prognozy. Około 95% głównych punktów danych mieści się w zakresie +/- 2 7 . błędy dopasowania regresji z linii dopasowania.
W przykładzie regresji około 95% punktów pasma znajduje się między linią regresji a wspaniałymi dodatkowymi 7% +/- tkanki tłuszczowej.
Komputer działa wolno?
ASR Pro to najlepsze rozwiązanie dla potrzeb naprawy komputera! Nie tylko szybko i bezpiecznie diagnozuje i naprawia różne problemy z systemem Windows, ale także zwiększa wydajność systemu, optymalizuje pamięć, poprawia bezpieczeństwo i dostraja komputer w celu uzyskania maksymalnej niezawodności. Więc po co czekać? Zacznij już dziś!
R-kwadrat może wynosić 76,1%. Mam dogłębny wpis na blogu, jeśli chcesz zinterpretować R-kwadrat. Właściwie nie będę się wdawał w szczegóły.
Powiązane artykuły: Przewidywanie z analizą regresji, zrozumienie dokładności regresji stosowanej w celu uniknięcia błędów wraz z kosztownymi błędami, błąd średniokwadratowy (MSE)
Często wolę standardowy błąd rezydualny regresji
R-kwadrat to łatwy do zrozumienia drobny procent. Jednak często doceniam nieco większy fizycznie standard błędu regresji. Doceniam tę widoczną informację z rzadkich jednostek zmiennej współzależnej. Kiedy używam modelu regresji w odniesieniu do tworzenia proroctw, S mówi mi, czy model jest wystarczająco dokładny, czy zdecydowanie nie.
Z drugiej strony, R-kwadrat nie zawiera żadnych jednostek, dlatego wydaje się niejednoznaczne, że będzie S. Jeśli znamy tylko R-kwadrat, powinien wynosić 76,1% bez pytań, nie wiemy, zadaj sobie pytanie, ile na średnia ten model jest oparty na błędach. … Aby uzyskać dokładne prognozy, powinieneś mieć rozmiar R do kwadratu, ale nie powinieneś być pewien, jak dokładnie powinien być. Użycie R-kwadrat do oszacowania całej dokładności niektórych prognoz powinno być zbyt trudne.
Aby to zademonstrować, spójrzmy na ten poziom regresji. Załóżmy, że nasze myśli muszą być w +/- 5% od Was, aby obserwowane nagrody były przydatne. Jeśli eksperci znają tylko jego 76,1% R-kwadrat, czy ktokolwiek może stwierdzić, czy nasz model jest zazwyczaj wystarczająco dokładny? Nie, nie można tego powiedzieć za pomocą R-kwadrat.
Jednak obecnie możesz użyć standardowego błędu z powodu regresji. Aby nasz wzór zapewniał wymaganą dokładność, S musi być mniejsze niż 2,5%, ponieważ 2,5 * 2 ogólnie 5. Nagle zdajemy sobie sprawę, że nasze S (3,5) jest za duże. Czy potrzebujemy dużo dokładniejszego modelu. Dziękuję Ci!
Chociaż bardzo podoba mi się popularny błąd, który pozostał, oczywiście możesz spojrzeć na ogólną precyzję dopasowania w dwóch jednostkach w tym samym czasie. To jest matematyczne dopasowanie jedzenia ciasta i wzięcia go!
Jeśli jesteś nowy w regresji i podoba Ci się nasz proces, którego używam na moim blogu, sprawdź mój e-book Market!
Połączone
Popraw szybkość swojego komputera już dziś, pobierając to oprogramowanie - rozwiąże ono problemy z komputerem.
Co mówi Ci codzienny błąd?
Popularny błąd mówi dokładnie, jak prawdopodobne jest, że pobranie danej próbki z tej kolonii będzie w porównaniu do średniej dla obecnej populacji. W przypadku wzrostu określonego błędu oczekiwania, tj. H. Jeśli drzewostany są większe, wzrasta prawdopodobieństwo, że większość raportowanych średnich, jak również dokładna średnia populacji, będzie nieprecyzyjna.
Jak interpretujesz średni błąd średniej?
Standardowy błąd marki to dowolne prawdopodobieństwo taktyki próby z oryginalnymi maszynami miar odbiegającą od średniej. Ponownie, bardziej wzniosłe wartości odpowiadają szerszemu rozkładowi. Przy SEM równym 3 wiemy, gdzie dzienna różnica między próbką a populacją oznacza, że wynosi 3.
Tips For Correcting Standard Errors Indicating Regression
Conseils Pour Corriger Les Erreurs Standard Indiquant Une Régression
Советы по исправлению стандартных ошибок, указывающих на регресс
Dicas Para Corrigir Erros Padrão Que Indicam Regressão
Sugerencias Para Corregir Errores Estándar Que Indican Regresión
Suggerimenti Per Correggere Gli Errori Standard Che Indicano Una Regressione
Tipps Zur Korrektur Von Standardfehlern, Die Auf Eine Regression Hinweisen
Tips Eftersom Korrigering Av Standardfel Som Indikerar Regression
회귀를 나타내는 표준 오류 수정을 위한 팁
Tips Voor Het Corrigeren Van Standaardfouten Die Regressie Aangeven