Regrese v aplikaci Excel: rovnice, příklady. Lineární regrese

Regresní analýza je statistická metoda výzkumu, která umožňuje ukázat závislost jednoho nebo jiného parametru na jedné nebo několika nezávislých proměnných. V období před počítačem bylo jeho použití poměrně obtížné, zejména pokud jde o velké objemy dat. Dnes, když se naučíte, jak vytvořit regresi v aplikaci Excel, můžete vyřešit složité statistické problémy doslova za pár minut. Níže uvádíme konkrétní příklady z oblasti ekonomie.

Typy regrese

Tento pojem byl zaveden do matematiky Francis Galton v roce 1886. Regrese se děje:
  • lineární;
  • parabolický;
  • stupeň;
  • exponenciální;
  • hyperbolická;
  • orientační;
  • logaritmický.
  • Příklad 1

    Zvažte úlohu stanovení závislosti počtu propuštěných členů týmu na průměrné mzdě u 6 průmyslových podniků.


    Úkoly. Šest firem analyzovalo průměrnou měsíční mzdu a počet zaměstnanců, kteří odešli na důchod. Ve formě tabulky platí:









    B



    C









    43) plat



    , 2



    , y



    30.000 rublů



    3



    1



    60



    35.000 rublů ($ 72)


    4



    , 2



    35



    40.000 rublů (
    3



    20



    45000 rublů



    6



    4



    20



    50,000 rublů



    7
    ,
    ,
    ,
    5



    15



    55,000 rublů


    ,
    8
    ,
    ,
    ,
    6



    15



    60,000 rublů

    pro vymezení problému počtu propuštěných pracovníků průměrné mzdy o 6 společností regresní model vypadá rovnice Y = 0 + 1 x 1 ++ a kxk, kde xi jsou ovlivňovány proměnnými, ai - regresními koeficienty, ak - počtem faktorů. Pro tento úkol Y - opatření propustil zaměstnance a ovlivňující faktory - plat, které označují X.

    Využití energie z tabulkového procesoru Excel „“

    regresní analýzy v Excelu musí předcházet použití stávajících tabulkových dat vložených funkcí. Pro tyto účely je však lepší použít velmi užitečný doplněk "Analysis package". Chcete-li ji aktivovat, potřebujete:


  • z karty Soubor přejděte na část "Možnosti";
  • v okně vyberte řádek "Doplňky";
  • klikněte na tlačítko "Go" umístěné pod pravým řádkem "Management";
  • zaškrtněte políčko vedle názvu "Balíček analýzy" a potvrďte akci kliknutím na tlačítko "Ok".
  • Pokud je vše správně provedeno, objeví se pravé tlačítko na pravé straně karty Údaje umístěné nad listem aplikace Excel.

    lineární regrese v Excelu

    Teď, když je po ruce všechny potřebné nástroje k provedení virtuálních ekonometrických výpočtů mohou začít řešit náš problém. Prototo:
  • klikněte na tlačítko "Analýza dat";
  • V okně stiskněte tlačítko "Regrese"; Y (počet propuštěných pracovníků) a X (jejich platy)
  • na kartě, která se zobrazí zadat rozsah hodnot;
  • potvrdíme naše akce stisknutím tlačítka "Ok".
  • V důsledku toho, program automaticky vyplní nový list tabulkových dat regresní analýza. Dávejte pozor! Aplikace Excel má možnost nezávisle určit místo, které dáváte přednost tomuto účelu. Například to může být stejné písmeno, které obsahuje hodnoty Y a X, nebo dokonce novou knihu speciálně navrženou pro ukládání takových dat.

    Analýza R-kvadrát regrese

    v dat Excelu získaných během zpracování tohoto příkladu jsou následující:
    Především byste měli věnovat pozornost hodnotě čtverce R. Je to určovací koeficient. V tomto příkladu je R-kvadrát = 0755 (755%), tj odhadnutých parametrů modelu vysvětlit vztah mezi uvažovaných parametrů do 755%. Čím vyšší je hodnota určovacího koeficientu, zvolený model je považován za vhodnější pro konkrétní úkol. Předpokládá se, že je správně popisuje aktuální situaci v hodnotě R-kvadrát nad 08. V případě, že R-kvadrát koeficient analýza Number 641428 ukazuje, jak je hodnota Y, pokud jsou všechny proměnné xi modelech před námi obnulyatsya. Jinými slovy, to může být argumentoval, že hodnota testovaného parametru je ovlivněna dalšími faktory, které nejsou popsány v konkrétním modelem. Dalším faktorem -016285 umístěným v buňce B18 je hmotnostVliv proměnné X Y. To znamená, že průměrný plat pracovníků v rámci modelů ovlivněna počtem propuštěných hmotnosti -016,285, že míra vlivu poměrně malý. Znak "-" označuje, že koeficient má zápornou hodnotu. To je zřejmé, protože každý ví, že vyšší mzdy v podniku, tím méně lidí vyjádřili přání ukončit pracovní smlouvu nebo odmítnout.

    s více regrese

    V tento termín odkazuje na komunikační rovnice s několika nezávislými proměnnými tvoří: y = f (x 1 + x 2 + xm) + ?, Kde y - výsledná proměnná (závisle proměnná) a x 1, x 2, xm jsou atributové faktory (nezávislé proměnné).

    Vyhodnocení

    V vícenásobné regrese (MR) jeho pohybu, za použití metody nejmenších čtverců (OLS). Pro lineární rovnice tvaru Y = a + b 1 x 1 ++ b m x m +? Vytváříme systém normálních rovnic (viz níže)
    Chcete-li porozumět principu metody, zvažte dvoufaktorový případ. Pak máme situaci popsanou vzorcem
    Odtud získáme:
    kde? - je odchylka odpovídající značky, která se odráží v indexu. MNC budou aplikovány na rovnici MR v standardní měřítku. V tomto případě získáme rovnici:
    , kde t y, t x 1 t xm - standartyzyruemыe Proměnné, pro které průměry jsou 0; ? i - standardizované regresní koeficienty a střední kvadratická odchylka - 1. Všimněte si, že všechny? i v tomto případě definován jako normalizované a tsentralyzyruemыe, takže jejich porovnání s sebou, je správný a platný. Navíc,Přijaté prověřování faktorů, odhazovat ty, které mají nejmenší hodnotu? i.

    nastavena pomocí lineární regresní rovnice

    Například tabulka dynamiky cen určitého produktu N za posledních 8 měsíců. Je třeba rozhodnout o účelnosti nákupu jeho strany za cenu 1850 rublů za tunu.





    , A
    ,
    ,
    ,
    , B



    C
    (198 )

    1



    číslo měsíce



    jméno měsíce



    cena zboží N



    2



    1



    , leden



    , 1750 rublů za tunu



    3



    2



    února
    (242 )

    , 1755 rublů za tunu



    4



    3



    březen



    1,767 rublů za tunu



    , 5



    4

    (271 )
    duben



    1760 rublů z ton



    6
    ,
    ,
    ,
    5



    , může



    , 1770 rublů za tunu



    7
    ,
    ,
    ,
    6



    červen

    ,
    ,
    , 1790 rublů za tunu


    ,
    8



    7



    července



    1,810 rublů za tunu



    , 9
    ,
    ,
    ,
    8


    ,
    srpnu



    , 1.840 rublů za tunu

















    , pro řešení tohoto problému v tabulce "Excel" jsou povinni používat Idoma lidé prezentovány ve výše uvedeném příkladu nástroj „analýza dat“. Potom vyberte sekci "Regrese" a zeptejte separametry Musíme si uvědomit, že do vstupního pole intervalu Y »zavedla řadu hodnot závislých proměnných (v tomto případě cenu zboží v určitém měsíci roku), a“ Input interval X »- pro nezávislé (několik měsíců). Potvrďte akce kliknutím na tlačítko "Ok". Na novém listu (pokud byl uveden) dostaneme data pro regresi. Postavit ho lineární rovnice tvaru y = ax + b, kde jako parametry a a b jsou koeficienty jednat řetězec se jménem a číslem měsíce a faktorů řádek «Y-křižovatce“ s písmenem výsledků regresní analýzy. To znamená, že lineární regresní rovnice (SD) Problém 3 je zapsána jako: cena zboží * N = 11714 + číslo 172754. měsíc nebo algebraický zápis y = x + 11 714 172 754

    Analýza

    Při rozhodování, zda obdržel přiměřené lineární regresní rovnice používá více korelační koeficienty (CCM) a stanovení a kritérium Fisher a Studentova testu. V tabulce „uzavřený“ regresní výsledky, které působí pod jmény více R R-kvadrát, F-statistiky a t-statistiky resp. KMK R dává možnost odhadnout blízkost pravděpodobnostního vztahu mezi nezávislými a závislými proměnnými. Jeho vysoká hodnota naznačuje poměrně silné spojení mezi proměnnými "měsíc v měsíci" a "cena zboží v rublech za tunu". Nicméně povaha tohoto spojení zůstává neznáma. Čtvercový R2 Koeficient determinace (RI) je numerická popis celkovém rozmezí podíl a ukazuje, že šíření část experimentálních dat, která odpovídá hodnotám závislé proměnnélineární rovnice regrese. V řešení tohoto problému, je tato hodnota 848%, tj statistické údaje s vysokým stupněm přesnosti získaných popisuje SD. F-statistika, také volal kritérium Fisher slouží k posouzení významnosti lineární vztah, popírání nebo potvrzující hypotézu o jeho existenci. Hodnota t-statistiky (test Student) pomáhá posoudit význam neznámého faktoru nebo konstantní výraz lineární vztah. Pokud hodnota t kritéria> t cr, pak je hypotéza o nevýznamnosti volného člena lineární rovnice odmítnuta. V tomto problém pro bezplatné nástroje členskými „Excel“ bylo dosaženo toho, že t = 16920903 p = 289 a E-12, které mají nulovou šanci, že bude odmítat hypotézy bezvýznamnosti volného člena. Pro koeficient s neznámým t = 579405 a p = 0001158. Jinými slovy, je pravděpodobnost, že odmítne hypotézu o bezvýznamnosti neznámého faktoru se rovná 012%. Tak lze argumentovat, že získaná rovnice lineární regrese je adekvátní.

    se nachází na proveditelnost nákupu akcií

    Vícenásobná regrese v Excelu provádí pomocí stejného nástroje, „Analýza dat.“ Zvažte konkrétní problém s aplikací. Vedení společnosti "NNN" musí rozhodnout o účelnosti nákupu 20% podílu v JSC "MMM". Náklady na balíček (JV) činí 70 milionů USD. Specialisté z "NNN" shromáždili údaje o podobných smlouvách. Bylo rozhodnuto odhadnout hodnotu bloku akcií podle parametrů vyjádřených vmilióny amerických dolarů, jako jsou:
  • závazků (VK);
  • ročního obratu (VO);
  • pohledávky (VD);
  • hodnota dlouhodobých aktiv (SOF).
  • Kromě toho společnost využila možnosti nedoplatky platů (V3 AP) tisíce amerických dolarů.

    Toto rozhodnutí znamená, Excel

    Za prvé, je třeba, aby tabulky výstupních dat. Má následující formu:
    Další:
  • způsobí, že "Analýza dat" okno;
  • vyberte část "Regrese";
  • v okně „Input rozmezí Y» zaveden rozsah závislé proměnné sloupci G;
  • na ikonu s červenou šipkou na pravé straně okna „Vstup intervalu X» a uvolnit řadu archu hodnoty sloupce B, C, D a F.
  • Všimněte si položku ‚Nový list‘ a tlačítko ‚OK‘ . Získejte regresní analýzu pro tento úkol.

    Studie výsledky a závěry

    "Collect" se představil zaoblenými údaje shora na listu Excelu, regresní rovnice: SP = 0103 + 0541 OFA * * VO - 0031 + 0405 * VK * VD 0691 * VZP - 265844. ve více obvyklé matematické formě může být zapsán jako: y = 0103 * x1 + 0541 * x2 - 0031 * x3 + 0405 * x4 + x5 0691 * - 265 844 data pro JSC "MMM", uvedené v následující tabulce:
    ,
    , OFA, USD



    , VO, USD



    VK, USD



    VD, USD



    VZP, USD



    společný podnik, USD



    1025

    ,
    ,
    , 5355
    ,
    ,
    ,
    , 452



    , 415



    , 2155
    ,
    ,
    ,
    , 6472
    ,
    tak, že je do regresní rovnice získanéčíslo 6472 milionů amerických dolarů. To znamená, že akcie společnosti "MMM" JSC by se neměly koupit, protože jejich hodnota v 70 milionech dolarů je poměrně nadhodnocená. Jak můžete vidět, použití tabulky aplikace Excel a regresní rovnice nám umožnily rozumné rozhodnutí o proveditelnosti úplně konkrétní transakce. Nyní víte, jaká je regrese. Příklady v programu Excel, popsané výše, vám pomohou vyřešit praktické problémy v oblasti ekonometrie.

    Související publikace