Thursday, 19 October 2017

Flytte Gjennomsnittet Sesong Variant


Flytte gjennomsnitt Hvis denne informasjonen er tegnet på en graf, ser det slik ut: Dette viser at det er stor variasjon i antall besøkende, avhengig av sesong. Det er langt mindre i høst og vinter enn vår og sommer. Men hvis vi ønsket å se en trend i antall besøkende, kunne vi beregne et 4-punkts glidende gjennomsnitt. Vi gjør dette ved å finne gjennomsnittlig antall besøkende i fire kvartaler i 2005: Da finner vi gjennomsnittlig antall besøkende i de tre siste kvartaler i 2005 og første kvartal 2006: Så de siste to kvartaler i 2005 og de to første kvartaler av 2006: Merk at det siste gjennomsnittet vi finner er de siste to kvartaler i 2006 og de to første kvartalene av 2007. Vi skisserer de bevegelige gjennomsnittene på en graf, og sørger for at hvert gjennomsnitt er plottet i midten av de fire kvartaler det dekker: Vi kan nå se at det er en veldig liten nedadgående trend i besøkende. Hvordan beregner jeg sesongvariasjonen fra et 4-punkts glidende gjennomsnitt. Hvis jeg har en liste over salg per kvartal i 2 år, si. Fra disse dataene kan jeg beregne 4 poeng glidende gjennomsnitt. Vanligvis, salgsmessig gjennomsnitt (trend). vis mer Hvis jeg har en liste over salg per kvartal i 2 år, si. Fra disse dataene kan jeg kalkulere 4-punkts glidende gjennomsnitt. Vanligvis var salgetrykkende gjennomsnittlig (trend) sesongvariasjon, og dette ville vært lett hvis jeg hadde gjort 3 eller 5 poeng glidende gjennomsnitt (dvs. ulikt antall) Salg. Trend. Sesongvariasjon x. en. d y. b. e z. c. f Salg. Trend. Sesongvariasjon x. en y. b z Tar jeg bare et 2-punkts glidende gjennomsnitt av trenden for å få tallene i tilpasning Beklager, håper du forstår spørsmålet It039 er litt vanskelig å forklare. Som du har forstått, med trepunkts eller fempunkts glidende gjennomsnitt, er datapunktene dine justert med dine opprinnelige data. Vel, det firepunkts glidende gjennomsnittet vil gi deg en trendlinje med datapunkter som er justert midtveis mellom midtpunktene i de opprinnelige dataene dine, så jeg tror at du bør interpolere mellom de bevegelige gjennomsnittlige datapunktene. Siden de bevegelige gjennomsnittlige datapunktene er jevnt fordelt på begge sider av dine opprinnelige data, involverer interpolering gjennomsnittlig suksessive poeng, så jeg er enig med forslaget om å ta ytterligere topunkts glidende gjennomsnitt som et middel til å beregne trenden. Jeg vil imidlertid referere til det som interpolering i stedet for som et videre glidende gjennomsnitt. John middot 7 år siden middot akkurat nå Svar på dette spørsmålet Relaterte spørsmål Rapporter misbruk Rapporter misbruk Beklager, du har nådd din daglige spørringsgrense. Tjen flere poeng eller kom tilbake i morgen for å spørre mer. Spør koster 5 poeng, og deretter velger du et best svar, du tjener 3 poeng. Spørsmål må følge retningslinjene for fellesskapet. Mediaopplastingen mislyktes. Du kan prøve å legge til media igjen eller gå videre og legge inn svaret Media upload mislyktes. Du kan prøve å legge til media igjen eller gå videre og legge inn spørsmålet. Opplastet bilde er mindre enn minimumskravene 320 x 240 piksler. Beklager, filformat støttes ikke. Du kan bare laste opp bilder med en størrelse mindre enn 5 MB. Du kan bare laste opp videoer med en størrelse mindre enn 60 MB. Generere forhåndsvisning Gå videre og legg inn svaret ditt. Opplastet video vil være live etter behandling. Gå videre og legg inn spørsmålet ditt. Opplastet video vil være live etter behandling. Sendingsforespørsel. Dette kan ta ett eller to minutter Uploading. Spreadsheet implementering av sesongjustering og eksponensiell utjevning Det er greit å utføre sesongjustering og passe eksponensielle utjevningsmodeller ved hjelp av Excel. Skjermbildene og diagrammene nedenfor er hentet fra et regneark som er satt opp for å illustrere multiplikativ sesongjustering og lineær eksponensiell utjevning på følgende kvartalsvise salgsdata fra Outboard Marine: Klikk her for å få en kopi av regnearkfilen selv. Utgaven av lineær eksponensiell utjevning som skal brukes her for demonstrasjonsformål er Brown8217s versjon, bare fordi den kan implementeres med en enkelt kolonne med formler, og det er bare én utjevningskonstant for å optimalisere. Vanligvis er det bedre å bruke Holt8217s versjon som har separate utjevningskonstanter for nivå og trend. Fremskrivningsprosessen fortløper som følger: (i) først er dataene sesongjustert (ii) så blir prognoser generert for sesongjusterte data via lineær eksponensiell utjevning og (iii) til slutt er de sesongjusterte prognosene kvoteres for å få prognoser for den opprinnelige serien . Sesongjusteringsprosessen utføres i kolonne D til G. Det første trinnet i sesongjustering er å beregne et sentrert glidende gjennomsnitt (utført her i kolonne D). Dette kan gjøres ved å ta gjennomsnittet av to ettårige gjennomsnitt som kompenseres av en periode i forhold til hverandre. (En kombinasjon av to offset-gjennomsnitt i stedet for et enkelt gjennomsnitt er nødvendig for sentrering når antall årstider er like.) Det neste trinnet er å beregne forholdet til glidende gjennomsnitt, dvs. De opprinnelige dataene divideres med det bevegelige gjennomsnittet i hver periode - som utføres her i kolonne E. (Dette kalles også quottrend-cyclequot-komponenten i mønsteret, forutsatt at trend og konjunktursykluser kan anses å være alt som forblir etter gjennomsnitt over en helårs verd av data. Selvfølgelig kan endringer i måned til måned som ikke skyldes sesongbestemte bestemmes av mange andre faktorer, men gjennomsnittet på 12 måneder glatter seg over dem i stor grad.) Beregnet sesongindeks for hver sesong beregnes ved først å beregne alle forholdene for den aktuelle sesongen, som er gjort i celler G3-G6 ved hjelp av en AVERAGEIF formel. Gjennomsnittstallene blir deretter rescaled slik at de summerer til nøyaktig 100 ganger antall perioder i en sesong, eller 400 i dette tilfellet, som er gjort i celler H3-H6. Nedenfor i kolonne F brukes VLOOKUP-formler til å sette inn riktig sesongindeksverdi i hver rad i datatabellen, i henhold til kvartalet av året representerer den. Det sentrert glidende gjennomsnittet og de sesongjusterte dataene ser ut som dette: Merk at det bevegelige gjennomsnittet vanligvis ser ut som en jevnere versjon av den sesongjusterte serien, og den er kortere i begge ender. Et annet regneark i samme Excel-fil viser anvendelsen av den lineære eksponensielle utjevningsmodellen til sesongjusterte data, som begynner i kolonne G. En verdi for utjevningskonstanten (alfa) er angitt over prognosen kolonnen (her i celle H9) og For enkelhets skyld er det tildelt rekkeviddenavnet quotAlpha. quot (Navnet er tilordnet med kommandoen quotInsertNameCreatequot.) LES-modellen initialiseres ved å sette de to første prognosene tilsvarer den første virkelige verdien av sesongjusterte serien. Formelen som brukes her for LES-prognosen, er den recirkulære resirkulære formen av Brown8217s-modellen: Denne formelen er oppgitt i cellen som svarer til den tredje perioden (her, celle H15) og kopieres derfra. Legg merke til at LES-prognosen for den nåværende perioden refererer til de to foregående observasjonene og de to foregående feilene, samt til verdien av alfa. Således refererer prognoseformelen i rad 15 kun til data som var tilgjengelige i rad 14 og tidligere. (Selvfølgelig, hvis vi ønsket å bruke enkle i stedet for lineær eksponensiell utjevning, kunne vi erstatte SES-formelen her i stedet. Vi kunne også bruke Holt8217s i stedet for Brown8217s LES-modellen, som ville kreve to flere kolonner med formler for å beregne nivå og trend som brukes i prognosen.) Feilene beregnes i neste kolonne (her, kolonne J) ved å trekke prognosene fra de faktiske verdiene. Rotenes middelkvadratfeil beregnes som kvadratroten av variansen av feilene pluss kvadratet av gjennomsnittet. (Dette følger av den matematiske identiteten: MSE VARIANCE (feil) (AVERAGE (feil)). 2.) Ved beregning av gjennomsnitt og varians av feilene i denne formelen, er de to første periodene utelukket fordi modellen ikke faktisk begynner å prognose til den tredje perioden (rad 15 på regnearket). Den optimale verdien av alfa kan bli funnet enten ved å endre alfa manuelt til minimum RMSE er funnet, ellers kan du bruke quotSolverquot til å utføre en nøyaktig minimering. Verdien av alfa som Solver funnet er vist her (alfa0.471). Det er vanligvis en god ide å plotte feilene i modellen (i transformerte enheter) og også å beregne og plotte sine autokorrelasjoner ved lags på opptil en sesong. Her er en tidsserier av de (sesongjusterte) feilene: Feilautokorrelasjonene beregnes ved hjelp av CORREL () - funksjonen for å beregne korrelasjonene til feilene med seg selv forsinket av en eller flere perioder - detaljer vises i regnearkmodellen . Her er et plot av autokorrelasjonene til feilene ved de fem første lagene: Autokorrelasjonene på lags 1 til 3 er svært nær null, men spissen ved lag 4 (hvis verdien er 0,35) er litt plagsom - det antyder at Sesongjusteringsprosessen har ikke vært helt vellykket. Men det er faktisk bare marginalt signifikant. 95 signifikansbånd for å teste om autokorrelasjoner er signifikant forskjellig fra null er omtrent pluss-eller-minus 2SQRT (n-k), hvor n er prøvestørrelsen og k er lagret. Her er n 38 og k varierer fra 1 til 5, slik at square-root-of-n-minus-k er rundt 6 for dem alle, og derfor er grensene for å teste den statistiske signifikansen av avvik fra null tilnærmet pluss - eller-minus 26 eller 0,33. Hvis du varierer verdien av alpha for hånd i denne Excel-modellen, kan du observere effekten på tidsseriene og autokorrelasjonsplottene av feilene, så vel som på den rotte-kvadratiske feilen, som vil bli illustrert nedenfor. På bunnen av regnearket er prognoseformelen kvotetatt i fremtiden ved bare å erstatte prognoser for faktiske verdier ved det punktet der de faktiske dataene går tom - det vil si. hvor quotthe futurequot begynner. (Med andre ord, i hver celle der en fremtidig dataværdi vil oppstå, settes en cellereferanse som peker på prognosen som er laget for den perioden.) Alle de andre formlene kopieres ganske enkelt ned fra oven: Legg merke til at feilene for prognoser for fremtiden er alle beregnet til å være null. Dette betyr ikke at de faktiske feilene vil være null, men det reflekterer bare det faktum at vi forutsetter at fremtidige data vil svare til prognosene i gjennomsnitt. De resulterende LES-prognosene for de sesongjusterte dataene ser slik ut: Med denne spesielle verdien av alfa, som er optimal for prognoser med en periode fremover, er den forventede trenden litt oppadgående, noe som gjenspeiler den lokale trenden som ble observert de siste 2 årene eller noe. For andre verdier av alfa, kan det oppnås en helt annen trendprojeksjon. Det er vanligvis en god ide å se hva som skjer med den langsiktige trendprojeksjonen når alfa er variert, fordi verdien som er best for kortsiktig prognose, ikke nødvendigvis vil være den beste verdien for å forutse den lengre fremtid. For eksempel er her resultatet som oppnås hvis verdien av alfa er manuelt satt til 0,25: Den projiserte langsiktige trenden er nå negativ, heller enn positiv. Med en mindre verdi av alfa, legger modellen vekt på eldre data i sin estimering av dagens nivå og trend, og langsiktige prognoser reflekterer den nedadgående trenden observert de siste 5 årene i stedet for den nyere oppadgående trenden. Dette diagrammet illustrerer også tydelig hvordan modellen med en mindre verdi av alfa er langsommere for å svare på quotturning pointsquot i dataene og derfor har en tendens til å gjøre en feil på det samme tegnet i mange perioder på rad. Dens 1-trinns prognosefeil er større i gjennomsnitt enn de som er oppnådd før (RMSE på 34,4 i stedet for 27,4) og sterkt positivt autokorrelert. Lag-1 autokorrelasjonen på 0,56 overstiger sterkt verdien av 0,33 beregnet ovenfor for en statistisk signifikant avvik fra null. Som et alternativ til å svekke verdien av alfa for å introdusere mer konservatisme i langsiktige prognoser, blir det noen ganger lagt til en quotrend dampeningquot-faktor i modellen for å gjøre den projiserte trenden flatt ut etter noen perioder. Det siste trinnet i å bygge prognosemodellen er å quotereasonizequot LES prognosene ved å multiplisere dem med de riktige sesongindeksene. De resesaliserte prognosene i kolonne I er således bare produktene av sesongindeksene i kolonne F og de sesongjusterte LES-prognosene i kolonne H. Det er relativt enkelt å beregne konfidensintervaller for en-trinns prognoser laget av denne modellen: først beregne RMSE (root-mean-squared-feilen, som bare er kvadratroten til MSE), og beregne deretter et konfidensintervall for sesongjustert prognose ved å legge til og trekke to ganger RMSE. (Generelt er et 95-konfidensintervall for en prognose for en periode fremdeles omtrent lik punktsprognosen pluss-eller-minus-to ganger estimert standardavvik for prognosefeilene, forutsatt at feilfordelingen er omtrent normal og prøvestørrelsen er stor nok, si 20 eller mer. Her er RMSE i stedet for standardfeilavviket for feilene det beste estimatet av standardavviket for fremtidige prognosefeil fordi det tar forvirring, samt tilfeldige variasjoner i betraktning.) Tillitgrensene for sesongjustert prognose blir deretter resesasonalized. sammen med prognosen, ved å multiplisere dem med de riktige sesongindeksene. I dette tilfellet er RMSE lik 27,4 og sesongjustert prognose for den første fremtidige perioden (desember 93) er 273,2. så sesongjustert 95 konfidensintervall er fra 273,2-227,4 218,4 til 273,2227,4 328,0. Multiplicere disse grensene med Decembers sesongindeks på 68,61. Vi oppnår lavere og øvre konfidensgrenser på 149,8 og 225,0 rundt prognosen på 93,9 prosent på 187,4. Forventningsgrenser for prognoser mer enn en periode framover vil generelt øke etter hvert som prognosehorisonten øker, på grunn av usikkerhet om nivå og trend, samt sesongfaktorer, men det er vanskelig å beregne dem generelt ved hjelp av analytiske metoder. (Den riktige måten å beregne konfidensgrenser for LES-prognosen er ved å bruke ARIMA-teorien, men usikkerheten i sesongindeksene er en annen sak.) Hvis du vil ha et realistisk konfidensintervall for en prognose mer enn en periode framover, tar du alle kilder til Feil i betraktning, din beste innsats er å bruke empiriske metoder: for eksempel for å oppnå et konfidensintervall for en 2-trinns prognose, kan du opprette en annen kolonne på regnearket for å beregne en 2-trinns prognose for hver periode ( ved å starte opp en-trinns prognose). Beregn deretter RMSE for de to-trinns prognosefeilene og bruk dette som grunnlag for et 2-trinns konfidensintervall.

No comments:

Post a Comment