Jeg har en langsiktig oppfølging av blodtrykksopptak. Verdien på et bestemt punkt er mindre prediktiv enn det bevegelige gjennomsnittet (rullende gjennomsnitt), og derfor velger jeg å beregne det. Dataene ser ut som at jeg liker å beregne en ny variabel, kalt BLOODPRESSUREUPDATED. Denne variabelen skal være det bevegelige gjennomsnittet for BLOODPRESSURE og har følgende egenskaper: Et glidende gjennomsnitt er nåverdien pluss forrige verdi dividert med to. For første observasjon er BLOODPRESSUREUPDATED bare den nåværende BLOODPRESSURE. Hvis det mangler, bør BLOODPRESSUREUPDATED være den totale gjennomsnittet. Manglende verdier skal fylles ut med nærmeste tidligere verdi. Ive prøvde følgende: Jeg har også prøvd rollaply og rollmeanr uten å lykkes. Id setter pris på litt hjelp. spurte okt 5 14 kl 0:45 Ved beregning av glidende gjennomsnitt er antall returnerte elementer mindre enn antall rader av dataene, dvs. bare kvote-1quot-elementer returneres. Dermed kan det føre til problemet her. Eller vil du vurdere å legge til den bevegelige gjennomsnittskolonnen separat, som: test2BLOODPRESSUREUPDATED lt - med (test2, c (gjennomsnittlig (BLOODPRESSURE, na. rm T), rulllapply (BLOODPRESSURE, 2, mean, na. rm T)) ndash KFB okt 5 14 kl 03:40 Takk for innsatsen KFB. Dessverre fungerte det ikke. Jeg prøvde også noen få redigerte versjoner. Kanskje er dyrehagefunksjonene ikke egnede for dette. Jeg har kodet følgende som virker: test5 lt-test test5UM lt - rep (NA, nrow (test5)) test5first lt-duplisert (test5ID) for (jeg i 1: nrow test5)) annet test5 Men det er utrolig sakte. ndash Adam Robinsson okt 5 14 kl 7: 09Movende gjennomsnitt i R Så langt jeg vet, har R ikke en innebygd funksjon for å beregne glidende gjennomsnitt. Ved hjelp av filterfunksjonen kan vi imidlertid skrive en kort funksjon for å flytte gjennomsnitt: Vi kan da bruke funksjonen på data: mav (data) eller mav (data, 11) hvis vi vil spesifisere et annet antall datapunkter enn standard 5-plotting fungerer som forventet: plot (mav (data)). I tillegg til antall datapunkter hvorav gjennomsnittlig, kan vi også endre sidebeskrivelsen av filterfunksjonene: sides2 bruker begge sider, sides1 bruker bare tidligere verdier. Del dette: Postnavigering Kommentarnavigasjon Kommentarnavigasjon Legg til en trend eller flytte gjennomsnittlig linje til et diagram Gjelder: Excel 2016 Word 2016 PowerPoint 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Mer. Mindre Hvis du vil vise datatrender eller flytte gjennomsnitt i et diagram du opprettet. Du kan legge til en trendlinje. Du kan også utvide en trendlinje utover de faktiske dataene dine for å bidra til å forutsi fremtidige verdier. For eksempel prognoser følgende lineære trendlinje to kvartaler fremover og viser tydelig en oppadgående trend som ser lovende ut på fremtidig salg. Du kan legge til en trendlinje på et 2-D-diagram som ikke er stablet, inkludert område, strekk, kolonne, linje, lager, scatter og boble. Du kan ikke legge til en trendlinje på en stablet, 3-D, radar-, kake-, overflate - eller doughnutdiagram. Legg til en trendlinje På diagrammet ditt, klikk på dataserien som du vil legge til en trendlinje eller glidende gjennomsnitt. Treningslinjen starter på det første datapunktet i dataserien du velger. Sjekk Trendline-boksen. For å velge en annen type trendlinje, klikk på pilen ved siden av Trendline. og klikk deretter Eksponentiell. Linjær prognose. eller to perioder som går i gjennomsnitt. For flere trendlinjer, klikk på Flere alternativer. Hvis du velger Flere alternativer. Klikk på alternativet du vil ha i Format Trendline-ruten under Trendline Options. Hvis du velger Polynomial. skriv inn den høyeste effekten for den uavhengige variabelen i bestillingsboksen. Hvis du velger Flytende gjennomsnitt. skriv inn antall perioder som skal brukes til å beregne det bevegelige gjennomsnittet i Period-boksen. Tips: En trendlinje er mest nøyaktig når den R-kvadrert verdien (et tall fra 0 til 1 som viser hvor tett de estimerte verdiene for trendlinjen tilsvarer dine faktiske data) er på eller nær 1. Når du legger til en trendlinje for dataene dine , Excel beregner automatisk sin R-kvadrert verdi. Du kan vise denne verdien på diagrammet ditt ved å merke verdien for Vis R-kvadrat i kartboksen (Format Trendline-panel, Trendlinjealternativer). Du kan lære mer om alle trendlinjealternativene i seksjonene nedenfor. Linjær trendlinje Bruk denne typen trendlinje til å skape en rettstrekningslinje for enkle lineære datasett. Dine data er lineære hvis mønsteret i datapunktene ser ut som en linje. En lineær trendlinje viser vanligvis at noe øker eller avtar med jevn hastighet. En lineær trendlinje bruker denne ligningen til å beregne de minste firkantene som passer for en linje: hvor m er skråningen og b er avskjæringen. Følgende lineære trendlinje viser at kjølesalg har økt konsekvent over en 8-års periode. Legg merke til at R-kvadratverdien (et tall fra 0 til 1 som viser hvor tett de estimerte verdiene for trendlinjen tilsvarer dine faktiske data) er 0.9792, som passer godt til linjen til dataene. Viser en best egnet buet linje, denne trendlinjen er nyttig når frekvensen av endring i dataene øker eller senker raskt og deretter ut. En logaritmisk trendlinje kan bruke negative og positive verdier. En logaritmisk trendlinje bruker denne ligningen til å beregne de minste firkantene som passer gjennom punkter: hvor c og b er konstanter og ln er den naturlige logaritmen-funksjonen. Følgende logaritmiske trendlinje viser forventet populasjonsvekst hos dyr i et fast romområde, hvor befolkningen utjevnet som plass for dyrene, ble redusert. Vær oppmerksom på at R-kvadratverdien er 0.933, som er en relativt god passform til linjen til dataene. Denne trendlinjen er nyttig når dataene dine svinger. For eksempel, når du analyserer gevinster og tap over et stort datasett. Ordren til polynomet kan bestemmes av antall svingninger i dataene eller av hvor mange svinger (bakker og daler) dukker opp i kurven. Typisk har en Order 2 polynomisk trendlinje bare en bakke eller dal, en Ordre 3 har en eller to åser eller daler, og en ordre 4 har opptil tre åser eller daler. En polynom eller krøllete trendlinje bruker denne ligningen til å beregne de minste firkantene som passer gjennom punkter: hvor b og er konstanter. Følgende Order 2 polynomiske trendlinje (en bakke) viser forholdet mellom kjørehastighet og drivstofforbruk. Legg merke til at R-kvadratverdien er 0.979, som ligger nær 1 slik at linjene passer godt til dataene. Viser en buet linje, denne trendlinjen er nyttig for datasett som sammenligner målinger som øker med en bestemt hastighet. For eksempel, akselerasjonen av en racerbil med intervaller på 1 sekund. Du kan ikke opprette en strømtrendelinje hvis dataene inneholder null eller negative verdier. En kraft trendlinje bruker denne ligningen til å beregne de minste firkantene som passer gjennom punkter: hvor c og b er konstanter. Merk: Dette alternativet er ikke tilgjengelig når dataene dine inneholder negative eller nullverdier. Følgende avstandsmålingsdiagram viser avstanden i meter etter sekunder. Strømtendenslinjen viser tydelig den økende akselerasjonen. Merk at R-kvadratverdien er 0.986, som er en nesten perfekt passform av linjen til dataene. Viser en buet linje, denne trendlinjen er nyttig når dataverdiene stiger eller faller ved stadig økende priser. Du kan ikke opprette en eksponentiell trendlinje hvis dataene inneholder null eller negative verdier. En eksponentiell trendlinje bruker denne ligningen til å beregne de minste firkantene som passer gjennom punkter: hvor c og b er konstanter og e er grunnlaget for den naturlige logaritmen. Følgende eksponensielle trendlinje viser den reduserende mengden av karbon 14 i en gjenstand som den aldrer. Vær oppmerksom på at R-kvadratverdien er 0.990, noe som betyr at linjen passer perfekt til dataene. Flytte Gjennomsnittlig trendlinje Denne trendlinjen utgjør svingninger i data for å vise et mønster eller en trend tydeligere. Et glidende gjennomsnitt bruker et bestemt antall datapunkter (angitt av Period-alternativet), gjennomsnitt dem, og bruker gjennomsnittsverdien som et punkt i linjen. For eksempel, hvis Perioden er satt til 2, brukes gjennomsnittet av de to første datapunktene som det første punktet i den bevegelige gjennomsnittlige trendlinjen. Gjennomsnittet av det andre og det tredje datapunktet benyttes som det andre punktet i trenden, etc. En glidende gjennomsnittlig trendlinje bruker denne ligningen: Antall poeng i en glidende gjennomsnittlig trendlinje er det totale antall poeng i serien minus nummer du angir for perioden. I et scatterdiagram er trendlinjen basert på rekkefølgen av x-verdiene i diagrammet. For et bedre resultat, sorter x-verdiene før du legger til et bevegelige gjennomsnitt. Følgende glidende gjennomsnittlig trendlinje viser et mønster i antall boliger solgt over en 26-ukers periode. R: Beregning av rullende eller bevegelige gjennomsnitt R: Beregning av rullende eller bevegelige gjennomsnitt Les ut hvordan du kan maksimere store data i skyen med Apache Hadoop. Last ned denne eBok nå. Brakt til deg i samarbeid med Hortonworks. Jeg har spilt rundt med noen tidsseriedata i R og siden det var litt variasjon mellom påfølgende punkter, ønsket jeg å glatte ut dataene ved å beregne det bevegelige gjennomsnittet. Jeg kjempet for å finne en innebygget funksjon for å gjøre dette, men kom over Didier Ruedins blogginnlegg som beskrev følgende funksjon for å gjøre jobben: Jeg prøvde å plugge inn noen tall for å forstå hvordan det fungerer: Her forsøkte jeg å gjøre et rullende gjennomsnitt som tok hensyn til de siste 3 tallene, så jeg forventet å få bare to tall tilbake 4.333333 og 5 og hvis det skulle bli NA-verdier, trodde jeg at det var i begynnelsen av sekvensen. Faktisk viser det seg at dette er hva sideparametrene kontrollerer: Så i vår mav-funksjon ser det rullende gjennomsnitt ut begge sider av gjeldende verdi i stedet for bare ved tidligere verdier. Vi kan finjustere det for å få den oppførelsen vi ønsker: NA-verdiene er irriterende for enhver plotting vi vil gjøre, slik at vi kan kvitte seg med dem. Etter å ha kommet til dette punktet la jeg merke til at Didier hadde henvist til dyreparkspakken i kommentarene, og den har en innebygd funksjon for å ta vare på alt dette: Jeg skjønte også at jeg kan liste alle funksjonene i en pakke med ls-funksjonen så jeg skal skanne dyreparker liste over funksjoner neste gang jeg trenger å gjøre noe tidsserier relatert therell trolig allerede være en funksjon for det
No comments:
Post a Comment