Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationSat, 25 Oct 2008 10:47:28 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/25/t1224953305hm8gyg66hv9zs1e.htm/, Retrieved Wed, 22 May 2024 14:22:14 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18781, Retrieved Wed, 22 May 2024 14:22:14 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact167
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Univariate Explorative Data Analysis] [Q2 U EDA] [2008-10-25 16:47:28] [e11d930c9e2984715c66c796cf63ef19] [Current]
- R  D    [Univariate Explorative Data Analysis] [Q2 Correctie assu...] [2008-10-31 23:06:20] [547636b63517c1c2916a747d66b36ebf]
Feedback Forum
2008-10-29 16:11:46 [Gert De la Haye] [reply
bij het ingeven van de data, vergeten het aantal lags in te geven! Hiermee kan assumptie 1 makkelijk afgelzen worden door de nieuwe grafieken die dan onderaan verschijnen!
2008-10-30 00:39:02 [Olivier Uyttendaele] [reply
Link naar de verbeterde blog met correct aantal lags:
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t1225327053uf0vmcgl7ic8g3l.htm
2008-10-30 21:38:54 [Kim De Vos] [reply
Assumptie 1: Hierbij moet je kijken naar de autocorrelatie op de lag-plot. Bij opties moet je de hoeveelheid vertragingen ingeven die moeten worden berekend. Dit geeft je de mogenlijkheid om een toekomstige voorspelling te doen.
De tijdreeks is niet random maar er is sprake van positieve seizonale autocorrelatie. Je ziet dat in lag 12 en 24 de lag boven de grens ligt. (Dit is een terugkerend patroon in maand 12 van elk jaar)

Assumptie 2: Om te bepalen of je data normaal verdeeld is, kan je gebruik maken van de density plot en het histogram maar ook via de normal Q-Q plot. Op het histogram en de density plot kan je niet duidelijk waarnemen of het hier gaat om een normale verdeling. De Q-Q plot geeft duidelijke informatie. Hier merk je op dat de waarnemeingen vrij dicht op de rechte liggen. Toch merk je een oneffenheid op maar hier moet je niet wakker van liggen want deze ligt vrij dicht tegen de rechte.

Assumptie 3:
De grafiek mag niet fluctueren op lange termijn.
Je kan hiervoor kijken naar de run sequence plot, je merkt een dalende trend op.
Je kan dit ook op een andere manier berekenen, namelijk door de central tendency uit te voeren.
http://www.freestatistics.org/blog/date/2008/Oct/30/t1225396256z7cpi8rqy2wptn0.htm

Je ziet in de tabel dat de gemiddelden rond 87 schommelen, de outliers hebben dus niet echt effect op het gemiddelde. Toch blijft dit echter moeilijk te zien, we vermoeden dat er een dalende trend is.

Assumptie 4:
Gebruikte techniek = Sequence plot. Hier moet je kijken naar de spreiding van de reeks over de tijd heen. Je verdeelt de grafiek in 2 gelijke delen. In het 1e deel schommelt de grafiek meer dan in het 2e deel, ze hebben dus niet dezelfde spreiding.

Er werd niet voldaan aan de 4 validiteisvoorwaarden.
2008-10-31 23:10:26 [Olivier Uyttendaele] [reply
Assumptie 1: Are the data autocorrelated?
Hiervoor heb ik de verkeerd grafiek gebruikt, het is niet het Run Sequence Plot dat hier voor in aanmerking komt maar het lag plot of door de autocorrelatie te onderzoeken.
Een normaal lag plot vertoont een vlak waarin de waardes random geplaatst zijn en dus het hele vlak vullen. In dit lag plot is dit ook het geval.

Algemeen kan gesteld worden dat in data zonder autocorrelatie geen identificeerbare structuur mag vertonen in het lag plot.

Assumptie 2: Is the random component generated by a fixed distribution?
Hier heb ik de juiste 2 grafieken voor gebruikt. Histogram en Density Plot. Wel kon ik nog het Q Q Plot vermelden.
Volgens mij heb ik de uitkomst wel redelijk goed geinterpreteerd, het is geen perfecte normaalverdeling, er komen nog extremere waarden voor. Deze zijn echter verwaarloosbaar. Dit moest ik er nog bij vermelden.

Assumptie 3: Is the deterministic component constant?
Hier moest ik het Run Sequence Plot voor gebruiken.
Met deze methode kan je kijken of er veranderingen zijn in het niveau, of er outliers zijn en of er veranderingen zijn in spreiding.
Hier diende ik op te merken dat wanneer je een rechte door het gemiddelde zou trekken, deze een dalende trend zou vertonen -> het niveau blijft dus niet constant.

Assumptie 4: The random component have a fixed variation.
Wederom moest ik hier het Run sequence plot bekijken of er verschillen zitten in de spreiding. Best is om hier dit plot te reproduceren met een kleine aanpassing. nl. de constant uit de reeks halen. Dit doe je door ofwel van de reeks het gemiddelde af te trekken in excel (in dit geval 86,69...) of door in de R code van het nieuw gereproduceerd model volgende code te zetten “x<-x-86,69”
zie -> http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/01/t1225494436owzpw7dfwhaxbgf.htm

Wanneer ik dit doe, kan ik zien dat de mate waarin de grafiek schommelt in het 1ste deel, niet gelijk is aan dat van het 2de deel. De spreiding is dus niet gelijk.

In het document had ik geschreven dat het model diende verworpen te worden aangezien niet aan alle assumpties werd voldaan, hier had ik dus gelijk in.
2008-11-03 21:20:44 [Bonifer Spillemaeckers] [reply
Assumptie 1 : Voor deze assumptie moeten we niet naar de Run Sequence Plot kijken maar naar de Autocorrelation Function-grafiek. Wanneer we bij de berekeningen de lags instellen op 36 kunnen we een periode van 3 jaar bekijken. We bemerken dat niet alle lijnen binnen het betrouwbaarheidsinterval liggen. Kijken we naar de maanden 12, 24 en 36 dan liggen de lijnen opmerkelijk ver buiten het betrouwbaarheidsinterval. Dit duidt op een positieve seizoenale correlatie.

Assumptie 4 : Om te zien of er een vaste variatie is te bemerken binnen de waarden, kijken we naar het Run Sequence Plot. We bemerken in het begin (t.e.m. 30) een terugkerend patroon, verder in de grafiek verlopen de waarden gelijkmatig op- en neergaand met opvallend minder uitschieters.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18781&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18781&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18781&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18781&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18781&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18781&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')