Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Sat, 25 Oct 2008 04:39:14 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/25/t1224931201arf6xr0s22vkvrf.htm/, Retrieved Sun, 19 May 2024 00:03:08 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18673, Retrieved Sun, 19 May 2024 00:03:08 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

198

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Investigating dis...] [2008-10-25 10:39:14] [d7f41258beeebb8716e3f5d39f3cdc01] [Current]
-   PD      [Univariate Explorative Data Analysis] [Feedback Q2 12lags] [2008-11-03 20:16:54] [d32f94eec6fe2d8c421bd223368a5ced] 
-   PD      [Univariate Explorative Data Analysis] [Feedback Q2 36lags] [2008-11-03 20:21:43] [d32f94eec6fe2d8c421bd223368a5ced] 
-   PD      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-04 06:44:26] [192e18f2975bd990ab791be56d7a2d91] 
-   PD      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-04 06:44:26] [2d4aec5ed1856c4828162be37be304d9] 
- RMPD      [Central Tendency] [Investigating Dis...] [2008-11-04 07:07:09] [2d4aec5ed1856c4828162be37be304d9] 
- R  D      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-04 07:12:44] [2d4aec5ed1856c4828162be37be304d9] 

Feedback Forum

2008-11-03 17:05:39 [Dries Van Gheluwe] [reply] 
Geen oplossing bij de vierde voorwaarde, hier moet je kijken naar het run sequence plot en kijken naar de spreiding doorheen de grafiek. De eerste voorwaarde wordt niet opgelost volgens het run sequence plot maar met de lag plots (12 en 32), dan kan je zien dat ze niet random zijn maar er wel sprake is van seizonale correlatie. Je kan dit zien in het run sequence plot maar dat is in dit geval zeer moeilijk. Bij de 2de voorwaaarde maak je best gebruik van het QQ-plot ipv het Density-Plot
2008-11-03 20:31:00 [Evelien Blockx] [reply] 
Ik dacht dat het het best was om je lags in te stellen op een veelvoud van 12 (12 en 36 bijvoorbeeld). De assumpties testen kan je als volgt: 
 
Assumptie 1: Om te kijken of er autocorrelatie is, moet je de twee laatste grafieken zichtbaar maken. Hiervoor moet je het aantal lags instellen. Hieronder vind je de link waarop ik het aantal lags ingesteld heb op 12. 
 
http://www.freestatistics.org/blog/date/2008/Nov/03/t1225743488e0ktx65pagu9bez.htm 
 
De autocorrelaties moeten dichtbij nul liggen (randomness). Als de randomness geldt, zou de lag plot structuurloos moeten zijn. Je ziet dat de rechte lijn bijna horizontaal loopt en de punten gespreid liggen. De autocorrelatie is dichtbij nul. 
 
Maar wanneer je daarna naar de laatste grafiek kijkt (autocorrelation function), merk je wel een positieve seizoenale autocorrelatie. Dit wordt nog duidelijker als je het aantal lags op 36 instelt, zoals in volgende berekening. 
 
http://www.freestatistics.org/blog/date/2008/Nov/03/t1225743771wt5stgeywfe8pdz.htm 
 
Op de autocorrelation function zie je dat de 12de en 24ste autocorrelatie zeer groot is. Dat wijst op seizoenale autocorrelatie. De tijdreeks is dus bijgevolg niet random, er is seizoenale autocorrelatie. 
 
Assumptie 2: Deze assumptie werd correct getest met histogram en density plot. Hier mag je wel besluiten dat het min of meer normaal verdeeld is. De normal QQ plot kan je hiervoor ook gebruiken. 
 
Assumptie 3: Hiervoor moet je de run sequence plot gebruiken. Als fixed location geldt, dan is de run sequence plot vlak en niet-fluctuerend op LT. Als je kijkt naar de lange termijn trend, merk je dat er een kleine achteruitgang is, het niveau is niet helemaal constant. Er is dus een vermoeden dat fixed location hier niet geldt, al is het moeilijk te zien. 
 
Assumptie 4: Hiervoor gebruik je de run sequence plot. Als fixed variation geldt, dan is de verticale wijdte in de run sequence plot ongeveer hetzelfde over de hele horizontale as. Je ziet dat de spreiding in het eerste gedeelte groter is dan in het tweede gedeelte van de grafiek. De spreiding verandert. 
 
Het model is dus niet geldig.
2008-11-04 07:16:38 [Peter Melgers] [reply] 
Assumptie 2: 
 
Het Histogram vertoont min of meer normaalverdeling en het Density Plot lijkt vrij sterk op normaalverdeling. Er is een kleine afwijking maar dit is niet zo erg dus: normaalverdeling, ondanks het feit dat we autocorrelatie hebben. 
 
Aan het Normal Q-Q Plot kunnen we ook zien dat de meeste punten vrij dicht op één lijn liggen. 
 
Assumptie 3: 
 
Je kan ook naar central tendency gaan kijken waar een beetje fluctuatie kan opgemerkt worden (het gemiddelde schommelt een beetje). 
 
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/04/t1225782468mbc0udfl3ufzh6b.htm 
 
Assumptie 4: 
 
Hiervoor moet je het Run Sequence Plot gebruiken (spreiding van de reeks over de tijd heen). De eerste helft schommelt harder dan de tweede helft. 
 
Wanneer we het gemiddelde gaan aftrekken in de R-code: 
x=x-86.8934426229508 invullen, vallen de schommelingen nog harder op. 
 
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/04/t1225782826tgm8b81hmje3hk2.htm 
 
De tijdsreeks heeft dus een veranderende spreiding. 
 
Conclusie: het model is niet geldig omdat niet alle voorwaarden is voldaan. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18673&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18673&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18673&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18673&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18673&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18673&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code