Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationWed, 22 Oct 2008 07:21:58 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/22/t1224681785nwfpxnv5sdk0hc3.htm/, Retrieved Wed, 15 May 2024 19:10:45 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18407, Retrieved Wed, 15 May 2024 19:10:45 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact198
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Univariata explor...] [2008-10-22 13:21:58] [54e3d3004a715f41ac868f539d95466f] [Current]
-   P       [Univariate Explorative Data Analysis] [Lag aanpassen] [2008-10-26 13:44:48] [252acdb58d8522ab27f61fa1e87b5efe]
Feedback Forum
2008-10-31 15:57:01 [2df1bcd103d52957f4a39bd4617794c8] [reply
Unverified author, student heeft berekening niet geblogd onder eigen inloggegevens...

De student trekt de juiste conclusies, namelijk dat niet aan alle voorwaarden is voldaan en we dus niet over een geldig model kunnen spreken.

Echter, student had soms beter andere grafieken bekeken om besluit te trekken.

Assumptie 1: lagplot, student had deze beter opgeroepen en bekeken of de punten op de rechte lagen om zo al dan niet autocorrelatie te besluiten.

Assumptie 2: student bekijkt juist het histogram.

Assumptie 3: Run sequence plot op LT had interessanter geweest om zo vast te stellen dat er geen constante locatie is.

Assumptie 4: Run sequence plot om vervolgens te oordelen dat er geen constante spreiding is over de tijd heen.
2008-11-02 15:07:10 [Elias Van Deun] [reply
Assumptie 1: Deze assumptie wordt op de verkeerde grafiek afgelezen. Het is niet de run sequence plot die we moeten hebben, maar de lag plot. Deze bekom je door bij de berekening het aantal lags in te vullen. In dit voorbeeld heb ik 12 lags gekozen:
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/02/t1225623402715pn0ml5lw71j0.htm

Als we dan de Autocorrelation Function bekijken, zie je dat er op de 12de lag een grote verticale rechte is, dat wil zeggen dat we er autocorrelatie is.

Assumptie 2: Aan de hand van het histogram en de density plot kunnen we toch afleiden dat er min of meer een normaal verdeling is. De student vergeet ook te verwijzen naar de QQ plot, hierop is te zien dat de punten min of meer op de rechte liggen, dat wil zeggen dat er sprake is van een normaal verdeling.

Assumptie 3: Ook hier gebruikt de student de verkeerde grafiek. Het is niet de QQ plot die we gebruiken, maar de run sequence plot. Op deze grafiek zien we dat er op langere termijn de constante achteruit gaan. Om zekerder te zijn berekenen we het gemiddelde via de central tendency.
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/02/t1225624585k99kterovz3fqxe.htm
Uit de grafieken van de trimmed- en winsorised mean kunnen we afleiden dat het gemiddelde niet constant blijft. Er is een dalende trend aanwezig.

Assumptie 4: Deze gaat over de spreiding van de waarden. Hiervoor gebruiken we terug de run sequence plot. Als je de grafiek in twee helften verdeeld, merk je op dat de spreiding niet gelijk is in de linker- en rechter helft. In de linker helft is de spreiding groter.

De conclusie is correct: Dit model is niet geldig omdat niet aan alle voorwaarden zijn voldaan.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time8 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 8 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18407&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]8 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18407&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18407&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time8 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18407&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18407&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18407&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')