Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationSun, 26 Oct 2008 09:17:58 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/26/t1225034458r7ewskuod1dwsxc.htm/, Retrieved Fri, 17 May 2024 06:42:15 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18927, Retrieved Fri, 17 May 2024 06:42:15 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact166
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD    [Univariate Explorative Data Analysis] [Clothing Producti...] [2008-10-26 15:17:58] [14a75ec03b2c0d8ddd8b141a7b1594fd] [Current]
-   P       [Univariate Explorative Data Analysis] [Verbetering Q2] [2008-10-30 15:35:56] [6816386b1f3c2f6c0c9f2aa1e5bc9362]
- RMP       [Central Tendency] [Verbetering Q2_As...] [2008-10-30 15:50:08] [6816386b1f3c2f6c0c9f2aa1e5bc9362]
Feedback Forum
2008-10-30 15:54:31 [Kenny Simons] [reply
Om te zien of dit model juist is voor onze tijdreeks, moet onze tijdreeks aan 4 voorwaarden voldoen:
1) Random drawings (= een onafhankelijke toevallige trekking)
2) Een vaste verdeling
3) De verdeling moet een constante locatie / niveau hebben.
4) Er moet ook eenzelfde spreiding zijn (= dezelfde breedte)

Voor de eerste assumptie moeten we zien naar de autocorrelatie of naar het lagplot. Hiervoor moest je het aantal lags instellen (best op 12 of 36). Als we de lags op 36 hebben ingesteld, zien we in de grafiek van de autocorrelation function dat we bij lag 12 een zeer grote autocorrelatiecoëfficiënt hebben. Dit komt ook weer voor bij lag 24. We kunnen dus besluiten dat de tijdreeks niet random is, want ze bevat wel degelijk correlatie, namelijk een seizoenale correlatie. Hier vind je de grafieken bij lag=36
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t1225381046jopsq56a363ocsz.htm

Voor assumptie 2, moeten we zien naar het histogram en eventueel naar het density plot. Aan de hand van het histogram zien we dat we min of meer een normaal verdeling hebben. Bij het density plot, zien we dit ook. Er zit wel een kleine bult in, maar hier moeten we zeker niet van wakker liggen. Om deze assumptie op te lossen, kunnen we ook zien naar het normal QQ plot. Als de punten zo goed als op de rechte liggen, hebben we te maken met een normaal verdeling en dit is hier ook het geval.

Voor de derde assumptie, moeten we zien naar het run sequence plot. Deze reeks gaat vrij snel op en neer, maar hier moeten we zien naar de lange termijntrend of hier het niveau constant blijft. Dit is hier niet het geval. Het niveau gaat hier lichtjes achteruit.
Als we de central tendency berekenen voor deze tijdreeks, kunnen we zien dat bij de winsorized mean het gemiddelde ongeveer bij 87 begint en ook bij plus minus 87 eindigt, dit wil zeggen dat outliers geen invloed op het niveau van het gemiddelde hebben.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t1225381872xstjbt9bcth6nen.htm

Voor assumptie 4 moeten we zien naar de spreiding van het run sequence plot. Dit is weer niet eenvoudig te zien. Als we deze curve nu in 2 delen splitsen, zien we dat het eerste deel (het linkse deel) een grotere spreiding (schommeling) heeft dan het 2e deel (het rechtse deel). We kunnen dus besluiten dat de spreiding niet constant is.
2008-10-30 15:57:52 [Kenny Simons] [reply
Als we zien naar het run sequence plot, zien we duidelijk dat er geen constante spreiding is, maar wel een dalend verloop. Deze vraag heb ik goed beantwoord.
2008-10-30 15:58:31 [Kenny Simons] [reply
Mijn laatste commentaar moest bij Q3 komen.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18927&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18927&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18927&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18927&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18927&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18927&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 12 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')