Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_bootstrapplot.wasp
Title produced by softwareBlocked Bootstrap Plot - Central Tendency
Date of computationThu, 06 Nov 2008 10:51:23 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/06/t1225993969r2jd9lxke55t03i.htm/, Retrieved Sun, 19 May 2024 04:56:16 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22352, Retrieved Sun, 19 May 2024 04:56:16 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact150
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Blocked Bootstrap Plot - Central Tendency] [workshop 1 Q4] [2008-11-06 17:51:23] [c5d6d05aee6be5527ac4a30a8c3b8fe5] [Current]
Feedback Forum
2008-11-10 11:05:34 [Jasmine Hendrikx] [reply
Evaluatie task 1 Q4:

De student vermeldt hier dat zij geen verdere suggesties heeft op hetgeen de student uit workshop 3a heeft geschreven. Wat de student uit workshop 3a zegt, is inderdaad correct. Aanvullend zou ik wel nog zeggen dat men dus een afweging moet maken. Met andere woorden: wat kost het u om met een outlier geconfronteerd te worden? Afhankelijk van de situatie kies je dan voor midrange of voor het gemiddelde. Bij midrange heb je een kleine spreiding, maar als het mis gaat, zal het ook serieus misgaan. Hier is het risico dus groter. Bij het gemiddelde is de schatting wel minder nauwkeurig, maar men zal hier veel minder te maken hebben met outliers, dus bijgevolg minder risico’s. Eventueel zou je er ook nog bij kunnen zeggen dat de mediaan niet echt een goede keuze is, aangezien deze veel outliers bevat EN bovendien een grotere variantie vertoont dan de midrange. Uit de density plots kun je bovendien ook afleiden dat de midrange een grilliger verloop kent dan het gemiddelde en ook veel outliers heeft, wat ook tot uiting komt in de notched boxplots in de grafiek.
2008-11-10 13:13:34 [Käthe Vanderheggen] [reply
Hier had de student wel nog de werking van de plots kunnen toelichten en aantonen dat je een afweging dient te maken of de midrange met haar kleinste spreiding of de mean met de minste outliers, het meest betrouwbare is.
2008-11-10 15:41:34 [Lana Van Wesemael] [reply
De student heeft hier de meeste informatie inderdaad al gegeven. Probeer volgende keer toch om iets meer informatie te geven. Geef bijvoorbeeld een link met de theorie.
Vb: de bootstrap plot word gebruikt om de onzekerheid te schatten. Hoe kleiner de spreiding van de plot, hoe correcter de berekeningen zijn.
2008-11-11 07:52:15 [Kevin Vermeiren] [reply
De student had inderdaad een goed antwoord gegeven maar dit antwoord klopte enkel in het geval dat de outliers irrelevant zouden zijn. Er moet steeds een afweging gemaakt worden omtrent de kostprijs van een confrontatie met zulke outliers.Indien de outliers irrelevant zouden zijn zou de mid-range inderdaad de beste schatter zijn voor de kledingproductie. Omdat de mid-range vertegenwoordigd wordt door de box plot met de kleinste spreiding. Hoe kleiner de spreiding hoe efficiënter.De outliers zijn echter wel degelijk van belang. Het aantal outliers staat in verband met het risico op fouten en dus de zekerheid. Veel outliers betekent een hoger risico op fouten en een kleinere zekerheid. Bijgevolg is de mid-range gevoeliger voor fouten dan de mean. De mean is eigenlijk een minder efficiënte schatter(door de grotere spreiding) van de productie maar heeft geen hinder van outliers(minder kans op fouten dus betrouwbaarder).

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22352&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22352&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22352&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Estimation Results of Blocked Bootstrap
statisticQ1EstimateQ3S.D.IQR
mean85.671721311475486.893442622950888.07459016393441.722859076839702.40286885245902
median86.487.3881.977159396345451.59999999999999
midrange88.037588.188.851.149101871123900.8125

\begin{tabular}{lllllllll}
\hline
Estimation Results of Blocked Bootstrap \tabularnewline
statistic & Q1 & Estimate & Q3 & S.D. & IQR \tabularnewline
mean & 85.6717213114754 & 86.8934426229508 & 88.0745901639344 & 1.72285907683970 & 2.40286885245902 \tabularnewline
median & 86.4 & 87.3 & 88 & 1.97715939634545 & 1.59999999999999 \tabularnewline
midrange & 88.0375 & 88.1 & 88.85 & 1.14910187112390 & 0.8125 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22352&T=1

[TABLE]
[ROW][C]Estimation Results of Blocked Bootstrap[/C][/ROW]
[ROW][C]statistic[/C][C]Q1[/C][C]Estimate[/C][C]Q3[/C][C]S.D.[/C][C]IQR[/C][/ROW]
[ROW][C]mean[/C][C]85.6717213114754[/C][C]86.8934426229508[/C][C]88.0745901639344[/C][C]1.72285907683970[/C][C]2.40286885245902[/C][/ROW]
[ROW][C]median[/C][C]86.4[/C][C]87.3[/C][C]88[/C][C]1.97715939634545[/C][C]1.59999999999999[/C][/ROW]
[ROW][C]midrange[/C][C]88.0375[/C][C]88.1[/C][C]88.85[/C][C]1.14910187112390[/C][C]0.8125[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22352&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22352&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Estimation Results of Blocked Bootstrap
statisticQ1EstimateQ3S.D.IQR
mean85.671721311475486.893442622950888.07459016393441.722859076839702.40286885245902
median86.487.3881.977159396345451.59999999999999
midrange88.037588.188.851.149101871123900.8125



Parameters (Session):
par1 = 500 ; par2 = 12 ;
Parameters (R input):
par1 = 500 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1 < 10) par1 = 10
if (par1 > 5000) par1 = 5000
if (par2 < 3) par2 = 3
if (par2 > length(x)) par2 = length(x)
library(lattice)
library(boot)
boot.stat <- function(s)
{
s.mean <- mean(s)
s.median <- median(s)
s.midrange <- (max(s) + min(s)) / 2
c(s.mean, s.median, s.midrange)
}
(r <- tsboot(x, boot.stat, R=par1, l=12, sim='fixed'))
bitmap(file='plot1.png')
plot(r$t[,1],type='p',ylab='simulated values',main='Simulation of Mean')
grid()
dev.off()
bitmap(file='plot2.png')
plot(r$t[,2],type='p',ylab='simulated values',main='Simulation of Median')
grid()
dev.off()
bitmap(file='plot3.png')
plot(r$t[,3],type='p',ylab='simulated values',main='Simulation of Midrange')
grid()
dev.off()
bitmap(file='plot4.png')
densityplot(~r$t[,1],col='black',main='Density Plot',xlab='mean')
dev.off()
bitmap(file='plot5.png')
densityplot(~r$t[,2],col='black',main='Density Plot',xlab='median')
dev.off()
bitmap(file='plot6.png')
densityplot(~r$t[,3],col='black',main='Density Plot',xlab='midrange')
dev.off()
z <- data.frame(cbind(r$t[,1],r$t[,2],r$t[,3]))
colnames(z) <- list('mean','median','midrange')
bitmap(file='plot7.png')
boxplot(z,notch=TRUE,ylab='simulated values',main='Bootstrap Simulation - Central Tendency')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Estimation Results of Blocked Bootstrap',6,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'statistic',header=TRUE)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,'Estimate',header=TRUE)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,'IQR',header=TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
q1 <- quantile(r$t[,1],0.25)[[1]]
q3 <- quantile(r$t[,1],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[1])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,1])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
q1 <- quantile(r$t[,2],0.25)[[1]]
q3 <- quantile(r$t[,2],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[2])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,2])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'midrange',header=TRUE)
q1 <- quantile(r$t[,3],0.25)[[1]]
q3 <- quantile(r$t[,3],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[3])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,3])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')