Kendall tau Correlation Matrix
Date of computation: Thu, 13 Nov 2008 01:05:38 -0700
various EDA topic
Feedback Forum
2008-11-16 15:50:55 [Gert-Jan Geudens] [reply
Het is goed om deze kendall tau correlation weer te geven. Dit kan immers zeer nuttige informatie opleveren. Zoals de student reeds vermelde zien we ook hier dat het verband tussen invoer en de wisselkoers het grootst is. De student had nog wel kunnen vermelden dat dit geen vertekend beeld is aangezien uit de partiële correlatie reeds gebleken is, dat de uitvoer nauwelijks invloed heeft op deze correlatie.
2008-11-19 16:17:40 [Carole Thielens] [reply
Om zijn analyse in Q1 van de opdracht ' various EDA topics' te ondersteunen, gebruikte de student een Kendall Tau Correlation Plot.
De ‘kendall tau correlatie plot’ geeft linksboven in één keer de correlaties tussen alle variabelen weer. Hoe lager de correlatie tussen 2 variabelen, hoe hoger de waarschijnlijkheid dat het verband tussen deze twee variabelen niet aan het toeval toegeschreven kan worden. De verscheidene waarden rechtsonder in de kendall tau correlation plot zijn gelijk aan de p-waarden. Deze p-waarden wijzen op probabiliteit, wat aangeeft in welke mate het verband tussen 2 variabelen aan het toeval toe te schrijven is. De probabiliteit en correlatie kennen een negatief verband. Dit impliceert dat een lage probabiliteit gepaard gaat met een hoge correlatie en omgekeerd. Uit de plot en bijhorende tabel besloot de student enkel en alleen dat de correlatie tussen wisselkoers en invoer de grootste is. Verdere uitleg om deze conclusies te ondersteunen, is naar mijn mening zeker nog vereist. Er dient bijvoorbeeld zeker en vast opgemerkt te worden dat deze correlatie van 0.45 gepaard gaat met opmerkelijk grote p-waarde van 3.7!? Deze probabiliteitswaarde wijst immers op de mate waarin het verband tussen twee variabelen aan het toeval toe te schrijven is. Hieruit blijkt met andere woorden dat de correlatie tussen wisselkoers en invoer wel de grootste is, maar daarnaast ook enorm sterk aan het toeval toe te schrijven is. Het is voor mij niet duidelijk hoe dit mogelijk kan zijn, maar het vermelden van dit fenomeen is essentieel.
2008-11-19 16:22:34 [Carole Thielens] [reply
In mijn voorgaande assesment betreffende deze specifieke analyse, heb ik vermeld dat de correlatie tussen wisselkoers en invoer gepaard ging met een zeer grote p-waarde. De conclusie van de student zou bijgevolg niet kloppen. Ik merkte echter zelf niet op dat deze p-waarde tot de -7de macht weergegeven werd en ik me dus bijgevolg vergiste. De hoge correlatie van 0.45 gaat dus wel gepaard met een lage p-waarde, waaruit besloten kan worden dat er een aanzienlijk positief verband bestaat tussen deze twee variabelen, wat niet aan het toeval toe te schrijvezn is.
2008-11-22 13:54:38 [Angelique Van de Vijver] [reply
Goed van de student om zijn analyse te staven met deze kendell tau correlation. In de tabel zien we dus ook hier dat de correlatie tussen invoer en wisselkoers het hoogste is (0.45). Deze is inderdaad wel lager dan de correlatie die we hadden bij de vorige berekeningen (0.62).
We zien ook zeer lage p-waarden wat er dus op wijst dat de correlaties die weergeven worden niet aan het toeval te wijten zijn.

Post a new message
Dataseries X:
109,57	156,4	377,2
107,08	143,1	332,2
110,33	148,9	364,8
110,36	134	352,4
106,5	118	341,6
104,3	125,3	298,2
107,21	138	355,3
109,34	114	330,9
108,2	109,9	314,5
109,86	151,5	418,9
108,68	129,1	433,2
113,38	121,7	367
117,12	126,1	422,9
116,23	114,3	352,1
114,75	124,7	419,8
115,81	111,9	432,7
115,86	120	414,2
117,8	119,5	387,7
117,11	137,8	297,2
116,31	105,4	357,4
118,38	135,4	384,2
121,57	182,5	425,2
121,65	129,6	385,3
124,2	147,5	355,4
126,12	128,9	409,8
128,6	119,7	421,2
128,16	149,4	421,8
130,12	136,6	464,2
135,83	118,6	494
138,05	121,4	404,2
134,99	138,9	411,4
132,38	109,5	403,4
128,94	131,7	403,3
128,12	160,3	520,9
127,84	138,1	439,8
132,43	136,7	434,8
134,13	126,6	476,5
134,78	138	454,3
133,13	152	522
129,08	137	498,4
134,48	134,9	439,9
132,86	154,4	450,7
134,08	145,2	447,1
134,54	133,1	451,3
134,51	169,6	466,8
135,97	159,3	498
136,09	124,9	533,6
139,14	138,1	451,9
135,63	162,5	477,1
136,55	136,6	410,4
138,83	148,1	469,5
138,84	142	485,4
135,37	137,9	406,7
132,22	152,5	439,7
134,75	182,8	412,2
135,98	135,3	440,2
136,06	141,8	411,1
138,05	151,7	477,7
139,59	140,6	463,2
140,58	128	320,5

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'George Udny Yule' @

Kendall tau rank correlations for all pairs of data series
tau( Wisselkoers , Uitvoer )0.1957013887700340.0273180710433372
tau( Wisselkoers , Invoer )0.4504097382410773.70909608582437e-07
tau( Uitvoer , Invoer )0.2810292218104620.0015242652142482

R code (references can be found in the software module):
panel.tau <- function(x, y, digits=2, prefix='', cex.cor)
usr <- par('usr'); on.exit(par(usr))
par(usr = c(0, 1, 0, 1))
rr <- cor.test(x, y, method='kendall')
r <- round(rr$p.value,2)
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep='')
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex)
panel.hist <- function(x, ...)
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='grey', ...)
pairs(t(y),diag.panel=panel.hist, upper.panel=panel.smooth, lower.panel=panel.tau, main=main)
a<-table.element(a,'Kendall tau rank correlations for all pairs of data series',3,TRUE)
n <- length(y[,1])
for (i in 1:(n-1))
for (j in (i+1):n)
dum <- paste('tau(',dimnames(t(x))[[2]][i])
dum <- paste(dum,',')
dum <- paste(dum,dimnames(t(x))[[2]][j])
dum <- paste(dum,')')
r <- cor.test(y[i,],y[j,],method='kendall')