Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_pairs.wasp
Title produced by softwareKendall tau Correlation Matrix
Date of computationThu, 06 Nov 2008 13:46:55 -0700
Cite this page as followsStatistical Computations at, Office for Research Development and Education, URL, Retrieved Mon, 10 Jun 2024 20:21:58 +0000
Statistical Computations at, Office for Research Development and Education, URL, Retrieved Mon, 10 Jun 2024 20:21:58 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact138
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Kendall tau Correlation Matrix] [Opdr 2 Q1 Kendall...] [2008-11-06 20:46:55] [74a138e5b32af267311b5ad4cd13bf7e] [Current]
Feedback Forum
2008-11-09 15:22:18 [Nathalie Daneels] [reply
Evaluatie opdracht 2: Task 1:

De conclusie zou nog moeten aangevuld worden (naar mijn mening) met:

Als we naar de spreadsheet met gegevens kijken, kunnen we vaststellen dat de tijd op de horizontale as staat en de variabelen op de verticale as. Het is zo dat de tijd altijd op de verticale as moet staan, daarom moet de tabel dus getransponeerd worden. Deze tabel moet ook bij in het werk worden opgenomen. We hebben voor het oplossen van deze opdracht gebruik gemaakt van de Kendall Tau Rang Correlation: deze grafiek geeft een overzicht van alle correlaties van de variabelen in 1 keer: Op de hoofddiagonaal staat een histogram van elke variabele ; rechts boven de hoofddiagonaal zijn de scatterplots gegeven (per 2 variabelen) en links onder de hoofddiagonaal staat de probabiliteit van de variabelen (en niet de correlatiecoëfficient) of met andere woorden de waarschijnlijkheid dat het verband aan het toeval kan worden toegeschreven (hoe hoger het getal, hoe meer waarschijnlijk dat het verband aan het toeval kan worden toegeschreven). Deze grafiek is ook een heel goede maatstaf: het ondervindt veel minder invloed van outliers en is veel robuster.
We kunnen concluderen dat de cashflow(RCF) de beste boekhoudkundige predictor is voor RNR: De waarschijnlijkheid dat het verband tussen RCF en RNR aan het toeval te wijten is, is bijna onbestaande (0,01) of met andere woorden: we kunnen er zo goed als zeker van zijn dat RCF de beste predictor is. (De betrouwbaarheid bij deze variabele(de cashflow) is kleiner dan 0,05: dus het is zeer onwaarschijnlijk dat het verband aan het toeval kan worden toegeschreven ; Hoe hoger deze probabiliteit, hoe slechter de correlatie.)Dit kunnen we ook afleiden uit de scatterplot van deze twee variabelen: het is bijna mogelijk om een rechte te trekken door de waarnemingen: Dit betekent dat er een lineair verband is tussen de twee data. Slechts weinig observaties liggen niet op deze rechte: we kunnen dus duidelijk veronderstellen dat er een sterk positief verband is tussen de variabelen (een kleine x-waarde van de ene variabele komt overeen met een kleine x-waarde van de andere variabele; hetzelfde geldt voor de y-waardes) en dus ook een positieve correlatie tussen x en y.
2008-11-09 19:41:13 [006ad2c49b6a7c2ad6ab685cfc1dae56] [reply
Goed, je had ook nog de tabel kunnen toevoegen. De getallen geven de probabiliteit weer. Dit wil zeggen in welke mate de correlatie kan worden toegeschreven aan toeval. De getallen geven de betrouwbaarheid van de berekeningen weer. Een probabiliteit van 0,01 wil dus zeggen dat er een betrouwbaarheid is van 99%. De p-waarde in de tabel moet kleiner zijn dan 0,05 om een goede correlatie te hebben.
2008-11-12 10:35:51 [Jolien Van Landeghem] [reply
OK, maar naar mijn mening ontbreken enkele dingen. We gebruiken eerst en vooral de kendall tau matrix omdat deze ongevoelig is voor outliers en gebruikt kan worden met nominale waarden. We vinden hier alle mogelijke correlaties terug. Als we zoeken naar de beste predictor zien we dat de p waarde bij de rcf het laagst is (en dus de kleinste kans om aan het toeval toegeschreven te worden). De p waarde is kleiner dan de grens van 0.05 en de kans is klein dat dit een toevallige gebeurtenis is. 1% is aan het toeval te schrijven. De tau coefficient geeft de correlatie weer en ligt tegen 1 of -1 in geval van sterke correlatie. In dit geval is de correlatie significant.

Post a new message
Dataseries X:
4,2	4,8	20,8	0,9	39,6
2,6	-4,2	17,1	0,85	36,1
3	1,6	22,3	0,83	34,4
3,8	5,2	25,1	0,84	33,4
4	9,2	27,7	0,85	34,8
3,5	4,6	24,9	0,83	33,7
4,1	10,6	29,5	0,83	36,3

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @
R Framework error message
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.

Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ \tabularnewline
R Framework error message & 
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.
\tabularnewline \hline \end{tabular} %Source:

[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @[/C][/ROW]
[ROW][C]R Framework error message[/C][C]
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.
[/C][/ROW] [/TABLE] Source:

Globally Unique Identifier (entire table):

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @
R Framework error message
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.

Kendall tau rank correlations for all pairs of data series
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483

Kendall tau rank correlations for all pairs of data series \tabularnewline
pair & tau & p-value \tabularnewline
tau( RNVM , RNR ) & 0.714285714285714 & 0.0301587301587301 \tabularnewline
tau( RNVM , RCF ) & 0.523809523809524 & 0.136111111111111 \tabularnewline
tau( RNVM , RLEZ ) & 0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RNVM , REV
 ) & 0.333333333333333 & 0.381349206349206 \tabularnewline
tau( RNR , RCF ) & 0.80952380952381 & 0.0107142857142857 \tabularnewline
tau( RNR , RLEZ ) & -0.0529256124024963 & 0.873844698517373 \tabularnewline
tau( RNR , REV
 ) & 0.0476190476190476 & 1 \tabularnewline
tau( RCF , RLEZ ) & -0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RCF , REV
 ) & -0.142857142857143 & 0.772619047619048 \tabularnewline
tau( RLEZ , REV
 ) & 0.370479286817474 & 0.266379923342483 \tabularnewline

[ROW][C]Kendall tau rank correlations for all pairs of data series[/C][/ROW]
[ROW][C]tau( RNVM , RNR )[/C][C]0.714285714285714[/C][C]0.0301587301587301[/C][/ROW]
[ROW][C]tau( RNVM , RCF )[/C][C]0.523809523809524[/C][C]0.136111111111111[/C][/ROW]
[ROW][C]tau( RNVM , RLEZ )[/C][C]0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RNVM , REV
[ROW][C]tau( RNR , RCF )[/C][C]0.80952380952381[/C][C]0.0107142857142857[/C][/ROW]
[ROW][C]tau( RNR , RLEZ )[/C][C]-0.0529256124024963[/C][C]0.873844698517373[/C][/ROW]
[ROW][C]tau( RNR , REV
[ROW][C]tau( RCF , RLEZ )[/C][C]-0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RCF , REV
[ROW][C]tau( RLEZ , REV

Globally Unique Identifier (entire table):

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Kendall tau rank correlations for all pairs of data series
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483

Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
panel.tau <- function(x, y, digits=2, prefix='', cex.cor)
usr <- par('usr'); on.exit(par(usr))
par(usr = c(0, 1, 0, 1))
rr <- cor.test(x, y, method='kendall')
r <- round(rr$p.value,2)
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep='')
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex)
panel.hist <- function(x, ...)
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='grey', ...)
pairs(t(y),diag.panel=panel.hist, upper.panel=panel.smooth, lower.panel=panel.tau, main=main)
a<-table.element(a,'Kendall tau rank correlations for all pairs of data series',3,TRUE)
n <- length(y[,1])
for (i in 1:(n-1))
for (j in (i+1):n)
dum <- paste('tau(',dimnames(t(x))[[2]][i])
dum <- paste(dum,',')
dum <- paste(dum,dimnames(t(x))[[2]][j])
dum <- paste(dum,')')
r <- cor.test(y[i,],y[j,],method='kendall')