Γιατί η συσχέτιση δεν συνεπάγεται αιτία - Η έννοια αυτού του κοινού ρητού στις στατιστικές

Μπορεί να θυμάστε αυτό το απλό μάντρα από την τάξη στατιστικών στοιχείων σας:

"Η συσχέτιση δεν συνεπάγεται αιτιώδη συνάφεια."

Ίσως νομίζετε ότι γνωρίζετε τι σημαίνει αυτή η φράση.

Όπως, αν σπούδαζες πολύ σκληρά στα στατιστικά, πήρες έναν καλό βαθμό και έπειτα μπήκες στο κολέγιο, αυτό πρέπει να σημαίνει ότι μπήκες στο κολέγιο επειδή πήρες τάξη στα στατιστικά.

Ενώ αυτός ο βαθμός, μαζί με τις δεξιότητες που μάθατε, πιθανότατα βοήθησαν, δεν μπορείτε να αγνοήσετε τους άλλους παράγοντες που παίζετε - και πιθανότατα δεν μπορείτε να υποστηρίξετε ότι ο βαθμός σας Στατιστικά ήταν η αιτία της αποδοχής σας στο κολέγιο.

Πρώτα πράγματα πρώτα - γιατί κάνουμε λάθος συσχέτιση με αιτιώδη συνάφεια;

Είναι εύκολο να σκεφτεί κανείς ότι επειδή δύο πράγματα φαίνονται να σχετίζονται, το ένα πρέπει να είναι το αίτιο του άλλου. Αλλά αυτό μπορεί να είναι μια ανόητη και μερικές φορές επικίνδυνη υπόθεση.

Για παράδειγμα, ας υποθέσουμε ότι προσπαθείτε να καταλάβετε τι κάνει τους ανθρώπους λιγότερο γκρινιάρης. Πραγματοποιείτε μια μελέτη που διαπιστώνει ότι, όταν οι άνθρωποι κοιμούνται τουλάχιστον x ώρες τη νύχτα, είναι λιγότερο γκρινιάρης.

Αλλά έχετε λάβει υπόψη όλους τους παράγοντες εδώ; Ίσως άρχισαν επίσης να εργάζονται περισσότερο ως συνέπεια της ξεκούρασης και αυτό άλλαξε τη διάθεσή τους.

Δεν είναι όλα τα παραδείγματα τόσο καλοήθη - και μερικά είναι εντελώς παράλογα.

Για να δείξετε πόσο παραπλανητικό μπορεί να είναι να υποθέσουμε ότι η συσχέτιση συνεπάγεται αιτιώδη συνάφεια, ρίξτε μια ματιά στο παρακάτω γράφημα από τους ψευδείς συσχετισμούς του Tyler Vigen:

Παρόλο που υπάρχει ισχυρή συσχέτιση μεταξύ αυτών των δύο παραγόντων, αμφιβάλλω ότι θα μπορούσατε να υποστηρίξετε αποτελεσματικά ότι ο ένας προκάλεσε τον άλλο. Ίσως αυτό θα είναι μια πρόκληση για τους ανθρώπους να προσπαθήσουν και να αποδείξουν.

Εδώ είναι ένα άλλο στολίδι από τη συλλογή του Tyler:

Κοιτάξτε αυτή την όμορφη συσχέτιση. Αλλά θα πιέζεις σκληρά να ισχυριστείς ότι, επειδή κάποιος έτρωγε περισσότερο τυρί, θα ήταν πιο πιθανό να εμπλακούν θανάσιμα στα σεντόνια τους.

Τι είναι η συσχέτιση στα στατιστικά;

Σύμφωνα με το λεξικό, μια συσχέτιση είναι μια αμοιβαία σχέση ή σύνδεση μεταξύ δύο ή περισσότερων πραγμάτων (ή μεταβλητών) - ειδικά ενός που δεν αναμένεται μόνο με βάση την τύχη.

Ας το χρησιμοποιήσουμε σε μια πρόταση: Το τεράστιο μέγεθος των ντοματών μου φαίνεται να συσχετίζεται με την επιπλέον βροχή που είχαμε αυτό το καλοκαίρι.

Τώρα, εδώ υποθέτω ότι, επειδή έβρεχε λίγο περισσότερο από το συνηθισμένο, τα φυτά τομάτας μου πήγαν καρύδια και παρήγαγαν ντομάτες τεράτων.

Αλλά αυτός είναι ο μόνος παράγοντας; Τι γίνεται με το πλούσιο σε θρεπτικά λίπασμα που χρησιμοποίησα στα υπερυψωμένα κρεβάτια μου; Τι γίνεται με την ποιότητα των φυτών που αγόρασα από το φυτώριο; Τι γίνεται με το προσεκτικό κλάδεμά μου και την περιποίηση;

Όπως μπορείτε να δείτε, αν και υπάρχει συσχέτιση μεταξύ των μεγάλων ντοματών μου και του βροχερού καλοκαιριού μας, αυτό δεν σημαίνει απαραίτητα αιτιώδη συνάφεια.

Τι είναι η αιτία στα στατιστικά στοιχεία;

Ώρα για έναν άλλο ορισμό. Αιτία , σύμφωνα με το λεξικό, είναι η πράξη ή η αντιπροσωπεία που παράγει ένα αποτέλεσμα.

Ας πάρουμε λίγο πιο συγκεκριμένα. Αιτία σημαίνει ότι υπάρχει μια σχέση μεταξύ δύο γεγονότων όπου ένα γεγονός επηρεάζει το άλλο. Στα στατιστικά στοιχεία, όταν η τιμή ενός συμβάντος - ή μιας μεταβλητής - ανεβαίνει ή κατεβαίνει λόγω ενός άλλου συμβάντος ή μεταβλητής, μπορούμε να πούμε ότι υπήρχε αιτία. Α προκάλεσε το Β να συμβεί.

Τι λες για ένα παράδειγμα για αυτό; Ίσως είστε ελεύθεροι για ένα περιοδικό που πληρώνει με τη λέξη. Όσο μεγαλύτερη είναι η ιστορία (και όσο περισσότερες λέξεις περιέχει), τόσο περισσότερο πληρώνεστε.

Υπάρχει λοιπόν μια άμεση συσχέτιση μεταξύ πόσων λέξεων γράφετε και πόσων πληρώνεστε. Αλλά υπάρχει επίσης αιτιώδης συνάφεια (επειδή γράψατε περισσότερα, πληρώσατε περισσότερα)

Γιατί είναι τόσο εύκολο να το κάνετε λάθος;

Γιατί είναι τόσο εύκολο να σκεφτεί κανείς ότι η συσχέτιση συνεπάγεται αιτιώδη συνάφεια; Λοιπόν, εάν δύο πράγματα φαίνονται να σχετίζονται, έχουμε την τάση να τα συνδέουμε και να υποθέσουμε ότι επηρεάζουν το ένα το άλλο. Όταν ο καιρός είναι κρύος, οι άνθρωποι περνούν περισσότερο χρόνο μέσα. Γύρω από τις διακοπές, τα εμπορικά κέντρα είναι γεμάτα. Όταν παίρνετε λίγο ιβουπροφαίνη, ο πονοκέφαλος σας εξαφανίζεται.

Παρόλο που αυτές οι περιστάσεις είναι σίγουρα σχετικές - και κάποιες ίσως υπονοούν αιτιότητα - δεν αντιστέκονται απαραίτητα στην επιστημονική ανάλυση.

Υπάρχουν μερικοί λόγοι για τους οποίους θα μπορούσαμε να συνάγουμε κατά λάθος την αιτία από τη συσχέτιση.

Τι είναι μια σύγχυση μεταβλητή;

Πρώτα απ 'όλα, μπορεί να έχετε μια σύγχυση μεταβλητή στο μείγμα. Αυτή είναι μια μεταβλητή που επηρεάζει τόσο τις ανεξάρτητες όσο και τις εξαρτημένες μεταβλητές στη σχέση σας - και έτσι μπερδεύει την ικανότητά σας να προσδιορίζετε τη φύση αυτής της σχέσης.

Για παράδειγμα, εάν μια νέα οικογένεια μετακινηθεί σε μια γειτονιά και το έγκλημα ανεβαίνει, οι κάτοικοι σε αυτήν την περιοχή μπορεί να υποθέσουν ότι οφείλεται σε αυτήν τη νέα οικογένεια. Τι γίνεται όμως αν, ταυτόχρονα, ένα κέντρο κράτησης άνοιξε κοντά; Αυτή είναι η πιο πιθανή αιτία του αυξημένου εγκλήματος.

Τι είναι η αντίστροφη αιτία;

Δεύτερον, μπορεί να αντιμετωπίζετε την αντίστροφη αιτιότητα . Αυτό συμβαίνει όταν, αντί να υποθέσετε σωστά ότι το Α προκαλεί Β, τα αναμιγνύετε και υποθέτετε ότι το Β προκαλεί Α.

Μπορεί να είναι δύσκολο να φανταστεί κανείς πώς συμβαίνει αυτό, αλλά σκεφτείτε πώς λειτουργούν τα ηλιακά πάνελ. Παράγουν περισσότερη δύναμη όταν ο ήλιος είναι στον ουρανό περισσότερο.

Αλλά ο ήλιος δεν είναι πλέον στον ουρανό γιατί τα πάνελ παράγουν περισσότερη ισχύ. Τα πάνελ παράγουν περισσότερη ισχύ επειδή ο ήλιος λάμπει για μεγαλύτερες χρονικές περιόδους.

Τι είναι μια σύμπτωση;

Τρίτον, δεν πρέπει να ξεχνάμε τη δύναμη της σύμπτωσης . Όταν δύο πράγματα συμβαίνουν ταυτόχρονα, είναι δελεαστικό να δούμε την αιτιώδη συνάφεια. Αλλά όπως ακριβώς το παραπάνω ανόητο γράφημα, με τις στοές και τους βαθμούς CS, πολλοί είναι απλώς συμπτώσεις.

Στο τέλος - γιατί νοιαζόμαστε;

Ίσως προσπαθείτε να καταλάβετε εάν ένα συγκεκριμένο νέο φάρμακο κάνει τους ασθενείς να αισθάνονται καλύτερα. Ή θα θέλατε να μάθετε τι κάνει τους ανθρώπους να αγοράσουν ένα συγκεκριμένο προϊόν.

Όποιο κι αν είναι το κίνητρό σας, είναι συχνά πολύ χρήσιμο να καταλάβετε εάν το Α προκαλεί Β, μαζί με το πώς και γιατί.

Αλλά όπως έχουμε δει, δεν είναι τόσο εύκολο. Πρέπει να ελέγξετε όσο το δυνατόν περισσότερους παράγοντες, να μειώσετε την πιθανότητα συγχύσεως μεταβλητών και συμπτώσεων και να μειώσετε τα δεδομένα σε ό, τι είναι σχετικό.

Δεν θα μπει στο βαθύτερο φιλοσοφικό ερώτημα για το πώς μπορούμε πραγματικά να αποδείξουμε την αιτιότητα χωρίς αμφιβολία. Αυτό για άλλη μια φορά.

Τουλάχιστον τώρα γνωρίζετε ότι - παρόλο που δύο συμβάντα ή μεταβλητές μπορεί να φαίνονται να σχετίζονται - αυτό δεν σημαίνει ότι το ένα έχει άμεση αιτιώδη επίδραση στο άλλο.