Παρόλο που η καμπύλη φαίνεται ίδια, ποια είναι η διαφορά μεταξύ της κατανομής Cauchy και Gaussian;


Απάντηση 1:

Ο Cauchy δεν μοιάζει με κανονικό. Πώς ακριβώς φαίνεται ένα Cauchy εξαρτάται από τις παραμέτρους που χρησιμοποιείτε, αλλά δεν φαίνεται φυσιολογικό.

π.χ.

(1000, 0, 1) x2 <- rnorm (1000, μέση (x1), sd (x1)) γραφική παράσταση (πυκνότητα (x1) (x2))

Μην κοιτάτε τα ίδια καθόλου. Και το x1 κυμαίνεται από -178 έως 702 ενώ το x2 μεταβαίνει από -76 σε 71.


Απάντηση 2:

Όπως μπορείτε να δείτε, οι δύο καμπύλες φαίνονται παρόμοιες, καθώς και οι δύο έχουν ένα μόνο "χτύπημα" και απλώνονται μικρότερες όσο μακρύτερα φτάνετε. Είναι διαφορετικά στο ότι ο Cauchy έχει μια πιο στενή κορυφή και εξαπλώνεται πιο αργά - υπάρχει μια πολύ μεγαλύτερη πιθανότητα απόκτησης τιμών μακριά από την κορυφή σε σύγκριση με την κανονική κατανομή. Αυτή η διαφορά αποδίδει πολλές διαφορετικές συνέπειες μαθηματικά - όπως το Cauchy που δεν έχει μια καλά καθορισμένη μέση τιμή και έχει μια ιδιότυπη κατανομή δειγματοληψίας όπου δεν ισχύει ο "νόμος μεγάλου αριθμού".


Απάντηση 3:

Παρόλο που η καμπύλη φαίνεται ίδια, ποια είναι η διαφορά μεταξύ της κατανομής Cauchy και Gaussian;

Εξαιρετικά, μοιάζουν παρόμοια. Αλλά μου δείξτε ένα γράφημα της συνάρτησης πυκνότητας μιας διανομής και πείτε μου ότι είναι είτε Cauchy είτε Gaussian, θα ήξερα ποια (αν υποτεθεί ότι ήταν πραγματικά ένα από αυτά). Ο Cauchy έχει πολύ μεγαλύτερες ουρές.

Όταν έχουμε μια οικογένεια διανομών με άγνωστες παραμέτρους, θέλουμε να εκτιμήσουμε αυτές τις παραμέτρους.

  • Η κατανομή Gauss έχει δύο παραμέτρους, τη μέση και την τυπική απόκλιση. Θα μπορούσαμε να χρησιμοποιήσουμε και άλλες παραμέτρους, για παράδειγμα το μέσο (το οποίο είναι ίσο με το μέσο όρο) και το ημι-διακταριτιδικό εύρος (που είναι περίπου
  • 0.67450.6745
  • φορές από την τυπική απόκλιση). Ο μέσος όρος της κατανομής Cauchy δεν υπάρχει, αλλά ο διάμεσος είναι το κέντρο συμμετρίας. Η τυπική απόκλιση δεν υπάρχει ούτε, αλλά ο μέσος όρος των τετραγωνικών αποκλίσεων από το διάμεσο είναι άπειρος.

Αυτή είναι η μεγάλη διαφορά. Μπορούμε να πάρουμε τις παραμέτρους της διανομής ως μέση και ημισυνεκτακλεπική κλίμακα, αλλά δεν μπορούμε να χρησιμοποιήσουμε τη μέση και τυπική απόκλιση για το Cauchy καθώς δεν υπάρχουν.

Όταν λαμβάνουμε ένα δείγμα για να μας βοηθήσουν να εκτιμήσουμε τις παραμέτρους της κατανομής, υπολογίζουμε στατιστικά στοιχεία όπως η μέση και η τυπική απόκλιση των τιμών του δείγματος. Αυτά τα στατιστικά στοιχεία έχουν διανομές. Η κατανομή μιας στατιστικής δειγματοληψίας είναι γνωστή ως κατανομή της δειγματοληψίας.

  • Αν η κατανομή του πληθυσμού είναι Gaussian (η κατανομή δειγματοληψίας) του μέσου του δείγματος είναι επίσης Gaussian και έχει μια πολύ μικρότερη τυπική απόκλιση, έτσι ένα μεγάλο δείγμα δίνει ακριβέστερες εκτιμήσεις από μόνο λαμβάνοντας μια παρατήρηση. Αν η κατανομή είναι Cauchy, η ο μέσος δείκτης έχει επίσης μια κατανομή Cauchy, αλλά έχει ακριβώς την ίδια μεσαία και ημι-διακρυσταλλική κλίμακα με την αρχική κατανομή. Δεν υπάρχει κανένα όφελος στη λήψη του μέσου ενός δείγματος.

Αυτή είναι μια άλλη διαφορά. Ο μέσος όρος ενός δείγματος από το Gaussian είναι χρήσιμος για την εκτίμηση του μέσου (ή του μέσου). ο μέσος όρος ενός δείγματος για το Cauchy είναι άχρηστο για την εκτίμηση του μέσου όρου. Είναι καλύτερα να χρησιμοποιήσετε το διάμεσο δείγμα, το οποίο δίνει ακριβέστερες εκτιμήσεις.

Παρόμοια επιχειρήματα ισχύουν και για την εκτίμηση της εξάπλωσης (ωστόσο το καθορίζετε) κάθε διανομής. Οι συνήθεις εκτιμήσεις για μια Gaussian κατανομή δεν λειτουργούν για μια κατανομή Cauchy.

Η πραγματική διαφορά είναι στον μαθηματικό τύπο για την πυκνότητα. Σε τυπική μορφή ο Gaussian έχει πυκνότητα

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

και η Cauchy έχει πυκνότητα

1π(1+z2)\frac1{\pi(1+z^2)}

.

Σημειώστε ότι οι δύο

zz

s είναι διαφορετικά. Στην πρώτη περίπτωση η τυπική απόκλιση είναι

11

, στη δεύτερη περίπτωση το ανώτερο τεταρτημόριο είναι

11

.

Η συνάρτηση κατανομής (η πιθανότητα ότι

ZzZ\le z

) δεν έχει μια τακτοποιημένη κλειστή μορφή για τη διανομή Gauss, αλλά κάνει για το Cauchy, είναι

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Εάν θέλετε να γράψετε τις κατανομές στους ίδιους άξονες για να δείτε τη διαφορά, πρέπει να ταιριάξετε τις παραμέτρους. Έτσι θα τυποποιήσω τον Gaussian έτσι ώστε να είναι τα κατώτερα και ανώτερα τεταρτημόρια

0.6745-0.6745

και

0.67450.6745

, δηλ. να είναι ίση με την τυπική απόκλιση

1.48261.4826

και χρησιμοποιήστε την τυποποιημένη φόρμα για το Cauchy. Οι περιοχές κάτω από τα γραφήματα πρέπει να είναι ίσες, έτσι ώστε τα ύψη στο κέντρο να είναι κατάλληλα κλιμακωτά (

0.2690.269

για τους Γκαουσιανούς και

0.3180.318

για το Cauchy - ο Cauchy είναι ψηλότερος στη μέση και υψηλότερος στις ουρές).