Σχηματισμός, Δευτεροβάθμια εκπαίδευση και τα σχολεία
Πλησιέστερου γείτονα μέθοδο: παράδειγμα της εργασίας
ο πλησιέστερος γείτονας μέθοδος είναι ο ευκολότερος μετρική ταξινομητής ο οποίος βασίζεται στην αξιολόγηση της ομοιότητας των διαφορετικών αντικειμένων.
Αναλύονται αντικείμενο ανήκει στην κατηγορία στην οποία ανήκουν τα θέματα του δείγματος εκπαίδευσης. Ας μάθουμε ποια είναι η πλησιέστερη γείτονα. Προσπαθήστε να καταλάβετε το περίπλοκο θέμα, παραδείγματα των διαφορετικών τεχνικών.
μέθοδος υπόθεση
πλησιέστερο γείτονα μέθοδος μπορεί να θεωρηθεί ως η πιο κοινή αλγόριθμο που χρησιμοποιείται για την ταξινόμηση. Αντικείμενο υποβάλλονται σε κατάταξη ανήκει στην κατηγορία y_i, στην οποία το πιο κοντινό αντικείμενο την εκμάθηση x_i δείγμα.
Η εξειδίκευση των μεθόδων τους κοντινότερους γείτονές
k πλησιέστερου γείτονα μέθοδος μπορεί να βελτιώσει την ακρίβεια της ταξινόμησης. Αναλύθηκε αντικείμενο ανήκει στην ίδια κατηγορία με το μεγαλύτερο μέρος των γειτόνων της, δηλαδή, k κοντά σε αυτό αντικείμενα της αναλύθηκε x_i δείγμα. Στην επίλυση των προβλημάτων με δύο κατηγορίες ο αριθμός των γειτόνων θα είναι περίεργο να αποφευχθεί μια κατάσταση ασάφειας, αν ο ίδιος αριθμός των γειτόνων θα ανήκουν σε διαφορετικές κατηγορίες.
Η τεχνική των αιωρούμενων γείτονες
PostgreSQL-ανάλυση μέθοδο tsvector κοντινότερους γείτονές χρησιμοποιείται όταν ο αριθμός των τάξεων τουλάχιστον τρεις, και δεν μπορείτε να χρησιμοποιήσετε ένα μονό αριθμό. Αλλά ασάφεια προκύπτει ακόμα και σε αυτές τις περιπτώσεις. Στη συνέχεια, το i-οστό γείτονα παίρνει w_i βάρους, η οποία μειώνεται με το βαθμό γείτονα i. Αναφέρεται στην κατηγορία του αντικειμένου, το οποίο θα έχει μέγιστο συνολικό βάρος μεταξύ κοντινοί γείτονες.
Η υπόθεση του συμπαγούς
Στην καρδιά όλων των ανωτέρω μεθόδων είναι η υπόθεση του συμπαγούς. Προτείνει μια σχέση μεταξύ του μέτρου της ομοιότητας των αντικειμένων και ότι ανήκουν στην ίδια κατηγορία. Σε αυτήν την περίπτωση, το όριο μεταξύ των διαφόρων τύπων είναι μια απλή μορφή, και να δημιουργήσουν τάξεις των αντικειμένων στο χώρο συμπαγές κινητό περιοχή. Κάτω από αυτές τις περιοχές σε μαθηματική ανάλυση νοείται ένα κλειστό φραγμένο σύνολο. Αυτή η υπόθεση δεν έχει σχέση με την καθημερινή αντίληψη της λέξης.
Ο βασικός τύπος
Ας εξετάσουμε πιο κοντινότερο γείτονα. Εάν η προτεινόμενη εκπαίδευση σε τύπο δείγματος «αντικείμενο-απόκρισης» Χ ^ m = \ {(x_1, y_1), \ τελείες, (x_m, y_m) \}? εάν ένα πλήθος αντικειμένων να καθορίσει την απόσταση συνάρτηση \ rho (Χ, Χ «), η οποία αντιπροσωπεύεται με τη μορφή ενός επαρκούς μοντέλου ομοιότητα των αντικειμένων αυξάνοντας την τιμή της συνάρτησης μειώνεται ομοιότητα μεταξύ αντικειμένων Χ, Χ».
Για οποιοδήποτε αντικείμενο, u θα κατασκευάσει ένα δείγμα εκπαίδευσης αντικείμενα x_i με την αύξηση αποστάσεις με u:
\ Rho (u, x_ {1? Υ}) \ Leq \ rho (u, x_ {2? Υ}) \ Leq \ cdots \ Leq \ rho (u, x_ {m? U}),
όπου x_ {i? u} χαρακτηρίζει το δείγμα εκμάθησης αντικείμενο, το οποίο είναι το i-th αντικείμενο προέλευσης γείτονα u. Τέτοια σημειογραφία και η χρήση να απαντήσουν σε i-th γείτονα: y_ {i? u}. Ως εκ τούτου, θεωρούμε ότι οποιοδήποτε αντικείμενο u προκαλεί αναρίθμηση δική του δείγματος.
Προσδιορισμός του αριθμού k των γειτόνων
πλησιέστερο γείτονα μέθοδο όταν k = 1 είναι σε θέση να δώσει μια εσφαλμένη κατάταξη, όχι μόνο σε αντικείμενα-εκπομπές, αλλά και για άλλες κατηγορίες που βρίσκονται κοντά.
Αν πάρουμε k = m, ο αλγόριθμος θα είναι τόσο σταθερό και θα εκφυλιστεί σε μια σταθερή τιμή. Αυτός είναι ο λόγος για τον οποίο η αξιοπιστία είναι σημαντικό να αποφεύγεται η ακραία δείκτες k.
Στην πράξη, όπως χρησιμοποιείται ο βέλτιστος δείκτης k κριτήριο συρόμενη ελέγχου.
εκπομπές προβολές
Τα αντικείμενα της μελέτης είναι σε μεγάλο βαθμό άνιση, αλλά ανάμεσά τους υπάρχουν και εκείνοι που έχουν τα χαρακτηριστικά μιας τάξης και αναφέρονται ως πρότυπα. Στην εγγύτητα του θέματος με το ιδανικό μοντέλο της υψηλής πιθανότητας του ανήκουν σε αυτή την κατηγορία.
Πώς rezultativen μέθοδος πλησιέστερους γείτονες; Ένα παράδειγμα μπορεί να δει κανείς στη βάση των περιφερειακών και μη πληροφοριακές κατηγορίες αντικειμένων. Υποτίθεται πυκνό περιβάλλον του αντικειμένου άλλων εκπροσώπων αυτής της κατηγορίας. Όταν τα αφαιρέσετε από την κατάταξη της δειγματοληψίας της ποιότητας δεν θα υποφέρει.
Πάρτε σε ένα ορισμένο αριθμό δειγμάτων μπορεί εκρήξεις του θορύβου που είναι «επί τόπου» της κατηγορίας. Η κατάργηση ουσιαστικά θετικό αντίκτυπο στην ποιότητα της ταξινόμησης.
Αν το δείγμα που λαμβάνεται από τους μη κατατοπιστική και την εξάλειψη των αντικειμένων θόρυβο, μπορείτε να υπολογίζετε σε μερικά θετικά αποτελέσματα την ίδια στιγμή.
Η πρώτη μέθοδος παρεμβολής του στο πλησιέστερο κατάταξης γείτονα επιτρέπει τη βελτίωση της ποιότητας, να μειώσει το ποσό των αποθηκευμένων δεδομένων, να μειώσει το χρόνο της κατάταξης, που δαπανάται για την επιλογή των επόμενων πρότυπα.
Η χρήση των υπερ-μεγάλα δείγματα
πλησιέστερο γείτονα μέθοδος βασίζεται στην πραγματική αποθήκευση των αντικειμένων μάθησης. Για να δημιουργήσετε πολύ δείγματα μεγάλης κλίμακας χρησιμοποιώντας ένα τεχνικό πρόβλημα. Ο στόχος δεν είναι μόνο να σώσει ένα σημαντικό ποσό των πληροφοριών, αλλά και στο ελάχιστο χρονικό διάστημα για να έχουν χρόνο για να βρει οποιοδήποτε αντικείμενο u k μεταξύ των πλησιέστερων γειτόνων.
Για να αντιμετωπίσει αυτό το έργο, οι δύο μέθοδοι που χρησιμοποιούνται:
- λεπτό δείγμα μέσω ενός αντικείμενα εκκένωσης μη δεδομένων?
- αποτελεσματική χρήση ειδικής δομής δεδομένων και κωδικών για άμεση αναζήτηση των πλησιέστερων γειτόνων.
Κανόνες των μεθόδων επιλογής
Η παραπάνω ταξινόμηση θεωρήθηκε. Πλησιέστερα μέθοδος γείτονα χρησιμοποιείται στην επίλυση πρακτικών προβλημάτων, η οποία είναι γνωστή εκ των προτέρων η απόσταση λειτουργίας \ rho (Χ, Χ «). Περιγράφοντας αντικείμενα αριθμητικό φορείς χρησιμοποιούν ένα Ευκλείδειο μετρικό. Αυτή η επιλογή δεν έχει καμία ειδική αιτιολογία, αλλά περιλαμβάνει τη μέτρηση όλων των σημείων «στην ίδια κλίμακα.» Αν αυτός ο παράγοντας δεν λαμβάνεται υπόψη, τότε η μέτρηση θα κυριαρχούν η δυνατότητα που έχει υψηλότερο αριθμητικές τιμές.
Εάν υπάρχει ένα σημαντικό ποσό των χαρακτηριστικών, τον υπολογισμό της απόστασης ως το άθροισμα των αποκλίσεων σε συγκεκριμένα συμπτώματα εμφανίζονται σοβαρή διάσταση του προβλήματος.
Σε υψηλά χώρο διαστάσεων μακριά από το ένα το άλλο θα είναι όλα τα αντικείμενα. Τελικά, κάθε δείγμα θα είναι δίπλα στο αντικείμενο που σπούδασε k γείτονες. επιλεγεί ένας μικρός αριθμός ενημερωτικών χαρακτηριστικά για την εξάλειψη αυτού του προβλήματος. Αλγόριθμοι για τον υπολογισμό εκτιμήσεις βασίζονται στη βάση των διαφόρων συνόλων των σημείων, καθώς και για κάθε επιμέρους χτίσουν τη λειτουργία εγγύτητά τους.
συμπέρασμα
Μαθηματικούς υπολογισμούς συχνά περιλαμβάνουν τη χρήση μιας ποικιλίας τεχνικών που έχουν τα δικά τους ιδιαίτερα χαρακτηριστικά, πλεονεκτήματα και μειονεκτήματα. Προβεβλημένα πλησιέστερο μέθοδος γείτονα μπορεί να λύσει αρκετά σοβαρό πρόβλημα, λόγω των χαρακτηριστικών των μαθηματικών αντικειμένων. Η πειραματική έννοια, με βάση την ανάλυση μέθοδος χρησιμοποιείται ενεργά σε τεχνητή νοημοσύνη.
Στα έμπειρα συστήματα είναι απαραίτητο όχι μόνο για την ταξινόμηση των αντικειμένων, αλλά και να δείξει στον χρήστη μια εξήγηση του εν λόγω κατάταξη. Σε αυτή τη μέθοδο, μια εξήγηση αυτού του φαινομένου είναι εκφρασμένα σε σχέση με το αντικείμενο της συγκεκριμένης κατηγορίας, καθώς και θέση του σε σχέση με το δείγμα που χρησιμοποιείται. Οι ειδικοί νομικό κλάδο, οι γεωλόγοι, οι γιατροί, πάρτε αυτό το «προηγούμενο» λογική που χρησιμοποιούν ενεργά στην έρευνα τους.
Προκειμένου να αναλυθεί η μέθοδος ήταν η πιο αξιόπιστη, αποτελεσματική, δίνοντας τα επιθυμητά αποτελέσματα, θα πρέπει να λάβει ένα ελάχιστο όριο k, ενώ αποφεύγουν επίσης τις εκπομπές μεταξύ των αναλύονται αντικείμενα. Αυτός είναι ο λόγος για τον οποίο η χρήση των προτύπων και η μέθοδος επιλογής, καθώς και οι μετρήσεις βελτιστοποίησης.
Similar articles
Trending Now