01 από 02
Καταργήστε τις διπλές εγγραφές δεδομένων στο Excel
Τα προγράμματα υπολογιστικών φύλλων , όπως το Excel, χρησιμοποιούνται συχνά ως βάσεις δεδομένων για πράγματα όπως καταλόγους ανταλλακτικών, αρχεία πωλήσεων και λίστες αλληλογραφίας.
Οι βάσεις δεδομένων στο Excel αποτελούνται από πίνακες δεδομένων που συνήθως οργανώνονται σε σειρές δεδομένων που ονομάζονται εγγραφές.
Σε μια εγγραφή, τα δεδομένα σε κάθε κελιά ή πεδίο στη σειρά σχετίζονται - όπως το όνομα, η διεύθυνση και ο αριθμός τηλεφώνου της εταιρείας.
Ένα κοινό πρόβλημα που παρουσιάζεται ως βάση δεδομένων μεγαλώνει σε μέγεθος είναι αυτό των διπλών εγγραφών ή σειρών δεδομένων.
Αυτή η επανάληψη μπορεί να συμβεί αν:
- Πλήρη αρχεία εισάγονται στη βάση δεδομένων περισσότερες από μία φορές με αποτέλεσμα δύο ή περισσότερες πανομοιότυπες εγγραφές
- Πολλαπλές εγγραφές έχουν ένα ή περισσότερα πεδία - όπως όνομα και διεύθυνση - που περιέχουν τα ίδια δεδομένα.
Είτε έτσι είτε αλλιώς, οι διπλότυπες εγγραφές μπορούν να προκαλέσουν μια σειρά από προβλήματα - όπως η αποστολή πολλαπλών αντιγράφων εγγράφων στο ίδιο άτομο όταν οι πληροφορίες βάσης δεδομένων χρησιμοποιούνται σε συγχώνευση αλληλογραφίας - γι 'αυτό είναι καλή ιδέα να σαρώσετε και να αφαιρέσετε διπλές εγγραφές σε τακτική βάση.
Και ενώ είναι εύκολο να διαλέξουμε διπλές εγγραφές σε ένα μικρό δείγμα όπως αυτό στην παραπάνω εικόνα, οι πίνακες δεδομένων θα μπορούσαν εύκολα να περιέχουν εκατοντάδες αν όχι χιλιάδες εγγραφές καθιστώντας πολύ δύσκολο να διαλέξουμε διπλές εγγραφές - ειδικά μερικώς αντιστοιχούσες εγγραφές.
Για να καταστεί ευκολότερη η πραγματοποίηση αυτής της εργασίας, το Excel διαθέτει ενσωματωμένο εργαλείο δεδομένων το οποίο αποκαλείται, όπως είναι αναμενόμενο, το Remove Duplicates , το οποίο μπορεί να χρησιμοποιηθεί για την εύρεση και αφαίρεση πανομοιότυπων και εν μέρει ταιριαστών αρχείων.
Ωστόσο, ο τρόπος με τον οποίο έχει σχεδιαστεί το εργαλείο Κατάργηση διπλότυπων , πανομοιότυπα και εν μέρει αντίστοιχα αρχεία πρέπει να αντιμετωπιστούν χωριστά.
Αυτό οφείλεται στο γεγονός ότι το παράθυρο διαλόγου Κατάργηση διπλότυπων εμφανίζει τα ονόματα πεδίων για τον επιλεγμένο πίνακα δεδομένων και επιλέγετε τα πεδία που πρέπει να συμπεριλάβετε στην αναζήτηση αντιστοιχιών εγγραφών:
- Για πανομοιότυπα αρχεία, αναζητήστε όλα τα πεδία - αφήστε τα σημάδια ελέγχου δίπλα σε όλα τα ονόματα των στηλών ή πεδίων.
- Για καταχωρίσεις που ταιριάζουν μερικώς - αφήστε τα σημάδια ελέγχου δίπλα μόνο στα πεδία που αντιστοιχούν.
Ονόματα πεδίων και γράμματα στηλών
Όπως αναφέρθηκε, το εργαλείο Κατάργηση διπλότυπων αποτελείται από ένα παράθυρο διαλόγου όπου επιλέγετε τα αντίστοιχα πεδία για αναζήτηση, ελέγχοντας τα επιθυμητά ονόματα πεδίων ή στηλών.
Οι πληροφορίες που εμφανίζει το παράθυρο διαλόγου - ονόματα πεδίων ή γράμματα στηλών - εξαρτώνται από το αν τα δεδομένα σας περιέχουν μια σειρά από επικεφαλίδες - ή κεφαλίδες - στην κορυφή του πίνακα δεδομένων, όπως φαίνεται στην παραπάνω εικόνα.
Αν το κάνει - βεβαιωθείτε ότι η επιλογή στη δεξιά πλευρά του παραθύρου διαλόγου - Τα δεδομένα μου έχει κεφαλίδες - είναι απενεργοποιημένη και το Excel θα εμφανίσει τα ονόματα αυτής της σειράς ως ονόματα πεδίων στο παράθυρο διαλόγου.
Εάν τα δεδομένα σας δεν έχουν μια σειρά κεφαλίδας, το παράθυρο διαλόγου θα εμφανίσει τα κατάλληλα γράμματα στη στήλη διαλόγου για το επιλεγμένο εύρος δεδομένων.
Συνεχή σειρά δεδομένων
Για να λειτουργεί σωστά το εργαλείο Κατάργηση διπλότυπων , ο πίνακας δεδομένων πρέπει να είναι ένα συνεχόμενο εύρος δεδομένων - δηλαδή δεν πρέπει να υπάρχουν κενές σειρές, στήλες και, αν είναι δυνατόν, δεν υπάρχουν κενά κελιά τοποθετημένα μέσα στον πίνακα.
Το να μην έχετε κενά μέσα σε έναν πίνακα δεδομένων είναι μια καλή πρακτική όταν πρόκειται για τη διαχείριση δεδομένων γενικά και όχι μόνο όταν ψάχνετε για διπλότυπα δεδομένα. Τα άλλα εργαλεία δεδομένων του Excel - όπως η ταξινόμηση και το φιλτράρισμα - λειτουργούν καλύτερα όταν ο πίνακας δεδομένων είναι ένα συνεχόμενο εύρος δεδομένων.
Καταργήστε το παράδειγμα διπλής καταγραφής δεδομένων
Στην παραπάνω εικόνα, ο πίνακας δεδομένων περιέχει δύο πανομοιότυπες εγγραφές για τον A. Thompson και δύο μερικές αντιστοιχίες για τον R. Holt - όπου όλα τα πεδία ταιριάζουν εκτός από τον αριθμό φοιτητή.
Τα παρακάτω βήματα περιγράφουν λεπτομερώς πώς μπορείτε να χρησιμοποιήσετε το εργαλείο " Κατάργηση διπλότυπων ":
- Καταργήστε τη δεύτερη από τις δύο πανομοιότυπες εγγραφές για τον A. Thompson.
- Αφαιρέστε τη δεύτερη μερική αντιστοιχία εγγραφής για τον R. Holt.
Ανοίγοντας το πλαίσιο διαλόγου Κατάργηση διπλότυπων
- Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στη βάση δεδομένων δείγματος.
- Κάντε κλικ στην καρτέλα Δεδομένα στην κορδέλα.
- Κάντε κλικ στο εικονίδιο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το πλαίσιο διαλόγου Κατάργηση διπλότυπων .
- Το παράθυρο διαλόγου " Κατάργηση διπλότυπων " εμφανίζει όλες τις επικεφαλίδες στηλών ή τα ονόματα πεδίων από το δείγμα δεδομένων μας
- Τα σύμβολα ελέγχου δίπλα στα ονόματα πεδίων υποδεικνύουν ποιες στήλες το Excel θα προσπαθήσει να ταιριάξει κατά την αναζήτηση διπλών εγγραφών
- Από προεπιλογή, όταν ανοίξει το παράθυρο διαλόγου, όλα τα ονόματα πεδίων έχουν απενεργοποιηθεί
Εύρεση ταυτόσημων αρχείων
- Δεδομένου ότι ψάχνουμε για εντελώς πανομοιότυπες εγγραφές σε αυτό το παράδειγμα, θα αφήσουμε όλες τις επικεφαλίδες της στήλης να ελεγχθούν
- Κάντε κλικ στο κουμπί OK
Σε αυτό το σημείο πρέπει να δούμε τα ακόλουθα αποτελέσματα:
- Το παράθυρο διαλόγου θα πρέπει να κλείσει και να αντικατασταθεί από ένα μήνυμα λέγοντας: 1 διπλές τιμές βρέθηκαν και αφαιρέθηκαν. Διατηρούνται 7 μοναδικές τιμές.
- Η σειρά που περιέχει την διπλότυπη εγγραφή του A. Thompson θα έχει αφαιρεθεί από τη βάση δεδομένων
- Παρόλο που υπάρχουν δύο εγγραφές μερικής αντιστοιχίας για τον R. Holt, επειδή δεν συμφωνούν όλα τα πεδία - ο αριθμός σπουδαστών για τα δύο αρχεία διαφέρει - το Excel θεωρεί ότι είναι ένα μοναδικό αρχείο δεδομένων
02 του 02
Εντοπίστε και καταργήστε τις εν μέρει αντιστοιχούσες εγγραφές με την κατάργηση διπλότυπων
Έλεγχος ενός πεδίου κάθε φορά
Δεδομένου ότι το Excel αφαιρεί μόνο τις εγγραφές δεδομένων που ταιριάζουν ακριβώς με τα επιλεγμένα πεδία δεδομένων, ο καλύτερος τρόπος για να βρείτε όλες τις εν μέρει αντιστοιχισμένες εγγραφές δεδομένων είναι να αφαιρέσετε το σημάδι ελέγχου μόνο για ένα πεδίο τη φορά, όπως γίνεται στα παρακάτω βήματα.
Οι επακόλουθες αναζητήσεις για αρχεία που ταιριάζουν σε όλα τα πεδία, εκτός από το όνομα, την ηλικία ή το πρόγραμμα, θα αφαιρέσουν όλους τους πιθανούς συνδυασμούς για την μερική αντιστοιχία εγγραφών.
Εύρεση εγγραφών που ταιριάζουν εν μέρει
- Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στον πίνακα δεδομένων, εάν είναι απαραίτητο
- Κάντε κλικ στην καρτέλα Δεδομένα στην κορδέλα .
- Κάντε κλικ στο εικονίδιο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το πλαίσιο διαλόγου Κατάργηση διπλότυπων .
- Επιλέγονται όλα τα ονόματα πεδίων ή επικεφαλίδες στηλών για τον πίνακα δεδομένων.
- Για να εντοπίσετε και να καταργήσετε αρχεία που δεν έχουν αντιστοιχία σε κάθε πεδίο, καταργήστε το σημάδι ελέγχου εκτός από τα ονόματα πεδίων που πρέπει να αγνοήσει το Excel.
- Για αυτό το παράδειγμα, κάντε κλικ στο πλαίσιο ελέγχου δίπλα στην επικεφαλίδα της στήλης ID σπουδαστών για να αφαιρέσετε το σημάδι επιλογής.
- Το Excel θα πραγματοποιήσει μόνο αναζήτηση και κατάργηση εγγραφών που έχουν αντίστοιχα δεδομένα στα πεδία " Ονοματεπώνυμο" , " Αρχικό " και " Πρόγραμμα" .
- Κάντε κλικ στο κουμπί OK
- Το παράθυρο διαλόγου θα πρέπει να κλείσει και να αντικατασταθεί από ένα μήνυμα λέγοντας: 1 διπλές τιμές βρέθηκαν και αφαιρέθηκαν. Διατηρούνται 6 μοναδικές τιμές.
- Η σειρά που περιέχει τη δεύτερη εγγραφή για τον R. Holt με το Student ID του ST348-252 θα έχει αφαιρεθεί από τη βάση δεδομένων.
- Κάντε κλικ στο OK για να κλείσετε το πλαίσιο μηνύματος
Σε αυτό το σημείο, ο πίνακας δεδομένων παραδειγμάτων πρέπει να είναι απαλλαγμένος από όλα τα διπλάσια δεδομένα.