Καταργήστε διπλές σειρές δεδομένων στο Excel

01 από 02

Καταργήστε τις διπλές εγγραφές δεδομένων στο Excel

Καταργήστε διπλότυπα - Αναζητήστε ταυτόσημα αρχεία ανά όνομα πεδίου. © Ted French

Τα προγράμματα υπολογιστικών φύλλων , όπως το Excel, χρησιμοποιούνται συχνά ως βάσεις δεδομένων για πράγματα όπως καταλόγους ανταλλακτικών, αρχεία πωλήσεων και λίστες αλληλογραφίας.

Οι βάσεις δεδομένων στο Excel αποτελούνται από πίνακες δεδομένων που συνήθως οργανώνονται σε σειρές δεδομένων που ονομάζονται εγγραφές.

Σε μια εγγραφή, τα δεδομένα σε κάθε κελιά ή πεδίο στη σειρά σχετίζονται - όπως το όνομα, η διεύθυνση και ο αριθμός τηλεφώνου της εταιρείας.

Ένα κοινό πρόβλημα που παρουσιάζεται ως βάση δεδομένων μεγαλώνει σε μέγεθος είναι αυτό των διπλών εγγραφών ή σειρών δεδομένων.

Αυτή η επανάληψη μπορεί να συμβεί αν:

Είτε έτσι είτε αλλιώς, οι διπλότυπες εγγραφές μπορούν να προκαλέσουν μια σειρά από προβλήματα - όπως η αποστολή πολλαπλών αντιγράφων εγγράφων στο ίδιο άτομο όταν οι πληροφορίες βάσης δεδομένων χρησιμοποιούνται σε συγχώνευση αλληλογραφίας - γι 'αυτό είναι καλή ιδέα να σαρώσετε και να αφαιρέσετε διπλές εγγραφές σε τακτική βάση.

Και ενώ είναι εύκολο να διαλέξουμε διπλές εγγραφές σε ένα μικρό δείγμα όπως αυτό στην παραπάνω εικόνα, οι πίνακες δεδομένων θα μπορούσαν εύκολα να περιέχουν εκατοντάδες αν όχι χιλιάδες εγγραφές καθιστώντας πολύ δύσκολο να διαλέξουμε διπλές εγγραφές - ειδικά μερικώς αντιστοιχούσες εγγραφές.

Για να καταστεί ευκολότερη η πραγματοποίηση αυτής της εργασίας, το Excel διαθέτει ενσωματωμένο εργαλείο δεδομένων το οποίο αποκαλείται, όπως είναι αναμενόμενο, το Remove Duplicates , το οποίο μπορεί να χρησιμοποιηθεί για την εύρεση και αφαίρεση πανομοιότυπων και εν μέρει ταιριαστών αρχείων.

Ωστόσο, ο τρόπος με τον οποίο έχει σχεδιαστεί το εργαλείο Κατάργηση διπλότυπων , πανομοιότυπα και εν μέρει αντίστοιχα αρχεία πρέπει να αντιμετωπιστούν χωριστά.

Αυτό οφείλεται στο γεγονός ότι το παράθυρο διαλόγου Κατάργηση διπλότυπων εμφανίζει τα ονόματα πεδίων για τον επιλεγμένο πίνακα δεδομένων και επιλέγετε τα πεδία που πρέπει να συμπεριλάβετε στην αναζήτηση αντιστοιχιών εγγραφών:

Ονόματα πεδίων και γράμματα στηλών

Όπως αναφέρθηκε, το εργαλείο Κατάργηση διπλότυπων αποτελείται από ένα παράθυρο διαλόγου όπου επιλέγετε τα αντίστοιχα πεδία για αναζήτηση, ελέγχοντας τα επιθυμητά ονόματα πεδίων ή στηλών.

Οι πληροφορίες που εμφανίζει το παράθυρο διαλόγου - ονόματα πεδίων ή γράμματα στηλών - εξαρτώνται από το αν τα δεδομένα σας περιέχουν μια σειρά από επικεφαλίδες - ή κεφαλίδες - στην κορυφή του πίνακα δεδομένων, όπως φαίνεται στην παραπάνω εικόνα.

Αν το κάνει - βεβαιωθείτε ότι η επιλογή στη δεξιά πλευρά του παραθύρου διαλόγου - Τα δεδομένα μου έχει κεφαλίδες - είναι απενεργοποιημένη και το Excel θα εμφανίσει τα ονόματα αυτής της σειράς ως ονόματα πεδίων στο παράθυρο διαλόγου.

Εάν τα δεδομένα σας δεν έχουν μια σειρά κεφαλίδας, το παράθυρο διαλόγου θα εμφανίσει τα κατάλληλα γράμματα στη στήλη διαλόγου για το επιλεγμένο εύρος δεδομένων.

Συνεχή σειρά δεδομένων

Για να λειτουργεί σωστά το εργαλείο Κατάργηση διπλότυπων , ο πίνακας δεδομένων πρέπει να είναι ένα συνεχόμενο εύρος δεδομένων - δηλαδή δεν πρέπει να υπάρχουν κενές σειρές, στήλες και, αν είναι δυνατόν, δεν υπάρχουν κενά κελιά τοποθετημένα μέσα στον πίνακα.

Το να μην έχετε κενά μέσα σε έναν πίνακα δεδομένων είναι μια καλή πρακτική όταν πρόκειται για τη διαχείριση δεδομένων γενικά και όχι μόνο όταν ψάχνετε για διπλότυπα δεδομένα. Τα άλλα εργαλεία δεδομένων του Excel - όπως η ταξινόμηση και το φιλτράρισμα - λειτουργούν καλύτερα όταν ο πίνακας δεδομένων είναι ένα συνεχόμενο εύρος δεδομένων.

Καταργήστε το παράδειγμα διπλής καταγραφής δεδομένων

Στην παραπάνω εικόνα, ο πίνακας δεδομένων περιέχει δύο πανομοιότυπες εγγραφές για τον A. Thompson και δύο μερικές αντιστοιχίες για τον R. Holt - όπου όλα τα πεδία ταιριάζουν εκτός από τον αριθμό φοιτητή.

Τα παρακάτω βήματα περιγράφουν λεπτομερώς πώς μπορείτε να χρησιμοποιήσετε το εργαλείο " Κατάργηση διπλότυπων ":

  1. Καταργήστε τη δεύτερη από τις δύο πανομοιότυπες εγγραφές για τον A. Thompson.
  2. Αφαιρέστε τη δεύτερη μερική αντιστοιχία εγγραφής για τον R. Holt.

Ανοίγοντας το πλαίσιο διαλόγου Κατάργηση διπλότυπων

  1. Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στη βάση δεδομένων δείγματος.
  2. Κάντε κλικ στην καρτέλα Δεδομένα στην κορδέλα.
  3. Κάντε κλικ στο εικονίδιο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το πλαίσιο διαλόγου Κατάργηση διπλότυπων .
  4. Το παράθυρο διαλόγου " Κατάργηση διπλότυπων " εμφανίζει όλες τις επικεφαλίδες στηλών ή τα ονόματα πεδίων από το δείγμα δεδομένων μας
  5. Τα σύμβολα ελέγχου δίπλα στα ονόματα πεδίων υποδεικνύουν ποιες στήλες το Excel θα προσπαθήσει να ταιριάξει κατά την αναζήτηση διπλών εγγραφών
  6. Από προεπιλογή, όταν ανοίξει το παράθυρο διαλόγου, όλα τα ονόματα πεδίων έχουν απενεργοποιηθεί

Εύρεση ταυτόσημων αρχείων

  1. Δεδομένου ότι ψάχνουμε για εντελώς πανομοιότυπες εγγραφές σε αυτό το παράδειγμα, θα αφήσουμε όλες τις επικεφαλίδες της στήλης να ελεγχθούν
  2. Κάντε κλικ στο κουμπί OK

Σε αυτό το σημείο πρέπει να δούμε τα ακόλουθα αποτελέσματα:

02 του 02

Εντοπίστε και καταργήστε τις εν μέρει αντιστοιχούσες εγγραφές με την κατάργηση διπλότυπων

Κατάργηση διπλότυπων - Αναζήτηση για μερικές αντιστοιχίσεις εγγραφών ανά όνομα πεδίου. © Ted French

Έλεγχος ενός πεδίου κάθε φορά

Δεδομένου ότι το Excel αφαιρεί μόνο τις εγγραφές δεδομένων που ταιριάζουν ακριβώς με τα επιλεγμένα πεδία δεδομένων, ο καλύτερος τρόπος για να βρείτε όλες τις εν μέρει αντιστοιχισμένες εγγραφές δεδομένων είναι να αφαιρέσετε το σημάδι ελέγχου μόνο για ένα πεδίο τη φορά, όπως γίνεται στα παρακάτω βήματα.

Οι επακόλουθες αναζητήσεις για αρχεία που ταιριάζουν σε όλα τα πεδία, εκτός από το όνομα, την ηλικία ή το πρόγραμμα, θα αφαιρέσουν όλους τους πιθανούς συνδυασμούς για την μερική αντιστοιχία εγγραφών.

Εύρεση εγγραφών που ταιριάζουν εν μέρει

  1. Κάντε κλικ σε οποιοδήποτε κελί που περιέχει δεδομένα στον πίνακα δεδομένων, εάν είναι απαραίτητο
  2. Κάντε κλικ στην καρτέλα Δεδομένα στην κορδέλα .
  3. Κάντε κλικ στο εικονίδιο Κατάργηση διπλότυπων για να επισημάνετε όλα τα δεδομένα στον πίνακα δεδομένων και για να ανοίξετε το πλαίσιο διαλόγου Κατάργηση διπλότυπων .
  4. Επιλέγονται όλα τα ονόματα πεδίων ή επικεφαλίδες στηλών για τον πίνακα δεδομένων.
  5. Για να εντοπίσετε και να καταργήσετε αρχεία που δεν έχουν αντιστοιχία σε κάθε πεδίο, καταργήστε το σημάδι ελέγχου εκτός από τα ονόματα πεδίων που πρέπει να αγνοήσει το Excel.
  6. Για αυτό το παράδειγμα, κάντε κλικ στο πλαίσιο ελέγχου δίπλα στην επικεφαλίδα της στήλης ID σπουδαστών για να αφαιρέσετε το σημάδι επιλογής.
  7. Το Excel θα πραγματοποιήσει μόνο αναζήτηση και κατάργηση εγγραφών που έχουν αντίστοιχα δεδομένα στα πεδία " Ονοματεπώνυμο" , " Αρχικό " και " Πρόγραμμα" .
  8. Κάντε κλικ στο κουμπί OK
  9. Το παράθυρο διαλόγου θα πρέπει να κλείσει και να αντικατασταθεί από ένα μήνυμα λέγοντας: 1 διπλές τιμές βρέθηκαν και αφαιρέθηκαν. Διατηρούνται 6 μοναδικές τιμές.
  10. Η σειρά που περιέχει τη δεύτερη εγγραφή για τον R. Holt με το Student ID του ST348-252 θα έχει αφαιρεθεί από τη βάση δεδομένων.
  11. Κάντε κλικ στο OK για να κλείσετε το πλαίσιο μηνύματος

Σε αυτό το σημείο, ο πίνακας δεδομένων παραδειγμάτων πρέπει να είναι απαλλαγμένος από όλα τα διπλάσια δεδομένα.