Supprimer automatiquement les lignes en double dans Excel

Excel est une application polyvalente qui s’est développée bien au-delà de ses premières versions en tant que simple solution de feuille de calcul. Employés comme archiviste, carnet d’adresses, outil de prévision et bien plus encore, de nombreuses personnes utilisent même Excel d’une manière qui n’a jamais été voulue.

Si vous utilisez beaucoup Excel à la maison ou au bureau, vous savez que parfois les fichiers Excel peuvent rapidement devenir difficiles à manier en raison du grand nombre d’enregistrements avec lesquels vous travaillez.

Heureusement, Excel dispose de fonctions intégrées pour vous aider à trouver et à supprimer les enregistrements en double. Malheureusement, il y a quelques mises en garde à l’utilisation de ces fonctions, alors soyez prudent ou vous pouvez supprimer sans le savoir des enregistrements que vous n’aviez pas l’intention de supprimer. En outre, les deux méthodes ci-dessous suppriment instantanément les doublons sans vous permettre de voir ce qui a été supprimé.

Je mentionnerai également un moyen de mettre en évidence les lignes qui sont dupliquées en premier, afin que vous puissiez voir celles qui seront supprimées par les fonctions avant de les exécuter. Vous devez utiliser une règle de mise en forme conditionnelle personnalisée pour mettre en évidence une ligne entièrement dupliquée.

Fonction Supprimer les doublons

Supposons que vous utilisez Excel pour garder une trace des adresses et que vous pensez avoir des enregistrements en double. Regardez l’exemple de feuille de calcul Excel ci-dessous:

Supprimer les enregistrements Excel en double

Notez que l’enregistrement «Jones» apparaît deux fois. Pour supprimer ces enregistrements en double, cliquez sur le Les données sur le ruban et localisez le Supprimer les doublons fonction sous le Outils de données section. Cliquer sur Supprimer les doublons et une nouvelle fenêtre s’ouvre.

Cliquez sur le bouton Supprimer les doublons

Ici, vous devez prendre une décision en fonction de l’utilisation d’étiquettes d’en-tête en haut de vos colonnes. Si vous le faites, sélectionnez l’option intitulée Mes données ont des en-têtes. Si vous n’utilisez pas d’étiquettes d’en-tête, vous utiliserez les désignations de colonne standard d’Excel, telles que la colonne A, la colonne B, etc.

Options de suppression des enregistrements en double Excel

Pour cet exemple, nous allons choisir la colonne A uniquement et cliquer sur le bouton D’accord bouton. La fenêtre d’options se ferme et Excel supprime le deuxième enregistrement «Jones».

Excel a supprimé l'enregistrement en double

Bien sûr, ce n’était qu’un simple exemple. Tous les enregistrements d’adresses que vous conservez à l’aide d’Excel sont probablement beaucoup plus compliqués. Supposons, par exemple, que vous ayez un fichier d’adresses qui ressemble à ceci.

Enregistrements en double du carnet d'adresses Excel

Notez que bien qu’il existe trois enregistrements «Jones», seuls deux sont identiques. Si nous utilisions les procédures ci-dessus pour supprimer les enregistrements en double, une seule entrée «Jones» resterait. Dans ce cas, nous devons étendre nos critères de décision pour inclure à la fois le prénom et le nom de famille trouvés dans les colonnes A et B respectivement.

Pour ce faire, cliquez à nouveau sur le Les données onglet sur le ruban puis cliquez sur Supprimer les doublons. Cette fois, lorsque la fenêtre d’options apparaît, choisissez les colonnes A et B. Cliquez sur le bouton D’accord et notez que cette fois, Excel n’a supprimé qu’un seul des enregistrements «Mary Jones».

En effet, nous avons demandé à Excel de supprimer les doublons en faisant correspondre les enregistrements en fonction des colonnes A et B plutôt que de la seule colonne A. Plus vous choisissez de colonnes, plus il faut remplir de critères avant qu’Excel considère un enregistrement comme un doublon. Choisissez toutes les colonnes si vous souhaitez supprimer les lignes complètement dupliquées.

Plus d'options lors de la suppression des doublons

Excel vous donnera un message vous indiquant combien de doublons ont été supprimés. Cependant, il ne vous montrera pas quelles lignes ont été supprimées! Faites défiler jusqu’à la dernière section pour voir comment mettre en évidence les lignes en double avant d’exécuter cette fonction.

1607789217 504 Supprimer automatiquement les lignes en double dans

Méthode de filtrage avancée

La deuxième façon de supprimer les doublons consiste à utiliser l’option de filtre avancé. Tout d’abord, sélectionnez toutes les données de la feuille. Ensuite, sur l’onglet Données du ruban, cliquez sur Avancée dans le Trier et filtrer section.

1607789217 804 Supprimer automatiquement les lignes en double dans

Dans la boîte de dialogue qui apparaît, assurez-vous de vérifier Enregistrements uniques uniquement case à cocher.

1607789217 624 Supprimer automatiquement les lignes en double dans

Vous pouvez filtrer la liste sur place ou copier les éléments non dupliqués dans une autre partie de la même feuille de calcul. Pour une raison étrange, vous ne pouvez pas copier les données sur une autre feuille. Si vous le souhaitez sur une autre feuille, choisissez d’abord un emplacement sur la feuille actuelle, puis coupez et collez ces données dans une nouvelle feuille.

Avec cette méthode, vous n’obtenez même pas de message indiquant le nombre de lignes supprimées. Les lignes sont supprimées et c’est tout.

Mettez en surbrillance les lignes en double dans Excel

Si vous voulez voir quels enregistrements sont en double avant de les supprimer, vous devez effectuer un peu de travail manuel. Malheureusement, Excel ne dispose pas d’un moyen de mettre en évidence les lignes entièrement dupliquées. Il a une fonctionnalité sous la mise en forme conditionnelle qui met en évidence les cellules en double, mais cet article concerne les lignes en double.

La première chose à faire est d’ajouter une formule dans une colonne à droite de votre ensemble de données. La formule est simple: il suffit de concaténer toutes les colonnes de cette ligne ensemble.

= A1 & B1 & C1 & D1 & E1

Dans mon exemple ci-dessous, j’ai des données dans les colonnes A à F. Cependant, la première colonne est un numéro d’identification, donc j’exclus cela de ma formule ci-dessous. Assurez-vous d’inclure toutes les colonnes contenant des données sur lesquelles vous souhaitez vérifier les doublons.

1607789217 140 Supprimer automatiquement les lignes en double dans

J’ai mis cette formule dans la colonne H, puis je l’ai fait glisser vers le bas pour toutes mes lignes. Cette formule combine simplement toutes les données de chaque colonne en un seul gros morceau de texte. Maintenant, sautez quelques colonnes supplémentaires et entrez la formule suivante:

=COUNTIF($H$1:$H$34, $H1) > 1

Ici, nous utilisons la fonction COUNTIF et le premier paramètre est l’ensemble de données que nous voulons examiner. Pour moi, c’était la colonne H (qui a la formule de combinaison de données) de la ligne 1 à 34. C’est aussi une bonne idée de se débarrasser de la ligne d’en-tête avant de faire cela.

Vous voudrez également vous assurer d’utiliser le signe dollar ($) devant la lettre et le chiffre. Si vous avez 1000 lignes de données et que votre formule de ligne combinée est dans la colonne F, par exemple, votre formule ressemblerait à ceci à la place:

=COUNTIF($F$1:$F$1000, $F1) > 1

Le deuxième paramètre n’a que le signe dollar devant la lettre de la colonne, ce qui est verrouillé, mais nous ne voulons pas verrouiller le numéro de ligne. Encore une fois, vous allez le faire glisser vers le bas pour toutes vos lignes de données. Cela devrait ressembler à ceci et les lignes dupliquées devraient avoir TRUE.

1607789217 36 Supprimer automatiquement les lignes en double dans

Maintenant, mettons en évidence les lignes qui contiennent TRUE car ce sont les lignes en double. Tout d’abord, sélectionnez la feuille de calcul entière de données en cliquant sur le petit triangle à l’intersection en haut à gauche des lignes et des colonnes. Allez maintenant dans l’onglet Accueil, puis cliquez sur Mise en forme conditionnelle et cliquez sur Nouvelle règle.

1607789217 646 Supprimer automatiquement les lignes en double dans

Dans la boîte de dialogue, cliquez sur Utilisez une formule pour déterminer les cellules à mettre en forme.

1607789218 515 Supprimer automatiquement les lignes en double dans

Dans la boîte sous Mettez en forme les valeurs où cette formule est vraie:, entrez la formule suivante en remplaçant P avec votre colonne qui a les valeurs TRUE ou FALSE. Assurez-vous d’inclure le signe dollar devant la lettre de la colonne.

=$P1=TRUE

Une fois que vous avez fait cela, cliquez sur Format et cliquez sur l’onglet Remplir. Choisissez une couleur qui sera utilisée pour mettre en évidence toute la ligne dupliquée. Cliquez sur OK et vous devriez maintenant voir les lignes en double sont mises en évidence.

1607789218 627 Supprimer automatiquement les lignes en double dans

Si cela n’a pas fonctionné pour vous, recommencez et recommencez lentement. Cela doit être fait exactement comme il faut pour que tout cela fonctionne. Si vous manquez un seul symbole $ en cours de route, cela ne fonctionnera pas correctement.

Mises en garde concernant la suppression des enregistrements en double

Il y a, bien sûr, quelques problèmes pour laisser Excel supprimer automatiquement les enregistrements en double pour vous. Tout d’abord, vous devez faire attention à ne pas choisir trop ou trop peu de colonnes à utiliser par Excel comme critère d’identification des enregistrements en double.

Trop peu et vous risquez de supprimer par inadvertance les enregistrements dont vous avez besoin. Trop de colonnes d’identifiant ou y compris par accident et aucun doublon ne sera trouvé.

Deuxièmement, Excel suppose toujours que le premier enregistrement unique rencontré est l’enregistrement principal. Tous les enregistrements ultérieurs sont supposés être des doublons. Cela pose un problème si, par exemple, vous ne parvenez pas à modifier l’adresse de l’une des personnes de votre fichier, mais que vous créez un nouvel enregistrement.

Si le nouvel enregistrement d’adresse (correcte) apparaît après l’ancien enregistrement (obsolète), Excel supposera que le premier enregistrement (obsolète) est le maître et supprimera tous les enregistrements suivants qu’il trouve. C’est pourquoi vous devez faire attention à la manière dont vous laissez Excel décider de ce qui est ou non un enregistrement en double.

Dans ces cas, vous devez utiliser la méthode de duplication de surbrillance sur laquelle j’ai écrit et supprimer manuellement l’enregistrement en double approprié.

Enfin, Excel ne vous demande pas de vérifier si vous souhaitez vraiment supprimer un enregistrement. En utilisant les paramètres que vous choisissez (colonnes), le processus est complètement automatisé. Cela peut être une chose dangereuse lorsque vous avez un grand nombre d’enregistrements et que vous êtes convaincu que les décisions que vous avez prises étaient correctes et que vous autorisez Excel à supprimer automatiquement les enregistrements en double pour vous.

Assurez-vous également de consulter notre article précédent sur la suppression des lignes vides dans Excel. Prendre plaisir!