skip to main | skip to sidebar
Code 18
Manuel du savoir-faire à l'usage des geeks et des curieux
RSS
  • Accueil
  • Le web au Québec
  • Liens
  • Twitter
  • Facebook
  • À propos

mercredi 3 février 2010

Supprimer les doublons dans SQL Server

Publié par Infinite Loop, à 21 h 00 2 commentaires

Un client nous a envoyé une liste de ses contacts dans le but de les importer dans un de nos systèmes. En recevant le fichier, mon chargé de projet a jeté un coup d'oeil et a remarqué qu'il comportait de nombreux doublons. Il m'a suggéré d'utiliser un tableur comme Excel pour faire le ménage de la liste et éliminer les duplicatas pour que chaque adresse courriel demeure unique.

À vrai dire, je ne maîtrise pas tout à fait les formules Excel alors mon réflexe de programmeur a été d'importer la liste dans une table temporaire de la base de données et d'évaluer combien d'enregistrements s'y retrouvent plus d'une fois :

SELECT email, count(*)
FROM contacts
GROUP BY email
HAVING count(*) > 1
En créant la table temporaire, j'ai pris soin d'ajouter une clé primaire IDENTITY(1,1) pour pouvoir en tirer profit au moment de la suppression.
DELETE c1
FROM contacts c1, contacts c2
WHERE c1.email = c2.email
AND c1.id > c2.id
Comme la séquence de la clé primaire id s'incrémente pour chaque enregistrement au moment de l'importation, je peux m'en servir pour supprimer les enregistrements identiques trouvés avec le produit croisé effectué sur la table elle-même.

Ainsi, deux enregistrements possédant la même clé email auront deux identificateurs différents :
id   name      email
100 code 18 code18.blogspot@gmail.com
200 code 18 code18.blogspot@gmail.com
Pour chaque combinaison, seul celui dont l'ID est le plus petit sera conservé et les autres seront retirés. Sur une table déjà existante, j'aurais plutôt eu tendance à comparer le champ de date de création ou de modification afin de ne conserver que le plus récent.


Tags: SQL Server

2 réponses à "Supprimer les doublons dans SQL Server"

  1. Anonyme a dit...
    18 juillet 2013 à 09 h 48

    tout simplement parfait

    merci

    Wassim AZZOUZI a dit...
    8 octobre 2013 à 10 h 04

    Une autre solution est d'utiliser ROW_NUMBER ()
    Supprimer les lignes dupliquées d'une table SQL Server


Publier un commentaire

Message plus récent Messages plus anciens Accueil
S'abonner à : Publier des commentaires (Atom)
    Suivre @code18 sur Twitter

    Catégories

    • Apache (21)
    • Citations (167)
    • Club Vidéo (24)
    • Coffre à outils (56)
    • CSS (8)
    • Curiosités (117)
    • Design Pattern (2)
    • Drupal (8)
    • Easter Eggs (22)
    • Extensions Firefox (20)
    • GIMP (7)
    • Histoire (21)
    • HTML (32)
    • Humour (57)
    • Intégration (34)
    • iPod (12)
    • JavaScript (110)
    • Jeu de combat (6)
    • Le coin du geek (128)
    • Liens (12)
    • Linux (56)
    • Livres (78)
    • Lois et principes (46)
    • Marché des saveurs (26)
    • Mathématique (18)
    • Mobile (5)
    • Montréal (32)
    • Musique (112)
    • Pancartes et écriteaux (16)
    • Perl (8)
    • Pérou (1)
    • PHP (130)
    • PostgreSQL (44)
    • Programmation (105)
    • Saviez-vous que (55)
    • Sécurité (22)
    • SEO (5)
    • SQL Server (22)
    • Vieilles publicités (6)
    • Virtualisation (8)
    • Voyages (1)
    • Zend Framework (26)

    Divers

    Archives

    • ►  2015 (6)
      • ►  août 2015 (1)
      • ►  juillet 2015 (1)
      • ►  février 2015 (3)
      • ►  janvier 2015 (1)
    • ►  2014 (8)
      • ►  décembre 2014 (1)
      • ►  novembre 2014 (1)
      • ►  octobre 2014 (1)
      • ►  août 2014 (2)
      • ►  juillet 2014 (2)
      • ►  janvier 2014 (1)
    • ►  2013 (53)
      • ►  décembre 2013 (2)
      • ►  novembre 2013 (1)
      • ►  octobre 2013 (3)
      • ►  septembre 2013 (2)
      • ►  août 2013 (5)
      • ►  juillet 2013 (3)
      • ►  juin 2013 (5)
      • ►  mai 2013 (3)
      • ►  avril 2013 (7)
      • ►  mars 2013 (7)
      • ►  février 2013 (11)
      • ►  janvier 2013 (4)
    • ►  2012 (105)
      • ►  décembre 2012 (8)
      • ►  novembre 2012 (5)
      • ►  octobre 2012 (4)
      • ►  septembre 2012 (1)
      • ►  août 2012 (8)
      • ►  juillet 2012 (7)
      • ►  juin 2012 (7)
      • ►  mai 2012 (10)
      • ►  avril 2012 (13)
      • ►  mars 2012 (15)
      • ►  février 2012 (15)
      • ►  janvier 2012 (12)
    • ►  2011 (146)
      • ►  décembre 2011 (14)
      • ►  novembre 2011 (11)
      • ►  octobre 2011 (12)
      • ►  septembre 2011 (13)
      • ►  août 2011 (15)
      • ►  juillet 2011 (17)
      • ►  juin 2011 (18)
      • ►  mai 2011 (15)
      • ►  avril 2011 (9)
      • ►  mars 2011 (7)
      • ►  février 2011 (3)
      • ►  janvier 2011 (12)
    • ▼  2010 (398)
      • ►  décembre 2010 (29)
      • ►  novembre 2010 (28)
      • ►  octobre 2010 (32)
      • ►  septembre 2010 (34)
      • ►  août 2010 (22)
      • ►  juillet 2010 (35)
      • ►  juin 2010 (42)
      • ►  mai 2010 (36)
      • ►  avril 2010 (37)
      • ►  mars 2010 (34)
      • ▼  février 2010 (32)
        • Comment dépenser 100$ de vins en 3 minutes
        • Citation no. 71 sur l'emploi
        • Comment expliquer REST à sa femme
        • L'informatique, comme la mécanique
        • Propriétaire d'une fonction Postgres
        • Le Parfum de Süskind - Fin alternative
        • JSONP pour récupérer des données distantes
        • Cacher les erreurs PHP en production
        • Citation no. 70 sur les vertus d'un programmeur
        • Nouveau look de Code 18
        • Des visiteurs d'un peu partout
        • Vider un select box en JavaScript
        • Pourquoi les programmeurs ont des rages de sucre?
        • Intégrer une carte Bing Maps
        • IBM Glass Engine
        • Voir Back to the Future d'une autre façon
        • Faits saillants d'une soirée atypique
        • Citation no. 69 sur la culture
        • Konami Code sur PHP.net
        • Résultat au test de geek
        • Processeur ultra-performant !
        • Écouteurs de contrefaçon
        • Transférer un profil utilisateur à PayPal
        • Noms de familles qui se terminent par LX
        • Erreur sur la personne
        • Citation no. 68 sur l'optimisation du code
        • Aliss de Patrick Senécal
        • Spécial du vendredi : Chewbacca
        • Wine : exécuter un logiciel Windows sous Linux
        • Supprimer les doublons dans SQL Server
        • Conclusion Vidéotron
        • Valeur par défaut d'un champ SQL Server
      • ►  janvier 2010 (37)
    • ►  2009 (430)
      • ►  décembre 2009 (32)
      • ►  novembre 2009 (34)
      • ►  octobre 2009 (33)
      • ►  septembre 2009 (37)
      • ►  août 2009 (37)
      • ►  juillet 2009 (39)
      • ►  juin 2009 (38)
      • ►  mai 2009 (37)
      • ►  avril 2009 (35)
      • ►  mars 2009 (37)
      • ►  février 2009 (32)
      • ►  janvier 2009 (39)
    • ►  2008 (84)
      • ►  décembre 2008 (34)
      • ►  novembre 2008 (39)
      • ►  octobre 2008 (11)

    Abonnés

Copyright © All Rights Reserved. Code 18 | Converted into Blogger Templates by Theme Craft