Bonjour,
Je réalise un programme qui me permet de lister dans un fichier csv les doublons présent dans un fichier XML.
J'ai commencé à réaliser mon code les résultats en sortie fonctionne, sauf que ma méthode ne doit pas être la bonne car pour parser 90 000 lignes il prend plus d'une heure, et encore le fichier final fera dans les 150 000 lignes, j'ai pas envie que ça prenne la journée...
En gros je crée une list sans doublon et je compare mon fichier XML ligne par ligne et je parse autant de fois que de lignes de la list sans doublons.
Ma question est de savoir si il y a une méthode de tri pour extraire mes doublons sans à devoir à parser mon XML des milliers de fois, je me dis que la fonction "Distinct.count" sort très rapidement le nombre de non doublons alors pourquoi pas les lister tout aussi rapidement ?
Merci
Ps: je débute :D