You've just exported a spreadsheet from QuickBooks, Sage, or your CRM. You open it up and right away you notice duplicates, dates in three different formats, accented names that turned into gibberish, and dollar amounts mixed in with plain numbers.

If that sounds familiar, you're definitely not alone. Messy data is probably the most common thing stopping people from doing reliable analysis, and it eats up hours of manual work every week.

In this guide, we'll go through the five most common data problems in Excel and CSV files, show you what they actually look like, and walk you through how each one gets fixed automatically in seconds.

Vous venez d'exporter un fichier Excel depuis QuickBooks, Sage, ou votre CRM. Vous l'ouvrez et tout de suite, vous remarquez des doublons, des dates dans trois formats différents, des noms accentués transformés en charabia, et des montants mélangés avec des chiffres ordinaires.

Si ça vous dit quelque chose, vous n'êtes vraiment pas seul. Les données mal formatées sont probablement le frein numéro un à toute analyse fiable, et ça gruge des heures de travail manuel chaque semaine.

Dans ce guide, on va passer en revue les cinq problèmes les plus fréquents dans les fichiers Excel et CSV, vous montrer à quoi ils ressemblent concrètement, et vous expliquer comment chacun se corrige automatiquement en quelques secondes.

1. Hidden Duplicate Rows

1. Les doublons cachés

Duplicates are sneaky. Two rows can look identical but actually differ by an invisible trailing space or a capitalization mismatch. Excel's built-in filters won't catch these.

Les doublons sont sournois. Deux lignes peuvent sembler identiques, mais en réalité elles diffèrent par un espace invisible à la fin ou par une majuscule de trop. Les filtres intégrés d'Excel ne les détecteront pas.

BeforeAvant
NameNom EmailCourriel AmountMontant
Jane Smith[email protected]1,200.00
Jane Smith [email protected]1,200.00
Marc Dupont[email protected]850.00
JANE SMITH[email protected]1,200.00
Li Wei[email protected]3,400.00

Rows 2 and 4 are duplicates of Row 1, hidden by a trailing space and uppercase.

Les lignes 2 et 4 sont des doublons de la ligne 1, cachés par un espace final et une majuscule.

AfterAprès
NameNom EmailCourriel AmountMontant
Jane Smith[email protected]1,200.00
Marc Dupont[email protected]850.00
Li Wei[email protected]3,400.00

2 duplicates removed. Only unique rows remain.

2 doublons supprimés. Il ne reste que les lignes uniques.

CleanSheet trims whitespace and normalizes text before comparing rows, so it catches duplicates that Excel's built-in "Remove Duplicates" misses.

CleanSheet retire les espaces et normalise le texte avant de comparer les lignes. Il détecte donc les doublons que la fonction « Supprimer les doublons » d'Excel laisse passer.

2. Garbled Text (Encoding Issues)

2. Texte corrompu (problèmes d'encodage)

You open a CSV and see "émilie" instead of "Émilie", or "Café" instead of "Café". This happens when a file saved in UTF-8 gets opened as Latin-1 (or the other way around). It's really common with exports from accounting software and government portals.

Vous ouvrez un CSV et vous voyez « émilie » au lieu de « Émilie », ou « Café » au lieu de « Café ». Ça arrive quand un fichier enregistré en UTF-8 est ouvert en Latin-1 (ou l'inverse). C'est très courant avec les exports de logiciels comptables et de portails gouvernementaux.

BeforeAvant
EmployeeEmployé DepartmentDépartement CityVille
Émilie TremblayComptabilitéMontréal
René GagnéRessources humainesQuébec
Sarah JohnsonMarketingToronto

Accented characters are corrupted. This is a classic UTF-8 / Latin-1 mojibake issue.

Les caractères accentués sont corrompus. C'est un problème classique de mojibake UTF-8 / Latin-1.

AfterAprès
EmployeeEmployé DepartmentDépartement CityVille
Émilie TremblayComptabilitéMontréal
René GagnéRessources humainesQuébec
Sarah JohnsonMarketingToronto

All garbled characters restored to their correct Unicode form.

Tous les caractères corrompus sont restaurés dans leur forme Unicode correcte.

CleanSheet maps corrupted byte sequences back to the correct Unicode characters. It covers the most common mojibake patterns you'll find in Canadian and European data exports.

CleanSheet reconvertit les séquences d'octets corrompues vers les bons caractères Unicode. Il couvre les cas de mojibake les plus courants dans les exports de données canadiens et européens.

3. Inconsistent Date Formats

3. Formats de dates incohérents

Is "03/04/2025" March 4th or April 3rd? When your file mixes US and European date formats, or has text dates like "March 4, 2025" sitting next to "2025-03-04", you can't trust any analysis you run on it.

« 03/04/2025 », c'est le 4 mars ou le 3 avril? Quand votre fichier mélange des formats de dates américains et européens, ou contient des dates en texte comme « March 4, 2025 » à côté de « 2025-03-04 », impossible de faire confiance à vos analyses.

BeforeAvant
InvoiceFacture Date AmountMontant
INV-00103/04/20251,500
INV-002March 15, 20252,300
INV-0032025-03-22980
INV-00415/03/20254,100
INV-00504-03-25750

Five rows, four different date formats. Sorting or filtering is impossible.

Cinq lignes, quatre formats de dates différents. Impossible de trier ou de filtrer.

AfterAprès
InvoiceFacture Date AmountMontant
INV-0012025-03-041,500
INV-0022025-03-152,300
INV-0032025-03-22980
INV-0042025-03-154,100
INV-0052025-03-04750

All dates standardized to ISO 8601 (YYYY-MM-DD). Sortable, filterable, unambiguous.

Toutes les dates sont normalisées en ISO 8601 (AAAA-MM-JJ). Triable, filtrable, sans ambiguïté.

CleanSheet lets you choose your date region (US, Europe, or auto-detect) so ambiguous dates like "03/04/2025" are interpreted correctly. Every date is converted to the universal YYYY-MM-DD format.

CleanSheet vous permet de choisir votre région (Amérique du Nord, Europe, ou détection automatique) pour que les dates ambiguës comme « 03/04/2025 » soient interprétées correctement. Toutes les dates sont converties au format universel AAAA-MM-JJ.

4. Messy Number and Currency Formats

4. Formats de chiffres et devises en désordre

When you pull data from different countries or different software, number formats collide. Some use periods as decimal separators, others use commas. Throw in currency symbols, thousands separators, and the occasional text value in a numeric column, and your calculations break without warning.

Quand vous tirez des données de différents pays ou logiciels, les formats de chiffres entrent en collision. Certains utilisent le point comme séparateur décimal, d'autres la virgule. Ajoutez les symboles de devises, les séparateurs de milliers et un texte qui se glisse dans une colonne numérique, et vos calculs plantent sans avertissement.

BeforeAvant
ItemArticle PricePrix QuantityQuantité
Widget A$1,234.56100
Widget B€2.500,00fifty
Widget C3 450,75 $200
Widget D1234.575

Mixed currency symbols, decimal styles, and text in a numeric column.

Symboles de devises mélangés, styles de décimales variés et du texte dans une colonne numérique.

AfterAprès
ItemArticle PricePrix QuantityQuantité
Widget A1234.56100
Widget B2500.00fifty
Widget C3450.75200
Widget D1234.5075

Currency symbols stripped, decimals normalized, numbers rounded to 2 places.

Symboles de devises retirés, décimales normalisées, chiffres arrondis à 2 décimales.

CleanSheet handles both North American (1,234.56) and European (1.234,56) number formats. It strips currency symbols and converts everything to clean, calculation-ready numbers.

CleanSheet gère aussi bien les formats nord-américains (1,234.56) qu'européens (1.234,56). Il retire les symboles de devises et convertit tout en chiffres propres, prêts pour le calcul.

5. Extra Spaces, Inconsistent Capitalization, and Special Characters

5. Espaces en trop, majuscules incohérentes et caractères spéciaux

Leading spaces, trailing spaces, double spaces between words, "JOHN DOE" right next to "john doe"... these seem like small things, but they break lookups, deduplication, and pivot tables all the time.

Des espaces au début, des espaces à la fin, des espaces doubles entre les mots, « JOHN DOE » juste à côté de « john doe »... ça peut sembler anodin, mais ça brise les recherches, la déduplication et les tableaux croisés dynamiques à tout coup.

BeforeAvant
CustomerClient PhoneTéléphone EmailCourriel
  JOHN DOE  5551234567JOHN.DOE @EXAMPLE.COM
jane smith(555) 123-4567[email protected]
Marc™ Dupont555.123.4567marc@example .com

Extra spaces, inconsistent case, special symbols, and varied phone formats.

Espaces en trop, casse incohérente, symboles spéciaux et formats de téléphone variés.

AfterAprès
CustomerClient PhoneTéléphone EmailCourriel
John Doe(555) 123-4567[email protected]
Jane Smith(555) 123-4567[email protected]
Marc Dupont(555) 123-4567[email protected]

Text trimmed, proper case applied, phones standardized, emails lowercased, symbols removed.

Texte nettoyé, casse corrigée, téléphones standardisés, courriels en minuscules, symboles retirés.

CleanSheet does all of this in one pass: trims whitespace, normalizes text case, formats phone numbers, cleans up emails, and strips special characters like ™ and ©.

CleanSheet fait tout ça en une seule passe : retire les espaces, normalise la casse, formate les numéros de téléphone, nettoie les courriels et supprime les caractères spéciaux comme ™ et ©.

How CleanSheet Works: 3 Steps

Comment fonctionne CleanSheet : 3 étapes

1

Upload Your File

Drag and drop any Excel (.xlsx, .xls) or CSV file. No account needed, no sign-up. Your file stays on your device and is never uploaded to any server.

2

Choose What to Clean

Pick the cleaning options you want: remove duplicates, fix encoding, standardize dates, clean numbers, normalize text, and more. CleanSheet turns on the most useful ones by default so you can just hit "Clean" right away.

3

Download Your Clean File

Within seconds, CleanSheet shows you exactly what changed, with a full before/after comparison and a detailed cleaning report. Then you download the cleaned file as CSV, Excel, PDF, or JSON.

1

Téléchargez votre fichier

Glissez-déposez n'importe quel fichier Excel (.xlsx, .xls) ou CSV. Pas besoin de compte ni d'inscription. Votre fichier reste sur votre appareil et n'est jamais envoyé à un serveur.

2

Choisissez quoi nettoyer

Sélectionnez les options de nettoyage que vous voulez : supprimer les doublons, corriger l'encodage, standardiser les dates, nettoyer les chiffres, normaliser le texte, et plus encore. CleanSheet active les options les plus utiles par défaut, alors vous n'avez qu'à cliquer sur « Nettoyer ».

3

Téléchargez votre fichier propre

En quelques secondes, CleanSheet vous montre exactement ce qui a changé, avec une comparaison avant/après complète et un rapport détaillé. Ensuite, vous téléchargez le fichier nettoyé en CSV, Excel, PDF ou JSON.

Bonus: Smart Pattern Detection

Bonus : Détection intelligente de motifs

On top of the automatic fixes, CleanSheet has a Smart Detection engine. It looks at each column and figures out its type (email, phone, date, URL, zip code) and then spots anomalies: values that don't fit the pattern of their column.

En plus des corrections automatiques, CleanSheet possède un moteur de Détection intelligente. Il analyse chaque colonne pour déterminer son type (courriel, téléphone, date, URL, code postal), puis repère les anomalies : les valeurs qui ne cadrent pas avec le motif de leur colonne.

Say 95% of a column has valid email addresses but one row just says "john@". CleanSheet will flag that and suggest a fix. You review each suggestion and decide what to do. Nothing gets changed without you saying so.

Disons que 95 % d'une colonne contient des adresses courriel valides, mais qu'une ligne affiche simplement « john@ ». CleanSheet va signaler ce cas et suggérer une correction. Vous examinez chaque suggestion et décidez quoi faire. Rien ne change sans votre approbation.

Your data never leaves your browser. Vos données ne quittent jamais votre navigateur.

CleanSheet runs 100% in your browser using JavaScript. No files are uploaded, no data is transmitted, no account is required. Your spreadsheet stays on your computer the entire time.

CleanSheet fonctionne à 100 % dans votre navigateur en JavaScript. Aucun fichier n'est téléversé, aucune donnée n'est transmise, aucun compte n'est requis. Votre fichier reste sur votre ordinateur du début à la fin.

Stop Cleaning Spreadsheets by Hand

Arrêtez de nettoyer vos fichiers à la main

We've all been there: scrolling through rows, writing TRIM formulas, doing find-and-replace over and over. It's slow, easy to mess up, and honestly pretty boring. CleanSheet takes care of the five most common cleaning tasks in seconds, and gives you a transparent report showing every single change it made.

On est tous passés par là : défiler des lignes, écrire des formules TRIM, faire des chercher-remplacer à répétition. C'est lent, facile de se tromper, et franchement assez ennuyant. CleanSheet prend en charge les cinq tâches de nettoyage les plus courantes en quelques secondes et vous fournit un rapport transparent qui montre chaque changement effectué.

Try CleanSheet for Free

Clean up to 100 rows for free. No sign-up, no installation, and your data never leaves your browser.

Essayez CleanSheet gratuitement

Nettoyez jusqu'à 100 lignes gratuitement. Pas d'inscription, pas d'installation, et vos données ne quittent jamais votre navigateur.