Certes, 54% des vietnamiens ont « Nguyen » comme nom de famille. Mais cela ne suffit pas pour modéliser la loi de distribution des noms de famille au Vietnam et encore moins celle des prénoms. Pourtant, un tel modèle permet de prédire les probabilités de collisions signalétiques (homonymies) dans l’annuaire des employés d’une multinationale. Et le vietnam a cela d’intéressant qu’il s’agit sans doute de l’un des pays dans lesquels les probabilités de collisions signalétiques doivent être les plus importantes (puisque 54%…).
Voici quelques sources générales sur le sujet :
- un retour d’expérience utile pour comprendre les conventions de nommage en usage au Vietnam (document déjà cité dans un message précédent), voir également cette autre explication ou cette présentation plus générale des conventions de nommage à travers le monde en complément de mon ancien message à ce sujet
- une longue liste de prénoms vietnamiens masculins, féminins ou unisexes (mais sans indication de fréquence d’occurence), à comparer avec des listes similaires trouvées ailleurs
- un rapport d’étude trop succinct sur la base du système de la sécurité sociale américaine, qui mentionne le pays de naissance et donne la liste, par ordre décroissant de fréquence, des noms de famille des américains nés au Vietnam (entre autres)
- enfin, quelques données statistiques sur le noms de famille et le nom intercalaire, réunies par Patrick Fermi mais malheureusement trop peu de choses sur les prénoms
Alors que faire ? Je crois bien que je vais me résoudre à compter les vietnamiens un par un. Enfin presque… J’ai trouvé un annuaire téléphonique du Vietnam, en ligne. Il ne reste plus qu’à apprendre à Excel à aller taper dedans, à compter les fréquences d’apparition des noms de famille et des prénoms (ce qui suppose d’ailleurs de différencier les noms de familles, les noms intercalaires et les prénoms composés…). Le résultat devrait être intéressant. Je vous en dirai plus à l’occasion.
Tant que j’y suis, même si c’est hors sujet, voici un excellent argumentaire qui explique aux américains pourquoi il est stupide de croire que les noms des gens peuvent toujours se décomposer en « First Name », « Middle Name » et « Last Name ».