Sujet : Re: Petite statistique
De : xanax-doux (at) *nospam* chez.moi.invalid (Sh. Mandrake)
Groupes : fr.lettres.langue.francaiseDate : 16. Jan 2024, 21:50:33
Autres entêtes
Organisation : <http://pasdenom.info/news.html>
Message-ID : <uo6q6q$l9a$1@rasp.pasdenom.info>
References : 1
User-Agent : Mozilla Thunderbird
Le 16/01/2024 21:33:07, par la barbe du Prophète,
ram@zedat.fu-berlin.de(Stefan Ram) a écrit :
Je viens d'écrire un petit programme de statistiques qui évalue la
fréquence des mots dans les messages de ce newsgroup au cours des
dernières années. (Afin d'exclure les messages spam en anglais, je
n'ai pris en compte pour l'instant que les posts de certains noms
d'expéditeurs réguliers).
La particularité de mon programme est qu'il prend également
en compte les signes de ponctuation, les combinaisons de
plusieurs mots (Par exemple : « 9492 'de la' », voir plus bas)
ainsi que les combinaisons de plusieurs signes de ponctuation
(Par exemple : « 5661 '".' », voir plus bas).
C'est utile pour l'apprentissage du français, car cela permet de
savoir quelles expressions sont particulièrement fréquentes et
valent donc la peine d'être apprises.
(Le programme distingue les majuscules et les minuscules, donc
« vous » et « Vous » sont considérés comme deux mots différents.
Si une combinaison comme "y a" est comptée, chacun des deux mots
"y" et "a" est en outre compté une fois de plus séparément).
Suivent les 212 lignes jusqu'à « il y a » :
[...]
Intéressant. Mais en quoi est-ce utile pour l'apprentissage du français ?
-- UbuntuLe Magicien