Liste des Groupes | Revenir à fct tex |
DF>> Le tri des caractères accentués français requiert l'option -u de
DF>> xindex qui force l'utilisation de l'algorithme UCA.Ah... Il serait du coup souhaitable que lorsque l'une ou l'autre des>
options :
- `-l fr` ;
- `-l *`, le français étant détecté comme langue par défaut,
l'option `-u` soit automatiquement activée.
J'ai prévu un fichier xindex-french.lua qui, utilisé avec la commande :
>
xindex -c french monfichier
>
force les options -u (et des options spécifiques au français,
cf. ci-dessous) ainsi que "-l fr" (cette dernière pouvant quand même
être écrasée par une autre option /explicite/ "-l de" par exemple.
Denis : j'y ai inclus tes suppressions des tirets pour les sous-item
et supprimé les abréviations « sq. » et « sqq. ».
Les préférences (en début de fichier)
sont bien documentées et facilement modifiables par l'utilisateur, je
pense à une version perso du fichier xindex-french.lua à placer dans
le dossier courant ou dans le $TEXMHOME ou $TEXMFLOCAL.
>Je pense pouvoir proposer à Michal sous quelques jours une
implémentation /expérimentale/ des options [accents backward] et
[alternate shifted] (pour les tirets, espaces, apostrophes) de
l'algorithme UCA.
C'est presque prêt, encore quelques tests à faire… Herbert m'a fait
savoir qu'il est débordé en ce moment, il ne devrait pas pouvoir
travailler sérieusement sur xindex avant un mois ou deux, patience
donc !
Excellente nouvelle : merci ! Les listes `alphabet_lower` et>
`alphabet_upper` auraient-elles alors encore raison d'être dans le
fichier `xindex-fr.lua ` ?
Oui, quand même. Il ne faut pas se cacher que recourir à UCA ne
s'impose que si on a des mots accentués à trier (ou des mots avec
apostrophe, tiret, etc.), c'est ça qui impose le tri à plusieurs
(quatre en fait !) niveaux.
Sinon, un tri simple (sans -u) peut suffire et sera *beaucoup* plus
rapide ;-). C'est pourquoi, j'ai prévu, dans mon fichier
xindex-french.lua la possibilité de /ne pas/ recourir à UCA (une ligne
à mettre en commentaire).
Même avec UCA, les listes `alphabet_lower` et `alphabet_upper` sont
utilisées (mais marginalement).
Les messages affichés proviennent d'usenet.