L'art de l'indexation

1. Apercu général
2. Détails des champs
  2.1. En-tête
  2.2. Histoires
  2.3. Quelles données lister?
3. Où trouver l'ensemble des informations sur Inducks?
4. La F.A.Q. Inducks

1. Apercu général

Voici l'index du "PM 1" (Picsou magazine 1) tel qu'indexé dans fr.dbi:

 

PM    1      h3 [issdate:1972-03] [price:2.50 FRF] [pages:116] [inx:OMi,FWi]
PM    1a    FC PM    1     1 c          RGu         [desc-fr:Picsou plante une pancarte devant son coffre-fort] [xapp:US]
PM    1p002 FC PM    1A    1 i          RGu         Le billet d'Oncle Picsou [desc-fr:Picsou tapant à la machine à écrire] [xapp:US]
PM    1p003 I AT  170-A   29        RCi GCh ?       Oncle Picsou contre tonton Soupic [xapp:DD,HDL,US]
PM    1p034 F PM----1-1    0q                       Enfin la super-surprise ! [xapp:US] [storyitem:$STORYITEM$]
PM    1p035 W DG   38-04  12                        Gontran et la tremblotte chronique [desc-fr:Picsou n'est pas vêtu de sa redingote] [hero:US,GL] [/tremblote n'a qu'un t (?)]
PM    1p051 W OS 1184-06   7                        Géo Trouvetou ou Géo Brisetou ? [desc-fr:Géo a mis au point une machine qui décuple la force physique]
PM    1p060 W MM   33-05   2                        Pluto [logo;My Picsou is rich] [lang:en]
PM    1p067 W MM   83-02  12                        Mickey et la fiesta de Pepitt City [xapp:GO,PE,MM]
PM    1p080 FC PM    1C    1 g                      Grand calme ou grand nerveux... ? [xapp:US]
PM    1p081 FC             1 g          RGu         Oui... mézou ?
PM    1p082aFC PM    1D    4 i                      [app:US,MM,DD,GY,BB(66),HLP,GD,Practical Pig,Fiddler Pig,MI,CL,GO,JW,PL] ["poster-puzzle" comportant 12 vignettes à coller]
PM    1p084 FC PM    1B    2 i                      Oncle Picsou... vous parle d'or [desc-fr:Picsou dans son coffre, s'emmêle les pieds dans du fil de fer, bat le métal, flotte dans l'espace] [xapp:US] [art:RMr?]
PM    1p089 W US   33-07   1                        Pouce ! Je pèse
PM    1p091 S 69095       24                        Picsou et la vigne Picratos ! [desc-fr:vignoble détruit par les sauterelles
"Horizontalement", la première ligne donne des informations sur le numéro indexé, les lignes suivantes listent les histoires ou illustrations publiées dans le numéro, dans l'ordre où elles apparaissent à l'intérieur du numéro.

"Verticalement", chaque ligne est divisée en deux parties.
   - dans la première partie les champs ont une taille fixe et sont alignés verticalement, dans l'ordre:
       code de l'entrée,   code de l'histoire,   nombre de pages,   nature de l'entrée,   auteurs,  
   - dans la seconde partie on trouve le titre, puis un nombre variable de champs indiqués sous la forme [nomduchamp:valeur].

Voici le même index, colorisé en fonction du code de couleur:

 
PM    1      h3 [issdate:1972-03] [price:2.50 FRF] [pages:116] [inx:OMi,FWi]
PM    1a    FC PM    1     1 c          RGu         [desc-fr:Picsou plante une pancarte devant son coffre-fort] [xapp:US]
PM    1p002 FC PM    1A    1 i          RGu         Le billet d'Oncle Picsou [desc-fr:Picsou tapant à la machine à écrire] [xapp:US]
PM    1p003 I AT  170-A   29        RCi GCh ?       Oncle Picsou contre tonton Soupic [xapp:DD,HDL,US]
PM    1p034 F PM----1-1    0q                       Enfin la super-surprise ! [xapp:US] [storyitem:$STORYITEM$]
PM    1p035 W DG   38-04  12                        Gontran et la tremblotte chronique [desc-fr:Picsou n'est pas vêtu de sa redingote] [/tremblote n'a qu'un t (?)]
PM    1p051 W OS 1184-06   7                        Géo Trouvetou ou Géo Brisetou ? [desc-fr:Géo a mis au point une machine qui décuple la force physique]
PM    1p060 W MM   33-05   2                        Pluto [logo;My Picsou is rich] [lang:en]
PM    1p067 W MM   83-02  12                        Mickey et la fiesta de Pepitt City [xapp:GO,PE,MM]
PM    1p080 FC PM    1C    1 g                      Grand calme ou grand nerveux... ? [xapp:US]
PM    1p081 FC             1 g          RGu         Oui... mézou ?
PM    1p082aFC PM    1D    4 i                      [app:US,MM,DD,GY,BB(66),HLP,GD,Practical Pig,Fiddler Pig,MI,CL,GO,JW,PL] ["poster-puzzle" comportant 12 vignettes à coller]
PM    1p084 FC PM    1B    2 i                      Oncle Picsou... vous parle d'or [desc-fr:Picsou dans son coffre, s'emmêle les pieds dans du fil de fer, bat le métal, flotte dans l'espace] [xapp:US] [art:RMr?]
PM    1p089 W US   33-07   1                        Pouce ! Je pèse
PM    1p091 S 69095       24                        Picsou et la vigne Picratos ! [desc-fr:vignoble détruit par les sauterelles

2. Détails des champs

2.1. En-tête

La première ligne se compose du code du numéro, PM 1 puis du code d'en-tête h3 ("header 3") reservé aux numéros d'une série (Picsou numéro Magazine 1). Le premier niveau h1 ("header 1") est reservé à la publication tout entière (Picsou Magazine):
PM           h1 Picsou Magazine [publ:Hachette]

PM    1      h3 [inx:FWi,OMi] ...
[index du numéro 1...]

PM    2      h3 [inx:Un indexeur] ...
[index du numéro 2...]
(le deuxième niveau est rarement utilisé, il correspond aux différentes déclinaisons ou différents "volumes" d'une même série).

Le code qui vient au début de chaque ligne (PM, PM 1, PM 1a...) contient un nombre bien défini d'espaces de sorte que les lignes sont triées dans l'ordre alphabétique (mise à part les éventuelles lignes vides): "10" vient après "epace"+"1", ainsi le chiffre des unités est toujours aligné, de même pour le chiffre des dizaines etc.

Les champs pour les lignes d'en-tête sont simples et leur signification relativement évidente...
publ pour l'éditeur (publisher),
issdate pour la date de publication (format AA ou AA-MM ou AA-MM-DD),
price pour le prix,
pages pour le nombre total de pages du numéro,
inx (le seul obligatoire) qui indique le nom du ou des indexeur(s), "-" s'il n'y en a pas.

Ce dernier champ contient une valeur formatée selon le même principe pour chaque champ Inducks:

[nomduchamp:valeur1(commentaire1),valeur2(commentaire2),...]

Chaque valeur peut-être soit un nom complet, soit dans le cas de noms souvent utilisés, une abréviation dont la signification est indiquée dans des fichiers "légendes". On peut ajouter entre parenthèses des commentaires à chaque valeur. Certains champs peuvent également contenir à la place de (commentaire) (ou en plus) un caratère comme "?" (incertain) ou dans le cas des noms d'auteurs ")" qui signifie que le travail d'un auteur a été repris d'une autre histoire.

2.2. Histoires

Dans le jargon Inducks, une histoire est n'importe quelle "entrée" qui n'est pas un en-tête, les couvertures, illustrations, articles ou les véritables histoires sont toutes des "histoires". La ligne se décompose ainsi:

   - Le code de l'entrée indique dans quelle publication l'histoire se trouve, PM 1a, PM 1p002 etc., ce code est formé du code du numéro (PM 1) et de n'importe quelle séquence dont l'ordre alphabétique correspond à l'ordre des histoires dans le numéro. On peut utiliser une séquence en "p002", "p010" etc. pour indiquer le numéro de pages.
   - Le code de l'histoire. C'est la donnée la plus importante de l'indexe, ce code provient des fichiers histoires (un pour chaque production) et on peut le trouver par une recherche dans le COA. La première lettre indique le type de production: B=Brésil, W=comic-books US, I=Italie, certains sont un peu moins évidents comme Y=bande quotidienne US, Z=planche hebdomadaire US. Inducks a normalisé l'ensemble des codes et crée des codes lorsque les éditeurs n'en avaient pas.
   - Le nombre de page. Une partie fractionnaire peut être indiqué sous la forme d'une lettre "h"=1/2 ("half"), "q"=1/4 ("quarter"), d=1/3. Si la fraction est plus compliquée, il faut l'indiquer à la fin de la ligne par [brokpg:5/12] par exemple ("broken page").
   - "Nature" de l'histoire. Il s'agit d'une série de lettre, "c"=couverture, "i"=illustration, "a"=article, "t"=texte, " " (rien ou plus exactement espace) = "histoire, 4 bandes par page", "3"="3 bandes par page" (etc.). On peut indiquer le nombre de vignettes par bande par une lettre: "4b"="4 bandes par page, 2 vignettes par bande", "4c"="4 bandes par page, 3 vignettes par bande", "3c"= etc. On peut encore ajouter un symbol "=" pour "bandes imprimées sur deux pages" (il existe encore d'autres abbréviations).
   - Auteurs. Il s'agit en fait de quatre champs, "auteur du synopsis", "auteur du scénario", "auteur du crayonné", et "auteur de l'encrage" (les significations peuvent être légèrement différentes selon la nature de l'histoire, si c'est une couverture, une illustration peinte, un article etc.). Ces champs ont une taille de quatre caractères chacun et ne peuvent contenir que le nom d'une abréviation (éventuellement avec un point d'interrogation). Cependant, en général, on ne rempli pas ces champs car ils sont automatiquement recopiés depuis les fichiers "histoires" grâce au code de l'histoire. Dans quelques cas il peut cependant s'avérer utile de les lister (lorsque le code de l'histoire est inconnu ou dans le cas d'un storyitem, voir plus bas).
   - Héros. Il s'agit de l'éventuel logo imprimé devant le titre de l'histoire (ou seul s'il n'y pa pas de titre), très souvent un nom de personnage. Par exemple "Donald aventures", "La bande à Picsou" etc. Dans les anciennes publications, de tels logos n'existaient pas, et ils ne sont par conséquent pas listé. Dans les publications récentes, on peut les lister, mais il n'y a pas toujours (pour l'instant) d'abréviation exacte dans Inducks, seulement par exemple "US" pour "Duck Tales" (au lieu de "La bande à Picsou") et "DD" pour "Donald Duck" (au lieu de "Donald aventures"). Il est donc préférable pour l'instant de ne rien lister ou de lister [logo;Donald aventures] (ce champ avec un point-virgule est un champ non officiel traité comme un commentaire).
   - Titre.
   - Tout autre champ utile: xapp ("eXact APPearance", liste des personnages), lang (langue, si différente du français), idc (identification incertaine), desc-fr une description en français (desc en Anglais), code le code de l'histoire tel qu'il apparait dans une publication (indiqué en général lorsqu'il est erroné), ou un simple commentaire entre crochets. On peut également ajouter des commentaires "privés" (c'est-à-dire non visibles dans le COA) en ajoutant un / après le premier crochet, par exemple: [/commentaire].

2.3. Quelles données lister?

Le programme Inducks dizni qui travaille dans l'ombre du COA recopie les données entre les différents fichiers, en donnant la priorité aux fichiers "histoires". Par conséquent, mieux vaut en faire le moins possible ! Lorsque le code de l'histoire est entré, les champs xapp ou desc, et encore plus les noms des auteurs, ne sont pas nécessaire car dizni peut alors utiliser les données des fichiers histoires (jugés fiables). Même lorsque le code est inconnu, il vaut mieux porter ses efforts à l'identification de l'histoire.
De plus il n'est pas obligatoire (et sans doute beaucoup trop long) de lister les illustrations, mise à part la couverture.

Un cas important concerne les histoires publiées pour la première fois au monde dans le magazine que l'on indexe. Certaines productions sont indexées dans un fichier à part, pour d'autres au contraire (comme la France), le fichier des publications fait office de fichier "histoires". Ainsi les données sur les auteurs des histoires françaises sont "maintenus" sur la ligne correspondant à la première publication de cette histoire. Ceci est indiqué par le champ spécial [storyitem:$STORYITEM$]. Les histoires françaises publiées pour la première fois dans un numéro doivent donc être indexées soigneusement, tout autant que cela est possible, avec liste de personnages, noms d'auteurs, description (ceci afin également d'aider les autres indexeurs à identifier l'histoire). De même pour les illustrations françaises, il faut indiquer la plupart des renseignements, mais le champ storyitem n'est pas utile car les illustrations ont toutes un code basés sur la publication ("FC PM 1", FC PM 1A" etc.) et elles sont automatiquement reconnues comme storyitem.

3. Où trouver l'ensemble des informations sur Inducks?

Cette page expose les règles principales du format Inducks. La liste exhaustive des champs et fichiers utilisés par Inducks se trouvent sur le site du Bolderbast.

4. F.A.Q.

1. Comment indiquer une histoire en plusieurs parties?
On utilise [part:numéro de partie]. Le programme dizni se charge de regrouper les différentes parties de manière semi-intelligente.

2. Faut-il indexer toutes les pages : couvertures, sommaire, rédactionnels, publicité, jeux ?
Non, le sommaire et les rédactionnels sont peu intéressants. Le minimum est la couverture + les histoires.

3. Que mettre dans le champ prévu pour cela quand on n'a pas de code sur l'histoire ?
Vide (c'est-à-dire des espaces) ou le début du code si l'on connait le pays de production.

4. Le prix du magazine doit-il être en euros ?
Dans la devise où le magazine était à l'origine vendu.

5. Le nombre d'espaces entre les colonnes a-t-il de l'importance ?
Oui, c'est la seule façon pour le programme de savoir s'il s'agit d'un code, héros, nombre de pages ou titre (bien sûr, il faut visualiser l'index avec une police de caractère à chasse fixe, type courier).

6. J'ai remarqué que les histoires du type I 257-A sont référencées I AT 257-A. Est-ce toujours vrai ?
Non (malheureusement), les codes imprimées varient et sont des fois imprécis (surtout avant les années 80). Ici "I 257-A" peut vouloir dire "I TL 257-A" ("Topolino") ou "I AT 257-A" ("Almanacco Topolino"). Mais il est facile de les différencier car les histoires dans Topolino ont 3 bandes par pages, et 4 dans Almanacco Topolino.

7. Une histoire est répertoriée W WDC 87-02 alors que dans la première case apparait SAP 4. Quelle conclusion en tirer ?
Les éditeurs ont référencé l'histoire à partir d'une réédition italienne ("Super Almanacco Paperino 4") mais c'est bien d'une histoire américaine qu'il s'agit. Pour les codes avec numéro (par exemple Danois comme "D 12345"), il y a beaucoup moins de problèmes de ce genre.

8. Peut-on/doit-on mentionner la page de début d'une histoire ?
Pas obligatoire, mais on peut en mettant dans l'"entrycode" "p123" pour la page 123.

9. Le héros de l'histoire. Comment le choisir quand il n'est ni dans le titre ni dans le logo ?
Champ vide dans ce cas. Le "héros" est le logo imprimé, pas le personnage principal.

10. Que signifie oeoe?
Dans tout l'index français, le oe collé est entré par "oeoe" et le OE collé majuscule par "OEOE" car le jeu de caractère latin-1 ne l'inclu pas. Sur le COA ils sont remplacés pas &oelig et Œ respectivement.

11. Comment régler ces messages d'erreur ?

Dat:fr/SPG  19p159  @S 76179        #442 Pages (34) differ from story file (44) while changes/part/includes fields are empty
Dat:fr/SPG  20p082  @S 83016        #442 Pages (34) differ from story file (44) while changes/part/includes fields are empty
Dat:fr/SPG  21p158  @S 84025        #442 Pages (36) differ from story file (44) while changes/part/includes fields are empty
Dat:fr/SPG  22p155  @S 78212        #442 Pages (37) differ from story file (44) while changes/part/includes fields are empty

Dizni avertit l'indexeur qu'il a listé une réedition avec un nombre de pages inférieure à l'original (sous-entendu il peut s'agir d'une identification fausse). Ce n'est pas le cas ici, il suffit d'utiliser le champ "changes" par ex: [changes:apparently some pages are cut] qui indique que la version n'est pas identique à l'original (traduction et nouvelles colorisation ne comptant évidemment pas).

Pour tout contact: fwi at inducks.org.

page d'accueil Inducks