Il y a pas mal d'erreurs de l'algo qui comparait les chaines, déjà il ignore complètement les sons (entre [ ] ), ensuite son approximation des chaines fait des fois des abérations. J'ai fait un petit script perl qui revérifie tout ça, il lit le fichier tob.tph, repère quand y a une entrée du style STRING_SET ~a~ @b où a != b, à ce moment là il va chercher dans le fichier tra généré à partir du dialog.tlk us les 2 chaines pour les comparer, et quand elles diffèrent il les affiche et s'arrête. Ca m'a déjà permis d'en corriger pas mal en fait. A mon avis ça serait pas mal de coller tout ça sur github pour qu'on puisse envoyer nos modifs au fur et à mesure, parce qu'à priori il y a vraiment beaucoup de choses !
Dans mes modifs délires, je me suis amusé à ajouter un vrai écran de crédit pour la traduction française, question d'y mettre qu'il y a le patch fr de la couronne de cuivre et des gens qui délirent sur le forum de beamdog pour s'amuser avec ça ! Bah faut lui indiquer 2 indexes de chaines dans le dialog.tlk, on ne peut pas mettre les indexes anglais sinon on écrase les crédits anglais et c'est pas ce qu'on veut, donc on a besoin de 2 indices en +, mais apparemment on ne peut pas en ajouter ! Bon à priori j'ai pris 1212 et 1213 qui sont vides tous les 2, remarque le 2ème je sais même pas quand il est affiché ! C'est bon ou on peut faire mieux ? En tous cas faut commencer par désinstaller complètement tout ça puis installer à vide pour que l'interface soit mise à jour avec les nouvelles chaines, et encore le contenu des crédits n'est apparu qu'après que j'ai sélectionné le français puis quitté. Enfin point de détail mais marrant quand même...
Sinon j'ai modifié le lancement de setup pour utiliser ./setup dans bg2eetrans.tp2 comme ça ça marche, il arrive à lancer la 2ème partie tout seul sous linux.
J'ai des idées pour corriger automatiquement les descriptions d'items en me basant sur la traduc anglaise mais bon y a de quoi faire. Je ne pense pas qu'on puisse arriver au bout d'un truc pareil dans un délai raisonnable, mais bon on peut toujours l'améliorer ! Déjà les sons et les textes de sélection sont corrigés pour imoen, jaheira et minsc + un tas de corrections trouvés par mon script difficiles à vérifier dans le jeu ! Y a pas, faudrait coller tout ça sur github à priori...
Bon voilà j'ai collé tout ça très rapidement dans un repo github avec comme fichiers initiaux ceux du zip ici et appliqué par dessus ma tonne de modifs. C'est juste le répertoire bg2eetrans sans aucun setup.exe dedans, à récupérer et à mettre à la place du répertoire bg2eetrans pour tester. C'est là : https://github.com/zelurker/bg2eetrans
L'algorithme ne fait peut-être pas ce que tu penses. Cf les explications que j'ai données à dricks.
Il a été écrit pour récupérer des textes dans un jeu traduit en vue d'aider à la traduction de mod, qui réutilise parfois à dessein des textes déjà présents dans le jeu. Par conséquent, le seul objectif est le texte, pas le son, car dans ce cas, ce sera toujours le son associé par le mod au texte qui fera foi, et pas celui associé par le jeu. Dans l'usage avec les mods, l'outil produit un fichier tra qui contient les textes récupérés et qui préserve les sons du mod. Dans les cas d'usage avec des mods, la récupération est généralement relativement faible (quoique, pour BG1 NPC, cela ait permis de récupérer plus de 1000 textes). De sorte que le traducteur repasse toujours derrière.
En utilisant ce même algorithme pour identifier, dans les textes d'un autre jeu, les textes (quasi) identiques à BG2EE, et générer un fichier tph de correspondance, j'ai effectivement introduit un problème potentiel vis-à-vis des sons. Et évidemment, l'usage du résultat sans vérification (qui a le temps de revoir 74000 textes ?) n'arrange rien.
Pour information, le fichier tph n'est pas le produit d'un simple comparaison des textes anglais de BG2EE et de ToB. Avant de comparer, j'avais passé beaucoup de temps à réduire les écarts en étudiant des changements très fréquents faits par les correcteurs (pinailleurs ?) dans BG2EE. Voici le pré-traitement que j'avais appliqué aux textes de ToB pour les "rapprocher" de ceux de BG2EE. Il s'agit de recherches et remplacements faits avec notepad++, avec vérification visuelle, sauf pour les cas de ponctuations et d'espacement. // 1
// Haer'Dalis -> Haer'Dalis
// Haer'Dalis -> Haer'Dalis
// 2
// ([!?]) ([A-Z]) -> \1 \2
// ([:,]) ([A-Za-z]) -> \1 \2
// 3
// \.\.\.([A-Za-z]) -> ... \1
// 4
// ([\.]) ([A-Za-z]) -> \1 \2
// ([\.]) (["']) -> \1 \2
// 5
// ~ ([A-Z]) -> ~\1
// ([0-9])gp -> \1 gp
// "~Spell Sequencer - " -> "~Spell Sequencer-"
// "~Contingency - " -> "~Contingency-"
// "~Chain Contingency - " -> "~Chain Contingency-"
// "~Spell Trigger - " -> "~Spell Trigger-"
// ([Ss])hort [Bb]ow -> \1hortbow
// ([Ll])ong [Bb]ow -> \1ongbow
// ([Aa])lright -> \1ll right
// ([Aa])mnish -> \1mnian
// 6
// theatre -> theater
// ithril -> ithral
// extra-planar -> extraplanar
// Yaga Shura -> Yaga-Shura
// 7
// "([ ]*\r\n){1,}([Nn]ot |[Oo]nly |[Uu]n|)[Uu]sable [Bb]y[ ]*[:]*[ ]*(\r\n[ A-Za-z\-\(,\)&]*)*" -> ""
// 8
// "1-handed" -> "One-handed"
// "2-handed" -> "Two-handed"
// 9
// "Shortbows were the first" -> "Shortbows were the first bows"
// "(\r\nWeight[]*:[ ]*[0-9]*)(([ ]*\r\n[ A-Za-z0-9:\-\(,\)\/&']*)*)" -> "\2\r\n\1"
// "twelve hundred" -> "1,200"
// "a thousand" -> "1,000" (partiel)
// "Lord Arnise" -> "Lord de'Arnise"
// "Roenal" -> "Roenall"
// "Faerun" -> "Faerûn"
// "Range[ ]*:[ ]*Caster[ ]*$" -> "Range: 0"
// "Range[ ]*:[ ]*([Cc]aster line of sight|[Vv]isual Sight of Caster)" -> "Range: Visual range of the caster"
// "(Area of [Ee]ffect[ ]*):[ ]*([Cc]aster|[Ss]elf)" -> "\1: The caster"
// "Duration[ ]*:[ ]*Instantaneous" -> "Duration: Instant"
// "([Rr]ange[ ]*:)[ ]*Self" -> "\1 0"
// "([jJ])udgement" -> "\1udgment"
// "([Mm])ajordomo" -> "\1ajordomo"
// "\(([sS])igh\)" -> "*\1igh*"
// "\(([Gg])runt\)" -> "*\1runt*"
// " . . ." -> "..."
// ". . ." -> "..."
// "([Gg])ood[ \-]bye" -> "\1oodbye"
// "([Gg])ood-bye" -> "\1oodbye"
// "[\(\-<]([hH]ic|[Hh]iccup|[Bb]urp)!*[\)\->]" -> "*\1*"
// "[\(\-<]([Ss]nicker|[Gg]iggle|[Yy]awn|[Ss]nort|[Cc]huckle|[Ss]ob|[Ss]niffle|[Ss]niff|[Bb]lush)[s]*!*[\)\->]" -> "*\1*"
// "[\(\-<]([Ss]hudder|[Gg]ulp|[Gg]asp|[Ss]igh|[Cc]ough)[s]*!*[\)\->]" -> "*\1*"
// "([sS])pell book" -> "\1pellbook"
// "(Welessan|Wesselan)" -> "Wessalen"
// "Reirric" -> "Reirrac"
// "Selune" -> "Selûne"
// "([Qq])uarter [sS]taff" -> "\1uaterstaff"
// "([Pp])ick [Pp]ocketing" -> "\1ickpocketing"
// "Black Talon" -> "Blacktalon"
// "([Ss])ulphurous" -> "\1ulfurous"
// "Grand Druid" -> "Great Druid"
// "([Dd])oppleganger" -> "\1oppelganger"
// "([Gg])uildhouse" -> "\1uild house"
// "([Ww])raith Form" -> "\1raithform"
// "([Cc])loud Kill" -> "\1loudkill"
// 10
// "([Tt])ravelling" -> "\1raveling"
// "Area of Effect: Creature touched" -> "Area of Effect: 1 creature"
// "THAC0[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "THAC0: \1"
// "Armor [Cc]lass[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Armor Class: \1"
// "Saving [Tt]hrow[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Saving Throw: \1"
// "Saving [Tt]hrows[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Saving Throws: \1"
// "Magic [Rr]esistance[ ]*:[ ]*(\+[0-9]+[ ]*%)[ ]*[Bb]onus" -> "Magic Resistance: \1"
// "Scimitar/Wakizashi/Ninja-To" -> "Scimitar/Wakizashi/Ninjato"
// "Duration[ ]*:[ ]*10 turns" -> "Duration: 2 hours"
// "([Mm])issle" -> "\1issile"
// "Proficiency [Tt]ype:[ ]*Staff" -> "Proficiency Type: Quarterstaff"
// "Armor[ ]*[Cc]lass[ ]*[Bb]onus[ ]*:[ ]*([0-9])" -> "Armor Class: +\1"
// "can not " -> "cannot "
// "5 turns" -> "1 hour"
// "everytime" -> "every time"
// "vs spells", "vs. spells", "vs wands" "vs. wands" -> "vs. spell", "vs. wand"
// "([1-9])D([1-9]+[0-9]*)" -> "\1d\2"
// Nombreuses modifs locales non répétitives pour mieux correspondre à BG2EE
// "[\(\-<]([Gg]rumble)[s]*!*[\)\->]" -> "*\1*"
// "colour" -> "color"
// "Damage[ ]*: [ ]+" -> "Damage: "
// "THAC0[ ]*: [ ]+" -> "THAC0: "
et à l'inverse côté BG2EE: // Mise aux normes BG2 pour ameliorer la comparaison
// (ex: ligne 200) caractere special "—" (milieu de ligne) "-" -> "-" (3476 occurrences)
// (ex: ligne 2140) caractere special "–" (début de ligne) "-" -> "-" (1550 occurrences)
// Ninjato -> Ninjato (exemple @6486, pose pb pour conversion UTF-8 -> CP1252, 44 occurrences)
Mine de rien, cela a un effet non négligeable sur le nombre de cas "exact match", qui sont les seuls véritablement fiables. A noter que les // 1, // 2, ... correspondent au nombre de cycles de tentatives d'améliorations, avec recherche des raisons pour lesquelles la note de correspondance n'était pas suffisante, échantillonnée sur quelques milliers de lignes. Personnellement, j'en ai ma claque. Consacrer autant d'énergie (plus d'un mois) à un pis aller, cela me donnait l'impression de me battre contre des moulins. Si le fichier de ToB modifié comme évoqué ci-dessus te serait utile, dis-le moi et je te le mettrai à disposition. Pour celui de BG2EE, le mieux serait de repartir de la version la plus récente (2.3) et non de la 1.3 comme c'était le cas lors de ma dernière génération de fichier tph.
Un souci majeur est que la cible est mouvante, il faudrait relancer l'algorithme à chaque nouvelle version car il y a de nouveaux textes et pleins de textes changent, pour la plupart des cas pour du pinaillage.
A titre d'exemple, pour la V2 de BGEE (qui est déjà traduite), il devait y avoir 500 nouveaux textes et un bon millier de textes modifiés parmi les anciens. Cela a occasionné environ 300 reprises de traductions et donc pas loin d'un millier de différences en VO non significatives du point de vue la traduction, même si dans certains cas il s'agissait de véritables changements ("yes" remplacé par "aye" pour coller au personnage nain, par exemple, sauf qu'en français on ne sait pas le transcrire). J'imagine que le massacre est au moins du même ordre de grandeur côté BG2EE, même si le nombre de textes ajoutés est moindre, pour une raison bien identifiée (le nouveau tutoriel dans BGEE). En principe, il faudrait relancer tout le traitement sur les textes récents afin d'être sûr que les modifications de description de classe ou de capacité spéciale ne sont pas perdues par la récupération de la traduction d'origine alors que ce n'est plus pertinent. Dans ces conditions, même si l'idée de partager un dépôt s'avère pratique, se pose la question qu'à chaque nouvelle version du jeu, le fait de regénérer le fichier obligerait à réanalyser tout ce qui a changé. Si tu souhaites initier un dépôt à partir de ce que tu as déjà repris, n'hésite pas.
Personnellement je n'ai pas le courage de participer à ça. Je préférerais consacrer cette énergie à contribuer à la traduction elle-même, à constituer un fichier tra contenant une traduction ajustée à la VO lorsqu'elle a changé, plutôt que d'éliminer des correspondances douteuses.
C'est sûr qu'il y a de quoi en avoir marre, pas étonnant ! Bah je ne propose pas de miracle non plus, j'essaye juste de simplifier le truc pour avoir un truc utilisable, pas la traduction parfaite de tout changement de texte fait par beamdog n'importe quand en temps réel. C'est pour ça que c'est un projet très long, parce qu'il faudrait reprendre les textes au fur et à mesure en retraduisant manuellement, mais bon au moins avant ça on a un truc utilisable pour ceux qui ne causent pas anglais. En + j'ai des doutes sur un algo de similitude pour un truc comme ça, y a un exemple sur l'un des 1ers textes, de mémoire la description de l'arc long, elle ne change pas vraiment par rapport au texte de tob sauf que le thac0 diminue de 1 et un autre champ des caractéristiques change. Ca ne fait que 2 caractères qui changent, mais pour un truc comme ça c'est carrément critique comme changement !
D'ailleurs je sais pas si t'as vu dans les crédits des autres traducs mais apparemment y a des équipes visiblement "libres" qui ont fait d'autres langages et qui disent qu'ils continuent à faire évoluer la traduction... comme quoi eux aussi ils doivent gueuler des fois !
Pour l'instant l'idée est beaucoup + simple, en gros on repart du texte anglais, on apprend au script à savoir lire les descriptions d'armes et d'objets pour lui faire corriger lui même les traducs fr pour ce genre de truc, et pour le reste on admet que même si beamdog a changé des trucs le sens général reste le même et on garde le texte français d'origine pour l'instant (c'est pas tout à fait vrai partout, je suis tombé sur la description des faeries qui a passablement changé apparemment à moins que ça soit une erreur de traduc peu probable à la base, mais bon... Si tu veux voir c'est 54759, le texte de beamdog dit en gros que ce sont des petites créatures malicieuses, généralement bienveillantes mais que leur disposition peut varier autant que celle des autres races. Le texte français de tob ne parle que de leur représentation - il dit qu'elles sont généralement représentées par des petites femmes ailées mais que cela peut changer ! Donc soit ils ont confondu représentation et caractère ce qui est peu probable, soit ça a pas mal changé !). Ca devrait déjà donner un texte utilisable comme ça, déjà pas mal. J'avais commencé par faire comme toi, reprendre le texte anglais de tob pour le comparer au texte anglais de beamdog mais y a trop de différences mineures et c'est un bordel monstrueux, le script pète en permanence sur des trucs comme ça, vaut mieux oublier, ou garder ça pour + tard, pour relire le texte.
Après il restera toujours un gros bout de texte à vraiment traduire, genre les npcs ajoutés et cie.
Note pour ceux qui connaissent pas les textes de tob, y a des aberrations dedans aussi, du style les textes des bouquins dupliqués alors qu'avec un fichier comme ça ils devraient utiliser les mêmes indexes de chaines, et pour le dialogue féminin souvent la partie féminine est exactement identique à l'autre ! Un sacré bordel tout ça !
Bah on verra bien où ça nous mène, on peut toujours essayer quelques temps, l'avantage avec git c'est qu'on a le droit à l'erreur, on peut facilement revenir en arrière !
Pour info le script de traduction des descriptions d'armes/objets anglaises vers le français avance bien ! C'est mon + long script jusqu'ici, 189 lignes pour l'instant, mais il marche vachement bien. C'est assez long à mettre au point parce qu'il faut lui faire traduire tous les petits trucs à la volée et y en a pas mal. En tous cas c'est sûr ça a de la gueule, ça intercepte le vieux bloc PARAMETRES quand y en avait 1 dans la traduc française et ça le supprime puis ça ajoute à la place la traduc du bloc de la version anglaise. Visiblement ils ont du faire ça de leur côté avec un programme qui parcourait tous les objets pour générer des descriptions + précises donc ça a du sens d'utiliser un script pour traduire tout ça... Trop tôt pour poster, mais à ce rythme là ça devrait être bon demain (avec de la chance !)
Bon voilà j'ai basculé dans git les changements : toutes les descriptions d'objets sont mises à jour selon le modèle de la version anglaise et traduites automatiquement par le script. Bon alors il est possible que j'ai pas réussi à choper tous les bouts de textes anglais, il peut encore y en avoir qui trainent au milieu de certaines descriptions, mais là va falloir soit relire beaucoup soit tester. En tous cas y a beaucoup + de traductions dans le jeu du coup, et toutes conformes à la version 2.3 du jeu anglais.
A ce niveau là va falloir tester un peu tout ça pour voir ce qu'il reste comme problèmes. Ce qui reste évidemment : tous les trucs ajoutés depuis tob par beamdog et dont le script n'a pu trouver la traduction ailleurs (à mon avis il a pas du en trouver énormément mais j'ai pas vérifié). Donc en gros les npcs ajoutés et le mode de jeu supplémentaire doivent être majoritairement en anglais.
Pour le reste on doit avoir presque tout en français. De mon côté j'ai été voir cette traduction par curiosité, j'étais en train de refaire une partie dans bgee pour aller tester le dlc, donc j'en suis pas encore arrivé à bg2, donc je vais pas tester tout de suite (à part le tout début du jeu que j'ai déjà testé bien sûr !). Donc si y en a qui veulent tester, super, le lien github est toujours le même : https://github.com/zelurker/bg2eetrans utilisez le lien download en haut à droite pour récupérer un fichier zip, remplacez le répertoire bg2eetrans par le répertoire bg2eetrans-master contenu dans le zip et relancez l'install (éventuellement désinstallez complètement bg2eetrans d'abord pour mettre à jour l'interface avec les vrais crédits au moment de la réinstallation).
Voilà si personne ne teste je vais mettre un bout de temps à revenir à ça, mais en tous cas c'était bien !
Hé hé, y a encore quelques problèmes de traducs de toutes ces descriptions, ça aurait été trop beau que le script chope tous les cas dès le début. Bon, je continue à avancer petit à petit et à améliorer ça, on va y arriver... le truc reste utilisable quand même en attendant et continue à s'améliorer... je me dis que je ferais peut-être bien d'inclure les scripts perl que j'ai utiliser au git au cas où quelqu'un soit assez fou pour reprendre ça un jour ! La bonne nouvelle c'est que ça peut être relancé sans problème si une nouvelle version de bg2ee sort !
Bonjour et merci pour tous le travail que vous faites pour qu'on puisse avoir une expérience en FR
J'ai lu en diagonale toutes vos discussions, et je ne sais pas si je dois préférer le fichier donné par Isaya en début de topic ou le fichier proposé par Dricks (Fichiers tlk VF pour BG2EE 2.2 à jour) pour ce qui est des textes.
Pour les voix, il n'y en a qu'un seul donc pas de soucis.
@Rib Comme tu ne précises pas quelle version du jeu tu possèdes, il n'est pas possible de répondre à ta question simplement. Selon que tu as une version 1.3 (maximum possible pour Android, version DVD ou Mac App Store) ou 2.x (Windows, Linux, Mac sauf App Store), la réponse ne sera pas le même.
Android (1.3) : voir ce message 1.3 : voir le premier message de la discussion 2.x : voir ce message pour le point de départ. Ensuite il y a 3 possibilités :
installer le mod tel quel, malgré les défauts cités par dricks ou zelurker
installer le mod, puis remplacer les fichiers dialog.tlk et dialogF.tlk par ceux proposés par dricks (voir ses instructions pour plus de précisions)
remplacer certains fichiers du mod par ceux proposés par zelurker (voir ses instructions), puis installer le mod
Juste un petit message pour signaler que la decompression de l'archive de zelurker pose problème... Il y a des fichiers qui portent le même nom (la faute aux liens symboliques linux) et si on ne fait pas attention, on écrase les bons fichiers par les liens symboliques linux qui ne servent pas sous windows.
Je recommande de choisir de ne pas écraser les fichiers mais de renommer le deuxième fichier. C'est ce qui marche le mieux.
Je vais tester la trad et si j'ai le temps je ferai un retour.
Grâce à l'aide de Luren et de Freddy_Gwendo (@Gwendolyne sur ce forum), via le forum de la Couronne de Cuivre, les travaux de @dricks et de @zelurker ont été intégrés. Par ailleurs il y a d'autres améliorations :
désormais aucune voix ne devrait être incorrecte
des textes propres à la version 2.x de BG2EE communs avec BGEE 2.x ont été intégrés (prêtre de Tyr, chaman)
de nombreuses textes de BG II satisfaisants en français ont été repêchés
un mécanisme bien plus strict a évité de reprendre des textes de BGEE moins satisfaisants que ceux de BG II
de nombreux titres de quête (écran du journal) ont été passés en français par Luren
dans l'ensemble le nombre de textes traduits et leur qualité a été améliorée
Il s'agit toujours une version française partielle couvrant principalement BG II + ToB originels et de façon incomplète, et en aucun cas d'une véritable traduction.
J'ai mis à jour le premier message de cette discussion pour indiquer un lien de téléchargement pour cette nouvelle version adaptée à BG2EE V2.0 et supérieure ainsi que pour reporter les précisions pour installer la version Android.
Après 8 mois de pause (bah oui des trucs à faire, dsl !), je viens de retoucher la traduc. Le gros truc qui me bloquait c'est qu'il faut jouer à bg2 pour la vérifier, et j'étais dans bg1 alors évidemment... Après avoir joué un moment, c'est plutôt pas mal. Y a 2 problèmes : 1) les petites retouches ridicules que beamdog a fait sur la traduc anglaise du style ajouter un s, changer un mot de liaison ce genre de truc, tout ça fait foirer la détection du texte et ça fait qu'on se retrouve des fois avec un peu d'anglais au milieu du français. C'est assez rare n'empêche, je m'attendais à en voir +. 2) y a encore des foirages au niveau du gui, rien que nouvelle partie, et lire la description après le 1er choix, c'est pas mal... !!! Là-dessus la traduc du gui est foutument bordelique, au final tout va dans le même fichier dialog.tlk, mais on a 2 traductions séparées, 1 pour le gui, l'autre pour le jeu lui même, du coup y a confusion et on ne sait plus qui fait quoi parfois...
Pour le 1) y avait quand même dans les 2000 chaines environ avec ce problème (sur + de 70 000 ça fait pas tant que ça), donc j'ai refait un script pour détecter les différences par rapport à la version us de tob et quand ça fait moins de 5 caractères, accepter la traduc. Ca fait qu'on gagne + de 600 chaines de traduites en +, j'en ai vérifié pas mal de visu, ça a l'air de très bien marcher.
Pour le 2) c'est un vrai bordel à corriger à cause des confusions et du fait que pour un petit truc détecté rapidement faut trouver quel fichier corriger puis recompiler le truc ce qui prend pas mal de temps puis re-tester en priant qu'on se soit pas gouré. J'ai mis à jour la traduc de bg1ee à partir de ma version, ça permet de récupérer les descriptions manquantes des ennemis jurés des rôdeurs, mais je les ai pas encore toutes corrigées, trop long, trop chiant, mais bon on progresse. C'est mieux en tous cas, et au moins on a plus le bug très visible juste après nouvelle partie !
Corrigé aussi à la main les descriptions d'armures elfiques, on arrivait à comprendre mais c'était bizarre !
Bon va falloir rejouer, désolé pour le bug des fichiers écrasés sosu windoze, j'y avais même pas pensé, normalement windoze suporte les liens symboliques mais ne fait pas la différence majuscule/minuscule d'où l'écrasement. Faudrait probablement refaire toute l'organisation des fichiers en + propre pour éviter ça, mais je ne connais presque rien au weidu, donc dur dur...
voilà je viens de pusher une modif pour supprimer les liens symboliques, alors sous linux weidu veut absolument que tous ses fichiers soient en minuscules donc il a fallu renommer presque tout pour pouvoir virer les symlinks.
Le problème c'est que le répertoire résultat dans lang est fr_fr à la fin vu que toutes les opérations sur les fichiers de weidu se font en minuscules et comme le jeu veut absolument fr_FR, et bin faudra créer un lien symbolique à la main sous linux, c'est le seul qui est obligatoire, sans ça le jeu ne détecte pas du tout le français. Il doit y avoir moyen de lancer une commande pour créer le lien sans passer par weidu mais pour l'instant je sais pas comment faire donc faut le faire à la main. Ce qui serait pas mal aussi c'est d'éviter d'avoir à virer tout le répertoire fr_FR quand on veut réinstaller ce qui m'est arrivé pas mal dernièrement, parce que ça oblige à virer les voix du coup, même si j'en garde très peu en fr (les anglaises sont généralement mieux, sauf Irenicus qui est excellent en fr !).
Bon enfin du coup ça résoud les problèmes de liens symboliques sous windoze et osx !
Me suis fait un script pour désinstaller les mods à partir du weidu.log et un autre pour les réinstaller à partir d'une copie du weidu.log, ça me permet de tester tout ça avec des mods et de les déinstaller/réinstaller rapidement si je trouve une saloperie dans la traduc. Encore corrigé l'une des répliques à Imoen au tout début du jeu qui a été affectée par la màj de la traduc bgee. A part ça tout a l'air bon pour l'instant, on reprendra les tests + tard ! A noter : la 1ère entrée du journal qui apparait quand Imo nous sort de notre prison au début du jeu est une entrée qui n'existait apparemment pas dans le jeu original donc pas de traduc pour celle là !
J'ai perdu des heures à m'arracher les cheveux à cause d'un bug de gui dans la vo, je croyais que c'était un bug de mon côté ! Nouvelle partie / choix du sexe, ça affiche bien un texte tob dans la vo, en fait c'est parce qu'ils ont copié le gui de bgee, dans bgee le texte à cet endroit là est bon, c'est 24313, mais dans bg2ee 24313 fait référence à un texte tob donc ça marche plus. Du coup c'est un bug à ne pas corriger, on risque de péter un texte tob sinon ! C'est malin je te jure !!!
Bon j'ai refait toute la partie bgee en régénérant ça avec un script parce qu'il y avait trop d'erreurs difficiles à trouver dedans, ça veut dire que j'ai moins d'entrées traduites mais au moins elles sont fiables (y avait surtout des bugs énervants avec les voix). Sinon avec un autre script du même genre j'ai ajouté les chaines après 74000 en rapport avec la traduction de tob qui étaient passées à la trappe... On en est à 82% de texte traduit (en comparant avec le nombre d'entrées dans le fichier us), pas mal quand même. Il manque encore des trucs visibles du genre des descriptions de sorts, ou des détails dans la description de certains trucs, mais c'est pas mal...
Tiens sinon j'ai aussi fait un petit script pour extraire les voix d'une install tob à partir des dialogues et les convertir en ogg pour bg2ee, au final ça fait un répertoire de 180 Mo quand même. Au cas où ça intéresse du monde je peux le poster, mais c'est du perl donc ça marchera surtout sous linux et osx, avec windows à condition d'avoir un vrai shell genre mingw32... !
@zelurker As-tu jeté un coup d'oeil à la nouvelle version que nous avons préparée ? Pour ce qui concerne les textes écrasés avec de mauvais textes de BGEE, j'ai écrit un script qui a comparé les notes obtenues par les récupérations depuis ToB et BGEE et qui neutralise la récupération depuis BGEE si elle n'est pas meilleure qu'à partir de ToB. Cela a éliminé un très grand nombre de ces défauts.
Par ailleurs, il y a une évolution majeure concernant les textes nouveaux de BG2EE (après 74106) : j'ai retiré toutes les récupérations, qui ne concernaient que des phrase assez basiques et pas forcément fiable (tutoiement/vouvoiement, prise en compte du sexe du personnage, bug de la notation). Désormais quasiment tous les textes installés dans cette partie sont vérifiés et ceux qui ne le sont pas encore sont suffisamment complexes pour présenter très peu de risques sur le calcul de notes (environ 900 textes au total).
Concernant le problème du répertoire fr_FR qui reste après désinstallation, j'ai passé du temps, essayé plusieurs choses en particulier une désinstallation explicite dans le premier tp2, rien n'y fait, ces satanés fichiers dialog.tlk disparaissent puis reviennent en fin de désinstallation. J'ai laissé tomber pour l'instant.
J'ai regardé rapidement les modifications que tu as apportés pour les noms de fichier/répertoire en minuscule. Celles que tu as apportées aux lignes README et AUTO_TRA dasn bg2eetrans.tp2 ne servent à rien puisque tu as renommé le répertoire du mod en fr_fr et que tu as aussi changé dans LANGUAGE.
Si le nom du répertoire lang/fr_FR est important pour le jeu, tu devrais sans doute laisser fr_FR lorsque tu patches BGEE.sql. Quant au nom du dossier lang/fr_FR, si c'est important que ce soit en partie en majuscule, modifie simplement les instructions qui font la copie des fichiers tlk :
ACTION_IF ( ~%LANGUAGE%~ STRING_EQUAL_CASE ~fr_fr~ ) THEN BEGIN
// Create the language directory if it does not exist
ACTION_IF NOT FILE_EXISTS ~lang/fr_FR~ THEN BEGIN
MKDIR ~lang/fr_FR~
END
COPY ~lang/en_US/dialog.tlk~ ~lang/fr_FR/dialog.tlk~
COPY ~lang/en_US/dialog.tlk~ ~lang/fr_FR/dialogF.tlk~
MKDIR ~lang/fr_FR/override~
// Add the chosen language to BG2EE
COPY_EXISTING ~BGEE.lua~ ~override/BGEE.lua~
REPLACE_TEXTUALLY ~ {'en_US', 99385, 99386, 'English'},~ ~ {'en_US', 99385, 99386, 'English'},
{'fr_FR', 1212, 1213, 'Français'},~
UNLESS ~'fr_FR'~
// Add the translated interface file
COPY ~bg2eetrans/language/fr_FR/L_fr_FR.lua~ ~lang/fr_FR/override/L_fr_FR.lua~
END
J'ai déjà dépensé beaucoup d'énergie à essayer de fusionner des travaux faits en parallèle par plusieurs personnes sur ce même sujet de la récupération de textes pour BG II, avec des approches différentes et qui présentent la plupart du temps un nombre énorme de différences minimes sans importance, mais qui sont une plaie pour essayer de fusionner sur les différences importantes. Par ailleurs, j'ai un gros sujet sur la table en ce moment en rapport avec la traduction proprement dite. Par conséquent je pense que je ne vais pas investir plus de temps à étudier les améliorations que tu as obtenues. Est-ce que ça te dirait d'unir les efforts autour d'un projet commun ?
Bah non j'ai pas vu la mise à jour de l'autre côté, je ne fréquente pas vraiment beaucoup le forum, y a un lien ? Finalement on arrive à convaincre le jeu de prendre fr_fr comme langage, me suis aperçu que j'ai plus besoin de mon symlink après avoir tout mis en minuscules donc ça va ! Sinon pour remarque si tu lances la désinstallation comme par la commande weidu au lieu de le faire par l'interface, du genre : weidu --uninstall ~BG2EETRANS/BG2EETRANSINSTALL.TP2~ puis weidu --uninstall ~BG2EETRANS/BG2EETRANS.TP2~ à ce moment là tout est propre, les fichiers dialog.tlk sont bien virés et on peut réinstaller sans problème. Je m'en suis aperçu par hasard parce que c'est comme ça que mon script désinstalle tous mes mods quand je veux modifier la traduc ! Par contre ne me demande pas pourquoi ils restent quand on fait la désinstallation en passant par les menus classiques, aucune idée ! Remarque : ça serait probablement + simple de fusionner les 2 tp2, c'est peut-être de là que vient le problème d'ailleurs, surtout qu'il y a de moins en moins de raison de choisir l'une ou l'autre option maintenant qu'on a la partie bgee fiable ! Mais de toutes façons même avant j'ai toujours tout installé !
Ca va je continue à avancer, ma refonte de bgee a évidemment oublié des trucs, donc j'ai déjà regagné dans les 2000 lignes... ! Mais bon au bout du compte si on veut la finir cette traduc il va bien falloir que quelqu'un finisse par vraiment traduire des trucs !
Bon à priori j'ai fait la plupart du gui (tous les choix de nouvelle partie, incluant les kits, les sorts de sorciers jusqu'au niveau 3, des sorts de prêtres mais je sais plus si je les ai tous faits, faudra que je vérifie). On en est à 85% environ si on compte les phrases, mais peut-être + vu qu'il y a des textes en anglais dans la traduc française de tob et bgee, visiblement des trucs inutilisés. Y a des bizarreries sur des descriptions de certains sorts sur leur portée entre autres c'est pour ça qu'ils n'ont pas été détectés par le machin automatique, j'ai mis ça dans le fichier bgee_manual en commentaire en précisant les différences (en pratique ça change probablement rien du tout au niveau game play, c'est + de l'info théorique). Y avait aussi une partie des chaines qui n'ont pas été détectées automatiquement parce qu'il y avait des espaces en bout de ligne sur l'une des 2 versions (entre bgee et bg2ee !). Lamentable, ils n'ont même pas d'éditeur qui supprime les espaces en fin de ligne ! Bon là je pense que je vais pouvoir rejouer un moment, le pb avec ma méthode c'est que je mets des mods anglais, du coup ça perturbe !!! Remarque avec mes nouveaux fichiers pour bgee la régénération par weidu de juste cette partie là est devenue super rapide, excellent pour pouvoir tester rapidement des modifs ! Ca reste très lent pour tob mais là y a eu trop de modifs sur le fichier tob donc ça restera comme ça !
J'ai amélioré la détection des textes non traduits (ceux qui se retrouvent en anglais dans la vf de bgee), et du coup y a un gros paquet de chaines qui ont été virées de bgee. Je viens de refaire le donjon d'irenicus pour m'assurer que j'avais pas fait de cata, non non, c'est top frime, j'ai pas trouvé 1 seul truc en anglais ! Cool ! (on est tombé à 82% avec tout ce qui a viré, mais en fait c'est visiblement très élevé quand même !)
Bon, je me suis fait un autre script pour détecter les trucs non traduits sinon on va les chercher longtemps. J'en ai déjà rajouté quelques uns d'après ses résultats (traductions de sorts retouchées, j'ai mis les détails dans le fichier manual en commentaire). Y a des surprises aussi du style l'exploitation des fichiers de voix du perso, 16235 par exemple : bg2ee us : ~To battle, and victory!~ [MALE5A] bg2 us : ~~ [MALE005A] mais la surprise ici c'est surtout que les fichiers français sont nommés différemment, c'est pas male005a.wav, c'est homme5a.wav ! Donc quoi, est-ce que le moteur du jeu fait lui même la traduction ? Ca m'étonnerait, surtout ici en fr, du coup à priori va falloir retoucher le fichier dialogtob.tra pour ça, puis coller ça en traduction manuelle dans tob_manual.tph...
C'est bon pour le début du chapitre 2. L'erreur la + remarquable : bgee us : he bgee fr : il semblerait que cela n'était pas verrouilé, après tout et le mieux c'est que c'était pour traduire un mot clé weidu , du coup on le retrouvait partout !!! M'enfin bon, on avance, on avance...
Sinon pour remarque si tu lances la désinstallation comme par la commande weidu au lieu de le faire par l'interface, du genre : weidu --uninstall ~BG2EETRANS/BG2EETRANSINSTALL.TP2~ puis weidu --uninstall ~BG2EETRANS/BG2EETRANS.TP2~ à ce moment là tout est propre, les fichiers dialog.tlk sont bien virés et on peut réinstaller sans problème.
Je le sais, je le fais moi-même quand je dois faire des essais pour la deuxième partie.
Remarque : ça serait probablement + simple de fusionner les 2 tp2, c'est peut-être de là que vient le problème d'ailleurs, surtout qu'il y a de moins en moins de raison de choisir l'une ou l'autre option maintenant qu'on a la partie bgee fiable ! Mais de toutes façons même avant j'ai toujours tout installé !
Si c'était si simple... Le premier installateur est nécessaire pour créer le répertoire fr_FR et y copier les fichiers dialog.tlk. Si ce n'est pas fait, la langue française n'est pas disponible et WeiDU ne permet alors pas de modifier des fichiers tlk dans une langue qui n'existe pas encore. C'est pour cela qu'il faut exécuter WeiDU une seconde fois.
Mais bon au bout du compte si on veut la finir cette traduc il va bien falloir que quelqu'un finisse par vraiment traduire des trucs !
Justement, c'est ce que j'ai essayé de te faire comprendre dans mon précédent message. J'ai déjà commencé à reprendre de façon vérifiée par un humain les textes à partir de 74107 (à partir de BGEE et IWDEE) et j'ai également traduit un certain nombre de textes dans cette partie.
Y a des surprises aussi du style l'exploitation des fichiers de voix du perso, 16235 par exemple : bg2ee us : ~To battle, and victory!~ [MALE5A] bg2 us : ~~ [MALE005A] mais la surprise ici c'est surtout que les fichiers français sont nommés différemment, c'est pas male005a.wav, c'est homme5a.wav ! Donc quoi, est-ce que le moteur du jeu fait lui même la traduction ? Ca m'étonnerait, surtout ici en fr, du coup à priori va falloir retoucher le fichier dialogtob.tra pour ça, puis coller ça en traduction manuelle dans tob_manual.tph...
Dans BG II, FEMALE4 et MALE005 sont les seuls à être référencés dans le fichier tlk et à avoir des fichiers se trouvant dans des fichiers bif. Certains mods ont fait usage de ces voix, Kiara-Zaiya par exemple. Pour toutes les voix du PJ, il n'y avait jamais d'affichage de texte. De sorte que les fichiers de voix pour le PJ n'avaient jamais aucun lien avec des textes et pouvaient porter des noms différentes de ceux référencés dans le fichier tlk. L'apparition du texte associé aux voix pour PJ est une nouveauté EE. Le pack de voix que j'ai mis à disposition s'est aligné sur le nommage anglais.
Ok, vu la màj, je vais tacher de tester... mais ça promet si on fait plein de modifs chacun de son côté, le merge s'annonce difficile... weidu : ok tant pis. Kiara-Zaiya : par hasard j'ai voulu tester ce mod dernièrement et je me suis pris un joli crash en arrivant dans le secteur des esclavagistes. Comme on a pas de message, j'ai pas cherché à comprendre, quand j'ai trouvé le mod qui causait ça j'ai juste désinstallé, pas trouvé de patch pour ee pour ça.
Pour les voix bah oui soit on renomme les fichiers pour faire comme les voix anglaises, soit on traduit nous mêmes les male en homme et female en femme, pas bien dur non plus, bah n'importe, c'est chiant à faire de toutes façons, je l'ai fait juste pour male5 que j'ai traduit en homme5 en rajoutant les phrases qui vont bien et j'ai trouvé ça chiant et arrêté là ! Au moins ça marche, mais bon....
Me suis amusé à détailler les différences dans le texte tob intégré à bg2ee et celui originalement dans tob us, y a des modifs de dingue là-dedans, des trucs où on se demande si ils les ont pas ajoutés spécialement pour emmerder ceux qui essaieraient de traduire !!! (du genre juste supprimer un r dans rrrrtg, et y en a d'autres... !).
L'idée étant que si on pouvait déterminer précisément où sont partis les bouts de textes de tob on aurait 100% du texte tob traduit, visiblement le texte français est en meilleur état que le texte anglais original, mais c'est + facile à dire qu'à faire avec toutes les modifs de tarés qu'ils ont collées partout... Enfin bon, on en est à la partie chiante, on a déjà la majorité des textes qui sont faits, donc y aura + de gros ajouts miraculeux maintenant si on veut le finir faut le faire à la main, et c'est beaucoup - amusant (moi j'adorais faire mumuse avec des scripts qui font de la magie, du coup je perds mon intérêt là...). Et puis aucune envie de traduire leurs npcs, ils sont probablement parmi les + mauvais npcs jamais faits pour bg2 et pourtant y en a des tonnes, quitte à traduire un npc resté en anglais autant prendre kelsey, ça serait nettement mieux !
Bref, je crois que je vais continuer à jouer en prenant des notes au fur et à mesure sur ce que je trouve en anglais sans viser 100%, c'est déjà à un très bon niveau à mon avis...
Et puis aucune envie de traduire leurs npcs, ils sont probablement parmi les + mauvais npcs jamais faits pour bg2 et pourtant y en a des tonnes, quitte à traduire un npc resté en anglais autant prendre kelsey, ça serait nettement mieux !
@Graoumf : Excellent, merci, je regarderai + en détail dès que j'aurai + de temps !
le forum m'a bouffé ma réponse quand j'ai essayé de faire quote, bizarre...
Bon enfin en tous cas sur l'autre partie, à savoir l'idée de retrouver les bouts de la traduc tob dans bg2ee, et bin mon dernier post était amer parce que je venais de me casser les dents dessus, du genre + d'1h pour 600 lignes de validées, et encore de façon extrêmement compliquée, obligé d'abandonner à ce niveau là. Mais en fait j'ai trouvé qu'il y a des algos spécialisés pour ce genre de problème, voir par exemple String::Similarity en perl sur cpan ! Avec ça je valide en gros 10 000 lignes à l'heure, enfin un peu + d'1h, mais rien à voir avec les 600 d'hier ! Donc j'en suis à 20 000 là, y en a 74000 donc je suis loin d'être au bout, mais il reste de l'espoir. Si j'y arrive, ça change complètement la partie tob du coup ! Enfin vive git, on a le droit de faire des erreurs et de revenir en arrière avec ça, mais ça serait vachement bien que ça marche !
Alors la fin a été + vite que le début, j'ai mis un peu + de 2h à faire les 50 000 entrées restantes. Résultat des courses : toute la partie TOB de bg2ee est à 100% en français !!!
Bon, comment ça marche + en détail : me suis aperçu à force de faire des corrections manuelles sur la partie que je joue que toutes les entrées que j'ajoutais étaient de la forme : STRING_SET ~n~ @n c'est à dire toujours la même entrée entre le fichier us de bg2ee et tob us. De quoi se dire que ça serait quand même vachement bien de trouver les rares entrées qui ne sont pas comme ça, y a moyen de faire du 100% assez facilement dans ce cas là. D'où un nouveau script, read.pl, qui au lei de chercher n'importe où une correspondance à une entrée du fichier bg2ee us la cherche uniquement pour la même entrée dans le fichier tob us, avec un taux d'erreur maxi de 50%. Ca m'a oblié à retoucher pas mal de choses dans dialogtob, mais pas tant que ça non plus au final. donc maintenant on prend les 74000 entrées de tob en 1er, puis on colle par dessus les traductions de bgee qui vont bien, et voilà le résultat.
J'ai juste testé le début de partie avec ça, ça a l'air de remarquablement bien marcher ! Je testerai + en détail + tard. De toutes façons à priori y a aucune chance de trouver un texte anglais dans un texte qui appartenait à bg2, au pire vous pouvez peut-être trouver une entrée qui n'a pas été retouchée, mais bonne chance pour s'en apercevoir... A priori ça doit être du tout bon ! En + c'est monstrueusement rapide à installer par rapport au veau qu'on avait avant, là c'est tellement rapide qu'on a l'impression que ça a bugué !
Top ! Bon, je fais un break, j'y retourne tout à l'heure pour tester !
Bon j'ai été un peu trop optimiste, pas étonnant après une percée pareille ! Il restait 2 problèmes : - la traduction des descriptions d'artefacts est faite par un script et il ne sait pas causer anglais, donc dès qu'il y a quelque chose d'un peu spécial, il coince, du coup on se retrouve avec pas mal de texte où y a de l'anglais de mélangé. J'en ai corrigé pas mal, je suis pas sûr d'avoir tout eu, mais je crois, ça apparait surtout dans la partie tob du jeu, là où y a des artefacts vraiment très spéciaux ! - Y a pas mal de chaines après 74106 dans le fichier bg2ee qu'on retrouve pourtant dans la traduction ToB, par exemple une certaine dague +2 du chateau de armise qui apparait comme "dagger +2" si on inclut pas ces traductions ! Donc je les ai remises, ça ralentit sensiblement le traitement, mais bon on avait de la marge, c'était trop rapide !
Comments
J'ai fait un petit script perl qui revérifie tout ça, il lit le fichier tob.tph, repère quand y a une entrée du style
STRING_SET ~a~ @b
où a != b, à ce moment là il va chercher dans le fichier tra généré à partir du dialog.tlk us les 2 chaines pour les comparer, et quand elles diffèrent il les affiche et s'arrête. Ca m'a déjà permis d'en corriger pas mal en fait.
A mon avis ça serait pas mal de coller tout ça sur github pour qu'on puisse envoyer nos modifs au fur et à mesure, parce qu'à priori il y a vraiment beaucoup de choses !
Bah faut lui indiquer 2 indexes de chaines dans le dialog.tlk, on ne peut pas mettre les indexes anglais sinon on écrase les crédits anglais et c'est pas ce qu'on veut, donc on a besoin de 2 indices en +, mais apparemment on ne peut pas en ajouter !
Bon à priori j'ai pris 1212 et 1213 qui sont vides tous les 2, remarque le 2ème je sais même pas quand il est affiché !
C'est bon ou on peut faire mieux ? En tous cas faut commencer par désinstaller complètement tout ça puis installer à vide pour que l'interface soit mise à jour avec les nouvelles chaines, et encore le contenu des crédits n'est apparu qu'après que j'ai sélectionné le français puis quitté. Enfin point de détail mais marrant quand même...
Sinon j'ai modifié le lancement de setup pour utiliser ./setup dans bg2eetrans.tp2 comme ça ça marche, il arrive à lancer la 2ème partie tout seul sous linux.
J'ai des idées pour corriger automatiquement les descriptions d'items en me basant sur la traduc anglaise mais bon y a de quoi faire. Je ne pense pas qu'on puisse arriver au bout d'un truc pareil dans un délai raisonnable, mais bon on peut toujours l'améliorer ! Déjà les sons et les textes de sélection sont corrigés pour imoen, jaheira et minsc + un tas de corrections trouvés par mon script difficiles à vérifier dans le jeu !
Y a pas, faudrait coller tout ça sur github à priori...
Enfin je me suis bien amusé en tous cas !
C'est juste le répertoire bg2eetrans sans aucun setup.exe dedans, à récupérer et à mettre à la place du répertoire bg2eetrans pour tester.
C'est là : https://github.com/zelurker/bg2eetrans
Il a été écrit pour récupérer des textes dans un jeu traduit en vue d'aider à la traduction de mod, qui réutilise parfois à dessein des textes déjà présents dans le jeu. Par conséquent, le seul objectif est le texte, pas le son, car dans ce cas, ce sera toujours le son associé par le mod au texte qui fera foi, et pas celui associé par le jeu. Dans l'usage avec les mods, l'outil produit un fichier tra qui contient les textes récupérés et qui préserve les sons du mod.
Dans les cas d'usage avec des mods, la récupération est généralement relativement faible (quoique, pour BG1 NPC, cela ait permis de récupérer plus de 1000 textes). De sorte que le traducteur repasse toujours derrière.
En utilisant ce même algorithme pour identifier, dans les textes d'un autre jeu, les textes (quasi) identiques à BG2EE, et générer un fichier tph de correspondance, j'ai effectivement introduit un problème potentiel vis-à-vis des sons. Et évidemment, l'usage du résultat sans vérification (qui a le temps de revoir 74000 textes ?) n'arrange rien.
Pour information, le fichier tph n'est pas le produit d'un simple comparaison des textes anglais de BG2EE et de ToB. Avant de comparer, j'avais passé beaucoup de temps à réduire les écarts en étudiant des changements très fréquents faits par les correcteurs (pinailleurs ?) dans BG2EE. Voici le pré-traitement que j'avais appliqué aux textes de ToB pour les "rapprocher" de ceux de BG2EE. Il s'agit de recherches et remplacements faits avec notepad++, avec vérification visuelle, sauf pour les cas de ponctuations et d'espacement.
// 1 // Haer'Dalis -> Haer'Dalis // Haer'Dalis -> Haer'Dalis // 2 // ([!?]) ([A-Z]) -> \1 \2 // ([:,]) ([A-Za-z]) -> \1 \2 // 3 // \.\.\.([A-Za-z]) -> ... \1 // 4 // ([\.]) ([A-Za-z]) -> \1 \2 // ([\.]) (["']) -> \1 \2 // 5 // ~ ([A-Z]) -> ~\1 // ([0-9])gp -> \1 gp // "~Spell Sequencer - " -> "~Spell Sequencer-" // "~Contingency - " -> "~Contingency-" // "~Chain Contingency - " -> "~Chain Contingency-" // "~Spell Trigger - " -> "~Spell Trigger-" // ([Ss])hort [Bb]ow -> \1hortbow // ([Ll])ong [Bb]ow -> \1ongbow // ([Aa])lright -> \1ll right // ([Aa])mnish -> \1mnian // 6 // theatre -> theater // ithril -> ithral // extra-planar -> extraplanar // Yaga Shura -> Yaga-Shura // 7 // "([ ]*\r\n){1,}([Nn]ot |[Oo]nly |[Uu]n|)[Uu]sable [Bb]y[ ]*[:]*[ ]*(\r\n[ A-Za-z\-\(,\)&]*)*" -> "" // 8 // "1-handed" -> "One-handed" // "2-handed" -> "Two-handed" // 9 // "Shortbows were the first" -> "Shortbows were the first bows" // "(\r\nWeight[]*:[ ]*[0-9]*)(([ ]*\r\n[ A-Za-z0-9:\-\(,\)\/&']*)*)" -> "\2\r\n\1" // "twelve hundred" -> "1,200" // "a thousand" -> "1,000" (partiel) // "Lord Arnise" -> "Lord de'Arnise" // "Roenal" -> "Roenall" // "Faerun" -> "Faerûn" // "Range[ ]*:[ ]*Caster[ ]*$" -> "Range: 0" // "Range[ ]*:[ ]*([Cc]aster line of sight|[Vv]isual Sight of Caster)" -> "Range: Visual range of the caster" // "(Area of [Ee]ffect[ ]*):[ ]*([Cc]aster|[Ss]elf)" -> "\1: The caster" // "Duration[ ]*:[ ]*Instantaneous" -> "Duration: Instant" // "([Rr]ange[ ]*:)[ ]*Self" -> "\1 0" // "([jJ])udgement" -> "\1udgment" // "([Mm])ajordomo" -> "\1ajordomo" // "\(([sS])igh\)" -> "*\1igh*" // "\(([Gg])runt\)" -> "*\1runt*" // " . . ." -> "..." // ". . ." -> "..." // "([Gg])ood[ \-]bye" -> "\1oodbye" // "([Gg])ood-bye" -> "\1oodbye" // "[\(\-<]([hH]ic|[Hh]iccup|[Bb]urp)!*[\)\->]" -> "*\1*" // "[\(\-<]([Ss]nicker|[Gg]iggle|[Yy]awn|[Ss]nort|[Cc]huckle|[Ss]ob|[Ss]niffle|[Ss]niff|[Bb]lush)[s]*!*[\)\->]" -> "*\1*" // "[\(\-<]([Ss]hudder|[Gg]ulp|[Gg]asp|[Ss]igh|[Cc]ough)[s]*!*[\)\->]" -> "*\1*" // "([sS])pell book" -> "\1pellbook" // "(Welessan|Wesselan)" -> "Wessalen" // "Reirric" -> "Reirrac" // "Selune" -> "Selûne" // "([Qq])uarter [sS]taff" -> "\1uaterstaff" // "([Pp])ick [Pp]ocketing" -> "\1ickpocketing" // "Black Talon" -> "Blacktalon" // "([Ss])ulphurous" -> "\1ulfurous" // "Grand Druid" -> "Great Druid" // "([Dd])oppleganger" -> "\1oppelganger" // "([Gg])uildhouse" -> "\1uild house" // "([Ww])raith Form" -> "\1raithform" // "([Cc])loud Kill" -> "\1loudkill" // 10 // "([Tt])ravelling" -> "\1raveling" // "Area of Effect: Creature touched" -> "Area of Effect: 1 creature" // "THAC0[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "THAC0: \1" // "Armor [Cc]lass[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Armor Class: \1" // "Saving [Tt]hrow[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Saving Throw: \1" // "Saving [Tt]hrows[ ]*:[ ]*(\+[0-9])[ ]*[Bb]onus" -> "Saving Throws: \1" // "Magic [Rr]esistance[ ]*:[ ]*(\+[0-9]+[ ]*%)[ ]*[Bb]onus" -> "Magic Resistance: \1" // "Scimitar/Wakizashi/Ninja-To" -> "Scimitar/Wakizashi/Ninjato" // "Duration[ ]*:[ ]*10 turns" -> "Duration: 2 hours" // "([Mm])issle" -> "\1issile" // "Proficiency [Tt]ype:[ ]*Staff" -> "Proficiency Type: Quarterstaff" // "Armor[ ]*[Cc]lass[ ]*[Bb]onus[ ]*:[ ]*([0-9])" -> "Armor Class: +\1" // "can not " -> "cannot " // "5 turns" -> "1 hour" // "everytime" -> "every time" // "vs spells", "vs. spells", "vs wands" "vs. wands" -> "vs. spell", "vs. wand" // "([1-9])D([1-9]+[0-9]*)" -> "\1d\2" // Nombreuses modifs locales non répétitives pour mieux correspondre à BG2EE // "[\(\-<]([Gg]rumble)[s]*!*[\)\->]" -> "*\1*" // "colour" -> "color" // "Damage[ ]*: [ ]+" -> "Damage: " // "THAC0[ ]*: [ ]+" -> "THAC0: "
et à l'inverse côté BG2EE:
// Mise aux normes BG2 pour ameliorer la comparaison // (ex: ligne 200) caractere special "—" (milieu de ligne) "-" -> "-" (3476 occurrences) // (ex: ligne 2140) caractere special "–" (début de ligne) "-" -> "-" (1550 occurrences) // Ninjato -> Ninjato (exemple @6486, pose pb pour conversion UTF-8 -> CP1252, 44 occurrences)
Mine de rien, cela a un effet non négligeable sur le nombre de cas "exact match", qui sont les seuls véritablement fiables. A noter que les // 1, // 2, ... correspondent au nombre de cycles de tentatives d'améliorations, avec recherche des raisons pour lesquelles la note de correspondance n'était pas suffisante, échantillonnée sur quelques milliers de lignes.
Personnellement, j'en ai ma claque. Consacrer autant d'énergie (plus d'un mois) à un pis aller, cela me donnait l'impression de me battre contre des moulins.
Si le fichier de ToB modifié comme évoqué ci-dessus te serait utile, dis-le moi et je te le mettrai à disposition. Pour celui de BG2EE, le mieux serait de repartir de la version la plus récente (2.3) et non de la 1.3 comme c'était le cas lors de ma dernière génération de fichier tph.
Un souci majeur est que la cible est mouvante, il faudrait relancer l'algorithme à chaque nouvelle version car il y a de nouveaux textes et pleins de textes changent, pour la plupart des cas pour du pinaillage.
A titre d'exemple, pour la V2 de BGEE (qui est déjà traduite), il devait y avoir 500 nouveaux textes et un bon millier de textes modifiés parmi les anciens. Cela a occasionné environ 300 reprises de traductions et donc pas loin d'un millier de différences en VO non significatives du point de vue la traduction, même si dans certains cas il s'agissait de véritables changements ("yes" remplacé par "aye" pour coller au personnage nain, par exemple, sauf qu'en français on ne sait pas le transcrire).
J'imagine que le massacre est au moins du même ordre de grandeur côté BG2EE, même si le nombre de textes ajoutés est moindre, pour une raison bien identifiée (le nouveau tutoriel dans BGEE). En principe, il faudrait relancer tout le traitement sur les textes récents afin d'être sûr que les modifications de description de classe ou de capacité spéciale ne sont pas perdues par la récupération de la traduction d'origine alors que ce n'est plus pertinent.
Dans ces conditions, même si l'idée de partager un dépôt s'avère pratique, se pose la question qu'à chaque nouvelle version du jeu, le fait de regénérer le fichier obligerait à réanalyser tout ce qui a changé.
Si tu souhaites initier un dépôt à partir de ce que tu as déjà repris, n'hésite pas.
Personnellement je n'ai pas le courage de participer à ça. Je préférerais consacrer cette énergie à contribuer à la traduction elle-même, à constituer un fichier tra contenant une traduction ajustée à la VO lorsqu'elle a changé, plutôt que d'éliminer des correspondances douteuses.
En + j'ai des doutes sur un algo de similitude pour un truc comme ça, y a un exemple sur l'un des 1ers textes, de mémoire la description de l'arc long, elle ne change pas vraiment par rapport au texte de tob sauf que le thac0 diminue de 1 et un autre champ des caractéristiques change. Ca ne fait que 2 caractères qui changent, mais pour un truc comme ça c'est carrément critique comme changement !
D'ailleurs je sais pas si t'as vu dans les crédits des autres traducs mais apparemment y a des équipes visiblement "libres" qui ont fait d'autres langages et qui disent qu'ils continuent à faire évoluer la traduction... comme quoi eux aussi ils doivent gueuler des fois !
Pour l'instant l'idée est beaucoup + simple, en gros on repart du texte anglais, on apprend au script à savoir lire les descriptions d'armes et d'objets pour lui faire corriger lui même les traducs fr pour ce genre de truc, et pour le reste on admet que même si beamdog a changé des trucs le sens général reste le même et on garde le texte français d'origine pour l'instant (c'est pas tout à fait vrai partout, je suis tombé sur la description des faeries qui a passablement changé apparemment à moins que ça soit une erreur de traduc peu probable à la base, mais bon... Si tu veux voir c'est 54759, le texte de beamdog dit en gros que ce sont des petites créatures malicieuses, généralement bienveillantes mais que leur disposition peut varier autant que celle des autres races. Le texte français de tob ne parle que de leur représentation - il dit qu'elles sont généralement représentées par des petites femmes ailées mais que cela peut changer ! Donc soit ils ont confondu représentation et caractère ce qui est peu probable, soit ça a pas mal changé !). Ca devrait déjà donner un texte utilisable comme ça, déjà pas mal.
J'avais commencé par faire comme toi, reprendre le texte anglais de tob pour le comparer au texte anglais de beamdog mais y a trop de différences mineures et c'est un bordel monstrueux, le script pète en permanence sur des trucs comme ça, vaut mieux oublier, ou garder ça pour + tard, pour relire le texte.
Après il restera toujours un gros bout de texte à vraiment traduire, genre les npcs ajoutés et cie.
Note pour ceux qui connaissent pas les textes de tob, y a des aberrations dedans aussi, du style les textes des bouquins dupliqués alors qu'avec un fichier comme ça ils devraient utiliser les mêmes indexes de chaines, et pour le dialogue féminin souvent la partie féminine est exactement identique à l'autre ! Un sacré bordel tout ça !
Bah on verra bien où ça nous mène, on peut toujours essayer quelques temps, l'avantage avec git c'est qu'on a le droit à l'erreur, on peut facilement revenir en arrière !
C'est mon + long script jusqu'ici, 189 lignes pour l'instant, mais il marche vachement bien.
C'est assez long à mettre au point parce qu'il faut lui faire traduire tous les petits trucs à la volée et y en a pas mal.
En tous cas c'est sûr ça a de la gueule, ça intercepte le vieux bloc PARAMETRES quand y en avait 1 dans la traduc française et ça le supprime puis ça ajoute à la place la traduc du bloc de la version anglaise. Visiblement ils ont du faire ça de leur côté avec un programme qui parcourait tous les objets pour générer des descriptions + précises donc ça a du sens d'utiliser un script pour traduire tout ça...
Trop tôt pour poster, mais à ce rythme là ça devrait être bon demain (avec de la chance !)
toutes les descriptions d'objets sont mises à jour selon le modèle de la version anglaise et traduites automatiquement par le script. Bon alors il est possible que j'ai pas réussi à choper tous les bouts de textes anglais, il peut encore y en avoir qui trainent au milieu de certaines descriptions, mais là va falloir soit relire beaucoup soit tester. En tous cas y a beaucoup + de traductions dans le jeu du coup, et toutes conformes à la version 2.3 du jeu anglais.
A ce niveau là va falloir tester un peu tout ça pour voir ce qu'il reste comme problèmes.
Ce qui reste évidemment : tous les trucs ajoutés depuis tob par beamdog et dont le script n'a pu trouver la traduction ailleurs (à mon avis il a pas du en trouver énormément mais j'ai pas vérifié). Donc en gros les npcs ajoutés et le mode de jeu supplémentaire doivent être majoritairement en anglais.
Pour le reste on doit avoir presque tout en français.
De mon côté j'ai été voir cette traduction par curiosité, j'étais en train de refaire une partie dans bgee pour aller tester le dlc, donc j'en suis pas encore arrivé à bg2, donc je vais pas tester tout de suite (à part le tout début du jeu que j'ai déjà testé bien sûr !). Donc si y en a qui veulent tester, super, le lien github est toujours le même : https://github.com/zelurker/bg2eetrans utilisez le lien download en haut à droite pour récupérer un fichier zip, remplacez le répertoire bg2eetrans par le répertoire bg2eetrans-master contenu dans le zip et relancez l'install (éventuellement désinstallez complètement bg2eetrans d'abord pour mettre à jour l'interface avec les vrais crédits au moment de la réinstallation).
Voilà si personne ne teste je vais mettre un bout de temps à revenir à ça, mais en tous cas c'était bien !
J'ai lu en diagonale toutes vos discussions, et je ne sais pas si je dois préférer le fichier donné par Isaya en début de topic ou le fichier proposé par Dricks (Fichiers tlk VF pour BG2EE 2.2 à jour) pour ce qui est des textes.
Pour les voix, il n'y en a qu'un seul donc pas de soucis.
Merci !
Android (1.3) : voir ce message
1.3 : voir le premier message de la discussion
2.x : voir ce message pour le point de départ. Ensuite il y a 3 possibilités :
Juste un petit message pour signaler que la decompression de l'archive de zelurker pose problème... Il y a des fichiers qui portent le même nom (la faute aux liens symboliques linux) et si on ne fait pas attention, on écrase les bons fichiers par les liens symboliques linux qui ne servent pas sous windows.
Je recommande de choisir de ne pas écraser les fichiers mais de renommer le deuxième fichier. C'est ce qui marche le mieux.
Je vais tester la trad et si j'ai le temps je ferai un retour.
Merci en tout cas pour les efforts.
Par ailleurs il y a d'autres améliorations :
- désormais aucune voix ne devrait être incorrecte
- des textes propres à la version 2.x de BG2EE communs avec BGEE 2.x ont été intégrés (prêtre de Tyr, chaman)
- de nombreuses textes de BG II satisfaisants en français ont été repêchés
- un mécanisme bien plus strict a évité de reprendre des textes de BGEE moins satisfaisants que ceux de BG II
- de nombreux titres de quête (écran du journal) ont été passés en français par Luren
- dans l'ensemble le nombre de textes traduits et leur qualité a été améliorée
Il s'agit toujours une version française partielle couvrant principalement BG II + ToB originels et de façon incomplète, et en aucun cas d'une véritable traduction.J'ai mis à jour le premier message de cette discussion pour indiquer un lien de téléchargement pour cette nouvelle version adaptée à BG2EE V2.0 et supérieure ainsi que pour reporter les précisions pour installer la version Android.
Après avoir joué un moment, c'est plutôt pas mal. Y a 2 problèmes :
1) les petites retouches ridicules que beamdog a fait sur la traduc anglaise du style ajouter un s, changer un mot de liaison ce genre de truc, tout ça fait foirer la détection du texte et ça fait qu'on se retrouve des fois avec un peu d'anglais au milieu du français. C'est assez rare n'empêche, je m'attendais à en voir +.
2) y a encore des foirages au niveau du gui, rien que nouvelle partie, et lire la description après le 1er choix, c'est pas mal... !!! Là-dessus la traduc du gui est foutument bordelique, au final tout va dans le même fichier dialog.tlk, mais on a 2 traductions séparées, 1 pour le gui, l'autre pour le jeu lui même, du coup y a confusion et on ne sait plus qui fait quoi parfois...
Pour le 1) y avait quand même dans les 2000 chaines environ avec ce problème (sur + de 70 000 ça fait pas tant que ça), donc j'ai refait un script pour détecter les différences par rapport à la version us de tob et quand ça fait moins de 5 caractères, accepter la traduc. Ca fait qu'on gagne + de 600 chaines de traduites en +, j'en ai vérifié pas mal de visu, ça a l'air de très bien marcher.
Pour le 2) c'est un vrai bordel à corriger à cause des confusions et du fait que pour un petit truc détecté rapidement faut trouver quel fichier corriger puis recompiler le truc ce qui prend pas mal de temps puis re-tester en priant qu'on se soit pas gouré. J'ai mis à jour la traduc de bg1ee à partir de ma version, ça permet de récupérer les descriptions manquantes des ennemis jurés des rôdeurs, mais je les ai pas encore toutes corrigées, trop long, trop chiant, mais bon on progresse. C'est mieux en tous cas, et au moins on a plus le bug très visible juste après nouvelle partie !
Corrigé aussi à la main les descriptions d'armures elfiques, on arrivait à comprendre mais c'était bizarre !
Bon va falloir rejouer, désolé pour le bug des fichiers écrasés sosu windoze, j'y avais même pas pensé, normalement windoze suporte les liens symboliques mais ne fait pas la différence majuscule/minuscule d'où l'écrasement. Faudrait probablement refaire toute l'organisation des fichiers en + propre pour éviter ça, mais je ne connais presque rien au weidu, donc dur dur...
Le problème c'est que le répertoire résultat dans lang est fr_fr à la fin vu que toutes les opérations sur les fichiers de weidu se font en minuscules et comme le jeu veut absolument fr_FR, et bin faudra créer un lien symbolique à la main sous linux, c'est le seul qui est obligatoire, sans ça le jeu ne détecte pas du tout le français. Il doit y avoir moyen de lancer une commande pour créer le lien sans passer par weidu mais pour l'instant je sais pas comment faire donc faut le faire à la main.
Ce qui serait pas mal aussi c'est d'éviter d'avoir à virer tout le répertoire fr_FR quand on veut réinstaller ce qui m'est arrivé pas mal dernièrement, parce que ça oblige à virer les voix du coup, même si j'en garde très peu en fr (les anglaises sont généralement mieux, sauf Irenicus qui est excellent en fr !).
Bon enfin du coup ça résoud les problèmes de liens symboliques sous windoze et osx !
Encore corrigé l'une des répliques à Imoen au tout début du jeu qui a été affectée par la màj de la traduc bgee. A part ça tout a l'air bon pour l'instant, on reprendra les tests + tard !
A noter : la 1ère entrée du journal qui apparait quand Imo nous sort de notre prison au début du jeu est une entrée qui n'existait apparemment pas dans le jeu original donc pas de traduc pour celle là !
Nouvelle partie / choix du sexe, ça affiche bien un texte tob dans la vo, en fait c'est parce qu'ils ont copié le gui de bgee, dans bgee le texte à cet endroit là est bon, c'est 24313, mais dans bg2ee 24313 fait référence à un texte tob donc ça marche plus.
Du coup c'est un bug à ne pas corriger, on risque de péter un texte tob sinon !
C'est malin je te jure !!!
Sinon avec un autre script du même genre j'ai ajouté les chaines après 74000 en rapport avec la traduction de tob qui étaient passées à la trappe...
On en est à 82% de texte traduit (en comparant avec le nombre d'entrées dans le fichier us), pas mal quand même.
Il manque encore des trucs visibles du genre des descriptions de sorts, ou des détails dans la description de certains trucs, mais c'est pas mal...
Tiens sinon j'ai aussi fait un petit script pour extraire les voix d'une install tob à partir des dialogues et les convertir en ogg pour bg2ee, au final ça fait un répertoire de 180 Mo quand même. Au cas où ça intéresse du monde je peux le poster, mais c'est du perl donc ça marchera surtout sous linux et osx, avec windows à condition d'avoir un vrai shell genre mingw32... !
Pour ce qui concerne les textes écrasés avec de mauvais textes de BGEE, j'ai écrit un script qui a comparé les notes obtenues par les récupérations depuis ToB et BGEE et qui neutralise la récupération depuis BGEE si elle n'est pas meilleure qu'à partir de ToB. Cela a éliminé un très grand nombre de ces défauts.
Par ailleurs, il y a une évolution majeure concernant les textes nouveaux de BG2EE (après 74106) : j'ai retiré toutes les récupérations, qui ne concernaient que des phrase assez basiques et pas forcément fiable (tutoiement/vouvoiement, prise en compte du sexe du personnage, bug de la notation). Désormais quasiment tous les textes installés dans cette partie sont vérifiés et ceux qui ne le sont pas encore sont suffisamment complexes pour présenter très peu de risques sur le calcul de notes (environ 900 textes au total).
Concernant le problème du répertoire fr_FR qui reste après désinstallation, j'ai passé du temps, essayé plusieurs choses en particulier une désinstallation explicite dans le premier tp2, rien n'y fait, ces satanés fichiers dialog.tlk disparaissent puis reviennent en fin de désinstallation. J'ai laissé tomber pour l'instant.
J'ai regardé rapidement les modifications que tu as apportés pour les noms de fichier/répertoire en minuscule. Celles que tu as apportées aux lignes README et AUTO_TRA dasn bg2eetrans.tp2 ne servent à rien puisque tu as renommé le répertoire du mod en fr_fr et que tu as aussi changé dans LANGUAGE.
Si le nom du répertoire lang/fr_FR est important pour le jeu, tu devrais sans doute laisser fr_FR lorsque tu patches BGEE.sql.
Quant au nom du dossier lang/fr_FR, si c'est important que ce soit en partie en majuscule, modifie simplement les instructions qui font la copie des fichiers tlk :
ACTION_IF ( ~%LANGUAGE%~ STRING_EQUAL_CASE ~fr_fr~ ) THEN BEGIN // Create the language directory if it does not exist ACTION_IF NOT FILE_EXISTS ~lang/fr_FR~ THEN BEGIN MKDIR ~lang/fr_FR~ END COPY ~lang/en_US/dialog.tlk~ ~lang/fr_FR/dialog.tlk~ COPY ~lang/en_US/dialog.tlk~ ~lang/fr_FR/dialogF.tlk~ MKDIR ~lang/fr_FR/override~ // Add the chosen language to BG2EE COPY_EXISTING ~BGEE.lua~ ~override/BGEE.lua~ REPLACE_TEXTUALLY ~ {'en_US', 99385, 99386, 'English'},~ ~ {'en_US', 99385, 99386, 'English'}, {'fr_FR', 1212, 1213, 'Français'},~ UNLESS ~'fr_FR'~ // Add the translated interface file COPY ~bg2eetrans/language/fr_FR/L_fr_FR.lua~ ~lang/fr_FR/override/L_fr_FR.lua~ END
J'ai déjà dépensé beaucoup d'énergie à essayer de fusionner des travaux faits en parallèle par plusieurs personnes sur ce même sujet de la récupération de textes pour BG II, avec des approches différentes et qui présentent la plupart du temps un nombre énorme de différences minimes sans importance, mais qui sont une plaie pour essayer de fusionner sur les différences importantes.
Par ailleurs, j'ai un gros sujet sur la table en ce moment en rapport avec la traduction proprement dite.
Par conséquent je pense que je ne vais pas investir plus de temps à étudier les améliorations que tu as obtenues. Est-ce que ça te dirait d'unir les efforts autour d'un projet commun ?
Finalement on arrive à convaincre le jeu de prendre fr_fr comme langage, me suis aperçu que j'ai plus besoin de mon symlink après avoir tout mis en minuscules donc ça va !
Sinon pour remarque si tu lances la désinstallation comme par la commande weidu au lieu de le faire par l'interface, du genre :
weidu --uninstall ~BG2EETRANS/BG2EETRANSINSTALL.TP2~
puis
weidu --uninstall ~BG2EETRANS/BG2EETRANS.TP2~
à ce moment là tout est propre, les fichiers dialog.tlk sont bien virés et on peut réinstaller sans problème. Je m'en suis aperçu par hasard parce que c'est comme ça que mon script désinstalle tous mes mods quand je veux modifier la traduc !
Par contre ne me demande pas pourquoi ils restent quand on fait la désinstallation en passant par les menus classiques, aucune idée !
Remarque : ça serait probablement + simple de fusionner les 2 tp2, c'est peut-être de là que vient le problème d'ailleurs, surtout qu'il y a de moins en moins de raison de choisir l'une ou l'autre option maintenant qu'on a la partie bgee fiable ! Mais de toutes façons même avant j'ai toujours tout installé !
Ca va je continue à avancer, ma refonte de bgee a évidemment oublié des trucs, donc j'ai déjà regagné dans les 2000 lignes... ! Mais bon au bout du compte si on veut la finir cette traduc il va bien falloir que quelqu'un finisse par vraiment traduire des trucs !
Y a des bizarreries sur des descriptions de certains sorts sur leur portée entre autres c'est pour ça qu'ils n'ont pas été détectés par le machin automatique, j'ai mis ça dans le fichier bgee_manual en commentaire en précisant les différences (en pratique ça change probablement rien du tout au niveau game play, c'est + de l'info théorique).
Y avait aussi une partie des chaines qui n'ont pas été détectées automatiquement parce qu'il y avait des espaces en bout de ligne sur l'une des 2 versions (entre bgee et bg2ee !). Lamentable, ils n'ont même pas d'éditeur qui supprime les espaces en fin de ligne !
Bon là je pense que je vais pouvoir rejouer un moment, le pb avec ma méthode c'est que je mets des mods anglais, du coup ça perturbe !!!
Remarque avec mes nouveaux fichiers pour bgee la régénération par weidu de juste cette partie là est devenue super rapide, excellent pour pouvoir tester rapidement des modifs !
Ca reste très lent pour tob mais là y a eu trop de modifs sur le fichier tob donc ça restera comme ça !
Cool !
(on est tombé à 82% avec tout ce qui a viré, mais en fait c'est visiblement très élevé quand même !)
Y a des surprises aussi du style l'exploitation des fichiers de voix du perso, 16235 par exemple :
bg2ee us : ~To battle, and victory!~ [MALE5A]
bg2 us : ~~ [MALE005A]
mais la surprise ici c'est surtout que les fichiers français sont nommés différemment, c'est pas male005a.wav, c'est homme5a.wav ! Donc quoi, est-ce que le moteur du jeu fait lui même la traduction ? Ca m'étonnerait, surtout ici en fr, du coup à priori va falloir retoucher le fichier dialogtob.tra pour ça, puis coller ça en traduction manuelle dans tob_manual.tph...
bgee us : he
bgee fr : il semblerait que cela n'était pas verrouilé, après tout
et le mieux c'est que c'était pour traduire un mot clé weidu , du coup on le retrouvait partout !!!
M'enfin bon, on avance, on avance...
Le premier installateur est nécessaire pour créer le répertoire fr_FR et y copier les fichiers dialog.tlk. Si ce n'est pas fait, la langue française n'est pas disponible et WeiDU ne permet alors pas de modifier des fichiers tlk dans une langue qui n'existe pas encore. C'est pour cela qu'il faut exécuter WeiDU une seconde fois. Justement, c'est ce que j'ai essayé de te faire comprendre dans mon précédent message. J'ai déjà commencé à reprendre de façon vérifiée par un humain les textes à partir de 74107 (à partir de BGEE et IWDEE) et j'ai également traduit un certain nombre de textes dans cette partie. Dans BG II, FEMALE4 et MALE005 sont les seuls à être référencés dans le fichier tlk et à avoir des fichiers se trouvant dans des fichiers bif. Certains mods ont fait usage de ces voix, Kiara-Zaiya par exemple.
Pour toutes les voix du PJ, il n'y avait jamais d'affichage de texte. De sorte que les fichiers de voix pour le PJ n'avaient jamais aucun lien avec des textes et pouvaient porter des noms différentes de ceux référencés dans le fichier tlk. L'apparition du texte associé aux voix pour PJ est une nouveauté EE.
Le pack de voix que j'ai mis à disposition s'est aligné sur le nommage anglais.
weidu : ok tant pis.
Kiara-Zaiya : par hasard j'ai voulu tester ce mod dernièrement et je me suis pris un joli crash en arrivant dans le secteur des esclavagistes. Comme on a pas de message, j'ai pas cherché à comprendre, quand j'ai trouvé le mod qui causait ça j'ai juste désinstallé, pas trouvé de patch pour ee pour ça.
Pour les voix bah oui soit on renomme les fichiers pour faire comme les voix anglaises, soit on traduit nous mêmes les male en homme et female en femme, pas bien dur non plus, bah n'importe, c'est chiant à faire de toutes façons, je l'ai fait juste pour male5 que j'ai traduit en homme5 en rajoutant les phrases qui vont bien et j'ai trouvé ça chiant et arrêté là ! Au moins ça marche, mais bon....
Me suis amusé à détailler les différences dans le texte tob intégré à bg2ee et celui originalement dans tob us, y a des modifs de dingue là-dedans, des trucs où on se demande si ils les ont pas ajoutés spécialement pour emmerder ceux qui essaieraient de traduire !!! (du genre juste supprimer un r dans rrrrtg, et y en a d'autres... !).
L'idée étant que si on pouvait déterminer précisément où sont partis les bouts de textes de tob on aurait 100% du texte tob traduit, visiblement le texte français est en meilleur état que le texte anglais original, mais c'est + facile à dire qu'à faire avec toutes les modifs de tarés qu'ils ont collées partout...
Enfin bon, on en est à la partie chiante, on a déjà la majorité des textes qui sont faits, donc y aura + de gros ajouts miraculeux maintenant si on veut le finir faut le faire à la main, et c'est beaucoup - amusant (moi j'adorais faire mumuse avec des scripts qui font de la magie, du coup je perds mon intérêt là...).
Et puis aucune envie de traduire leurs npcs, ils sont probablement parmi les + mauvais npcs jamais faits pour bg2 et pourtant y en a des tonnes, quitte à traduire un npc resté en anglais autant prendre kelsey, ça serait nettement mieux !
Bref, je crois que je vais continuer à jouer en prenant des notes au fur et à mesure sur ce que je trouve en anglais sans viser 100%, c'est déjà à un très bon niveau à mon avis...
le forum m'a bouffé ma réponse quand j'ai essayé de faire quote, bizarre...
Bon enfin en tous cas sur l'autre partie, à savoir l'idée de retrouver les bouts de la traduc tob dans bg2ee, et bin mon dernier post était amer parce que je venais de me casser les dents dessus, du genre + d'1h pour 600 lignes de validées, et encore de façon extrêmement compliquée, obligé d'abandonner à ce niveau là.
Mais en fait j'ai trouvé qu'il y a des algos spécialisés pour ce genre de problème, voir par exemple String::Similarity en perl sur cpan ! Avec ça je valide en gros 10 000 lignes à l'heure, enfin un peu + d'1h, mais rien à voir avec les 600 d'hier ! Donc j'en suis à 20 000 là, y en a 74000 donc je suis loin d'être au bout, mais il reste de l'espoir. Si j'y arrive, ça change complètement la partie tob du coup !
Enfin vive git, on a le droit de faire des erreurs et de revenir en arrière avec ça, mais ça serait vachement bien que ça marche !
Alors la fin a été + vite que le début, j'ai mis un peu + de 2h à faire les 50 000 entrées restantes.
Résultat des courses : toute la partie TOB de bg2ee est à 100% en français !!!
Bon, comment ça marche + en détail :
me suis aperçu à force de faire des corrections manuelles sur la partie que je joue que toutes les entrées que j'ajoutais étaient de la forme :
STRING_SET ~n~ @n
c'est à dire toujours la même entrée entre le fichier us de bg2ee et tob us.
De quoi se dire que ça serait quand même vachement bien de trouver les rares entrées qui ne sont pas comme ça, y a moyen de faire du 100% assez facilement dans ce cas là.
D'où un nouveau script, read.pl, qui au lei de chercher n'importe où une correspondance à une entrée du fichier bg2ee us la cherche uniquement pour la même entrée dans le fichier tob us, avec un taux d'erreur maxi de 50%. Ca m'a oblié à retoucher pas mal de choses dans dialogtob, mais pas tant que ça non plus au final.
donc maintenant on prend les 74000 entrées de tob en 1er, puis on colle par dessus les traductions de bgee qui vont bien, et voilà le résultat.
J'ai juste testé le début de partie avec ça, ça a l'air de remarquablement bien marcher !
Je testerai + en détail + tard. De toutes façons à priori y a aucune chance de trouver un texte anglais dans un texte qui appartenait à bg2, au pire vous pouvez peut-être trouver une entrée qui n'a pas été retouchée, mais bonne chance pour s'en apercevoir... A priori ça doit être du tout bon !
En + c'est monstrueusement rapide à installer par rapport au veau qu'on avait avant, là c'est tellement rapide qu'on a l'impression que ça a bugué !
Top ! Bon, je fais un break, j'y retourne tout à l'heure pour tester !
https://github.com/zelurker/bg2eetrans
Cliquez le bouton vert, download zip, et voilà.
De mémoire y a pas de setup.exe pour windoze, récupérez un weidu à jour...
- la traduction des descriptions d'artefacts est faite par un script et il ne sait pas causer anglais, donc dès qu'il y a quelque chose d'un peu spécial, il coince, du coup on se retrouve avec pas mal de texte où y a de l'anglais de mélangé. J'en ai corrigé pas mal, je suis pas sûr d'avoir tout eu, mais je crois, ça apparait surtout dans la partie tob du jeu, là où y a des artefacts vraiment très spéciaux !
- Y a pas mal de chaines après 74106 dans le fichier bg2ee qu'on retrouve pourtant dans la traduction ToB, par exemple une certaine dague +2 du chateau de armise qui apparait comme "dagger +2" si on inclut pas ces traductions ! Donc je les ai remises, ça ralentit sensiblement le traitement, mais bon on avait de la marge, c'était trop rapide !