Derniers journaux de haypo :
- [16/01@02:03] hachoir-subfile : extrait les fichiers contenu dans un autre fichier
- [29/11@22:01] hachoir-metadata cherche des testeurs
- [07/11@15:35] Déshabillez Flash (du son maintenant)
- [05/11@04:10] Déshabillez Flash
- [25/10@21:55] Rejouez chez vous les plus grandes batailles de la guerre du libre
- [24/09@13:47] Les hommes sont des fourmis (Men are ants)
- [11/09@23:15] Dernière avancées du Hachoir (il peut écrire !!!)
- [08/09@02:15] MultiDeskOS et Jayce dans Wikipédia
- [10/07@22:54] Hachoir 0.4
- [16/06@11:03] Progrès dans l'équipe de traduction du jeu Wormux
- [30/05@17:48] Hachoir 0.3 et les méta-données
- [04/05@23:09] Hachoir 0.2 en préparation
- [26/03@01:50] Nouvelles du programme Hachoir
- [11/01@00:36] Wormux 0.7beta1
- [11/12@08:23] Hachoir version 2005-12-11
- [07/12@13:13] J'ai quitté Gnome pour KDE
- [04/12@02:33] Clavier ergonomique, dvorak & cie.
- [15/11@05:36] Projet Hachoir
- [14/11@00:48] Wormux n'est pas mort
- [13/10@21:40] Interreta Televidilo
Journal : Nouvelle version de hachoir-metadata tolérante aux erreurs
Posté par Victor STINNER (page perso, ) le 15 avril 2007http://hachoir.org/wiki/hachoir-metadata
La nouvelle version (0.10) a été réécrite en partie pour être tolérante aux erreurs, ce qui signifie qu'en cas d'erreur le programme ne s'arrête pas mais affiche simplement une erreur. Ceci permet d'extraire les métadonnées de fichiers tronqués ou erronés mais également de tolérer des erreurs dans Hachoir (coeur/parseur fichier).
Détails des changements
Des greffons pour Konqueror et Nautilus font leur apparition. Ils permettent de lire les métadonnées d'un fichier depuis le menu contextuel (clic droit).
De nouveaux formats sont supportés : documents Microsoft Office (Word, Excel, Powerpoint), New-style Executable (programme NE, Windows 16-bit), X11 Portable Compiled Font (.pcf) et Microsoft Archive (.mar).
Les données sont maintenant fortement typées : un numéro de piste est obligatoirement un entier, la date de création doit être une date, etc. Les chaînes de caractères sont maintenant obligatoirement en Unicode. Le filtre automatique des valeurs erronées (durée négative, chaîne vide, etc.) est un plus restrictif.
Enfin, une nouvelle option « --quality » permet de choisir la qualité des informations extraites ou plus exactement le temps alloué à l'extracteur (quality=0 : extraction rapide, quality=1 : extraction la plus complète mais surtout la plus lente). Cette option détermine par exemple le nombre de fichiers traités dans une archive ou la qualité de l'estimation du débit et de la durée d'un MP3 à débit varible (VBR).
Un programme de fuzzing a été écrit spécialement pour l'occasion. Il a permis de corriger énormément de bugs dans les différents composants d'Hachoir.
Nouvelle version des autres composants d'Hachoir
hachoir-core sort en version 0.9 (c'est essentiellement des corrections de bugs). hachoir-parser sort en version 0.10. Les nouveaux formats supportés : Archive Microsoft (.mar), icône animée pour Microsoft Windows (.ani), aide Microsoft HTML (.chm), raccourci Windows (.lnk), X11 Portable Compiled Font (pcf), Adobe Portable Document Format (PDF).
Détails des changements sur :
http://cheeseshop.python.org/pypi/hachoir-core
http://cheeseshop.python.org/pypi/hachoir-parser
Liste complète des formats supportés par Hachoir :
http://hachoir.org/wiki/hachoir-parser
> Lire le journal (8 commentaires, moyenne: 3,4).
Strigi
Je me demandais, comme ça, est-ce que tu penses que ton projet pourrait collaborer avec strigi d'une façon ou d'une autre ? En ce moment il y a un port des KFilePlugins pour extraire les métadonnées http://wiki.kde.org/tiki-index.php?page=Porting+KFilePlugin+(...) . De ce que j'en ai lu il est très rapide.
-
[^]Re: Strigi
Posté par Victor STINNER (page perso, ) le 15/04/2007 à 11:52. (lien). Évalué à 4.J'ai pris contact avec les développeurs, mais pour l'instant on n'a rien fait ensemble. Ils m'ont proposé d'écrire un plugin pour Strigi. Je pense par contre qu'Hachoir est très lent et c'est donc pas une bonne idée de l'utiliser avec Strigi.
bonjour
dabord merci pour cette outil, j'ai essayé de l'utiliser (pensant que c'etait possible hein ! ) pour extraire/detecter une image bmp perdu dans un fichier binaire.
je sais qu'ici ce n'est pas un forum mais j'ai un message d'erreur qui me laisse perplexe:
[err!] [<SpiderManVideoFile>] Hachoir can't extract metadata, but is able to parse: Rom.bin
si je comprend bien il peut le faire mais ne veut pas, et quelque soit l'options passées il me repond toujours la meme chose. Est ce que l'erreur UnicodeDecodeError: 'ascii' codec can't decode byte 0xff in position 0: ordinal not in range(128) que j'obtiens en mode debug expliquerais le probleme ?
d'apres http://www.haypocalc.com/wiki/Hachoir il doit etre possible de : Transformation d'un fichier binaire en document XML représentant sa structure c'est ce qui m'interresse ici.
c'est un fichier de bios, le but etant de changer le logo de demarrage.
http://awdbedit.sourceforge.net/
et Phoenix Bios Editor Pro ne veulent pas toucher a mon bios (Rom.bin)
-
[^]Re: bonjour
Posté par Vador Dark (Jabber id, ) le 15/04/2007 à 11:13. (lien). Évalué à 2.Tu peux toujours tenter de repérer la chaine "BM" dans ton fichier binaire. Tu aura déjà l'offset de l'image dans fichier binaire. Ensuite, si tu connais les propriétés de ton image(couleur, hauteur, largeur), il n'y a pas de raison que la taille du BMP soit différente de celle pré-inclu. Bon, ceci-dit, avant d'aller flasher mon bios avec un fichier après ce genre de bidouille, je me méfierais à mort. On peut imaginer que d'un logiciel à l'autre, le BMP ne soit pas tout à fait de taille identique. On peut imaginer que le logiciel qui inclut le BMP dedans ne l'inclut pas tel quel. On peut imaginer qu'il y ait un BM quelque part sans que ça soit l'image... .
-
[^]Re: bonjour
Posté par dark_star () le 15/04/2007 à 16:06. (lien). Évalué à 2.merci pour vos reponse.
non je n'ai pas peur de flasher mon bios, je pense pouvoir le recuperer assez facilement en cas de pb (rom de rechange)
et un petit http://tux.crystalxp.net/ au demarrage me tente vraiment beaucoup.
voir un
http://www.isc.tamu.edu/~lewing/linux/sit3-shine.7.gif
voila voila
-
-
[^]Re: bonjour
Posté par Victor STINNER (page perso, ) le 15/04/2007 à 11:51. (lien). Évalué à 5.« d'apres http://www.haypocalc.com/wiki/Hachoir il doit etre possible de : Transformation d'un fichier binaire en document XML représentant sa structure c'est ce qui m'interresse ici. »
Hum, effectivement, Hachoir pouvait le faire, mais j'ai supprimé le code car ce n'était pas interactif et pas assez souple. Aujourd'hui, j'utilise uniquement hachoir-urwid qui permet d'avoir une visuallisation de ce genre :
http://hachoir.org/wiki/hachoir-parser/examples
« j'ai essayé de l'utiliser (pensant que c'etait possible hein ! ) pour extraire/detecter une image bmp perdu dans un fichier binaire »
... euh, c'est pas le bon outil, par contre, hachoir-subfile a exactement cet objectif :
http://hachoir.org/wiki/hachoir-subfile
Je n'ai pas encore publié de version stable car l'outil est encore pas mal expérimental, néanmois il est possible de le tester avec :
http://hachoir.org/wiki/Install/snapshot
Il faudra alors utiliser une commande du genre « hachoir-subfile Rom.fin --category=image ».
L'erreur « [err!] [<SpiderManVideoFile>] Hachoir can't extract metadata, but is able to parse: Rom.bin » indique que Hachoir pense que ce fichier est une vidéo du jeu SpiderMan et hachoir-metadata ne sait pas lire les métadonnées de ces vidéos. Bon, c'est un bug, ce fichier n'est sûrement pas une vidéo SpiderMan :-p
gestion de trame ?
Est-ce que hachoir gère les trames ?
En gros, un fichier est le plus souvent une arborescence de champs qui forment des paquets souvent de tailles fixe ou alors avec des tailles précisés.
Un trame, c'est l'inverse. Taille fixe mais donnés pas forcément de taille fixe. J'ai vu un exemple (CCSDS) ou l'entète de trame donnait l'offset de démarage du prochain paquet.
J'imagine que les flux genre mpeg2 doivent avoir ce genre de découpe.
-
[^]Re: gestion de trame ?
Posté par Victor STINNER (page perso, ) le 15/04/2007 à 18:56. (lien). Évalué à 4.Un travail est en cours depuis 6 mois pour supporter les flux fragmentés. Le système de fichier FAT a été le premier à avoir cette fonction, puis Ogg a suivi. Et très récemment, j'ai écrit le support pour les fichiers Microsoft Office qui sont très fragmentés. MPEG TS (Transport Stream) et MPEG PES utilisent aussi le découpage en petit paquet, mais ce n'est pas (encore?) supporté dans Hachoir.
Les journaux sont destinés à des informations qui ne sont pas suffisamment intéressantes
pour être validées en dépêche (sinon n'hésitez pas à proposer votre information en
dépêche), qui sont sans rapport avec Linux ou le libre, ou simplement pour donner votre
avis. Si vous désirez poser une question, merci d'utiliser 

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.
Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.