Dring a écrit 1103 commentaires

  • # Natural Language Generation

    Posté par  . En réponse au journal Wikifunctions est le nouveau projet de le fondation Wikimedia, un wiki de fonctions éditables par . Évalué à 5.

    J'aime pas trop le terme, car dès qu'il est prononcé les gens s'imaginent qu'on parle d'intelligence articielle avancée voire de LLM.

    Mais grosso modo, partir de données structurées et générer un texte lisible par un humain et respectant la grammaire du langage cible, c'est "déjà" du NLG. Et ça implique déjà un bon niveau de complexité (règles d'accord, ajustement grammaticaux divers et variés, voire - mais pas dans le cas de wikipedia j'imagine - choix de synonymes pour rendre le texte moins monotone).

    Donc pour moi, Abstract Wikipedia c'est clairement du NLG. Et une question : où est-ce qu'on peut trouver le code ? Je suis très curieux de voir l'implémentation. J'ai déjà trouvé quelques frameworks open-source, mais pas très convaincants, et qui ne faisaient presque rien.

    Et si quelqu'un se demande "pourquoi utiliser ce type d'outil plutôt qu'un LLM ?", la réponse est généralement : parce qu'on veut être sûr de ce qu'on va obtenir en sortie.

  • [^] # Re: Contexte

    Posté par  . En réponse au lien Wikifunctions is up (read-only). Évalué à 6.

    Il est encore temps d'en faire un journal, en copiant/collant ton premier commentaire à côté !

  • # La tradition avant tout !

    Posté par  . En réponse à la dépêche Décès de Kevin Mitnick. Évalué à 5.

    Décédé ? Ça veut dire quoi ? C’est un synonyme de bronsonisé ?

  • [^] # Re: Alors lisons cette proposition de réglement

    Posté par  . En réponse à la dépêche CRA: L’Europe va-t-elle jeter le bébé du logiciel libre avec l’eau du bain de la cyber-insécurité ?. Évalué à 2.

    Si je comprends bien le journal, depuis la proposition, il y a eu des amendements qui portent justement sur cette partie, et ce sont ces changements qui poseraient soucis. Mais on peut trouver où la version courante ?

    Plus étrange encore, il me semblait que le texte était passé au journal officiel le 7 juin, donc déjà applicable ?

    Je suis perdu…

    https://www.ssi.gouv.fr/actualite/adoption-definitive-du-cybersecurity-act-un-succes-pour-lautonomie-strategique-europeenne/

  • [^] # Re: Github, c'est tout cassé!

    Posté par  . En réponse au lien Gimp 2.99.16 (développement) vient de sortir. Évalué à 0.

    Tout ça c'est ta faute Jehan ! Si tu avais déjà publié une dépêche, personne n'aurait publié un lien sur GitHub !

    (…s'en va en sifflotant l'air de rien…)

  • [^] # Re: différence avec Merlin

    Posté par  . En réponse au lien BirdNET Sound ID App AI-Powered Bird Sound Recognition. Évalué à 6.

    Sachez que mes dernières observations quand à l'usage

    "quant à l'usage"

    Signé : le gars relou de l'après-midi

  • [^] # Re: Erratum

    Posté par  . En réponse au journal [HS] Les Ricards. Évalué à 2.

    Pour avoir déjà vu des personnes se noyer dans un océan de Ricard, je ne peux m'inscrire qu'en faux face à une telle déclaration.

  • [^] # Re: Bob Ricard

    Posté par  . En réponse au journal [HS] Les Ricards. Évalué à 5.

    Il a pas été mercenaire en Afrique, en plus ?

  • [^] # Re: Et la compression fractale ?

    Posté par  . En réponse à la dépêche Des formats d'image. Évalué à 2.

    Oui, je parle de ça. Mais quand je regarde les articles, je retrouve pas le soft que j'utilisais à l'époque. Y'a une référence à la société Iterated Systems. Je pense que j'avais sans doute récupérer une version de leur logiciel.

    Oui, très lent à la compression, très lent à la décompression, mais incroyablement efficace, à une époque ou internet c'était "pour les riches ou les universités américaines" et on devait se contenter des BBS ou du Minitel, donc avec des débits horribles.

    Comme j'ai pu le lire à gauche à droite, l'idée a été tuée par :
    - le fait que y'avait rien pour lire ces images à part un soft payant et cher
    - l'arrivée de l'ADSL
    - l'arrivée de JPEG qui présentait un meilleur compromis taille / durée de traitement

  • [^] # Re: PNG encore utile.

    Posté par  . En réponse à la dépêche Des formats d'image. Évalué à 4.

    D'ailleurs, on a souvent le combo : SVG pour le logo en grand, puis les versions matricielles pour les formats de 8x8 jusqu'à 32x32 voire plus.

  • # Et la compression fractale ?

    Posté par  . En réponse à la dépêche Des formats d'image. Évalué à 3.

    Dans la première moitié des années 90, je me souviens m'être amusé avec des logiciels de compression fractale. J'étais persuadé que c'était des fichiers JFIF, mais d'après https://en.wikipedia.org/wiki/Comparison_of_graphics_file_formats, JFIF est juste un format conteneur.

    Il me semble que la compression était terriblement longue (jusqu'à une heure sur mon 486DX pour des images 640x480 - ce qu'on appelait de la haute résolution à l'époque !). Mais la taille du fichier résultat était ridicule - je ne sais pas comment ça se comparerait avec du WebP aujourd'hui. La décompression était également assez lente.

    Le côté rigolo, c'est qu'on pouvait zoomer à l'infini, y'avait pas de pixelisation. A la place, l'algo "imaginait" l'image.

    J'ai cherché fractal compression sur Wikipedia, mais je tombe sur rien que je reconnaisse. Y'aurait pas un autre fossile dans les parages qui pourrait m'éclairer ?

  • [^] # Re: Quels serveurs recommandez-vous ?

    Posté par  . En réponse au lien Fonctionnalité DNS via HTTPS améliorée avec Firefox 114: options plus détaillées, ajout d'exceptions. Évalué à 2.

    Perso je reste sur la valeur par défaut, donc Cloudfare.

  • [^] # Re: En attendant, dans la réalité...

    Posté par  . En réponse au journal Vraiment toujours pas convaincu par l'Hydroxychloroquine ?. Évalué à 10.

    France-Soir, le journal le plus neutre du monde. Si France-Soir était un pays, ce serait la Suisse.

    …ou pas…

    Tant qu'à citer le parquet, allons jusqu'à la phrase qui suit.

    Cette information judiciaire n’englobe pas les faits relatifs à la prise en charge thérapeutique de la tuberculose et de la Covid-19, évoqués par la mission d’inspection IGAS-IGESR comme susceptibles de constituer des faits de recherches cliniques non autorisés. Ces faits font l’objet d’une analyse complémentaire en cours par le parquet de Marseille

    L'emphase est de moi, j'avoue. Et pour rappel, ça devient ça dans France-Soir :

    En revanche, "Cette information judiciaire n'englobe pas les faits relatifs à la prise en charge thérapeutique de la tuberculose et de la Covid-19", précise sans équivoque le parquet.

    Incroyable, le journaliste a sans doute joué de malchance lorsque ses doigts se sont mis à taper malencontreusement l'opposé de ce que disait le communiqué. Une crise d'arthrose jamais vue avant dans l'histoire de la dactylographie. Il aurait du coup mieux fait d'écrire à ce propos plutôt que sur la perquisition.

  • [^] # Re: Mais au fait…

    Posté par  . En réponse au journal Avis et décisions CADA et génération d'un gros PDF. Évalué à 3.

    Il m'arrive au boulot de recevoir (et d'ouvrir donc) des fichiers de 200,000 lignes sous Excel sans soucis particulier (si ce n'est une certaine lenteur, bien sûr). Donc, ça, c'est pas un problème.

    Les cellules qui font plus d'une page, on est d'accord que c'est inutilisable sur Tableur. Mais en fait, c'est inutilisable tout court, non ? OK, on peut faire une recherche sur un truc, mais ça doit être un rendu de toute façon dégueulasse ; ça ou un fichier texte, y'a vraiment du mieux dans le PDF ?

    En plus, Acrobat (ou les PDF.js et consorts embarqués dans les navigateurs) sont pas des foudres de guerre. C'est pas pire ?

    Et tant qu'on est dans la curiosité, c'est quoi le format de page retenu ? Du A3, pour que chaque cellule tienne effectivement dans une page (et du coup un zoom nécessaire pour naviguer) ? Autre chose ?

  • [^] # Re: Autre solution

    Posté par  . En réponse à la dépêche LoTemplate générateur de documents à partir d'ODT. Évalué à 3.

    Pendant 2 décennies, ça aura vraiment été la différence majeure Unix / Windows. Dans Windows, l'interface graphique était indissociable du reste du système. Progressivement (sur les 5/10 dernières années je dirais, même peut-être même plus) le positionnement a changé.

    A l'inverse, ça m'a aussi posé problème sur Linux. Quand on faisait du Java, et que pour une raison ou pour une autre on avait besoin de certains packages orienté rendu graphique, on se retrouvait avec des erreurs parce que le serveur X n'était pas installé sur la machine. Sous windows, on était sûr de trouver systématiquement toute cette couche.

  • [^] # Re: Autre solution

    Posté par  . En réponse à la dépêche LoTemplate générateur de documents à partir d'ODT. Évalué à 2.

    Pas sûr que tu obtiennes la même qualité de résultat. La sortie PDF de PhpWord est basé sur leur générateur html. Je me demande quelle qualité de pagination tu obtiens dans ces conditions, le respect des lignes veuves/orphelines, la qualité de la césure, la mise à jour d'un index ou d'une table des matières, etc.

    J'imagine que l'intérêt d'utiliser un moteur comme celui de LibreOffice est justement de prendre en compte tout ce qu'un logiciel de traitement de texte sait faire nativement.

    Il y a quelques années, je m'étais retrouvé à coder un truc équivalent sur du pur Windows, avec du OLEAutomation. J'avais d'ailleurs à l'époque (on parle de 1998 environ !) le même problème : Word plantait régulièrement, et pas d'autre choix que de relancer toute la machine. Quand j'avais 1000 rapports à générer, ça foutait vraiment les boules de devoir rester à surveiller le bousin. Et c'était pas du headless, donc ça tournait sur une workstation. Comme ça utilisait le presse-papiers pour gérer certaines problématiques, il était interdit de toucher au PC pendant que ça tournait. Pour marquer les endroits où le texte devait être inséré, j'utilisait la notion de bookmark/signet intégrée à Word, j'imagine que l'équivalent existe dans LO.

  • # Tiens...

    Posté par  . En réponse à la dépêche LoTemplate générateur de documents à partir d'ODT. Évalué à 5.

    …en suivant les liens BIRT, j'ai la moitié des liens qui sont cassés, je me demande ce qui se passe. Ca faisait longtemps que j'avais pas été voir ce projet, je me demande où il en est.

    Et à propos de LOTemplate, j'imagine qu'avec les extensions à venir pour sortir du tableur, il faudra faire un choix dès la conception, i.e. :

    • si je crée un modèle au format ODT, je sortirais soit du word, soit du ODT, mais pas du ODS ou du Excel
    • et à l'inverse, si je crée un modèle au format ODS, je sortirais soit du excel, soit du ODS, pas pas du ODT ou du Word

    Et dans tous les cas, je pourrais sortir du PDF. C'est bien ça ?

  • [^] # Re: Proxy

    Posté par  . En réponse au lien suis-je sur un réseau avec proxy transparent. Évalué à 7.

    Pareil. Du coup on peut dire que ça marche super bien, non ?

  • # Mais au fait…

    Posté par  . En réponse au journal Avis et décisions CADA et génération d'un gros PDF. Évalué à 5.

    …pourquoi un PDF ? Certes on peut chercher hors ligne, mais une fois qu’on a trouvé l’info est vraiment simple à exploiter ?

    Pourquoi un fichier tableur bien formaté ne faisait pas l’affaire ?

    En fait j’imagine peut-être juste pas bien à quoi ressemble le PDF produit.

  • [^] # Re: Alors non.

    Posté par  . En réponse au lien Les réseaux sociaux sont des maladies mentales (par un Ploum qui semble avoir mis fin à sa diète). Évalué à 0.

    Alors histoire de contredire (un peu) mon commentaire précédent, tout ça est sans doute directement lié à la production de dopamine.

    Toute activité qui permet de générer de la dopamine va devenir addictive. Regarder des vidéos TikTok au kilomètre ? Des torrents de dopamine. Ce que je raccourcis en « bêtise » est sans doute une addiction, en effet, et nul doute qu’on a déjà établi ça scientifiquement.

    La bêtise, à mon sens, c’est cette incapacité à prendre du recul et de dire « tiens je viens de passer 3 heures à faire du rien, c’est p’têt pas normal ».

    C’est probablement de la bêtise poussée par un cerveau qui ne veut pas se priver d’un autre shoot de dopamine.

  • # Dans le même esprit...

    Posté par  . En réponse au lien Les réseaux sociaux sont des maladies mentales (par un Ploum qui semble avoir mis fin à sa diète). Évalué à 10.

    Je me rappelle avoir vu un site de photos "juste avant l'accident", essentiellement des selfies de personnes se prenant avec leur smartphone dans une situation ultra dangereuse : devant un précipice, dos à la route, …

    Je pense que l'inconscience et la bêtise font partie de la nature humaine. Le smartphone n'est qu'un révélateur parmi d'autres. Parmi les autres : la voiture et la moto par exemple, où tu vois des jeunes adultes, entraînés par leurs poussées d'hormones, prendre des risques inconsidérés, mais aussi des adultes à l'âge avancé faire pareil "parce qu'ils sont pressés" ou "parce qu'ils ont une voiture/moto sportive, ça serait dommage de pas en profiter parfois".

    Tiens, poussons l'exemple des comportement idiots au volant. Le smartphone. La cigarette. Le café ou toute autre boisson. La recherche des clés qui sont tombées derrière le siège. Se retourner pour engueuler le p'tit dernier qui fait trop de bruit ou a fait tomber sa glace.

    On a tendance à trouver des maladies pour tout de nos jours, mais la bêtise, c'est pas une maladie. Et ça vient pas tout juste de sortir.

  • # Licence ? Téléchargement ?

    Posté par  . En réponse au lien Mojo a new programming language for all AI developers. Évalué à 4.

    J'ai rien trouvé sur le site, sinon une page pour s'enregistrer avant d'avoir accès à quoi que ce soit ? Quelqu'un a fait la démarche jusque au bout ? C'est open source ? J'ai bien peur que non :-(.

    A part ça, j'ai l'impression que c'est "à peine" un nouveau langage, et plutôt du python sous stéroïdes, non ?

  • [^] # Re: Le résumé

    Posté par  . En réponse au lien Blanche Gardin dans « LOL : qui rit, sort » ? L’actrice explique pourquoi ça n’arrivera pas. Évalué à 10.

    Pour le coup, c'est pas toi qui vivrait dans un monde de bisounours ? Tu penses que parmi ceux qui ont accepté l'offre, il y en a beaucoup qui ont reversé tout ou partie des 150k€ restants ?

    Pour beaucoup d'émissions de télé, de galas, d'évènements sportifs, je suis juste horrifié par l'argument "associatif". Je me souviens avoir fait la "course des lumières" de Paris. J'ai regardé avec attention :

    • combien on était dans le village sportif avant le départ,
    • le chèque qui a été remis à l'hôpital sponsorisé,
    • le prix de l'inscription
    • et le fait que des bénévoles avaient récupérés des dons supplémentaires (en sus des inscriptions donc)

    …et c'était juste ridicule. La seule question qui me trottait dans la tête pendant toute la course, c'était "mais où est passé l'argent ?".

    Note que je le savais avant même de m'inscrire, donc quelque part, "y'a pas vol". J'ai fais l'inscription parce que j'avais un peu de pression familiale. Mais il y en a qui s'en mettent plein les fouilles sans scrupules, et je me suis promis de faire plus de dons en 2023 (ce que j'ai fait), et d'aller courir tout seul dans le bois à côté de chez moi le jour de cette course.

  • [^] # Re: Orientation de l’article

    Posté par  . En réponse au lien Frustrated? It's not you, it's Rust . Évalué à 10.

    En tout cas, c'est un article intéressant. Bien écrit, la dose d'humour nécessaire pour rendre ça agréable à lire, et qui explique le "pourquoi" de façon progressive.

    Depuis le début, j'ai du mal à me mettre à Rust car je trouve que la syntaxe devient vite imbittable (je fais le même reproche aux versions modernes de C++ et de Java). A force de vouloir rajouter du sucre syntaxique, on a créé des langages qui flirtent avec l'hyperglycémie.

    Là, certes la syntaxe reste lourde, mais l'approche pas à pas me redonne envie de m'y mettre (ce que je ne ferai probablement pas quand même pour une autre raison toute bête : je suis un gros faignant).

  • [^] # Re: Pourquoi faire ?

    Posté par  . En réponse au lien FerretDB 1.0 GA - a truly Open Source MongoDB alternative. Évalué à 5.

    J'ai loupé quelque chose

    Oui. Le NoSQL c’est hype. Ça permet de recoder à la main tout ce qu’une base de données relationnelle fait par défaut avec l’intégrité référentielle. Si c’est pas le progrès, qu’est-ce que c’est ?