Journal Forvo: faut-il contribuer?

Posté par  (site web personnel) .
Étiquettes : aucune
8
26
déc.
2010
J'ai découvert le site "forvo.com" (un lien récent sur DLFP). C'est une base de donnée de prononciations de mots. Celles-ci sont fournies généreusement par les utilisateurs. Pour un mot donné, on peut avoir plusieurs langues, et plusieurs prononciations par langue. En plus ça fonctionne sans Flash. Bref, c'est très pratique.
Les données sont fournies sous license Creative Commons.
Au début je me suis dis: "cool". Puis quand j'ai regardé l'API d'utilisation, j'ai vu qu'on était limité à 1000 mots par jour (oui, ce qui m'intéressait c'était de savoir si on pouvait tout pomper). Bref, le partage des données soumises par les utilisateurs est un leurre, Forvo en devient propriétaire et en permet leur utilisation jusqu'à ce qu'ils changent d'avis. Impossible de faire un "fork" à tout moment. Ce n'est pas du tout un Wikipedia de la prononciation.
Bien sûr rien n'est gratuit dans le monde, ils ont évidemment prévu de rentabiliser leur investissement (développement, hébergement).
D'un point de vue général, je crois que tout projet "crowd sourcé" ne vaut que si on a la garantie d'avoir accès à tout moment à l'ensemble des données. On ne m'y reprendra plus!

Je me dis que ça vaudrait le coup de rajouter un tel projet à Wikipedia, ou alors une telle fonctionnalité à Wiktionnary. (je sais, yakafokon). La prononciation est parfois disponible dans ce projet, mais c'est loin d'être aussi convivial que Forvo (son système de demande, les votes, la localisation des contributeurs).
Je me dis que pour peu que les utilisateurs aient un outil sympa d'enregistrement (qui vire le bruit, tronque les blancs), ça devrait être possible très rapidement de se créer une base libre de son: c'est beaucoup plus facile que d'écrire un article ou expliquer un mot.
  • # swac tools, projet shtooka

    Posté par  (site web personnel) . Évalué à 5.

    Pour les outils, il y a le swac recorder
    http://shtooka.net/soft/shtooka_recorder/en/
    un petit tuto (en anglais ici)
    http://www.youtube.com/watch?v=AcJoLBjUOaY

    par contre il est windows-only et ne vire pas le bruit de son, mais pour connaitre les gens du projet, il me semble que l'un d'eux travaillait sur une nouvelle version, portable, du code, donc peut-être voir avec eux où ça en est etc.

    et l'ensemble des collections qu'ils ont enregistrés sont disponibles ici
    http://swac-collections.org/

    Après il est vrai que le projet en lui même porte une attention très particulière sur la qualités des audios (rien à voir avec Forvo, je vous laisse écouter), et que donc ils n'acceptent pas n'importe quels enregistrements, mais rien n'empêche de créer un petit frère à ce site plus orienté "quantité que qualité".

    mes 2 centimes
    • [^] # Re: swac tools, projet shtooka

      Posté par  . Évalué à 3.

      Et aussi tatoeba : http://tatoeba.org
      Il n'y a pas beaucoup de prononciation actuellement mais c'est prévu.
      L'avantage de ce projet par rapport à shtooka, c'est qu'il présente des phrases complètes et tournures idiomatiques.
      • [^] # Re: swac tools, projet shtooka

        Posté par  (site web personnel) . Évalué à 5.

        à terme l'ensemble des audios de tatoeba (je suis un des admins et la voix française), seront disponible sur swac-collection vu que c'est grâce à eux et aux matériels qu'ils nous ont prêté qu'on peut fournir des audios. Comme ça il y aura un endroit où "tout pomper" (et sur swac collection on peut voir les "métas" des audios, choses que pour des questions d'ergonomies on n'affiche sur tatoeba), c'est juste que l'admin de swac-collection n'a pas encore eu le temps de packager mes audios (au besoin je peux héberger en attendant un tar de tous les audios)

        ah oui les audios sont sous CC-BY (comme les phrases), donc mangez-en

        et normalement l'université où j'enseigne actuellement devrait me fournir incessamment sous pneu du matériel pour enregistrer, donc je devrais être en mesure de fournir plus.
        • [^] # Re: swac tools, projet shtooka

          Posté par  (site web personnel) . Évalué à 3.

          Je me réponds pour dire que l'université chinoise ou je suis me permets d'utiliser leur laboratoire de langue, où ils ont vraiment du matériel pro (micro statique, salle de mixage, salle d'enregistrement avec moins de 20dB de bruit de fond). Donc delta mon emploi du temps / le leur, à présent je peux enregistrer des phrases / mots français avec une qualité d'écoute parfaite :)

          Ils ont bien aimé swac-recorder d'ailleurs, et m'ont dit qu'ils l'utiliseraient sûrement à l'avenir pour leurs propres besoin, j'essaierai de négocier pour récupérer les enregistrements qu'eux font.

          comme quoi suffit juste de demander
      • [^] # Re: swac tools, projet shtooka

        Posté par  (site web personnel) . Évalué à 3.

        L'avantage de ce projet par rapport à shtooka, c'est qu'il présente des phrases complètes et tournures idiomatiques.

        De mon point de vue, son plus gros avantage par rapport à Forvo est d'être libre. Reste plus qu'à avoir la même (ou mieux) qualité/quantité...
  • # Dump

    Posté par  . Évalué à 6.

    Je ne vois pas vraiment de problèmes à des limites de consultation de l'API, parce que ça serait normal que les gros utilisateurs payent par exemple.

    En revanche, s'il n'y a pas moyen de récupérer une archive qui contient toutes les données sous CC (c'est possible avec tous les projets Wikimedia, et MusicBrainz), c'est un vrai problème.

    DLFP >> PCInpact > Numerama >> LinuxFr.org

    • [^] # Re: Dump

      Posté par  . Évalué à 4.

      De toute façon c'est une licence non-libre (limitation non-commerciale).
      • [^] # Re: Dump

        Posté par  . Évalué à 1.

        Et c'est très bien comme ça.

        Si je contribue volontairement et bénévolement à un projet en produisant des données,ce que je veux c'est que ce soit utile à des gens (ie des personnes physiques, avec du vrai sang, des vrais os et un vrai cerveau). Je ne veux pas que des machins à but lucratif usent directement de mes contributions pour engranger des richesses. Ce n'est pas en tout cas l'esprit qui anime mes contributions.


        (Après quand je rapporte un bug sous tel ou tel projet, mettons le noyau, que des sociétés comme Red Hat en profite indirectement ça me gène moins, c'est indirect, et ce n'est pas mon travail volontaire et bénévole qui est exploité mais son effet.)
        • [^] # Re: Dump

          Posté par  . Évalué à 4.

          Je voudrais éviter de lancer un troll, mais le problème c'est que le « non commercial » est assez difficile à définir, et pourrait interdire des utilisations intéressantes. Par exemple, MusicBrainz gagne de l'argent avec mon travail − et j'en suis bien content car ça permet enfin d'avoir des développeurs à plein temps et des serveurs performants.

          Mais en fait je viens de voir que… certaines choses (heureusement parmi les moins importantes) sont sous licence non commerciale, et seul MB peut les exploiter commercialement : http://musicbrainz.org/doc/MusicBrainzLicense

          À priori, ça ne me gène pas, mais si jamais MusicBrainz disparaît, personne d'autre ne pourra reprendre les données et avoir le même système.

          DLFP >> PCInpact > Numerama >> LinuxFr.org

        • [^] # Re: Dump

          Posté par  . Évalué à 6.

          > Je ne veux pas que des machins à but lucratif usent directement de mes contributions
          Quand tu contribues du code à un logiciel libre, le principe est que ce code sera inclus dans une distribution. Red Hat, Mandriva ou même Linux Mag avec son Cd mensuel. Si ton code a une clause non commerciale, aucune distribution majeure ne pourra l'intégrer. Le code ne pourra pas non plus être intégré sur un CD distribué dans une conférence, ni avec un magazine, ni en téléchargement sur une page d'une entreprise, ni une page personnelle comportant de la publicité. Ton code ne pourra pas non plus être forké sur une forge internet (publicité). Je ne suis pas sûr que je puisse envoyer un tar.gz par mail (deux lignes de pub dans la signature). Bref ton code ne sera jamais distribué à personne. Bizarre si tu veux faire du libre.

          Note que les licences libres n'incluent jamais de restriction non commerciale, et CC est le seul organisme émetteur de licences qui en offre la possibilité (pour permettre à un même auteur de faire du libre et du non-libre dans le même cadre juridique). Les textes et images de Wikipédia n'ont pas non plus de restriction. Un éditeur allemand a par exemple vendu une version papier d'un dictionnaire basé sur Wikipédia, et a fait des profits. Cela a été vécu comme une victoire par les contributeurs.

          Tu es libre de contribuer où tu veux, mais pour information, les projets libres que tu utilises tous les jours ne restreignent pas l'utilisation commerciale, et s'ils le faisaient tu ne serais pas en mesure de les utiliser.
          • [^] # Re: Dump

            Posté par  (site web personnel) . Évalué à 3.

            Zut, j'ai dit la même chose en plus bourrin.
            Faudrait que je stocke ton commentaire et le ressortir à la place d'être plus agressif. Dit, ton commentaire est libre (usage commercial inclus évidement, nous parlons de libre)? ;-)
            • [^] # Re: Dump

              Posté par  . Évalué à 6.

              Pas de souci, on va dire que tout ce que j'écris est CC-by-sa 3.0. Hésite pas à vendre des bouquins avec les meilleurs trolls de linuxfr copyleft JGO/Zenitram, et bons bénéfices.
        • [^] # Re: Dump

          Posté par  (site web personnel) . Évalué à 6.

          Je ne veux pas que des machins à but lucratif usent directement de mes contributions pour engranger des richesses.

          D'une OK, donc tu n'aimes pas le libre (la liberté de diffuser le code, quelque soit la commerciabilité, ça c'est le libre. Limiter à du non commercial n'a plus grand chose à voir avec le libre), admettons, c'est ton choix et tu es très libre de faire ce choix, mais j'espère que tu es bien conscient que le libre et toi ça fait deux.

          De deux tu te fais avoir avec ce projet si tu contribues "parce que le NC c'est bien" : "L'intégralité du contenu de Forvo, ainsi que le contenu mis en ligne par les utilisateurs (notamment les enregistrements), sont la propriété de Forvo, (...)", ça veut dire que eux comptent bien en faire un usage commercial et donc comptent bien user directement de tes contributions pour engranger des richesses. A fond même à mon avis.
          • [^] # Re: Dump

            Posté par  (site web personnel) . Évalué à -1.

            > Je ne veux pas que des machins à but lucratif usent directement de mes contributions pour engranger des richesses.

            D'une OK, donc tu n'aimes pas le libre (la liberté de diffuser le code, quelque soit la commerciabilité, ça c'est le libre


            "Je n'aime pas une des conséquences du libre" impliquerait "je n'aime pas le libre" ? C'est du genre, tu n'es pas mon ami alors tu es mon ennemi ? C'est fallacieux, à mon humble avis.

            S'il existe une version non-libre des CC, utilisée, c'est bien parce qu'il y a des gens pour penser autrement. En espérant que j'ai bien compris les motivations de tcourbon, il pencherait plutôt contre le côté privateur des licences libres. Je m'explique, en forçant le trait.

            On suppose que toute liberté laissé à l'ennemi est une liberté à laquelle on renonce. On suppose aussi que les entités commerciales utilisent la privation de liberté pour arriver à leurs fins. Laisser les commerceux exploiter quelque chose de libre leur donne plus de pouvoir pour attaquer les intérêts du Libre. C'est, toujours à mon humble avis, presque un acte politique. De plus, les CC non-libres permettent quand même à l'auteur lui-même d'accorder l'exploitation à qui il veut.
            • [^] # Re: Dump

              Posté par  . Évalué à 3.

              "Je n'aime pas une des conséquences du libre" impliquerait "je n'aime pas le libre" ?

              Tu n'as pas écrit Je n'aime pas mais Je ne veux pas, ça implique donc que tu ne veux pas faire de libre (je n'ai personnellement rien contre ça, il faut juste assumer qu'on aime pas le libre).

              S'il existe une version non-libre des CC, utilisée, c'est bien parce qu'il y a des gens pour penser autrement.

              Il existe aussi plein d'autre licence propriétaire (dont le droit d'auteur par défaut), je ne vois pas le rapport avec le libre.

              Laisser les commerceux exploiter quelque chose de libre leur donne plus de pouvoir pour attaquer les intérêts du Libre.

              C'est aussi ne pas accorder ce droit à toutes les boîtes qui font du libre, à tous ceux qui voudraient remboursé (une partie du) le coût de la diffusion ce ces œuvres.

              De plus, les CC non-libres permettent quand même à l'auteur lui-même d'accorder l'exploitation à qui il veut.

              En pratique, c'est inutilisable, car impossible de contacter facilement les auteurs.

              « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

              • [^] # Re: Dump

                Posté par  (site web personnel) . Évalué à -1.

                Tu n'as pas écrit "Je n'aime pas" mais "Je ne veux pas", ça implique donc que tu ne veux pas faire de libre (je n'ai personnellement rien contre ça, il faut juste assumer qu'on aime pas le libre).
                Je considère comme acquis pour la suite qu'on peut "aimer le libre" et refuser pourtant d'en faire à l'occasion.

                >Laisser les commerceux exploiter quelque chose de libre leur donne plus
                >de pouvoir pour attaquer les intérêts du Libre.
                C'est aussi ne pas accorder ce droit à toutes les boîtes qui font du libre, à tous ceux qui voudraient remboursé (une partie du) le coût de la diffusion ce ces œuvres.

                >>De plus, les CC non-libres permettent quand même à l'auteur lui-même
                >>d'accorder l'exploitation à qui il veut.
                > En pratique, c'est inutilisable, car impossible de contacter facilement les auteurs.


                Je suis bien d'accord avec ça. Trop d'ouverture permet aux "méchants" de l'utiliser. Pas assez, empêche les "gentils" de l'utiliser. C'est pour ça que je place la décision de l'ordre du politique parce qu'il faut décider sans être sûr du résultat. On est dans une situation où on ne peut pas donner gain de cause à tout le monde (Optimum_de_Pareto).
                • [^] # Re: Dump

                  Posté par  . Évalué à 2.

                  Je considère comme acquis pour la suite qu'on peut "aimer le libre" et refuser pourtant d'en faire à l'occasion.

                  Je n'appelle pas ça aimer le libre mais aimer profiter du libre.

                  « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

                  • [^] # Re: Dump

                    Posté par  (site web personnel) . Évalué à -1.

                    >>Je considère comme acquis pour la suite qu'on peut "aimer le libre"
                    > et refuser pourtant d'en faire à l'occasion.
                    Je n'appelle pas ça aimer le libre mais aimer profiter du libre.


                    Ça dépend de plein de paramètres. À titre personnel, on peut fort bien faire du libre et recevoir des compliments de Vrms. À titre professionnel, on peut fort bien faire... ce que veulent le patron et les collègues.

                    On profite du libre s'il était tout à fait possible de ne faire que du libre. Quelqu'un qui diffuse ses œuvres en non-libre, CC-BY-NC y compris, peut très bien le faire temporairement pour éviter de se faire piquer les idées. Ou pour une autre raison, laissée libre à l'auteur.

                    Dans un autre registre, ceux qui utilisent la BSD (pile IP, au hasard...), sans recontribuer en retour en profitent aussi. Mais, puisque c'est la volonté de la licence BSD, est-ce encore profiter ?
                    • [^] # Re: Dump

                      Posté par  (site web personnel) . Évalué à 2.

                      Quelqu'un qui diffuse ses œuvres en non-libre, CC-BY-NC y compris, peut très bien le faire temporairement pour éviter de se faire piquer les idées. Ou pour une autre raison, laissée libre à l'auteur.

                      Argument classique de ceux qui n'aiment pas le libre : ne pas laisser la liberté, retenir les informations, dans le but d'avoir un avantage par rapport à d'autres personnes qui pourraient faire mieux dans le futur. 0% d'idées du libre, fail. Le libre, c'est justement pour laisser les gens "piquer" les idées! Ce que tu veux éviter, c'est le libre! Donc dire aimer le libre tout en voulant éviter ses bases, c'est quand même gros.

                      Tu as beaucoup à apprendre sur les principes fondateurs du libre, à commencer par les 4 libertés, dont :
                      http://fr.wikipedia.org/wiki/Culture_libre#Culture_libre_et_(...)
                      "la liberté de la modifier et de diffuser des copies de l'œuvre résultante." (sous-entendu : sans limitation, en vente ou pas, au choix)

                      Encore une fois, il n'y a pas de mal à ne pas aimer le libre, ou vouloir ne pas faire de libre dans certains cas car ça ne rentre pas dans les "modèles de développement", et vouloir "éviter de se faire piquer les idée" comme tu dis. Pas de mal, mais ce n'est pas le libre.
                    • [^] # Re: Dump

                      Posté par  . Évalué à 2.

                      À titre personnel, on peut fort bien faire du libre et recevoir des compliments de Vrms

                      vrms ne complimentent que ceux qui utilise du libre pas ceux qui le font.

                      Dans un autre registre, ceux qui utilisent la BSD (pile IP, au hasard...), sans recontribuer en retour en profitent aussi. Mais, puisque c'est la volonté de la licence BSD, est-ce encore profiter ?

                      Évidemment, comme tous ceux qui utilise des logiciels GPL sans y contribuer.

                      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

            • [^] # Re: Dump

              Posté par  (site web personnel) . Évalué à 2.

              S'il existe une version non-libre des CC, utilisée, c'est bien parce qu'il y a des gens pour penser autrement.

              Oui, il y a (beaucoup) de gens qui n'aiment pas le libre, et je ne les insulte pas, je ne les trouve pas idiots, ils sont libre de ne pas aimer, et on a des licences CC pour eux, il n'y a pas de problèmes.

              C'est, toujours à mon humble avis, presque un acte politique

              Donc tu n'as absolument rien compris au libre : le libre ne fait pas de politique.

              Le libre permet de construire une bombe nucléaire et tuer des milliards de personnes (y compris des libristes), beurk le libre, mais le libre c'est ça.
              le libre permet de jouer en bourse en jouant à qui a la plus grosse, mais le libre c'est ça.
              Le libre, c'est ne pas faire de différence. Le libre permet de tuer les libristes, oui, et on ne change pas la licence pour ça!

              De plus, les CC non-libres permettent quand même à l'auteur lui-même d'accorder l'exploitation à qui il veut.

              Même cas avec Microsoft : je peux avoir Windows en libre (suffit de négocier avec Microsoft). Ca ne fait pas de Windows un truc libre. Tu n'as rien compris au libre (on regarde la licence au moment où on a le produit, pas après négociation, théorie de l'île déserte)

              "Je n'aime pas une des conséquences du libre" impliquerait "je n'aime pas le libre" ? C'est du genre, tu n'es pas mon ami alors tu es mon ennemi ? C'est fallacieux, à mon humble avis.

              Le seul hic est que tu n'aimes pas ce qui fait le pivot du libre : ne pas faire de différence arbitraire (genre NC). A partir de la, difficile de dire que tu aimes le libre. Met une -NC au libre, et 99% des projets libres (Linux compris) disparaissent.

              Sinon, ça en fait un ennemi que pour toi, personnellement le proprio (-NC compris) ne sont pas mes ennemis, j'en utilise plein, juste je suis conscient que ça n'a rien à voir avec le libre.
              • [^] # Re: Dump

                Posté par  (site web personnel) . Évalué à -3.

                >>C'est, toujours à mon humble avis, presque un acte politique
                > Donc tu n'as absolument rien compris au libre : le libre ne fait pas de politique.


                Si je n'ai pas compris (par hypothèse) une partie du libre, alors je n'ai rien compris au libre... Et ad hominen si on lit la suite de ta réponse...

                On ne se connait pas tant que ça, je pense. Serait-il possible que tu mettes un bémol à ta harangue ?
  • # Contribue aux projets Wikimedia

    Posté par  . Évalué à 4.

    > Je me dis que ça vaudrait le coup de rajouter un tel projet à Wikipedia,
    Tu peux constater certaines pages de la wikipédia anglophone comme le wiktionnaire sont accompagnées de prononciations. Pour l'instant, les anglophones ont de l'avance sur la quantité de mots, mais il ne tient qu'à toi de rejoindre le projet francophone : Projet:Prononciation.
  • # La beauté des licences non libres

    Posté par  (site web personnel) . Évalué à 10.

    Tu sers juste de contributeur gratuit, dans un seul sens (toi vers eux), et eux se font le fric (licence "Non Commercial", donc non libre).

    C'est ça de parler de "Creative Commons" sans séparer les licences libres de celles non libres, au final ça fait croire que certaines entreprises sont "dans le mouvement du libre" alors qu'ils ne font que t'utiliser, ça va revenir dans le gueule du libre de ne pas mettre assez les point sur les i sur la ce qui fait le libre.

    Donc :
    "faut-il contribuer?"

    Je dirai, à la vue de la licence, que tu serais bien bonne poire de leur donner sans pouvoir recevoir autant que tu donnes de ton côté (toi tu donnes avec une autorisation pour eux de faire du commercial, eux te rendent sans ce droit)
    • [^] # Re: La beauté des licences non libres

      Posté par  . Évalué à 4.

      oui, c'est pour cela qu'il y a la gpl .... on donne en _obligeant_ à rendre sous le même régime...
      :-))

      Zoyeux Noyelle...
      • [^] # Re: La beauté des licences non libres

        Posté par  (site web personnel) . Évalué à 0.

        pour des sons, une licence libre sans copyleft fort obligatoire - que ce soit la BSD 2-clause, la CC-by, la WTFPL - peuvent convenir.

        Ce serait pour des images issues de modélisation 3D ou vectoriel, dont les sources sont identifiables, la GPL pourrait avoir son intérêt effectivement ;-)
    • [^] # Re: La beauté des licences non libres

      Posté par  . Évalué à 6.

      moi j'attends juste qu'ils ouvrent leur API pour me permettre de contribuer depuis l'interface de Skype.

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.