Aller au contenu principal
Body

Recherche

Au-delà du projet de la localisation de Common Voice en langue kabyle

Nous avons lancé depuis des mois la localisation du site Common Voice de Mozilla en langue kabyle dans l'espoir de collecter des données vocales en langue kabyle. L'objectif de la localisation du site étant atteint.

La locale kabyle dispose actuellement d'une place parmi d’autres langues à travers le monde. Le site est accessible en ligne sur l'adresse: https://voice.mozilla.org/kab, où des contributeurs commencent déjà à enregistrer leur voix sur les corpus en kabyle déjà exposés et participer à la présélection des enregistrements effectués.

L'enregistrement de la voix se fait actuellement sur la base d'un corpus de 3000 phrases intégrées par une équipe de contributeurs.

Nous comptons atteindre un objectif de 1000 heures d'enregistrements libres de droit, destinés à produire des modèles d’apprentissage vocaux kabyles, à utiliser librement sur les dispositifs numériques. Les 1000 heures d’enregistrements sont absolument  nécessaires pour produire un moteur vocal kabyle de haute qualité.

Il s'agit donc de pouvoir générer des modèles pré-entrainés pour alimenter les moteurs vocaux:

  1. Un moteur text2Speech: Il permettra d'interagir avec les machines en leur fournissant du texte en kabyle et la machine pourra le lire. Hormis les usages courants, ce type d'outils permettra aussi aux personnes dans l'incapacité de parler en kabyle pour différentes raisons (non maitrise, incapacité physique) d'interagir avec des kabylophones via la parole.

  2. Un moteur speech2text: Il permettra d'interagir avec les machines en leur fournissant de la voix en kabyle et la machine pourra le traduire en texte. Hormis les usages courants, ce type d'outils permettra aussi aux personnes dans l'incapacité d'écrire en kabyle pour différentes raisons (non maitrise, incapacité physique) d'interagir avec des kabylophones par l'écrit (emails, rédaction de papier...).

Deux projets parallèles sont lancés par Mozilla pour accompagner Common Voice, et que nous espérons investir très prochainement pour entrainer les données collectées via Common Voice pour intégrer la langue kabyle:

  1. Le projet DeepSpeech: Il fait partie du projet Common Voice. DeepSpeech est un moteur Speech-To-Text (voix->texte) opensource, utilisant un modèle entrainé via les techniques d'apprentissage automatique, il se base sur le document de recherche de Baidu- Scaling up end-to-end speech recognition- accessible sur l'adresse: https://arxiv.org/abs/1412.5567. Le project DeepSpeech utilise le projet TensorFlow de Google pour rendre l'implémentation  plus simple.

  2. Le projet TTS. Le projet TTS (Text 2 Speech - Texte->Voix) a pour objectif de produire un moteur TTS léger mais avec une très grande qualité de synthèse vocale.

Ainsi, nous lançons un appel à toutes les bonnes volontés et en particulier la communauté scientifique/académique pour intégrer ce projet en fournissant des corpus, mais aussi au grand public des quatre coins de la Kabylie pour lire et enregistrer leur voix sur le site Common Voice tout accent confondu.

Les corpus devront respecter les conditions suivantes:

  1. Le corpus consiste en phrases de taille petite et moyenne, ne dépassant pas 10 secondes à la lecture.

  2. Ces phrases devront être construites à partir de ressources libres de droits.

  3. Elles peuvent être issues du langage quotidien, des poèmes, articles de journaux, romans, nouvelles, textes de chansons, proverbes, devinettes, script de films, théâtre,

  4. Ces corpus doivent respecter la syntaxe en usage  dans les écoles et universités en Kabylie.

  5. Ces corpus ne doivent contenir que le langage kabyle.

  6. L'auteur du corpus devra donner ses sources et devra s'identifier: Nom, email et occupation.

  7. Les phrases devront être rédigées sur des fichiers textes encodées en utf8 (Word par défaut gère utf8). Une phrase par ligne.

  8. Les corpus peuvent être envoyés à l'email: belkacem77@gmail.com ou via un Pull Request (insertion) sur le dépôt github : https://github.com/belkacem77/tuddar

  9. Pour enregistrer votre voix en lisant des phrases ou pour participer à la présélection des enregistrements, rendez vous sur l’adresse :  https://voice.mozilla.org/kab.

Une fois collectés, ces corpus seront analysés, vérifiés syntaxiquement. Les doublons seront écartés pour ne pas exposer les mêmes phrases plusieurs fois sur Common Voice.

Ce projet n'a pas pour vocation de produire un outil d'apprentissage phonologique/phonétique pour le kabyle, mais un outil de reconnaissance vocale de grande envergure (taille et qualité) destiné à intégrer les machines.

(*) Mohamed Belkacem est ingénieur informaticien - Consultant ERP et administrateur de la locale kabyle Chez Mozilla

 

Auteur
Mohand Belkacem (*)
 

Commentaires

Permalien

Qui dira dans un passé récent que cela pourrait se produire? Le Kabyle qui intégre la technlogie. J'ai lu des articles déjà publié et j'ai vu des logiciels en kabyle grace à cette équipe.

Merci les jeunes

Permalien

Il faudrait nous donner vos adresses Facebook et LinkedIn

Permalien

tannemirt-il a gma ɣef leqdic agi

Permalien

Mon avis de chercheur dans le domaine est que ce projet est de la poudre aux yeux pour impressioner seulement.
Les objectifs déclarés, c'est à dire convertir automatiquement des textes écrits dans notre langue à la parole et vice-versa, ne pourront pas être atteints avec l'approche préconisée, pour les raisons suivantes:
- bases linguistiques de la langue pas encore suffisament documentées;
- écriture instable;
- les approches et modèles statistiques telles que ceux utilisés dans DeepSpeech sont limitées en ce qui concerne la qualité des résultats que l'on peut obtenir et ainsi limitent les applications utiles qu'on pourrait en tirer.

En passant, je signale que le niveau de qualité de langue utilisé sur le site https://voice.mozilla.org/kab laisse à désirer (bien qu'on remarque une légère amélioration de l'orthographe par rapport aux autres sites localisés antérieurement).
Pour citer quelques exemples:
- fautes d'orthographe: "walli" au lieu de "wali", "affus" au lieu de "afus", "tafyir" au lieu de "tafyirt", ...
- notation insatisfaisante: "taɣect" au lieu de "taɣʷect", "nebɣa" au lieu de "nevɣa", ...
- emploi d'arabismes quand un synomyme autochtone existe: "heddṛen" au lieu de "ttmeslayen", ...
- structures non autochtones: " Nwala d akken ayagi ...", au lieu de "Nwala ayagi ..."
- phrases trop longues et manque de ponctuation
- sémantique pas soignée: "yimdanen ilawen" au lieu de "yimdanen" tout court

En conclusion, on peut participer dans ce projet pour s'amuser mais il ne faut pas se leurrer quant à la possibilité d'atteindre les objectifs déclarés. Il faut d'abord poser et solidifier les bases avant de songer à se lancer dans projets grandioses inadaptés et sans chance de résultats utiles.

Permalien

Maintenant , on comprend bien qu'il y a langue kabyle , et langue tamazigh , sort du bois et dis nos vos plans , mais n’oublier pas que ni Massinissa, ni Yougratha, ni Takfariness , ni el kahina n'a parlé cette langue de kabyle

Permalien

Est-ce que ceux qui contribuent leur temps et leur voix à ce projet seront compensés ?

Permalien

Je voudrais participer depuis les Etats-Unis. C'est possible?

Permalien

Il faut arrêter d'essayer d'impressioner et de gagner du prestige et de la visibilité en bricolant une place dans des projets d'autrui. Il faut être capable de créer soi-même ce qui servira pour notre langue et notre peuple.

Permalien

En lisant les commentaires plus haut, on se rend compte du désastre sociologique dans lequel est plongée la société kabyle. Des jeunes dépourvus de moyens qui tentent de propulser leur langue le plus haut possible.
Il me semble que ce projet est ouvert en lisant les informations sur le site donnée dans l'article. Ce qui veut dire qu'en cas d'erreur, ils peuvent eux même corriger. Sinon, sur le plan technique, je fais confiance à cette équipe d'ingénieurs. Encore bravo. Si je pouvais aider, je le ferai. Allez tiens je vais enregistrer ma voix.
Pour les auteurs des commentaires type Stout du village, je vous invite à donner un coup de main à ces jeunes intelligents, plus intelligents que leur prédécesseurs. Ils savent ce qu'ils font mieux que quiconque.

Permalien

Critiques constructives:
- Le projet n'est pas élaboré par des spécialistes dans les sciences du langage, donc il faut définir les finalités de ce projets
-c'est bien de respecter les règles d'écriture élaborées par les profs des universités kabyles (Béjaia, Tizi-Ouzou et Bouira).
- Un projet qui doit être réalisé uniquement par des spécialistes ( linguistes) car l'appel à participation pour le grand public induira beaucoup d'erreur comme c'est déjà le cas (erreurs d'orthographe et syntaxe pour l'écrit; erreurs de prosodie et intonation pour la lecture des phrases).

-

Permalien

@ l'auteur du commentaire "De la poudre aux yeux" supposé chercheur:

L'auteur de l'article étant connu, il s'agit d'un ingénieur informaticien qui suit l'évolution dans le domaine de la linguistique berbère depuis 1994 et qui vous répond: Son nom est Belkacem Mohammed, il est de Tizi-ouzou, il y travaille, il y réside. Personne ne le paie pour les travaux qu'ils mènent depuis des années. Je confirme aussi que d'autres projets plus importants seront lancés, d'autre projets aussi viennent de se concrétiser ces jours-ci. Ils sont annoncés sur les réseaux sociaux et feront objet d'articles prochainement.

J'aimerai bien avoir affaire un un chercheur identifié. Un chercheur ne doit pas avoir honte. Il fera mieux de décliner son identité sinon votre commentaire sera dépourvu de sens. Et surtout savoir dans quel domaine de recherche vous menez vos recherches/activités.

Par ailleurs, je signale à tout le monde que les travaux de localisation en kabyle des interfaces sont ouverts à tous. Tout le monde peut apporter librement sa contribution. Des vidéos et des publications sont disponibles sur le Web. Ces publications invitent les kabylophones à se rendre sur les centaines de projets lancés depuis des années. Des milliers d'entrées attendent d'être localisées en langue kabyle. Il ne s'agit donc pas de projets de labos fermés. C'est des projets collaboratifs, participatifs.

Je tiens à signaler à notre cher chercheur, que les linguistes ont abandonné la notation des labios-vélaires depuis longtemps. L'équipe se base sur les dernières règle syntaxique publiées par une équipe d'enseignants universitaires aux DLCAs de Tizi ouzou et de Bgayet.

J'ajoute, pour ce qui du deepspeech, nous sommes des informaticiens et nous savons mieux que quiconque ce qu'est le deep learning. Je ne donnerai pas plus de détails mais je t'invite à faire des cours sur le sujet ou à défaut consulter des références libres en ligne pour comprendre d'avantage. Ce n'est pas bon en tant que chercheur d'induire les gens en erreur. DeepSpeech, se base sur des algorithmes réalisés par Google que l'industrie de la linguistique vocale a repris à travers le monde entier.

Je t'invite d'abord à décliner ton identité ici sur le fil des commentaires puis prendre attache avec l'équipe qui réalise ces projets sans retour matériel ni sur leurs carrières.

Si vraiment tu mènes des recherches c'est certainement avec retour sur ta carrière. Ce n'est pas le cas des équipes libres travaillant sur des projets libres, opensource en ligne. Nous le faisons par amour pour notre langue.

@ l'auteur de "tous les algeriens sont kif kif".

Ces projets n'ont rien de politique. L'équipe kabyplophone tente de numériser et automatiser la langue d'une région: La kabylie. Nous ne sommes ni une académie, ni une institution à budget. Nous le faisons d'abord pour nous, mais surtout pour lé générations futures. Celui qui veut autre chose, personne ne le lui interdit.

@ ceux qui cherchent à contribuer

Le projet est en cloud, il est accessible de partout.
La participation est possible soit par:
- Corriger les erreurs de localisation
- Proposer des corpus à exposer sur le site pour lecture
- Enregistrer votre voix sur le site en lisant les phrases proposées.
- Valider les enregistrements des autres participants.

Pour toute information supplémentaires, contactez moi sur l'@ belkacem77@gmail.com

Je tiens à remercier ceux qui aident. Grâce à votre participation, le kabyle est classé 6 ième à l'échelle mondiale devant plus d'une centaines de langues.

Le projet se poursuivra aussi longtemps que possible en accompagnant tout les changements futures probables qui affecteront la grammaire ou la syntaxe.

Permalien

Ce résultat est le fruit de travail des gens déterminés, des gens qui parlent peu et travail plus....pour ceux qui considèrent que tous les algériens son kif kif ils ont qu'a manger et faire kaka et la eux aussi seront vraiment kif kif. La kahina, Massinissa ont parle le lybique qui n'est pas vraiment aussi différent de kabyle actuel...Bravo a cette équipe et bonne continuation....Churchil a dit que quand on va quelque part si on s’arrête a chaque chien qui aboi on arrivera jamais a destination.

Permalien

vous ne savez que critiquez! dites nous ce que vous avez acompli ? rien ! alors laissez les initiateurs trannquilles! on dirait que ça vous dérange ! surtout le commentateur de " la poudre aux yeux"! vas y corrige si tu trouve des erreurs! c'est comme ça que ça marche ! ne3dine rebbi!

Permalien

Aux dictateurs qui ne supportent pas les commentateurs: Tout le monde a le droit de faire des commentaires. La critique est nécessaire pour arriver à des résultats de qualité. Heureusement qu'il y a des gens qui ont un regard critique et ont les capacités pour entrer dans le détail du sujet sans se laisser impressioner par le superficiel comme beaucoup qui baignent dans l'ignorance.

Il incombe à ceux qui ont fait les erreurs de les corriger, pas au commentateurs qui les signalent.

Permalien

Je suis d'accord avec l'auteur des "critiques constructives" et "de la poudre aux yeux".
Ce genre de projet sur la langue doit être laissé aux linguistes formés adéquatement et pas dans un cadre de crowd-sourciing (faisant appel à tout le monde) qui généralement ne produit pas de la qualité.

Permalien

--------------------------------------------------------------------
Réponse à "le chercheur dans le domaine"
Si vous êtes vraiment un chercheur dans le domaine osez donnez votre vrais nom.
--------------------------------------------------------------------
Ce n'est pas le nom qui importe, mais plutôt le contenu des commentaires.
D'ailleurs un chercheur correct ne fait pas de publicité pour son nom.
Tout à fait le contraire de l'auteur de cet article qui se dit ing'enieur et fait de la publicit'e pour son nom et ce projet ou il veut faire travailler les autres. Remarquez qu'il ne mentionne jamais le nom des collaborateurs mais seulement son nom pour gagner du prestige. A en juger par ses communications sur le net, c'est tout ce qui l'intéresse: se faire une renommée.

Permalien

Je ne sais pas ce que les commentateurs concernés pensent des propos de "Réponse & explications", mais moi j'aimerai intervenir sur quelques points.

1. L'auteur écrit que "les linguistes ont abandonné la notation des labios-vélaires depuis longtemps. L'équipe se base sur les dernières règle syntaxique publiées par une équipe d'enseignants universitaires aux DLCAs de Tizi ouzou et de Bgayet".
Premièrement, la transcription n'est pas du domaine des règles syntaxiques. Ensuite, les départements de Tamazight cités ne font que reprendre bêtement les règles de transcription développées par Chaker, un orientaliste de l´INALCO qui a une vue réduccioniste de la langue et une expérience limitée au français et à l'arabe (des langues qui sont un désastre du point de vue de la transcription). L'aspect de la facilité d'apprentissage de la langue est complétement négligé. Or ce point est très important pour la langue de Mammeri. Ce n'est pas un hasard que Mammeri lui-même notait les labio-vélaires.
Alors, il est impératif de noter le son labio-vélaire (kʷ, gʷ, qʷ, etc... ) pour ne pas risquer de le perdre comme c'est le cas déjà dans certains parlers (Vgayet, par exemple). C'est un son très spécifique de Tamazight qui la distingue de l'arabe, par exemple. Il facilite la lecture et la compréhension pour les apprenants. Il distingue aussi sémantiquement les mots comme agi/agʷi, meqqaṛ/meqqʷaṛ, etc...
Il en va de même pour la notation du son [v] par la lettre "v" au lieu de "b", comme dans "vava". Le son [b] et le son [v] doivent être notés avec des lettres différentes, pour les mêmes raisons citées pour les labio-vélaires.

2. L'auteur montre son arrogance et son esprit conflictuel en essayant de donner des leçons au chercheur sur des sujets dans lesquels il a manifestement très peu d'expérience comme consultant ERP (gestion informatique des entreprises) et en l'accusant d'induire en erreur. Non, je ne crois pas que le chercheur induit en erreur quiconque. Son avis est partagé par des milliers de gens qui utilisent les outils de google basés sur une approche statistique du traitement de la langue. Il n'y a qu'a voir la qualité des traductions produites par translate.google.com ! Ça vaut pour jouer mais pas pour des traductions professionelles.

3. Faut se concentrer sur les commentaires pour y répondre objectivement et non pas dévier l'attention sur l'identité des commentateurs. Un chercheur ne cherche pas à faire de la publicité à son nom ou à ses travaux. Par contre, on voit bien que l'auteur de cet article n'as pas honte de faire la promotion de soi-même de manière continue.

4. L'auteur nous dit son nom, sa profession et qu'il vit à Tizi-Ouzou. Mais il devrait nous dire beaucoup plus que ca sur lui parce qu' il sollicite la participation de ses compatriotes dans des projets dont il s'est auto-proclamé leader. Avant de songer à collaborer avec lui, il serait sage de savoir le plus possible sur son profil, ses qualités professionnelles et humaines. Un des points essentiels est sa mentalité. De ce point de vue là, en écoutant une de ses présentations disponible sur le net en vidéo, j'ai remarqué une forte tendance à une mentalité arabo-islamique. Il est même allé jusqu'à dire qu'on devrait marrier les femmes kabyles avec des arabes, pourvu qu'elles ne restent pas à la maison (considérant comme les islamistes que les femmes sont un fardeau dont il faut se débarrasser). Je doute que cela soit compatible avec quelqu'un qui prétend travailler par amour pour la langue de Mammeri. Qu'il nous dise comment il arrive à passer du coq à l'âne, ou en d'autres mots, de la barbe et gandoura islamistes à l'amour de la langue de Mammeri.

Permalien

@ l'auteir de Re: Réponse & explications
Ton commentaire me fait marrer hihi.

Si tu veux donner de l'aide, tous les projets sont ouverts. C'est l'esprit opensource. Nous avons besoin de chercheurs comme toi pour faire avancer taqbaylit et comme ça on connaîtra ton identité.
Ici ça se discute langue, science et culture et non pas politique.
Allez, je retourne sur un autre projet de linguistique informatique.

Permalien

Mohammed Belkacem dit: "Je tiens à remercier ceux qui aident. Grâce à votre participation, le kabyle est classé 6 ième à l'échelle mondiale devant plus d'une centaines de langues."

Classé 6ème à l´échelle mondiale !! Quelle échelle exactement ? Des bricoleurs de Mozilla?
Il faut être précis et ne pas pondre de telles affirmations pour impressioner et manipuler les gens dans le but de les recruter dans un projet pour être exploités.

C'est qui vraiment qui participe dans ce projet et qu'on remercie? On a besoin de références pour ne pas rester dans le bluff.

Permalien

"linguistique berbère", "langue kabyle": clairement une âme de colonisé qui n'arrive pas à se débarrasser de ces termes péjoratifs collés par les colonisateurs.
Pourtant notre langue s'appelle Tamazight depuis des millénaires et Tamazight est un terme autochtone.
D'ailleurs c'est une langue qu'on appelle Tamazight qui s'enseigne dans les écoles à Tizi-Ouzou et curieusement ou contradictoirement l'auteur se réfère aux département de Tamazight de l'université de Tamazight. C'est ainsi qu'il s'appelle.
Cette langue de Mammeri, Mammeri lui-même l'appelait Tamazight!
On ne peut aimer sa langue et accepter qu'on l'appelle avec des noms péjoratifs assignés par les envahisseurs étrangers. Tôt ou tard cela crée un sentiment d'humiliation et un grave problème d'identité.

Si l'auteur veut à tout prix se démarquer des autres parlers de Tamazight ou bien préciser que les projets concernent la langue de Mammeri, dans ce cas-là il devrait utiliser le terme "Tamazight de Tizi-Ouzou" ou "Tamazight du Centre-Nord" (par rapport au territoire de Tamazgha) qui engloberait les parlers des régions de Tizi-Ouzou, Vgayet, etc...
Cette dénomination des parlers de Tamazight basée sur l'emplacement géographique par rapport à Tamazgha s'appliquerait à tous les parlers et ainsi se débarrasser des appelations colonialistes non-autochtones.

Permalien

prener attache avec les équipes sur face book pour savoir ce qu'ils font. Des statistiques, des annonces, des formations, vidéos sont chaque jours partagées ils m impressionetn ces enfants

Permalien

Je rejoins le commentateur qui questionne les agissements de l'auteur.
Il faut arrêter cette hypocrisie connue des islamistes intégristes.
Je confirme que ce Mohammed Belkacem est allé a Wizgan pour parler de localisation de logiciels et il a dit publiquement à l'audience que les femmes kabyles doivent être mariées aux arabes pour qu'elles ne restent pas à la maison.
C'est quoi sinon de la politique?

Il fait la promotion du mot "kabyle" pour désigner la langue de Mammeri en faignant d'ignorer que c'est un terme colonial péjoratif et que notre langue s'appelle Tamazight depuis la nuit des temps.
C' est expressement pour se démarquer de nos autres frères et soeurs Amazighs et même les aliéner.
Qui d'autre fait la promotion du mot "kabyle"?
C'est quoi sinon de la politique?

Permalien

@bluff
Le projet est ouvert. Les corpus sont envoyés via Github. Une équipe relit et valide. puis elles sont exposées sur le site.
Les gens lisent les phrases en ligne. Le internautes réécoutent ces phrases. Présélection. Une autre équipe réécoutent ces phrases en phase finale.

Dernières statistiques:

Nombre d'enregistrements (phrases enregistrées avec voix): 7870
Nombre de donateurs de voix (personnes): 55
Nombre de votes (relecture): 14862
Nombre de votants (personnes qui relisent) : 118

Le kabyle est classé 6 ième derrière l'anglais, le français, l'allemand, le chinois et le catalan en nombre d'enregistrements sur le site
@Tamazight
Ce projet ne concerne que taqbaylit. Nous ne sommes pas une académie ni une institution à budget. Nous nous concentrons sur la langue qui se parle en territoire de Kabylie qui s'appelle: taqbaylit ou tazwawt c'est comme ça qu'on l'appelle dans nos villages.

Permalien

@réponses
Quel est votre village où la langue de Mammeri apparement s'appelle "tazwawt"?
On connait "agawaw"-"igawawen" dans notre village mais pas ce terme péjoratif collé par les francais et d'où ils ont tire le mot "zouave".
Arrêtez de faire le zouave!

Permalien

@réponses
Dites-nous comment il est délimité ce territoire de "kabylie" où l´on parle cette langue.

Permalien

Sur le plan compétence, ces projets nécessitent des personnes formés en linguistique et langue amazighe. Contrairement à ce que l'on veut faire croire, ce ne sont pas des projets où l'informatique joue un rôle important. Dans ces projets, le gros du travail c'est de traduire, d'inventer du vocabulaire qui n' existe pas dans notre langue et en géneral travailler sur la langue. Ni l'auteur ni aucun des collaborateurs qu'il a cité dans un autre article n'ont une formation en linguistique ou en langue amazighe. Ayant examiné les résultats de ces travaux, j'ai trouvé qu'en conséquence de ce manque de compétence, les localisations sont horribles: la notation est déficiente, les fautes d'orthographe abondantes, les mots inventés sont mal formés morphologiquement, le vocabulaire contient souvent des arabismes (alors que les mots autochtones existent), la structure syntaxique des phrases est hideuse (souvent calquée sur l'arabe ou le francais), la ponctuation est et à la fin même les plus aguérris ne comprennent pas grand chose et n'ont plus envie d'utiliser ces outils dans leur langue. En somme, on massacre la langue de Mammeri et on n'incite pas les gens à l'apprendre!

Permalien

“opensource” ne s’écrit jamais en un seul mot, open source ou open-source. En francais, c’est “code source ouvert”. On voit bien que l’auteur massacre d’autres langues aussi, sans souci. Il ferait mieux de ne pas retourner à son bricolaje linguistique et plutôt retourner à son commerce avec les ERP.

Permalien

C'est pas étonnant. On voit bien que tout ça n'est pas sérieux.
On rie sous la barbe et à la barbe de ses compatriotes.
Répondez plutôt si ce n'est pas vrai que votre esprit est façonné par le courant islamiste intégriste et que si c'est compatible avec travailler sérieusement pour la langue de Mammeri.

Permalien

Venez, rejoignez- nous et apportez votre pierre à l'édifice.
Le monde de l'opensource est très grand, Chacun trouvera sa place.
Nous sommes présents sur FB, VK et autres plateforme. Vous découvrirez un groupe de jeunes dynamiques, très conscients est désireux. On a besoin de plus de contributions et de critiques sur place sur les projets.
Vous prendrez et donnerez.
La langue kabyle interpelle ses enfants.

M. Belkacem

Permalien

Si vous voulez des candidats compétents pour vous rejoindre dans ces projets, je vous conseille au minimum d'agir sur les points suivants:

1. Bannissez le mot "kabyle" et remplacez-le par Tamazight
2. Dans la notation, ne suivez pas comme un troupeau les recommendations de Chaker (INALCO) et adoptez une notation de qualité qui facilite l'apprentissage de la langue conformément aux principes de l´UNESCO (notation la plus phonétique possible).
3. Appliquez-vous dans tout ce que vous produisez en exigeant un haut niveau de qualité.
4. Utiliser d'autres moyens de communication que FB et VK.
5. Ne faites pas trop de publicité pour ces projets et ne publiez pas des articles sensationnels. Les gens intelligents remarquent que vous faites trop de bruit et que ce qui vous intéresse c'est d'être le chef et d'acquérir une notoriété.
6. Soyez modeste et respectez vos ancêtres et le travail qu´'ils ont fait pour que vous puissiez en son temps jouir d'une formation d'informatique.
7. N'exagérez pas le rôle que peut jouer le rôle du numérique dans l'avancement de notre langue.
8. Soyez honnête et intègre. Oubliez les idées islamistes où vous vous êtes égaré.

Permalien

@Apporter sa piiere à l'édifice

Commencez d'abord par montrer que vous êtes soucieux de la qualité.
Ne balancez pas n'importe quoi à vos compatriotes.
Corrigez vos fautes, que ce soit en français ou dans les localisations. Montrez que avez un respect pour les langues. Ce n´est pas du hacking dont il est question.
On vous a déjà dit que "open source" s'écrit en deux mots et vous continuez de l´écrire "opensource". Cela montre que vous êtes tétu et dépourvu de drive pour vous améliorer.

Permalien

Par M.Belkacem
Pour ceux qui disent pourquoi le kabyle et non pas tamaziɣt.

Le NLP et les corpus linguistiques:

Le NLP n'est pas de la littérature. Le NLP est une discipline qui marie plusieurs sciences exactes. Le NLP implémente des programmes informatiques se basant sur des notions mathématiques et statistiques pour réaliser des algorithmes informatiques traitant les langues humaines selon les règles de la linguistique à travers des corpus et un ensemble de règles de la langue codifiées pour une usage technique.

Le algorithmes ne peuvent pas traiter un corpus Cocktail du genre corpus berbère contenant toutes les variantes du berbère en raison de:

1- Un jeu de phonèmes (donc de graphèmes) extrêmement important.

2- Ecart phologique, morphologique et grammatical entre les langues berbères.

3- Ecart lexical.

Ces écarts, si l'on considère que que le berbère représente un caractère d'unicité, ne méneront nul part, à moins que l'on produise une langue de labo.

Cet esprit d'unicité de la langue, s'il persistera, il va tout simplement nous retarder, voire rendre impossible l'intégration des langues berbères sur le numérique.

Le désir des berbéristes d'emboiter le pas aux nationalistes arabes ( certainement héritage idéologique issu du jacobinisme à la française) nous conduira vers la production d'une langue mort-née à l'image de l'arabe dit académique utilsé uniquement dans les mosquées. Et pire encore, politiquement, l'échec sera une occasion pour les détracteurs des langues berbères de continuer le résistance et socialement, un justificatif aux locuteurs de continuer de croire que les langues berbères ne sont bonnes que pour l'addaynin.

J'ai consulté un corpus de phrases "berbères" de 108000 entrées pour le reprendre et l'exposer sur Common Voice, introduites dans Tatoeba, une fondation hébergeant des corpus ouverts, ce qui est une initiative très louable et encourageamnte, et je tiens à remercier les initiateurs et les contributeurs. Ces corpus sont destinés aux divers traitements automatiques.

Pour les exploiter, il faudra faire le tri et c'est très difficile sur un corpus de plus de 100 000 phrases de plus de 15 parlers berbères très disparates.

Pourtant, Taotoeba a ouvert la voie à toutes les langues du monde codifiées dans ISO 639-3 et non pas ISO 639-2. Contairement à ISO 639-2 dont fait partie le Kabyle mais pas toutes les autres langues berbère, ISO 639-3 quant à lui, est ouvert à toutes les langues berbères dont le Chawi, le Mozabit, le Tergui, le Ouergli, ....etc. Ces langues sont toutes codifiées dans cette norme que Tatoeba utilise.En tout cas, un projet de corpus Kabyle est inimitié sur cette plateforme. La locale kabyle sera bientôt ouverte.

Il est temps de produire des corpus segmentés sur la base des parlés pour pouvoir analyser mieux et produire de bons traitements.

L'unicité de la langue ne fera pas de nous des citoyens unis. L'union est daans la justice, le droit, la citoyenneté. Elle n'est ni dans la langue, ni dans la religion.

Permalien

M. Belkacem ne sait pas lire ou feint de ne pas comprendre ce qu’il lit et détourne la question des commentateurs pour rabacher et divaguer sur des impertinences.

Aucun commentateur n’a demandé à ce que ce M. Belkacem travaille sur l’unification des variantes de Tamazight. Dieu nous en garde!

Mais on a demandé que quand il se réfère à la langue de Mammeri qu’il n’utilise pas le terme péjoratif “kabyle” inventé par les colonisateurs, mais plutôt Tamazight. Car c’est ce terme autochtone que nos ancêtres utilisaient avant que les colonisateurs leur imposent le nom de “kabyle” renvoyant sournoisement aux tribus arabes. Hanoteau écrivait en 1906 dans son livre intitulé ”Essai de grammaire renfermant les principes du langage parlé par les populations du versant nord du Jurjura et spécialement par les Igaouaouen”:

“Nous connaissons aujourd’hui ces groupes sous les dénominations, arabes pour la plupart, de Kabyle, Chaouia, Chelouh, Beraber, Zenatia, Beni Mzab et Touareg.
Aucun de ces noms n’appartient à la langue des peuples qu’ils désignent. Plusieurs de ces peuples, cependant, les Kabyles par exemple, les ont adoptés et ont oublié leur nom national. Mais, partout où les populations berbères ont été à l’abri du contact et de l’influence arabes, elles s’appellent : Imazighen ou Imajaghen, pluriel de Amajegh, chez les Touareg du Sud, et Imouchagh, pluriel de Amachegh, chez ceux du Nord. “

Alors prenez note une bonne fois pour toute, arrêtez de vous humilier et débarrassez-vous du fardeau colonial.

Permalien

Les projets sont ouverts. Tout le monde peut apporter sa touche. Connectez vous sur les réseaux sociaux pour vous aider via des tuto, vidéos, formations à vous introduire dans ce beaux monde conjuguant nouvelles technologies et langue kabyle.

Permalien

Bonjour,

je voudrai répondre au chercheur qui au lieu de participer au projet vilipende l'action combien louable de bénévoles kabyles !

Alors abordons point par point vos questions !

Si vous voulez des candidats compétents pour vous rejoindre dans ces projets, je vous conseille au minimum d'agir sur les points suivants:

1. On ne peut pas bannir le mot Kabyle, car c'est un FAIT nous sommes KABYLES et il s'agit bien de la langue kabyle qui est différente du chaoui, mzabi, chleuh, rif, ....etc
2. S.Chaker (INALCO) est une référence en la matière. Si vous estimer avoir plus de connaissance que nos éminents chercheurs (qui sont connus et reconnus) mettez vous donc à l'ouvrage, c'est un projets ouvert, fini la hiérarchie des élites et le nombrilisme intellectuel !
3. La qualité s'acquière par la participation Mr, savez vous ce qu'est l'intelligence collective ?
4. Les plates-formes FB et VK permettent l'ouverture car les sites classiques sont en général passives.
5. La publicité a un rôle de promotion pour les travaux collaboratifs pour unir les Kabyles dans des contextes PRAGMATIQUES. Les gens intelligents remarquent les gens qui font des efforts pour leur langue gratuitement et essayent de donneur le meilleur d'eux-mêmes.Vous êtes d'ailleurs invité à faire de même !
6. Soyez modeste vous-même d'abord, et respectez vos jeunes qui veulent sortir des carcans de l'absurdité AUTORITAIRE et le travail qu´'ils ont fait pour que vous puissiez en son temps jouir de logiciels et sites gratuits et efficaces.
7. N'exagérez pas vos critiques hautaines et anonymes.
8. Soyez honnête et intègre vous-mêmes car vous mélangez les torchant et les serviettes. Soyez laïc et Open Minded et faites attention à votre tension et votre sucre car ça va ensemble !

Mes salutations linguistiques !

Permalien

1. Moi et les gens de mon village, nous nous appelons Igawawen et Imazighen comme se sont appellés nos ancêtres depuis la nuit des temps. Vous vous dénominez avec le mot arabe et péjoratif “kabyle” (voulant dire tribu) assigné par les colonialistes. Cela ne vous dérange pas puisque vous êtes islamiste. Mais gardez cette appelation pour vous et ceux qui peuvent porter cette honte. La langue de Mammeri est une variante de Tamazight. Elle a ses péculiarités dans lesquelles il n’y a pas de mal à s’approfondir, mais il faut lui donner un nom digne (comme par exemple, Tamazight du Centre-Nord) et faire du travail de qualité pour qu’elle prenne place comme une langue à part entière.

2. Chaker est une référence pour les ignorants. Fini les intellectuels, vous dites. Je suppose que vous voulez les remplacer avec votre dictature islamique? Il n’y a rien d’ouvert dans les projets que propose Mohammed Belkacem, il est connu pour vouloir imposer ses idées et profiter de la bonne volonté des autres dans des projets où il garde toujours le contrôle de l’acceptation des contributions. Et si seulement il était compétent dans la matière et capable d’élever le niveau. Avis aux amateurs!

3. La qualité s’obtient avec des personnes formées adéquatement dans la matière, ayant une mentalité exigeante sur le plan de la qualité et travaillant dûr. L’intelligence collective n’existe pas sans l’intelligence individuelle. 0+0+0+0 = 0.

4. Facebook/VK c’est un attrape-nigaud. Ce n’est pas fait pour le travail collaboratif sérieux et professionnel qui a ses propres plateformes numériques. En plus de que Facebook/VK vivent des données des utilisateurs qu’ils vendent par-ci par-là malgré les amendes astronomiques infligées par l’UE pour ces violations. Il n’est pas du tout conseillé de s’inscrire sur Facebook ou VK. Pour ceux qui savent lire l’anglais, je conseille ce site de Richard Stallman (pionnier dans l’informatique) où il explique pourquoi:
https://stallman.org/facebook.html

5. La publicité c’est pour vendre des choses qui ne se vendent pas d’elles-mêmes. Les projets de qualité en Tamazight sur l’internet n’ont jamais fait de publicité et les collaborateurs se proposent d’eux-mêmes parce qu’ils voient la qualité et l’utilité des systèmes développés. Ce n’est pas le cas de ces projets de localisation de plateformes open-source dont l’utilité et l’adéquation pour Tamazight est questionable. Et surtout on voit le travail bâclé et les résultats médiocres.

6. On ne peut pas avoir de respect pour la mentalité islamiste et le travail bâclé. On ne risque pas d’utiliser et encore moins de “jouir” de logiciels localisés dans une langue mutilée.

7. Les critiques ne sont pas du tout exagérées, au contraire elles sont dosées proportionnellement à la médiocrité exhibée. Elles ne sont pas hautaines non plus, parce que les commentateurs se sont donnés la peine d´examiner les résutats des projets mentionés. Il faut donc se concentrer sur les critiques et argumenter sur le sujet si vous en êtes capable, au lieu d’essayer de détourner l’attention sur l’identité des commentateurs.

8. Un islamiste qui parle de laïcité et d’ouverture d’esprit. On aura tout vu! Et typiquement, l’islamiste ajoute des commentaires impertinents qui montrent le niveau d’esprit. Il n’y a pas de problème avec la tension ou le sucre, mais il y a un problème grave avec la mentalité islamiste et ceux qui ne savent pas écrire un mot comme “torchon” tout en ayant des prétentions de travailler sur la langue!

“salutations linguistiques” : linguistiques, loin de là avec votre niveau de langue en français ou en tamazight sans parler des connaissances scientifiques en linguistique. Même pas “salutations informatiques” car bien que formé en informatique vous n’êtes même pas capable de développer des logiciels pour votre langue. Vous essayer seulement de traduire et consommer des logiciels que d’autres ont développés. Ce n’est pas comme ça que la langue de Mammeri va avancer.

Permalien

1-Le "Moi" est haïssable, mon cher dictateur anonyme du virtuel ! Le mot "Kabyle" (Aqbayli) vient de la racine "QBALA" qui veut dire (droit) donc "aqbayli d win iteddun qbala" ! Kabyle veut dire celui qui droit, car le kabyle est connu pour sa bravour et sa parole ! Soyez modeste et faites des recherches ! Je vous apprends des choses, hein ?

2-Si Chaker n'est pas un grand chercheur, veuillez nous citer vos références, O éminence de grâce !

3-La qualité c'est le travail ! Tous nos participants "common voice", et autre... sont des universitaires et des thésards ! Venez assister à nos projets les portes sont grandes ouvertes, je réitère mon invitation, voulez vous que je vous supplie ?

4-Facebook et VK sont des plateformes qui évoluent tous les jours, il n'y a pas de système parfait, c'est le monde de l'évolution tout court ! Facebook ne vous oblige pas à exposer votre vie au monde, c'est juste un outil qui peut être utiliser positivement si vous le souhaitez... Sinon créez un site on viendra vous donner un coup de main avec plaisir. Car faire du grabuge comme vous le faites si bien ne mène à rien, nous on continue notre petit chemin de contributeurs !...

5--Qui fait de la pub ? C'est juste un malheureux article de notre modeste contribution pour notre langue que Lematindz a eu le gentillesse de s'y intéresser ! Respirez un coup, prenez un verre d'eau et tout ira pour le mieux pour vous ! Enjoy life take a deep breath don't be nervous, life is beautiful !

6-Essayez donc d'écrire en Kabyle ou en Tamazight (appelez le comme vous voudrez lol!) on verra bien si votre orgueil est proportionnel à vos connaissances en la matière ! Mais bon ce n'est pas un match de box, on discute seulement, peut être que toute l'Afrique du nord est en marge de découvrir un génie berbère unificateur de toutes les tribus et de toutes les confédérations !?

7-Vos critiques sont infondées, je réitère, ce qui cache un sentiment d'envie des plus jaloux ! De toutes les façons ce n'est pas nouveau c'est un trait de caractère bien de chez-nous, je confirme vous êtes bien un fils de Kabylie ! Soyez envieux ça vous mènera surement à la gloire, qui sait, un jour !

8-Taxer les gens d'islamistes ou d'un autre nom d'oiseau ne mènent à rien, c'est une rixe de bas étage, je vous pardonne d'avance ! Pour les fautes d'ortho je vous rassure vous en faites tout autant, Monsieur Victor Hugo, voici un exemple flagrant :
(Paragraphe 7 : ..., parce que les commentateurs se sont donnés.... il n'y a pas d'accord possible ici, revoyez vos cours de français depuis le primaire Monsieur le chercheur de poux!!!!) et j'en passe et des meilleures ! Il y en a d'autres bêtises mais je m'arrête là car cette faute illustre bien votre niveau !

9-Je vous fais savoir, Éminence, que j'écris avec mon tel portable ! Je ne vais pas ml'étaler sur mes croyances car ça n'engage et ça ne concerne que moi, et vos croyance m'importent guère ! Attention au diabète et à la tension artérielle ça va monter impétueusement !

Enfin bref, je n'ai hélas rien appris de vous hormis le fait que j'ai perdu quelques minutes de ma vie ! (Mdr)... Un conseil, soyez indulgent avec ceux que vous croyez "ignorants" et soyez respectueux et reconnaissants envers ceux qui vous dépassent de loin car ceux-là ne daigneront pas à vous répondre ...

Mes salutations informatiques et linguistiques au Cheurcheur de poux de la ripoublik !

SANS AUCUNE RANCUNE (puisque vous n'êtes qu'un ANONYME qui veux faire du bruit avec des pets sous l'eau)

Permalien

Je partage le constat qu'il faut se méfier de cet individu et de ses activités.

Pour commencer, ceux qui travaillent véritablement pour être utiles à leur langue, le font en silence. C'est leur travail qui parle.

Deuxièmement, ce n'est pas en localisant dans sa langue des logiciels ou applications web développées par des américains ou russes qu'on élève le prestige de sa langue ou qu’on la fait connaitre sa langue. Au contraire, cela montre qu'on est dépendants de l'innovation des autres peuples et qu'on ne produit rien dans sa langue. Si ce monsieur est un informaticien de bon niveau et soucieux de faire diffuser sa langue, pourquoi ne développe-t-il pas un logiciel innovant dans sa langue avec le label de "Made in Vgayet" ou "Made in Tizi Wezzu"? Ainsi les autres peuples viendront s'intéresser à sa langue et ce seraient eux qui voudraient une localisation dans le sens inverse.

D'un autre côté, il faudrait évaluer l'utilité de ces localisations pour ses compatriotes. Au lieu de nous dire combien de personnes gaspillent leur temps sur ces projets douteux, pourquoi ne nous dit-il pas combien de personnes utilisent ces logiciels localisés dans la langue de Mammeri? Moi je dirai que très peu, pour la simple raison qu'il y a très peu de gens qui ont la motivation et capacité (linguistique, informatique,..) de le faire. On ne met pas la charrue avant le bœuf.

Alors, on revient à une question centrale: pourquoi ce monsieur s'engage-t-il dans de tels projets et en fait une grande publicité? Comme l’a fait remarquer un autre lecteur, il y a très probablement le désir égocentrique d’acquérir un prestige personnel et de se faire une renommée. Mais j’irai plus loin. Contrairement à ce que l’on veut nous faire croire, on peut fortement soupçonner qu’il y a la motivation de l’argent dans ces activités. Prenons l’exemple de la localisation (traduction de l’interface, pour ceux qui ne connaissent pas ce terme) du réseau social russe vk. com. Il incite ses compatriotes à s’inscrire sur ce réseau. Mis à part les problèmes de sécurité auxquels seraient exposés ses compatriotes et que ce monsieur n’a pas l’air de comprendre suffisamment (ou il s’en fiche royalement), il y a le fait que vk. com va gagner de l’argent pour chaque utilisateur qui s’inscrit (à travers les annonces publicitaires par exemple ou en vendant les listes de données). Il est d’usage dans le secteur, qu’on verse une commission (1 Euro/par personne inscrite, par exemple) à celui qui ameute les utilisateurs à s’inscrire. Ainsi donc ce monsieur gagnerait de l’argent sur le dos de la sécurité de ses compatriotes et sous couvert de la promotion de la langue !

Il y a d’autres raisons pourquoi il serait sage de se méfier des activités de ce monsieur et ne pas s’y associer. L’une d’elles étant que durant ses présentations, dont certaines sont enregistrées et diffusées sur youtube, il a exprimé des opinions qui dévoilent une mentalité arabo-islamiste. Il a par exemple dit publiquement qu’il faudrait marier les femmes amazighes aux arabes plutôt qu’elles restent avec leurs familles. C'est-à-dire que la femme amazighe est un objet gênant dont il faut se débarrasser coûte que coûte. Ce qui est totalement incompatible avec l’histoire et le développement de la langue et culture amazighe.

Permalien

Même un âne n’apprendrait pas de quelqu’un qui sort des sottises pareilles. Et meme un âne, ne serait pas aussi obstiné a nier que le mot “kabyle” est un mot arabe donné par les colonisateurs. Quelque soit le sens qu’on s’efforce à lui inventer, “kabyle” est un mot d’origine arabe assigné par les colonisateurs. Prenons votre dernière invention “qbala”, de la racine “QBL” en arabe dont en tire plusieurs mots et plusieurs sens que je vous laisse le soins de découvrir dans le "qamus". Je vous en citerai quelques-uns qui confirment l' orientation islamiste: “qabil” =celui qui accepte (je laisse le lecteur deviner quoi), “qibla” = la mecque.
En Tamazight c’est “srid” qu’il faut employer pour dire “droit”. Les imazighen qui marchent droit, il y en a surtout dans les générations précédentes. Maintenant, il y a aussi des escrocs, des vendus, des bluffeurs, des ignorants comme on peut le constater.

Permalien

On constate dans les commentaires de l'auteur, Belkacem Mohammed, un mépris pour les chercheurs et le savoir scientifique. A l'image du gouvernement en Algérie, ce qui prime c'est l'apparence et parler pour impressioner. Sur le terrain, c'est la médiocrité.

Ajouter un commentaire