Forum
Autres sujets
Probabilité de suffixe
Nombre réponses :5
Nombre lectures :2235
Auteur Message
Ebajalé
 Envoyé le 07/05/2013 à 02:07:02
MessageCherche une publication où figurerait la probabilité chiffrée de terminaison d'un mot en fonction du nombre de lettres de ce mot et de sa catégorie ( nom, adjectif, verbe ... )

Exemple :
Soit un NOM en 12 lettres.
J'ai intuitivement l'impression qu'il sera plus probable qu'il se termine en
" -ation " qu'en " -ement " ( ou inversement s'était agi s'agissait d'un adverbe ).
Mots-croisés

Modérateur
 Envoyé le 11/05/2013 à 00:47:23
MessageJe pense que les systèmes interactifs proposés sur ce site remplacent ce type de publications, car ils donnent la possibilité de faire des recherches avec des lettres disposées aléatoirement dans les mots.
RemarqueIl est nécessaire de savoir ce que vous aimeriez en faire. Car vous n'indiquez pas si vous souhaitez des probabilités calculées sur la totalité des mots d'un dictionnaire, ou sur l'utilisation réelle des mots (dans le langage de tous les jours, dans la presse, dans les mots croisés ???)
Ebajalé
 Envoyé le 11/05/2013 à 13:40:44
MessageMerci d'avoir pris la peine de me répondre.
Devant ma grille, je souhaite tirer les mots de moi-même plutôt qu'à coups de
systèmes interactifs et je me sens déshonoré si j'ai recours à un tiers même pour une seule définition.
Ces probabilités d'agencement des lettres concernent les mots communs du lexique ( tel le Trésor de la Langue Française Informatisé qu'on trouve sur le site Lexilogos )

Exemple :
Soit un nom commun de 13 lettres.
Quelle probabilité ( chiffrée ) de terminaison à essayer en premier lieu: - ement ? En second lieu : -ation , en troisième position - elage ? Etc.
Autrement dit :
Dans le TLFI ( ou autre lexique équivalent ) , 24 % des noms communs se terminent par -ement , 18 % par - ation, 5 % par - elage, etc.
( Il s'agit de chiffres tout à fait arbitraires ! ). J'aimerais connaître les données numériques RÉELLES.
La question est : existent-elles et où les trouver ?
Il s'agit moins d'un problème de mots croisés que de déchiffrage d'un texte français crypté .
Mots-croisés

Modérateur
 Envoyé le 11/05/2013 à 13:51:22
MessagePour un texte français, il faudrait effectivement utiliser un corpus le plus proche possible de la nature du texte à décoder. Car savoir que x% des mots du dictionnaire terminent d'une certaine façon, n'est pas très utile, si ces mots ne sont presque pas ou plus utilisés.
Ebajalé
 Envoyé le 13/05/2013 à 18:35:45
MessageJe ne vous parlais pas de n'importe quel mot du dictionnaire mais ceux à lettres nombreuses ( 13 ) et quand même très utilisés dans les mots longs tels les adverbes en - ment, les adjectifs en -able ou les noms en -euse.
A PRIORI ( c'est-à-dire avant même de connaître la définition du mot ), compte-tenu de la fréquence de ces terminaisons dans les noms communs du lexique, quelle terminaison des trois faut-il privilégier ?
Seules des données chiffrées pourraient permettre de répondre.
Dans le texte ci-dessus, les lettres les plus utilisées sont ( probablement ) le E puis, le S ensuite puis le R, le I, le N. etc.
Ce que je recherche c'est une analyse de la fréquence des groupements de lettres en français ( et qui le caractérise puisque spécifique à chaque langue ).
Je prétends que cela peut aider à la résolution des grilles.
Merci d'avoir bien voulu me donner votre avis.
Mots-croisés

Modérateur
 Envoyé le 13/05/2013 à 18:48:36
MessageOn trouve des tableaux de groupes et de terminaisons dans mon guide: https://www.mots-croises.ch/Manuels/Resoudre-mots-croises/

Je pourrais en calculer d'autres à la demande, mais je ne suis pas certain de l'utilisation réelle...

Ajouter une réponse