logiciel de tri de mots

Modérateur : Michel Quercia

Répondre
rojopomodoro00
Messages : 4
Enregistré le : mar. juin 27, 2017 12:05 am

logiciel de tri de mots

Message par rojopomodoro00 » mar. juin 27, 2017 12:13 am

Bonjour à toutes et à tous
J'ai un problème que je n'arrive pas à résoudre. J'ai une liste de thèmes appelant la I={ mot1,mot2,...,mot N}
et j'ai 120 documents qui contiennent en moyenne 70 pages (cette donnée ne va nous servir à rien c'est juste pour montrer que le travail ne peut pas se faire à la main).
Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents
Avec le logiciel Lexico3 (logiciel d'analyse du contenu) j'arrive à extraire la fréquence d'apparition des mots dans chaque article.
Y a-t-il un logiciel pour résoudre ce problème ? Merci à vous.

Avatar du membre
U46406
Messages : 6014
Enregistré le : mer. juil. 27, 2016 7:38 pm
Classe : shadow CCO nobo CMT
Contact :

Re: logiciel de tri de mots

Message par U46406 » mar. juin 27, 2017 9:50 am

Dans quel langage de programmation ? Python ? Tu sais programmer ?
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

Avatar du membre
bullquies
Messages : 6095
Enregistré le : mar. avr. 17, 2012 9:19 pm
Classe : Thé à la

Re: logiciel de tri de mots

Message par bullquies » mar. juin 27, 2017 12:26 pm

python avec TextBlob par exemple
ingé

rojopomodoro00
Messages : 4
Enregistré le : mar. juin 27, 2017 12:05 am

Re: logiciel de tri de mots

Message par rojopomodoro00 » mar. juin 27, 2017 1:17 pm

Merci à vous . @U46406 non je ne connais rien en programmation j'ai cru qu'il y a des applications pour faire ça en très peu de lignes
sans codage.
Modifié en dernier par rojopomodoro00 le mar. juin 27, 2017 1:44 pm, modifié 2 fois.

Avatar du membre
U46406
Messages : 6014
Enregistré le : mer. juil. 27, 2016 7:38 pm
Classe : shadow CCO nobo CMT
Contact :

Re: logiciel de tri de mots

Message par U46406 » mar. juin 27, 2017 1:28 pm

Ben, va falloir suivre un cursus Humanités numérique informatique, hé hé. :)
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

rojopomodoro00
Messages : 4
Enregistré le : mar. juin 27, 2017 12:05 am

Re: logiciel de tri de mots

Message par rojopomodoro00 » mar. juin 27, 2017 1:46 pm

:) Lexico3 me donne directement en un clic tous les mots d'un document avec leurs fréquences d'apparition .je peux faire le reste à la main avec excel .
par exemple supposons que dans ma liste de départ j'ai 5 thèmes ( mot1,mot2,mot3,mot4,mot5) et lorsque j'ai cherché la répétition de ses mots dans les documents j'ai trouvé ;
documents 1 : le mot1 est présent 5 fois ; le mot2 est présent 3 fois ; le mot 3 on ne le trouve pas ; le mot 4 est présent 1 fois ,le mot 5 0 fois .on note cela de cette manière (5,3,0,1,0)
document 2 : (1.0.3.2,0)
document 3:(0,2,1;0,0)
document 4 : (8.0.0.2,0)
document 5:(0,0,7;0,0)
pour dire qu'un mot représente bien les documents je fais la somme des fréquence d'apparition ça nous donne (14,5,11,5,0) donc la liste ( mot1,mot2;mot3,mot4) est la plus représentative . je me dis qu'il y aura des cas particulier où ce raisonnement va bloquer
vous en pensez quoi ?
Modifié en dernier par rojopomodoro00 le mar. juin 27, 2017 4:03 pm, modifié 1 fois.

Avatar du membre
U46406
Messages : 6014
Enregistré le : mer. juil. 27, 2016 7:38 pm
Classe : shadow CCO nobo CMT
Contact :

Re: logiciel de tri de mots

Message par U46406 » mar. juin 27, 2017 1:53 pm

il te faut la solution pour dans combien de temps (si tu es en stage) ?
Pour savoir si tu as le temps de te lancer dans l'apprentissage de ce que c'est qu'un algorithme et la programmation ?
(ou alors si tu fais un Master de littérature comparée du 17e siècle et que Python, c'est pas ta priorité ...)
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

rojopomodoro00
Messages : 4
Enregistré le : mar. juin 27, 2017 12:05 am

Re: logiciel de tri de mots

Message par rojopomodoro00 » mar. juin 27, 2017 2:05 pm

hhhhh je suis en master Finance . j'ai 2 jours pour trouver la solution =D. tu penses quoi de la proposition que j'ai faite avant ? c'est comme ça qu'il faut penser ?

Avatar du membre
fakbill
Messages : 11078
Enregistré le : mer. juil. 30, 2008 4:59 pm
Classe : Dr.-Ing

Re: logiciel de tri de mots

Message par fakbill » mer. juin 28, 2017 9:30 pm

"Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents "
La question est mal posée. C'est quoi LA sous liste la plus représentative? Une liste d'un seul élément qui est le plus représenté dans les textes? Les deux éléments les plus représentés? Les 5 premiers? bref la question n'a pas de sens. Cherche une question qui a un sens et on verra ce qu'on peut faire :)
Pas prof.
Prépa, école, M2, thèse (optique/images) ->ingé dans le privé.

Avatar du membre
fakbill
Messages : 11078
Enregistré le : mer. juil. 30, 2008 4:59 pm
Classe : Dr.-Ing

Re: logiciel de tri de mots

Message par fakbill » mer. juin 28, 2017 9:33 pm

ps : en 2017 c'est totalement dingue de faire ça à la main même si c'est uniquement sur qlqs documents de qlqs pages. Ce n'est pas la première fois que je vois un "littéraire" compter des occurrences à la main mais ça me sidère toujours autant. Qu'on vous apprenne la base de la base de la programmation nécessaires à vos études de textes.

"je me dis qu'il y aura des cas particulier où ce raisonnement va bloquer" : je me dis que, tant que tu n'as pas défini LA sous liste LA plus représentative, alors la question n'a aucun sens :)
Pas prof.
Prépa, école, M2, thèse (optique/images) ->ingé dans le privé.

Avatar du membre
U46406
Messages : 6014
Enregistré le : mer. juil. 27, 2016 7:38 pm
Classe : shadow CCO nobo CMT
Contact :

Re: logiciel de tri de mots

Message par U46406 » jeu. juin 29, 2017 9:48 am

Il va peut-être faire une courbe statistique, et déplacer un cursus interactif pour définir son sous-ensemble le plus caractéristique ?
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

Répondre

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité