logiciel de tri de mots

rojopomodoro00

logiciel de tri de mots

Message par rojopomodoro00 » 27 juin 2017 00:13

Bonjour à toutes et à tous
J'ai un problème que je n'arrive pas à résoudre. J'ai une liste de thèmes appelant la I={ mot1,mot2,...,mot N}
et j'ai 120 documents qui contiennent en moyenne 70 pages (cette donnée ne va nous servir à rien c'est juste pour montrer que le travail ne peut pas se faire à la main).
Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents
Avec le logiciel Lexico3 (logiciel d'analyse du contenu) j'arrive à extraire la fréquence d'apparition des mots dans chaque article.
Y a-t-il un logiciel pour résoudre ce problème ? Merci à vous.

Messages : 2427

Inscription : 27 juil. 2016 19:38

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par U46406 » 27 juin 2017 09:50

Dans quel langage de programmation ? Python ? Tu sais programmer ?
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

Messages : 3823

Inscription : 17 avr. 2012 21:19

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par bullquies » 27 juin 2017 12:26

python avec TextBlob par exemple
The Axiom of Choice is obviously true, the Well-Ordering Principle is obviously false, and nobody knows about Zorn's Lemma. - Jerry Bona

rojopomodoro00

Re: logiciel de tri de mots

Message par rojopomodoro00 » 27 juin 2017 13:17

Merci à vous . @U46406 non je ne connais rien en programmation j'ai cru qu'il y a des applications pour faire ça en très peu de lignes
sans codage.
Dernière modification par rojopomodoro00 le 27 juin 2017 13:44, modifié 2 fois.

Messages : 2427

Inscription : 27 juil. 2016 19:38

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par U46406 » 27 juin 2017 13:28

Ben, va falloir suivre un cursus Humanités numérique informatique, hé hé. :)
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

rojopomodoro00

Re: logiciel de tri de mots

Message par rojopomodoro00 » 27 juin 2017 13:46

:) Lexico3 me donne directement en un clic tous les mots d'un document avec leurs fréquences d'apparition .je peux faire le reste à la main avec excel .
par exemple supposons que dans ma liste de départ j'ai 5 thèmes ( mot1,mot2,mot3,mot4,mot5) et lorsque j'ai cherché la répétition de ses mots dans les documents j'ai trouvé ;
documents 1 : le mot1 est présent 5 fois ; le mot2 est présent 3 fois ; le mot 3 on ne le trouve pas ; le mot 4 est présent 1 fois ,le mot 5 0 fois .on note cela de cette manière (5,3,0,1,0)
document 2 : (1.0.3.2,0)
document 3:(0,2,1;0,0)
document 4 : (8.0.0.2,0)
document 5:(0,0,7;0,0)
pour dire qu'un mot représente bien les documents je fais la somme des fréquence d'apparition ça nous donne (14,5,11,5,0) donc la liste ( mot1,mot2;mot3,mot4) est la plus représentative . je me dis qu'il y aura des cas particulier où ce raisonnement va bloquer
vous en pensez quoi ?
Dernière modification par rojopomodoro00 le 27 juin 2017 16:03, modifié 1 fois.

Messages : 2427

Inscription : 27 juil. 2016 19:38

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par U46406 » 27 juin 2017 13:53

il te faut la solution pour dans combien de temps (si tu es en stage) ?
Pour savoir si tu as le temps de te lancer dans l'apprentissage de ce que c'est qu'un algorithme et la programmation ?
(ou alors si tu fais un Master de littérature comparée du 17e siècle et que Python, c'est pas ta priorité ...)
« Occupez-vous d’abord des choses qui sont à portée de main. Rangez votre chambre avant de sauver le monde. Ensuite, sauvez le monde. » (Ron Padgett, dans Comment devenir parfait) :mrgreen:

rojopomodoro00

Re: logiciel de tri de mots

Message par rojopomodoro00 » 27 juin 2017 14:05

hhhhh je suis en master Finance . j'ai 2 jours pour trouver la solution =D. tu penses quoi de la proposition que j'ai faite avant ? c'est comme ça qu'il faut penser ?

Messages : 9679

Inscription : 30 juil. 2008 16:59

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par fakbill » 28 juin 2017 21:30

"Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents "
La question est mal posée. C'est quoi LA sous liste la plus représentative? Une liste d'un seul élément qui est le plus représenté dans les textes? Les deux éléments les plus représentés? Les 5 premiers? bref la question n'a pas de sens. Cherche une question qui a un sens et on verra ce qu'on peut faire :)
Pas prof.
Prépa, école, M2, thèse (optique/images) ->ingé dans le privé.

Messages : 9679

Inscription : 30 juil. 2008 16:59

Profil de l'utilisateur : Élève de lycée

Re: logiciel de tri de mots

Message par fakbill » 28 juin 2017 21:33

ps : en 2017 c'est totalement dingue de faire ça à la main même si c'est uniquement sur qlqs documents de qlqs pages. Ce n'est pas la première fois que je vois un "littéraire" compter des occurrences à la main mais ça me sidère toujours autant. Qu'on vous apprenne la base de la base de la programmation nécessaires à vos études de textes.

"je me dis qu'il y aura des cas particulier où ce raisonnement va bloquer" : je me dis que, tant que tu n'as pas défini LA sous liste LA plus représentative, alors la question n'a aucun sens :)
Pas prof.
Prépa, école, M2, thèse (optique/images) ->ingé dans le privé.

Répondre