Résumé un texte avec python

 Résumé de texte😍


Il y a une énorme quantité de données apparaissant numériquement, il est donc nécessaire de développer une procédure unique pour résumer immédiatement de longs textes tout en gardant l'idée principale. La synthèse de texte permet également de raccourcir le temps de lecture, d'accélérer les recherches d'in👌formations et d'obtenir un maximum d'informations sur un sujet.


Objectif principal et résumé

L'objectif principal de l'utilisation de l'apprentissage automatique pour la synthèse de texte est de réduire le texte de référence à une version plus petite tout en conservant ses connaissances à côté de sa signification. Plusieurs descriptions textuelles résumées sont fournies, par exemple, expliquent le rapport en tant que texte généré à partir d'un ou plusieurs documents qui communiquent des connaissances pertinentes dans le premier texte, et qui ne représentent pas plus de la moitié du texte principal et généralement beaucoup plus limité que cela.


J'espère que vous savez maintenant ce qu'est la synthèse de texte et pourquoi nous devons utiliser l'apprentissage automatique pour cela. Dans la section ci-dessous, je vais vous présenter un projet d'apprentissage automatique sur la synthèse de texte avec Python.



Résumé de texte avec Python

Maintenant, je vais vous expliquer la tâche de résumé de texte avec Python. Je vais commencer par importer les bibliothèques Python nécessaires :

Nous n'avons pas besoin d'utiliser beaucoup d'apprentissage automatique ici. Nous pouvons facilement résumer du texte sans entraîner de modèle. Mais encore, nous devons utiliser un traitement du langage naturel, pour cela, j'utiliserai la bibliothèque NLTK en Python.


Exécutons maintenant quelques étapes pour supprimer les ponctuations du texte, puis nous devons effectuer quelques étapes de traitement de texte, et à la fin, nous allons simplement tokeniser le texte et vous pourrez alors voir les résultats de la synthèse de texte avec python. 


text = "Enter Text to Summarize"
if text.count(". ") > 20:
    length = int(round(text.count(". ")/10, 0))
else:
    length = 1

nopuch =[char for char in text if char not in string.punctuation]
nopuch = "".join(nopuch)

processed_text = [word for word in nopuch.split() if word.lower() not in nltk.corpus.stopwords.words('english')]

word_freq = {}
for word in processed_text:
    if word not in word_freq:
        word_freq[word] = 1
    else:
        word_freq[word] = word_freq[word] + 1

max_freq = max(word_freq.values())
for word in word_freq.keys():
    word_freq[word] = (word_freq[word]/max_freq)

sent_list = nltk.sent_tokenize(text)
sent_score = {}
for sent in sent_list:
    for word in nltk.word_tokenize(sent.lower()):
        if word in word_freq.keys():
            if sent not in sent_score.keys():
                sent_score[sent] = word_freq[word]
            else:
                sent_score[sent] = sent_score[sent] + word_freq[word]

summary_sents = nlargest(length, sent_score, key=sent_score.get)
summary = " ".join(summary_sents)
print(summary)

Le code ci-dessus vous donnera alors un résumé du texte souhaité que vous devez stocker dans la variable 'text'. N'hésitez pas à poser vos précieuses questions dans la section commentaires ci-dessous.👌👌



Commentaires

Posts les plus consultés de ce blog

Comment fonctionne l'optimise d'Adam

RESEAU DE NEURONE CONVOLUTIF

Comment utiliser les diagrammes PlantUML dans Visual Studio Code pour Windows 10