Spaces:

Burcin
/

ExtractiveSummarizer

Runtime error

App Files Files Community

Burcin commited on Jan 28, 2022

Commit

7f35581

1 Parent(s): 92e0d6e

Upload app.py

Browse files

Files changed (1) hide show

app.py +41 -10

app.py CHANGED Viewed

@@ -28,7 +28,7 @@ def  get_wiki_summary_by_pegasus(inp):
     model = PegasusForConditionalGeneration.from_pretrained("google/pegasus-xsum")
     summary = model.generate(**tokens)
     return tokenizer.decode(summary)
-"""
 def get_wiki_summary_by_lem(inp):
@@ -79,22 +79,53 @@ def get_wiki_summary_by_lem(inp):
     return summary
 desc =  """This interface allows you to summarize Wikipedia explanations. Only requirement is to write the topic. For summarization this model uses extractive summarization method and the number of sentences in the output depends on the length of the original text."""
-sample = [['Europe'], ['Great Depression'], ['Crocodile Dundee']]
-iface = Parallel(gr.Interface(fn=get_wiki_original_text, inputs=gr.inputs.Textbox(label="Requested Topic from Wikipedia    :   "), outputs="text"),
-                 gr.Interface(fn=get_wiki_summary_by_lem, inputs=gr.inputs.Textbox(label="Requested Topic from Wikipedia    :   "), outputs="text"),
-                 #gr.Interface(fn=get_wiki_summary_by_pegasus, inputs=gr.inputs.Textbox(label="Requested Topic from Wikipedia    :   "), outputs="text"),
-  #  get_wiki_original_text,get_wiki_summary_by_lem, get_wiki_summary_by_pegasus,
                  title= 'Text Summarizer',
                  description = desc,
                  examples=sample,

     model = PegasusForConditionalGeneration.from_pretrained("google/pegasus-xsum")
     summary = model.generate(**tokens)
     return tokenizer.decode(summary)
+    """
 def get_wiki_summary_by_lem(inp):
     return summary
+def get_wiki_summary_by_tfidf(inp):
+    text = wikipedia.summary(inp)
+    tfidf_vectorizer = TfidfVectorizer(ngram_range=(1,3))
+    all_sentences = [str(sent) for sent in nltk.sent_tokenize(text)]
+    sentence_vectors = tfidf_vectorizer.fit_transform(all_sentences)
+    sentence_scores_vector = np.hstack(np.array(sentence_vectors.sum(axis=1)))
+    sentence_scores = dict(zip(all_sentences, sentence_scores_vector))
+    summary_length = 0
+    if len(sentence_scores) > 5 :
+        summary_length = int(len(sentence_scores)*0.20)
+    else:
+        summary_length = int(len(sentence_scores)*0.50)
+    summary = str()
+    for sentence in nltk.sent_tokenize(text):
+        for i in range(0,summary_length):
+            if str(sentence).find(str(nlargest(summary_length, sentence_scores, key = sentence_scores.get)[i])) == 0:
+                summary += str(sentence).replace('\n','')
+                summary += ' '
+    return summary
 desc =  """This interface allows you to summarize Wikipedia explanations. Only requirement is to write the topic. For summarization this model uses extractive summarization method and the number of sentences in the output depends on the length of the original text."""
+x = """ Europe """
+y = ''' Great Depression '''
+z = ''' Crocodile Dundee '''
+sample = [[x],[y],[z]]
+iface = Parallel(gr.Interface(fn=get_wiki_original_text, inputs=gr.inputs.Textbox(label="Text"), outputs="Original Text"),
+                 gr.Interface(fn=get_wiki_summary_by_lem, inputs=gr.inputs.Textbox(label="Text"), outputs="Extractive Summarization v1"),
+                 gr.Interface(fn=get_wiki_summary_by_tfidf, inputs=gr.inputs.Textbox(label="Text"), outputs="Extractive Summarization v2"),
                  title= 'Text Summarizer',
                  description = desc,
                  examples=sample,