try423

Sleeping

App Files Files Community

try423 / app.py

Rajagopal

Update app.py

8722edc about 2 years ago

raw

history blame contribute delete

2.51 kB

	import streamlit as st
	from langchain import OpenAI, PromptTemplate, LLMChain
	from langchain.text_splitter import CharacterTextSplitter
	from langchain.chains.mapreduce import MapReduceChain
	from langchain.prompts import PromptTemplate
	from langchain.chat_models import AzureChatOpenAI
	from langchain.chains.summarize import load_summarize_chain
	from langchain.chains import AnalyzeDocumentChain
	from PyPDF2 import PdfReader
	from langchain.document_loaders import TextLoader
	from langchain.indexes import VectorstoreIndexCreator
	from langchain.document_loaders import PyPDFLoader



	import os


	os.environ["OPENAI_API_TYPE"] = "azure"
	os.environ["OPENAI_API_VERSION"] = "2023-03-15-preview"



	llm = AzureChatOpenAI(
	deployment_name="esujnand", model_name="gpt-35-turbo"
	)



	st.title("Wipro CSRD AI 1")

	# description text
	st.write("Step 1: Summary of your selected section of CSRD... Sections in this are enviormental topic1, enviornamtal topic2 ")
	st.write("Step 2: Ask your specfici questions regarding a CSRD disclosure requirments")


	# pdf file upload
	pdf_file = st.file_uploader("Upload file", type=["pdf"])

	numberofpages = 100

	if st.button("How many pages? "):
	reader = PdfReader(pdf_file)
	numberofpages = len(reader.pages)
	st.write("length is ", numberofpages)

	if st.button("table of contents? "):
	reader = PdfReader(pdf_file)
	page = reader.pages[2].extract_text()
	st.write(page)




	startpage = st.slider('Which section to look at', 0, numberofpages, 1)
	st.write("starting section page", startpage)


	pagecount = st.slider('How many pages', 1, 5, 1)
	st.write("pages to read", pagecount)


	def extract_text_from_pdf():
	reader = PdfReader(pdf_file)
	# get all pages text
	text = [reader.pages[i].extract_text() for i in range(startpage, startpage + pagecount )]
	# join all pages text
	text = " ".join(text)
	return text


	def extract_text_from_pdf2():
	reader = PdfReader(pdf_file)
	# get all pages text
	text = [reader.pages[i].extract_text() for i in range(len(reader.pages))]
	# join all pages text
	text = " ".join(text)
	return text

	if st.button("Summerize "):
	with st.spinner("Extracting Text..."):
	summary_chain = load_summarize_chain(llm, chain_type="map_reduce")
	summarize_document_chain = AnalyzeDocumentChain(combine_docs_chain=summary_chain, verbose=True)
	text = extract_text_from_pdf()
	with st.spinner("Summarizing..."):
	result = summarize_document_chain.run(text)
	st.write(result)