Spaces:

tonneli
/

EureCA

Sleeping

App Files Files Community

EureCA / dsp /modules /gpt3.py

tonneli

Delete history

f5776d3 over 1 year ago

raw

history blame contribute delete

9.08 kB

	import logging
	from logging.handlers import RotatingFileHandler

	# Configure logging
	logging.basicConfig(
	level=logging.INFO,
	format='%(message)s',
	handlers=[
	logging.FileHandler('openai_usage.log')
	]
	)

	import functools
	import json
	from typing import Any, Literal, Optional, cast

	import dsp
	import backoff
	import openai

	from dsp.modules.cache_utils import CacheMemory, NotebookCacheMemory, cache_turn_on
	from dsp.modules.lm import LM

	try:
	OPENAI_LEGACY = int(openai.version.__version__[0]) == 0
	except Exception:
	OPENAI_LEGACY = True

	try:
	from openai.openai_object import OpenAIObject
	import openai.error
	ERRORS = (openai.error.RateLimitError, openai.error.ServiceUnavailableError, openai.error.APIError)
	except Exception:
	ERRORS = (openai.RateLimitError, openai.APIError)
	OpenAIObject = dict


	def backoff_hdlr(details):
	"""Handler from https://pypi.org/project/backoff/"""
	print(
	"Backing off {wait:0.1f} seconds after {tries} tries "
	"calling function {target} with kwargs "
	"{kwargs}".format(**details)
	)


	class GPT3(LM):
	"""Wrapper around OpenAI's GPT API. Supports both the OpenAI and Azure APIs.

	Args:
	model (str, optional): OpenAI or Azure supported LLM model to use. Defaults to "text-davinci-002".
	api_key (Optional[str], optional): API provider Authentication token. use Defaults to None.
	api_provider (Literal["openai", "azure"], optional): The API provider to use. Defaults to "openai".
	model_type (Literal["chat", "text"], optional): The type of model that was specified. Mainly to decide the optimal prompting strategy. Defaults to "text".
	**kwargs: Additional arguments to pass to the API provider.
	"""

	def __init__(
	self,
	model: str = "gpt-3.5-turbo-instruct",
	api_key: Optional[str] = None,
	api_provider: Literal["openai", "azure"] = "openai",
	api_base: Optional[str] = None,
	model_type: Literal["chat", "text"] = None,
	**kwargs,
	):
	super().__init__(model)
	self.provider = "openai"
	openai.api_type = api_provider

	default_model_type = (
	"chat"
	if ("gpt-3.5" in model or "turbo" in model or "gpt-4" in model)
	and ("instruct" not in model)
	else "text"
	)
	self.model_type = model_type if model_type else default_model_type

	if api_provider == "azure":
	assert (
	"engine" in kwargs or "deployment_id" in kwargs
	), "Must specify engine or deployment_id for Azure API instead of model."
	assert "api_version" in kwargs, "Must specify api_version for Azure API"
	assert api_base is not None, "Must specify api_base for Azure API"
	if kwargs.get("api_version"):
	openai.api_version = kwargs["api_version"]

	if api_key:
	openai.api_key = api_key

	if api_base:
	if OPENAI_LEGACY:
	openai.api_base = api_base
	else:
	openai.base_url = api_base

	self.kwargs = {
	"temperature": 0.0,
	"max_tokens": 150,
	"top_p": 1,
	"frequency_penalty": 0,
	"presence_penalty": 0,
	"n": 1,
	**kwargs,
	} # TODO: add kwargs above for </s>

	if api_provider != "azure":
	self.kwargs["model"] = model
	self.history: list[dict[str, Any]] = []

	def _openai_client(self):
	return openai

	def log_usage(self, response):
	"""Log the total tokens from the OpenAI API response."""
	usage_data = response.get('usage')
	if usage_data:
	total_tokens = usage_data.get('total_tokens')
	logging.info(f'{total_tokens}')

	def basic_request(self, prompt: str, **kwargs):
	raw_kwargs = kwargs

	kwargs = {self.kwargs, kwargs}
	if self.model_type == "chat":
	# caching mechanism requires hashable kwargs
	kwargs["messages"] = [{"role": "user", "content": prompt}]
	kwargs = {"stringify_request": json.dumps(kwargs)}
	response = chat_request(**kwargs)

	else:
	kwargs["prompt"] = prompt
	response = completions_request(**kwargs)

	history = {
	"prompt": prompt,
	"response": response,
	"kwargs": kwargs,
	"raw_kwargs": raw_kwargs,
	}
	self.history.append(history)

	return response

	@backoff.on_exception(
	backoff.expo,
	ERRORS,
	max_time=1000,
	on_backoff=backoff_hdlr,
	)
	def request(self, prompt: str, **kwargs):
	"""Handles retreival of GPT-3 completions whilst handling rate limiting and caching."""
	if "model_type" in kwargs:
	del kwargs["model_type"]

	return self.basic_request(prompt, **kwargs)

	def _get_choice_text(self, choice: dict[str, Any]) -> str:
	if self.model_type == "chat":
	return choice["message"]["content"]
	return choice["text"]

	def __call__(
	self,
	prompt: str,
	only_completed: bool = True,
	return_sorted: bool = False,
	**kwargs,
	) -> list[dict[str, Any]]:
	"""Retrieves completions from GPT-3.

	Args:
	prompt (str): prompt to send to GPT-3
	only_completed (bool, optional): return only completed responses and ignores completion due to length. Defaults to True.
	return_sorted (bool, optional): sort the completion choices using the returned probabilities. Defaults to False.

	Returns:
	list[dict[str, Any]]: list of completion choices
	"""

	assert only_completed, "for now"
	assert return_sorted is False, "for now"

	# if kwargs.get("n", 1) > 1:
	# if self.model_type == "chat":
	# kwargs = {**kwargs}
	# else:
	# kwargs = {**kwargs, "logprobs": 5}

	response = self.request(prompt, **kwargs)

	if dsp.settings.log_openai_usage:
	self.log_usage(response)

	choices = response["choices"]

	completed_choices = [c for c in choices if c["finish_reason"] != "length"]

	if only_completed and len(completed_choices):
	choices = completed_choices

	completions = [self._get_choice_text(c) for c in choices]
	if return_sorted and kwargs.get("n", 1) > 1:
	scored_completions = []

	for c in choices:
	tokens, logprobs = (
	c["logprobs"]["tokens"],
	c["logprobs"]["token_logprobs"],
	)

	if "<\|endoftext\|>" in tokens:
	index = tokens.index("<\|endoftext\|>") + 1
	tokens, logprobs = tokens[:index], logprobs[:index]

	avglog = sum(logprobs) / len(logprobs)
	scored_completions.append((avglog, self._get_choice_text(c)))

	scored_completions = sorted(scored_completions, reverse=True)
	completions = [c for _, c in scored_completions]

	return completions



	@CacheMemory.cache
	def cached_gpt3_request_v2(**kwargs):
	return openai.Completion.create(**kwargs)

	@functools.lru_cache(maxsize=None if cache_turn_on else 0)
	@NotebookCacheMemory.cache
	def cached_gpt3_request_v2_wrapped(**kwargs):
	return cached_gpt3_request_v2(**kwargs)

	@CacheMemory.cache
	def _cached_gpt3_turbo_request_v2(**kwargs) -> OpenAIObject:
	if "stringify_request" in kwargs:
	kwargs = json.loads(kwargs["stringify_request"])
	return cast(OpenAIObject, openai.ChatCompletion.create(**kwargs))

	@functools.lru_cache(maxsize=None if cache_turn_on else 0)
	@NotebookCacheMemory.cache
	def _cached_gpt3_turbo_request_v2_wrapped(**kwargs) -> OpenAIObject:
	return _cached_gpt3_turbo_request_v2(**kwargs)

	@CacheMemory.cache
	def v1_cached_gpt3_request_v2(**kwargs):
	return openai.completions.create(**kwargs)

	@functools.lru_cache(maxsize=None if cache_turn_on else 0)
	@NotebookCacheMemory.cache
	def v1_cached_gpt3_request_v2_wrapped(**kwargs):
	return v1_cached_gpt3_request_v2(**kwargs)

	@CacheMemory.cache
	def v1_cached_gpt3_turbo_request_v2(**kwargs):
	if "stringify_request" in kwargs:
	kwargs = json.loads(kwargs["stringify_request"])
	return openai.chat.completions.create(**kwargs)

	@functools.lru_cache(maxsize=None if cache_turn_on else 0)
	@NotebookCacheMemory.cache
	def v1_cached_gpt3_turbo_request_v2_wrapped(**kwargs):
	return v1_cached_gpt3_turbo_request_v2(**kwargs)



	def chat_request(**kwargs):
	if OPENAI_LEGACY:
	return _cached_gpt3_turbo_request_v2_wrapped(**kwargs)

	return v1_cached_gpt3_turbo_request_v2_wrapped(**kwargs).model_dump()

	def completions_request(**kwargs):
	if OPENAI_LEGACY:
	return cached_gpt3_request_v2_wrapped(**kwargs)

	return v1_cached_gpt3_request_v2_wrapped(**kwargs).model_dump()