Spaces:

jdelavande
/

chat-ui-energy

Running on CPU Upgrade

chat-ui-energy / src /lib /server /textGeneration /generate.ts

goupilew

[feat] Add support for endpoint web sources (#1544)

eabf2bf unverified 12 months ago

1.75 kB

	import type { ToolResult } from "$lib/types/Tool";
	import { MessageUpdateType, type MessageUpdate } from "$lib/types/MessageUpdate";
	import { AbortedGenerations } from "../abortedGenerations";
	import type { TextGenerationContext } from "./types";
	import type { EndpointMessage } from "../endpoints/endpoints";

	type GenerateContext = Omit<TextGenerationContext, "messages"> & { messages: EndpointMessage[] };

	export async function* generate(
	{ model, endpoint, conv, messages, assistant, isContinue, promptedAt }: GenerateContext,
	toolResults: ToolResult[],
	preprompt?: string
	): AsyncIterable<MessageUpdate> {
	for await (const output of await endpoint({
	messages,
	preprompt,
	continueMessage: isContinue,
	generateSettings: assistant?.generateSettings,
	toolResults,
	isMultimodal: model.multimodal,
	conversationId: conv._id,
	})) {
	// text generation completed
	if (output.generated_text) {
	let interrupted =
	!output.token.special && !model.parameters.stop?.includes(output.token.text);

	let text = output.generated_text.trimEnd();
	for (const stopToken of model.parameters.stop ?? []) {
	if (!text.endsWith(stopToken)) continue;

	interrupted = false;
	text = text.slice(0, text.length - stopToken.length);
	}

	yield {
	type: MessageUpdateType.FinalAnswer,
	text,
	interrupted,
	webSources: output.webSources,
	};
	continue;
	}

	// ignore special tokens
	if (output.token.special) continue;

	// pass down normal token
	yield { type: MessageUpdateType.Stream, token: output.token.text };

	// abort check
	const date = AbortedGenerations.getInstance().getList().get(conv._id.toString());
	if (date && date > promptedAt) break;

	// no output check
	if (!output) break;
	}
	}