Spaces:

Leeflour
/

fufeigemini

Running

App Files Files Community

fufeigemini / app /utils /cache.py

Leeflour

Upload 197 files

d0dd276 verified about 1 month ago

raw

history blame contribute delete

13 kB

	import time
	import xxhash
	import asyncio
	from typing import Dict, Any, Optional, Tuple
	import logging
	from collections import deque
	from app.utils.logging import log
	logger = logging.getLogger("my_logger")
	import heapq

	# 定义缓存项的结构
	CacheItem = Dict[str, Any]

	class ResponseCacheManager:
	"""管理API响应缓存的类，一个键可以对应多个缓存项（使用deque）"""

	def __init__(self, expiry_time: int, max_entries: int,
	cache_dict: Dict[str, deque[CacheItem]] = None):
	"""
	初始化缓存管理器。

	Args:
	expiry_time (int): 缓存项的过期时间（秒）。
	max_entries (int): 缓存中允许的最大总条目数。
	cache_dict (Dict[str, deque[CacheItem]], optional): 初始缓存字典。默认为 None。
	"""
	self.cache: Dict[str, deque[CacheItem]] = cache_dict if cache_dict is not None else {}
	self.expiry_time = expiry_time
	self.max_entries = max_entries # 总条目数限制
	self.cur_cache_num = 0 # 当前条目数
	self.lock = asyncio.Lock() # Added lock

	async def get(self, cache_key: str) -> Tuple[Optional[Any], bool]: # Made async
	"""获取指定键的第一个有效缓存项（不删除）"""
	now = time.time()
	async with self.lock:
	if cache_key in self.cache:
	cache_deque = self.cache[cache_key]
	# 查找第一个未过期的项，且不删除
	for item in cache_deque:
	if now < item.get('expiry_time', 0):
	response = item.get('response',None)
	return response, True

	return None, False

	async def get_and_remove(self, cache_key: str) -> Tuple[Optional[Any], bool]:
	"""获取并删除指定键的第一个有效缓存项。"""
	now = time.time()
	async with self.lock:
	if cache_key in self.cache:
	cache_deque = self.cache[cache_key]

	# 查找第一个有效项并收集过期项
	valid_item_to_remove = None
	response_to_return = None
	new_deque = deque()
	items_removed_count = 0

	for item in cache_deque:
	if now < item.get('expiry_time', 0):
	if valid_item_to_remove is None: # 找到第一个有效项
	valid_item_to_remove = item
	response_to_return = item.get('response', None)
	items_removed_count += 1 # 计数此项为移除

	else:
	new_deque.append(item) # 保留后续有效项
	else:
	items_removed_count += 1 # 计数过期项为移除

	# 更新缓存状态
	if items_removed_count > 0:
	self.cur_cache_num = max(0, self.cur_cache_num - items_removed_count)
	if not new_deque:
	# 如果所有项都被移除（过期或我们取的那个）
	del self.cache[cache_key]
	else:
	self.cache[cache_key] = new_deque

	if valid_item_to_remove:
	return response_to_return, True # 返回找到的有效项

	# 如果键不存在或未找到有效项
	return None, False

	async def store(self, cache_key: str, response: Any):
	"""存储响应到缓存（追加到键对应的deque）"""
	now = time.time()
	new_item: CacheItem = {
	'response': response,
	'expiry_time': now + self.expiry_time,
	'created_at': now,
	}

	needs_cleaning = False
	async with self.lock:
	if cache_key not in self.cache:
	self.cache[cache_key] = deque()

	self.cache[cache_key].append(new_item) # 追加到deque末尾
	self.cur_cache_num += 1
	needs_cleaning = self.cur_cache_num > self.max_entries

	if needs_cleaning:
	# 在锁外调用清理，避免长时间持有锁
	await self.clean_if_needed()

	async def clean_expired(self):
	"""清理所有缓存项中已过期的项。"""
	now = time.time()
	keys_to_remove = []
	total_cleaned = 0
	async with self.lock:
	# 迭代 cache 的副本以允许在循环中安全地修改 cache
	for key, cache_deque in list(self.cache.items()):
	original_len = len(cache_deque)
	# 创建一个新的 deque，只包含未过期的项
	valid_items = deque(item for item in cache_deque if now < item.get('expiry_time', 0))
	cleaned_count = original_len - len(valid_items)

	if cleaned_count > 0:
	log('info', f"清理键 {key[:8]}... 的过期缓存项 {cleaned_count} 个。")
	total_cleaned += cleaned_count

	if not valid_items:
	keys_to_remove.append(key) # 标记此键以便稍后删除
	# 在持有锁时直接删除键
	if key in self.cache:
	del self.cache[key]
	log('info', f"缓存键 {key[:8]}... 的所有项均已过期，移除该键。")
	elif cleaned_count > 0:
	# 替换为只包含有效项的 deque
	self.cache[key] = valid_items

	# 统一更新缓存计数
	if total_cleaned > 0:
	self.cur_cache_num = max(0, self.cur_cache_num - total_cleaned)

	async def clean_if_needed(self):
	"""如果缓存总条目数超过限制，清理全局最旧的项目。"""

	async with self.lock:
	if self.cur_cache_num <= self.max_entries:
	return

	# 计算目标大小和需要移除的数量
	target_size = max(self.max_entries - 10, 10)
	if self.cur_cache_num <= target_size:
	return

	items_to_remove_count = self.cur_cache_num - target_size
	log('info', f"缓存总数 {self.cur_cache_num} 超过限制 {self.max_entries}，需要清理 {items_to_remove_count} 个")

	# 收集所有缓存项及其元数据
	all_items_meta = []
	for key, cache_deque in self.cache.items():
	for item in cache_deque:
	all_items_meta.append({'key': key, 'created_at': item.get('created_at', 0), 'item': item})

	# 找出最旧的 N 项
	actual_remove_count = min(items_to_remove_count, len(all_items_meta))
	if actual_remove_count <= 0:
	return # 没有项目可移除或无需移除

	items_to_remove = heapq.nsmallest(actual_remove_count, all_items_meta, key=lambda x: x['created_at'])

	# 执行移除
	items_actually_removed = 0
	keys_potentially_empty = set()
	for item_meta in items_to_remove:
	key_to_clean = item_meta['key']
	item_to_clean = item_meta['item']

	if key_to_clean in self.cache:
	try:
	# 直接从 deque 中移除指定的 item 对象
	self.cache[key_to_clean].remove(item_to_clean)
	items_actually_removed += 1
	# 计数器在最后统一更新
	log('info', f"因容量限制，删除键 {key_to_clean[:8]}... 的旧缓存项 (创建于 {item_meta['created_at']})。")
	keys_potentially_empty.add(key_to_clean)
	except (KeyError, ValueError):
	log('warning', f"尝试因容量限制删除缓存项时未找到 (可能已被提前移除): {key_to_clean[:8]}...")
	pass

	# 检查是否有 deque 因本次清理变空
	for key in keys_potentially_empty:
	if key in self.cache and not self.cache[key]:
	del self.cache[key]
	log('info', f"因容量限制清理后，键 {key[:8]}... 的deque已空，移除该键。")

	# 统一更新缓存计数
	if items_actually_removed > 0:
	self.cur_cache_num = max(0, self.cur_cache_num - items_actually_removed)
	log('info', f"因容量限制，共清理了 {items_actually_removed} 个旧缓存项。清理后缓存数: {self.cur_cache_num}")

	def generate_cache_key(chat_request, last_n_messages: int = 65536, is_gemini=False) -> str:
	"""
	根据模型名称和最后 N 条消息生成请求的唯一缓存键。
	Args:
	chat_request: 包含模型和消息列表的请求对象 (符合OpenAI格式)。
	last_n_messages: 需要包含在缓存键计算中的最后消息的数量。
	Returns:
	一个代表该请求的唯一缓存键字符串 (xxhash64哈希值)。
	"""
	h = xxhash.xxh64()

	# 1. 哈希模型名称
	h.update(chat_request.model.encode('utf-8'))

	if last_n_messages <= 0:
	# 如果不考虑消息，直接返回基于模型的哈希
	return h.hexdigest()

	messages_processed = 0

	# 2. 增量哈希最后 N 条消息 (从后往前)
	if is_gemini:
	# log('INFO', f"开启增量哈希gemini格式内容")
	for content_item in reversed(chat_request.payload.contents):
	if messages_processed >= last_n_messages:
	break
	role = content_item.get('role')
	if role is not None and isinstance(role, str):
	h.update(b'role:')
	h.update(role.encode('utf-8'))
	# log('INFO', f"哈希gemini格式角色{role}")
	parts = content_item.get('parts', [])
	if not isinstance(parts, list):
	parts = []
	for part in parts:
	text_content = part.get('text')
	if text_content is not None and isinstance(text_content, str):
	h.update(b'text:')
	h.update(text_content.encode('utf-8'))
	# log('INFO', f"哈希gemini格式文本内容{text_content}")

	inline_data_obj = part.get('inline_data')
	if inline_data_obj is not None and isinstance(inline_data_obj, dict):
	h.update(b'inline_data:')
	data_payload = inline_data_obj.get('data', '')
	# log('INFO', f"哈希gemini格式非文本内容{data_payload[:32]}")
	if isinstance(data_payload, str):
	h.update(b'data_prefix:')
	h.update(data_payload[:32].encode('utf-8'))

	file_data_obj = part.get('file_data')
	if file_data_obj is not None and isinstance(file_data_obj, dict):
	h.update(b'file_data:')
	file_uri = file_data_obj.get('file_uri', '')
	if isinstance(file_uri, str):
	h.update(b'file_uri:')
	h.update(file_uri.encode('utf-8'))
	messages_processed += 1

	else :
	for msg in reversed(chat_request.messages):
	if messages_processed >= last_n_messages:
	break

	# 哈希角色
	h.update(b'role:')
	h.update(msg.get('role', '').encode('utf-8'))

	# 哈希内容
	content = msg.get('content')
	if isinstance(content, str):
	h.update(b'text:')
	h.update(content.encode('utf-8'))
	elif isinstance(content, list):
	# 处理图文混合内容
	for item in content:
	item_type = item.get('type') if hasattr(item, 'get') else None
	if item_type == 'text':
	text = item.get('text', '') if hasattr(item, 'get') else ''
	h.update(b'text:')
	h.update(text.encode('utf-8'))
	elif item_type == 'image_url':
	image_url = item.get('image_url', {}) if hasattr(item, 'get') else {}
	image_data = image_url.get('url', '') if hasattr(image_url, 'get') else ''

	h.update(b'image_url:') # 加入类型标识符
	if image_data.startswith('data:image/'):
	# 对于base64图像，使用前32字符作为标识符
	h.update(image_data[:32].encode('utf-8'))
	else:
	h.update(image_data.encode('utf-8'))

	messages_processed += 1
	return h.hexdigest()