smartai-v2/smartai-qwen.git

			@@ -41,6 +41,7 @@
			torch_dtype=torch.float16

			).eval()
			model = model.to(f"cuda:{config.get('cuda')}")
			self.model_pool.append(model)

			# 共享的处理器 (线程安全)
			@@ -172,7 +173,7 @@
			return_tensors="pt",
			)
			inputs = inputs.to(model.device)
			with torch.inference_mode():
			with torch.inference_mode(),torch.cuda.amp.autocast():
			outputs = model.generate(**inputs,max_new_tokens=200)
			generated_ids = outputs[:, len(inputs.input_ids[0]):]
			image_text = self.processor.batch_decode(
			@@ -219,7 +220,7 @@
			def image_rule_chat(self, image_des,rule_text, ragurl, rag_mode,max_tokens):
			try:
			content = (
			f"图片描述内容为：\n{image_des}\n规则内容：\n{rule_text}。\n请验证图片描述中是否有符合规则的内容，不进行推理和think。返回结果格式为[xxx符合的规则id]，如果没有返回[]")
			f"图片描述内容为：\n{image_des}\n规则内容：\n{rule_text}。\n请验证图片描述中是否有不符合规则的内容，不进行推理和think。返回结果格式为[xxx符合的规则id]，如果没有返回[]")
			#self.logger.info(len(content))
			search_data = {
			"prompt": "",