shidong
2025-07-14 fa78e5b5e03e40431e6c4404c6ecb00b8de81be3
qwen_thread.py
@@ -41,6 +41,7 @@
                torch_dtype=torch.float16
            ).eval()
            model = model.to(f"cuda:{config.get('cuda')}")
            self.model_pool.append(model)
        # 共享的处理器 (线程安全)
@@ -172,7 +173,7 @@
                return_tensors="pt",
            )
            inputs = inputs.to(model.device)
            with torch.inference_mode():
            with torch.inference_mode(),torch.cuda.amp.autocast():
                outputs = model.generate(**inputs,max_new_tokens=200)
            generated_ids = outputs[:, len(inputs.input_ids[0]):]
            image_text = self.processor.batch_decode(
@@ -219,7 +220,7 @@
    def image_rule_chat(self, image_des,rule_text, ragurl, rag_mode,max_tokens):
        try:
            content = (
                f"图片描述内容为:\n{image_des}\n规则内容:\n{rule_text}。\n请验证图片描述中是否有符合规则的内容,不进行推理和think。返回结果格式为[xxx符合的规则id],如果没有返回[]")
                f"图片描述内容为:\n{image_des}\n规则内容:\n{rule_text}。\n请验证图片描述中是否有不符合规则的内容,不进行推理和think。返回结果格式为[xxx符合的规则id],如果没有返回[]")
            #self.logger.info(len(content))
            search_data = {
                "prompt": "",