add azure_gpt_4o (#197)

2025-05-23 03:57:42 +08:00
parent 119bef25e2
commit a845824f06
2 changed files with 52 additions and 2 deletions
--- a/mm_agents/agent.py
+++ b/mm_agents/agent.py
@@ -9,6 +9,7 @@ import xml.etree.ElementTree as ET
 from http import HTTPStatus
 from io import BytesIO
 from typing import Dict, List
+from dotenv import load_dotenv

 import backoff
 import dashscope
@@ -565,7 +566,55 @@ class PromptAgent:
    )
    def call_llm(self, payload):

-        if self.model.startswith("gpt"):
+        if payload['model'].startswith("azure-gpt-4o"):
+
+
+            #.env config example :
+            # AZURE_OPENAI_API_BASE=YOUR_API_BASE
+            # AZURE_OPENAI_DEPLOYMENT=YOUR_DEPLOYMENT
+            # AZURE_OPENAI_API_VERSION=YOUR_API_VERSION
+            # AZURE_OPENAI_MODEL=gpt-4o-mini
+            # AZURE_OPENAI_API_KEY={{YOUR_API_KEY}}
+            # AZURE_OPENAI_ENDPOINT=${AZURE_OPENAI_API_BASE}/openai/deployments/${AZURE_OPENAI_DEPLOYMENT}/chat/completions?api-version=${AZURE_OPENAI_API_VERSION}
+
+
+            # Load environment variables
+            load_dotenv()
+            api_key = os.getenv('AZURE_OPENAI_API_KEY')
+            openai_endpoint = os.getenv('AZURE_OPENAI_ENDPOINT')
+            #logger.info("Openai endpoint: %s", openai_endpoint)
+
+            headers = {
+                "Content-Type": "application/json",
+                "api-key": api_key
+            }
+            logger.info("Generating content with GPT model: %s", payload['model'])
+            response = requests.post(
+                openai_endpoint,
+                headers=headers,
+                json=payload
+            )
+
+            if response.status_code != 200:
+                if response.json()['error']['code'] == "context_length_exceeded":
+                    logger.error("Context length exceeded. Retrying with a smaller context.")
+                    payload["messages"] = [payload["messages"][0]] + payload["messages"][-1:]
+                    retry_response = requests.post(
+                        openai_endpoint,
+                        headers=headers,
+                        json=payload
+                    )
+                    if retry_response.status_code != 200:
+                         logger.error(
+                            "Failed to call LLM even after attempt on shortening the history: " + retry_response.text)
+                         return ""
+
+                logger.error("Failed to call LLM: " + response.text)
+                time.sleep(5)
+                return ""
+            else:
+                return response.json()['choices'][0]['message']['content']
+        elif self.model.startswith("gpt"):
            headers = {
                "Content-Type": "application/json",
                "Authorization": f"Bearer {os.environ['OPENAI_API_KEY']}"
@@ -1046,7 +1095,7 @@ class PromptAgent:
            except Exception as e:
                print("Failed to call LLM: " + str(e))
                return ""
-
+        
        else:
            raise ValueError("Invalid model: " + self.model)

--- a/requirements.txt
+++ b/requirements.txt
@@ -60,3 +60,4 @@ azure-mgmt-compute
 azure-mgmt-network
 docker
 loguru
+dotenv