2026-02-24 22:37:15 +00:00
1 changed files with 17 additions and 77 deletions
--- a/main.py
+++ b/main.py
@@ -1,11 +1,8 @@
 # ruff: noqa: INP001
 """Async helpers for querying Vertex AI vector search via MCP."""
 import argparse
 import asyncio
 import io
 import logging
 import os
 from collections.abc import AsyncIterator, Sequence
 from contextlib import asynccontextmanager
 from dataclasses import dataclass
@@ -17,9 +14,8 @@ from gcloud.aio.storage import Storage
 from google import genai
 from google.genai import types as genai_types
 from mcp.server.fastmcp import Context, FastMCP
 from pydantic_settings import BaseSettings, PydanticBaseSettingsSource, YamlConfigSettingsSource
-logger = logging.getLogger(__name__)
+from .utils import Settings, _args, log_structured_entry
 HTTP_TOO_MANY_REQUESTS = 429
 HTTP_SERVER_ERROR = 500
@@ -91,12 +87,9 @@ class GoogleCloudFileStorage:
                file_stream.name = file_name
            except TimeoutError as exc:
                last_exception = exc
-                logger.warning(
+                log_structured_entry(
-                    "Timeout downloading gs://%s/%s (attempt %d/%d)",
+                    f"Timeout downloading gs://{self.bucket_name}/{file_name} (attempt {attempt + 1}/{max_retries})"
-                    self.bucket_name,
+                    "WARNING"
                    file_name,
                    attempt + 1,
                    max_retries,
                )
            except aiohttp.ClientResponseError as exc:
                last_exception = exc
@@ -104,13 +97,9 @@ class GoogleCloudFileStorage:
                    exc.status == HTTP_TOO_MANY_REQUESTS
                    or exc.status >= HTTP_SERVER_ERROR
                ):
-                    logger.warning(
+                     log_structured_entry(
-                        "HTTP %d downloading gs://%s/%s (attempt %d/%d)",
+                        f"HTTP {exc.status} downloading gs://{self.bucket_name}/{file_name} (attempt {attempt + 1}/{max_retries})"
-                        exc.status,
+                        "WARNING"
                        self.bucket_name,
                        file_name,
                        attempt + 1,
                        max_retries,
                    )
                else:
                    raise
@@ -283,58 +272,6 @@ class GoogleCloudVectorSearch:
 # ---------------------------------------------------------------------------
 def _parse_args() -> argparse.Namespace:
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--transport",
        choices=["stdio", "sse"],
        default="stdio",
    )
    parser.add_argument("--host", default="0.0.0.0")
    parser.add_argument("--port", type=int, default=8080)
    parser.add_argument(
        "--config",
        default=os.environ.get("CONFIG_FILE", "config.yaml"),
    )
    return parser.parse_args()
 _args = _parse_args()
 class Settings(BaseSettings):
    """Server configuration populated from env vars and a YAML config file."""
    model_config = {"env_file": ".env", "yaml_file": _args.config}
    project_id: str
    location: str
    bucket: str
    index_name: str
    deployed_index_id: str
    endpoint_name: str
    endpoint_domain: str
    embedding_model: str = "gemini-embedding-001"
    search_limit: int = 10
    @classmethod
    def settings_customise_sources(
        cls,
        settings_cls: type[BaseSettings],
        init_settings: PydanticBaseSettingsSource,
        env_settings: PydanticBaseSettingsSource,
        dotenv_settings: PydanticBaseSettingsSource,
        file_secret_settings: PydanticBaseSettingsSource,
    ) -> tuple[PydanticBaseSettingsSource, ...]:
        return (
            init_settings,
            env_settings,
            dotenv_settings,
            YamlConfigSettingsSource(settings_cls),
            file_secret_settings,
        )
@dataclass
 class AppContext:
    """Shared resources initialised once at server startup."""
@@ -429,13 +366,16 @@ async def knowledge_search(
            for s in search_results
            if s["distance"] > cutoff and s["distance"] > min_sim
        ]
-
+    
-    logger.info(
+    log_structured_entry(
-        "knowledge_search timing: embedding=%sms, vector_search=%sms, total=%sms, chunks=%s",
+        "knowledge_search timing",
-        round((t_embed - t0) * 1000, 1),
+        "INFO",
-        round((t_search - t_embed) * 1000, 1),
+        {
-        round((t_search - t0) * 1000, 1),
+            "embedding": f"{round((t_embed - t0) * 1000, 1)}ms",
-        [s["id"] for s in search_results],
+            "vector_serach": f"{round((t_search - t_embed) * 1000, 1)}ms",
            "total": f"{round((t_search - t0) * 1000, 1)}ms",
            "chunks": {[s["id"] for s in search_results]}
        }
    )
    # Format results as XML-like documents