Add CI

2026-03-05 21:43:15 +00:00
parent 86ed34887b
commit d39b8a6ea7
17 changed files with 337 additions and 210 deletions
--- a/.gitea/workflows/ci.yml
+++ b/.gitea/workflows/ci.yml
@@ -0,0 +1,43 @@
+name: CI
+
+on:
+  push:
+    branches: [main]
+  pull_request:
+    branches: [main]
+
+jobs:
+  lint:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v4
+      - uses: astral-sh/setup-uv@v6
+        with:
+          python-version: "3.12"
+      - run: uv sync --frozen
+      - name: Ruff check
+        run: uv run ruff check
+      - name: Ruff format check
+        run: uv run ruff format --check
+
+  typecheck:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v4
+      - uses: astral-sh/setup-uv@v6
+        with:
+          python-version: "3.12"
+      - run: uv sync --frozen
+      - name: Type check
+        run: uv run ty check
+
+  test:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v4
+      - uses: astral-sh/setup-uv@v6
+        with:
+          python-version: "3.12"
+      - run: uv sync --frozen
+      - name: Run tests
+        run: uv run pytest --cov
--- a/CLAUDE.md
+++ b/CLAUDE.md
@@ -0,0 +1,3 @@
+Use `uv` for project management
+Linter: `uv run ruff check`
+Type-checking: `uv run ty check`
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -36,3 +36,19 @@ pythonpath = ["."]
 [build-system]
 requires = ["uv_build>=0.8.3,<0.9.0"]
 build-backend = "uv_build"
+
+[tool.ruff]
+exclude = ["scripts", "tests"]
+
+[tool.ty.src]
+exclude = ["scripts", "tests"]
+
+[tool.ruff.lint]
+select = ['ALL']
+ignore = [
+    'D203',    # one-blank-line-before-class
+    'D213',    # multi-line-summary-second-line
+    'COM812',  # missing-trailing-comma
+    'ANN401',  # dynamically-typed-any
+    'ERA001',  # commented-out-code
+]
--- a/scripts/agent.py
+++ b/scripts/agent.py
--- a/src/knowledge_search_mcp/init.py
+++ b/src/knowledge_search_mcp/init.py
@@ -6,10 +6,10 @@ from .models import AppContext, SearchResult, SourceNamespace
 from .utils.cache import LRUCache

 __all__ = [
+    "AppContext",
    "GoogleCloudFileStorage",
    "GoogleCloudVectorSearch",
-    "SourceNamespace",
-    "SearchResult",
-    "AppContext",
    "LRUCache",
+    "SearchResult",
+    "SourceNamespace",
 ]
--- a/src/knowledge_search_mcp/main.py
+++ b/src/knowledge_search_mcp/main.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """MCP server for semantic search over Vertex AI Vector Search."""

 import time
@@ -9,7 +8,11 @@ from .config import _args
 from .logging import log_structured_entry
 from .models import AppContext, SourceNamespace
 from .server import lifespan
-from .services.search import filter_search_results, format_search_results, generate_query_embedding
+from .services.search import (
+    filter_search_results,
+    format_search_results,
+    generate_query_embedding,
+)

 mcp = FastMCP(
    "knowledge-search",
@@ -44,7 +47,7 @@ async def knowledge_search(
    log_structured_entry(
        "knowledge_search request received",
        "INFO",
-        {"query": query[:100]}  # Log first 100 chars of query
+        {"query": query[:100]},  # Log first 100 chars of query
    )

    try:
@@ -61,7 +64,7 @@ async def knowledge_search(
        log_structured_entry(
            "Query embedding generated successfully",
            "INFO",
-            {"time_ms": round((t_embed - t0) * 1000, 1)}
+            {"time_ms": round((t_embed - t0) * 1000, 1)},
        )

        # Perform vector search
@@ -74,17 +77,13 @@ async def knowledge_search(
                source=source,
            )
            t_search = time.perf_counter()
-        except Exception as e:
+        except Exception as e:  # noqa: BLE001
            log_structured_entry(
                "Vector search failed",
                "ERROR",
-                {
-                    "error": str(e),
-                    "error_type": type(e).__name__,
-                    "query": query[:100]
-                }
+                {"error": str(e), "error_type": type(e).__name__, "query": query[:100]},
            )
-            return f"Error performing vector search: {str(e)}"
+            return f"Error performing vector search: {e!s}"

        # Apply similarity filtering
        filtered_results = filter_search_results(search_results)
@@ -98,32 +97,26 @@ async def knowledge_search(
                "total_ms": f"{round((t_search - t0) * 1000, 1)}ms",
                "source_filter": source.value if source is not None else None,
                "results_count": len(filtered_results),
-                "chunks": [s["id"] for s in filtered_results]
-            }
+                "chunks": [s["id"] for s in filtered_results],
+            },
        )

        # Format and return results
        if not filtered_results:
            log_structured_entry(
-                "No results found for query",
-                "INFO",
-                {"query": query[:100]}
+                "No results found for query", "INFO", {"query": query[:100]}
            )

        return format_search_results(filtered_results)

-    except Exception as e:
+    except Exception as e:  # noqa: BLE001
        # Catch-all for any unexpected errors
        log_structured_entry(
            "Unexpected error in knowledge_search",
            "ERROR",
-            {
-                "error": str(e),
-                "error_type": type(e).__name__,
-                "query": query[:100]
-            }
+            {"error": str(e), "error_type": type(e).__name__, "query": query[:100]},
        )
-        return f"Unexpected error during search: {str(e)}"
+        return f"Unexpected error during search: {e!s}"


 def main() -> None:
--- a/src/knowledge_search_mcp/clients/base.py
+++ b/src/knowledge_search_mcp/clients/base.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """Base client with shared aiohttp session management."""

 import aiohttp
--- a/src/knowledge_search_mcp/clients/storage.py
+++ b/src/knowledge_search_mcp/clients/storage.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """Google Cloud Storage client with caching."""

 import asyncio
@@ -8,8 +7,9 @@ from typing import BinaryIO
 import aiohttp
 from gcloud.aio.storage import Storage

-from ..logging import log_structured_entry
-from ..utils.cache import LRUCache
+from knowledge_search_mcp.logging import log_structured_entry
+from knowledge_search_mcp.utils.cache import LRUCache
+
 from .base import BaseGoogleCloudClient

 HTTP_TOO_MANY_REQUESTS = 429
@@ -56,7 +56,7 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
            log_structured_entry(
                "File retrieved from cache",
                "INFO",
-                {"file": file_name, "bucket": self.bucket_name}
+                {"file": file_name, "bucket": self.bucket_name},
            )
            file_stream = io.BytesIO(cached_content)
            file_stream.name = file_name
@@ -65,7 +65,7 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
        log_structured_entry(
            "Starting file download from GCS",
            "INFO",
-            {"file": file_name, "bucket": self.bucket_name}
+            {"file": file_name, "bucket": self.bucket_name},
        )

        storage_client = self._get_aio_storage()
@@ -87,15 +87,18 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
                        "file": file_name,
                        "bucket": self.bucket_name,
                        "size_bytes": len(content),
-                        "attempt": attempt + 1
-                    }
+                        "attempt": attempt + 1,
+                    },
                )
            except TimeoutError as exc:
                last_exception = exc
                log_structured_entry(
-                    f"Timeout downloading gs://{self.bucket_name}/{file_name} (attempt {attempt + 1}/{max_retries})",
+                    (
+                        f"Timeout downloading gs://{self.bucket_name}/{file_name} "
+                        f"(attempt {attempt + 1}/{max_retries})"
+                    ),
                    "WARNING",
-                    {"error": str(exc)}
+                    {"error": str(exc)},
                )
            except aiohttp.ClientResponseError as exc:
                last_exception = exc
@@ -103,16 +106,19 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
                    exc.status == HTTP_TOO_MANY_REQUESTS
                    or exc.status >= HTTP_SERVER_ERROR
                ):
-                     log_structured_entry(
-                        f"HTTP {exc.status} downloading gs://{self.bucket_name}/{file_name} (attempt {attempt + 1}/{max_retries})",
+                    log_structured_entry(
+                        (
+                            f"HTTP {exc.status} downloading gs://{self.bucket_name}/"
+                            f"{file_name} (attempt {attempt + 1}/{max_retries})"
+                        ),
                        "WARNING",
-                        {"status": exc.status, "message": str(exc)}
+                        {"status": exc.status, "message": str(exc)},
                    )
                else:
                    log_structured_entry(
                        f"Non-retryable HTTP error downloading gs://{self.bucket_name}/{file_name}",
                        "ERROR",
-                        {"status": exc.status, "message": str(exc)}
+                        {"status": exc.status, "message": str(exc)},
                    )
                    raise
            else:
@@ -123,7 +129,7 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
                log_structured_entry(
                    "Retrying file download",
                    "INFO",
-                    {"file": file_name, "delay_seconds": delay}
+                    {"file": file_name, "delay_seconds": delay},
                )
                await asyncio.sleep(delay)

@@ -138,7 +144,7 @@ class GoogleCloudFileStorage(BaseGoogleCloudClient):
                "file": file_name,
                "bucket": self.bucket_name,
                "max_retries": max_retries,
-                "last_error": str(last_exception)
-            }
+                "last_error": str(last_exception),
+            },
        )
        raise TimeoutError(msg) from last_exception
--- a/src/knowledge_search_mcp/clients/vector_search.py
+++ b/src/knowledge_search_mcp/clients/vector_search.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """Google Cloud Vector Search client."""

 import asyncio
@@ -6,8 +5,9 @@ from collections.abc import Sequence

 from gcloud.aio.auth import Token

-from ..logging import log_structured_entry
-from ..models import SearchResult, SourceNamespace
+from knowledge_search_mcp.logging import log_structured_entry
+from knowledge_search_mcp.models import SearchResult, SourceNamespace
+
 from .base import BaseGoogleCloudClient
 from .storage import GoogleCloudFileStorage

@@ -94,7 +94,7 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
            log_structured_entry(
                "Vector search query failed - endpoint not configured",
                "ERROR",
-                {"error": msg}
+                {"error": msg},
            )
            raise RuntimeError(msg)

@@ -113,8 +113,8 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
                "deployed_index_id": deployed_index_id,
                "neighbor_count": limit,
                "endpoint_id": endpoint_id,
-                "embedding_dimension": len(query)
-            }
+                "embedding_dimension": len(query),
+            },
        )

        datapoint: dict = {"feature_vector": list(query)}
@@ -149,10 +149,10 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
                        {
                            "status": response.status,
                            "response_body": body,
-                            "deployed_index_id": deployed_index_id
-                        }
+                            "deployed_index_id": deployed_index_id,
+                        },
                    )
-                    raise RuntimeError(msg)
+                    raise RuntimeError(msg)  # noqa: TRY301
                data = await response.json()

            neighbors = data.get("nearestNeighbors", [{}])[0].get("neighbors", [])
@@ -161,15 +161,15 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
                "INFO",
                {
                    "neighbors_found": len(neighbors),
-                    "deployed_index_id": deployed_index_id
-                }
+                    "deployed_index_id": deployed_index_id,
+                },
            )

            if not neighbors:
                log_structured_entry(
                    "No neighbors found in vector search",
                    "WARNING",
-                    {"deployed_index_id": deployed_index_id}
+                    {"deployed_index_id": deployed_index_id},
                )
                return []

@@ -185,7 +185,7 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
            log_structured_entry(
                "Fetching content for search results",
                "INFO",
-                {"file_count": len(content_tasks)}
+                {"file_count": len(content_tasks)},
            )

            file_streams = await asyncio.gather(*content_tasks)
@@ -206,12 +206,9 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
            log_structured_entry(
                "Vector search completed successfully",
                "INFO",
-                {
-                    "results_count": len(results),
-                    "deployed_index_id": deployed_index_id
-                }
+                {"results_count": len(results), "deployed_index_id": deployed_index_id},
            )
-            return results
+            return results  # noqa: TRY300

        except Exception as e:
            log_structured_entry(
@@ -220,7 +217,7 @@ class GoogleCloudVectorSearch(BaseGoogleCloudClient):
                {
                    "error": str(e),
                    "error_type": type(e).__name__,
-                    "deployed_index_id": deployed_index_id
-                }
+                    "deployed_index_id": deployed_index_id,
+                },
            )
            raise
--- a/src/knowledge_search_mcp/config.py
+++ b/src/knowledge_search_mcp/config.py
@@ -1,7 +1,14 @@
+"""Configuration management for the MCP server."""
+
+import argparse
 import os
 import sys
-import argparse
-from pydantic_settings import BaseSettings, PydanticBaseSettingsSource, YamlConfigSettingsSource
+
+from pydantic_settings import (
+    BaseSettings,
+    PydanticBaseSettingsSource,
+    YamlConfigSettingsSource,
+)


 def _parse_args() -> argparse.Namespace:
@@ -14,7 +21,7 @@ def _parse_args() -> argparse.Namespace:
        parser = argparse.ArgumentParser()
        return argparse.Namespace(
            transport="stdio",
-            host="0.0.0.0",
+            host="0.0.0.0",  # noqa: S104
            port=8080,
            config=os.environ.get("CONFIG_FILE", "config.yaml"),
        )
@@ -25,7 +32,7 @@ def _parse_args() -> argparse.Namespace:
        choices=["stdio", "sse", "streamable-http"],
        default="stdio",
    )
-    parser.add_argument("--host", default="0.0.0.0")
+    parser.add_argument("--host", default="0.0.0.0")  # noqa: S104
    parser.add_argument("--port", type=int, default=8080)
    parser.add_argument(
        "--config",
@@ -36,6 +43,7 @@ def _parse_args() -> argparse.Namespace:

 _args = _parse_args()

+
 class Settings(BaseSettings):
    """Server configuration populated from env vars and a YAML config file."""

@@ -63,6 +71,7 @@ class Settings(BaseSettings):
        dotenv_settings: PydanticBaseSettingsSource,
        file_secret_settings: PydanticBaseSettingsSource,
    ) -> tuple[PydanticBaseSettingsSource, ...]:
+        """Customize the order of settings sources to include YAML config."""
        return (
            init_settings,
            env_settings,
@@ -78,7 +87,7 @@ _cfg: Settings | None = None

 def get_config() -> Settings:
    """Get or create the singleton Settings instance."""
-    global _cfg
+    global _cfg  # noqa: PLW0603
    if _cfg is None:
        _cfg = Settings.model_validate({})
    return _cfg
@@ -88,8 +97,8 @@ def get_config() -> Settings:
 class _ConfigProxy:
    """Proxy object that lazily loads config on attribute access."""

-    def __getattr__(self, name: str):
+    def __getattr__(self, name: str) -> object:
        return getattr(get_config(), name)


-cfg = _ConfigProxy()  # type: ignore[assignment]
+cfg = _ConfigProxy()
--- a/src/knowledge_search_mcp/logging.py
+++ b/src/knowledge_search_mcp/logging.py
@@ -1,23 +1,22 @@
-"""
-Centralized Cloud Logging setup.
-Uses CloudLoggingHandler (background thread) so logging does not add latency
+"""Centralized Cloud Logging setup.
+
+Uses CloudLoggingHandler (background thread) so logging does not add latency.
 """

 import logging
-from typing import Optional, Dict, Literal
+from typing import Literal

 import google.cloud.logging
 from google.cloud.logging.handlers import CloudLoggingHandler

 from .config import get_config

-
 _eval_log: logging.Logger | None = None


 def _get_logger() -> logging.Logger:
    """Get or create the singleton evaluation logger."""
-    global _eval_log
+    global _eval_log  # noqa: PLW0603
    if _eval_log is not None:
        return _eval_log

@@ -33,7 +32,7 @@ def _get_logger() -> logging.Logger:
            handler = CloudLoggingHandler(client, name=cfg.log_name)  # async transport
            logger.addHandler(handler)
            logger.setLevel(getattr(logging, cfg.log_level.upper()))
-        except Exception as e:
+        except Exception as e:  # noqa: BLE001
            # Fallback to console if Cloud Logging is unavailable (local dev)
            logging.basicConfig(level=getattr(logging, cfg.log_level.upper()))
            logger = logging.getLogger(cfg.log_name)
@@ -46,15 +45,23 @@ def _get_logger() -> logging.Logger:
    return logger


-def log_structured_entry(message: str, severity: Literal["INFO", "WARNING", "ERROR"], custom_log: Optional[Dict] = None) -> None:
-    """
-    Emit a JSON-structured log row.
+def log_structured_entry(
+    message: str,
+    severity: Literal["INFO", "WARNING", "ERROR"],
+    custom_log: dict | None = None,
+) -> None:
+    """Emit a JSON-structured log row.

    Args:
        message: Short label for the row (e.g., "Final agent turn").
        severity: "INFO" | "WARNING" | "ERROR"
        custom_log: A dict with your structured payload.
+
    """
    level = getattr(logging, severity.upper(), logging.INFO)
    logger = _get_logger()
-    logger.log(level, message, extra={"json_fields": {"message": message, "custom": custom_log or {}}})
+    logger.log(
+        level,
+        message,
+        extra={"json_fields": {"message": message, "custom": custom_log or {}}},
+    )
--- a/src/knowledge_search_mcp/models.py
+++ b/src/knowledge_search_mcp/models.py
@@ -1,8 +1,7 @@
-# ruff: noqa: INP001
 """Domain models for knowledge search MCP server."""

 from dataclasses import dataclass
-from enum import Enum
+from enum import StrEnum
 from typing import TYPE_CHECKING, TypedDict

 if TYPE_CHECKING:
@@ -12,7 +11,7 @@ if TYPE_CHECKING:
    from .config import Settings


-class SourceNamespace(str, Enum):
+class SourceNamespace(StrEnum):
    """Allowed values for the 'source' namespace filter."""

    EDUCACION_FINANCIERA = "Educacion Financiera"
--- a/src/knowledge_search_mcp/server.py
+++ b/src/knowledge_search_mcp/server.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """MCP server lifecycle management."""

 from collections.abc import AsyncIterator
@@ -8,12 +7,12 @@ from google import genai
 from mcp.server.fastmcp import FastMCP

 from .clients.vector_search import GoogleCloudVectorSearch
-from .config import Settings, cfg
+from .config import get_config
 from .logging import log_structured_entry
 from .models import AppContext
 from .services.validation import (
-    validate_genai_access,
    validate_gcs_access,
+    validate_genai_access,
    validate_vector_search_access,
 )

@@ -21,15 +20,18 @@ from .services.validation import (
@asynccontextmanager
 async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
    """Create and configure the vector-search client for the server lifetime."""
+    # Get config with proper types for initialization
+    config_for_init = get_config()
+
    log_structured_entry(
        "Initializing MCP server",
        "INFO",
        {
-            "project_id": cfg.project_id,
-            "location": cfg.location,
-            "bucket": cfg.bucket,
-            "index_name": cfg.index_name,
-        }
+            "project_id": config_for_init.project_id,
+            "location": config_for_init.location,
+            "bucket": config_for_init.bucket,
+            "index_name": config_for_init.index_name,
+        },
    )

    vs: GoogleCloudVectorSearch | None = None
@@ -37,10 +39,10 @@ async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
        # Initialize vector search client
        log_structured_entry("Creating GoogleCloudVectorSearch client", "INFO")
        vs = GoogleCloudVectorSearch(
-            project_id=cfg.project_id,
-            location=cfg.location,
-            bucket=cfg.bucket,
-            index_name=cfg.index_name,
+            project_id=config_for_init.project_id,
+            location=config_for_init.location,
+            bucket=config_for_init.bucket,
+            index_name=config_for_init.index_name,
        )

        # Configure endpoint
@@ -48,25 +50,28 @@ async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
            "Configuring index endpoint",
            "INFO",
            {
-                "endpoint_name": cfg.endpoint_name,
-                "endpoint_domain": cfg.endpoint_domain,
-            }
+                "endpoint_name": config_for_init.endpoint_name,
+                "endpoint_domain": config_for_init.endpoint_domain,
+            },
        )
        vs.configure_index_endpoint(
-            name=cfg.endpoint_name,
-            public_domain=cfg.endpoint_domain,
+            name=config_for_init.endpoint_name,
+            public_domain=config_for_init.endpoint_domain,
        )

        # Initialize GenAI client
        log_structured_entry(
            "Creating GenAI client",
            "INFO",
-            {"project_id": cfg.project_id, "location": cfg.location}
+            {
+                "project_id": config_for_init.project_id,
+                "location": config_for_init.location,
+            },
        )
        genai_client = genai.Client(
            vertexai=True,
-            project=cfg.project_id,
-            location=cfg.location,
+            project=config_for_init.project_id,
+            location=config_for_init.location,
        )

        # Validate credentials and configuration by testing actual resources
@@ -76,32 +81,41 @@ async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
        validation_errors = []

        # Run all validations
-        genai_error = await validate_genai_access(genai_client, cfg)
+        config = get_config()
+        genai_error = await validate_genai_access(genai_client, config)
        if genai_error:
            validation_errors.append(genai_error)

-        gcs_error = await validate_gcs_access(vs, cfg)
+        gcs_error = await validate_gcs_access(vs, config)
        if gcs_error:
            validation_errors.append(gcs_error)

-        vs_error = await validate_vector_search_access(vs, cfg)
+        vs_error = await validate_vector_search_access(vs, config)
        if vs_error:
            validation_errors.append(vs_error)

        # Summary of validations
        if validation_errors:
            log_structured_entry(
-                "MCP server started with validation errors - service may not work correctly",
+                (
+                    "MCP server started with validation errors - "
+                    "service may not work correctly"
+                ),
                "WARNING",
-                {"validation_errors": validation_errors, "error_count": len(validation_errors)}
+                {
+                    "validation_errors": validation_errors,
+                    "error_count": len(validation_errors),
+                },
            )
        else:
-            log_structured_entry("All validations passed - MCP server initialization complete", "INFO")
+            log_structured_entry(
+                "All validations passed - MCP server initialization complete", "INFO"
+            )

        yield AppContext(
            vector_search=vs,
            genai_client=genai_client,
-            settings=cfg,
+            settings=config,
        )

    except Exception as e:
@@ -111,7 +125,7 @@ async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
            {
                "error": str(e),
                "error_type": type(e).__name__,
-            }
+            },
        )
        raise
    finally:
@@ -121,9 +135,9 @@ async def lifespan(_server: FastMCP) -> AsyncIterator[AppContext]:
            try:
                await vs.close()
                log_structured_entry("Closed aiohttp sessions", "INFO")
-            except Exception as e:
+            except Exception as e:  # noqa: BLE001
                log_structured_entry(
                    "Error closing aiohttp sessions",
                    "WARNING",
-                    {"error": str(e), "error_type": type(e).__name__}
+                    {"error": str(e), "error_type": type(e).__name__},
                )
--- a/src/knowledge_search_mcp/services/init.py
+++ b/src/knowledge_search_mcp/services/init.py
@@ -1,13 +1,21 @@
 """Service modules for business logic."""

-from .search import filter_search_results, format_search_results, generate_query_embedding
-from .validation import validate_genai_access, validate_gcs_access, validate_vector_search_access
+from .search import (
+    filter_search_results,
+    format_search_results,
+    generate_query_embedding,
+)
+from .validation import (
+    validate_gcs_access,
+    validate_genai_access,
+    validate_vector_search_access,
+)

 __all__ = [
    "filter_search_results",
    "format_search_results",
    "generate_query_embedding",
-    "validate_genai_access",
    "validate_gcs_access",
+    "validate_genai_access",
    "validate_vector_search_access",
 ]
--- a/src/knowledge_search_mcp/services/search.py
+++ b/src/knowledge_search_mcp/services/search.py
@@ -1,11 +1,10 @@
-# ruff: noqa: INP001
 """Search helper functions."""

 from google import genai
 from google.genai import types as genai_types

-from ..logging import log_structured_entry
-from ..models import SearchResult
+from knowledge_search_mcp.logging import log_structured_entry
+from knowledge_search_mcp.models import SearchResult


 async def generate_query_embedding(
@@ -17,6 +16,7 @@ async def generate_query_embedding(

    Returns:
        Tuple of (embedding vector, error message). Error message is None on success.
+
    """
    if not query or not query.strip():
        return ([], "Error: Query cannot be empty")
@@ -30,9 +30,11 @@ async def generate_query_embedding(
                task_type="RETRIEVAL_QUERY",
            ),
        )
+        if not response.embeddings or not response.embeddings[0].values:
+            return ([], "Error: Failed to generate embedding - empty response")
        embedding = response.embeddings[0].values
-        return (embedding, None)
-    except Exception as e:
+        return (embedding, None)  # noqa: TRY300
+    except Exception as e:  # noqa: BLE001
        error_type = type(e).__name__
        error_msg = str(e)

@@ -41,24 +43,15 @@ async def generate_query_embedding(
            log_structured_entry(
                "Rate limit exceeded while generating embedding",
                "WARNING",
-                {
-                    "error": error_msg,
-                    "error_type": error_type,
-                    "query": query[:100]
-                }
+                {"error": error_msg, "error_type": error_type, "query": query[:100]},
            )
            return ([], "Error: API rate limit exceeded. Please try again later.")
-        else:
-            log_structured_entry(
-                "Failed to generate query embedding",
-                "ERROR",
-                {
-                    "error": error_msg,
-                    "error_type": error_type,
-                    "query": query[:100]
-                }
-            )
-            return ([], f"Error generating embedding: {error_msg}")
+        log_structured_entry(
+            "Failed to generate query embedding",
+            "ERROR",
+            {"error": error_msg, "error_type": error_type, "query": query[:100]},
+        )
+        return ([], f"Error generating embedding: {error_msg}")


 def filter_search_results(
@@ -75,6 +68,7 @@ def filter_search_results(

    Returns:
        Filtered list of search results.
+
    """
    if not results:
        return []
@@ -82,14 +76,10 @@ def filter_search_results(
    max_sim = max(r["distance"] for r in results)
    cutoff = max_sim * top_percent

-    filtered = [
-        s
-        for s in results
-        if s["distance"] > cutoff and s["distance"] > min_similarity
+    return [
+        s for s in results if s["distance"] > cutoff and s["distance"] > min_similarity
    ]

-    return filtered
-

 def format_search_results(results: list[SearchResult]) -> str:
    """Format search results as XML-like documents.
@@ -99,6 +89,7 @@ def format_search_results(results: list[SearchResult]) -> str:

    Returns:
        Formatted string with document tags.
+
    """
    if not results:
        return "No relevant documents found for your query."
--- a/src/knowledge_search_mcp/services/validation.py
+++ b/src/knowledge_search_mcp/services/validation.py
@@ -1,20 +1,26 @@
-# ruff: noqa: INP001
 """Validation functions for Google Cloud services."""

 from gcloud.aio.auth import Token
 from google import genai
 from google.genai import types as genai_types

-from ..clients.vector_search import GoogleCloudVectorSearch
-from ..config import Settings
-from ..logging import log_structured_entry
+from knowledge_search_mcp.clients.vector_search import GoogleCloudVectorSearch
+from knowledge_search_mcp.config import Settings
+from knowledge_search_mcp.logging import log_structured_entry
+
+# HTTP status codes
+HTTP_FORBIDDEN = 403
+HTTP_NOT_FOUND = 404


-async def validate_genai_access(genai_client: genai.Client, cfg: Settings) -> str | None:
+async def validate_genai_access(
+    genai_client: genai.Client, cfg: Settings
+) -> str | None:
    """Validate GenAI embedding access.

    Returns:
        Error message if validation fails, None if successful.
+
    """
    log_structured_entry("Validating GenAI embedding access", "INFO")
    try:
@@ -30,20 +36,26 @@ async def validate_genai_access(genai_client: genai.Client, cfg: Settings) -> st
            log_structured_entry(
                "GenAI embedding validation successful",
                "INFO",
-                {"embedding_dimension": len(embedding_values) if embedding_values else 0}
+                {
+                    "embedding_dimension": len(embedding_values)
+                    if embedding_values
+                    else 0
+                },
            )
            return None
-        else:
-            msg = "Embedding validation returned empty response"
-            log_structured_entry(msg, "WARNING")
-            return msg
-    except Exception as e:
+        msg = "Embedding validation returned empty response"
+        log_structured_entry(msg, "WARNING")
+        return msg  # noqa: TRY300
+    except Exception as e:  # noqa: BLE001
        log_structured_entry(
-            "Failed to validate GenAI embedding access - service may not work correctly",
+            (
+                "Failed to validate GenAI embedding access - "
+                "service may not work correctly"
+            ),
            "WARNING",
-            {"error": str(e), "error_type": type(e).__name__}
+            {"error": str(e), "error_type": type(e).__name__},
        )
-        return f"GenAI: {str(e)}"
+        return f"GenAI: {e!s}"


 async def validate_gcs_access(vs: GoogleCloudVectorSearch, cfg: Settings) -> str | None:
@@ -51,14 +63,11 @@ async def validate_gcs_access(vs: GoogleCloudVectorSearch, cfg: Settings) -> str

    Returns:
        Error message if validation fails, None if successful.
+
    """
-    log_structured_entry(
-        "Validating GCS bucket access",
-        "INFO",
-        {"bucket": cfg.bucket}
-    )
+    log_structured_entry("Validating GCS bucket access", "INFO", {"bucket": cfg.bucket})
    try:
-        session = vs.storage._get_aio_session()
+        session = vs.storage._get_aio_session()  # noqa: SLF001
        token_obj = Token(
            session=session,
            scopes=["https://www.googleapis.com/auth/cloud-platform"],
@@ -70,102 +79,136 @@ async def validate_gcs_access(vs: GoogleCloudVectorSearch, cfg: Settings) -> str
            f"https://storage.googleapis.com/storage/v1/b/{cfg.bucket}/o?maxResults=1",
            headers=headers,
        ) as response:
-            if response.status == 403:
+            if response.status == HTTP_FORBIDDEN:
                msg = f"Access denied to bucket '{cfg.bucket}'. Check permissions."
                log_structured_entry(
-                    "GCS bucket validation failed - access denied - service may not work correctly",
+                    (
+                        "GCS bucket validation failed - access denied - "
+                        "service may not work correctly"
+                    ),
                    "WARNING",
-                    {"bucket": cfg.bucket, "status": response.status}
+                    {"bucket": cfg.bucket, "status": response.status},
                )
                return msg
-            elif response.status == 404:
+            if response.status == HTTP_NOT_FOUND:
                msg = f"Bucket '{cfg.bucket}' not found. Check bucket name and project."
                log_structured_entry(
-                    "GCS bucket validation failed - not found - service may not work correctly",
+                    (
+                        "GCS bucket validation failed - not found - "
+                        "service may not work correctly"
+                    ),
                    "WARNING",
-                    {"bucket": cfg.bucket, "status": response.status}
+                    {"bucket": cfg.bucket, "status": response.status},
                )
                return msg
-            elif not response.ok:
+            if not response.ok:
                body = await response.text()
                msg = f"Failed to access bucket '{cfg.bucket}': {response.status}"
                log_structured_entry(
                    "GCS bucket validation failed - service may not work correctly",
                    "WARNING",
-                    {"bucket": cfg.bucket, "status": response.status, "response": body}
+                    {"bucket": cfg.bucket, "status": response.status, "response": body},
                )
                return msg
-            else:
-                log_structured_entry(
-                    "GCS bucket validation successful",
-                    "INFO",
-                    {"bucket": cfg.bucket}
-                )
-                return None
-    except Exception as e:
+            log_structured_entry(
+                "GCS bucket validation successful", "INFO", {"bucket": cfg.bucket}
+            )
+            return None
+    except Exception as e:  # noqa: BLE001
        log_structured_entry(
            "Failed to validate GCS bucket access - service may not work correctly",
            "WARNING",
-            {"error": str(e), "error_type": type(e).__name__, "bucket": cfg.bucket}
+            {"error": str(e), "error_type": type(e).__name__, "bucket": cfg.bucket},
        )
-        return f"GCS: {str(e)}"
+        return f"GCS: {e!s}"


-async def validate_vector_search_access(vs: GoogleCloudVectorSearch, cfg: Settings) -> str | None:
+async def validate_vector_search_access(
+    vs: GoogleCloudVectorSearch, cfg: Settings
+) -> str | None:
    """Validate vector search endpoint access.

    Returns:
        Error message if validation fails, None if successful.
+
    """
    log_structured_entry(
        "Validating vector search endpoint access",
        "INFO",
-        {"endpoint_name": cfg.endpoint_name}
+        {"endpoint_name": cfg.endpoint_name},
    )
    try:
-        headers = await vs._async_get_auth_headers()
-        session = vs._get_aio_session()
+        headers = await vs._async_get_auth_headers()  # noqa: SLF001
+        session = vs._get_aio_session()  # noqa: SLF001
        endpoint_url = (
            f"https://{cfg.location}-aiplatform.googleapis.com/v1/{cfg.endpoint_name}"
        )

        async with session.get(endpoint_url, headers=headers) as response:
-            if response.status == 403:
-                msg = f"Access denied to endpoint '{cfg.endpoint_name}'. Check permissions."
+            if response.status == HTTP_FORBIDDEN:
+                msg = (
+                    f"Access denied to endpoint '{cfg.endpoint_name}'. "
+                    "Check permissions."
+                )
                log_structured_entry(
-                    "Vector search endpoint validation failed - access denied - service may not work correctly",
+                    (
+                        "Vector search endpoint validation failed - "
+                        "access denied - service may not work correctly"
+                    ),
                    "WARNING",
-                    {"endpoint": cfg.endpoint_name, "status": response.status}
+                    {"endpoint": cfg.endpoint_name, "status": response.status},
                )
                return msg
-            elif response.status == 404:
-                msg = f"Endpoint '{cfg.endpoint_name}' not found. Check endpoint name and project."
+            if response.status == HTTP_NOT_FOUND:
+                msg = (
+                    f"Endpoint '{cfg.endpoint_name}' not found. "
+                    "Check endpoint name and project."
+                )
                log_structured_entry(
-                    "Vector search endpoint validation failed - not found - service may not work correctly",
+                    (
+                        "Vector search endpoint validation failed - "
+                        "not found - service may not work correctly"
+                    ),
                    "WARNING",
-                    {"endpoint": cfg.endpoint_name, "status": response.status}
+                    {"endpoint": cfg.endpoint_name, "status": response.status},
                )
                return msg
-            elif not response.ok:
+            if not response.ok:
                body = await response.text()
-                msg = f"Failed to access endpoint '{cfg.endpoint_name}': {response.status}"
+                msg = (
+                    f"Failed to access endpoint '{cfg.endpoint_name}': "
+                    f"{response.status}"
+                )
                log_structured_entry(
-                    "Vector search endpoint validation failed - service may not work correctly",
+                    (
+                        "Vector search endpoint validation failed - "
+                        "service may not work correctly"
+                    ),
                    "WARNING",
-                    {"endpoint": cfg.endpoint_name, "status": response.status, "response": body}
+                    {
+                        "endpoint": cfg.endpoint_name,
+                        "status": response.status,
+                        "response": body,
+                    },
                )
                return msg
-            else:
-                log_structured_entry(
-                    "Vector search endpoint validation successful",
-                    "INFO",
-                    {"endpoint": cfg.endpoint_name}
-                )
-                return None
-    except Exception as e:
+            log_structured_entry(
+                "Vector search endpoint validation successful",
+                "INFO",
+                {"endpoint": cfg.endpoint_name},
+            )
+            return None
+    except Exception as e:  # noqa: BLE001
        log_structured_entry(
-            "Failed to validate vector search endpoint access - service may not work correctly",
+            (
+                "Failed to validate vector search endpoint access - "
+                "service may not work correctly"
+            ),
            "WARNING",
-            {"error": str(e), "error_type": type(e).__name__, "endpoint": cfg.endpoint_name}
+            {
+                "error": str(e),
+                "error_type": type(e).__name__,
+                "endpoint": cfg.endpoint_name,
+            },
        )
-        return f"Vector Search: {str(e)}"
+        return f"Vector Search: {e!s}"
--- a/src/knowledge_search_mcp/utils/cache.py
+++ b/src/knowledge_search_mcp/utils/cache.py
@@ -1,4 +1,3 @@
-# ruff: noqa: INP001
 """LRU cache implementation."""

 from collections import OrderedDict