66 lines
2.5 KiB
Plaintext
66 lines
2.5 KiB
Plaintext
╔════════════════════════════════════════════════════════════════╗
|
|
║ ✅ PROYECTO PIPELINE COPIADO EXITOSAMENTE ║
|
|
╚════════════════════════════════════════════════════════════════╝
|
|
|
|
📁 UBICACIÓN: /home/coder/sigma-chat/pipeline
|
|
|
|
📊 ESTADÍSTICAS:
|
|
• Tamaño total: ~400KB
|
|
• Archivos Python: 33
|
|
• Packages: 7
|
|
• Apps: 1
|
|
• Archivos de documentación: 5
|
|
|
|
📦 PACKAGES INCLUIDOS:
|
|
✅ chunker - 3 estrategias de chunking
|
|
✅ embedder - Generación de embeddings (Vertex AI)
|
|
✅ file-storage - Almacenamiento en GCS
|
|
✅ vector-search - Índices vectoriales (Vertex AI)
|
|
✅ llm - Cliente para Gemini/Vertex AI
|
|
✅ document-converter - Conversión PDF → Markdown
|
|
✅ utils - Utilidades varias
|
|
|
|
🎯 APPS INCLUIDAS:
|
|
✅ index-gen - Pipeline completo KFP
|
|
|
|
📚 DOCUMENTACIÓN:
|
|
✅ 00_START_HERE.md - Punto de inicio rápido
|
|
✅ QUICKSTART.md - Guía rápida con ejemplos
|
|
✅ README.md - Documentación completa
|
|
✅ STRUCTURE.md - Estructura detallada
|
|
✅ config.example.yaml - Plantilla de configuración
|
|
|
|
⚙️ ARCHIVOS DE CONFIGURACIÓN:
|
|
✅ pyproject.toml - Dependencias y scripts CLI
|
|
✅ config.yaml - Configuración de GCP
|
|
✅ .python-version - Python 3.12
|
|
✅ .gitignore - Exclusiones de git
|
|
|
|
🚀 PRÓXIMOS PASOS:
|
|
|
|
1. Subir a GCP Workbench:
|
|
• Comprimir: tar -czf pipeline.tar.gz pipeline/
|
|
• Subir a Workbench
|
|
• Descomprimir: tar -xzf pipeline.tar.gz
|
|
|
|
2. Instalar dependencias:
|
|
cd ~/pipeline
|
|
uv sync
|
|
|
|
3. Configurar:
|
|
nano config.yaml
|
|
# Editar: project_id, location, bucket
|
|
|
|
4. Probar:
|
|
echo "Texto de prueba" > test.txt
|
|
recursive-chunker test.txt output/
|
|
|
|
📖 LEER PRIMERO:
|
|
cat 00_START_HERE.md
|
|
|
|
═══════════════════════════════════════════════════════════════
|
|
|
|
✨ TODO LISTO PARA USAR EN GCP WORKBENCH ✨
|
|
|
|
═══════════════════════════════════════════════════════════════
|