← Zákazky

Script Python: ingesta automática licitaciones públicas españolas ( PLACSP)+filtro+carga Airtable

Rozpočet: $300.0 FIXED / ⭐ 0.00 (0) Spain

python

Necesito un desarrollador/a Python para construir un script de ingesta automática de licitaciones públicas españolas, con filtrado por categoría y carga en Airtable. Es la primera fase de un proyecto más amplio — si el trabajo es bueno, hay continuidad con fases adicionales (scraping documental + IA). **Qué debe hacer el script:** 1. Conectarse al feed público Atom/XML de la Plataforma de Contratación del Sector Público (PLACSP), que publica todas las licitaciones del Estado español en formato estructurado (CODICE). 2. Ejecutarse de forma programada (ej. semanal) y descargar únicamente las licitaciones nuevas o actualizadas desde la última ejecución. 3. Filtrar los registros por: - Código CPV (te facilitaré la lista exacta, son 4 códigos de servicios de soporte IT). - Palabras clave en el título (te facilitaré la lista, términos como "helpdesk", "puesto de trabajo digital", etc.). 4. Insertar o actualizar (upsert, sin duplicados) los registros filtrados en una base de Airtable que yo proporcionaré, con estos campos: título, órgano contratante, fecha de publicación, código CPV, enlace a la ficha, estado. 5. Manejar cambios de estado: si una licitación ya cargada es anulada, declarada desierta, o modificada, el script debe actualizar el registro existente (no crear uno duplicado). **No incluye en esta fase:** scraping de PDFs, procesamiento con IA/LLM, ni cálculo de fechas de finalización. Eso es una fase posterior, para más adelante. **Sobre el hosting:** el script se instalará y ejecutará en un servidor propio que yo voy a contratar (VPS Linux), no en GitHub Actions, Lambda ni ningún servicio serverless de terceros. Necesito que el freelancer: - Configure el entorno en el servidor (dependencias, entorno virtual de Python, variables de entorno/credenciales). - Configure el cron job del sistema (o systemd timer) para la ejecución programada semanal. - Deje el proceso preparado para arrancar automáticamente si el servidor se reinicia. - Entregue un procedimiento claro de acceso remoto (SSH) que yo pueda usar para supervisarlo, y documentación de cómo reinstalar/replicar el entorno desde cero si cambio de servidor. Yo me encargo de contratar y proporcionar el acceso al VPS (proveedor a definir — Hetzner, DigitalOcean, IONOS u otro); el freelancer trabaja sobre ese servidor, no sobre su propia infraestructura ni sobre servicios cloud propios. **Entregables:** - Script funcional en Python, documentado, con README de instalación y configuración. - Instalación y configuración completa en el VPS que yo proporcione, incluyendo cron/systemd timer. - Manejo básico de errores (qué pasa si el feed no responde, si cambia su estructura, etc.), con log o notificación de fallo. - Código entregado en repositorio Git de mi propiedad al finalizar. - Documentación de despliegue: pasos para reinstalar el entorno en otro servidor si fuera necesario. Habilidades requeridas - Python (scripting, APIs REST, parsing XML/Atom) - Airtable API - Administración básica de servidores Linux (VPS): SSH, entornos virtuales, cron/systemd, gestión de procesos en segundo plano - Valorable: experiencia previa con datos de contratación pública o portales gubernamentales (España o UE) - Valorable: conocimiento de formato CODICE o feeds de licitación pública Tipo de proyecto y presupuesto - Precio fijo (no por horas). - Alcance acotado y bien definido — indícame tu presupuesto y plazo estimado en la propuesta. - Posibilidad real de continuidad en fases futuras (scraping + IA) para quien haga bien este primer encargo.
Otvoriť na Upwork