Script Python: ingesta automática licitaciones públicas españolas ( PLACSP)+filtro+carga Airtable
Budget: $300.0
FIXED /
⭐ 0.00 (0)
Spain
python
Necesito un desarrollador/a Python para construir un script de ingesta automática de licitaciones públicas españolas, con filtrado por categoría y carga en Airtable. Es la primera fase de un proyecto más amplio — si el trabajo es bueno, hay continuidad con fases adicionales (scraping documental + IA).
**Qué debe hacer el script:**
1. Conectarse al feed público Atom/XML de la Plataforma de Contratación del Sector Público (PLACSP), que publica todas las licitaciones del Estado español en formato estructurado (CODICE).
2. Ejecutarse de forma programada (ej. semanal) y descargar únicamente las licitaciones nuevas o actualizadas desde la última ejecución.
3. Filtrar los registros por:
- Código CPV (te facilitaré la lista exacta, son 4 códigos de servicios de soporte IT).
- Palabras clave en el título (te facilitaré la lista, términos como "helpdesk", "puesto de trabajo digital", etc.).
4. Insertar o actualizar (upsert, sin duplicados) los registros filtrados en una base de Airtable que yo proporcionaré, con estos campos: título, órgano contratante, fecha de publicación, código CPV, enlace a la ficha, estado.
5. Manejar cambios de estado: si una licitación ya cargada es anulada, declarada desierta, o modificada, el script debe actualizar el registro existente (no crear uno duplicado).
**No incluye en esta fase:** scraping de PDFs, procesamiento con IA/LLM, ni cálculo de fechas de finalización. Eso es una fase posterior, para más adelante.
**Sobre el hosting:** el script se instalará y ejecutará en un servidor propio que yo voy a contratar (VPS Linux), no en GitHub Actions, Lambda ni ningún servicio serverless de terceros. Necesito que el freelancer:
- Configure el entorno en el servidor (dependencias, entorno virtual de Python, variables de entorno/credenciales).
- Configure el cron job del sistema (o systemd timer) para la ejecución programada semanal.
- Deje el proceso preparado para arrancar automáticamente si el servidor se reinicia.
- Entregue un procedimiento claro de acceso remoto (SSH) que yo pueda usar para supervisarlo, y documentación de cómo reinstalar/replicar el entorno desde cero si cambio de servidor.
Yo me encargo de contratar y proporcionar el acceso al VPS (proveedor a definir — Hetzner, DigitalOcean, IONOS u otro); el freelancer trabaja sobre ese servidor, no sobre su propia infraestructura ni sobre servicios cloud propios.
**Entregables:**
- Script funcional en Python, documentado, con README de instalación y configuración.
- Instalación y configuración completa en el VPS que yo proporcione, incluyendo cron/systemd timer.
- Manejo básico de errores (qué pasa si el feed no responde, si cambia su estructura, etc.), con log o notificación de fallo.
- Código entregado en repositorio Git de mi propiedad al finalizar.
- Documentación de despliegue: pasos para reinstalar el entorno en otro servidor si fuera necesario.
Habilidades requeridas
- Python (scripting, APIs REST, parsing XML/Atom)
- Airtable API
- Administración básica de servidores Linux (VPS): SSH, entornos virtuales, cron/systemd, gestión de procesos en segundo plano
- Valorable: experiencia previa con datos de contratación pública o portales gubernamentales (España o UE)
- Valorable: conocimiento de formato CODICE o feeds de licitación pública
Tipo de proyecto y presupuesto
- Precio fijo (no por horas).
- Alcance acotado y bien definido — indícame tu presupuesto y plazo estimado en la propuesta.
- Posibilidad real de continuidad en fases futuras (scraping + IA) para quien haga bien este primer encargo.
Auf Upwork öffnen