Pablo González
Software Engineer | AI & Data Automation Engineer
Soy un desarrollador apasionado por el software, la automatización, el scraping y el mundo de los datos. Cuando algo se vuelve repetitivo, busco la forma de automatizarlo para crear soluciones innovadoras y escalables.
Sobre Mí
Soy Pablo, un apasionado de la tecnología desde que tengo memoria. Desde pequeño, me fascinó explorar y descubrir las infinitas posibilidades que ofrecía un ordenador, lo que me impulsó a especializarme en programación y a desarrollar una fuerte inclinación por la automatización de procesos, buscando siempre evitar repeticiones innecesarias.
Esta pasión me llevó a sumergirme en proyectos innovadores, y actualmente formo parte de un equipo dedicado a la Investigación, Desarrollo e Innovación (I+D+I) con Inteligencia Artificial, donde diseño sistemas multi-agente sobre modelos de lenguaje. Aquí tengo la oportunidad de trabajar en proyectos desafiantes y disruptivos que marcan la diferencia.
Además, he decidido ampliar mi formación en Ciencia de Datos en la Universitat Oberta de Catalunya, combinando mi experiencia profesional con una sólida base académica. Mi enfoque se centra en desarrollar soluciones eficientes y escalables, utilizando metodologías ágiles y adaptándome rápidamente a las nuevas tendencias tecnológicas para impulsar proyectos exitosos.
Experiencia
4+ años en desarrollo de software, web scraping y automatización de datos
Especialización en Python, Java, Groovy, Php y Javascript, desarrollo de APIs y sistemas multi-agente con IA
Educación
Grado en Ciencia de Datos Aplicada (en curso) - UOC
CFGS Desarrollo de Aplicaciones Web - IES Ingeniero De la Cierva
Certificaciones
ETL and ELT in Python
Experiencia Profesional
Data Automation Engineer (I+D+I AI)
- Diseño de un orquestador multi-agente sobre Claude que clasifica la intención del usuario y delega en agentes especializados (análisis, generación de código, validación y optimización)
- Arquitectura para la ejecución concurrente del sistema multi-agente: varias sesiones operando sobre el mismo repositorio sin conflictos mediante git-plumbing
- Workflow de publicación con human-gate explícito antes de cualquier escritura externa, e integración con sistemas de ticketing y control de versiones vía protocolos de herramientas para LLMs
- Generación de una base de conocimiento con IA (convenciones, patrones verificados, casos de uso) consultada por los agentes antes de actuar
- Detección de errores en tiempo real y autoreparación mediante flujos auto-generados, con un orquestador en PHP para la gestión de incidencias de scraping sin intervención manual
- Procesos en Python con BeautifulSoup/lxml, AWS S3, Celery y RabbitMQ para una orquestación escalable, con dockerización y despliegue en Amazon EC2
Java & Groovy Developer
- Miembro del equipo "Factory", responsable de la extracción de datos de sitios de e-commerce y marketplaces
- Creación y mantenimiento de scripts de web scraping con Selenium, Playwright y otras herramientas para automatizar la extracción de datos
- Investigación y desarrollo de técnicas avanzadas de scraping: resolución automática de captchas, rotación de proxies y user-agents, fingerprinting y técnicas de invisibilidad para evitar bloqueos
- Implementación de procesos ETL y pipelines de datos para la transformación, limpieza y almacenamiento eficiente, garantizando la calidad e integridad de la información
- Monitorización y análisis de logs con Kibana y Grafana para la detección temprana de fallos y la optimización de la estabilidad del sistema
- Metodología Scrum con JIRA, Maven, Git y CI/CD con Jenkins
Estudiante en prácticas
- Primeros pasos en el desarrollo de software y en técnicas de web scraping
- Participación en proyectos reales del equipo de desarrollo
- Colaboración en equipos ágiles con metodología Scrum
Proyectos
Análisis de Accidentes de Tráfico
Aplicación web que analiza datos de accidentes de tráfico en Estados Unidos, identificando patrones comunes, factores temporales y condiciones que contribuyen a los accidentes. Implementado con Python, Flask, Pandas y visualizaciones interactivas.
Ver AplicacióniCloud Backup Tool
Script para realizar copias de seguridad automáticas de fotos y videos desde iCloud a almacenamiento local. Notificaciones opcionales por Telegram y eliminación de videos de iCloud.
Ver RepositorioETL Data Processing
Implementación de dos pipelines ETL para procesar datos de ventas e inventario utilizando Apache Airflow, PostgreSQL, Elasticsearch y Kibana. Containerizado con Docker y orquestado con Docker Compose.
Ver RepositorioRealtime Data Streaming
Flujo de trabajo automatizado de ingeniería de datos que recopila, procesa y almacena datos de usuarios generados aleatoriamente. Utiliza Apache Airflow, Apache Kafka, Apache Spark y Cassandra.
Ver RepositorioIVA Rate Notifier
Script en Python para monitorear cambios en las tasas de IVA y notificarlos por correo electrónico. Ideal para empresas y contadores que necesitan mantenerse actualizados con las variaciones fiscales internacionales.
Ver RepositorioFullpage Screenshot
Script en Python que utiliza Playwright para automatizar navegadores, capturando imágenes de elementos específicos en páginas web y gestionando cookies personalizadas.
Ver RepositorioCertificaciones y Licencias
Certificación DataCamp
Certificación completada en DataCamp, demostrando habilidades avanzadas en análisis y procesamiento de datos.
Ver Certificación