Visión general
De qué trata este proyecto.
Recibirás (1) una reconstrucción SfM de la sala principal del museo (unos 800 metros cuadrados, 1.500 imágenes), (2) un conjunto de 300 fotos de consulta con poses ground-truth y (3) 200 fotos sin ground-truth para evaluación a ciegas. Implementarás una tubería de localización visual: extracción de features (SuperPoint o equivalente), matching contra la nube de descriptores 3D, y estimación de pose con PnP (Perspective-n-Point) + RANSAC. El éxito es error mediano de posición por debajo de 30 cm y error mediano de orientación por debajo de 3 grados en las consultas de evaluación, con tiempo de inferencia inferior a 1,5 segundos en un teléfono Android de gama media.
El Briefing
Lo que harás y lo que demostrarás.
Devolver la pose 6-DoF de una foto tomada por un visitante dentro de un museo, con precisión sub-métrica y latencia compatible con un teléfono de gama media.
Earning criteria — what you'll demonstrate
- Aplicar matching de features modernas (SuperPoint, R2D2 o equivalentes) a un caso real de interior
- Resolver PnP+RANSAC para estimar pose 6-DoF a partir de correspondencias 2D-3D
- Optimizar la tubería para inferencia en dispositivos móviles con presupuesto de cómputo
- Comunicar los límites técnicos del sistema a un equipo no técnico de museo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Visión por Computador
Construir un sistema de localización visual end-to-end y exponerlo en una experiencia móvil es exactamente el portfolio que pide cualquier equipo de AR/VR o robótica de interiores.
Este proyecto afina
- visual-localization
- feature-matching
- pose-estimation
AI Engineer
Llevar un pipeline de investigación a un producto móvil con presupuesto de latencia es trabajo típico de una persona AI Engineer en startups de hardware-software.
Este proyecto afina
- python
- model-optimization
- visual-localization
ML Researcher
Evaluar feature matchers y métodos de pose sobre un benchmark propio acerca al rol de investigación aplicada en grupos de visión 3D.
Este proyecto afina
- feature-matching
- pose-estimation
- multi-view-geometry
Applied AI Scientist
Equilibrar precisión, latencia y experiencia de usuario para un cliente institucional es el día a día de quien ejerce de Applied AI Scientist en consultorías de visión.
Este proyecto afina
- model-optimization
- multi-view-geometry
- visual-localization