Plataforma · AI Funnel

Declare su IA. Nosotros la desplegamos.

IA edge como un fichero de configuración. AI Funnel convierte un grafo TOML en un modelo cuantizado, validado y listo para OTA que se ejecuta en la clase de dispositivo que envía — sin un equipo de IA edge.

IA · capa de inteligencia

De un vistazo

Tres nodos entran. Inferencia cuantizada sale.

Las entradas fluyen al funnel; el rombo es donde ocurren reentrenar, cuantizar y validar antes de que el modelo cruce al dispositivo.

Funnel de tres nodos abstractos de datos fluyendo de izquierda a derecha hacia un bloque de inferencia con forma de rombo, ámbar sobre el rombo

Tres columnas · Un bucle

Cliente · Nube · Dispositivo.

01

El cliente aporta

  • · Un grafo TOML que declara entradas, modelos y postprocesado.
  • · Artefactos de modelo ONNX o TFLite.
  • · Un dataset en formato COCO con las etiquetas que le interesan.
  • · Un contenedor opcional de lógica de negocio para acciones aguas abajo.

02

La nube de Munic hace

  • · Reentrenar sobre el corpus combinado (su dataset + priors de Munic).
  • · Cuantizar a int8/int4 por clase de silicio — INT8 NPU, INT4 móvil, FP16 GPU.
  • · Validar en una rebanada de holdout con presupuestos de precisión/recall por clase.
  • · Hacer benchmarks de latencia wall-clock y vatios en cada nivel de hardware soportado.
  • · Empaquetar, firmar y desplegar el artefacto por OTA a través del pipeline de despliegue de flota.

03

Runtime en el dispositivo

  • · Flow Router orquesta el grafo a través de NPU, GPU y CPU.
  • · Plano de frames compartido zero-copy con el servicio Camera Capture y la etapa ROI shader de AI Funnel.
  • · Presupuesto de recursos por modelo aplicado — sin escapadas térmicas, sin picos de CPU sorpresa.
  • · La telemetría de vuelta a la nube cierra el bucle de reentrenamiento.

Experiencia de desarrollador

Tres artefactos. Un commit.

La superficie de cara al cliente es un fichero TOML, una carpeta de dataset y unos pocos ficheros de modelo. Todo lo demás es generado y verificado por el funnel.

# ai-funnel.toml
name = "fleet-incident-triage"
version = 1

[input.camera]
source = "mos-camera-capture"
format = "yuv420p"

[stage.detect]
model = "models/yolo-v8n.int8.onnx"
labels = ["vehicle", "pedestrian", "cyclist"]

[stage.classify]
inputs = ["detect.crops"]
model = "models/incident-classifier-v3.int8.onnx"

[output.event]
sink = "mos-event-processor"
when = "classify.confidence > 0.7"

Un cliente real entrega ~30 líneas de TOML, un bundle de modelo y un directorio de dataset. El funnel gestiona cada detalle entre silicios.

Automatización en la nube

Reentrenar · cuantizar · validar · benchmark · OTA.

  1. Reentrenar. Su dataset se combina con los priors de Munic y se commitea una etiqueta de generación.
  2. Cuantizar. Variantes int8 / int4 / fp16 por clase de silicio soportada — sin exportación manual.
  3. Validar. Rebanada de holdout + presupuestos de precisión/recall por clase. Una regresión bloquea el despliegue.
  4. Benchmark. Latencia wall-clock y vatios capturados en cada nivel de hardware soportado — publicados en el informe de despliegue.
  5. OTA. Cohortes, canarios, rollback automático. La misma fontanería de flota que cualquier otro servicio MOS4.

Runtime en dispositivo

Flow Router orquesta NPU · GPU · CPU.

Los modelos se ejecutan zero-copy desde el plano de frames de la cámara con memoria compartida, con presupuestos de recursos por modelo. Sin escapadas térmicas, sin CPU descontrolada.

Hardware soportado

Un funnel, cada nivel.

AI Funnel cuantiza y hace benchmarks para cada clase de silicio en la familia de hardware MOS4 — desde SoCs modem-class hasta cajas AI-class. El catálogo de artefactos sigue precisión, latencia y vatios por nivel para que los equipos de producto puedan ajustar el silicio al requisito.

Punto de prueba anónimo

OEM de dashcam · triaje ADAS + DMS.

Un OEM líder de dashcams entrega a toda su flota un modelo unificado de triaje construido con AI Funnel. Detección, clasificación y anonimización GDPR en directo se ejecutan a partir de un único grafo TOML, en una clase de dispositivo, con bucles de reentrenamiento semanales.

Referencia bajo NDA · solicite una llamada de referencia mediada por ventas

FAQ

Preguntas frecuentes

  • ¿Qué entrega el cliente a AI Funnel?

    Un grafo TOML que declara entradas, modelos y postprocesado; artefactos de modelo ONNX o TFLite; y un dataset en formato COCO. Un contenedor opcional de lógica de negocio gestiona las acciones aguas abajo.

  • ¿Qué hace la nube de Munic con esa entrada?

    Reentrenar sobre el corpus combinado, cuantizar por clase de silicio (INT8 NPU, INT4 móvil, FP16 GPU), validar en una rebanada de holdout con presupuestos de precisión/recall, hacer benchmarks de latencia y vatios, después firmar y desplegar por OTA.

  • ¿Cómo se orquestan los modelos en el dispositivo?

    Flow Router coloca los modelos a través de NPU, GPU y CPU. El plano de frames se comparte zero-copy con el servicio Camera Capture y la etapa ROI shader de AI Funnel. Los presupuestos de recursos por modelo evitan escapadas térmicas.

  • ¿Qué clases de silicio soporta AI Funnel?

    Cada clase de silicio en la familia de hardware MOS4 — de modem-class a AI-class. El catálogo de artefactos sigue precisión, latencia y vatios por nivel para que los equipos puedan ajustar el silicio al requisito.

  • ¿Cuál es el tamaño de un artefacto típico de cara al cliente?

    Un cliente real entrega aproximadamente 30 líneas de TOML, un bundle de modelo y un directorio de dataset. El funnel gestiona cada detalle entre silicios.

  • ¿Hay un punto de prueba en producción?

    Sí — un OEM líder de dashcams entrega a toda su flota un modelo unificado de triaje construido con AI Funnel. Detección, clasificación y anonimización GDPR en directo se ejecutan a partir de un único grafo TOML con reentrenamiento semanal.

Traiga su TOML.

Muéstrenos el grafo y el dataset; ejecutaremos una pasada completa del funnel en un dispositivo objetivo de su elección.