Cada test corre el pipeline real contra una URL real. Mismo payload, 2-3 renderers, comparación side-by-side.