mexi um pouco mais no meu app de live translation. ja que deu pra validar o que eu queria fazer, resolvi mover pra uma arquitetura mais robusta principalmente pro processamento final do preview
resolvi separar em algumas camadas:
BroadcastEngine - pra capturar os frames e conexao IPC
VideoProcessor - recebe os frames e traduz em pipeline de processamento e transformaçao
Preview - PiP manager e layer pra exibir os frames processados
entao basicamente eu posso ter uma linha de processamento bem legal tipo
videoProcessing.addProcessors([
SafeAreaCropProcessor(),
TextDetectionProcessor(),
TranslationProcessor()
RenderingProcessor()
])
e exibir o resultado no PiP