Retiming long scene matches by action phase

2026-05-02 20:47:59 +02:00
parent 252f710396
commit 8415516f89
3 changed files with 158 additions and 11 deletions
@@ -181,6 +181,10 @@ Aktionsphase verfehlt, sucht der Matcher automatisch dichter innerhalb derselben
 Source-Szene nach lokalen Vision-Fenstern mit der passenden Aktion und richtet
 den Inpoint mit der Motion-Phase-Prüfung darauf neu aus. Erst wenn auch diese
 In-Scene-Reparatur scheitert, wird der Treffer verworfen.
+Diese In-Scene-Reparatur läuft auch für semantisch gültige Treffer aus langen
+Source-Szenen. Dadurch kann ein grob passender Dialogmoment nicht bestehen
+bleiben, wenn ein anderes lokales Fenster derselben Szene die gesuchte
+Aktionsphase und Bewegung klarer trifft.
 Der gewichtete Vision-Seed-Pfad ersetzt standardmäßig keinen normalen
 FFmpeg-Vollscan. Vision-Beschreibungen sind semantische Hinweise, aber keine
 Beweise; der volle CV-Scan bleibt deshalb aktiv, damit falsch bewertete
@@ -200,6 +204,11 @@ Nach einem dichten Vision-Treffer darf der spätere lokale Aligner nur noch im
 Bereich dieses Scan-Schritts nachjustieren. So kann ein korrekt gefundener
 Bewegungsmoment nicht wieder um viele Frames in eine ähnlich aussehende Phase
 derselben Szene verschoben werden.
+Für Vision-Action-Fenster nutzt die finale Retiming-Prüfung eine gemeinsame
+Content-und-Motion-Suche pro Frame. Content und Bewegungsphase werden dabei
+nicht mehr als zwei getrennte Korrekturschritte angewendet; das verhindert,
+dass eine kurze Geste erst korrekt erkannt und anschließend in eine spätere
+ähnliche Körperhaltung verschoben wird.
 Wenn mehrere Vision-Kandidaten in derselben Source-Szene ähnlich gut scoren
 und die Beat-Dauer abdecken, bevorzugt der Matcher die frühere Phase. Das
 verhindert, dass ein späterer, minimal stärkerer Standbildtreffer die