Spaces:

langtech-innovation
/

WhisperLiveKitDiarization

Paused

App Files Files Community

qfuxa commited on May 28

Commit

0c9255f

1 Parent(s): 78d7306

Message when launching transcription and no audio is detected

Browse files

Files changed (2) hide show

whisperlivekit/audio_processor.py +18 -11
whisperlivekit/web/live_transcription.html +10 -3

whisperlivekit/audio_processor.py CHANGED Viewed

@@ -453,31 +453,38 @@ class AudioProcessor:
                     await self.update_diarization(end_attributed_speaker, combined)
                     buffer_diarization = combined
-                # Create response object
-                if not lines:
-                    lines = [{
                         "speaker": 1,
                         "text": "",
-                        "beg": format_time(0),
-                        "end": format_time(tokens[-1].end if tokens else 0),
                         "diff": 0
                     }]
                 response = {
-                    "lines": lines,
                     "buffer_transcription": buffer_transcription,
                     "buffer_diarization": buffer_diarization,
                     "remaining_time_transcription": state["remaining_time_transcription"],
                     "remaining_time_diarization": state["remaining_time_diarization"]
                 }
-                # Only yield if content has changed
-                response_content = ' '.join([f"{line['speaker']} {line['text']}" for line in lines]) + \
-                                  f" | {buffer_transcription} | {buffer_diarization}"
-                if response_content != self.last_response_content and (lines or buffer_transcription or buffer_diarization):
                     yield response
-                    self.last_response_content = response_content
                 # Check for termination condition
                 if self.is_stopping:

                     await self.update_diarization(end_attributed_speaker, combined)
                     buffer_diarization = combined
+                response_status = "active_transcription"
+                final_lines_for_response = lines.copy()
+                if not tokens and not buffer_transcription and not buffer_diarization:
+                    response_status = "no_audio_detected"
+                    final_lines_for_response = []
+                elif response_status == "active_transcription" and not final_lines_for_response:
+                    final_lines_for_response = [{
                         "speaker": 1,
                         "text": "",
+                        "beg": format_time(state.get("end_buffer", 0)),
+                        "end": format_time(state.get("end_buffer", 0)),
                         "diff": 0
                     }]
                 response = {
+                    "status": response_status,
+                    "lines": final_lines_for_response,
                     "buffer_transcription": buffer_transcription,
                     "buffer_diarization": buffer_diarization,
                     "remaining_time_transcription": state["remaining_time_transcription"],
                     "remaining_time_diarization": state["remaining_time_diarization"]
                 }
+                current_response_signature = f"{response_status} | " + \
+                                           ' '.join([f"{line['speaker']} {line['text']}" for line in final_lines_for_response]) + \
+                                           f" | {buffer_transcription} | {buffer_diarization}"
+                if current_response_signature != self.last_response_content and \
+                   (final_lines_for_response or buffer_transcription or buffer_diarization or response_status == "no_audio_detected"):
                     yield response
+                    self.last_response_content = current_response_signature
                 # Check for termination condition
                 if self.is_stopping:

whisperlivekit/web/live_transcription.html CHANGED Viewed

@@ -427,7 +427,8 @@
                         buffer_transcription = "",
                         buffer_diarization = "",
                         remaining_time_transcription = 0,
-                        remaining_time_diarization = 0
                     } = data;
                     renderLinesWithBuffer(
@@ -436,13 +437,19 @@
                         buffer_transcription,
                         remaining_time_diarization,
                         remaining_time_transcription,
-                        false // isFinalizing = false for normal updates
                     );
                 };
             });
         }
-        function renderLinesWithBuffer(lines, buffer_diarization, buffer_transcription, remaining_time_diarization, remaining_time_transcription, isFinalizing = false) {
             const linesHtml = lines.map((item, idx) => {
                 let timeInfo = "";
                 if (item.beg !== undefined && item.end !== undefined) {

                         buffer_transcription = "",
                         buffer_diarization = "",
                         remaining_time_transcription = 0,
+                        remaining_time_diarization = 0,
+                        status = "active_transcription"
                     } = data;
                     renderLinesWithBuffer(
                         buffer_transcription,
                         remaining_time_diarization,
                         remaining_time_transcription,
+                        false,
+                        status
                     );
                 };
             });
         }
+        function renderLinesWithBuffer(lines, buffer_diarization, buffer_transcription, remaining_time_diarization, remaining_time_transcription, isFinalizing = false, current_status = "active_transcription") {
+            if (current_status === "no_audio_detected") {
+                linesTranscriptDiv.innerHTML = "<p style='text-align: center; color: #666; margin-top: 20px;'><em>No audio detected...</em></p>";
+                return;
+            }
             const linesHtml = lines.map((item, idx) => {
                 let timeInfo = "";
                 if (item.beg !== undefined && item.end !== undefined) {