One of the greatest challenges we confront each day with the TV News Archive is the sheer diversity of languages and dialects it preserves across a quarter century of global television news coverage. Dedicated LSM models provide robust deterministic transcription, but can struggle with long-tail languages and dialects. In contrast, Gemini 2.5 has proven exceptionally adept at recognizing speech from across the world. With that increased recognition capacity, however, comes greater challenges in prompt optimization and transcription stability. Here we explore a 30-minute Pashto-language broadcast from Afghanistan that traditional LSM models struggle with and examine how Gemini 2.5 Flash performs.
In the end, we observe that Gemini 2.5 Flash can yield strong transcription performance even for languages that classical LSM models struggle with when asked to output a block transcript without time information. However, when requesting timecode information to allow transcripts to be synchronized with the underlying video, results can differ substantially between runs and it can require multiple runs to achieve a complete transcript. Transcription runs frequently fail with timecode errors, infinite loop failures and other errors. Requesting parallel transcription and translation output at the same time yields substantial reductions in translation quality, with the best results achieved by performing a dedicated translation pass after the initial transcription task.
Let's start by just asking Gemini 2.5 Flash to transcribe the audio. (No data was used for training or tuning any model). Gemini not only returns a transcript, but even performs speaker diarization without being asked!
"the speech is in Pashto. male voice 1: موږ ته مخکې داسې انګیرل کیده چې شمال د جنوب دښمن گرزولې و او جنوب یې د شمال دښمن گرزولې وو نه. نو زموږ سره په دې کې څه نه وو، څو جن ه به نه ورسره. نو اوس د امنیت په ځای برابریږو نو، نو موږ ولاړو له دا د څلورو ولایتونو سفر مو وکړی. زموږ اصلی اجندا دا وه چې مثلا افغانستان مشتګار کړې دی. دا یې نه وایي چې یا دا پښتون دی یا د کندهار دی، یا د جلالاباد دی، یا د خوست دی، نه. دا ټول داسې انځور چې دا حکومت چې دی، دا د تاجک، اوزب ک، هزاره، او پښتون دا ټول ته په یوه سترګه کتل کیږی. زموږ اصلی هدف دا وو. male voice 2: ډېره مننه استادی محترم، حاجی صاحب، تاسې راته ووېل چې د افغانستان کې مختلف قومونه اوسیږي. دا د افغانستان د مختلفو قومونو کور دی. د غ ه ناسته ولاړې چې تاسې نن وکړې، د قومونو سره کیناستې، د سپین ږیرو مشرانو سره کیناستې. مخکې ولې نه کیده؟ ولې د قومي مشران یو بل سره نه کیناستل؟ مجل سونه یې نه کول. د یو بل نه هیله لري، له واره لري. مشکل چیرته وو؟ male voice 3: خبره داسې ده جناب، دا مخکې دا خبره نه کیده، که ازموج گرو خبره ته و کړی. په افغانستان کې دا خو مخکې دا سیاکی دایم نه سوي. یعنې ازموج په خپلو ولایتونو کې د جلال آباد او د زابل خلکو سره دې یی وخت پوه سو که سهی جلال آباد او زابل ته بوتلو؟ آ هغه خلک داخل او اقتصادي هم ډېر کمزوري و و. دوه خبره دا ده، دا ټول سفرونه چې موږ کړی د وایله الحمد دا د امارت کار دی، دا د امنیټ کار دی. نو male voice 1: نو اوس د الله تعالی قایم کړې په ټول افغانستان کې امنیت قایم شو. نو زموږ دا فکر پیدا شو چې موږ شمال ته تللی شو. دا دا د راست راتلاوې له یو بل اغا دا ده په دې وارې چې موږ ولاړو له اغا مږ حاجی صاحب صمر کړې دی نور زموږ سره ستا دې نور د پلاره راغلي نه دی. خو د ډېر راته چې موږ هلته ولاړو دا په غاټ کې زه پخپله په دویم قدم کې بیا یې یوازې شمال ته تللای وم. صمر کړې راسره وو په کې اغا حاجی امین الله حاجی صاحب راسره وو دوه نور. زه چې بیا دویم ځلې شمال ته تللای وم د شمال خلکو مې پوښتنی کولې. هلته په شمال کې یو حاجۍ صاحب وو اغا د پاره موږ ولاړو. هلته مو څلور پنځه شپې و کړې . لکه دا درې ستر وې بیا موږ بغلان او دغه ته ولاړو. او کندوز ته دا ولایتو ته ولاړو. یقین دا خبره راو چې موږ کندوز ته ازموج مې رسیدلی موږ څلور کندو ز ته ازموج و رسېدلو په پینزو. دا خلک له ازموج سره ډېر زیات وو. موږ له خلکو ډېر خوشحالې، یعنې دا خلک خپل واییش دا و چې موږ زمونځ ولاړو دپاره راځی چې موږ راتلو هلته په سرایې کې اتیش ده کابله مه دی ډېر زونډ وو. هلته یو کسان وو ماتې ورته وایې له نو دا خو مېرې پروګرام دی زه بیا راځم. بیا ازموج راغلو دا اختر نزدیک شپه وه. بیا موږ ولاړو هلته مو شپې و کړې. دغه وارې حاجی صاحب ولاړو ازموج ته د ازموج څو کسان و اغلې ازموج مې راغلو. د افلام نه دوه ساعته و اغلې. اول وارې ازموج په اغا ورسره رانی کې پنځوس کسان یې ښه تلو. اوس ازموج په اغا کې څلوېښت کسان یې ښه تلي. شپږ شل خلک دا وارې ازموج د احترام سره چې نور خلک ازموج د پاره راځی اغا ورکو دا ازموج مې سړه خبره کې ازموج دا کار داسې و یو ولایت ته ولاړو بل ولایت ته ولاړو اغا موږ شپه وو کړه. د اغه خبرې دا رقم وو. موږ اول وارې نو ازموج په سفر کې دا اغاټه ازموج ووېل چې دا کور د اول اغه یې درته ووېل سر امنیت وو. په خا خو اغا دا کار نه سې کولې. male voice 2: بل خبره دا ده چې ازموج د دې خلکو سره وو، د خلکو د اغه ځای چې ازموج خلکو ته اطمینان لاګی چې ازموج سره کار دی. دغه وارې بیا زه تللې و م. درېم وارې بیا ازموج دا اغه ملګری اغا حاجی صاحب ته مې په تلیفوني په ثبت کې ازموج په گروپ کې سره وېلۍ وو حاجی صاحب ته اغا ولایتو خلکو وېلۍ وو. د ا راست ده خلاص شو اغا مخامخ ورځم. اغا خلک له ازموج ډېر سخت خوشحالې، ازموج دې له هر چا نه خوشحالې. په پښتنو عنا نه کې ازموج هلته ولاړو وو. پینځه ش په تیر وو. په ټول ولایتو کې ازموج ته چوپانۍ راکوله. دا وارې عنا دا ده. ازموج ولایتو ته سپارلو ازموج عنا ازموج بیا دا نوې عنا ده. په ټول عزت او په ټول شی چې ازموج راتاو کړی، ازموج سره دا خلکو ته ازموج ډېر شی یې لونګی ورکړی. ټول ته. یوه تن ازموج دې د پاره ازموج عزت کړی دی ازموج د پاره ازموج عزت کړی دی. اغه د جنت ورکړی. male voice 4: د افغانستان ملي تلویزیون درنو اوریدونکو د خپرونې په دې برخه کې لنډ دمه لرلو بیا تر راګرځو ازموج خپرونه ادامه لري. male voice 1: سینه بیرغ male voice 5: ته دې وارې male voice 1: ازموج ژوند ته تازه ارشي male voice 5: سینه بیرغ male voice 1: ته ازموج دا اغا بیرغ male voice 5: چی زیباست بهار آزادی
Repeating variants of our basic prompt yields similar results. Gemini appears quite adept at producing a diarized transcript. However, since we need to align our transcripts with the underlying video, we need to have high resolution time information in our transcript. Given that the SRT captioning format is one of the most widely used industry standards, let's start by just asking Gemini for an SRT transcript:
Transcribe this television broadcast into SRT format. ONLY output the transcript in SRT format, nothing else. ONLY transcribe what was said, do not hallucinate.
This yields a correctly formatted transcript, but unfortunately as you can see it jumps from 58 seconds to 1 hour 12 seconds in a single line. Repeated SRT requests yielded similar temporal inconsistencies, ranging from large gaps and resets to inverted start and end times to out-of-order timestamps.
9 00:00:46,924 --> 00:00:51,524 یعني زموږ چې د په خپلو ولایتونو کې د جلال اباد او د زابل خلکو نه سې سره لیده یې وخت به یې سې څوک سې جلال اباد او زابل ته پتلو. 10 00:00:51,774 --> 00:00:58,454 او خلک داخلي اقتصادي هم ډېر کمزوری و دومره خبره دا وه چې دا ټول سفرونه چې موږ کړی دي د الې الهمدا د امارات کار دی دا د امنیت کار دی. 11 01:00:12,174 --> 01:00:19,254 دغه امارات خدای تعالی قایم کړی په ټول افغانستان کې امنیت قایم شو نو زموږ دا فکر پیدا شو چې موږ شمال ته تلای شو. 12 01:00:19,894 --> 01:00:26,594 او د د د لاس راولونه بله غټه دا چې په دې ورسره موږ ولاړو او دا د حاجی صاحب زموږګری را سر اسیدلی و نور دا پر راغلي نه دی.
Let's instead ask for a TTXT transcript to see if changing the output format helps. Unfortunately, this time the timestamps reset repeatedly throughout the transcript:
[ 11m42s94ms - 11m46s444ms ] ش مثلاً د کر تي پ کانال داسې تقریبا پ جهانې س و. [ 11m46s444ms - 11m50s564ms ] او دومره سرمای پ هلته مصروف س د د افغانستان پ دې و ولایتو پ مصروف س. [ 11m51s724ms - 11m52s174ms ] لنډ. [ 11m52s174ms - 11m53s864ms ] خبره غوښتنه هم دا ده. [ 11m54s254ms - 1m0s364ms ] د بدخش ته د ه رات و د کنر پ او پ ک ت ک ب د غې سپر د تول قوم و سپینځی و سر پ خ پ منځ ک ک نی. [ 1m0s774ms - 1m1s434ms ] الحمدلله. [ 1m2s234ms - 1m3s24ms ] بیا الحمدلله. [ 1m3s664ms - 1m5s704ms ] داسې امن راغلی د. [ 1m6s44ms - 1m10s94ms ] س باور و ک د د امارت و انشاء الله د نبی ع و دغه ب ی د کږي. [ 1m10s94ms - 1m15s64ms ] چې و ا ز و تر ک چ تر ت ب ی و ش ز بې محرم ازی و منځ ب چ و مخ ک ب چ و درې شي.
In our Gemini work to date, we have found that it yields the best result when allowed to converge on its own preferred output format and structure, rather than having one imposed upon it. Let's just ask Gemini to come up with its own JSON-formatted transcript:
Transcribe this television broadcast into JSON format.
Yielding:
{
\"start\": 1.488,
\"end\": 17.518,
\"label\": \"د جنوب دښمن ګرځول و، چې شمال د جنوب دښمن ګرځول و. نو اوس موږ سره په دې کې څه دهغه نه و، سو فکر نه و راسره. نو اوس چې دې د امن په
فضا برابر شو نه، نو موږ وړو د دا څلور ولایتونو ته سفر مونږ کړی.\"
},
{
\"start\": 18.068,
\"end\": 35.808,
\"label\": \"زموږ اصلي اجنډا دا وه چې مثال افغانستان موږ یو ګډ کور دی، دای ندي چې وایې چې یا دا پشتون دی، یا د کندهار دی، یا د جلال اباد دی،
یا د خوست دی، نه دا ټول دهغه نظام چې دی د حکومت چې دی، دا د تاجک، اوزبک او هزاره او پشتون دا ټول په یو سترګه کتل کېږي. زموږ اصلي هدف دا و. دا. ډې
ره مننه حاجی صاحب قران دم.\"
},
{
\"start\": 36.198,
\"end\": 40.168,
\"label\": \"حاجی صاحب تاسو را تلل وویل چې په افغانستان کې مختلف قومونه ژوند کوي.\"
},
{
\"start\": 40.698,
\"end\": 42.668,
\"label\": \"دا افغانستان د مختلف قومونو کور دی.\"
},
{
\"start\": 43.188,
\"end\": 50.848,
\"label\": \"دغه ناسته ولاړه چې تاسو چې نن وکرې، د قومونو سره کیناستل د سپینګیرو مشرانو سره کیناستل مخکې ولې نه کیدل؟ ولې د قومي مشرانو یو او
بل سره ناستې مجلسونه نه کیدل؟\"
}
We need shorter chunks to improve captioning overlays, so after iterative refinement, we eventually settled on the prompt below:
Transcribe this television broadcast into JSON format, where every 2 seconds is transcribed with \"start\" and \"end\" times in fractional seconds since the start of the audio and \"txt\" with the transcribed text. ONLY output the transcript in JSON format with these fields, nothing else. ONLY transcribe and translate what was said, do not hallucinate.
Which yields output like this:
{
\"start\": 0.354,
\"end\": 2.354,
\"txt\": \"نو زموږ موږ سیند زوره چې وویل چې جنوب ته شمال دشمن گرزولی او شمال یا د جنوب دشمن\"
},
{
\"start\": 2.354,
\"end\": 4.354,
\"txt\": \"گرزولی وله نو زموږ سر په دې کې هیڅ نه وله سوچ فکر\"
},
{
\"start\": 4.354,
\"end\": 6.354,
\"txt\": \"نه وله سر نو اوس د امن پزاه برابر ونا نو موږ ولاړو\"
},
{
\"start\": 6.354,
\"end\": 8.354,
\"txt\": \"دا د څلور ولایتونو ته سفر اوکی زموږ اصلی اجندا دا وله\"
},
{
\"start\": 8.354,
\"end\": 10.354,
\"txt\": \"چې مثال افغانستان مشتی گټ کور دی دا نه وي چې وایې چې یا دا پشتون دی\"
},
{
\"start\": 10.354,
\"end\": 12.354,
\"txt\": \"یا د کندی دی یا د جلال اباد دی یا د قوستی دی نه دا ټول\"
},
{
\"start\": 12.354,
\"end\": 14.354,
\"txt\": \"دا نزام چې دی دا حکومت چې دی دا د تاجک اوزبک او هزاره\"
},
{
\"start\": 14.354,
\"end\": 16.354,
\"txt\": \"او پشتون دا ټول تپي وسټرگ کتل کيږي زموږ اصلی هدف دا وله\"
},
{
\"start\": 16.354,
\"end\": 17.514,
\"txt\": \"لیار مه نن سې وکړه دم\"
}
Running a second time, unfortunately this time Gemini enters a failure state (shortened here for brevity – the actual output continued up to Gemini's 65K token limit and failed with MAX_TOKENS:
{
\"start\": 0.528,
\"end\": 8.018,
\"txt\": \"زم زم سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر س
ر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر
سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر
سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر سر head سر head head سر سر سر سر سر سر سر سر سر سر سر سر سر سر
सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर
सर सर सर सर सर सर سر सर सर सर सर سر سر सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर سر سر सर सर सर सर सर सर सर सर
सर सर सर सर सर सर सर सर सर सर سر سر सर सर सर सर सर सर सर सर सर سر सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर سر सर स
र सर सर सर सर सर सर सर सर सर सर सर سر سر سر सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर
سر सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर سر सर सर सर सर سر سر سر सर सर सर सर सर सर सर सर सर सर سر سر سر سر
سر سر سرر सर سر سر سر سر सर सर سر سر سر سر सर सर सर सर سر سر سر सर سر سر سر सर सर सर सर सर सर سر سر سر سر سر سر سر سر سر سر सर سر سر سر سر سر سر سر स
र सर सर سر سر سر سر سر سر سر सर सर सर सर सर सर सर सर سر سر سر سر सर سر سر सर सर سر سر سر سر सर सर सर सर سر سر سر سر سر سر سر سر سر سر سر सर सर سر
سر سر सर सर सर सर सर सर सर سر سر سر सर سر सर सर सर सर सर سر سر सर सर سر سر سر سر سر सर सर सर सर سر سر سر सर سر सर सर सर سر سر सर सर सर सर सर सर
سر सर سر सर سر سر सर سر سر سر سر सर سر سر سر سر سر सर سر سر سر سر سر سر سر सर سر सर سر سر سر سر सर سر سر سر सर सर سر सर सर سر सर सर सर सर سر सर स
र سر सर سر سر سر सर سر سر सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर سر سر سر سر سر सर सर सर सर सर سر سر सर سر سر سر سر सर सर सर सर सर
سر سر سر سر سر سر سر سر सर سر سر سر सर सर सर सर सर سر سر سر سر سر سر सर سر سر سر سر سر سر سر سر سر سر سر سر سر سر सर सर सर سر سر سر سر سر سر सर
सर سر سر سر سر सर सर सर سر سر سر سر سر سر سر سر سر سر سر सर सर सर سر سر सर सर سر سر سر سر सर سر سر سر سر سر सर سر سر سر سر सर सर सर सर सर سر سر س
ر सर سر सर सर सर सर سر سر सर सर सर सर सर सर सर سر सर सर سر سر सर سر سر سر سر سر سر سر سر سر सर سر سر سر सर सर सर सर सर सर سر सर सर सर सर सर सर सर
सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर सर سر سر سر سر सर सर سر सर सर سر سر سر سر سر سر سر سر سر سر सर सर سر سر سر सर سر سر سر سر سر سر
सर سر سر سر سر سر सर सर सर सर सर سر سر سر سر सर سر सर सर सर सर सर سر سر سر سر سر سر सर सर सर सर سر سر सर सर सर सर سر سر سر سر سر सर सर सर सर सर स
र सर सर सर सर सर سر सर सर सर सर सर سر सर सर سر سر सर सर सर सर सर सर سر سر سر सर सर सर सर सर सर सर सर سر سر سر सर سر सर سر सर सर सर सर सर سر سر سر
Running a third time we can see the results change slightly, but we get reasonable results again:
{
\"start\": 0.443,
\"end\": 2.213,
\"txt\": \"کې شم شمور چې وو چې جنوب یې د شمال دشمن ګرځولی\"
},
{
\"start\": 2.213,
\"end\": 3.423,
\"txt\": \"او شمال یې د جنوب دشمن ګرځولی\"
},
{
\"start\": 3.793,
\"end\": 5.953,
\"txt\": \"ولې نو موږ سره پدې کې څه دغه نه وو سو\"
},
{
\"start\": 5.953,
\"end\": 6.823,
\"txt\": \"ې فکر نه وله سره\"
},
{
\"start\": 7.373,
\"end\": 9.943,
\"txt\": \"نو اوس چې د امن پزه برابر اسون\"
},
{
\"start\": 10.153,
\"end\": 14.853,
\"txt\": \"نو موږ اول راولو دې د څلور ولایتونو سفر وموکې\"
},
{
\"start\": 15.393,
\"end\": 20.253,
\"txt\": \"زموږ اصلي اجندا دا وله چې مثال افغانستان مشټی غټ کور دی\"
}
Running again yields reasonable results at the start, but it eventually devolves and returns another MAX_TOKENS error:
{
\"start\": 0.354,
\"end\": 2.354,
\"txt\": \"نو زموږ موږ سیند زوره چې وویل چې جنوب ته شمال دشمن گرزولی او شمال یا د جنوب دشمن\"
},
{
\"start\": 2.354,
\"end\": 4.354,
\"txt\": \"گرزولی وله نو زموږ سر په دې کې هیڅ نه وله سوچ فکر\"
},
{
\"start\": 4.354,
\"end\": 6.354,
\"txt\": \"نه وله سر نو اوس د امن پزاه برابر ونا نو موږ ولاړو\"
},
{
\"start\": 6.354,
\"end\": 8.354,
\"txt\": \"دا د څلور ولایتونو ته سفر اوکی زموږ اصلی اجندا دا وله\"
},
{
\"start\": 8.354,
\"end\": 10.354,
\"txt\": \"چې مثال افغانستان مشتی گټ کور دی دا نه وي چې وایې چې یا دا پشتون دی\"
},
{
\"start\": 10.354,
\"end\": 12.354,
\"txt\": \"یا د کندی دی یا د جلال اباد دی یا د قوستی دی نه دا ټول\"
},
{
\"start\": 12.354,
\"end\": 14.354,
\"txt\": \"دا نزام چې دی دا حکومت چې دی دا د تاجک اوزبک او هزاره\"
}
Given that enabling Gemini 2.5 Flash's thinking mode has yielded dramatic improvements in the past, let's try enabling thinking. Note how this time we get our requested precise 2 second boundaries. However, it is suspicious that they land precisely every 2 seconds, since this means that timestamps are no longer precise:
{
\"start\": 0.0,
\"end\": 2.0,
\"txt\": \" زموژ پږنې شوری چی ووایی، چی جنوب د شمال دشمن ګرزولی او شمال د جنوب دشمن ګرزولی وو نه\"
},
{
\"start\": 2.0,
\"end\": 4.0,
\"txt\": \" او زموژ سره پدی کی هیڅ دغه نه وو، سوچ پیکر نه ووا سره\"
},
{
\"start\": 4.0,
\"end\": 6.0,
\"txt\": \" نو اوس چی دی د امن په فضا برابره شو نا، نو زموژ\"
},
{
\"start\": 6.0,
\"end\": 8.0,
\"txt\": \" ېې وړاند ولول دا د دغه څلورو ولایاتو سفر مو وکۍ\"
},
{
\"start\": 8.0,
\"end\": 10.0,
\"txt\": \" زموژ اصلی اګنډه دغه وو چی مثال افغانستان مشتی ګټ کور دی\"
},
{
\"start\": 10.0,
\"end\": 12.0,
\"txt\": \" دا ېې نۍ چی ووایی چی دا د پشتون دی، یا د قنداری دی، یا د جلال اباچی دی، یا د قوسیه دی\"
},
{
\"start\": 12.0,
\"end\": 14.0,
\"txt\": \" نه دا ټول دا نظام چی دی، دا حکومت چی دی\"
}
Running again this time yields correct fractional seconds:
{
\"start\": 0.38,
\"end\": 3.76,
\"txt\": \"شمش د جنوب دښمن گرځولی ونه\"
},
{
\"start\": 4.18,
\"end\": 6.84,
\"txt\": \"نور و شمیمار د جنوب دښمن گرځولی ونه\"
},
{
\"start\": 7.42,
\"end\": 9.38,
\"txt\": \"نو زموږ سر په دئ کي دغه نو ونو\"
},
{
\"start\": 9.38,
\"end\": 11.08,
\"txt\": \"سو چ فکر نو ولس\"
},
{
\"start\": 11.08,
\"end\": 13.56,
\"txt\": \"نو وشي د امن فضا برابر\"
},
{
\"start\": 13.56,
\"end\": 14.88,
\"txt\": \"سو نو\"
},
{
\"start\": 15.68,
\"end\": 20.3,
\"txt\": \"ز موږ ولالو د دغه څلو ويلايتو سفر مو کئ\"
},
{
\"start\": 21.06,
\"end\": 22.9,
\"txt\": \"ز موږ اسلئ اجندا دغه و\"
}
Running a third time Gemini enters another infinite loop failure mode, exiting with MAX_TOKENS. Unfortunately, this suggests that in this use case even enabling unbudgeted thinking is not helpful in mitigating infinite loop failures:
{
\"start\": 0.05,
\"end\": 2.05,
\"txt\": \"زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم ز
م زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم ز
م زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم ز
م زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم زم
زم زم زم زم زم زم زم زم زم ز zim zam zim zim zim zim zim zim zim zim zim zim
zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim
zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim z
im zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim zim z
Running a fourth time yields results again, but also exhibits coherence breakdown again, with timestamps drifting once more:
{
\"start\": 0.09,
\"end\": 8.07,
\"txt\": \"زموږ مشران چې وو لکه چې جنوب د شمال دښمن ګرزولي او شمال د جنوب دښمن ګرزولی وو نه\"
},
{
\"start\": 8.07,
\"end\": 10.23,
\"txt\": \"نو زموږ سره په دې کې څه ده ونه وو\"
},
{
\"start\": 10.23,
\"end\": 14.5,
\"txt\": \"سوج فکر نه وو راسره نو اوس چې د امن فضا برابره شو نه\"
},
{
\"start\": 14.5,
\"end\": 21.03,
\"txt\": \"نو موږ اول راغلو دا د څلورو ولایتونو سفر مو وکړی زموږ اصلی ایجنډا دا وه چې مثلا افغانستان\"
},
{
\"start\": 21.03,
\"end\": 24.34,
\"txt\": \"مشتي کټ کور دی دا نه ده چې او او یا د پشتون دی یا د کندهار دی یا د جلال اباد دی\"
}
Given that we want translations for our transcripts, can Gemini output both transcription and translation transcripts for our video?
Transcribe this television broadcast into JSON format, where every 2 seconds is transcribed with \"start\" and \"end\" times in fractional seconds since the start of the audio and \"txt\" with the transcribed text and \"trans\" with the English translation of the transcribed text. ONLY output the transcript in JSON format with these fields, nothing else. ONLY transcribe and translate what was said, do not hallucinate.
This yields:
{
\"start\": 0.449,
\"end\": 2.279,
\"txt\": \"ژور د چی ورته وو شمال د دښمن ګرز ول وو شمال د دښمن ګرز ول وو\",
\"trans\": \"The enemy was moving north, the enemy was moving north.\"
},
{
\"start\": 2.279,
\"end\": 5.929,
\"txt\": \"او نه نو سر که نه سوچ فکر نه سر نو\",
\"trans\": \"And there was no thought, no thought, no.\"
},
{
\"start\": 6.309,
\"end\": 8.049,
\"txt\": \"چده دا ام برابر دا\",
\"trans\": \"The peace was equal.\"
},
{
\"start\": 8.049,
\"end\": 14.549,
\"txt\": \"اصلی اجنډا مثال افغانستان د پشتو و د جلال اواز\",
\"trans\": \"The main agenda for example is Afghanistan's Pashto voice of Jalal.\"
},
{
\"start\": 14.549,
\"end\": 20.379,
\"txt\": \"د قوم و کوز او پشتو په ټوله کی اصلی هدف\",
\"trans\": \"The whole aim of the tribe and the Pashtuns is to have a common goal.\"
},
{
\"start\": 20.729,
\"end\": 22.189,
\"txt\": \"لی زه کور\",
\"trans\": \"I am home.\"
},
{
\"start\": 22.339,
\"end\": 24.589,
\"txt\": \"صاحب افغانستان قوم\",
\"trans\": \"Sir Afghanistan is a nation.\"
},
{
\"start\": 24.589,
\"end\": 28.189,
\"txt\": \"افغانستان مختلف قوم کور\",
\"trans\": \"Afghanistan is home to various ethnic groups.\"
},
{
\"start\": 28.849,
\"end\": 32.799,
\"txt\": \"دا قوم مشکل\",
\"trans\": \"This tribe is a problem.\"
},
{
\"start\": 33.029,
\"end\": 35.809,
\"txt\": \"صاحب افغانستان\",
\"trans\": \"Sir Afghanistan\"
},
{
\"start\": 36.319,
\"end\": 38.089,
\"txt\": \"د جلال از\",
\"trans\": \"From Jalal.\"
},
{
\"start\": 38.089,
\"end\": 43.149,
\"txt\": \"دا سر برابر د کور د کار\",
\"trans\": \"This is equal to the home work.\"
},
{
\"start\": 43.149,
\"end\": 44.599,
\"txt\": \"د کور د کار\",
\"trans\": \"The homework.\"
},
{
\"start\": 44.599,
\"end\": 47.749,
\"txt\": \"نو ز دا فکر پیدا شو\",
\"trans\": \"So that thought came to me.\"
}
Running a second time we get the following. The translation has changed considerably:
{
\"start\": 0.088,
\"end\": 8.018,
\"txt\": \"شمشال دښمن د جنوب د شمال دښمن شمال د جنوب دښمن\",
\"trans\": \"The enemy of the south is the enemy of the north, and the north is the enemy of the south.\"
},
{
\"start\": 8.168,
\"end\": 10.638,
\"txt\": \"فکر سوچ فکر\",
\"trans\": \"Thinking, thinking, thinking.\"
},
{
\"start\": 10.638,
\"end\": 20.308,
\"txt\": \"فکر برابر اصلی\",
\"trans\": \"Thinking is the same as the original.\"
},
{
\"start\": 20.578,
\"end\": 23.368,
\"txt\": \"اصلی اجندا\",
\"trans\": \"Original agenda.\"
},
{
\"start\": 23.368,
\"end\": 26.548,
\"txt\": \"افغانستان فکر\",
\"trans\": \"Afghanistan's thought.\"
},
{
\"start\": 27.028,
\"end\": 35.88,
\"txt\": \"افغانستان تاجک پختون\",
\"trans\": \"Afghanistan Tajiks, Pashtuns.\"
},
{
\"start\": 35.88,
\"end\": 44.208,
\"txt\": \"اصلی\",
\"trans\": \"original\"
},
{
\"start\": 44.578,
\"end\": 45.428,
\"txt\": \"کړه اجندا\",
\"trans\": \"Done agenda.\"
}
A third time and the translation has again changed:
{
\"start\": 0.05,
\"end\": 3.73,
\"txt\": \"شم شمال جنوب دشمن جنوب دشمن\",
\"trans\": \"North and south are enemies. South and north are enemies.\"
},
{
\"start\": 3.73,
\"end\": 6.84,
\"txt\": \"سوج فکر برابر\",
\"trans\": \"I don't think that is the case. It's equal.\"
},
{
\"start\": 6.84,
\"end\": 9.92,
\"txt\": \"ولایت اصلی اجندا افغانستان\",
\"trans\": \"The main agenda of the provinces is Afghanistan.\"
},
{
\"start\": 9.92,
\"end\": 17.65,
\"txt\": \"یا پختون یا قند یا جلال ابادی یا اصلی\",
\"trans\": \"Whether it's Pashtun, Kandahari, or Jalalabadi, it doesn't matter. They are all considered as one. Our main goal was this.\"
},
{
\"start\": 17.65,
\"end\": 19.05,
\"txt\": \"صاحب\",
\"trans\": \"Sir,\"
},
{
\"start\": 19.05,
\"end\": 24.31,
\"txt\": \"افغانستان قومون وطن قومون\",
\"trans\": \"You said that Afghanistan is home to various tribes. It's the home of various Afghan tribes.\"
},
{
\"start\": 24.31,
\"end\": 33.39,
\"txt\": \"قوم مشان مشکل\",
\"trans\": \"You previously didn't meet with the tribal elders, you didn't hold gatherings with them. Why was that? What was the problem?\"
},
{
\"start\": 33.39,
\"end\": 37.16,
\"txt\": \"جناب افغانستان\",
\"trans\": \"Sir, this didn't happen before in Afghanistan.\"
},
{
\"start\": 37.16,
\"end\": 44.38,
\"txt\": \"ولایت جلال اباد و زابل دخلت کمزور خبر\",
\"trans\": \"In our provinces, like Jalalabad and Zabul, people were weak. The news was this.\"
},
{
\"start\": 44.38,
\"end\": 49.37,
\"txt\": \"سفر اللہ\",
\"trans\": \"After all the travels we've made, by the grace of Allah, this has become possible.\"
}
A fourth time we get an even less understandable translation:
{
\"start\": 1.761,
\"end\": 3.761,
\"txt\": \"شمشیر شمال دشمن شمال جنوب دشمن\",
\"trans\": \"The sword of the north is the enemy. The north is the enemy of the south.\"
},
{
\"start\": 3.861,
\"end\": 6.001,
\"txt\": \"خبر فکر برابر\",
\"trans\": \"I think it's equal.\"
},
{
\"start\": 6.841,
\"end\": 10.991,
\"txt\": \"افغانستان\",
\"trans\": \"Afghanistan.\"
},
{
\"start\": 11.161,
\"end\": 16.711,
\"txt\": \"تاسې راځې په افغانستان کې قوم افغانستان د قوم\",
\"trans\": \"You come to Afghanistan where there are different tribes. It is the house of different tribes of Afghanistan.\"
},
{
\"start\": 17.111,
\"end\": 20.211,
\"txt\": \"تاسې قوم مشکل\",
\"trans\": \"You are a tribe with a problem.\"
},
{
\"start\": 21.361,
\"end\": 25.591,
\"txt\": \"افغانستان دا مشکل\",
\"trans\": \"Afghanistan is a problem.\"
},
{
\"start\": 25.861,
\"end\": 26.691,
\"txt\": \"شمال\",
\"trans\": \"North.\"
},
{
\"start\": 27.671,
\"end\": 29.351,
\"txt\": \"ژوند\",
\"trans\": \"Life.\"
},
{
\"start\": 30.291,
\"end\": 32.181,
\"txt\": \"افغانستان\",
\"trans\": \"Afghanistan.\"
},
{
\"start\": 33.001,
\"end\": 35.311,
\"txt\": \"امنیت مشکل\",
\"trans\": \"Security problem.\"
},
{
\"start\": 36.001,
\"end\": 37.951,
\"txt\": \"زوی مشکل\",
\"trans\": \"Son's problem.\"
},
{
\"start\": 38.301,
\"end\": 40.061,
\"txt\": \"مشکل\",
\"trans\": \"Problem.\"
},
{
\"start\": 40.591,
\"end\": 42.601,
\"txt\": \"صبر\",
\"trans\": \"Patience.\"
},
{
\"start\": 43.151,
\"end\": 44.021,
\"txt\": \"مشر\",
\"trans\": \"Leader.\"
},
{
\"start\": 44.131,
\"end\": 45.451,
\"txt\": \"نور\",
\"trans\": \"Light.\"
}
A fifth time we return to a more understandable translation:
{
\"start\": 0.0,
\"end\": 3.74,
\"txt\": \"شمشیر جنگول شمال دشمن گرزمون شمال جنوب دشمن گرزمون\",
\"trans\": \"The sword fights in the north are enemies of the north, and the enemies of the south are also enemies of the north.\"
},
{
\"start\": 4.1,
\"end\": 8.08,
\"txt\": \"شمشیر شمشیر فکر فکر فکر فکر\",
\"trans\": \"Sword, sword, thought, thought, thought, thought.\"
},
{
\"start\": 8.08,
\"end\": 10.12,
\"txt\": \"Now it's our peace\",
\"trans\": \"Now it's our peace\"
},
{
\"start\": 10.42,
\"end\": 15.68,
\"txt\": \"برابر سفر اصلی اجندا مثلا افغانستان\",
\"trans\": \"Equal to the trip, the main agenda of Afghanistan, for example,\"
},
{
\"start\": 15.68,
\"end\": 16.32,
\"txt\": \"افغانستان مشتی\",
\"trans\": \"Afghanistan is a handful.\"
},
{
\"start\": 16.32,
\"end\": 18.06,
\"txt\": \"یاد پشتون یا کند یاد جلال اباد\",
\"trans\": \"Remember Pashtuns or Kandahar or Jalalabad.\"
},
{
\"start\": 18.2,
\"end\": 20.88,
\"txt\": \"یا خوستی دا ټول دغه نظام حکومت دا\",
\"trans\": \"Or Khoshti, this entire system, the government, this is it.\"
},
{
\"start\": 21.06,
\"end\": 22.84,
\"txt\": \"د تاجک کوس ازار پشتون دا\",
\"trans\": \"This Tajik Kus Azar Pashtun, this\"
},
{
\"start\": 23.3,
\"end\": 24.36,
\"txt\": \"اصل هدف\",
\"trans\": \"The real goal\"
},
{
\"start\": 24.36,
\"end\": 25.1,
\"txt\": \"من کرم\",
\"trans\": \"I will do it.\"
},
{
\"start\": 25.56,
\"end\": 27.24,
\"txt\": \"افغانستان مختلف قومونه\",
\"trans\": \"Different ethnic groups in Afghanistan.\"
},
{
\"start\": 27.84,
\"end\": 30.56,
\"txt\": \"افغانستان قومونه کور\",
\"trans\": \"Afghanistan's ethnic groups are the home.\"
},
{
\"start\": 30.82,
\"end\": 32.74,
\"txt\": \"ولایت قومونه\",
\"trans\": \"Provinces are ethnic groups.\"
},
{
\"start\": 33.1,
\"end\": 34.62,
\"txt\": \"سر مخک\",
\"trans\": \"In front of\"
},
{
\"start\": 35.0,
\"end\": 35.84,
\"txt\": \"قوم مشر\",
\"trans\": \"Elder of the tribe\"
},
{
\"start\": 36.24,
\"end\": 38.64,
\"txt\": \"بل ناک مجلس دا مشکل\",
\"trans\": \"The other failed council, this is the problem.\"
},
{
\"start\": 39.06,
\"end\": 43.52,
\"txt\": \"افغانستان دست افغان حکومت\",
\"trans\": \"The government of Afghanistan, the government of Afghanistan.\"
},
{
\"start\": 43.68,
\"end\": 47.96,
\"txt\": \"افغانستان جلال اباد خلک خلک اقتصاد\",
\"trans\": \"In Afghanistan, the people of Jalalabad, the people, the economy.\"
}
And again:
{
\"start\": 0.000,
\"end\": 2.000,
\"txt\": \"شمش د جن د شمال د شمال د جنوب دښمن\",
\"trans\": \"North of the North, the enemy of the South,\"
},
{
\"start\": 2.000,
\"end\": 4.000,
\"txt\": \"اول د شمال جنوب دښمن زول ولاد و شم شمال د جنوب دښمن زول و\",
\"trans\": \"First, the enemy of the North, the enemy of the South, the enemy of the North, the enemy of the South.\"
},
{
\"start\": 4.000,
\"end\": 6.000,
\"txt\": \"و اوس زم سره په دی چې چغ ول فکر نه ول سر نو اوس د امن برابر\",
\"trans\": \"Now, we didn't think about it when we were with him, but now it's equal to peace.\"
},
{
\"start\": 6.000,
\"end\": 8.000,
\"txt\": \"دا سر نور نو زم لا او دا او او س ولایت سفر زم اصلی ا\",
\"trans\": \"This is enough, now we have to travel to these four provinces, this is our main agenda.\"
},
{
\"start\": 8.000,
\"end\": 10.000,
\"txt\": \"مسال افغانستان م قر دیی چیش یا د پشتون یا د کنده یا د جلال\",
\"trans\": \"For example, Afghanistan is a big house. It doesn't matter if it's Pashtun, Kandahari, or Jalalabadi.\"
},
{
\"start\": 10.000,
\"end\": 12.000,
\"txt\": \"ا و یا د ده ټول د یی د ده او ده یا د د تاج کو ب و ا\",
\"trans\": \"Or the whole thing is from this, and this, and this, or from the Tajik, Uzbek, and Hazara, and Pashtun.\"
},
{
\"start\": 12.000,
\"end\": 14.000,
\"txt\": \"و و پون د طور تی ک زم اصلی ا و من ک تا افغانستان ک قوم\",
\"trans\": \"And this is our main goal. In Afghanistan, we have many ethnic groups.\"
},
{
\"start\": 14.000,
\"end\": 16.000,
\"txt\": \"جو او افغانستان د مخت قوم کو وای تا ق مس ما\",
\"trans\": \"This is the home of various Afghan ethnic groups. What about you, Mr. Qais? What about Mr. Mas? What about Mr. Ma?\"
},
{
\"start\": 16.000,
\"end\": 18.000,
\"txt\": \"ما نا کی ول دی ق مش ول م مشکل خ خ جاب\",
\"trans\": \"There is no problem with the people's meeting. Why are you not attending? Why is there a problem with the people?\"
},
{
\"start\": 18.000,
\"end\": 20.000,
\"txt\": \"خ خا مطلب خب خب خبر افغانستان دست\",
\"trans\": \"My friend, this is not a new thing in Afghanistan. There was no such thing in Afghanistan before.\"
},
{
\"start\": 20.000,
\"end\": 22.000,
\"txt\": \"ولایت جلال باد بل او جلال بل خ کمز\",
\"trans\": \"There was no one who could say Jalalabad and Zabul. The people there were poor.\"
},
{
\"start\": 22.000,
\"end\": 24.000,
\"txt\": \"دا د ت او سف د د د د دا\",
\"trans\": \"This is the travel that we have done and this is the progress that we have made.\"
},
{
\"start\": 24.000,
\"end\": 26.000,
\"txt\": \"را اسلامیک ما الله افغانستان امن\",
\"trans\": \"May Allah establish security throughout Afghanistan.\"
},
{
\"start\": 26.000,
\"end\": 28.000,
\"txt\": \"خا امن زدا فک شمل درا درا شم را\",
\"trans\": \"When security is established, we will think about going to the north. What about the north? What about the north?\"
},
{
\"start\": 28.000,
\"end\": 30.000,
\"txt\": \"او ا دا شا ز او لا ن د\",
\"trans\": \"And oh, that's it. It's too much.\"
},
{
\"start\": 30.000,
\"end\": 32.000,
\"txt\": \"او د را ما را ر ن شم ز شام خ شم ک\",
\"trans\": \"And I will go to the north and ask the people of the north. In the north,\"
},
{
\"start\": 32.000,
\"end\": 34.000,
\"txt\": \"د بل خان شم شپ و ب و ل\",
\"trans\": \"And we will spend the night in the Khan's house. And then we will go to Baghlan.\"
},
{
\"start\": 34.000,
\"end\": 36.000,
\"txt\": \"ولایت خبری ک خبر کن ک\",
\"trans\": \"The news of the province is news. And the news of Kunduz.\"
},
{
\"start\": 36.000,
\"end\": 38.000,
\"txt\": \"کن ز زور کن زور و زیاد\",
\"trans\": \"Kunduz is too strong. Kunduz is too strong. It is too much.\"
},
{
\"start\": 38.000,
\"end\": 40.000,
\"txt\": \"خوشحال یعنی د خلو و خ د\",
\"trans\": \"I am very happy. This means that the people want peace.\"
},
{
\"start\": 40.000,
\"end\": 42.000,
\"txt\": \"د دا دا و و لا ل دیز د و\",
\"trans\": \"This is it. This is it. This is it. This is it. This is it. This is it. This is it. This is it. This is it.\"
},
{
\"start\": 42.000,
\"end\": 44.000,
\"txt\": \"برنامج و و و و\",
\"trans\": \"The program is on the table, I will come again. Again, I will call you. This is the end of the night.\"
},
{
\"start\": 44.000,
\"end\": 46.000,
\"txt\": \"شم و دا سر کل د دا\",
\"trans\": \"And I spent the night there. And then I went to the north. And then I went to the south. And then I went to the east.\"
}
Returning to the block transcript from the beginning, what if we ask Gemini to translate it as a single block of text? This time we get a much more legible and understandable transcript, suggesting Gemini's translation performance is significantly higher when performed as a separate task, rather than inline with transcription:
Male voice 1: Previously, it was believed by us that the North was made an enemy of the South, and the South an enemy of the North. No, it wasn't like that. So, there was nothing for us in that, and no disputes would arise from it. So now, as security is being established, we embarked on a trip to four provinces. Our main agenda was, for example, that Afghanistan has become unified. It doesn't say whether this is Pashtun, or from Kandahar, or from Jalalabad, or from Khost. No. This whole picture portrays that this government treats all, Tajiks, Uzbeks, Hazaras, and Pashtuns, with one eye (equally). This was our main goal.
Male voice 2: Many thanks, esteemed Ustaz, Haji Sahib. You told us that different ethnic groups live in Afghanistan. This is the home of Afghanistan's different ethnic groups. The meetings and gatherings you held today, you sat with the ethnic groups, you sat with the elders and leaders. Why wasn't this happening before? Why didn't the tribal leaders sit with each other? They weren't holding meetings. They kept their distance from each other. Where was the problem?
Male voice 3: The matter is like this, sir, this wasn't happening before. If we (Azmoj) were to talk about it, this policy was not consistently implemented in Afghanistan before. Meaning, we (Azmoj) in our provinces, with the people of Jalalabad and Zabul, did we truly understand them at that time, or did we just take them to Jalalabad and Zabul? Oh, those people were internally and economically very weak. The second point is, all these trips that we made, by the grace of Allah, this is the work of the Emirate; this is the work of security. So…
Male voice 1: So now, by the will of Allah Almighty, security has been established throughout Afghanistan. So, this thought occurred to us that we can go to the North. This back-and-forth, this time when we went, Haji Sahib endured (with us). Not many others from our side, or your family, accompanied us. But many told me that when we went there, in that gathering, I myself, in the second instance, had only gone to the North. Samar was with us, and among them, Haji Aminullah Haji Sahib was with us, and two others. When I went to the North for the second time, the people of the North were asking me questions. There in the North, there was a Haji Sahib for whom we went. We spent four or five nights there. Like these three major stops, then we went to Baghlan and that place. And to Kunduz, we went to these provinces. Certainly, the news came that we (Azmoj) had arrived in Kunduz. We four (Azmoj/our group) arrived in Kunduz in the evening. These people with us (Azmoj) were very numerous. We were very happy with the people. Meaning, these people's own statement was that "we have come for your visit." When we arrived there in the guesthouse, there was a lot of enthusiasm, like from Kabul, it was very lively. There were some people who told me, "This is my program; I will come again." Then we (Azmoj) came, it was the night before Eid. Then we went, and we spent the night there. This time, Haji Sahib went to us (Azmoj), and several people from Azmoj came to me (Azmoj). It took two hours from Aflam. The first time, in that meeting with Azmoj, fifty people attended well. Now, in that place with Azmoj, forty people have attended well. This time, twenty-six people came to Azmoj with respect, showing that other people also come for Azmoj. In my calm words, this is how Azmoj's work was: we went to one province, then another province, and we spent the night. Those discussions were like this. The first time, on our (Azmoj's) trip, we (Azmoj) emphasized this important point, that this country, first and foremost, was about security, as he told you. But alas, this work could not be done (before).
Male voice 2: Another point is that we (Azmoj) were with these people, in places where we (Azmoj) gave assurance to the people that there is work to be done with us (Azmoj). This time, I went again. The third time, Azmoj (we) conveyed to that friend, Haji Sahib, in a phone recording, what we (Azmoj) had said in the group. The people of those provinces had also told Haji Sahib. This is true; it is clear now; I go face-to-face. Those people are extremely happy with us (Azmoj), and we (Azmoj) are happy with everyone. Among Pashtun areas, we (Azmoj) had gone there. Five (issues/regions) were covered. In all provinces, they gave us (Azmoj) hospitality. This time, this is the main focus. We (Azmoj) delivered (aid/messages) to the provinces. This is Azmoj's focus; we (Azmoj), this is a new focus. With all respect and everything that we (Azmoj) have accomplished, to these people, we (Azmoj) gave many things, including turbans, to everyone. For this, one person, Azmoj, has brought honor for Azmoj. May he be given paradise.
Male voice 4: Dear listeners of Afghanistan National Television, we have a short break in this part of the program. We will return. Our program (Azmoj) continues.
Male voice 1: Heart, flag!
Male voice 5: This time, you.
Male voice 1: For our (Azmoj's) life, a fresh start.
Male voice 5: Heart, flag!
Male voice 1: For us (Azmoj), this flag.
Male voice 5: How beautiful is the spring of freedom!