1 00:00:05,400 --> 00:00:07,242 L'ABC dei media digitali per geek. 2 00:00:08,124 --> 00:00:10,742 Le workstation ed i computer di fascia alta già da 15 anni 3 00:00:10,742 --> 00:00:14,749 sono capaci di manipolare l'audio digitale molto facilmente. 4 00:00:14,749 --> 00:00:17,470 Ed è da 5 anni che anche le normali workstation son capaci 5 00:00:17,470 --> 00:00:21,643 di manipolare video grezzo senza la necessità di hardware dedicato. 6 00:00:21,643 --> 00:00:25,400 Ma oggi anche il più economico dei PC domestici ha la potenza di calcolo 7 00:00:25,400 --> 00:00:28,092 e la capacità d'immagazzinamento per produrre e pubblicare 8 00:00:28,092 --> 00:00:30,479 contenuti video senza nemmeno troppo sforzo. 9 00:00:30,479 --> 00:00:33,579 Ed ora che chiunque ha a disposizione l'hardware a basso costo, 10 00:00:33,579 --> 00:00:36,651 sempre più persone, ovviamente, cercano di creare 11 00:00:36,651 --> 00:00:39,908 contenuti multimediali interessanti, anche per lo streaming. 12 00:00:39,908 --> 00:00:44,017 Youtube per primo ha raggiunto il successo, ed ora tutti cercano di imitarlo. 13 00:00:44,017 --> 00:00:47,413 Ed è un bene! Perché questa roba è molto divertente! 14 00:00:48,250 --> 00:00:51,179 Non è affatto difficile trovare un pubblico per i media digitali 15 00:00:51,179 --> 00:00:54,649 ma io oggi mi rivolgo agli ingegneri, ai matematici, 16 00:00:54,649 --> 00:00:57,869 agli hacker, alle persone che si appassionano a scoprire 17 00:00:57,869 --> 00:01:01,302 e creare, e sviluppare essi stessi la tecnologia. 18 00:01:01,302 --> 00:01:03,282 Sono queste le persone che mi stanno a cuore. 19 00:01:04,250 --> 00:01:08,723 Il campo dei media digitali (e soprattutto la compressione) viene percepito come specialistico, 20 00:01:08,723 --> 00:01:12,822 qualcosa di incredibile difficoltà che non ha eguali in informatica. 21 00:01:12,822 --> 00:01:15,700 Agli industriali del settore non importa molto di questa percezione 22 00:01:15,700 --> 00:01:19,734 che, anzi, li aiuta a giustificare i numeri impressionanti che realizzano grazie ai loro brevetti. 23 00:01:19,734 --> 00:01:23,870 Sono fieri di pensare che i loro ricercatori siano il meglio del meglio, 24 00:01:23,870 --> 00:01:27,738 talmente intelligenti che le loro idee geniali 25 00:01:27,738 --> 00:01:29,903 non possano essere comprese dai comuni mortali. 26 00:01:30,625 --> 00:01:33,716 Ma questa è solo fuffa. 27 00:01:35,205 --> 00:01:38,900 Audio e video digitali, lo streaming e la compressione 28 00:01:38,900 --> 00:01:42,738 pongono numerose problematiche profonde e stimolanti 29 00:01:42,738 --> 00:01:44,662 proprio come ogni altra disciplina. 30 00:01:44,662 --> 00:01:47,929 Questa sembra specialistica perché poche persone ne sono a conoscenza. 31 00:01:47,929 --> 00:01:51,223 Forse se ne sono interessati in pochi perché erano in pochi 32 00:01:51,223 --> 00:01:54,665 a potersi permettere le costose apparecchiature dedicate necessarie fino a poco tempo fa. 33 00:01:54,665 --> 00:01:58,792 Ma oggi tutti coloro che sono capaci di guardare questo video 34 00:01:58,792 --> 00:02:03,317 hanno un PC economico e general-purpose, abbastanza potente per fare ciò che prima era riservato alle workstation. 35 00:02:05,926 --> 00:02:11,108 Lo scontro di oggi si combatte sul terreno dell'HTML5, dei browser, 36 00:02:11,108 --> 00:02:13,671 dei video, delle soluzioni libere contro quelle proprietarie. 37 00:02:13,671 --> 00:02:17,048 Questo è un buon momento per farsi coinvolgere 38 00:02:17,048 --> 00:02:20,000 e il punto migliore per cominciare è probabilmente 39 00:02:20,000 --> 00:02:22,619 comprendere la tecnologia che abbiamo di fronte oggi. 40 00:02:23,500 --> 00:02:25,071 Questo video è un'introduzione 41 00:02:25,071 --> 00:02:28,180 e, proprio per questo, sorvoleremo su molti dettagli 42 00:02:28,180 --> 00:02:30,882 in modo da rendere più semplice il quadro generale. 43 00:02:30,882 --> 00:02:33,908 Ci sarà qualcuno di voi che conoscerà già molti degli aspetti 44 00:02:33,908 --> 00:02:36,378 di cui parlerò adesso, almeno all'inizio. 45 00:02:36,378 --> 00:02:39,293 E d'altro canto, andrò inevitabilmente troppo veloce per coloro 46 00:02:39,293 --> 00:02:44,558 che non hanno mai sentito parlare di queste cose; se è così non preoccupatevi. 47 00:02:44,558 --> 00:02:48,629 L'importante è afferrare l'idea, un concetto che catturi l'attenzione. 48 00:02:48,629 --> 00:02:52,497 In particolare, prestate attenzione ai termini che useremo nella descrizione 49 00:02:52,479 --> 00:02:56,078 perché basteranno questi, insieme a Google e Wikipedia, per approfondire 50 00:02:56,078 --> 00:02:57,753 ogni argomento al livello che desiderate. 51 00:02:57,753 --> 00:03:00,094 E adesso passiamo immediatamente 52 00:03:00,094 --> 00:03:03,351 a presentare il vostro nuovo hobby. 53 00:03:03,901 --> 00:03:09,101 Audio analogico ed audio digitale 54 00:03:10,291 --> 00:03:13,030 Il suono è la propagazione, attraverso un mezzo, di onde 55 00:03:13,030 --> 00:03:16,981 che si allontanano dalla sorgente come le onde generate da un sasso in uno stagno. 56 00:03:16,981 --> 00:03:19,489 Il ricevitore, che sia un microfono o il nostro orecchio, 57 00:03:19,489 --> 00:03:22,876 trasforma queste variazioni di pressione in segnale elettrico. 58 00:03:22,876 --> 00:03:25,800 Beh, questo lo sapevamo già ai tempi della scuola. 59 00:03:25,800 --> 00:03:26,771 Ma andiamo avanti. 60 00:03:27,465 --> 00:03:32,527 Il segnale audio è una funzione, un valore che varia col tempo. 61 00:03:32,527 --> 00:03:34,248 Se rallentiamo un pochino l'oscilloscopio... 62 00:03:36,450 --> 00:03:38,190 sarà più semplice vederlo. 63 00:03:38,190 --> 00:03:40,688 Ci sono altri aspetti del segnale audio che vale la pena osservare. 64 00:03:40,688 --> 00:03:43,418 È continuo nei valori e nel tempo; 65 00:03:43,418 --> 00:03:46,813 e ciò vuol dire che in ogni istante può assumere ogni valore reale, 66 00:03:46,813 --> 00:03:50,228 e che questo valore può variare in modo uniforme nel tempo. 67 00:03:50,228 --> 00:03:52,439 A prescindere dal nostro livello di zoom 68 00:03:54,068 --> 00:03:58,510 non troverete mai discontinuità, mai punti singolari, mai gradini 69 00:03:58,510 --> 00:04:01,285 né tantomeno istanti in cui il segnale risulti assente. 70 00:04:03,247 --> 00:04:08,475 Il segnale è una funzione definita ovunque e la matematica classica può andarci a nozze. 71 00:04:11,001 --> 00:04:15,378 D'altro canto, un segnale digitale è discreto sia nel valore sia nel tempo. 72 00:04:15,378 --> 00:04:19,107 Nella sua forma più semplice, chiamata Pulse Code Modulation (PCM), 73 00:04:19,107 --> 00:04:24,058 l'ampiezza del segnale in un certo istante è rappresentata da solo uno dei possibili valori, 74 00:04:24,058 --> 00:04:30,165 rilevati in istanti temporali rigorosamente cadenzati. Il risultato è una sequenza di cifre. 75 00:04:30,674 --> 00:04:35,309 Questi grafici appaiono incredibilmente simili, vero? 76 00:04:35,309 --> 00:04:38,964 Risulta intuitivo pensare di poter passare da una forma all'altra 77 00:04:38,964 --> 00:04:44,683 e la buona notizia è che il teorema del campionamento ci dice che si può fare, e anche come. 78 00:04:44,683 --> 00:04:48,477 Nella sua forma più nota è stato reso pubblico nel 1949 da Claude Shannon 79 00:04:48,477 --> 00:04:52,409 che si basò sui lavori di Nyquist, Hartley e molti altri. 80 00:04:52,409 --> 00:04:56,138 Il teorema dice non solo che possiamo trasformare la forma analogica in quella digitale e viceversa, 81 00:04:56,138 --> 00:05:00,913 ma ci indica anche le condizioni per cui la trasformazione 82 00:05:00,913 --> 00:05:06,779 risulta senza perdite e le due rappresentazioni diventano equivalenti ed intercambiabili. 83 00:05:06,779 --> 00:05:10,601 Quando non sussistono le condizioni per la trasformazione lossless, il teorema 84 00:05:10,601 --> 00:05:14,247 ci dice quanta informazione viene perduta o come viene alterata. 85 00:05:14,900 --> 00:05:21,270 Fino a tempi recenti la tecnologia analogica veniva usata per tutte le elaborazioni audio 86 00:05:21,270 --> 00:05:25,267 ma non certo perché le sorgenti audio fossero di tipo analogico. 87 00:05:25,267 --> 00:05:28,450 Si potrebbe pensare che, visto che i computer sono un'invenzione recente, 88 00:05:28,450 --> 00:05:31,643 la tecnologia analogica sia per forza nata prima. 89 00:05:31,643 --> 00:05:34,428 Niente affatto. Il digitale è arrivato prima. 90 00:05:34,428 --> 00:05:37,611 Il telegrafo ha preceduto il telefono di mezzo secolo 91 00:05:37,611 --> 00:05:41,951 ed era già completamente meccanizzato nel 1860; si mandavano segnali digitali, 92 00:05:41,951 --> 00:05:46,476 codificati e multiplexati anche su lunghissime distanze. Ricordate i nastri per telescrivente? 93 00:05:46,476 --> 00:05:50,427 Harry Nyquist dei laboratori Bell stava facendo ricerche sulle trasmissioni a impulsi del telegrafo 94 00:05:50,427 --> 00:05:53,027 quando pubblicò la descrizione di quella che in seguito 95 00:05:53,027 --> 00:05:57,219 fu chiamata frequenza di Nyquist, il concetto cardine del teorema del campionamento. 96 00:05:57,219 --> 00:06:01,642 Ok, a quei tempi il telegrafo trasmetteva simboli per testo, 97 00:06:01,642 --> 00:06:06,883 non certo segnali analogici digitalizzati, ma l'avvento di radio e telefono 98 00:06:06,883 --> 00:06:12,000 diede impulso alle tecnologie analogica e digitale che crebbero di pari passo. 99 00:06:12,699 --> 00:06:18,732 L'audio è sempre stato elaborato in analogico perché, perbacco, è più facile. 100 00:06:18,732 --> 00:06:23,257 Un filtro passa-basso, per esempio, richiede due componenti passivi. 101 00:06:23,257 --> 00:06:26,505 Un circuito per la trasformata di Fourier a tempo breve, un centinaio. 102 00:06:26,505 --> 00:06:30,752 Beh, magari un migliaio se vogliamo farlo bene. 103 00:06:31,844 --> 00:06:35,989 L'elaborazione digitale dei segnali richiede milioni o miliardi di transistor 104 00:06:35,989 --> 00:06:40,366 che funzionano ad elevata frequenza, hardware dedicato che si occupi 105 00:06:40,366 --> 00:06:43,836 di campionare e riconvertire i segnali, un ambiente software completo 106 00:06:43,836 --> 00:06:47,362 che controlli e sfrutti questa enorme potenza a disposizione, 107 00:06:47,362 --> 00:06:51,091 parecchio spazio di memorizzazione per conservare il lavoro per il futuro... 108 00:06:51,091 --> 00:06:56,171 Verrebbe da pensare che quella analogica sia la strada più semplice per l'elaborazione audio, 109 00:06:56,171 --> 00:07:07,019 a meno che uno non abbia già miliardi di transistor e tutta quella roba a portata di mano. 110 00:07:07,850 --> 00:07:12,660 E visto che oggi ce l'abbiamo, l'elaborazione digitale è divenuta più interessante. 111 00:07:13,363 --> 00:07:18,906 Innanzitutto, i circuiti analogici non hanno la flessibilità di un computer. 112 00:07:18,906 --> 00:07:21,182 Aggiungere una funzionalità a questo mostro 113 00:07:22,191 --> 00:07:24,578 beh... è praticamente impossibile. 114 00:07:24,578 --> 00:07:26,567 Invece, su un sistema di elaborazione digitale basta scrivere 115 00:07:28,668 --> 00:07:34,127 un nuovo programma. Scrivere software non è banale, ma è di sicuro più semplice. 116 00:07:34,127 --> 00:07:39,550 Un'altra importante considerazione è che ogni componente analogico è imperfetto. 117 00:07:39,550 --> 00:07:44,352 Non esistono un transistor perfetto, un induttore perfetto, un condensatore perfetto, 118 00:07:44,352 --> 00:07:51,569 quindi ogni componente introduce rumore e distorsione, generalmente non molto ma lo fa. 119 00:07:51,569 --> 00:07:55,669 Già solo la trasmissione di un segnale analogico, specie se su lunghe distanze, 120 00:07:55,669 --> 00:08:00,434 lo rovina progressivamente e irreversibilmente. 121 00:08:00,434 --> 00:08:06,513 Inoltre la componentistica analogica è ingombrante. 122 00:08:06,513 --> 00:08:09,946 Con due righe di codice sul mostro a transistor possiamo realizzare 123 00:08:09,946 --> 00:08:14,702 un filtro che richiederebbe un induttore grande come un frigorifero. 124 00:08:14,702 --> 00:08:17,941 I sistemi digitali non presentano quegli svantaggi. 125 00:08:17,941 --> 00:08:24,335 Nella forma digitale, i nostri segnali possono essere copiati, elaborati e trasmessi senza alterazioni. 126 00:08:24,335 --> 00:08:26,889 È anche vero che ogni tanto usiamo algoritmi lossy 127 00:08:26,889 --> 00:08:31,284 ma le uniche fasi non ideali restano il campionamento e la riconversione, 128 00:08:31,284 --> 00:08:35,929 quando è inevitabile interfacciarsi col mondo analogico. 129 00:08:35,929 --> 00:08:40,750 In ogni caso, oggi la qualità delle conversioni è veramente elevata 130 00:08:40,750 --> 00:08:45,849 e il nostro sistema uditivo le percepisce come se fossero lossless. 131 00:08:45,849 --> 00:08:50,429 L'hardware necessario oggi è diventato economico ed ha dimensioni ridotte, 132 00:08:50,429 --> 00:08:55,379 quindi chi decide di fare elaborazione audio sceglie ovviamente la via digitale. 133 00:08:55,379 --> 00:09:00,857 Ora iniziamo a parlare di memorizzazione, copia, elaborazione e trasmissione. 134 00:09:01,107 --> 00:09:04,607 L'audio digitale "nudo e crudo" 135 00:09:04,956 --> 00:09:08,639 La forma più comune per l'audio grezzo è la Pulse Code Modulation (PCM). 136 00:09:08,639 --> 00:09:13,867 Ci sono anche altre rappresentazioni, come la modulazione sigma-delta usata nei SACD 137 00:09:13,867 --> 00:09:16,625 che si basa sulla densità degli impulsi ed è detta PDM. 138 00:09:16,625 --> 00:09:19,687 Comunque la PCM è di gran lunga più usata, 139 00:09:19,687 --> 00:09:22,158 anche perché è matematicamente più comoda. 140 00:09:22,158 --> 00:09:26,350 Un ingegnere audio potrebbe lavorare una vita e utilizzare solo la PCM. 141 00:09:26,350 --> 00:09:29,135 Questa codifica si caratterizza con tre parametri fondamentali, 142 00:09:29,135 --> 00:09:34,187 rendendo relativamente semplice la gestione di ogni possibile variante. 143 00:09:34,187 --> 00:09:36,426 Il primo parametro è la frequenza di campionamento. 144 00:09:36,426 --> 00:09:40,886 La frequenza più alta che una codifica può rappresentare è detta frequenza di Nyquist. 145 00:09:40,886 --> 00:09:45,124 Nella PCM la frequenza di Nyquist è esattamente la metà della frequenza di campionamento. 146 00:09:45,124 --> 00:09:51,389 Quindi la frequenza di campionamento influenza direttamente la frequenza più alta che troveremo nel segnale digitale. 147 00:09:51,389 --> 00:09:56,515 Le vecchie linee telefoniche analogiche limitavano la voce ad una banda sotto i 4 kHz, 148 00:09:56,515 --> 00:10:02,224 quindi la telefonia digitale e le applicazioni vocali usano un campionamento ad 8 kHz, 149 00:10:02,224 --> 00:10:07,277 la minima frequenza di campionamento necessaria a catturare una intera banda ampia 4 kHz. 150 00:10:07,227 --> 00:10:14,263 Ecco l'effetto della mia voce campionata ad 8 kHz: è un po' smorzata ma resta intelligibile. 151 00:10:14,263 --> 00:10:18,149 Questa resta la più bassa frequenza di campionamento mai usata nella pratica. 152 00:10:18,149 --> 00:10:23,322 E quando la potenza, la memoria e i dischi crebbero, l'hardware per computer 153 00:10:23,322 --> 00:10:29,642 riuscì a salire a campionamenti di 11, poi a 16, poi a 22 e anche a 32 kHz. 154 00:10:29,642 --> 00:10:33,491 Ovviamente, con l'incremento nella frequenza di campionamento e nella frequenza di Nyquist, 155 00:10:33,491 --> 00:10:38,302 le alte frequenze si sentivano più chiaramente ed il suono divenne più naturale. 156 00:10:38,301 --> 00:10:44,576 I Compact Disc usano un campionamento a 44.1 kHz, che è un po' meglio di 32 kHz, 157 00:10:44,576 --> 00:10:46,788 anche se le differenze sono meno evidenti. 158 00:10:46,788 --> 00:10:52,053 La scelta di 44.1 kHz è un po' insolita, soprattutto se considerate che questa frequenza non era 159 00:10:52,053 --> 00:10:56,559 mai stata utilizzata prima, ma l'enorme successo dei CD l'ha resa molto comune. 160 00:10:56,559 --> 00:11:01,195 La frequenza di campionamento più comune, a parte il settore dei CD, è di 48 kHz. 161 00:11:05,710 --> 00:11:08,597 E non ci sono differenze percepibili tra le due. 162 00:11:08,597 --> 00:11:13,640 Ad esempio, questo video (o almeno l'originale) è stato girato e prodotto con audio a 48 kHz, 163 00:11:13,640 --> 00:11:18,545 perché è questo lo standard per l'audio ad alta fedeltà nel settore video. 164 00:11:18,545 --> 00:11:25,100 Sono in uso anche frequenze di campionamento a super-alta fedeltà di 88, 96 e 192 kHz. 165 00:11:25,100 --> 00:11:30,888 L'introduzione di queste frequenze di campionamento non è legata all'estensione del campo uditivo. 166 00:11:30,888 --> 00:11:32,489 Il motivo è un altro. 167 00:11:32,896 --> 00:11:37,319 Facciamo un passo indietro: il matematico francese Jean Baptiste Joseph Fourier ci ha dimostrato 168 00:11:37,319 --> 00:11:42,353 che possiamo scomporre i segnali (anche l'audio) nell'insieme di frequenze che li compongono. 169 00:11:42,353 --> 00:11:45,841 Questa rappresentazione nel dominio della frequenza è equivalente a quella nel dominio del tempo: 170 00:11:45,841 --> 00:11:49,719 il segnale è lo stesso ma lo descriviamo in maniera diversa. 171 00:11:49,719 --> 00:11:56,131 Qui osserviamo la rappresentazione nel dominio della frequenza di un segnale analogico che vogliamo campionare. 172 00:11:56,131 --> 00:11:59,888 Il teorema del campionamento ci dice due cose fondamentali del processo di campionamento. 173 00:11:59,888 --> 00:12:04,727 Primo: il segnale digitale non può catturare le frequenze più elevate di quella di Nyquist. 174 00:12:04,727 --> 00:12:10,640 Secondo (è questa la novità): se non tagliamo via quelle frequenze con un filtro passa-basso, 175 00:12:10,640 --> 00:12:16,414 il campionamento le riporterà tra le frequenze catturate in forma di distorsioni da aliasing. 176 00:12:16,414 --> 00:12:20,069 E, detto in breve, l'aliasing suona malissimo. 177 00:12:20,069 --> 00:12:25,242 Quindi è essenziale rimuovere ogni frequenza più elevata di quella di Nyquist prima del campionamento e dopo la riconversione. 178 00:12:25,871 --> 00:12:31,265 L'orecchio umano percepisce i suoni fino a circa 20 kHz. 179 00:12:31,265 --> 00:12:37,548 Nei campionamenti a 44.1 o 48 kHz il filtro passa-basso deve essere estremamente preciso 180 00:12:37,548 --> 00:12:42,101 per evitare di alterare le frequenze udibili, sotto i 20 kHz, 181 00:12:42,101 --> 00:12:49,439 ma comunque tagliare le frequenze sopra quella di Nyquist che rovinerebbero il campionamento. 182 00:12:49,439 --> 00:12:55,342 Un filtro così è difficile da realizzare e non ci riesce completamente. 183 00:12:55,342 --> 00:13:00,024 Invece, se il campionamento avviene a 96 o 192 kHz 184 00:13:00,024 --> 00:13:07,223 il filtro passa-basso può agire su un'altra ottava (o due) per filtrare. E questo filtro è più semplice. 185 00:13:07,223 --> 00:13:14,348 Le frequenze di campionamento oltre i 48 kHz sono dovute proprio all'origine analogica del segnale. 186 00:13:15,014 --> 00:13:20,844 Il secondo parametro fondamentale è il formato del campione, cioè il formato di ogni valore rilevato. 187 00:13:20,844 --> 00:13:26,285 Un numero è sempre un numero ma in informatica un numero si può rappresentare in un gran numero di modi. 188 00:13:26,942 --> 00:13:30,902 All'inizio i file PCM usavano una codifica lineare ad 8 bit, senza segno. 189 00:13:30,902 --> 00:13:37,028 La gamma dinamica era limitata a 50 dB ed il rumore di quantizzazione, come state sentendo, era decisamente percepibile. 190 00:13:37,028 --> 00:13:39,970 Infatti l'audio ad 8 bit è quasi svanito ai nostri giorni. 191 00:13:41,007 --> 00:13:47,484 La telefonia digitale utilizza una tra due codifiche ad 8 bit non lineari, dette A-law e mu-law. 192 00:13:47,484 --> 00:13:51,287 Queste codifiche offrono la gamma dinamica di 14 bit usandone 8 193 00:13:51,287 --> 00:13:54,674 grazie alla maggior ampiezza (non lineare, appunto) dei valori maggiori. 194 00:13:54,674 --> 00:13:59,226 Le codifiche A-law e mu-law sono certamente migliori sul fronte del rumore di quantizzazione, 195 00:13:59,226 --> 00:14:03,557 e nascondono altri artefatti grazie alla miglior resa della voce. 196 00:14:03,557 --> 00:14:08,248 Troverete queste 3 codifiche ad 8 bit, lineare, A-law e mu-law, 197 00:14:08,248 --> 00:14:13,328 generalmente in uso con campionamenti ad 8 kHz, anche se qui li abbiamo provati a 48 kHz. 198 00:14:13,328 --> 00:14:18,491 Le codifiche PCM di oggi usano 16 o 24 bit interi in complemento a due ed offrono 199 00:14:18,491 --> 00:14:23,858 la gamma dinamica da meno infinito a zero decibel nei loro 16 o 24 bit. 200 00:14:23,858 --> 00:14:27,800 I loro valore massimo coincide con zero decibel. 201 00:14:27,800 --> 00:14:31,584 In tutti i formati visti finora, i segnali più forti di zero decibel, 202 00:14:31,584 --> 00:14:35,619 e dunque maggiori del massimo rappresentabile, vengono tagliati. Persi. 203 00:14:35,619 --> 00:14:41,199 Negli studi di missaggio è consueto l'uso di numeri reali per la PCM, al posto degli interi. 204 00:14:41,199 --> 00:14:47,222 Un numero reale a 32 bit, come da standard IEEE 754, è lo stesso usato dai computer 205 00:14:47,222 --> 00:14:52,793 ed, oltre a 24 bit di risoluzione, ha anche 7 bit dedicati all'esponente per estendere i valori rappresentabili. 206 00:14:52,793 --> 00:14:57,040 Nei numeri reali il valore di zero decibel è su +/- 1.0 207 00:14:57,040 --> 00:15:00,547 ma un numero reale può anche assumere valori decisamente più elevati di 1 208 00:15:00,547 --> 00:15:05,220 quindi, se durante il missaggio certi segnali superano la soglia di zero decibel, non saranno perduti. 209 00:15:05,220 --> 00:15:11,077 I campionamenti PCM con numeri reali occupano parecchio spazio e quindi si usano solo durante le elaborazioni intermedie. 210 00:15:11,077 --> 00:15:15,796 Un ultimo punto: i PC leggono e scrivono dati in ottetti di bit, i byte, 211 00:15:15,796 --> 00:15:18,489 dunque bisogna tener presente che i campioni più grandi di 8 bit possono essere immagazzinati 212 00:15:18,489 --> 00:15:22,838 con ordine little endian o con il big endian, e sono entrambi utilizzati normalmente. 213 00:15:22,838 --> 00:15:28,751 Per esempio, i file Wav di Microsoft sono in little endian e gli AIFC di Apple in big endian. 214 00:15:28,751 --> 00:15:30,139 Sappiatelo. 215 00:15:30,870 --> 00:15:34,071 Il terzo parametro della codifica PCM è il numero di canali. 216 00:15:34,071 --> 00:15:38,485 Per convenzione, la codifica multicanale prevede l'inserimento dei campioni da ogni canale 217 00:15:38,485 --> 00:15:43,398 in sequenza nello stesso stream, una soluzione immediata e scalabile. 218 00:15:43,398 --> 00:15:47,701 Ed è tutto! Con questi parametri si descrive ogni stream PCM. 219 00:15:47,701 --> 00:15:51,578 Chiuso. L'audio digitale è proprio semplice! 220 00:15:51,578 --> 00:15:56,436 Ci sarebbe anche altro da dire, ovvio, ma adesso che sappiamo cosa c'è in un blocco di dati audio 221 00:15:56,436 --> 00:15:58,092 vediamo di parlare anche del video. 222 00:15:58,242 --> 00:16:02,242 Video digitale: piantiamo le basi (e facciamole attecchire) 223 00:16:02,571 --> 00:16:08,798 Possiamo pensare al segnale video come se fosse l'audio, notando che esso ha le dimensioni X e Y 224 00:16:08,798 --> 00:16:12,787 oltre alla dimensione temporale. Matematicamente è valido. 225 00:16:12,787 --> 00:16:19,097 Allora possiamo applicare lo stesso teorema del campionamento alle sue tre dimensioni, come facevamo con l'audio. 226 00:16:19,097 --> 00:16:25,815 Siamo d'accordo, audio e video sono molto diversi. I dati richiesti per il video sono molti, molti di più. 227 00:16:25,815 --> 00:16:29,294 L'audio da CD richiede circa 1.4 megabit per secondo. 228 00:16:29,294 --> 00:16:33,958 Il video grezzo 1080i HD richiede oltre 700 megabit per secondo, 229 00:16:33,958 --> 00:16:40,056 quindi più di 500 volte tanto. Tutta roba da catturare, elaborare ed immagazzinare ogni secondo. 230 00:16:40,056 --> 00:16:43,711 Secondo la legge di Moore... vediamo... più o meno 8 raddoppi, ciascuno in 2 anni... 231 00:16:43,711 --> 00:16:47,838 e quindi i computer dovrebbero richiedere circa 15 anni in più per maneggiare il video grezzo 232 00:16:47,838 --> 00:16:51,252 dal momento in cui riuscissero a gestire l'audio grezzo. 233 00:16:51,252 --> 00:16:55,425 Il video è però più complesso dell'audio. 234 00:16:55,425 --> 00:16:58,599 La mole di dati video deve essere rappresentata 235 00:16:58,599 --> 00:17:02,106 in un modo più efficiente rispetto alla semplicità della PCM lineare. 236 00:17:02,106 --> 00:17:06,705 In più, considerate che il video digitale viene in gran parte dal segnale televisivo 237 00:17:06,705 --> 00:17:13,423 e l'industria della televisione ha da sempre un occhio di riguardo per la compatibilità col passato. 238 00:17:13,423 --> 00:17:17,559 Proprio fino all'anno scorso, negli USA, i vecchi televisori in bianco e nero 239 00:17:17,559 --> 00:17:21,038 erano ancora capaci di funzionare con la TV analogica. 240 00:17:21,038 --> 00:17:23,879 È un bel trucco, no? 241 00:17:23,879 --> 00:17:28,718 Lo svantaggio della retrocompatibilità è questo: una volta che uno standard si impone, 242 00:17:28,718 --> 00:17:30,985 dopo non puoi più liberartene. 243 00:17:30,985 --> 00:17:37,305 Il video digitale non ha la storia dell'audio ma non puoi crearlo dal niente con idee nuove. 244 00:17:37,305 --> 00:17:43,958 Dopo una storia di oltre sessant'anni, i trucchi introdotti nella TV 245 00:17:43,958 --> 00:17:50,102 sono diventati un bel po' e poiché la TV digitale è ancora il motore del video digitale, 246 00:17:50,102 --> 00:17:54,664 tutti quegli accrocchi ce li siamo ritrovati anche negli standard per il video digitale. 247 00:17:54,664 --> 00:18:00,022 Sarò breve, perché i dettagli del video digitale sono molti di più rispetto all'audio 248 00:18:00,022 --> 00:18:05,592 e sarebbe impossibile discuterli tutti in questo episodio, quindi parleremo dei fondamentali. 249 00:18:06,036 --> 00:18:10,857 I parametri più ovvi sono certamente la larghezza e l'altezza dell'immagine in pixel. 250 00:18:10,857 --> 00:18:15,882 Purtroppo non è così semplice, perché la dimensione in pixel in sé non ci dice nulla riguardo ad 251 00:18:15,882 --> 00:18:22,016 altezza e larghezza del fotogramma, visto che il segnale broadcast non usa pixel quadrati. 252 00:18:22,016 --> 00:18:25,005 Mentre le righe verticali sono in numero fisso, 253 00:18:25,005 --> 00:18:29,021 i pixer orizzontali dipendono dalla larghezza di banda a disposizione. 254 00:18:29,021 --> 00:18:31,945 E quindi capita che le righe orizzontali siano costituite da pixel 255 00:18:31,945 --> 00:18:35,489 più stretti o più larghi di quanto siano alti. 256 00:18:35,489 --> 00:18:38,395 Generalmente negli standard si richiede che il video digitale 257 00:18:38,395 --> 00:18:41,902 conservi la risoluzione originale della fonte analogica, 258 00:18:41,902 --> 00:18:45,566 quindi è facile imbattersi in video digitali che usano pixel non quadrati. 259 00:18:45,566 --> 00:18:49,924 Per esempio, un DVD NTSC con rapporto d'aspetto 4:3 ha in realtà 260 00:18:49,924 --> 00:18:55,374 una risoluzione di 704 x 480 punti, ben più largo di 4:3. 261 00:18:55,374 --> 00:18:59,640 In questo caso, i pixel hanno un rapporto d'aspetto 10:11 e quindi sono più alti che larghi: 262 00:18:59,640 --> 00:19:04,553 l'effetto è di ridurre la larghezza dell'immagine per avere il rapporto d'aspetto 4:3. 263 00:19:04,553 --> 00:19:09,800 Un'immagine così dovrà essere corretta per essere mostrata correttamente sui display con pixel quadrati. 264 00:19:10,253 --> 00:19:15,287 Il secondo parametro è ovviamente il frame rate, il numero di fotogrammi al secondo. 265 00:19:15,287 --> 00:19:19,655 Nell'uso comune sono diffusi diversi frame rate standard e il video digitale, in qualche modo, 266 00:19:19,655 --> 00:19:23,689 può usarli un po' tutti, o anche altri fuori standard. Esistono perfino frame rate variabili 267 00:19:23,689 --> 00:19:27,113 in cui la velocità di aggiornamento varia lungo la durata del video. 268 00:19:27,113 --> 00:19:32,998 Con frame rate più elevati otteniamo movimenti più fluidi, e quindi niente interlacciamento. 269 00:19:32,998 --> 00:19:37,967 Nei primi tempi delle trasmissioni TV i tecnici cercavano il maggior frame rate possibile 270 00:19:37,967 --> 00:19:42,075 per avere movimenti fluidi e ridurre lo sfarfallio sui monitor CRT. 271 00:19:42,075 --> 00:19:45,277 Un'altra pressante richiesta era quella di usare la minor banda possibile 272 00:19:45,277 --> 00:19:48,182 mantenendo un'alta risoluzione ed un alto frame rate. 273 00:19:48,182 --> 00:19:51,208 La loro idea fu di creare la scansione interlacciata: con questa tecnologia 274 00:19:51,208 --> 00:19:54,826 le linee pari e le linee dispari venivano mandate in due passi successivi. 275 00:19:54,826 --> 00:19:59,961 Ogni passo fu chiamato semiquadro e due semiquadri costituivano all'incirca un fotogramma. 276 00:19:59,961 --> 00:20:05,319 Si, "all'incirca", perché i semiquadri pari e dispari non venivano mica dalla stessa immagine. 277 00:20:05,319 --> 00:20:10,797 In una trasmissione a 60 semiquadri al secondo, la sorgente è effettivamente ripresa 60 volte al secondo 278 00:20:10,797 --> 00:20:15,386 ma metà del fotogramma (le righe dispari o le righe pari) viene scartata, non serve. 279 00:20:15,386 --> 00:20:20,272 Ecco perché non si può ricostruire il fotogramma semplicemente ricombinando due semiquadri: 280 00:20:20,272 --> 00:20:23,039 essi non provengono dallo stesso fotogramma! 281 00:20:24,047 --> 00:20:29,683 La tecnologia a tubo catodico, o CRT, è stata l'unica per buona parte della storia del video. 282 00:20:29,683 --> 00:20:32,949 La luminosità di un vecchio CRT non era lineare, 283 00:20:32,949 --> 00:20:36,585 bensì legata alla tensione di controllo da un esponente di 2.5. 284 00:20:36,585 --> 00:20:43,821 Questo esponente si chiama gamma e da qui nasce l'espressione "correzione gamma di un display". 285 00:20:43,821 --> 00:20:50,493 Al contrario, la videocamera ha una luminosità lineare e collegandole direttamente un CRT si vedrebbe questo. 286 00:20:51,270 --> 00:20:56,637 Poiché in origine c'erano ben poche telecamere, tra l'altro costosissime, 287 00:20:56,637 --> 00:21:01,634 e parallelamente molte TV, che dovevano essere prodotte a costi contenuti, 288 00:21:01,634 --> 00:21:08,222 i tecnici decisero di applicare la correzione del gamma agli apparati di ripresa, invece che alle TV. 289 00:21:08,222 --> 00:21:13,062 Dunque il segnale video trasmesso via etere viaggiava con una luminosità che usava l'inverso 290 00:21:13,062 --> 00:21:18,271 dell'esponente gamma, così che, una volta giunto sul display, 291 00:21:18,271 --> 00:21:23,305 veniva ripristinato alla luminosità lineare originale. 292 00:21:23,777 --> 00:21:25,118 Beh, quasi. 293 00:21:30,393 --> 00:21:33,113 Ci sono ancora un paio di dettagli... 294 00:21:33,113 --> 00:21:40,442 Una telecamera televisiva in realtà usa un esponente gamma che risulta inverso di 2.2, non 2.5. 295 00:21:40,442 --> 00:21:43,754 È stato scelto questo valore per migliorare la visione negli ambienti oscuri. 296 00:21:43,754 --> 00:21:48,279 Inoltre la curva esponenziale diventa lineare in prossimità del nero: 297 00:21:48,279 --> 00:21:52,360 è un espediente per evitare il rumore dovuto alla sensibilità del sensore della videocamera. 298 00:21:54,941 --> 00:21:57,347 La correzione del gamma aveva però un effetto positivo: 299 00:21:57,347 --> 00:22:02,214 Si dà il caso che l'occhio umano abbia un gamma percettivo pari a 3, 300 00:22:02,214 --> 00:22:05,962 il che è molto, molto simile al gamma di un CRT di 2.5. 301 00:22:05,962 --> 00:22:10,607 Un'immagine che sfrutta la correzione gamma riserva maggior risoluzione alle basse intensità, 302 00:22:10,607 --> 00:22:14,336 di cui gli occhi possono apprezzare meglio i dettagli, 303 00:22:14,336 --> 00:22:18,222 e quindi usa il segnale visivo con maggiore efficienza. 304 00:22:18,222 --> 00:22:22,784 Sebbene i CRT siano ormai in estinzione, un normale monitor sRGB 305 00:22:22,784 --> 00:22:28,419 usa ancora una curva di intensità non lineare simile alla TV, con la rampa lineare nella zona del nero, 306 00:22:28,419 --> 00:22:32,491 seguita dalla zona esponenziale con esponente gamma di 2.4, 307 00:22:32,491 --> 00:22:36,636 il che gli permette di racchiudere una scala di valori che richiederebbe 16 bit in soli 8. 308 00:22:37,580 --> 00:22:41,790 L'occhio umano distingue tre colori principali: il rosso, il verde ed il blu. 309 00:22:41,790 --> 00:22:47,407 Molti display usano una combinazione additiva di questi tre colori per produrre tutti gli altri. 310 00:22:49,258 --> 00:22:54,190 I colori principali delle stampanti sono invece il ciano, il magenta ed il giallo ma l'idea di base è la stessa. 311 00:22:54,190 --> 00:22:59,381 questi pigmenti funzionano per via sottrattiva: ciascuno toglie un colore dalla luce riflessa. 312 00:22:59,381 --> 00:23:05,682 Il ciano toglie il rosso, il magenta toglie il verde ed il giallo toglie il blu. 313 00:23:05,682 --> 00:23:10,919 I video si possono rappresentare con le informazioni su rosso, verde e blu 314 00:23:10,919 --> 00:23:17,211 ma è una soluzione atipica. L'occhio umano è più sensibile alla luminosità che al colore 315 00:23:17,211 --> 00:23:21,329 e la codifica RGB distribuisce la luminosità dell'immagine sui tre canali colore. 316 00:23:21,329 --> 00:23:25,326 Voglio dire che il canale rosso appare come una versione rossa dell'originale, 317 00:23:25,326 --> 00:23:28,769 il canale verde come una versione verde dell'originale 318 00:23:28,769 --> 00:23:32,063 ed il canale blu come una versione blu dell'originale. 319 00:23:32,063 --> 00:23:35,705 Insomma, il bianco e nero moltiplicato per tre: no, non è efficiente. 320 00:23:35,706 --> 00:23:39,438 Per questo motivo e per lo strano caso che la TV è nata in bianco e nero, 321 00:23:39,438 --> 00:23:45,017 il video si rappresenta generalmente con un canale luma ad alta risoluzione, 322 00:23:45,017 --> 00:23:51,041 che poi è il bianco e nero, con l'aggiunta di altri canali croma a minore risoluzione, i colori. 323 00:23:51,041 --> 00:23:57,074 Il canale luma, detto Y, si ottiene tramite la somma pesata dei tre canali colore. 324 00:23:57,074 --> 00:24:01,867 I canali croma U e V sono quindi calcolati sottraendo il segnale luma dal blu 325 00:24:01,867 --> 00:24:04,070 e poi il luma dal rosso. 326 00:24:04,070 --> 00:24:11,750 La terna di valori YUV, elaborata per il video digitale, andrebbe chiamata più correttamente Y'CbCr 327 00:24:11,750 --> 00:24:15,238 ma la sua denominazione generica YUV è tuttavia molto usata 328 00:24:15,238 --> 00:24:18,301 in tutti gli ambiti, analogici e digitali. 329 00:24:18,912 --> 00:24:22,983 I canali croma U e V potrebbero usare la stessa risoluzione del canale luma Y 330 00:24:22,983 --> 00:24:28,674 ma, dato che l'occhio umano è meno sensibile alla distribuzione spaziale del colore, 331 00:24:28,674 --> 00:24:34,346 la risoluzione dei canali croma è generalmente ridotta a metà o anche un quarto, in orizzontale 332 00:24:34,346 --> 00:24:39,528 e/o in verticale, senza una perdita di qualità apprezzabile. 333 00:24:39,528 --> 00:24:43,942 Questa riduzione (subsampling) è stata applicata in ogni sua possibile variante 334 00:24:43,942 --> 00:24:46,875 ma le più comuni oggi sono 335 00:24:46,875 --> 00:24:51,187 4:4:4, che non subisce alcun subsampling, 336 00:24:51,187 --> 00:24:56,711 4:2:2, in cui la risoluzione orizzontale dei canali U e V è dimezzata, 337 00:24:56,711 --> 00:25:02,587 e 4:2:0, la più comune, in cui sia la risoluzione orizzontale sia quella verticale 338 00:25:02,587 --> 00:25:08,897 dei canali croma è dimezzata, col risultato di avere piani U e V di dimensione un quarto di quello Y. 339 00:25:08,897 --> 00:25:17,096 Usare le abbreviazioni 4:2:2, 4:2:0 o 4:1:1 o anche altre non descrive puntualmente i canali croma 340 00:25:17,096 --> 00:25:21,186 e il loro subsampling perchè ci sono molti modi di intercalare le informazioni rispetto al canale luma 341 00:25:21,186 --> 00:25:24,776 e, ancora una volta, molte varianti sono comunemente usate. 342 00:25:24,776 --> 00:25:32,502 Per esempio il motion JPEG, il video MPEG-1, il video MPEG-2, DV, Theora e WebM usano 343 00:25:32,502 --> 00:25:38,317 o possono usare il subsampling 4:2:0 ma piazzano i pixel dei canali croma in modi diversi. 344 00:25:38,317 --> 00:25:43,023 Le codifiche motion JPEG, video MPEG-1, Theora e WebM piazzano i pixel croma 345 00:25:43,023 --> 00:25:46,345 tra i pixel luma in orizzontale e in verticale. 346 00:25:46,345 --> 00:25:51,989 L'MPEG-2 inserisce i pixel croma tra due linee, allineandoli orizzontalmente coi pixel luma. 347 00:25:51,989 --> 00:25:57,106 La modalità interlacciata complica le cose, portando a strategie di piazzamento un po' strane. 348 00:25:57,106 --> 00:26:00,909 Infine c'è il PAL-DV, che è sempre interlacciato, che inserisce i pixel croma 349 00:26:00,909 --> 00:26:04,398 nelle stesse posizioni dei pixel luma in orizzontale 350 00:26:04,398 --> 00:26:07,303 ma verticalmente alterna i canali croma, riga per riga. 351 00:26:07,683 --> 00:26:12,282 E questo è sono il video 4:2:0. Potete scoprire da soli gli altri subsampling. 352 00:26:12,282 --> 00:26:14,882 Una volta compresa l'idea di base... Beh, passiamo ad altro. 353 00:26:15,511 --> 00:26:21,128 Nei file audio a più canali abbiamo inserito i campionamenti di ciascuno di essi in ordine. 354 00:26:21,128 --> 00:26:26,383 I file video usano sia formati a pacchetti, che alternano i canali colore, 355 00:26:26,383 --> 00:26:30,584 sia formati planari che racchiudono i pixel in diversi piani da sovrapporre 356 00:26:30,584 --> 00:26:35,415 per realizzare l'intero fotogramma. Queste due tipologie raggruppano in realtà più di 50 formati 357 00:26:35,415 --> 00:26:41,549 con più di una dozzina di uso comune. Ogni combinazione di subsampling croma e profondità di colore 358 00:26:41,549 --> 00:26:46,574 porta con sé una organizzazione particolare, un nuovo formato di pixel. Per ciascun subsampling 359 00:26:46,574 --> 00:26:50,858 ci sono poi varianti che si differenziano banalmente per l'ordine dei canali 360 00:26:50,858 --> 00:26:55,966 o un impacchettamento dei dati un po' diverso perché fu utile in una particolare piattaforma 361 00:26:55,966 --> 00:27:00,352 e talvolta perfino per semplice puntiglio. 362 00:27:00,352 --> 00:27:04,692 I diversi formati di pixel si indicano con un nome unico detto codice FOURCC, 363 00:27:04,692 --> 00:27:08,115 ne esistono numerosi ma non avrebbe senso fermarsi a descriverli tutti. 364 00:27:08,115 --> 00:27:13,704 Google può darvi una mano ma attenti: per il video grezzo il codice FOURCC vi indica solo l'organizzazione 365 00:27:13,704 --> 00:27:20,339 dei pixel ed il subsampling croma, ma nulla su dove stanno le informazioni, né sugli spazi colore. 366 00:27:20,339 --> 00:27:25,807 Il video YV12, ad esempio, può piazzare le informazioni croma secondo le regole JPEG, MPEG-2 o DV 367 00:27:25,807 --> 00:27:28,991 o anche secondo altre specifiche degli spazi colore YUV. 368 00:27:29,472 --> 00:27:33,913 Questo sintetizza un po' il nostro breve (ed incompleto) viaggio nel video grezzo. 369 00:27:33,913 --> 00:27:38,651 La buona notizia è che tutto questo basta per fare già un sacco di cose. 370 00:27:38,651 --> 00:27:42,528 In moltissime situazioni un fotogramma di dati video è solo un fotogramma di dati video. 371 00:27:42,528 --> 00:27:46,451 I dettagli diventano rilevanti quando parliamo di scrivere software ma per adesso 372 00:27:46,452 --> 00:27:52,086 sono lieto di aver dato ai cordiali spettatori una ampia panoramica dei concetti più importanti. 373 00:27:52,336 --> 00:27:55,536 Formati contenitori (e tutto il resto) 374 00:27:55,640 --> 00:27:59,230 Quindi, abbiamo dati audio ed abbiamo dati video. 375 00:27:59,230 --> 00:28:03,246 Ci resta da conoscere la parte più familiare ma non legata ai segnali, una parte di tecnologia 376 00:28:03,246 --> 00:28:07,410 che gli sviluppatori conoscono bene. E ce n'è in abbondanza! 377 00:28:07,928 --> 00:28:11,768 I blocchi di dati audio e video non hanno strutture esterne a contenerli 378 00:28:11,768 --> 00:28:15,173 ma spesso mostrano una dimensione uniforme. Potremmo concatenarli insieme 379 00:28:15,173 --> 00:28:18,097 secondo un ordine ben definito, anche se rigido, per conservarli o mandarli in streaming 380 00:28:18,097 --> 00:28:21,040 e ci sono soluzioni che effettivamente lavorano così. 381 00:28:21,040 --> 00:28:24,195 Tuttavia i frame compressi non sempre hanno una dimensione prevedibile 382 00:28:24,195 --> 00:28:29,405 e per i nostri scopi sarebbe preferibile una certa flessibilità nei formati da stipare in un flusso dati. 383 00:28:29,405 --> 00:28:34,281 Concatenando a casaccio dati di cui non conosciamo la dimensione, perdiamo i confini che separano i pacchetti 384 00:28:34,281 --> 00:28:37,871 finendo col non riconoscere da quale stream provengono certi dati. 385 00:28:37,871 --> 00:28:42,192 Una sequenza audio video deve avere una certa struttura per rimanere utilizzabile. 386 00:28:42,192 --> 00:28:46,606 In aggiunta ai nostri dati, c'è bisogno anche dei parametri per l'audio PCM e per il video, 387 00:28:46,606 --> 00:28:49,752 e probabilmente molti altri metadati che vogliamo far viaggiare insieme allo stream, 388 00:28:49,752 --> 00:28:55,415 come etichette per l'audio o capitoli e sottotitoli per il video, per una visione più confortevole. 389 00:28:55,415 --> 00:29:01,633 Ha dunque senso inserire i metadati (dati che riguardano i dati) nello stesso mezzo che viaggia. 390 00:29:01,633 --> 00:29:06,445 Conservare ed organizzare dati informi e vari metadati è il compito del contenitore. 391 00:29:06,445 --> 00:29:09,221 I contenitori organizzano i blocchi di dati, 392 00:29:09,221 --> 00:29:12,015 alternano ed identificano gli stream multipli, 393 00:29:12,015 --> 00:29:15,337 conservano le temporizzazioni e tutti i metadati importanti 394 00:29:15,337 --> 00:29:19,140 per interpretare, scorrere, manipolare e presentare i contenuti multimediali. 395 00:29:19,140 --> 00:29:22,222 In generale, ogni contenitore gestisce qualsiasi tipo di dati 396 00:29:22,222 --> 00:29:24,970 e ogni tipo di dato può finire in ogni tipo di contenitore. 397 00:29:25,720 --> 00:29:28,520 In conclusione... 398 00:29:28,801 --> 00:29:32,391 In questi trenta minuti abbiamo presentato audio e video digitali, 399 00:29:32,391 --> 00:29:35,435 visto un po' di storia, un po' di matematica e di ingegneria, 400 00:29:35,435 --> 00:29:39,377 ma abbiamo appena grattato in superficie ed è già il momento di fermarci. 401 00:29:41,107 --> 00:29:45,373 C'è davvero tanto altro di cui parlare, quindi spero vogliate seguirmi anche nel prossimo episodio. 402 00:29:45,373 --> 00:29:47,159 Fino ad allora... alla salute!