· 

Obergrenze für YouTube-Videos?

1. Einführung

In meinem Video mit dem Thema Mit YouTube in die Zukunft sehen habe ich die zufällige 11-stellige Video-ID dieses YouTube-Videos hier vorhergesehen. Wenn du dir die Zeitpunkte der Veröffentlichung anschaust, dann wirst du feststellen, dass dieses Video hier erst nach dem anderen veröffentlicht wurde. Die Chance, die Video-ID - wenn sie denn wirklich zufällig ist - vorherzusehen, liegt bei \(1\) zu \(64^{11}\). Es ist über 500 Milliarden mal wahrscheinlicher, dass ich im Lotto gewinne.
Sollte ich also Lotto spielen? Nein, der Trick ist, dass YouTube seinen Creatorn erlaubt, Videos privat hochzuladen und erst zu einem bestimmten Zeitpunkt in der Zukunft zu veröffentlichen. Beim "Veröffentlichen" sieht der Zuschauer dann nicht das tatsächliche Upload-Datum, sondern das Veröffentlichungsdatum. Die Video-ID bzw. die URL zum Abruf des Videos wird aber in dem Moment vergeben, in dem man das Video hochlädt. Ich habe also zuerst dieses Video hochgeladen, es dann privat gestellt, die Video-ID in das andere Video kopiert, das andere Video veröffentlicht und dann dieses hier veröffentlicht. So gesehen wäre es vielleicht sinnvoll, neben dem Veröffentlichungsdatum für den Benutzer sichtbar auch das Upload-Datum zu dokumentieren, um noch mehr Transparenz zu schaffen.

2. Berechnung der Anzahl möglicher URLs

Um diesem Video doch noch zu einem wissenstechnischen Mehrwert zu verhelfen, überlegen wir uns noch einmal kurz, warum es gerade bis zu \(64^{11}\) verschiedene Videos auf YouTube geben kann. Jedes YouTube-Video erhält eine einzigartige Video-ID. Diese wird genutzt, um ein bestimmtes Video über die URL aufzurufen. "v=" ist ein sogenannter Übergabeparameter. Der Wert dieses Parameters, den man in PHP mit $_GET abgreifen kann, ist eine 11-stellige Zeichenkette.
Du kennst aus anderen meiner Videos bereits das Dezimalsystem zur Basis \(10\), das Binärsystem zur Basis \(2\) und das Hexadezimalsystem zur Basis \(16\). Die Video-IDs sind letztendlich auch Zahlen, nämlich Zahlen zur Basis \(64\). Kann ein Computer überhaupt damit rechnen? Ja, weil es sich hierbei um eine Zweierpotenz, nämlich \(2^{6}\) handelt. Beim Hexadezimalsystem sind uns damals die Ziffern ausgegangen, da bei der Ziffer \(10\) die Verwechslungsgefahr mit der Zahl \(10\) im Hexadezimalsystem bestand. Deshalb haben wir hierbei auf die Kleinbuchstaben \(a\) bis \(f\) zurückgegriffen. Beim Zahlensystem zur Basis \(64\) (auch Base64 genannt), werden als Ziffern \(0-9\), \(a-z\), \(A-Z\) und zwei Sonderzeichen (bei YouTube "-" und "_") verwendet. Somit sind für jede der \(11\) Stellen \(64\) verschiedene Werte möglich, was in Summe $$ \underbrace{64\cdot 64\cdot ...\cdot 64}_{11\times} $$ ergibt. Das ist eine unvorstellbar große Zahl, nämlich insgesamt $$ 73.786.976.294.838.206.464 $$ (dreiundsiebzig Trillionen siebenhundertsechsundachtzig Billiarden neunhundertsechsundsiebzig Billionen zweihundertvierundneunzig Milliarden achthundertachtunddreißig Millionen zweihundertsechstausendvierhundertvierundsechzig) Videos. Das ist die Obergrenze an YouTube-Videos, wenn YouTube sich dazu entscheiden sollte, bei \(11\) Stellen für die Video-IDs zu bleiben.
Selbstverständlich müssen wir davon IDs wie "0123456789a" und solche, die ein "echtes Wort" enthalten, abziehen. Es ist nämlich unwahrscheinlich, dass YouTube aufgrund der Vorhersagbarkeit solche Video-IDs erlaubt. Das wären dann aber (im Vergleich zur Gesamtheit) so wenige IDs, dass wir sie an dieser Stelle ignorieren. Das Problem mit der Vorhersagbarkeit von Video-IDs löst YouTube dadurch, dass tatsächlich zufällige (bzw. pseudo-zufällige) IDs vergeben werden. Würde man einen inkrementellen Zähler verwenden (der bspw. bei \(1\) startet und der bei \(73.786.976.294.838.206.464\) aufhört, dann könnte man jedes Video (auch solche, die eigentlich "nicht gelistet" sein sollten) aufrufen, indem man auf die aktuelle Video-ID eins draufaddiert oder eins subtrahiert.