IT-Sicherheit und Zufallszahlengeneratoren – II

Im Jahr 2013 hatte ich einen Artikel zur Bedeutung von Zufallszahlen-Generatoren geschrieben. Vor kurzem habe ich dazu eine Mailkommunikation mit einem interessierten Leser führen dürfen, der sich selbst mit hardware-basierten Zufallszahlengeneratoren für IT-Systeme befasst. Dadurch wurde ich motiviert, dieses Thema mal wieder aufzugreifen.

Wir hatten im Artikel
IT-Sicherheit und Zufallszahlengeneratoren – I
festgestellt, dass die Qualität von Zufallszahlen als Element von Sicherheitsverfahren im Besonderen dann größte Bedeutung zukommt, wenn der Algorithmus von Sicherheitsverfahren bekannt ist. Dies gilt typischerweise für Open Source Programme, ist aber auch für viele technische Krypto-Verfahren von Bedeutung.

Ein Beispiel liefert etwa SSL/TLS. Zufallszahlengeneratoren müssen hier qualitativ hochwertige und nicht vorhersagbare statistische Element einstreuen. Dies ist einer der Gründe dafür, warum im Bereich der Herstellung von Software, die gezielt SSL/TLS-basierte Krypto- und Sicherheitsverfahren nutzt, hochwertige SW-Bibliotheken für die Generierung von Zufallszahlen zum Einsatz kommen. OpenSSL-Bibliotheken wären aber auch für Entwickler gewöhnlicher SW- und Web-Anwendungen von großem Interesse.

So würde man sich z.B. als Web-Entwickler freuen, wenn man derartige Bibliotheken auch im Rahmen von Webhosting-Angeboten deutscher Provider nutzen könnte. Mindestens im Jahr 2013 war das aber im Rahmen der Hosting-Angebote der marktdominanten Unternehmen (für Web-Hosting mit PHP-Unterstützung) nach eigener Recherche nicht der Fall.

Dieser Artikel beleuchtet ein wenig die Frage: Warum stellt dieser Zustand ein Problem dar? Wir erläutern dies am Beispiel der Entwicklung von Web-Anwendungen unter PHP. Zur Vertiefung für interessierte Leser verweisen wir unten explizit auf eine Website, die sich der Sicherheit unter PHP widmet, die aber auch für Nutzer anderer Programmiersprachen wie Java und interessierte Anwender von Web-Applikationen von Interesse sein dürfte.

Defizite von PRNGen in der Web-Programmierung am Beispiel PHP

Viele Web-2.0-Applikation beruhen auf der Programmiersprache PHP. Das betrifft u.a. Foren, Blogs, Gästebücher, Diskussionsplattformen, Bug-Tracker, etc.. PHP eignet sich daher gut als Beispiel für die Diskussion der Schwächen von PRNG-Bibliotheken.

Viele der genannten Verfahren setzen im Rahmen von Anmeldungen und/oder der Absendung von Beiträgen sog. Captcha-Verfahren mit zufällig generierten Zahlen und/oder Textsequenzen/Aufgaben ein, um Spammer abzublocken. Nun sind Entwickler meist bequeme Menschen - und setzen daher auf Software-PRNGs, die die PHP-Standardbibkliotheken anbieten.

Lassen sich darauf ohne weitere Zusatzmaßnahmen sichere Verfahren aufbauen? Die Antwort ist eindeutig: Nein!

Für PHP-Kundige aber auch andere Mitmenschen, die sich für die Sicherheit von Web-Applikationen interessieren, möchte ich in diesem Zusammenhang explizit den sehr guten und hinreichend tiefgehenden Artikel

 
(wie auch andere ergänzende Artikel der Website

 
empfehlen. Der genannte Artikel zeigt Einsatzgebiete von SW-PRNGen auf, er analysiert das Thema "unzureichende Entropie der Zufallszahlenverteilung" und leitet daraus einige wirksame Angriffsverfahren ab.

Ausgeführt wird dankenswerterweise auch, dass ein Mix von (deterministischen) mathematischen Konversionen (wie etwa Hashing) oder die Kombination mehrere PRNGs überhaupt nichts nutzt, um unzureichende Entropie zu kompensieren. Schon gar nicht im Fall von Open Source-Software ....

Im Gegensatz zur Meinung von etlichen Entwicklern macht der Artikel auch darauf aufmerksam, dass Verfahren, die auf dem bekannten "Mersenne Twister"-Algorithmus aufbauen (wie mt_rand()), ohne hinreichende Qualität und "Entropie" von Seeds keineswegs als sicher gelten können. Als Konsequenz fordert der Artikel u.a zwingend den zusätzlichen Einsatz von hochwertigen OpenSSL-Erweiterungen oder anderen Quellen hoher Entropie für die Zufallszahlen-Generierung.

Nun ist es leider aber so,

  1. dass die OpenSSL auf dem Ziel-Webserver der PHP-Web-Anwendung installiert sein muss
  2. und das die PHP-Module gegen die SSL-Bibliotheken compiliert und gelinkt sein müssen.

Das ist in den wenigsten Webhosting-Angeboten der Fall. Evtl. auch aus rechtlichen Gründen. So ist man als Entwickler von hochsicheren Lösungen eigentlich fast immer darauf angewiesen, mit eigenen Servern (oder gehosteten Root-Servern) zu arbeiten.

Wir lernen aus dem obigen Artikel jedenfalls, dass Software, die ihre Sicherheitsverfahren auf PRNGen ohne hinreichende Qualität (= "hohe Entropie") von Zufallselementen (Seeds) aufbaut, mathematisch kundigen Angreifern Tor und Tür öffnen kann. Das gilt natürlich nicht nur für die Sprache PHP, sondern auch andere web-relevante Sprachen wie etwa Java oder Ruby.

Sie glauben dennoch, das Thema sei so speziell, dass es in der täglichen Praxis wohl keine Rolle spielen dürfte?

Ein Beispiel aus der Praxis

Wir mussten selber im Rahmen der Implementierung einer Website für einen Kunden, in die ein beliebtes OpenSource Gäste-Buch (auf PHP-Basis) integriert war, erfahren, wie angreifbar PRNG-basierte Sicherheits-Verfahren sein können.

Das Gästebuch nutzte Captcha-Verfahren im Rahmen des Absendens von Beiträgen. Der User musste zufällig generierte und grafisch verzerrt dargestellte Zahlensequenzen beim Abschicken eines Beitrags in ein Formularfeld eingeben. Leider mussten wir feststellen, dass nach einer Weile das Spam-Aufkommen so zunahm, dass wir selbst mit zusätzlichen Text- und Ausdrucksfiltern der Flut nicht mehr Herr werden konnten. Wir hatten es mit einem typischen Fall eines erfolgreichen Angriffs auf die Schwäche von PHP-PRNGen (gemäß eines der Muster aus dem oben genannten Artikel) zu tun.

Wir haben deshalb den Code des Gästebuchs analysiert und letztlich festgestellt, dass die Captcha-Sequenzen nach einer statistischen Analyse tatsächlich vorhersagbar waren. Hierzu reichte eine überschaubare Anzahl von ca. (maximal) 60 Millionen Versuchen zur Seed-Sequenz-Prüfung. Die Analyse ließ sich locker in kürzester Zeit auf einem Laptop bewerkstelligen.

Ein typischer Fall von unzureichender Entropie. Wir änderten das Captcha-Verfahren dann selbst ab - und zwar

  • erstens mit Methoden, die dem Angreifer unbekannt waren
  • und zweitens mit eine Quelle für Seeds hoher Entropie.

Und siehe da: die Anzahl durchkommender Spams ging massiv zurück und hielt sich im Rahmen von Zufallstreffern im Promille-Bereich der Versuche.

Besonders lustig fanden wir, dass wir nach einer Weile tatsächlich auch noch eine Reaktion eines frustrierten Spammers im Rahmen abgewiesener, aber in einem Log-Bereich gespeicherten Beitragsversuches erhielten: Der Autor stellte eingerahmt in eine Reihe von Vulgärausdrücken fest, dass wir das Captcha-Verfahren wohl modifiziert hätten. Er glaube aber immer noch an das Potential seiner statistischen Analysen und würde das geänderte Verfahren früher oder später doch knacken. Er habe gerade nur keine Zeit ...

Hier sieht man mal, mit welchen Methoden in der Spammer-Szene gearbeitet wird.

Nun hatten wir den Vorteil, 2 Maßnahmen kombinieren zu können, von denen eine dem Prinzip von Open Source direkt zuwider lief. Ein Open Source Entwickler muss hingegen vollständig auf hohe Entropie von eingesetzten Zufallszahlen setzen.

OpenSSL unter UNIX/Linux als betroffenes Beispiel unzureichender Seed-Qualität

Trotz der Empfehlungen des oben erwähnten Artikels, der die Flankierung von PHP Software-PRNGen durch OpenSSL-Zufallsgeneratoren für Seeds empfiehlt, kann man mal die Frage stellen:

Wie sicher ist eigentlich OpenSSL selbst im Praxiseinsatz? Diese Frage ist deshalb von Bedeutung, weil es hier um den Kern sicherer Kommunikation mit Webseiten im Internet geht.

Für eine kritische Haltung muss man gar nicht mal auf den Heartbleed-Bug zurückgreifen oder gar Backdoors im (RSA-) Algorithmus vermuten:

 

Ein sehr schöner Artikel zu den diesjährig bekannt gewordenen grundlegenden Schwächen ist folgender:

 

Nach Meinung von Fachleuten führ(t)en aber schon sehr viel trivialere Umstände in der Praxis zu erheblichen OpenSSL-Schwächen. Folgender Artikel zeigt, dass auch die Entropie von OpenSSL unter bestimmten Umständen durch eine falsche Wahl von Seeds selbst wieder zu gering werden kann:

Auch der OpenSSL-Generator muss mit Seeds hinreichender Qualität versehen werden. Prozess IDs als Zusatz-Seed, auf die zumindest frühere OpenSSL-Implementierungen unter UNIX/Linux zurückgriffen, erweisen sich in diesem Zusammenhang interessanterweise und überraschenderweise als untauglich.

Dieses Beispiel zeigt, wie intrikat und kompliziert das Zusammenspiel von PRNG-Algorithmen und statistischen Seeds in einem konkreten Betriebssystem-Umfeld werden kann. Nicht gerade beruhigend? Der folgende Artikel befasst sich auch mit der damaligen OpenSSL-Schwäche und vertritt - wie ich - die Meinung, dass gerade wegen solcher Probleme Open Source wichtig ist:

 

Genug für heute. In einem weiteren Beitrag

IT-Sicherheit und Zufallszahlengeneratoren – III

werfen wir einen Blick auf einige weitere sicherheitsrelevante Verfahren, die eine hohe Qualität von Zufallszahlen erfordern.

Philosophische Fragen

Wie schon im letzten Blog-Artikel zu diesem Thema lassen wir den Leser mit ein paar "philosophischen" Fragen zurück:

Gehört es nicht zur Aufgabe einer modernen Staatsverwaltung, der heutigen Informationsgesellschaft, die den Staat trägt, einen (Web-) Service anzubieten, über den Entwickler und die Wirtschaft bei Bedarf kostenfrei ganze (verschlüsselte) Dateien mit hochwertigen Zufallszahlen abrufen können? Wäre ein solches Angebot nicht im nationalen Interesse? Eine Institution für ein solches öffentliches Angebot wäre in Deutschland etwa das BSI.
 
Natürlich fallen einem sofort zwei Fragen ein, die kritische Zeitgenossen aus zwei unterschiedlichen Perspektiven zu einem solchen Angebot stellen könnten:

  • Kann man einer solchen (staatlichen) Quelle von Zufallszahlen trauen? Unter welchen Voraussetzungen?
  • Kann dieses Angebot nicht auf von bösen Zeitgenossen genutzt - besser: missbraucht - werden? Wie sähe die Nutzen/Schadens-Bilanz aus?

Viel Spaß beim Nachdenken!

Die Kommentarfunktion ist geschlossen.