XSS – ein kleiner Fehler bei der Produktivierung von Web-SW kann schwere Folgen haben …

Letzte Woche war ich damit beschäftigt, das Hacking einer PHP-basierten Website nachzuvollziehen. Die Analyse ergab gleich mehrere Fehler, die sich in Kombination zu einem massiven Problem auswuchsen:

  1. Eine zentrale Datei, die das Umschreiben von gewöhnlichen Web-Adressen auf PHP-Skripts vornahm und schon seit ca. über einem Jahr ohne Probleme im Einsatz war, war kürzlich an einigen Stellen modifiziert worden. In der Testphase war diese Datei "auf die Schnelle" leider mit Statements versehen worden, die Adress-Anteile ungefiltert über PHP-"echo"-Kommandos ausgab. Im Produktivierungsprozess wurde dann "in der Hektik" vergessen, diese Statements vollständig zu deaktivieren. Jeder, der sich ein wenig mit PHP und Sicherheit auskennt, weiß, dass solche Kommandos das primäre Einfallstor für XSS-Angriffe darstellen.
  2. In den Tests vor der Produktivsetzung wurde zwar verifiziert, dass die Website mit all ihren Links korrekt lief. Der geänderte Rewrite-Prozess für Adressen wurde somit positiv bestätigt. Leider wurden Negativtests für bestimmte Typen von fehlerhaften Adresseingaben bzw. Adresseingaben zu nicht vorhandenen Seiten nicht im notwendigen Umfang durchgeführt. Solche Tests hätten schnell und deutlich gezeigt, dass manipulierte Eingaben und z.T. auch erratische Eingaben zu fehlenden Seiten ungefilterte Programm-Ausgaben zeitigten. So fiel das aber leider gar nicht auf.
  3. Durch Einschleusen von Javascript-Code konnte von Angreifern die DOM-Ebene manipuliert werden. Das ließ sich relativ leicht nachstellen. Allein dieser Punkt eröffnete bereits ein großes Schadenspotential. Als schlimmer erwies sich aber die durch XSS eröffnete Möglichkeit zum Auslesen von Session-Cookies. Dadurch stand einer Session-Übernahme nur noch wenig entgegen. Als besonders schlimm stellte sich das für Sessions heraus, in denen ein Zugriff auf eine ältere PhpMyAdmin-Installation stattfand. Leider war das Programm wegen fehlender SSL-Zertifikate in der gleichen Web-Domäne untergebracht worden. Hier war am falschen Ende gespart worden: Das Gemeine ist, dass sich eine "Sicherheits"-Überlegung - nämlich die notwendige Verschlüsselung von Transaktionen zur Datenbank-Pflege - im hier beschriebenen Angriffsszenario als Bumerang erwies.
  4. Interessanterweise nutzten die Angreifer die Sessionübernahme nicht direkt zur Manipulation der Datenbankinhalte. Die ältere PHP-Version wies nämlich auch noch eine Verwundbarkeit nach CVE-2017-9841 auf: Ein standardmäßig mit ausgeliefertes PHP-Programm eines Vendors beinhaltete einen eval()-Aufruf. Dadurch wurde dann die Ausführung von relativ beliebigem PHP-Code ermöglicht.
  5. Für die Website wurde keine TLS/SSL-Verschlüsselung erzwungen.

Im Endeffekt war durch die Kombination der obigen Punkte das Tor zu einem Hacker-Paradies geöffnet wurde; missbraucht wurde die Site denn auch prompt von Angreifern mit IP-Adressen in Albanien, Bulgarien, Rumänien, USA.

Was lernt man aus diesem Szenario?

Der Ablauf ist geradezu klassisch: Hastiges Arbeiten und Unaufmerksamkeiten eines Entwicklers reißen in der Konsequenz ein großes Loch in den Betrieb einer Website.

Worin lag im Ablauf aber der eigentliche Fehler? Dass beim schnellen Coding ein sauberes Exception-Handling mal umgangen wird, ist eine Sache. Ein PHP-Code mit echo-Befehlen, die eine ungefilterte Ausgabe auch nur fragmentierter Teile irgend eines Inputs liefern, darf aber keine QS passieren.

Hier meine ich einerseits ein Code-Review samt Scannen des Codes auf print oder echo-Befehle. Ich meine andererseits aber auch den Testansatz: Wenn man einem Rewrite-Programm für Adressen arbeitet, sollte man natürlich unbedingt das Verhalten für ungewöhnlichen Adress-Input testen. Ferner hätte eine Überwachung der Log-Protokolle einen Missbrauch eher entdecken lassen, als es dann de facto geschehen ist (nämlich durch den Hosting-Provider).

Ein weiterer Fehler liegt natürlich in der alten Version von PhpMyAdmin - hierfür hätten die herausgegebenen Warnungen CVEs, etc. verfolgt werden müssen. Das Risiko, dass mit der Positionierung dieser SW in derselben Domäne im Fall eines XSS-Angriffs verbunden war, war unterschätzt worden.

Eine interessante Frage im Rahmen dieses Blogs ist nun:
Hätte hier ein ISMS nach der ISO /IEC 27000 geholfen?

Ich meine schon. Im Rahmen der Risko-Analyse und Risiko-Bewertung hätte das Thema Web-Anwendungen und zugrunde liegende Programme sicher eine Rolle gespielt. Die Problematik von XSS-Angriffen hätte dort (u.a.) untersucht werden müssen. Als Maßnahme zur Risikobehandlung wären dann mit hoher Wahrscheinlichkeit die hier unterlassenen Schritte als Teil eines einzuhaltenden "Produktivierungsplans" definiert worden. Betroffen sind im hier gegebenen Kontext gleich eine ganze Reihe von in der Praxis obligatorischen Maßnahmen-Vorgaben des Anhangs zur Norm ISO/IEC 270001: Zu nennen sind die Maßnahmen A10.1, A10.3, A10.9, A10.10. Relevant sind ferner A11.5, A12 (bes. A12.2.4, A12.4, A12.5, A12.6), A15.2, A15.3.

Ich will gar nicht auf Details der Punkte eingehen. Man ist aber immer wieder erstaunt, wie gut eigentlich der Maßnahmenkatalog der Norm bei geeigneter Umsetzung helfen würde, Szenarien wie das oben beschriebene zu vermeiden.

IT-Sicherheit und Zufallszahlengeneratoren – II

Im Jahr 2013 hatte ich einen Artikel zur Bedeutung von Zufallszahlen-Generatoren geschrieben. Vor kurzem habe ich dazu eine Mailkommunikation mit einem interessierten Leser führen dürfen, der sich selbst mit hardware-basierten Zufallszahlengeneratoren für IT-Systeme befasst. Dadurch wurde ich motiviert, dieses Thema mal wieder aufzugreifen.

Wir hatten im Artikel
IT-Sicherheit und Zufallszahlengeneratoren – I
festgestellt, dass die Qualität von Zufallszahlen als Element von Sicherheitsverfahren im Besonderen dann größte Bedeutung zukommt, wenn der Algorithmus von Sicherheitsverfahren bekannt ist. Dies gilt typischerweise für Open Source Programme, ist aber auch für viele technische Krypto-Verfahren von Bedeutung.

Ein Beispiel liefert etwa SSL/TLS. Zufallszahlengeneratoren müssen hier qualitativ hochwertige und nicht vorhersagbare statistische Element einstreuen. Dies ist einer der Gründe dafür, warum im Bereich der Herstellung von Software, die gezielt SSL/TLS-basierte Krypto- und Sicherheitsverfahren nutzt, hochwertige SW-Bibliotheken für die Generierung von Zufallszahlen zum Einsatz kommen. OpenSSL-Bibliotheken wären aber auch für Entwickler gewöhnlicher SW- und Web-Anwendungen von großem Interesse.

So würde man sich z.B. als Web-Entwickler freuen, wenn man derartige Bibliotheken auch im Rahmen von Webhosting-Angeboten deutscher Provider nutzen könnte. Mindestens im Jahr 2013 war das aber im Rahmen der Hosting-Angebote der marktdominanten Unternehmen (für Web-Hosting mit PHP-Unterstützung) nach eigener Recherche nicht der Fall.

Dieser Artikel beleuchtet ein wenig die Frage: Warum stellt dieser Zustand ein Problem dar? Wir erläutern dies am Beispiel der Entwicklung von Web-Anwendungen unter PHP. Zur Vertiefung für interessierte Leser verweisen wir unten explizit auf eine Website, die sich der Sicherheit unter PHP widmet, die aber auch für Nutzer anderer Programmiersprachen wie Java und interessierte Anwender von Web-Applikationen von Interesse sein dürfte.

Defizite von PRNGen in der Web-Programmierung am Beispiel PHP

Viele Web-2.0-Applikation beruhen auf der Programmiersprache PHP. Das betrifft u.a. Foren, Blogs, Gästebücher, Diskussionsplattformen, Bug-Tracker, etc.. PHP eignet sich daher gut als Beispiel für die Diskussion der Schwächen von PRNG-Bibliotheken.

Viele der genannten Verfahren setzen im Rahmen von Anmeldungen und/oder der Absendung von Beiträgen sog. Captcha-Verfahren mit zufällig generierten Zahlen und/oder Textsequenzen/Aufgaben ein, um Spammer abzublocken. Nun sind Entwickler meist bequeme Menschen - und setzen daher auf Software-PRNGs, die die PHP-Standardbibkliotheken anbieten.

Lassen sich darauf ohne weitere Zusatzmaßnahmen sichere Verfahren aufbauen? Die Antwort ist eindeutig: Nein!

Für PHP-Kundige aber auch andere Mitmenschen, die sich für die Sicherheit von Web-Applikationen interessieren, möchte ich in diesem Zusammenhang explizit den sehr guten und hinreichend tiefgehenden Artikel

 
(wie auch andere ergänzende Artikel der Website

 
empfehlen. Der genannte Artikel zeigt Einsatzgebiete von SW-PRNGen auf, er analysiert das Thema "unzureichende Entropie der Zufallszahlenverteilung" und leitet daraus einige wirksame Angriffsverfahren ab.

Ausgeführt wird dankenswerterweise auch, dass ein Mix von (deterministischen) mathematischen Konversionen (wie etwa Hashing) oder die Kombination mehrere PRNGs überhaupt nichts nutzt, um unzureichende Entropie zu kompensieren. Schon gar nicht im Fall von Open Source-Software ....

Im Gegensatz zur Meinung von etlichen Entwicklern macht der Artikel auch darauf aufmerksam, dass Verfahren, die auf dem bekannten "Mersenne Twister"-Algorithmus aufbauen (wie mt_rand()), ohne hinreichende Qualität und "Entropie" von Seeds keineswegs als sicher gelten können. Als Konsequenz fordert der Artikel u.a zwingend den zusätzlichen Einsatz von hochwertigen OpenSSL-Erweiterungen oder anderen Quellen hoher Entropie für die Zufallszahlen-Generierung.

Nun ist es leider aber so,

  1. dass die OpenSSL auf dem Ziel-Webserver der PHP-Web-Anwendung installiert sein muss
  2. und das die PHP-Module gegen die SSL-Bibliotheken compiliert und gelinkt sein müssen.

Das ist in den wenigsten Webhosting-Angeboten der Fall. Evtl. auch aus rechtlichen Gründen. So ist man als Entwickler von hochsicheren Lösungen eigentlich fast immer darauf angewiesen, mit eigenen Servern (oder gehosteten Root-Servern) zu arbeiten.

Wir lernen aus dem obigen Artikel jedenfalls, dass Software, die ihre Sicherheitsverfahren auf PRNGen ohne hinreichende Qualität (= "hohe Entropie") von Zufallselementen (Seeds) aufbaut, mathematisch kundigen Angreifern Tor und Tür öffnen kann. Das gilt natürlich nicht nur für die Sprache PHP, sondern auch andere web-relevante Sprachen wie etwa Java oder Ruby.

Sie glauben dennoch, das Thema sei so speziell, dass es in der täglichen Praxis wohl keine Rolle spielen dürfte?

Ein Beispiel aus der Praxis

Wir mussten selber im Rahmen der Implementierung einer Website für einen Kunden, in die ein beliebtes OpenSource Gäste-Buch (auf PHP-Basis) integriert war, erfahren, wie angreifbar PRNG-basierte Sicherheits-Verfahren sein können.

Das Gästebuch nutzte Captcha-Verfahren im Rahmen des Absendens von Beiträgen. Der User musste zufällig generierte und grafisch verzerrt dargestellte Zahlensequenzen beim Abschicken eines Beitrags in ein Formularfeld eingeben. Leider mussten wir feststellen, dass nach einer Weile das Spam-Aufkommen so zunahm, dass wir selbst mit zusätzlichen Text- und Ausdrucksfiltern der Flut nicht mehr Herr werden konnten. Wir hatten es mit einem typischen Fall eines erfolgreichen Angriffs auf die Schwäche von PHP-PRNGen (gemäß eines der Muster aus dem oben genannten Artikel) zu tun.

Wir haben deshalb den Code des Gästebuchs analysiert und letztlich festgestellt, dass die Captcha-Sequenzen nach einer statistischen Analyse tatsächlich vorhersagbar waren. Hierzu reichte eine überschaubare Anzahl von ca. (maximal) 60 Millionen Versuchen zur Seed-Sequenz-Prüfung. Die Analyse ließ sich locker in kürzester Zeit auf einem Laptop bewerkstelligen.

Ein typischer Fall von unzureichender Entropie. Wir änderten das Captcha-Verfahren dann selbst ab - und zwar

  • erstens mit Methoden, die dem Angreifer unbekannt waren
  • und zweitens mit eine Quelle für Seeds hoher Entropie.

Und siehe da: die Anzahl durchkommender Spams ging massiv zurück und hielt sich im Rahmen von Zufallstreffern im Promille-Bereich der Versuche.

Besonders lustig fanden wir, dass wir nach einer Weile tatsächlich auch noch eine Reaktion eines frustrierten Spammers im Rahmen abgewiesener, aber in einem Log-Bereich gespeicherten Beitragsversuches erhielten: Der Autor stellte eingerahmt in eine Reihe von Vulgärausdrücken fest, dass wir das Captcha-Verfahren wohl modifiziert hätten. Er glaube aber immer noch an das Potential seiner statistischen Analysen und würde das geänderte Verfahren früher oder später doch knacken. Er habe gerade nur keine Zeit ...

Hier sieht man mal, mit welchen Methoden in der Spammer-Szene gearbeitet wird.

Nun hatten wir den Vorteil, 2 Maßnahmen kombinieren zu können, von denen eine dem Prinzip von Open Source direkt zuwider lief. Ein Open Source Entwickler muss hingegen vollständig auf hohe Entropie von eingesetzten Zufallszahlen setzen.

OpenSSL unter UNIX/Linux als betroffenes Beispiel unzureichender Seed-Qualität

Trotz der Empfehlungen des oben erwähnten Artikels, der die Flankierung von PHP Software-PRNGen durch OpenSSL-Zufallsgeneratoren für Seeds empfiehlt, kann man mal die Frage stellen:

Wie sicher ist eigentlich OpenSSL selbst im Praxiseinsatz? Diese Frage ist deshalb von Bedeutung, weil es hier um den Kern sicherer Kommunikation mit Webseiten im Internet geht.

Für eine kritische Haltung muss man gar nicht mal auf den Heartbleed-Bug zurückgreifen oder gar Backdoors im (RSA-) Algorithmus vermuten:

 

Ein sehr schöner Artikel zu den diesjährig bekannt gewordenen grundlegenden Schwächen ist folgender:

 

Nach Meinung von Fachleuten führ(t)en aber schon sehr viel trivialere Umstände in der Praxis zu erheblichen OpenSSL-Schwächen. Folgender Artikel zeigt, dass auch die Entropie von OpenSSL unter bestimmten Umständen durch eine falsche Wahl von Seeds selbst wieder zu gering werden kann:

Auch der OpenSSL-Generator muss mit Seeds hinreichender Qualität versehen werden. Prozess IDs als Zusatz-Seed, auf die zumindest frühere OpenSSL-Implementierungen unter UNIX/Linux zurückgriffen, erweisen sich in diesem Zusammenhang interessanterweise und überraschenderweise als untauglich.

Dieses Beispiel zeigt, wie intrikat und kompliziert das Zusammenspiel von PRNG-Algorithmen und statistischen Seeds in einem konkreten Betriebssystem-Umfeld werden kann. Nicht gerade beruhigend? Der folgende Artikel befasst sich auch mit der damaligen OpenSSL-Schwäche und vertritt - wie ich - die Meinung, dass gerade wegen solcher Probleme Open Source wichtig ist:

 

Genug für heute. In einem weiteren Beitrag

IT-Sicherheit und Zufallszahlengeneratoren – III

werfen wir einen Blick auf einige weitere sicherheitsrelevante Verfahren, die eine hohe Qualität von Zufallszahlen erfordern.

Philosophische Fragen

Wie schon im letzten Blog-Artikel zu diesem Thema lassen wir den Leser mit ein paar "philosophischen" Fragen zurück:

Gehört es nicht zur Aufgabe einer modernen Staatsverwaltung, der heutigen Informationsgesellschaft, die den Staat trägt, einen (Web-) Service anzubieten, über den Entwickler und die Wirtschaft bei Bedarf kostenfrei ganze (verschlüsselte) Dateien mit hochwertigen Zufallszahlen abrufen können? Wäre ein solches Angebot nicht im nationalen Interesse? Eine Institution für ein solches öffentliches Angebot wäre in Deutschland etwa das BSI.
 
Natürlich fallen einem sofort zwei Fragen ein, die kritische Zeitgenossen aus zwei unterschiedlichen Perspektiven zu einem solchen Angebot stellen könnten:

  • Kann man einer solchen (staatlichen) Quelle von Zufallszahlen trauen? Unter welchen Voraussetzungen?
  • Kann dieses Angebot nicht auf von bösen Zeitgenossen genutzt - besser: missbraucht - werden? Wie sähe die Nutzen/Schadens-Bilanz aus?

Viel Spaß beim Nachdenken!

IT-Sicherheit und Zufallszahlengeneratoren – I

Selbst manche IT-Fachleute und SW-Entwickler sind sich nicht immer bewusst darüber, wie wichtig gute Zufallszahlengeneratoren in diversen Sicherheitsverfahren sind. Es kann potentiell fatale Auswirkungen haben, wenn z.B. im Unternehmensbereich Sicherheitsverfahren auf unzureichenden Zufallszahlengeneratoren beruhen. "Unzureichend" bezieht sich dabei auf die statistische Qualität der Zufallsverteilung.

Ein typisches Beispiel liefert der Einsatz von Pseudozufallszahlengeneratoren [Pseudo Random Number Generator [PRNG]] im Zuge der Entwicklung von Security-Komponenten in Web-Applikationen fürs Unternehmens-Intra- oder -Extra-Net sowie fürs Internet. Hier greifen Entwickler oft auf zu schwache PRNGs zurück, die mit der jeweiligen Programmiersprache (z.B. PHP, Java,...) ausgeliefert werden, und reißen so Löcher in Enterprise-Web-Applikationen:

Krypto-Algorithmen, Authentisierungsverfahren oder Captcha-Verfahren für Transaktionsautorisierungen können bei unzureichender Statistik eingefütterter Zufallszahlen zum Ziel von Angriffsvektoren werden, die oftmals nicht erkannt oder aber unterschätzt werden. Dies gilt im Besonderen beim Einsatz eigenentwickelter Sicherheitsverfahren.

Zufallszahlen spielen aber auch beim Einsatz von professioneller, kommerzieller und von Open Source basierter Sicherheits-Software eine fundamentale Rolle. Immer wieder fragen mich einige meiner Kunden, die aufgrund ihres Berufes Wert auf die Verschlüsselung personenbezogener Daten legen müssen, warum beim Einsatz verschlüsselter Datencontainer (z.B. mit Realcrypt) oder aber auch bei der Generierung von kryptographischen Schlüsseln (z.B. in PGP) eine Phase der Generierung von Zufallszahlen auftritt, bei der der User z.B. durch erratische Mausbewegungen mitwirken muss.

Im Zuge der bekannt gewordenen Nachrichten im Umfeld der Abhöraktionen von Geheimdiensten im Internet tauchten ferner Nachrichten auf, in denen darüber spekuliert wurde, ob manche tragenden Verschlüsselungsmechanismen im Netz inzwischen korrumpiert seien. Dabei war einerseits von programmtechnischen "Backdoors" der Kryptierungsalgorithmen selbst die Rede; zur Sprache kamen andererseits aber auch Manipulationen standardisierter Verfahren zu Erzeugung von Kryptierungsschlüsseln oder Challenge-Response-Secrets in automatisiert ablaufenden Verfahren zur Kryptierung von Netzwerkverbindungen auf der Basis von Zufallszahlengeneratoren.

Wie erklärt sich das? Warum ist "Awareness" im Bereich von Zufallszahlen-Generatoren für Sicherheitsverfahren generell und im Besonderen für Kryptographieverfahren so wichtig? Und warum ist Unbedarftheit an dieser Stelle potentiell gefährlich?

Diese Fragen rechtfertigt einige kleine Artikel in diesem Blog. Ich kann dabei aus Platz- und auch Verständnisgründen nur an der Oberfläche kratzen. Lesern, die daran interessiert sind, sich intensiver mit dem Zusammenhang von kryptographischen Verfahren, Wahrscheinlichkeiten, Unvorhersagbarkeit und PRNGs auseinanderzusetzen, lege ich als eine erste Einführung die Online-Kurse nahe, die unter
https://www.udacity.com/course/viewer#!/c-cs387/l-48632905/m-48740007
abrufbar sind.

Hinweis: Vielfach wird in der deutschen Literatur ein PRNG auch als "Zufallsgenerator" bezeichnet. Ich verwende den Begriff "Zufallszahlengenerator" synonym. Die Erzeugung von Zufallssequenzen von Strings oder anderen Objekten kann i.d.R. auf die Erzeugung zufälliger Zahlensequenzen abgebildet werden.

Woran liegt es, dass Zufallszahlengeneratoren im Sicherheitsumfeld so wichtig sind?

Grundsätzlich muss man sich klarmachen, dass fast alle aktuellen computerbasierten Verfahren - und eben auch Kryptographieverfahren - algorithmisch und damit deterministisch arbeiten. Der Anspruch an solche Verfahren ist dabei heute der, dass selbst dann, wenn die Arbeitsweise des Sicherheits- oder Kryptierungs-Verfahren im Detail bekannt ist, die Kenntnis der algorithmischen Struktur nicht für eine Aufdeckung des zu bewahrenden Geheimnisses hinreichend sein darf - zumindest nicht innerhalb eines vernünftigen Zeitraums.

Grundsätzlich kann man bzgl. der Geheimhaltung im Zusammenhang mit Sicherheits- und Kryptierungsverfahren zwei Strategien nutzen:

  • Geheimhaltung des Algorithmus und der dabei Schlüssel (Zugangscodes oder Chiffrierungsschlüssel)
  • oder nur Geheimhaltung der Schlüssel (und ggf. zugehöriger zusätzlicher Autorisierungscodes).

Ob man ein Sicherheitsverfahren und dessen Algorithmus an sich geheimhalten muss, hängt u.a. von der mathematischen Struktur des eingesetzten Algorithmus ab. Ist es einem Angreifer selbst bei bekanntem Algorithmus nicht möglich, Autorisierungs-, Zugangs- oder Kryptierungsschlüssel zu erraten oder durch eine systematisches Verfahren in überschaubarer Zeit zu ermitteln, so darf der Algorithmus selbst durchaus einer breiten Öffentlichkeit bekannt sein.

Nehmen wir also an, jemand kenne den sicherheitstechnischen Algorithmus, der zum Schutz von Daten oder Informationen in IT-Systemen eingesetzt wird. Man sollte sich klarmachen, dass das heute praktisch für alle etablierten Verfahren außerhalb des geheimdienstlichen Bereichs der Fall ist! Wie und in welcher Weise kann dann z.B. ein Zugang zu einem System oder einer geheimen Botschaft trotzdem "abgesichert" sein?

Ein Beispiel liefert ein kompliziertes Safe- oder Koffer-Schloss, dessen Struktur durch einen Zahlencode nach einem bekannten Prinzip definiert wird. (Nehmen wir ferner an, jeder gewaltsame physische Versuch des Öffnens würde zu einer Zerstörung des Inhalts führen. Auch ein Abhorchen von Einrast-Klicks des Schlosses sei unmöglich.) Dann müsste ein Angreifer auf gut Glück einen alphanumerischen Code ("Schlüssel") nach dem anderen durchprobieren, um das Schloss durch einen Zufallstreffern zu öffnen. Die Sicherheit hängt dann von drei Faktoren ab:

  • der Länge und Komplexität des gewählten Codes,
  • der Zufälligkeit der als Schlüssel gewählten Buchstaben/Zahlen-Kombination,
  • der Existenz eines kleinen, aber hinreichend langen minimalen Zeitintervalls für einen Entschlüsselungsversuch

Die ersten beiden Punkte führen zu einer hoffentlich geringen statistischen Wahrscheinlichkeit für das Erraten des Schlüssels und bei einer minimalen Zeiteinheit pro Entschlüsselungsversuch auch zu einem hohen Erwartungswert für das Zeitintervall, bis ein systematisches Durch-Probieren von alphanumerischen Codes zu einem Öffnen des Schlosses führt.

Eine geringe Wahrscheinlichkeit für das Erraten eines Schlüssels sorgt hier für einen ggf. zu hohen Aufwand für den Angreifer, das Schloss zwischen zwei Kontrollgängen von Sicherheitspersonal oder vor einer erneuten Änderung des Schlüssels zu knacken.

Das Beispiel verdeutlicht:

Bei bekanntem Algorithmus hängt die Sicherheit eines algorithmischen Kryptierungs-, Autorisierungs- oder Zugangsverfahrens grundsätzlich von zusätzlichen statistischen Input-Elementen ab, die dem potentiellen Gegner nicht bekannt sein dürfen.

Sprich:

  • Die statistischen Elemente eines Krypto- oder Sicherheits-Algorithmus müssen wirklich statistisch sein, d.h. sie müssen sich echtem physikalisch-statistischem "Rauschen" annähern. Man sagt auch: Sie müssen eine hinreichend hohe "Entropie" aufweisen. In der Praxis bedeutet das u.a., dass grafische Darstellungen der letztlich durch ein Sicherheitsverfahren generierten Werte (meist "Schlüssel", aber auch die verschlüsselten Geheimnisse selbst) in einem geeigneten Parameter- und Beschreibungsraum keine erkennbaren oder sich gar wiederholenden Muster aufweisen dürfen.
  • Die statistischen Elemente eines Krypto- oder Sicherheits-Algorithmus müssen so erzeugt werden, dass der potentielle Gegner darauf möglichst keinen Einfluss hat und die ggf. systematisch erzeugten Werte oder deren Sequenz ihm nicht bekannt werden. Das betrifft sog. "Seeds" (Samen) und statistische Initialisierungsvektoren von Sicherheitsverfahren, es betrifft die im Verfahren zu erzeugenden Kryptierungsschlüssel oder Zugangs- und Autorisierungsschlüssel wie etwa Autorisierungsschlüssel für die Aktivierung von Kryptierungsschlüsseln selbst oder für das Betriebssystem.

(Vermeintliche) Sicherheit entsteht in modernen Verfahren primär dadurch, dass statistische Größen mit Algorithmen so kombiniert werden, dass man selbst bei bekanntem Algorithmus einen komplexen und geheimgehaltenen Schlüssel nicht in vernünftigen Zeiträumen durch systematische Analysen und Entschlüsselungsversuche reproduzieren kann.

Bereits hier sehen wir, dass "Zufälligkeit" eine bedeutsame Rolle spielt. Nur "zufällige" Verteilungen einer Größe in einem hinreichend großen Raum potentieller Parameter - z.B. erzeugter Kryptierungsschlüssel - sorgen für die benötigte geringe Wahrscheinlichkeit des Erratens eben solcher Schlüssel oder von Sicherheitscodes.

Nun lassen sich Zufallsverteilungen jeder Art von Größe auf die Verteilung von reellen Zahlen in einem Zahlenintervall oder kombinierten Zahlenintervallen abbilden. Über diesen Aspekt kommen in etlichen sicherheitsrelevanten Verfahren Pseudo-Zufallszahlengeneratoren ins Spiel - also Algorithmen, die Sequenzen von Zufallszahlen erzeugen :

Sie liefern oftmals den (hoffentlich) statistischen Input für übergeordnete algorithmische Verfahren.

Aufwandserhöhung erfordert den Einsatz von Zufallszahlen

Grundlage vieler aktueller Verfahren ist eine aufwändige Zerlegung von (sehr) großen Zahlen in Primfaktoren. [Die Zerlegung einer Zahl in Primfaktoren ist ein sog. "NP-Problem" der Komplexitätstheorie. Salopp gesagt bedeutet dies: Es ist kein effizienter Algorithmus bekannt, bei dem mit heutigen Mitteln das Problem bei hinreichend großen Primzahlen in überschaubarer Zeit berechnet werden kann.] Das schützt weitgehend vor systematischen Angriffen auf den Algorithmus selbst.

Dennoch bedienen sich auch solche Verfahren erzeugter oder von außen (durch den User oder physikalische Geräte) zugelieferter Zufallszahlen:
Etwa bei der Erzeugung der benötigten großen Primzahlen, bei der Erzeugung bestimmter Schlüssel, internen Werten, die temporär sog. zufällige Initialisierungsvektoren erzeugen, etc.. An bestimmten Stellen werden auf Basis von externer Zufalls-Seeds intern weitere Zufallszahlensequenzen mit Hilfe von PRNGs produziert.

Fazit: Ohne Zufallszahlen geht es nicht

Wir fassen mit Hilfe eines Zitats des Kryptographie Experten Bruce Schneier (siehe für das Zitat: https://www.schneier.com/yarrow-qa.html) zusammen:

Why is a PRNG important?

PRNGs are used everywhere in cryptography. In fact, it is hard to imagine a well-designed cryptographic application that doesn't use random numbers. Random numbers are used to generate session keys, initialization vectors, salts to be hashed with passwords, unique parameters in digital signature operations, random initialization for public-key generation, and nonces in different protocols. If the random numbers in any of these applications are insecure, than the entire application is insecure. Algorithms and protocols can't cover for bad random numbers.

Wie ernst man die mögliche Korrumpierung von PRNGs nimmt, zeigt folgender Artikel:
http://arstechnica.com/security/2013/09/stop-using-nsa-influence-code-in-our-product-rsa-tells-customers/

Ergänzung 1: Warum überhaupt definierte Algorithmen in Sicherheitsverfahren ?

Nun könnte jemand ganz spontan einwenden: Warum müssen denn IT-Sicherheitsverfahren überhaupt grundsätzlich "algorithmisch" aufgebaut sein?

Ein trivialer Teil der Antwort besteht sicher darin, dass auch nach Anwendung des Sicherheitsverfahrens der Zugang zu einem eventuellen Geheimnis für Berechtigte möglich sein muss. Bestimmte Teile der Sicherheitsvorkehrungen - z.B. die Kryptierung eines geheimen Textes - müssen also insofern reversibel gehalten sein, als man die Sicherheitssperren (wie etwa die Kryptierung) durch autorisierte Personen oder Systeme wieder aufheben können muss, sobald der Zugang zum geschützten Geheimnis oder einem gesicherten Verfahren erforderlich wird.

Hierzu bedarf es definierter und auch künftig gültiger Verfahren mit eindeutigen Handlungs- und Verarbeitungsschritten - also Algorithmen. Der Einsatz von Algorithmen dient also ganz wesentlich der erforderlichen Reversibilität der Sicherheitsmaßnahmen.

Tatsächlich gibt es aber Sicherheitsverfahren, in denen die Sicherheit durch zeitlich statistisch fluktuierende Änderungen von Elementen der Basis-Algorithmen erhöht wird. Z.B. könnte man - statt verschlüsselte Texte statisch zu halten - "aktive" Botschaftscontainer erzeugen, die die kryptierte Botschaft über eine durch Umweltdaten ausgelöste Algorithmenvariation immer wieder neu erzeugen. Solche Verfahren sind zwar interessant, lassen sich letztlich aber auf komplexere Algorithmen mit weiteren (symmetrisch für den Dekryptierer bekannten) Zufalls-Seeds zurückführen. Interessant sind diese Verfahren also eher weniger wegen der vordergründigen Algorithmen-"Verschleierung" als vielmehr wegen des Rückgriffs auf wirklich statistisch fluktuierende Input-Daten.

Ergänzung 2: Der Schutz von Schlüsseln erfordern zusätzliche Maßnahmen

Selbst bei erfolgreicher Geheimhaltung eines Algorithmus bliebe in jedem Fall die Frage der Autorisierung zur Aktivierung des "unbekannten" Dekryptierungs-Algorithmus mittels eines Schlüssels offen. Gerät ein Angreifer in den physischen Besitz eines Schlüssels, so kann man immer noch versuchen, die Sicherheit durch Abfrage eines persönlichen Zugangs- und Autorisierungscodes zu schützen. Sprich: Der Schlüssel wird nur aktiv, wenn sein Besitzer ein nur ihm bekanntes Geheimnis angibt.

Hier ist der Austausch von Identitäts- und Autorisierungsdaten (ggf. weiteren Geheimnissen) erforderlich. Das Autorisierungsproblem wirft die Sicherheit letztlich immer wieder auf elementarste Sicherheitsverfahren und die Geheimhaltung von Autorisierungscodes durch Personen zurück. Bin ich im Besitz von Identitäts- und Autorisierungsdaten und kann ich sie an der richtigen Stelle anbringen, muss mich deren weitere algorithmische Verwendung nicht mehr interessieren - solange der Zugang zu einem Verfahren oder die Dekryptierung eines codierten Geheimtextes erfolgreich durchgeführt werden.

Da aber

  • sowohl die Lagerung von vielen Autorisierungscodes, die ein Mensch im IT-Umfeld heute behalten muss,
  • als auch die Vorhaltung von vielen Autorisierungscodes vieler Nutzer für viele IT-Systeme

systematisch durch IT-Systeme selbst unterstützt werden muss, landen wir wieder bei dem Problem der sicheren - also kryptierten - Lagerung von Information und deren Dekryptierung auf IT-Systemen mit einem menschlichen Zugangskanal. Die Verfahren müssen systematische, reproduzierbare Schritte beinhalten - wir sprechen also auch hier wieder von Algorithmen.

Ergänzung 3: Muss der Sicherheitsalgorithmus den beteiligten Benutzern bekannt sein? Was bringt Geheimhaltung?

Man muss natürlich nicht immer einen Algorithmus bzw. ein algorithmisches arbeitendes Werkzeug kennen oder verstehen, um ihn bzw. es einsetzen zu können. Man muss ihn nur in einer praktikablen Form besitzen und anwenden können. Faktisch verstehen heute auch Sicherheits-Experten nicht die Details aller von Ihnen eingesetzten Algorithmen. Ein echtes Verständnis erfordert meist auch erhebliche mathematische Kenntnisse.

Da der Anwender den sicherheitstechnischen Algorithmus nicht verstehen muss, zieht das die Frage nach sich, ob man ihn dann nicht besser geheimhalten sollte. Gerade die NSA-Skandale der letzten Zeit und die zugehörige Backdoor-Diskussion werfen immerhin die Frage auf, wie man in einen nicht mehr bekannten oder nicht mehr nachvollziehbaren Algorithmus "Backdoors" einbauen will? Die Geheimhaltung von Algorithmen kann für Staaten, Geheimdienste oder Wirtschaftsunternehmen aus diesem Grunde durchaus relevant erscheinen.

Das Problem ist hierbei aber das des klassischen menschlichen Versagens. Um an die Kenntnis von Algorithmen zu kommen, müssen nämlich nur Einzelne "versagen". Gegen massiven Druck auf einzelne Person zur Offenlegung eines Algorithmus oder zugehörigen Schlüssels ist kein Kraut gewachsen - deswegen dürfen aber kryptierte Nachrichten anderer Personen, die andere Schlüssel nutzen, nicht gefährdet sein. Deshalb ist es so viel wichtiger, mit Verfahren zu arbeiten, bei denen selbst der Zugang zum Algorithmus die Sicherheit der mit ihm verschlüsselten Nachrichten nicht substanziell gefährdet. Bei bekanntem Algorithmus verlagert sich Sicherheit in der Masse auf die statistische und nicht in vernünftiger Zeit reproduzierbare Erzeugung von Schlüsseln und deren Geheimhaltung bzw. deren Schutz.

Weitere Argumente gegen eine Geheimhaltung von Algorithmen und zugehöriger Programmcodes sind klassische "Open Source" Argumente:

  • Wenn ich einen sicherheitsrelevanten Algorithmus kenne, kann ich seine Eigenschaften analysieren und evtl. Schwachstellen entdecken - aber auch beheben.
  • Wenn ich Zugang zu den Programmcodes für die Umsetzung von Sicherheits- oder Kryptierungs-Algorithmen habe, können andere Experten oder im Zweifelsfall sogar ich selbst prüfen, ob die Umsetzung einwandfrei erfolgt ist (keine backdoors) oder ob sich durch die programmtechnische Art der Umsetzung ggf. sekundäre Schwachstellen ergeben haben.

Beide Argumente eröffnen in einem Umfeld, in dem man an die Existenz mathematisch begründeter sicherer Kryptierungs-Algorithmen mit statistischen "Seeds" glaubt, vielleicht gerade für den Privatmann die einzige Chance auf eine angemessene Absicherung seiner Privatsphäre.

Im nächsten Artikel
IT-Sicherheit und Zufallszahlengeneratoren – II
vertiefen wir diese Überlegungen und betrachten ein einfaches Beispiel für die Kombination von statistischen Wahrscheinlichkeitselementen mit algorithmischen Strukturen.

Zusatzfrage

Für die Philosophen unter den Lesern habe ich zum Abschluss dieses Beitrags folgende Frage:

Kann man technische, informationsverarbeitende Systeme bauen, die "selbständig" Kryptoverfahren erzeugen, die für einen menschlichen Angreifer nicht mehr rekonstruierbar sind? Kann "etwas" (algorithmische) Verfahrensstrukturen entwickeln, die wir nicht in vernünftiger Zeit nachbauen oder rekonstruieren können, die wir aber dennoch zur Kryptierung und Dekryptierung einsetzen könnten? Und würde das die Sicherheit gegenüber "sicheren" Verfahren mit bekannten Algorithmen und zusätzlichen Zufallselementen wirklich erhöhen? Und wenn: in welchem Sinne genau ?