Endpunktbasierte OCR für DLP schließt die Lücke beim Schutz von Unternehmensdaten

Claudia Kurbjuhn November 7, 2023November 21, 2023 Data Loss Prevention

Wenn sensible Daten in einer E-Mail oder anderen Dateitypen enthalten sind, können Data Loss Prevention (DLP)-Lösungen mithilfe von Textinspektion und Deep Packet Inspection die Übertragung dieser Daten identifizieren und blockieren. Wenn dieselben Daten jedoch in ein Bild eingebettet sind, muss zunächst die optische Zeichenerkennung (OCR) zur Textextraktion verwendet werden, bevor die Daten von der DLP-Richtlinie bewertet werden können.

Die Zahl der Fälle, in denen sensible Daten über Bilddateien (d. h. jpegs, tiffs, bmps, pdf-Dateien) exfiltriert werden, nimmt zu. Dies reicht von der versehentlichen Weitergabe gescannter Dokumente, wie z. B. gescannter Rechnungen, Kreditkartendaten und Krankenversicherungsanträgen, bis hin zu böswilligen Versuchen, Fotos/Screenshots von vertraulichen Bildschirminhalten zu machen.

Leider ist OCR schon seit Jahren ein Dorn im Auge von Cybersecurity-Teams und Compliance-Beauftragten. Viele DLP-Lösungen, darunter Symantec und Microsoft Windows Purview, verlassen sich bei der Textextraktion auf eine serverbasierte Verarbeitung. Dieser Ansatz kann die Produktivität der Mitarbeiter beeinträchtigen, unnötige Datensicherheitsrisiken mit sich bringen und sogar dazu führen, dass DLP-Richtlinien nicht mehr in der Lage sind, alle potenziellen Ausstiegspunkte zu schützen.

Es gibt jedoch Alternativen. DLP-Lösungen wie Endpoint Protector von CoSoSys entdecken die Herausforderung und gehen sie anders an. Anstatt sich auf eine serverbasierte Verarbeitung zu verlassen, werden die OCR-Textextraktion und die Durchsetzung von Richtlinien direkt auf dem Endpunkt durchgeführt.

Sehen wir uns an, warum das wichtig ist.

1. Geschwindigkeit und Verarbeitung in Echtzeit

Bei herkömmlichen serverbasierten OCR-Lösungen müssen die Dokumente zur Verarbeitung an externe Server gesendet werden. Dies führt unweigerlich zu Latenzzeiten auf dem Endgerät des Mitarbeiters, da die Dateien zur Prüfung erst über das Internet übertragen werden müssen. Bei der endpunktbasierten OCR hingegen werden die Daten lokal auf dem Endpunkt des Benutzers verarbeitet. Diese Echtzeitverarbeitung verkürzt die Wartezeiten erheblich und ermöglicht eine nahezu sofortige Texterkennung und DLP-Richtlinienabgleich.

2. Die Möglichkeit, alle Ausgangspunkte zu scannen

Die serverbasierte OCR hat ein großes Problem: Sie kann nur Bilder nach sensiblem Text scannen, die einen Server durchlaufen. Das bedeutet, dass DLP-Lösungen, die sich auf diesen Ansatz stützen, auf den Schutz von Ausgangspunkten beschränkt sind, die z. B. nur E-Mail- und webbasiert sind. Diese Einschränkung schafft massive Lücken in jeder Datenschutz-, Compliance- und DLP-Strategie, da alle anderen Ausgangspunkte auf dem Endpunkt ungeschützt bleiben. Die OCR von Endpoint Protector ist endpunktbasiert, d.h. sie kann Text in Bildern über alle Ausgangspunkte hinweg konfigurieren, identifizieren und schützen. Dazu gehören Server-Uploads, Netzwerkfreigaben, USB-Laufwerke und Wechselmedien, Netzwerkdrucker, lokale/heimische Drucker, Kopieren/Einfügen, E-Mail, URL-Uploads, LAN-Freigaben und Cloud-Dienste, um nur einige zu nennen.

3. Datenschutz und Sicherheit

Bei serverbasierten OCR-Lösungen werden sensible Dokumente und extrahierter Text über das Internet an externe Server übertragen. Dieser Prozess birgt potenzielle Sicherheitsrisiken für Unternehmen, die nicht zulassen oder wünschen, dass ihre Daten außerhalb ihrer organisatorischen Kontrolle weitergegeben werden. Endpunktbasierte OCR- und DLP-Lösungen mindern diese Risiken, indem sie die Daten auf dem Endpunkt des Benutzers lokalisieren. Dieser Ansatz gewährleistet ein Maximum an Datenschutz und Sicherheit und gibt Unternehmen die vollständige Kontrolle über ihre sensiblen Daten. Endpoint Protector überträgt Ereignisinformationen vom Endpunkt-Client zum Server durch verschlüsselte Übertragung, um sicherzustellen, dass keine sensiblen Daten den Endpunkt verlassen.

4. Kosteneffizienz

Herkömmliche serverbasierte OCR-Lösungen sind oft mit Abonnementgebühren oder nutzungsabhängigen Preismodellen verbunden, die insbesondere für Unternehmen, die große Mengen an Dokumenten verarbeiten, erhebliche Kosten verursachen können. So wird beispielsweise Microsoft Purview-Benutzern pro 1000 gescannte Dokumente 1 US-Dollar in Rechnung gestellt (wobei jede Seite eines PDF-Dokuments als einzelne Seite gilt und somit eine Gebühr anfällt). Bei endpunktbasierter OCR-Verarbeitung, einschließlich Lösungen wie Endpoint Protector, fallen keine solchen Gebühren an.

5. Offline-Zugänglichkeit

Eine serverbasierte OCR-Lösung hängt stark von der Internetverbindung ab und ist daher für Szenarien, in denen Benutzer offline arbeiten müssen, ungeeignet. Da endpunktbasierte OCR direkt auf dem Endpunkt des Benutzers arbeitet, können Bilddateien, einschließlich .jpg, .bmp und .png, auch ohne Internetverbindung verarbeitet, Text extrahiert und mit einer aktiven DLP-Richtlinie abgeglichen werden. Diese Offline-Zugänglichkeit gewährleistet ununterbrochene Produktivität und Datenschutz, unabhängig vom Standort des Benutzers oder der Verfügbarkeit des Internets.

6. Integration und Anpassung

Endpunkt-basierte OCR-Lösungen bieten mehr Flexibilität bei der Integration mit anderen Anwendungen und der Anpassung an spezifische Geschäftsanforderungen. Benutzer können Endpunkt-OCR, einschließlich API, nahtlos in ihre bestehenden Formate, Arbeitsabläufe und Anwendungen integrieren und so die Gesamteffizienz steigern. Darüber hinaus haben Entwickler die Freiheit, die OCR-Algorithmen an die speziellen Anforderungen ihrer Anwendungen anzupassen und zu verfeinern, was zu einer höheren Genauigkeit und Zuverlässigkeit führt.

OCR-Verbesserungen durch Endpunkt-Hardware

Fortschritte bei der CPU-Leistung sowie Hardware-basierte Sicherheits-Frameworks machen die OCR auf Endgeräten schnell zum schnellsten und genauesten Ansatz für eine effektive DLP. Endpoint Protector ist der erste DLP-Anbieter, der das Vision Framework von Apple nutzt und damit einen Hardware-Ansatz für OCR verfolgt, der eine 10-fache Verbesserung der Verarbeitungsgeschwindigkeit und Genauigkeit bietet.

Der Wechsel von der traditionellen serverbasierten DLP-OCR zur endpunktbasierten OCR für DLP ist ein wichtiger Meilenstein in der Entwicklung der Dokumentenverarbeitung und des Informationsschutzes. Die Einführung dieses innovativen Ansatzes ermöglicht nicht nur eine bessere und genauere OCR-Erkennung, sondern gibt den Anwendern auch mehr Kontrolle über ihre Daten und steigert die allgemeine Produktivität in der heutigen digitalen Landschaft.

Erfahren Sie mehr zum Thema Data Loss Prevention

Möchten Sie tiefer in die Welt der Data Loss Prevention eintauchen? Schauen Sie sich diese sorgfältig ausgewählten Informationen an, um Ihr Wissen zu erweitern:

Data Loss Prevention: The Complete Guide Was ist Data Loss Prevention? Ein tiefer Einblick in seine Kernfunktionen DLP-Richtlinie 101: Von den Grundlagen zur professionellen Anwendung Top 3 Gründe für den Einsatz von Endpoint DLP DLP Security: Grundlagen für den Schutz von Unternehmensdaten