06.10.2010, 11:08 Uhr
Das Deepweb: Schätze, die nicht einmal Google heben kann (Montage: t-online.de).
Was Google nicht findet, gibt's nicht. Das glauben viele Internetnutzer. Dabei existiert abseits von dem sichtbaren World Wide Web eine gewaltige Ansammlung von Daten – das so genannte Deep Web. An diesem digitalen Untergrund beißen sich Googles Spürhunde die Zähne aus, was hier gespeichert ist, taucht deshalb auch nicht in den Ergebnislisten der Suchmaschine auf. Wir nehmen Sie mit in die Tiefen des Internet, die nicht einmal Google erforschen kann – und verraten, welche Informationsschätze sich hier heben lassen.
Das World Wide Web ist unerschöpflich und unendlich groß – und alle Informationen darin lassen sich mit Google finden. Dieses Credo gehört zum Grundverständnis vieler Internet-Nutzer. Dabei findet Google jedoch längst nicht alle Informationen im Web. Der durch Suchmaschinen abgedeckte Teil des Web ist zwischen einigen Dutzend und einigen hundert Terabyte groß, schätzen Experten. Sicher ist jedoch, dass dieses sogenannte Surface Web wohl nur ein Hundertstel der wahren Größe des Webs ausmacht. Der gewaltige, verborgene Rest bleibt dem normalen Anwender verborgen: Das Deep Web.
Über die Größe des Deep Web gibt es keine verlässliche Schätzung. Eine Erhebung des Unternehmens BrightPlanet aus dem Jahr 2001 schätzt die Datenmenge des Deep Web auf 7500 Terabyte. 2003 versuchte die University of California in Berkley, die Größe mathematisch zu ermitteln und kam auf beinahe 100.000 Terabyte. So genau weiß das jedoch niemand. Es gibt keine Karte des Deep Web, keine Möglichkeit, genau zu erfassen, welche Daten sich darin verbergen. Denn die Daten darin verschließen sich bisher auch den modernsten Suchalgorithmen – weshalb sie auch nicht in den Ergebnislisten von Google &. Co. auftauchen.
Ein Teil des Deep Web besteht aus Datenbanken. Ihre Inhalte sind nur über interne Suchfunktionen erreichbar, Google hat hier keinen Zutritt. Oft handelt es sich um die Datenbanken großer Forschungsnetzwerke, die hier ihre Ergebnisse austauschen. Andere gehören kommerziellen Anbietern wie dem Unternehmen LexisNexis, das in großem Stil gedruckte Publikationen wie Tageszeitungen und Magazine digitalisiert und in seiner Datenbank gegen eine Gebühr zugänglich macht. Wer über einen der für professionelle Anwender gedachten Zugänge verfügt, kann zum Beispiel alle deutschen Zeitungen nach einem bestimmten Thema durchsuchen – oft auf Jahrzehnte in die Vergangenheit. Auch andere kommerziell genutzte Datenschätze lagern im Deep Web: Die Bild-Datenbanken der großen Nachrichtenagenturen etwa mit ihrem riesigen Fundus an Presse-Fotos.
Ein rasant wachsender Bestandteil des Deep Web sind die dynamischen Datenbanken der sozialen Netzwerke. In Netzwerken wie Facebook stecken Millionen Datensätze mit Namen, Adressen, persönlichen Vorlieben und weiteren Informationen. Zugänglich sind sie nur den Mitgliedern, und auch hier nur den von einem Nutzer autorisierten Freunden. Eine andere große Datengruppe sind Internetseiten, die von Ihren Besitzern vor den Suchmaschinen versteckt wurden. Googles Webcrawler lassen sich mit einem Wegweiser daran hindern, eine Seite in den Google Index aufzunehmen – zum Beispiel, weil sie nur einem begrenzten Nutzerkreis zugänglich sein soll.
Heben lassen sich diese Datenschätze nur mit speziellen Zugängen. Wer wissenschaftlich arbeitet sollte deshalb bei der nächsten Hochschule anfragen, ob sie auf dem Campus über einen Zugang zu den kommerziellen Datenbanken verfügt. Oft lassen sich diese Datenbanken von Arbeitsplätzen in den Hochschulbibliotheken kostenlos durchsuchen. Kommerzielle Unternehmen wie BrightPlanet versuchen sich an automatisierten Deep-Web-Recherchen im Auftrag solventer Kunden – dazu sollen neben großen Unternehmen auf der Suche nach Informationen über ihre Konkurrenten auch amerikanische Geheimdienste gehören.
Google wäre jedoch nicht Google, wenn der Konzern nicht selbst bereits an Wegen arbeiten würde, die Inhalte des Deep Web immer weiter zu beleuchten. So entwickelt das Unternehmen seine Webcrawler so weiter, dass sie künftig automatisiert Suchanfragen an offene Datenbanken simulieren können. Die Suchergebnisse lassen sich dann indizieren und stehen dem Google-Nutzer bei einer Suche zur Verfügung. Gleichzeitig digitalisiert das Unternehmen seit Jahren selbst wissenschaftliche Dokumente und urheberrechtsfreie Bücher, die dann über die Google-Suche erreichbar sind. Zwar wird das Deep Web dadurch nicht kleiner werden. Google selbst wird seinen Nutzern jedoch immer mehr Daten anbieten können – und damit vielleicht Recherchen im Deep Web überflüssig machen. Bis dahin lohnt es sich jedoch auch für normale Internetnutzer, ab und zu auf Entdeckungsreise zu gehen in den nicht kartografierten Teilen des Web – vielleicht findet sich dort sogar der eine oder andere Schatz.
Kaum eine andere Seite wird häufiger angesurft als Google. Doch wer kennt die Geheimfunktionen der beliebten Suchmaschine? Google-Quiz
sven schrieb:
am 24. Januar 2011 um 12:57:39
(0)
(0)
was da woll drin is ?
wer weiß was man da so alles findet ...
Kommentar melden
Nort schrieb:
am 8. Oktober 2010 um 20:50:56
(0)
(0)
Was nicht einmal Google findet.
Was für ein Bericht.. Als Webseitenbereiber kann ich Google sagen welchen Bereich oder welche Seiten die
Suchmaschine aufnehmen sollte. Da Google sich an einige Spielregeln hält, kann die Suchmaschine garnicht alle Webseiten dieser Welt indizieren. Der sichtbare Bereich des Webs wird auf ca. 25% geschätzt. Diese Aussage ist bestimmt besser als mit Terabytezahlen um sich zu werfen. Wieviele Netznutzer wissen schon was 1 Terabyte ist? Mein Tipp: Das Webadressbuch 2011! Die besten Webseiten aus Deu
mehr
Kommentar melden
Bitte füllen Sie alle Felder aus.

Sie sind der Meinung, dass dieser Kommentar anstößige Inhalte enthält.

Attraktive und sportive Mode für Sie und Ihn: kompromisslose Qualität, die überzeugt. zum Special
Strafft den Hüft- und Taillenbereich und sorgt für ein volleres Dekolleté - jetzt für 19,99 €. von neckermann.de
Zeigen Sie Flagge - alles für die per- fekte EM-Party in Schwarz-Rot-Gold.
von GINGAR.de
Tolle Kurven perfekt in Szene gesetzt: zauberhafte Damenmode bis Größe 60. zum XXL-Special
Internet Explorer 9: Flotter Seiten- aufbau bei voller Sicherheit. mehr
Neues Oberklassen-Smartphone mit 4,7-Zoll-Display. zum Video