Die Möglichkeiten präziser bzw. erschöpfender Suchen können, bezogen auf den Inhalt einer Datenbank, durch die Quoten Precision und Recall ausgedrückt werden. Werte für den Recall sind im Internet nicht bestimmbar; Precision ist immer eine subjektive Größe. Die Eignung der Suchdienste für die Durchführung präziser bzw. erschöpfender Suchen wird daher anhand ihrer Arbeitsweise und der Funktionalitäten, die sie zur Verfügung stellen, bestimmt.
Die Forderung nach der Möglichkeit erschöpfender Suche bezieht sich gleichzeitig auf das gesamte WWW: es sollen alle Ressourcen gefunden werden, die es zu einem Thema gibt. Für diese Anforderung sind roboterbasierte Suchdienste generell besser geeignet als manuell erstellte, da sie entschieden größere Teile des WWW indexieren. Dennoch erfassen in der Praxis auch roboterbasierte Suchdienste nur Ausschnitte des WWW. Für eine möglichst erschöpfende Suche ist daher die Benutzung eines Einzeldienstes i.d.R. nicht ausreichend, sondern es müssen alle relevanten Einzeldienste berücksichtigt werden.
Eine Verbesserung der Suche kann bei roboterbasierten Suchdiensten nur begrenzt durch die Indexierung beeinflußt werden, da mit automatisierten Methoden gearbeitet wird. Die Möglichkeiten liegen hier vor allem in der separaten Indexierung einzelner Teile der Dokumente (Metadaten, bestimmte HTML-Elemente und Dateitypen) zusätzlich zum Volltext.
Einfluß auf die Suchmöglichkeiten haben vor allem Methoden des Information Retrieval, die über die reine Eingabe von Stichworten hinausgehen. Einige Verfahren, wie die Verwendung Boole'scher Operatoren, der Einsatz von Näheoperatoren und die Klammerung von Suchausdrücken, werden inzwischen von den meisten der großen Suchdienste angeboten. Mehr und mehr Dienste ermöglichen auch die Einschränkung der Suche auf einzelne Medientypen oder Protokolle - oft allerdings auf relativ primitiver Basis - sowie die Begrenzung der Suche auf einzelne HTML-Elemente.
Andere Funktionen, die z.T. in traditionellen Nachweismitteln für die wissenschaftliche Informationssuche gebräuchlich sind (Trunkierung, nutzergesteuerte Gewichtung von Suchbegriffen zum Zweck der Umsortierung der Ergebnisse oder Suche unter Einbeziehung des Publikations- bzw. Revisionszeitpunktes), finden sich nur bei einzelnen Diensten. Weitere für die wissenschaftliche Informationssuche interessante Suchoptionen, wie citation indexing, die Suche in Metadaten oder automatisches Klassifizieren sind nur ansatzweise oder gar nicht realisiert.
Einzelne Suchdienste haben Retrievalmethoden eingeführt, die der Modifizierung von Suchanfragen dienen. Dies betrifft besonders Methoden der Frageerweiterung, die vor allem dann hilfreich sein können, wenn sie vom Nutzer beeinflußbar sind. Die derzeitigen Realisierungen sind jedoch zum großen Teil auf hohen Recall ausgerichtet und die verwandten co-occurence-Methoden führen oft zum Angebot irrelevanter Begriffe. Durch diese Schwächen ist der Nutzen der gegenwärtigen Realisierungen begrenzt.
Eine Gruppierung der Suchergebnisse, die ebenfalls dazu dienen kann, bei großen Ergebnismengen relevante Treffer herauszufiltern, wird nur von zwei Diensten verwandt.
Insgesamt werden, besonders bei den großen, globalen Suchdiensten, zunehmend avancierte Retrievalfunktionalitäten angeboten, die die Möglichkeiten präziser bzw. erschöpfender Suchen verbessern. Dennoch führen die generellen Probleme, die sich aus der automatischen Indexierung und den Charakteristika von Internetdokumenten ergeben, oft weiterhin zu unbefriedigenden Ergebnissen.
Kleinere regionale oder fachlich spezialisierte Suchdienste bieten meist nur grundlegende Retrievalfunktionalitäten. Aufgrund der Anzahl der verzeichneten Ressourcen und den fortgeschrittenen Retrievalmöglichkeiten sind damit die großen, roboterbasierten Suchdienste unverzichtbar. Dennoch sind in regionalen und fachlichen Suchdiensten viele Dokumente verzeichnet, die von den großen, globalen Diensten nicht erfaßt werden. Besonders den fachlichen Suchdienste kommt dabei eine wachsende Bedeutung zu, da sie meist gezielt Server wissenschaftlicher Einrichtungen indexieren.
Bei manuell erstellten Diensten hängen die Möglichkeiten präziser bzw. erschöpfender Suche vor allem von der Erschließung und der Organisation der Ressourcen ab. Die Funktionalitäten des Information Retrieval spielen dagegen eine geringere Rolle, da die Dienste erheblich kleiner sind und meist über Browsing eine alternative Zugangsmöglichkeit zur Suche besteht. In beiden Bereichen gibt es große Unterschiede zwischen den kommerziellen, generellen und den fachspezifischen Diensten, die die jeweilige Zielgruppenorientierung der Dienste widerspiegeln. Ein Großteil der generellen Nachweisdienste für den breiten Massenmarkt beschränkt sich auf eine minimale Erschließung. Die Browsingverzeichnisse basieren i.d.R. auf selbstentwickelten Systematiken, deren Kategorien sich auf populäre Themen beziehen. Die Inhalte sind stark an Freizeit- und Unterhaltungsinteressen orientiert und die Dienste von Werbung dominiert. Sie sind damit für die die wissenschaftliche Informationssuche nur sehr begrenzt nutzbar.
Auf der anderen Seite stehen eine Reihe von, oft auf ein Fachgebiet bezogenen, Diensten, die sich speziell an wissenschaftliche Informationssuchende wenden. Diese sind meist durch relativ ausführliche Erschließung der Ressourcen mit Hilfe von Schlagworten, kontrolliertem Vokabular und Klassifikationscodes gekennzeichnet. Die systematische Verzeichnung erfolgt i.d.R. unter Verwendung etablierter Klassifikationsschemata. Sie bieten damit gute Möglichkeiten für präzise und erschöpfende Suchen innerhalb der verzeichneten Bestände.