Utiliser des moteurs de recherche Web profonds pour la recherche universitaire et scientifique
Vous avez peut-être déjà entendu le terme en passant, le sujet répandu mais rarement évoqué du « Web profond ». Un Web sous le Web, rempli de pétaoctets de données et d’informations hors de portée de votre barre de recherche Google, Bing ou Yahoo standard.
Mais qu’est-ce que le Web profond exactement et à quoi sert-il pour l’ensemble de la communauté des chercheurs ? Poursuivez votre lecture dans notre guide pour découvrir tout ce que vous devez savoir sur le Web profond, y compris ce qu'il signifie, où il se trouve et comment vous pouvez l'utiliser à votre avantage.
Le Deep Web : une bonne définition
Google utilise ce que l'on appelle un « robot d'exploration basé sur une araignée » pour parcourir le Web à la recherche de résultats de pages Web statiques, puis vous les renvoie lorsque vous saisissez les bons termes dans la barre de recherche. Cela ne couvre qu’une très petite partie des informations réellement disponibles sur le Web.
Tous les résultats que vous obtenez lors d’une recherche de base sur Google proviennent de ce que l’on appelle le « Web de surface ». Le Surface Web couvre vos bases : réseaux sociaux, sites d'actualités, shopping, blogs, etc.
Ensuite, il y a le Deep Web, qu’il ne faut pas confondre avec le « Dark Web », une partie d’Internet le plus souvent associée aux services de connexion pour la protection de la vie privée comme TOR et aux marchés de drogues en ligne comme la Route de la Soie, aujourd’hui disparue.
Voir également:Comment accéder au Deep Web et au Darknet
Le Web profond contient un torrent constamment mis à jour d’informations brutes et non contrôlées, regorgeant de termes techniques complexes et de tellement de diagrammes qu’il suffit de faire exploser l’IA Deep Dream de Google. Il s'agit de documents qui conservent des enregistrements d'éléments tels que les données de recensement, les données de mission de la NASA, les brevets et les bases de données d'articles universitaires.
On estime que l’ensemble du Web de surface ne représente qu’environ 20 téraoctets d’informations, soit 5 % des informations disponibles pour la recherche ouverte. En revanche, le deep web occupe environ 7,5pétaoctets d’informations, soit environ 95 pour cent du total.
Comment rechercher sur le Web profond
Savoir où chercher lorsque vous plongez dans les profondeurs du Web est la première étape, et probablement la plus importante, que vous devriez franchir avant de commencer quoi que ce soit d'autre. Bien que le Web profond soit presque infiniment vaste en ce qui concerne la quantité d’informations que vous pouvez trouver, contrairement à ce à quoi la plupart des gens sont habitués lorsqu’ils recherchent quelque chose sur Google, toutes ces données ne sont pas centralisées au même endroit.
Cela signifie que pour autant de sujets différents auxquels vous pouvez penser (finance, logiciels, affaires, économie, monde universitaire, etc.), il existe un nombre égal de moteurs de recherche conçus pour plonger dans les archives du Web profond de ces sujets particuliers.
Un problème auquel certains chercheurs se heurtent est celui des paywalls. Il n’y a aucun moyen de contourner ce problème ; afin de gérer ces sites Web/bases de données et de garder les lumières allumées, de nombreux sites mentionnés ci-dessous garderont leur contenu caché derrière un mur payant qui peut coûter plus de 50 $ pour lire un seul document, ou des plans d'abonnement mensuels qui vous donnent accès à tous. contenu pour un montant forfaitaire.
Si les paywalls vous posent problème, un outil que nous vous recommandons de consulter est l'extension du navigateur Google Chrome Unpaywall . Unpaywall parcourt automatiquement le Web à la recherche d’une version gratuite de tout contenu auquel vous essayez d’accéder et qui indique qu’il se trouve derrière un paywall. Vous n’obtiendrez peut-être pas toujours un résultat gratuit pour chaque article que vous recherchez, mais il est toujours bon de savoir que l’option est là si vous en avez besoin à la rigueur.
Ci-dessous, nous avons inclus une liste de certains des services qui, selon nous, font le meilleur travail pour cataloguer toutes les informations dont vous pourriez avoir besoin lors de votre prochain projet de recherche, en mettant particulièrement en évidence ceux qui facilitent la recherche.
JSTOR – Le premier ajout – et probablement le plus évident – à cette liste est la base de données JSTOR. Créé en 1995, ce trésor de recherche continue d'être l'un des premiers arrêts de tout chercheur universitaire en route vers le terrier du lapin. Offrant des recherches en texte intégral dans plus de 2 000 revues individuelles et plus de 15 000 livres, JSTOR est un incontournable pour tous ceux qui préfèrent une approche plus « à guichet unique » lors de leurs analyses approfondies de données. JSTOR vous permet d'accéder gratuitement à jusqu'à trois livres, tandis qu'un abonnement au service JPASS (19,50 $ par mois/199 $ par an) vous offrira une lecture illimitée et 10 téléchargements de PDF tous les 30 jours (jusqu'à 120 par an). Si vous ne pouvez pas vous le permettre, de nombreuses universités (plus précisément leurs professeurs) devraient avoir un abonnement qu’elles seraient prêtes à vous laisser utiliser à condition que vous le demandiez gentiment !
archive.org – Une gigantesque base de données de médias entrés dans le domaine public. Enregistrements sonores, vieilles vidéos, livres rares, à peu près tout ce dont vous pourriez avoir besoin pour créer votre prochaine superbe présentation à l'école, au travail ou les deux ! En partenariat avec Wayback Machine, qui compte plus de 280 milliards de pages Web indexées depuis presque la création d'Internet lui-même.
Bibliothèque du Congrès – Archives numérisées de tout ce qui est entré dans la Bibliothèque du Congrès. Plus de 200 ans d'informations historiques ainsi que des volumes à jour
osti.gov – Archives de recherche gouvernementales, complètes avec un historique de toutes les études entreprises par le gouvernement. Vos impôts ont payé ces produits, alors pourquoi ne devraient-ils pas vous appartenir ? 100 % consultable et capable de renvoyer des résultats à partir de n’importe quel document que vous essayez de rechercher.
Général
Catalogue GPO des publications du gouvernement américain — Base de données des publications fédérales.
Les Archives nationales — Outils de recherche et base de données en ligne des Archives nationales. S’il y a quelque chose que vous devez savoir sur l’histoire de l’Amérique ou sur l’état actuel de la nation, c’est ici.
Presse HighWire — Catalogue en ligne du plus grand référentiel de textes intégraux et non libres gratuits, évalués par des pairs, provenant de plus de 1 000 revues différentes. Il est difficile de savoir ce qui se cache derrière un paywall et ce qui ne l’est pas. La seule façon de le savoir est de filtrer vos termes de recherche jusqu’à ce que vous puissiez voir suffisamment de publications du côté payant et non payant de l’allée pour décider si vous devrez ou non retirer ce portefeuille.
Encyclopédie britannique – Le Google original, maintenant en ligne avec toutes les superbes images et textes dont vous vous souvenez encore des livres !
FRÉD – Données financières à jour couvrant 470 000 séries chronologiques provenant de 85 ressources différentes, cette base de données est fournie gratuitement grâce à l'aide de la Federal Reserve Bank of St. Louis. FRED renvoie à un certain nombre d’autres ressources tout aussi impressionnantes en matière de données économiques. Il devrait constituer la principale ressource pour quiconque effectue des recherches dans les domaines de la finance et de la théorie économique aux États-Unis.
Livres
livres Google – Le choix le plus évident. Bien que les autres listes ci-dessous conviennent parfaitement à ce qu’elles font, aucune ne peut être à la hauteur des prouesses de Google en matière de numérisation de livres. Certains livres auront des aperçus partiels, d’autres entièrement disponibles, et encore plus encore ne vous permettront de rien voir du tout. Tout le texte est numérisé (et consultable), mais la possibilité ou non de lire vos résultats dépend entièrement de l'état de la licence de droit d'auteur sur ce morceau de texte particulier.
Scribd – Cela ne remplit peut-être pas exactement le rôle de votre base de données de recherche universitaire ultime, mais le service d'abonnement mensuel reste un bon moyen de rester au courant de tous les nouveaux articles qui pourraient paraître dans vos magazines préférés ou de pouvoir effectuer une recherche dans les livres qui vient d'atteindre les étagères. La section Documents permet aux utilisateurs de télécharger à peu près n'importe quoi avec peu de restrictions, elle est donc devenue un référentiel pour de nombreux manuels et autres contenus académiques.
Projet Gutenberg — 53 000 livres électroniques gratuits disponibles en ligne, faisant également partie de la base de données consultable Archive.org.
La page des livres en ligne — Une base de données consultable de plus de 28 000 livres en anglais avec le texte complet disponible en ligne.
Institut de recherche Getty – Les collections de la bibliothèque du Getty Research Institute comprennent plus d’un million de livres, de photographies d’étude, de périodiques et de catalogues de ventes aux enchères. Il existe également une collection assez complète de matériaux rares ou uniques axés sur l’histoire de l’art et l’architecture.
Droit et politique
Bibliothèque de droit du Congrès — Se présente comme la plus grande collection de documents juridiques au monde, avec plus de 2 millions de volumes disponibles.
THOMAS (Bibliothèque du Congrès) — Informations législatives de la Bibliothèque du Congrès. Tous les projets de loi actuels et passés qui ont jamais été présentés à la Chambre des représentants sont archivés ici.
LexisNexis – Ressource solide pour tout étudiant en droit en herbe ou avocat en exercice. Base de données d’informations mise à jour quotidiennement, même si elle n’est pas bon marché. Les prix des différents services proposés par LexisNexis varient en fonction du service et même de l'État dans lequel vous effectuez la recherche, mais attendez-vous à dépenser plus de 125 $/mois pour des services comme Lexis Advance, qui vous permettent de rechercher parmi des millions de documents judiciaires et juridiques soumis. dans des cas réels partout aux États-Unis. Votre bibliothèque ou université locale peut proposer un abonnement que vous pouvez utiliser.
Médical et Santé
science.gov — Passerelle vers les informations scientifiques fournies par les agences gouvernementales américaines. Recherche dans une base de données agrégée de 200 millions de publications et de revues différentes, idéale pour toute personne essayant d'effectuer des recherches sur des sujets spécifiquement couverts dans la catégorie « science ».
PubMed — La Bibliothèque nationale de médecine des États-Unis contient plus de 16 millions de citations de MEDLINE et d'autres revues des sciences de la vie remontant aux années 1950. L'une des premières et toujours l'une des meilleures bases de données médicales disponibles en ligne aujourd'hui.
globalhealthfacts.org – Base de données indexée d’informations sur la santé mondiale, consultable par type de maladie, pays, conditions, symptômes, etc. Excellente ressource complète avec des centaines d'infographies qui peuvent être utilisées pour expliquer les statistiques de certains problèmes de santé à une plus grande échelle.
Journal de médecine de la Nouvelle-Angleterre – L’une des principales revues médicales avec le texte intégral des numéros antérieurs disponibles en ligne. Soyez prêt à payer pour certains contenus, mais une grande partie est également disponible gratuitement.
Sciences et académiques
Géographie et géologie
Commission géologique des États-Unis – Rempli d'autant de cartes et d'images que vous pouvez en supporter, couvrant de nombreux aspects différents de la topographie géologique des États-Unis.
Carte nationale des États-Unis par USGS – La source des données géospatiales actuelles de l’USGS. Toutes les cartes fournies sont disponibles de manière interactive sur le Web et dans leurs formats téléchargeables.
Données sur l'eau en temps réel de l'USGS — Une carte des États-Unis montrant des données en temps réel sur la qualité de l'eau des rivières et des réservoirs du pays.
Programme des risques sismiques de l'USGS — Cartes du monde montrant des données sismiques en temps réel. Utilise une carte interactive que vous pouvez utiliser pour passer d’un endroit à l’autre, amusant pour tous ceux qui ont même un certain intérêt pour ce qui se passe réellement juste sous nos pieds.
Physique et Astronomie
Le système de données astrophysiques SAO/NASA – Un moteur de données de physique et d’astronomie pour les articles académiques. Chaque article que vous souhaitez lire doit être demandé individuellement, ce qui peut être fastidieux, mais reste l'un des meilleurs moyens de mettre la main sur les données brutes provenant des télescopes et des expériences de physique du monde entier.
Index académique – Se divise en deux types de recherches différents : la recherche principale qui renvoie essentiellement des résultats Google plus précis, et l’autre qui recherche des trésors universitaires sur le Web profond.
Ingénierie et technologie
Bibliothèque numérique IEEE Xplore – Contient plus de 1,4 million de documents de l’Institute of Electronics and Electrical Engineers. Base de données consultable contenant des documents à jour concernant presque tout ce qui concerne l'électrotechnique et la technologie dans son ensemble.
TechXtra — Accès gratuit à des rapports, des documents électroniques, des recherches, des actualités de l'industrie et même des offres d'emploi dans les domaines des mathématiques, des sciences et de l'ingénierie.
Divers
Cœur — La plus grande base de données consultable au monde de documents de recherche en libre accès. Vaste base de données d'articles et de recherches regroupés, tous consultables par texte. Cela devrait être votre premier arrêt pour toute recherche précoce qui ne nécessite peut-être pas une plongée aussi profonde qu’ailleurs.
Arxiv – Dépôt de l’Université Cornell. Accès à plus de 700 000 articles techniques sur tout, de la biologie quantitative à l'informatique. Semble proposer du texte intégral dans plusieurs formats.
DeepDyve – DeepDyve est un chalutier commercial qui a littéralement regroupé des millions d’articles dans des milliers de revues scientifiques. Si vous recherchez quelque chose en matière de projets STEM, c'est un excellent point de départ (vous devrez cependant payer pour ce privilège).
Ressources vidéo
VidéoLectures.net – Un ensemble très complet de conférences vidéo provenant de sources de haute autorité, près de 20 000 conférences parmi lesquelles choisir et plus de 22 000 vidéos d'information au total.
Le Web est un endroit géant et merveilleux rempli de toutes les informations dont vous pourriez rêver, et plus encore. En utilisant ces sites et moteurs de recherche pour parcourir le Web profond, vous pouvez être sûr que votre prochain article académique, votre thèse de doctorat ou votre essai d'entrée à l'université contiendra les sources les plus riches possibles.
' Bibliothèque ' de Pixabay sous licence CC PAR 2.0